AIエージェントの衝撃 — AutoGPTから学ぶ自律性

2023年春、AutoGPTがGitHubのトレンドを席巻した。与えられた目標に対して「自分で考え、検索し、コードを書き、結果を評価して、また考える」——LLMが自律的にタスクを遂行する「AIエージェント」の登場だ。

最初にAutoGPTを動かしたときは正直ゾクッとした。GPT-4が自分で「まずGoogleで検索して…」「結果をファイルに保存して…」「次のアクションは…」って延々と考え続ける。まるで意思を持ってるかのような挙動に、深夜に一人で鳥肌が立った。

AIエージェントの基本的なループはこうなってる：

1. 目標を受け取る
2. 現在の状況から次のアクションを考える（LLM）
3. アクションを実行（検索、コード実行、ファイル操作など）
4. 結果を評価（LLM）
5. 目標が達成されるまで 2-4 を繰り返す

この「考えて→動いて→評価して→また考える」ループ。GAFAで言うPDCAをAIが自律的に回すようなもの。でも実際に使ってみると、早々にループ地獄にハマることも多くて、まだ「実用」には遠い。

最近のエージェント系プロジェクトをいくつか触ってみた感触：

AutoGPT — 先駆者。面白いけど実用性は低い。すぐ迷走する。
CrewAI — 複数エージェントが役割分担する。マネージャー、リサーチャー、ライターみたいに。こっちの方が実用的。
Claude Code — Anthropicが出したエージェント型コーディングツール。ファイル読み書きとbash実行ができて、結構使える。僕もヘビーユーザー。
Devin — 話題になったけど、実際のプロダクト開発で使うにはまだ早い印象。

エージェント技術は確実に進化してる。数年後には「コードを書くAI」じゃなくて「プロジェクトを進めるAI」が当たり前になってるかもしれない。