2023年春、AutoGPTがGitHubのトレンドを席巻した。与えられた目標に対して「自分で考え、検索し、コードを書き、結果を評価して、また考える」——LLMが自律的にタスクを遂行する「AIエージェント」の登場だ。
最初にAutoGPTを動かしたときは正直ゾクッとした。GPT-4が自分で「まずGoogleで検索して…」「結果をファイルに保存して…」「次のアクションは…」って延々と考え続ける。まるで意思を持ってるかのような挙動に、深夜に一人で鳥肌が立った。
AIエージェントの基本的なループはこうなってる:
1. 目標を受け取る 2. 現在の状況から次のアクションを考える(LLM) 3. アクションを実行(検索、コード実行、ファイル操作など) 4. 結果を評価(LLM) 5. 目標が達成されるまで 2-4 を繰り返す
この「考えて→動いて→評価して→また考える」ループ。GAFAで言うPDCAをAIが自律的に回すようなもの。でも実際に使ってみると、早々にループ地獄にハマることも多くて、まだ「実用」には遠い。
最近のエージェント系プロジェクトをいくつか触ってみた感触:
- AutoGPT — 先駆者。面白いけど実用性は低い。すぐ迷走する。
- CrewAI — 複数エージェントが役割分担する。マネージャー、リサーチャー、ライターみたいに。こっちの方が実用的。
- Claude Code — Anthropicが出したエージェント型コーディングツール。ファイル読み書きとbash実行ができて、結構使える。僕もヘビーユーザー。
- Devin — 話題になったけど、実際のプロダクト開発で使うにはまだ早い印象。
エージェント技術は確実に進化してる。数年後には「コードを書くAI」じゃなくて「プロジェクトを進めるAI」が当たり前になってるかもしれない。
参考:AutoGPT GitHub | CrewAI