AIエージェントの自律化を試みる
AIエージェントを自律的に動作させることはまだまだ進んでいないように感じる。Claude Code みたいなエージェントは人間の指示をオラクルとして受け取るように設計されている。つまり人間が設計とテストを担当し、AIは実装だけを行う従来のマネジメント構造のままだ。僕が欲しいのは民主主義社会の構成員のようなエージェント、つまり自分で判断して設計・実装・テストまで回せる自律的な存在である。
現状への不満
去年の記事で、生成AIの登場によってマネジメント階層は平坦になるだろうと想像した。AIが汎用的で素早いなら、人間が細かくタスクを分割して監督する必要がなくなるはずだと。
しかし今のところは全然そんなことがない。Claude Codeを使っていると、ことあるごとに「これでいいですか?」「次は何をしますか?」と聞いてくる。結局、人間が設計を与えてテストで確認するというマイクロマネジメントを強いられている。技術の進歩は思ったより遅いようだ。
やりたいこと
しょうがないので自分でそのギャップを埋めるためのチャレンジをしてみようと思う。とはいえ生成AIのモデル自体をどうにかするとか、それのラッパーであるClaude Codeを改造することはやりたくない。
そこで発想を変える。人間とAIの間の階層を平坦にする代わりに、AIエージェント内部に階層を持たせることを試みる。外から見ると一つの自律的なエージェントだが、内部では上位のAIが設計とテストを担当し、下位のAIが実装を担当する。いわばAIによるAIのマネジメントだ。
モデルやClaude Codeが優秀になるほど、この内部階層は浅くなっていくだろう。最終的には単一のAIが全てをこなせるようになるかもしれない。だが今はまだその段階ではないので、階層構造で補う。
Gas Townはその手の試みの一つだろう。まだいい感じに動きまくっているわけではなさそうだし、インターフェースを勉強するのも面倒なので自作してみることにした。
最初の一歩
まずはClaude Codeがユーザに対して問いかけてくる部分を潰したい。Claude Codeセッションを起動し、その前段に別のClaude Codeセッションを配置して、問いかけに自動で応答させる(Twitterでよく見かける構成だ)。
去年の記事で書いた「設計・実装・テスト」の枠組みでいえば、今回は実装フェーズの自動化に手をつけることになる。目標の分解(設計)や成果の検証(テスト)を自動化するのはおいおいでよい。まずはClaude Codeにマイクロマネジメントを求められている状況を打破したい。
この記事はClaude Codeによるレビューと編集支援を受けています。