AIが自分でエージェントを改善し続けるautoagent:Markdownを書くだけで育つ自律型AIの作り方

Uncategorized

AIが自分でエージェントを改善し続けるautoagent:Markdownを書くだけで育つ自律型AIの作り方

「AIにコードを書かせたい」じゃなくて、「AIにAIを育てさせたい」——そう思ったことはないだろうか。

自分でプロンプトを調整して、ツールを追加して、ベンチマークを取って……AIエージェントの改善ってそれ自体がめちゃくちゃ時間かかる作業だよな、と実感していた。そんなとき見つけたのが autoagent(kevinrgu/autoagent、⭐2931)だ。

このOSSは一言でいうと「AIエージェントが自分自身のコードを書き換えて、勝手に賢くなり続けるフレームワーク」。人間がやることはMarkdownファイルに目的を書くだけ。あとはメタエージェントが agent.py を自律的に編集→テスト→改善を繰り返してくれる。

実際に動かしてみたら、最初の数サイクルで「あ、これ自分が手でやってた作業じゃん」ってなって、地味に感動したのは正直なところだ。


autoagentの仕組み:コードに触らずエージェントが育つ理由

autoagentのアーキテクチャはシンプルで美しい。登場人物は2つだけ——「メタエージェント」と「ハーネス(agent.py)」だ。

メタエージェントは人間の代わりにエンジニアリングの試行錯誤を担う。具体的にはこういうループで動く:

  1. program.md を読んで「何を作るか」を理解する
  2. agent.py(ハーネス本体)を編集・改善する
  3. ベンチマークを実行してスコアを確認する
  4. スコアが上がるまで2〜3を繰り返す

人間はこのループに介入しない。program.md に「こういうエージェントが欲しい」と書いたら、あとはClaude Codeに「Read program.md and let’s kick off!」と打つだけ。

面白いのは「autoresearch but for agent engineering」というコンセプトだ。autoGPTやAutoResearchが「タスクを自律実行する」ツールなのに対し、autoagentは「エージェントそのものを自律設計する」レイヤーで動く。プロダクトを作るのではなく、プロダクトを作るロボットを作るイメージと言えば伝わるだろうか。

ByteDance DeerFlowのようなマルチエージェントフレームワークと比較すると、autoagentは「実行」より「自己進化」にフォーカスしている点が際立つ。


インストールとセットアップ手順

動作要件は以下の4つ。

  • Docker
  • Python 3.10+
  • uv(パッケージマネージャー)
  • APIキー(OpenAI / Anthropicなど)

セットアップはこれだけ:

```bash
git clone https://github.com/AAAI-DISIM-UnivAQ/autoagent.git
cd autoagent
uv sync
cp .env.example .env  # APIキーを記入
docker compose up -d

.envOPENAI_API_KEY または ANTHROPIC_API_KEY を設定したら、あとは Claude Code から呼び出すだけだ。


よくある失敗・注意点

1. Docker デーモンが起動していない

最も多いエラーがこれ。docker compose up -d 前に必ず docker info で確認しよう。

# 確認コマンド
docker info

2. uv が見つからない

Python パッケージマネージャーの uv はまだ知名度が低く、未インストールのケースが多い。

curl -LsSf https://astral.sh/uv/install.sh | sh

インストール後はターミナルを再起動してパスを通すこと。

3. APIキーのスコープ不足

OpenAI の場合、gpt-4o へのアクセス権がないキーを使うとエラーになる。Tier 1 以上のアカウントか確認しよう。Anthropic の場合は claude-sonnet-4-6 以上を推奨する。

4. program.md の記述が曖昧すぎる

autoagent の品質はほぼ program.md の質で決まる。「アプリを作って」のような指示では出力がブレる。役割・制約・成果物の3点を明記するのがコツだ。

# program.md 良い例

## 役割
あなたはPythonのWebスクレイピングエージェントです。

## 制約
- requests と BeautifulSoup のみ使用
- 対象URL以外へのアクセス禁止

## 成果物
CSVファイルとして結果を保存するスクリプト

5. VPS 環境での権限エラー

ローカルではなく VPS で動かす場合、Docker のソケット権限でつまずくことがある。自宅サーバーよりも管理が楽なクラウド VPS を使うと環境構築の手間が減る。

XServer VPS はDockerプリセットが用意されており、数クリックで autoagent が動く環境を整えられるのでおすすめだ。


まとめ

autoagent は「エージェントを作るエージェント」という新しいレイヤーを切り開くツールだ。program.md に要件を書いて Claude Code から呼び出すだけで、設計・実装・テストを自律的にこなすサブエージェントが生成される。AutoGPT が「タスクを自動化する」ツールなら、autoagent は「自動化するロボットそのものを自動設計する」ツールと言える。まだ発展途上だが、エージェント開発の生産性を大きく変える可能性を秘めている。


よくある質問

Q1. OpenAI と Anthropic、どちらのAPIを使うべきですか?

A. どちらでも動作しますが、コード生成タスクには Claude(Anthropic) が安定した結果を出すことが多いです。コストを抑えたい場合は claude-haiku-4-5 を、品質優先なら claude-sonnet-4-6 を選ぶとよいでしょう。

Q2. autoagent が生成したエージェントのコードは商用利用できますか?

A. autoagent 自体は MIT ライセンスですが、生成物の利用規約は使用した API(OpenAI / Anthropic)の利用規約に従います。商用利用前に各サービスのポリシーを確認してください。

Q3. Claude Code なしでも使えますか?

A. はい。program.md を用意してコマンドラインから直接実行することも可能です。ただし Claude Code と組み合わせることで対話的なフィードバックループが生まれるため、品質と速度の両面で Claude Code との併用を推奨します。
“`

コメント

タイトルとURLをコピーしました