SkillOpt:MicrosoftがClaude CodeのSKILL.mdをMLで自動最適化するOSSを公開

Uncategorized

`markdown

title: AIのスキルをニューラルネットのように学習させる──Microsoft SkillOptがClaude Codeを自動進化させる
slug: skillopt-microsoft-claude-code-skill-optimizer
description: MicrosoftのOSS「SkillOpt」はSKILL.mdをMLの手法で自動最適化。Claude Codeユーザー必見の夜間学習モードSkillOpt-Sleepも解説。

AIのスキルをニューラルネットのように学習させる──Microsoft SkillOptがClaude Codeを自動進化させる

「SKILL.mdを書いたはいいけど、本当にこれでいいのか自信がない」──Claude Codeをガチで使い込んでいると、誰もがぶつかる壁だ。

試行錯誤でプロンプトを調整し、スキルファイルを手直しして、またテストして……。その繰り返しに疲れたころ、Microsoft Researchが静かに公開したOSSが話題になっている。その名も SkillOpt。「スキル文書をニューラルネットの重みのように学習させる」という、一見トンデモに聞こえて実は本質を突いたフレームワークだ。

SkillOptとは──スキル文書を「訓練」するという革新的発想

[SkillOpt(microsoft/SkillOpt)](https://github.com/microsoft/SkillOpt)は2026年5月に公開され、GitHub Stars 6,000超を集めたMicrosoft ResearchのOSSだ。

コアコンセプトは一言でいえばこうだ:

> 「SKILL.mdをモデルの重みのように扱い、勾配降下法的なサイクルで最適化する」

ただし、モデルの重み自体は一切変えない。変えるのはあくまでテキスト文書であるSKILL.mdだけ。だから推論時のコスト増はゼロで、学習済みの best_skill.md(300〜2000トークン)を配置するだけで効果が得られる。

ベンチマーク結果も圧倒的だ:

  • 6ベンチマーク × 7モデル × 3ハーネス、全52セルでベストまたは同率ベスト
  • GPT-5.5でno-skill比: +23.5pt(直接チャット)、+24.8pt(Codex)、+19.1pt(Claude Code)
  • 欠陥スキルをゼロから修復: 0.00 → 1.00(全4シード、Claude・Codexともに)
  • Claude Codeのスキルエコシステムに詳しい読者なら、[agent-skillsでClaude Codeを強化](https://devsideup.com/agent-skills-claude-code-addy-osmani/)した経験があるだろう。SkillOptはそのスキルファイルを「人間が書く」から「機械が最適化する」フェーズへと引き上げるツールだ。

    仕組みの解説──エポック・学習率・バリデーションゲート

    MLをかじったことがある人なら、以下の用語がそのまま使われているのに気づくはずだ。

    エポック(Epoch)

    スキル文書に対して「提案 → テスト → 反映」のサイクルを何周するか。エポックを重ねるほど文書は洗練されるが、過学習(特定タスクへの過適合)にも注意が必要だ。

    学習率(Learning Rate)

    1サイクルでスキル文書をどれだけ大胆に書き換えるか。"low" は差分が小さく安全、"high" は大幅改変でリスクあり。副業プロジェクトの初期学習には "medium" が無難だ。

    バリデーションゲート(Validation Gate)

    ここが最大の肝。新しいスキル文書が既存バージョンより回帰(性能低下)しているとゲートが閉じ、変更を却下する。人間が手書きで管理していたときには気づきにくかった「こっそりした劣化」を自動的に防いでくれる。

    `
    旧スキル → [提案] → 新スキル候補 → [バリデーションゲート] → pass: 採用 / fail: 破棄
    `

    クロスモデル転移も確認済みで、Claudeで学習したスキルがCodexでも有効に機能する。SKILL.mdエコシステムの標準化が進む中(参考: [Anthropic公式スキル集でClaude Codeをカスタマイズ](https://devsideup.com/anthropics-skills-claude-code-custom-skill/))、モデル横断で使い回せるスキルの価値はさらに高まる。

    インストール・基本的な使い方

    インストールは1行で完了する。

    `bash
    pip install skillopt
    `

    基本的な学習フローは以下のとおり:

    `python
    from skillopt import SkillOptimizer

    optimizer = SkillOptimizer(
    skill_path=”skill.md”, # 最適化したいスキルファイル
    benchmark=”my_tasks” # 自前のタスクセット
    )

    best_skill = optimizer.train(
    epochs=5,
    lr=”medium” # “low” | “medium” | “high”
    )

    best_skill.md として自動保存される

    `

    benchmark には自分のプロジェクトで繰り返すタスク(コードレビュー・テスト生成・ドキュメント整備など)のサンプルを与えるのがポイントだ。汎用ベンチマークではなく自分のユースケースに特化したデータを使うほど、出力されるスキルの精度が上がる。

    対応モデルは OpenAI / Azure / Claude (Anthropic) / Qwen / MiniMax。手元のAPIキーさえあればすぐ始められる。

    SkillOpt-Sleep──寝ている間にスキルが育つ夜間学習モード

    SkillOptの真骨頂はここだ。Claude Code / Codex / Copilot向けの SkillOpt-Sleep プラグインを使うと、毎晩スキルの自動改善サイクルが回る。

    夜間に実行される処理の流れ:

    1. 過去セッションのログを収集(どんな作業を繰り返していたか)
    2. 繰り返しタスクを特定・リプレイ(パターン化されたワークフローを抽出)
    3. バリデーションゲート付きでSKILL.mdを更新(回帰チェック済み)
    4. 承認待ちとして提案(いきなり本番適用はしない)

    朝起きてPRを確認するように、スキル文書の「改善提案」をレビューして承認するだけでいい。

    Claude CodeプラグインとしてのインストールとSleepの実行

    Claude CodeへのSkillOpt-Sleepの導入手順は次のとおりだ:

    `bash

    プラグインのインストール

    /plugin marketplace add ./plugins/claude-code

    夜間学習を実行(初回はすぐ動作確認できる)

    /sleep
    `

    /sleep コマンドを実行すると、その時点までの作業ログを解析して提案サイクルが走る。初回実行で「こんなに繰り返しタスクがあったのか」と気づかされることも多い。

    常時稼働サーバーを用意したい場合

    SkillOpt-Sleepをローカルマシン依存にせず、常時稼働の学習サーバーで動かしたい場合にはConoHa VPSが選択肢に入る。月額数百円のプランでもPythonスクリプトとAPIキーを常駐させるには十分で、スリープスケジュールをcronで管理すれば完全放置の自動学習環境が作れる。副業のプロジェクト単位でVPSインスタンスを分けると、スキルの汚染も防げて管理しやすい。

    じさくエンジニア向け活用アイデア──副業プロジェクトのカスタムスキルを育てる

    SkillOptが特に刺さる使い方を具体例で挙げる。

    ① 副業案件ごとのスキルを特化育成

    Webアプリ受託・インフラ整備・データ分析と案件ジャンルが違うなら、benchmark を案件ごとに用意して別々のスキルファイルに学習させる。案件切り替え時にSKILL.mdを差し替えるだけで、Claude Codeが「その案件専用の補佐官」になる。

    ② コードレビュースキルの自動改善

    「このプロジェクトのコーディング規約でレビューする」というスキルを初期定義し、実際のコードレビューセッションをベンチマークに追加しながら学習させる。数週間後には自分のレビュー基準を的確に反映したスキルが完成する。

    ③ ドキュメント生成スキルを磨く

    READMEやAPI仕様書の自動生成は繰り返し頻度が高い典型タスク。SkillOpt-Sleepに任せると、自分の好みの文体・構成をじわじわ学習していく。

    ④ チームへのスキル配布

    best_skill.md は単なるテキストファイルなのでGitで管理できる。チームのリポジトリにコミットすれば、最適化済みスキルをメンバー全員が即座に共有できる。

    まとめ

    SkillOptが示した「スキル文書をMLの手法で最適化する」という発想は、プロンプトエンジニアリングの次のフェーズを先取りしている。モデルの重みを変えず、コストも増やさず、ただテキストを洗練させることでエージェントの性能を引き上げる──これはじさくエンジニアが今日から実践できる、現実的で強力なアプローチだ。

    手書きのSKILL.mdに限界を感じている人は、まず pip install skillopt の一行から始めてみてほしい。

    よくある質問(Q&A)

    Q1. 既存のSKILL.mdが壊れたりしませんか?

    バリデーションゲートが回帰(性能低下)を検出した場合、変更は自動的に破棄されます。SkillOpt-Sleepの場合は承認制なので、意図しない変更が本番に入ることはありません。念のためGitでバージョン管理しておくと安心です。

    Q2. ベンチマーク(タスクセット)はどうやって用意しますか?

    「このスキルが正しく動いていればこういう出力になる」という入出力ペアのテストケースを用意します。既存のセッションログをそのまま使うか、代表的なタスクを数十件手動で整備するのが一般的です。量よりも質(自分のユースケースへの近さ)が重要です。

    Q3. Claude Code以外のAIエージェントでも使えますか?

    はい。OpenAI / Azure / Qwen / MiniMaxにも対応しており、クロスモデル転移も確認されています。Claudeで学習したスキルをCodexに流用するといった使い方も実績があります。ハーネス(エージェント環境)としてはClaude Code・Codex・Copilotの3つが公式サポート対象です。
    `

    コメント

    タイトルとURLをコピーしました