`markdown
—
title: AIのスキルをニューラルネットのように学習させる──Microsoft SkillOptがClaude Codeを自動進化させる
slug: skillopt-microsoft-claude-code-skill-optimizer
description: MicrosoftのOSS「SkillOpt」はSKILL.mdをMLの手法で自動最適化。Claude Codeユーザー必見の夜間学習モードSkillOpt-Sleepも解説。
—

AIのスキルをニューラルネットのように学習させる──Microsoft SkillOptがClaude Codeを自動進化させる

「SKILL.mdを書いたはいいけど、本当にこれでいいのか自信がない」──Claude Codeをガチで使い込んでいると、誰もがぶつかる壁だ。

試行錯誤でプロンプトを調整し、スキルファイルを手直しして、またテストして……。その繰り返しに疲れたころ、Microsoft Researchが静かに公開したOSSが話題になっている。その名も SkillOpt。「スキル文書をニューラルネットの重みのように学習させる」という、一見トンデモに聞こえて実は本質を突いたフレームワークだ。

—

SkillOptとは──スキル文書を「訓練」するという革新的発想
仕組みの解説──エポック・学習率・バリデーションゲート
インストール・基本的な使い方
SkillOpt-Sleep──寝ている間にスキルが育つ夜間学習モード
Claude CodeプラグインとしてのインストールとSleepの実行
1. 常時稼働サーバーを用意したい場合
じさくエンジニア向け活用アイデア──副業プロジェクトのカスタムスキルを育てる
まとめ
よくある質問（Q&A）

SkillOptとは──スキル文書を「訓練」するという革新的発想

[SkillOpt（microsoft/SkillOpt）](https://github.com/microsoft/SkillOpt)は2026年5月に公開され、GitHub Stars 6,000超を集めたMicrosoft ResearchのOSSだ。

コアコンセプトは一言でいえばこうだ：

> 「SKILL.mdをモデルの重みのように扱い、勾配降下法的なサイクルで最適化する」

ただし、モデルの重み自体は一切変えない。変えるのはあくまでテキスト文書であるSKILL.mdだけ。だから推論時のコスト増はゼロで、学習済みの best_skill.md（300〜2000トークン）を配置するだけで効果が得られる。

ベンチマーク結果も圧倒的だ：

6ベンチマーク × 7モデル × 3ハーネス、全52セルでベストまたは同率ベスト

GPT-5.5でno-skill比: +23.5pt（直接チャット）、+24.8pt（Codex）、+19.1pt（Claude Code）

欠陥スキルをゼロから修復: 0.00 → 1.00（全4シード、Claude・Codexともに）

Claude Codeのスキルエコシステムに詳しい読者なら、[agent-skillsでClaude Codeを強化](https://devsideup.com/agent-skills-claude-code-addy-osmani/)した経験があるだろう。SkillOptはそのスキルファイルを「人間が書く」から「機械が最適化する」フェーズへと引き上げるツールだ。

—

仕組みの解説──エポック・学習率・バリデーションゲート

MLをかじったことがある人なら、以下の用語がそのまま使われているのに気づくはずだ。

エポック（Epoch）

スキル文書に対して「提案 → テスト → 反映」のサイクルを何周するか。エポックを重ねるほど文書は洗練されるが、過学習（特定タスクへの過適合）にも注意が必要だ。

学習率（Learning Rate）

1サイクルでスキル文書をどれだけ大胆に書き換えるか。"low" は差分が小さく安全、"high" は大幅改変でリスクあり。副業プロジェクトの初期学習には "medium" が無難だ。

バリデーションゲート（Validation Gate）

ここが最大の肝。新しいスキル文書が既存バージョンより回帰（性能低下）しているとゲートが閉じ、変更を却下する。人間が手書きで管理していたときには気づきにくかった「こっそりした劣化」を自動的に防いでくれる。

`
旧スキル → [提案] → 新スキル候補 → [バリデーションゲート] → pass: 採用 / fail: 破棄
`

クロスモデル転移も確認済みで、Claudeで学習したスキルがCodexでも有効に機能する。SKILL.mdエコシステムの標準化が進む中（参考: [Anthropic公式スキル集でClaude Codeをカスタマイズ](https://devsideup.com/anthropics-skills-claude-code-custom-skill/)）、モデル横断で使い回せるスキルの価値はさらに高まる。

—

インストール・基本的な使い方

インストールは1行で完了する。

`bash
pip install skillopt
`

基本的な学習フローは以下のとおり：

`python
from skillopt import SkillOptimizer

optimizer = SkillOptimizer(
skill_path=”skill.md”, # 最適化したいスキルファイル
benchmark=”my_tasks” # 自前のタスクセット
)

best_skill = optimizer.train(
epochs=5,
lr=”medium” # “low” | “medium” | “high”
)

best_skill.md として自動保存される

benchmark には自分のプロジェクトで繰り返すタスク（コードレビュー・テスト生成・ドキュメント整備など）のサンプルを与えるのがポイントだ。汎用ベンチマークではなく自分のユースケースに特化したデータを使うほど、出力されるスキルの精度が上がる。

対応モデルは OpenAI / Azure / Claude (Anthropic) / Qwen / MiniMax。手元のAPIキーさえあればすぐ始められる。

—

SkillOpt-Sleep──寝ている間にスキルが育つ夜間学習モード

SkillOptの真骨頂はここだ。Claude Code / Codex / Copilot向けの SkillOpt-Sleep プラグインを使うと、毎晩スキルの自動改善サイクルが回る。

夜間に実行される処理の流れ：

1. 過去セッションのログを収集（どんな作業を繰り返していたか）
2. 繰り返しタスクを特定・リプレイ（パターン化されたワークフローを抽出）
3. バリデーションゲート付きでSKILL.mdを更新（回帰チェック済み）
4. 承認待ちとして提案（いきなり本番適用はしない）

朝起きてPRを確認するように、スキル文書の「改善提案」をレビューして承認するだけでいい。

—

Claude CodeプラグインとしてのインストールとSleepの実行

Claude CodeへのSkillOpt-Sleepの導入手順は次のとおりだ：

`bash

プラグインのインストール

/plugin marketplace add ./plugins/claude-code

夜間学習を実行（初回はすぐ動作確認できる）

/sleep
`

/sleep コマンドを実行すると、その時点までの作業ログを解析して提案サイクルが走る。初回実行で「こんなに繰り返しタスクがあったのか」と気づかされることも多い。

常時稼働サーバーを用意したい場合

SkillOpt-Sleepをローカルマシン依存にせず、常時稼働の学習サーバーで動かしたい場合にはConoHa VPSが選択肢に入る。月額数百円のプランでもPythonスクリプトとAPIキーを常駐させるには十分で、スリープスケジュールをcronで管理すれば完全放置の自動学習環境が作れる。副業のプロジェクト単位でVPSインスタンスを分けると、スキルの汚染も防げて管理しやすい。

—

じさくエンジニア向け活用アイデア──副業プロジェクトのカスタムスキルを育てる

SkillOptが特に刺さる使い方を具体例で挙げる。

① 副業案件ごとのスキルを特化育成

Webアプリ受託・インフラ整備・データ分析と案件ジャンルが違うなら、benchmark を案件ごとに用意して別々のスキルファイルに学習させる。案件切り替え時にSKILL.mdを差し替えるだけで、Claude Codeが「その案件専用の補佐官」になる。

② コードレビュースキルの自動改善

「このプロジェクトのコーディング規約でレビューする」というスキルを初期定義し、実際のコードレビューセッションをベンチマークに追加しながら学習させる。数週間後には自分のレビュー基準を的確に反映したスキルが完成する。

③ ドキュメント生成スキルを磨く

READMEやAPI仕様書の自動生成は繰り返し頻度が高い典型タスク。SkillOpt-Sleepに任せると、自分の好みの文体・構成をじわじわ学習していく。

④ チームへのスキル配布

best_skill.md は単なるテキストファイルなのでGitで管理できる。チームのリポジトリにコミットすれば、最適化済みスキルをメンバー全員が即座に共有できる。

—

まとめ

SkillOptが示した「スキル文書をMLの手法で最適化する」という発想は、プロンプトエンジニアリングの次のフェーズを先取りしている。モデルの重みを変えず、コストも増やさず、ただテキストを洗練させることでエージェントの性能を引き上げる──これはじさくエンジニアが今日から実践できる、現実的で強力なアプローチだ。

手書きのSKILL.mdに限界を感じている人は、まず pip install skillopt の一行から始めてみてほしい。

—

よくある質問（Q&A）

Q1. 既存のSKILL.mdが壊れたりしませんか？

バリデーションゲートが回帰（性能低下）を検出した場合、変更は自動的に破棄されます。SkillOpt-Sleepの場合は承認制なので、意図しない変更が本番に入ることはありません。念のためGitでバージョン管理しておくと安心です。

Q2. ベンチマーク（タスクセット）はどうやって用意しますか？

「このスキルが正しく動いていればこういう出力になる」という入出力ペアのテストケースを用意します。既存のセッションログをそのまま使うか、代表的なタスクを数十件手動で整備するのが一般的です。量よりも質（自分のユースケースへの近さ）が重要です。

Q3. Claude Code以外のAIエージェントでも使えますか？

はい。OpenAI / Azure / Qwen / MiniMaxにも対応しており、クロスモデル転移も確認されています。Claudeで学習したスキルをCodexに流用するといった使い方も実績があります。ハーネス（エージェント環境）としてはClaude Code・Codex・Copilotの3つが公式サポート対象です。
`