Anthropicは、Claude CodeとPublic APIから得られた数百万件の人間×エージェントのインタラクションを分析し、AIエージェントが実際にどのくらい自律的に動いているかを定量的に明らかにした研究レポートを公開した。
これは何の話?
「AIエージェントは自律的に動く」とは言われるが、実際のところどの程度まで人間の手を離れているのか。Anthropicが初めて大規模な実使用データを基にその実態を測定した。

何が起きているか
分析の対象は、Claude CodeとAnthropicのPublic APIから得られた数百万件のインタラクションだ。プライバシー保護インフラ(CLIO)を通じてデータを取得し、自律性・リスク・人間の関与度を複数の指標で評価した。
Claude Codeの99.9パーセンタイルのターン長は、2025年10月〜2026年1月の3か月間で25分未満から45分超へとほぼ倍増した。この増加はモデルリリースをまたいでも滑らかで、モデル能力だけに起因するものではない可能性がある。中央値(約45秒)は安定しており、上位の外れ値が全体を底上げしている構図だ。
ユーザーの経験と監視戦略の変化
初期ユーザー(〜50セッション)ではセッションの約20%で全自動承認を使用しているが、750セッション以上になると40%超に増加する。同時に介入率も新規ユーザーの5%から熟練ユーザーの9%程度へと上昇する。自動承認と介入の両方が増えるのは一見矛盾に見えるが、これは個別確認から「能動的な監視」へと戦略が変わったためと解釈できる。
Public APIでも同様のパターンが観察されており、低複雑度タスクのツール呼び出しの87%に何らかの人間の関与があるのに対し、高複雑度タスクでは67%に低下している。これは複雑なタスクを担う経験豊富なユーザーほど自律的な利用をする傾向と一致している。
Claude自身が確認を求める
難度の高いタスクでは、Claude Code自身が自発的に確認のために処理を止める場面が増える。最も複雑なタスクでは、AIが自ら確認を求める回数が人間の介入の2倍以上になるという結果も出た。Anthropicは「モデルが自身の不確実性を認識し、人間へ積極的に伝えることは安全性の重要な特性」として、他のモデル開発者にも同様の訓練を推奨している。

リスクプロファイルの現状
Public APIのツール呼び出しの約80%には何らかのセーフガードがあり、73%には人間の関与がある。取り消し不可能と分類されたアクションは0.8%で、該当するものとして顧客へのメール送信などが挙げられている。ソフトウェアエンジニアリングが全体の約50%を占め、医療・金融・サイバーセキュリティへの展開も見られ始めている。Anthropicは「リスク・自律度の高いクラスターのうち、多くはセキュリティ評価や演習である可能性が高い」と但し書きしている。
研究の制約
データはAnthropicのモデルのみで、リスク・自律度の分類はClaudeによる自動分類だ。人間の手動確認はプライバシー上の制約から行えない。分析窓も2025年末〜2026年初頭の特定期間に限られ、Public APIでは独立したリクエストを一貫したエージェントセッションとして結びつける手段が現時点では存在しないという課題も明示されている。
提言の要点
Anthropicはモデル開発者・プロダクト開発者・政策担当者それぞれに向けて3点を提言している。ポストデプロイモニタリングへの投資、モデル自身の不確実性認識のための訓練、そして「すべてのアクションを承認させる」といった画一的な介入パターンの強制を避けることだ。熟練ユーザーは個別確認から能動的な監視へとシフトするため、実態に合った規制設計が求められる。
So What?
「エージェントは自律的に動く」という抽象的な議論から「どのくらいの時間・頻度・リスクで自律しているか」という実測の議論に移行できたのが、この研究の価値だ。今後エージェントが医療や金融といった高リスク分野に展開するにつれて、この種のポストデプロイ計測とその公開が業界全体の信頼構築における共通基盤になっていくだろう。
出典と日付
- 情報ソース: Anthropic Research Blog(2026年2月公開)
- URL: https://www.anthropic.com/research/measuring-agent-autonomy
- 著者: Miles McCain, Thomas Millar, Saffron Huang, Jake Eaton, Kunal Handa, Michael Stern, Alex Tamkin, Matt Kearney, Esin Durmus, Judy Shen, Jerry Hong, Brian Calvert, Jun Shern Chan, Francesco Mosconi, David Saunders, Tyler Neylon, Gabriel Nicholas, Sarah Pollack, Jack Clark, Deep Ganguli










