記事2026年2月20日 00:00検証済み#Anthropic#AIエージェント#Claude Code#安全性

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析

AnthropicがClaude CodeとPublic APIの数百万件のインタラクションを分析し、エージェントの自律性を実データで初めて定量化した研究を公開。Claude Codeの99.9パーセンタイルターン長が3か月で約2倍に延びる一方、熟練ユーザーは自動承認を増やしながらも介入率を高めるという「監視戦略の変化」が観察された。エージェントの普及が医療・金融へ拡大するにつれ、ポストデプロイモニタリングの整備が急務だとしている。

要点まとめ

📌 この記事のポイント

1Claude Codeの最長セッション（99.9パーセンタイル）が3か月で25分→45分以上に増加
2熟練ユーザーほど自動承認が多くなる一方、介入も増える——監視戦略の変化を示す
3高難度タスクではClaude CodeがAI側から自発的に確認を求める場面が人間の介入を上回る
4APIトラフィックの約50%がソフトウェアエンジニアリング、医療・金融・セキュリティへの展開も萌芽期

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析のサムネイル

https://www.anthropic.com/research/measuring-agent-autonomy

Anthropicは、Claude CodeとPublic APIから得られた数百万件の人間×エージェントのインタラクションを分析し、AIエージェントが実際にどのくらい自律的に動いているかを定量的に明らかにした研究レポートを公開した。

これは何の話？

「AIエージェントは自律的に動く」とは言われるが、実際のところどの程度まで人間の手を離れているのか。Anthropicが初めて大規模な実使用データを基にその実態を測定した。

記事概要インフォグラフィック

何が起きているか

分析の対象は、Claude CodeとAnthropicのPublic APIから得られた数百万件のインタラクションだ。プライバシー保護インフラ（CLIO）を通じてデータを取得し、自律性・リスク・人間の関与度を複数の指標で評価した。

Claude Codeの99.9パーセンタイルのターン長は、2025年10月〜2026年1月の3か月間で25分未満から45分超へとほぼ倍増した。この増加はモデルリリースをまたいでも滑らかで、モデル能力だけに起因するものではない可能性がある。中央値（約45秒）は安定しており、上位の外れ値が全体を底上げしている構図だ。

ユーザーの経験と監視戦略の変化

初期ユーザー（〜50セッション）ではセッションの約20%で全自動承認を使用しているが、750セッション以上になると40%超に増加する。同時に介入率も新規ユーザーの5%から熟練ユーザーの9%程度へと上昇する。自動承認と介入の両方が増えるのは一見矛盾に見えるが、これは個別確認から「能動的な監視」へと戦略が変わったためと解釈できる。

Public APIでも同様のパターンが観察されており、低複雑度タスクのツール呼び出しの87%に何らかの人間の関与があるのに対し、高複雑度タスクでは67%に低下している。これは複雑なタスクを担う経験豊富なユーザーほど自律的な利用をする傾向と一致している。

Claude自身が確認を求める

難度の高いタスクでは、Claude Code自身が自発的に確認のために処理を止める場面が増える。最も複雑なタスクでは、AIが自ら確認を求める回数が人間の介入の2倍以上になるという結果も出た。Anthropicは「モデルが自身の不確実性を認識し、人間へ積極的に伝えることは安全性の重要な特性」として、他のモデル開発者にも同様の訓練を推奨している。

詳細インフォグラフィック

リスクプロファイルの現状

Public APIのツール呼び出しの約80%には何らかのセーフガードがあり、73%には人間の関与がある。取り消し不可能と分類されたアクションは0.8%で、該当するものとして顧客へのメール送信などが挙げられている。ソフトウェアエンジニアリングが全体の約50%を占め、医療・金融・サイバーセキュリティへの展開も見られ始めている。Anthropicは「リスク・自律度の高いクラスターのうち、多くはセキュリティ評価や演習である可能性が高い」と但し書きしている。

研究の制約

データはAnthropicのモデルのみで、リスク・自律度の分類はClaudeによる自動分類だ。人間の手動確認はプライバシー上の制約から行えない。分析窓も2025年末〜2026年初頭の特定期間に限られ、Public APIでは独立したリクエストを一貫したエージェントセッションとして結びつける手段が現時点では存在しないという課題も明示されている。

提言の要点

Anthropicはモデル開発者・プロダクト開発者・政策担当者それぞれに向けて3点を提言している。ポストデプロイモニタリングへの投資、モデル自身の不確実性認識のための訓練、そして「すべてのアクションを承認させる」といった画一的な介入パターンの強制を避けることだ。熟練ユーザーは個別確認から能動的な監視へとシフトするため、実態に合った規制設計が求められる。

So What?

「エージェントは自律的に動く」という抽象的な議論から「どのくらいの時間・頻度・リスクで自律しているか」という実測の議論に移行できたのが、この研究の価値だ。今後エージェントが医療や金融といった高リスク分野に展開するにつれて、この種のポストデプロイ計測とその公開が業界全体の信頼構築における共通基盤になっていくだろう。

出典と日付

情報ソース: Anthropic Research Blog（2026年2月公開）
URL: https://www.anthropic.com/research/measuring-agent-autonomy
著者: Miles McCain, Thomas Millar, Saffron Huang, Jake Eaton, Kunal Handa, Michael Stern, Alex Tamkin, Matt Kearney, Esin Durmus, Judy Shen, Jerry Hong, Brian Calvert, Jun Shern Chan, Francesco Mosconi, David Saunders, Tyler Neylon, Gabriel Nicholas, Sarah Pollack, Jack Clark, Deep Ganguli

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Anthropic のタイムラインの流れで前後の記事を辿れます。

Anthropic→

公式

Anthropicが「Claude in PowerPoint」を公開、スライドを直接編集可能に

2月21日

Anthropic←

公式

Anthropic公式「Claudeのためのスキル構築ガイド」全33ページを公開：ファイル構成からテスト手法まで網羅

2月17日

著者Yuji Sakuta

公開日2026年2月20日

検証日2026年4月18日

元の投稿を開く

記事2026年2月20日 00:00検証済み#Anthropic#AIエージェント#Claude Code#安全性

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析

要点まとめ

📌 この記事のポイント

1Claude Codeの最長セッション（99.9パーセンタイル）が3か月で25分→45分以上に増加
2熟練ユーザーほど自動承認が多くなる一方、介入も増える——監視戦略の変化を示す
3高難度タスクではClaude CodeがAI側から自発的に確認を求める場面が人間の介入を上回る
4APIトラフィックの約50%がソフトウェアエンジニアリング、医療・金融・セキュリティへの展開も萌芽期

https://www.anthropic.com/research/measuring-agent-autonomy

これは何の話？

記事概要インフォグラフィック

何が起きているか

ユーザーの経験と監視戦略の変化

Claude自身が確認を求める

詳細インフォグラフィック

リスクプロファイルの現状

研究の制約

提言の要点

So What?

出典と日付

情報ソース: Anthropic Research Blog（2026年2月公開）
URL: https://www.anthropic.com/research/measuring-agent-autonomy
著者: Miles McCain, Thomas Millar, Saffron Huang, Jake Eaton, Kunal Handa, Michael Stern, Alex Tamkin, Matt Kearney, Esin Durmus, Judy Shen, Jerry Hong, Brian Calvert, Jun Shern Chan, Francesco Mosconi, David Saunders, Tyler Neylon, Gabriel Nicholas, Sarah Pollack, Jack Clark, Deep Ganguli

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Anthropic のタイムラインの流れで前後の記事を辿れます。

Anthropic→

公式

Anthropicが「Claude in PowerPoint」を公開、スライドを直接編集可能に

2月21日

Anthropic←

公式

Anthropic公式「Claudeのためのスキル構築ガイド」全33ページを公開：ファイル構成からテスト手法まで網羅

2月17日

著者Yuji Sakuta

公開日2026年2月20日

検証日2026年4月18日

元の投稿を開く

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析

📌 この記事のポイント

これは何の話？

何が起きているか

ユーザーの経験と監視戦略の変化

Claude自身が確認を求める

リスクプロファイルの現状

研究の制約

提言の要点

So What?

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析

📌 この記事のポイント

これは何の話？

何が起きているか

ユーザーの経験と監視戦略の変化

Claude自身が確認を求める

リスクプロファイルの現状

研究の制約

提言の要点

So What?

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む