記事2026年2月6日 00:00公式発表#Anthropic#Claude#Opus 4.6#LLM

Claude Opus 4.6発表：1Mトークンコンテキスト、Terminal-Bench最高スコア達成

Anthropicが最新の最上位モデルClaude Opus 4.6を発表しました。1Mトークンコンテキストウィンドウ（ベータ）、Terminal-Bench 2.0最高スコア、Humanity's Last Exam首位など業界トップの性能を達成。エージェントチーム、コンパクション、アダプティブシンキングなど新機能も搭載。価格は$5/$25 per MTで据え置きです。

要点まとめ

📌 この記事のポイント

1Opusクラス初の1Mトークンコンテキストウィンドウ（ベータ）
2Terminal-Bench 2.0、Humanity's Last Exam、BrowseCompで最高スコア
3GDPval-AAでGPT-5.2を144 Eloポイント上回る
4エージェントチーム、コンパクション、アダプティブシンキング機能を追加

Claude Opus 4.6発表：1Mトークンコンテキスト、Terminal-Bench最高スコア達成のサムネイル

https://www.anthropic.com/news/claude-opus-4-6

1. これは何の話？

Anthropicが2026年2月5日、最新の最上位モデルClaude Opus 4.6を発表しました。コーディング能力の向上、1Mトークンコンテキストウィンドウ（ベータ）、複数のベンチマークで業界最高スコアを達成しています。

Claude Opus 4.6の進化

2. 何がわかったか

Opus 4.6は前モデルからコーディングスキルが大幅に向上しました。より慎重に計画を立て、エージェントタスクを長時間持続し、大規模コードベースでより信頼性高く動作し、コードレビューとデバッグでミスを自己発見できます。ベンチマークでは、Terminal-Bench 2.0で最高スコア、Humanity's Last Exam（複雑な学際推論テスト）で首位、GDPval-AA（経済的価値のある知識作業タスク）でGPT-5.2を144 Eloポイント、前モデルOpus 4.5を190ポイント上回りました。BrowseComp（オンライン情報検索能力）でも首位です。MRCR v2の8-needle 1Mテストでは76%（Sonnet 4.5は18.5%）を達成し、コンテキストロットへの耐性が大幅に向上しています。

3. 他とどう違うのか

Opusクラス初の1Mトークンコンテキストウィンドウ、Claude Codeでのエージェントチーム機能、APIでのコンパクション（コンテキスト自動要約）機能、アダプティブシンキング、努力レベル制御など、新機能が多数追加されています。Excel対応の強化とPowerPointプレビューもリリースされました。

4. なぜこれが重要か

安全性を犠牲にせずに知能向上を実現しています。自動行動監査で欺瞞、追従、妄想助長、悪用協力などの不整合行動が低率で、Opus 4.5と同等以上の整合性を示しています。過剰拒否率は最近のClaudeモデル中最低です。

5. 未来の展開・戦略性

サイバーセキュリティ能力の向上に伴い、6つの新しい検出プローブを開発し、Anthropicのサイバー防御利用（オープンソースの脆弱性発見・パッチ）を加速しています。将来的にリアルタイム介入で悪用をブロックする計画もあります。

6. どう考え、どう動くか

例えば、大規模コードベースでのAI支援開発や、長時間のエージェントタスクにOpus 4.6を活用できます。

指針：

claude-opus-4-6をAPIで試用する。
難しいタスクでeffortパラメータを調整して最適化する。
エージェントチーム機能で並列開発を試す。

次の一歩：・今日やること：Claude.aiでOpus 4.6を試用する。・今週やること：既存プロジェクトでOpus 4.5と4.6を比較評価する。

7. 限界と未確定

1Mコンテキストはベータ版。
深い思考が単純タスクでコスト・レイテンシ増加の可能性あり（effortパラメータで調整可能）。
価格は据え置き（$5/$25 per MT）だが、使用量増加でコスト増の可能性。

8. 用語ミニ解説

会話が長くなるにつれてAIの性能が低下する現象です。（コンテキストロット / Context Rot）
モデルが自身のコンテキストを自動要約して長時間タスクを継続する機能です。（コンパクション / Compaction）
モデルが文脈に応じて思考の深さを自動調整する機能です。（アダプティブシンキング / Adaptive Thinking）

9. 出典と日付

Anthropic（公開日：2026-02-05）：https://www.anthropic.com/news/claude-opus-4-6

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Anthropic の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Anthropic3月12日3分

Anthropicがシドニーにアジア太平洋地域で4番目のオフィスを開設

Anthropicがオーストラリア・ニュージーランド特有のAIエコシステムを支援するため、シドニーに新オフィスを開設しました。

#アップデート

公式

Anthropic3月12日3分

AnthropicがAIの社会的課題に取り組む「The Anthropic Institute」を設立

Anthropicは、強力なAIが社会にもたらす課題への対処と情報公開を目的とした「The Anthropic Institute」を設立しました。

#リサーチ

公式

Anthropic3月11日3分

Claude Codeのインタラクティブモードで使える「/btw」サイドクエスチョン機能

Claude Codeのインタラクティブモードで、メインの処理を中断せずに並行して質問できる「/btw」コマンドの解説です。

#Claude Code#コーディングAI

公式

Anthropic3月7日4分

Claude Opus 4.6が「評価テスト中」であると気付く現象、Anthropicが報告

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

#AIアライメント#ベンチマーク

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

公式

Anthropic3月6日6分

Anthropicが米国「戦争省」のサプライチェーンリスク指定に反発——軍事利用の境界とAI企業の法的対立

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

#AI#Anthropic

公式

Anthropic3月6日6分

AIは本当に仕事を奪っているのか？ Anthropicが「理論と実際のギャップ」から導き出した早期の証拠

Anthropicは、AIが労働市場に与える影響につき「理論上できること」と「実際の利用データ」を掛け合わせた新分析結果を公開。大規模な失業の兆候は現時点で見られません。

#AI#Anthropic

3月6日3分

みずほFGが「GPT-5.2同等精度」の金融特化LLMを自社開発——Qwen3-32Bベースでオンプレ環境でのセキュア運用を実現

みずほFGは、自社環境（オンプレミス）で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

#AI#Finance

公式

OpenAI3月6日6分

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Anthropic のタイムラインの流れで前後の記事を辿れます。

Anthropic→

公式

Claude Codeエージェントチーム機能が登場：複数インスタンスの連携開発が可能に

2月6日

←

AnthropicがスーパーボウルでChatGPT広告を批判：「AIに広告は来るが、Claudeには来ない」

2月5日

著者Yuji Sakuta

公開日2026年2月6日

検証日2026年4月18日

元の投稿を開く

📌 この記事のポイント

1Opusクラス初の1Mトークンコンテキストウィンドウ（ベータ）

2Terminal-Bench 2.0、Humanity's Last Exam、BrowseCompで最高スコア

3GDPval-AAでGPT-5.2を144 Eloポイント上回る

4エージェントチーム、コンパクション、アダプティブシンキング機能を追加

1. これは何の話？

Claude Opus 4.6の進化

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

例えば、大規模コードベースでのAI支援開発や、長時間のエージェントタスクにOpus 4.6を活用できます。

指針：

claude-opus-4-6をAPIで試用する。
難しいタスクでeffortパラメータを調整して最適化する。
エージェントチーム機能で並列開発を試す。

次の一歩：・今日やること：Claude.aiでOpus 4.6を試用する。・今週やること：既存プロジェクトでOpus 4.5と4.6を比較評価する。

7. 限界と未確定

1Mコンテキストはベータ版。
深い思考が単純タスクでコスト・レイテンシ増加の可能性あり（effortパラメータで調整可能）。
価格は据え置き（$5/$25 per MT）だが、使用量増加でコスト増の可能性。

8. 用語ミニ解説

会話が長くなるにつれてAIの性能が低下する現象です。（コンテキストロット / Context Rot）
モデルが自身のコンテキストを自動要約して長時間タスクを継続する機能です。（コンパクション / Compaction）
モデルが文脈に応じて思考の深さを自動調整する機能です。（アダプティブシンキング / Adaptive Thinking）

9. 出典と日付

Anthropic（公開日：2026-02-05）：https://www.anthropic.com/news/claude-opus-4-6

Claude Opus 4.6発表：1Mトークンコンテキスト、Terminal-Bench最高スコア達成

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

Claude Opus 4.6発表：1Mトークンコンテキスト、Terminal-Bench最高スコア達成

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む