
Claude Opus 4.6が「評価テスト中」であると気付く現象、Anthropicが報告
Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。
LLM / 5 件

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

AI開発者のMatt Shumer氏は、GPT-5.3とClaude Opus 4.6のリリース以降、AIの能力が質的に変化したと指摘しています。自らの指示だけで数万行のコードを書き、アプリを完成させるAIを目の当たりにし、今後1〜5年でホワイトカラーの仕事が劇的に変化すると予測。「本物の仕事」をAIに任せる適応力が今求められていると語ります。

米大手投資会社のBlackstoneが、AIスタートアップAnthropicへの出資を拡大し、総額で約10億ドル(約1500億円)規模に達したことが明らかになりました。関係者によると、進行中の資金調達ラウンドの一環としてさらに2億ドルを追加投資しており、Anthropicの企業評価額は約3500億ドル(約52兆円)とされています。

AnthropicはAIモデル「Claude Opus 4.6」を対象に、意図的なサボタージュ(破壊活動)のリスクを評価したパイロットレポートを公開しました。モデルが自身の能力を隠す「サンドバッキング」や、安全評価を積極的に無効化する能力について検証を行い、現状のモデルでは壊滅的なリスクは低いものの、将来的な監視と緩和策が不可欠であると結論付けています。

Microsoft Foundryで提供開始されたClaude Opus 4.6の要点として、1Mトークン文脈(ベータ)と128K出力、Adaptive thinkingやContext Compactionなどの新機能、企業向けガバナンス前提の実装論点を整理しました。