1. これは何の話?

Anthropicは2026年2月、中国の3つのAI企業——DeepSeek、Moonshot AI(Kimiモデルの開発元)、MiniMax——が、Claudeの能力を自社モデルに転用するために大規模な不正アクセスを行っていたことを公表した。この手法は「蒸留(ディスティレーション)」と呼ばれ、強力なモデルの出力を使って弱いモデルを強化する学習技術だ。

3社合計で1600万件以上の交換をClaudeと行った。MiniMaxについては1つのプロキシネットワークで2万件超の不正アカウントを同時管理していたことが確認されている。いずれもAnthropicの利用規約と地域アクセス制限に違反した行為だ。

Anthropicはこの発表を通じて、証拠を業界全体で共有し、協調した対応を求めている。個社が単独で対処できる問題ではないという認識だ。

2. 何がわかったか

各社のスケールと手口は異なる。DeepSeekは15万件以上の交換に関与し、Claudeに「完了した回答の内部推論を段階的に説明させる」手法でチェーン・オブ・ソートの学習データを大量収集した。政治的に敏感な話題の検閲回避バージョンを生成させた例も確認されている。

Moonshot AIは340万件超の交換を生成し、エージェントの推論・ツール使用・コーディング・コンピュータビジョンを集中的に狙った。多様なアカウントタイプを使って検出を困難にする工夫をしていた。

MiniMaxは最も大規模で1300万件超の交換を行った。Anthropicが新モデルをリリースしてから24時間以内にトラフィックの約半分を新モデルへ切り替えるという俊敏さを見せた。Anthropicはこのキャンペーンをモデルリリース前に検出し、学習サイクルを初めてリアルタイムで追跡した。

3. 他とどう違うのか

蒸留そのものは合法的な技術だ。OpenAIを含む多くのフロンティアラボが自社モデルを蒸留して小型版を作っている。問題は規制対象地域からの不正アクセスを使い、競合の能力を無断で盗む点にある。

ハイドラクラスター(hydra cluster)と呼ばれるアカウント群の構造が特徴的だ。単一ポイントがバンされても別アカウントが即座に引き継ぐ設計で、一時的なアカウント停止では根絶できない。あるプロキシネットワークは2万件以上の不正アカウントを同時管理していた。

4. なぜこれが重要か

蒸留攻撃は輸出規制の抜け穴になっている。高性能チップへのアクセスを制限する輸出規制は、モデル学習のコスト自体を上げることが目的だが、蒸留攻撃でその制限を低コストにバイパスできる。アメリカのAIアドバンテージを維持する観点から、輸出規制単体では不十分であることをAnthropicはデータで示した。

安全性の観点では、蒸留で作られたモデルが元のモデルの安全装置を引き継がない可能性が高い。生物兵器の合成支援や悪意ある情報操作への利用に対する防衛機能が剥ぎ取られたまま流通するリスクがある。

5. 未来の展開・戦略性

Anthropicは行動分析・ふるまいのフィンガープリンティング・連携アカウントの検出システムを構築済みだと述べた。これらは業界他社やクラウドプロバイダー、規制当局との情報共有網とセットで機能させる設計だ。

今後、蒸留攻撃への対策はAPIアクセスの確認強化・モデルレベルのカウンターメジャー・業界標準の整備へと拡大していく可能性がある。この問題に対処するには単一企業の努力では追いつかず、業界全体のガバナンス整備が不可欠になると予測される。

6. どう考え、どう動くか

例えばAPIアクセスを仲介するプロキシサービスを利用している場合、そのサービスが蒸留攻撃のルートになっていないかを確認する必要がある。

指針:

  • 自社のLLM API利用でプロキシサービス経由のアクセスがある場合、サービス提供元の規約とモニタリング体制を確認する。
  • AIサプライチェーンの透明性(どのモデルがどのデータで学習されたか)を調達基準に加えることを検討する。
  • 輸出規制とAI安全保障の動向を政策レベルで追い、自社事業への影響を先読みする。

次の一歩:

  • 今日やること:利用中のLLM APIがAnthropicやOpenAIの直接APIか、プロキシ経由かを確認する。
  • 今週やること:MiniMax・Moonshot AIが関与するサービスの利用状況を棚卸しし、サプライヤーリスクを評価する。

7. 限界と未確定

  • 3社への帰属はIPアドレス・リクエストメタデータ・インフラ指標に基づくが、法的な認定ではなく「高い確信」という表現にとどまっている。
  • 各社の蒸留キャンペーンで学習されたモデルが実際に製品化されたかどうか(特にMiniMax以外)は公表されていない。
  • Anthropicが実施した「カウンターメジャー」の具体的な内容はセキュリティ上の理由から非公開で、効果の独立検証は不可能だ。

8. 用語ミニ解説

  • 能力の高いモデルの出力を使って、より小さいモデルを学習させる技術。合法的に使われることも多い。(蒸留 / distillation)
  • バンされたアカウントをすぐ別アカウントで補充し続けるアカウント群の構造。頭を潰しても胴体が残るギリシャ神話の怪物から命名。(ハイドラクラスター / hydra cluster)

9. 出典と日付

Anthropic(最終確認日:2026-02-24):https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks