記事2026年1月21日 00:00検証済み#AI安全#倫理#行動規範#Anthropic

AnthropicがClaudeの行動規範「憲法」を刷新 — 57ページの新ドキュメント公開

AnthropicはClaudeモデルに対する包括的な行動規範ドキュメント「Claude's Constitution」を発表しました。57ページにわたり、武器開発支援禁止、重要インフラ攻撃への関与禁止など「ハード制約」を明示し、AIの倫理的振る舞いの根拠を詳細に記述しています。

要点まとめ

📌 この記事のポイント

157ページの新「憲法」ドキュメントを公開
2大量殺傷兵器・重要インフラ攻撃への支援を禁止
3Claudeの自律的な倫理判断の根拠を明文化

AnthropicがClaudeの行動規範「憲法」を刷新 — 57ページの新ドキュメント公開のサムネイル

https://www.theverge.com/ai-artificial-intelligence/865185/anthropic-claude-constitution-soul-doc

1. これは何の話？

Anthropicが、Claudeモデルの行動指針を定めた公式ドキュメント「Claude's Constitution」を刷新しました。AI安全性やLLMのアラインメントに関心がある研究者・開発者に向けて、新しい「憲法」の内容と意図を解説します。

前回の憲法（2023年5月公開）がガイドラインのリスト形式だったのに対し、今回は57ページにわたる詳細なドキュメントとなっています。

2. 何がわかったか

新しい憲法では「ハード制約（Hard Constraints）」として、絶対に行ってはならない行為が明示されています。これには以下が含まれます。

大量殺傷兵器（生物・化学・核・放射線）の開発への重大な支援
重要インフラ（電力網、水道、金融システム）へのサイバー攻撃の支援
重大な被害をもたらすサイバー兵器・悪意あるコードの作成
児童性的虐待素材（CSAM）の作成
人類の大多数を殺傷・無力化する試みへの関与・支援

また、コア的価値観の優先順位も定められています：安全性 > 倫理性 > Anthropicガイドライン遵守 > 有用性の順で矛盾時は判断します。

3. 他とどう違うのか

OpenAIのモデル仕様書やGoogleのAI原則と比較して、Anthropicの憲法は「なぜそう行動すべきか」の理由をモデル自身が理解することを重視しています。単なる禁止事項リストではなく、倫理的判断の根拠を内包させることで、想定外の状況でも適切に振る舞えることを目指しています。

4. なぜこれが重要か

AIモデルがより自律的に動作するエージェント型アプリケーションが増える中、「何を禁止するか」だけでなく「なぜ禁止するか」をモデルに理解させることが安全性の鍵となります。Anthropicはこのアプローチで、事前に定義されていないグレーゾーンでの判断力を高めようとしています。

5. 未来の展開・戦略性

この「憲法」アプローチが成功すれば、他のAI企業も同様の詳細なガイドラインドキュメントを公開する可能性があります。規制当局との対話においても、「何をどう制御しているか」の説明材料として機能します。

6. どう考え、どう動くか

AI倫理やコンプライアンスを担当する方は、Claudeの憲法を参考に自社のAI利用ポリシーを見直すタイミングです。

指針：

Anthropicの公式ドキュメントを通読する。
自社のAI利用ガイドラインとの差分を確認する。
ハード制約に抵触しうるユースケースを洗い出す。

次の一歩：

今日やること：Anthropic公式サイトで憲法全文を確認する。
今週やること：社内のAI利用ポリシーの更新案を1件作成する。

7. 限界と未確定

憲法がモデルの実際の振る舞いにどの程度反映されるかは経験的な検証が必要です。
「重大な支援（serious uplift）」の閾値は主観的な部分があります。
日本語での挙動が英語と同等かは確認が必要です。

8. 用語ミニ解説

アラインメントとは、AIシステムの目標・行動を人間の意図や価値観に合わせることです。（Alignment）

9. 出典と日付

The Verge（公開日：2026-01-21）：https://www.theverge.com/ai-artificial-intelligence/865185/anthropic-claude-constitution-soul-doc Anthropic公式：https://www.anthropic.com/constitution

補足メモ

AnthropicがClaudeの行動規範「憲法」を刷新 — 57ページの新ドキュメント公開は、単発のニュースとして消費するだけでなく、前提条件と適用範囲を明確にしながら読むことで実務に転用しやすくなります。AnthropicはClaudeモデルに対する包括的な行動規範ドキュメント「Claude's Constitution」を発表しました。57ページにわたり、武器開発支援禁止、重要インフラ攻撃への関与禁止など「ハード制約」を明示し、AIの倫理的振る舞いの根拠を詳細に記述しています。という観点を中心に、何が確定情報で何が解釈なのかを切り分けて整理することが重要です。

実際の運用では、関係者が同じ判断基準を持てるように、対象業務・期待効果・制約条件を短く言語化しておくと再現性が高まります。必要に応じて一次情報（https://www.theverge.com/ai-artificial-intelligence/865185/anthropic-claude-constitution-soul-doc）へ戻り、数値と日付の一致確認を定期的に行うと、認識ずれの拡大を防げます。

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Anthropic の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Anthropic3月12日3分

Anthropicがシドニーにアジア太平洋地域で4番目のオフィスを開設

Anthropicがオーストラリア・ニュージーランド特有のAIエコシステムを支援するため、シドニーに新オフィスを開設しました。

#アップデート

公式

Anthropic3月12日3分

AnthropicがAIの社会的課題に取り組む「The Anthropic Institute」を設立

Anthropicは、強力なAIが社会にもたらす課題への対処と情報公開を目的とした「The Anthropic Institute」を設立しました。

#リサーチ

公式

Anthropic3月11日3分

Claude Codeのインタラクティブモードで使える「/btw」サイドクエスチョン機能

Claude Codeのインタラクティブモードで、メインの処理を中断せずに並行して質問できる「/btw」コマンドの解説です。

#Claude Code#コーディングAI

公式

Anthropic3月7日4分

Claude Opus 4.6が「評価テスト中」であると気付く現象、Anthropicが報告

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

#AIアライメント#ベンチマーク

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

公式

Anthropic3月6日6分

Anthropicが米国「戦争省」のサプライチェーンリスク指定に反発——軍事利用の境界とAI企業の法的対立

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

#AI#Anthropic

公式

Anthropic3月6日6分

AIは本当に仕事を奪っているのか？ Anthropicが「理論と実際のギャップ」から導き出した早期の証拠

Anthropicは、AIが労働市場に与える影響につき「理論上できること」と「実際の利用データ」を掛け合わせた新分析結果を公開。大規模な失業の兆候は現時点で見られません。

#AI#Anthropic

公式

Anthropic3月4日4分

Claude skill-creator 刷新：evalテスト・並列エージェント・説明文最適化で自作スキルを「動くと確認できる」レベルへ

Claude skill-creator がevalテスト・並列エージェント評価・A/B比較・説明文最適化を追加。コードを書かずにAgent Skillsの品質を定量計測・改善できるようになった。

#Anthropic#Claude

公式

Anthropic2月28日4分

AnthropicがDario Amodei声明、国防総省の「民間大規模監視・完全自律型兵器」要求を拒否

Anthropic CEOダリオ・アモデイが岐鑽的な声明。国防総省から「大規模国内監視」と「完全自律型兵器」への利用依領を求められたが、民主主義的価値に反するとして拒否。

#Anthropic#AI安全性

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Anthropic のタイムラインの流れで前後の記事を辿れます。

Anthropic→

公式

Claude Code ベストプラクティス完全ガイド：公式ドキュメントを徹底解説

1月22日

←

Claude Code開発者が注目する理由 — エージェント型コーディングツールの採用が加速

1月21日

著者Yuji Sakuta

公開日2026年1月21日

検証日2026年4月18日

元の投稿を開く

補足メモ

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

公式

Anthropic3月6日6分

Anthropicが米国「戦争省」のサプライチェーンリスク指定に反発——軍事利用の境界とAI企業の法的対立

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

#AI#Anthropic

公式

Anthropic3月6日6分

AIは本当に仕事を奪っているのか？ Anthropicが「理論と実際のギャップ」から導き出した早期の証拠

#AI#Anthropic

公式

Anthropic3月4日4分

Claude skill-creator 刷新：evalテスト・並列エージェント・説明文最適化で自作スキルを「動くと確認できる」レベルへ

#Anthropic#Claude

公式

Anthropic2月28日4分

AnthropicがDario Amodei声明、国防総省の「民間大規模監視・完全自律型兵器」要求を拒否

#Anthropic#AI安全性

AnthropicがClaudeの行動規範「憲法」を刷新 — 57ページの新ドキュメント公開

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

補足メモ

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

AnthropicがClaudeの行動規範「憲法」を刷新 — 57ページの新ドキュメント公開

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

補足メモ

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む