記事2026年3月10日 00:00報道#Architecture#Engineering#Testing#Claude Code#Codex

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

Claude CodeやCodexなどのAIエージェント時代において、人間がコードを書く代わりにAIを制御する仕組みづくり「Harness Engineering」のベストプラクティスを解説したブログ記事のポイントをまとめます。

要点まとめ

📌 この記事のポイント

1コードではなく、AIエージェントを制御するための「環境（ハーネス）」を構築することが現在の本質的な開発作業である
2リポジトリは腐敗を前提とし、決定論的ツール（リンター等）とE2EテストでAIの出力を強制・検証する
3計画と実行を分離し、AGENTS.mdなどを適切にメンテしてエージェントに正しい文脈を与える

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering のサムネイル

https://nyosegawa.github.io/posts/harness-engineering-best-practices-2026/

1. これは何の話？

全体俯瞰図

AIエージェント（Claude CodeやOpenAI Codexなど）を駆使してソフトウェア開発を行っているアーキテクトやリードエンジニア向けに、エージェントを制御するための環境構築手法であるHarness Engineering（ハーネスエンジニアリング）のベストプラクティスが公開されました。

AIがコードの大部分を自動生成する現代において、人間が担うべき主たる役割はコードを書くことから、AIが正しく安全に効率よく動けるレール（ハーネス）を敷くことへと移行しています。

本記事では、AIエージェントが暴走したり品質を低下させたりするのを防ぐために必要な、リポジトリの衛生管理、自動化ツール（リンター）による静的ガードレール、そしてアプリの目となるE2Eテストの戦略的導入について、具体例を交えて体系的に解説されています。

2. 何がわかったか

プロセスフロー解説

AIエージェントは非常に強力ですが、コンテキスト（文脈）の逸脱や既存アーキテクチャの破壊を引き起こしやすい性質を持っています。これらを防ぐためには、自然言語による曖昧な指示（ドキュメント）だけに頼るのではなく、テストコードや静的解析ツールといった決定論的なガードレールをリポジトリ内に組み込むことが必須であると指摘されています。

また、AGENTS.md のようなファイルをポインタとして使い、エージェントに進むべき方向を指示することの重要性が説かれています。さらに、CLIやWebアプリなどあらゆる環境において、エージェントが自らの成果物を視覚的・構造的に確認できるE2Eテストのインターフェース設計が、品質を保証する要となることが分かりました。

3. 他とどう違うのか

これまでAI開発に関する議論は、いかに優れたプロンプトを書くか（プロンプトエンジニアリング）や、どのモデルが優秀かといった内容が中心でした。

一方、今回の提言はモデルやプロンプトに依存せず、人間がソフトウェア工学の原則をAI向けに再定義し、テストや静的な制約によってAIがミスをしてもすぐに検知できる堅牢なシステム環境（足場）を作ることに焦点を当てている点が大きく異なります。

4. なぜこれが重要か

AIの進化スピードは速く、昨日まで有効だったプロンプトテクニックが明日には役に立たなくなることが頻繁に起きます。

しかし、テストコードやリンターといった決定論的（100%確実に結果が出る）なハーネス（安全帯）への投資は、AIモデルがどれだけ入れ替わっても陳腐化せず、プロジェクトの崩壊を防ぐ複利の資産として機能し続けるため、現行の開発チームにとって極めて重要です。

5. 未来の展開・戦略性

今後、ソフトウェア開発はエージェント・ファーストのアーキテクチャ設計へと完全にシフトしていくことが予想されます。

計画を立てるエージェントと実装するエージェントが分業し、それらの成果物を仲介する人間は、レビューアやテスターではなく、ハーネスの設計者・環境の管理者としての職能が最も市場で高く評価される時代がやってくるでしょう。また、エージェント専用のリンターやテストフレームワークが独立した大きなカテゴリとして成長する可能性があります。

6. どう考え、どう動くか

私たちは、AIエージェントに空気を読んで完璧なコードを書いてもらうという期待を捨て、違反すれば機械的にエラーが返る厳格なルールを設定する側に回るべきです。

例えば、エラーが起きた際には人間が直接直すのではなく、エージェントにエラーメッセージを読ませて自律解決させるループを設計することが推奨されます。

リポジトリ内の古いドキュメントを極力減らし、実行可能なテストコードに置き換える。
型チェックやリンター（Prettier/ESLintなど）をCI/CDだけでなく、コミット前のフックに組み込み、AIの提出物を即時弾く仕組みを作る。
大規模な改修の際は、実装に進む前に必ずAIに計画と検証手順を定義させる。

次の一歩として以下を進めます。

今日やること：稼働中のプロジェクトに未導入の静的解析ツール（リンター）を1つ追加し、設定を厳格化する。
今週やること：エージェントが確実に読み取れるE2Eテストを1件構築し、意図的にテストを壊して修復させるループを3回テストする。

7. 限界と未確定

このHarness Engineeringのアプローチにもいくつかの制約が考えられます。

レガシーシステムや静的解析が難しい古い言語（PHPの古いバージョンなど）への適用ハードルが高い可能性があります。
ガードレールを厳格にしすぎると、エージェントの柔軟な問題解決能力を削ぎ、かえって堂々巡り（ループバグ）に陥るリスクへの対処法が不明です。
小規模プロジェクトにおける、過剰なハーネス整備のコスト対効果のバランスについてさらに検証が必要です。

8. 用語ミニ解説

安全帯と制御機構（Harness Engineering / ハーネスエンジニアリング）ソフトウェア開発において、自律的なAIシステムが安全境界（ガードレール）を越えずに正しく動作するための環境構築やテスト自動化の仕組みを設計すること。

100%確実な検証ツール（決定論的ツール / Deterministic Tools） AIのように実行のたびに結果が変わる確率的なシステムとは逆の、入力に対して常に一意の結果（エラーか成功か）を返すリンターやテストスイートのこと。

9. 出典と日付

逆瀬川ちゃんのブログ（2026-03-09／2026-03-09／最終確認日：2026-03-10）：https://nyosegawa.github.io/posts/harness-engineering-best-practices-2026/

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Claude Code の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Anthropic3月11日3分

Claude Codeのインタラクティブモードで使える「/btw」サイドクエスチョン機能

Claude Codeのインタラクティブモードで、メインの処理を中断せずに並行して質問できる「/btw」コマンドの解説です。

#Claude Code#コーディングAI

公式

Anthropic3月10日4分

Claude Codeに「Code Review」機能が追加：複数エージェントがPRの潜在バグを自律検知

Claude CodeのTeamおよびEnterpriseプラン向けに、プルリクエスト（PR）を複数エージェントで並列レビューし、バグを自動検知してコメントする「Code Review」機能のベータ版が公開されました。

#Code Review#Claude Code

公式

Anthropic3月7日4分

Anthropic、GUI版「Claude Code Desktop」を公開：並行セッションや差分ビュー搭載

Anthropicが、並行作業やビジュアルな差分レビュー機能を備えた開発者向けGUIアプリ「Claude Code Desktop」のドキュメントを公開しました。

#デスクトップアプリ#開発ツール

公式

Anthropic3月4日4分

Claude skill-creator 刷新：evalテスト・並列エージェント・説明文最適化で自作スキルを「動くと確認できる」レベルへ

Claude skill-creator がevalテスト・並列エージェント評価・A/B比較・説明文最適化を追加。コードを書かずにAgent Skillsの品質を定量計測・改善できるようになった。

#Anthropic#Claude

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

3月14日3分

Claude Codeの対話履歴から「技術理解度」を可視化する「prompt-review」登場

Claude Codeの対話履歴を収集・分析し、個人の技術理解度やプロンプトの癖を可視化するレポート生成ツールのリリース。

#AIツール#エンジニア教育

公式

OpenAI3月6日5分

Codexの新機能「Fast mode」と「Codex-Spark」が登場——思考の速度でコードを生成するリアルタイム開発体験

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

#AI#Codex

3月3日4分

Claude Code向け広告監査ツール「Claude Ads」が公開――186項目を自動チェック、ネガ候補ワードも30秒で処理

Claude Code向けの無料広告監査スキル『Claude Ads』がOSSで公開。Google・Meta等6プラットフォームを186項目で自動チェックし、MCPでAPIに直接アクセスしてネガティブキーワード設定まで30秒で自動化する。

#Claude Code#広告運用

3月3日4分

Claude Codeで日常業務を爆速化する――経費精算・稼働報告・プレゼン資料まで「半自動化」でいい

Claude Codeをコーディング以外の日常業務に活用する実践ガイド。経費精算・プレゼン資料・メール監視などを「半自動化」で爆速化するコツを、Claude Code日常業務活用の具体事例で解説。

#Claude Code#業務効率化

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Claude Code のタイムラインの流れで前後の記事を辿れます。

Anthropic→

公式

Claude Codeに「Code Review」機能が追加：複数エージェントがPRの潜在バグを自律検知

3月10日

Anthropic←

公式

Anthropic、GUI版「Claude Code Desktop」を公開：並行セッションや差分ビュー搭載

3月7日

著者Yuji Sakuta

公開日2026年3月10日

検証日2026年4月18日

元の投稿を開く

📌 この記事のポイント

1コードではなく、AIエージェントを制御するための「環境（ハーネス）」を構築することが現在の本質的な開発作業である

2リポジトリは腐敗を前提とし、決定論的ツール（リンター等）とE2EテストでAIの出力を強制・検証する

3計画と実行を分離し、AGENTS.mdなどを適切にメンテしてエージェントに正しい文脈を与える

1. これは何の話？

全体俯瞰図

2. 何がわかったか

プロセスフロー解説

3. 他とどう違うのか

4. なぜこれが重要か

AIの進化スピードは速く、昨日まで有効だったプロンプトテクニックが明日には役に立たなくなることが頻繁に起きます。

5. 未来の展開・戦略性

今後、ソフトウェア開発はエージェント・ファーストのアーキテクチャ設計へと完全にシフトしていくことが予想されます。

6. どう考え、どう動くか

リポジトリ内の古いドキュメントを極力減らし、実行可能なテストコードに置き換える。
型チェックやリンター（Prettier/ESLintなど）をCI/CDだけでなく、コミット前のフックに組み込み、AIの提出物を即時弾く仕組みを作る。
大規模な改修の際は、実装に進む前に必ずAIに計画と検証手順を定義させる。

次の一歩として以下を進めます。

今日やること：稼働中のプロジェクトに未導入の静的解析ツール（リンター）を1つ追加し、設定を厳格化する。
今週やること：エージェントが確実に読み取れるE2Eテストを1件構築し、意図的にテストを壊して修復させるループを3回テストする。

7. 限界と未確定

このHarness Engineeringのアプローチにもいくつかの制約が考えられます。

レガシーシステムや静的解析が難しい古い言語（PHPの古いバージョンなど）への適用ハードルが高い可能性があります。
ガードレールを厳格にしすぎると、エージェントの柔軟な問題解決能力を削ぎ、かえって堂々巡り（ループバグ）に陥るリスクへの対処法が不明です。
小規模プロジェクトにおける、過剰なハーネス整備のコスト対効果のバランスについてさらに検証が必要です。

8. 用語ミニ解説

9. 出典と日付

逆瀬川ちゃんのブログ（2026-03-09／2026-03-09／最終確認日：2026-03-10）：https://nyosegawa.github.io/posts/harness-engineering-best-practices-2026/

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む