1. これは何の話?

全体俯瞰図

AIエージェント(Claude CodeやOpenAI Codexなど)を駆使してソフトウェア開発を行っているアーキテクトやリードエンジニア向けに、エージェントを制御するための環境構築手法であるHarness Engineering(ハーネスエンジニアリング)のベストプラクティスが公開されました。

AIがコードの大部分を自動生成する現代において、人間が担うべき主たる役割はコードを書くことから、AIが正しく安全に効率よく動けるレール(ハーネス)を敷くことへと移行しています。

本記事では、AIエージェントが暴走したり品質を低下させたりするのを防ぐために必要な、リポジトリの衛生管理、自動化ツール(リンター)による静的ガードレール、そしてアプリの目となるE2Eテストの戦略的導入について、具体例を交えて体系的に解説されています。

2. 何がわかったか

プロセスフロー解説

AIエージェントは非常に強力ですが、コンテキスト(文脈)の逸脱や既存アーキテクチャの破壊を引き起こしやすい性質を持っています。これらを防ぐためには、自然言語による曖昧な指示(ドキュメント)だけに頼るのではなく、テストコードや静的解析ツールといった決定論的なガードレールをリポジトリ内に組み込むことが必須であると指摘されています。

また、AGENTS.md のようなファイルをポインタとして使い、エージェントに進むべき方向を指示することの重要性が説かれています。さらに、CLIやWebアプリなどあらゆる環境において、エージェントが自らの成果物を視覚的・構造的に確認できるE2Eテストのインターフェース設計が、品質を保証する要となることが分かりました。

3. 他とどう違うのか

これまでAI開発に関する議論は、いかに優れたプロンプトを書くか(プロンプトエンジニアリング)や、どのモデルが優秀かといった内容が中心でした。

一方、今回の提言はモデルやプロンプトに依存せず、人間がソフトウェア工学の原則をAI向けに再定義し、テストや静的な制約によってAIがミスをしてもすぐに検知できる堅牢なシステム環境(足場)を作ることに焦点を当てている点が大きく異なります。

4. なぜこれが重要か

AIの進化スピードは速く、昨日まで有効だったプロンプトテクニックが明日には役に立たなくなることが頻繁に起きます。

しかし、テストコードやリンターといった決定論的(100%確実に結果が出る)なハーネス(安全帯)への投資は、AIモデルがどれだけ入れ替わっても陳腐化せず、プロジェクトの崩壊を防ぐ複利の資産として機能し続けるため、現行の開発チームにとって極めて重要です。

5. 未来の展開・戦略性

今後、ソフトウェア開発はエージェント・ファーストのアーキテクチャ設計へと完全にシフトしていくことが予想されます。

計画を立てるエージェントと実装するエージェントが分業し、それらの成果物を仲介する人間は、レビューアやテスターではなく、ハーネスの設計者・環境の管理者としての職能が最も市場で高く評価される時代がやってくるでしょう。また、エージェント専用のリンターやテストフレームワークが独立した大きなカテゴリとして成長する可能性があります。

6. どう考え、どう動くか

私たちは、AIエージェントに空気を読んで完璧なコードを書いてもらうという期待を捨て、違反すれば機械的にエラーが返る厳格なルールを設定する側に回るべきです。

例えば、エラーが起きた際には人間が直接直すのではなく、エージェントにエラーメッセージを読ませて自律解決させるループを設計することが推奨されます。

  • リポジトリ内の古いドキュメントを極力減らし、実行可能なテストコードに置き換える。
  • 型チェックやリンター(Prettier/ESLintなど)をCI/CDだけでなく、コミット前のフックに組み込み、AIの提出物を即時弾く仕組みを作る。
  • 大規模な改修の際は、実装に進む前に必ずAIに計画と検証手順を定義させる。

次の一歩として以下を進めます。

  • 今日やること:稼働中のプロジェクトに未導入の静的解析ツール(リンター)を1つ追加し、設定を厳格化する。
  • 今週やること:エージェントが確実に読み取れるE2Eテストを1件構築し、意図的にテストを壊して修復させるループを3回テストする。

7. 限界と未確定

このHarness Engineeringのアプローチにもいくつかの制約が考えられます。

  • レガシーシステムや静的解析が難しい古い言語(PHPの古いバージョンなど)への適用ハードルが高い可能性があります。
  • ガードレールを厳格にしすぎると、エージェントの柔軟な問題解決能力を削ぎ、かえって堂々巡り(ループバグ)に陥るリスクへの対処法が不明です。
  • 小規模プロジェクトにおける、過剰なハーネス整備のコスト対効果のバランスについてさらに検証が必要です。

8. 用語ミニ解説

安全帯と制御機構(Harness Engineering / ハーネスエンジニアリング) ソフトウェア開発において、自律的なAIシステムが安全境界(ガードレール)を越えずに正しく動作するための環境構築やテスト自動化の仕組みを設計すること。

100%確実な検証ツール(決定論的ツール / Deterministic Tools) AIのように実行のたびに結果が変わる確率的なシステムとは逆の、入力に対して常に一意の結果(エラーか成功か)を返すリンターやテストスイートのこと。

9. 出典と日付

逆瀬川ちゃんのブログ(2026-03-09/2026-03-09/最終確認日:2026-03-10):https://nyosegawa.github.io/posts/harness-engineering-best-practices-2026/