1. これは何の話?
OpenAIのResponses APIに、長期にわたる会話のコンテキストサイズを削減するための「コンパクション」機能が追加された。長時間のやりとりや複数ターンにわたる処理を行うAIエージェント開発者にとって、コスト・品質・レイテンシのバランスを取ることが課題となっていた問題に対処するものだ。
コンテキストウィンドウが大きくなるにつれて、APIリクエストのコスト増加やレイテンシの長期化が発生しやすくなる。コンパクション機能はこの課題に対して、「重要な状態と推論を保持しながら不要なトークンを削減する」アプローチで対応する。
提供形式は大きく二つある。リクエスト時にしきい値を設定して自動圧縮を行う「サーバー側コンパクション」と、開発者が明示的に呼び出す「スタンドアロン圧縮エンドポイント」だ。

2. 何がわかったか
サーバー側コンパクションは、Responses createリクエスト(POST /responses)にcontext_managementパラメータとcompact_thresholdを設定することで有効になる。トークン数がしきい値を超えると、サーバーが自動的に圧縮を実行しながらレスポンスを継続するため、開発者が別途/responses/compactを呼び出す必要はない。
スタンドアロン圧縮エンドポイントは完全にステートレスで動作し、開発者が任意のタイミングで呼び出してコンテキストウィンドウ全体を圧縮することができる。送信したメッセージ・ツール・アイテムを受け取り、次の/responses呼び出しに渡せる圧縮済みコンテキストウィンドウを返す。
ZDR(Zero Data Retention)フレンドリーな設計でもあり、store=falseと組み合わせることでデータを保持しないまま圧縮を活用できる。
3. 他とどう違うのか
従来のResponses APIでは、長期会話を続けるとコンテキストウィンドウが膨らみ、開発者自身がメッセージを手動でトリムするか、会話を打ち切るしか手段がなかった。コンパクションは「エッセンスを保ちながら圧縮する」という方向性で、単純なトリムよりも文脈の連続性を保つことが可能になる。
また返却される圧縮アイテムは「暗号化された不透明なデータ」として設計されており、人間が直接読むことは想定されていない。これは、AIが自律的に前後の文脈を引き継ぐパターンに特化した仕様といえる。
4. なぜこれが重要か
長期タスクを実行するAIエージェントにとって、コンテキストの管理は根本的なボトルネックだ。コンパクション機能が標準提供されることで、エージェント開発者はこの問題をAPI側に委ねることができ、アプリケーション層での設計複雑性を下げることができる。
特にCodexのような長時間のコーディングタスクや、複数ターンにわたるカスタマーサポートエージェントなど、セッションを長く維持する必要があるユースケースで価値が高い。
5. 未来の展開・戦略性
コンパクション機能はOpenAI Platformのエージェント基盤整備の一環として位置付けられる。Responses APIが正式版として成熟するにつれ、このような「長期実行を支えるインフラ機能」は競合他社のAPIとの差別化要素になっていく可能性がある。
また、ZDR対応という点は規制の厳しい業界(医療・法務・金融など)でのエンタープライズ採用を後押しする。データを外部に残さない要件と長期エージェント実行の両立を公式サポートする例は、現時点では珍しい。
6. どう考え、どう動くか
例えば複数ターンにわたるコードレビューエージェントを構築している開発者が、これまではコンテキストが膨らんで処理品質が低下する問題を抱えていたとすると、compact_thresholdを設定するだけで自動的に文脈を維持しながらコストを抑えた運用ができるようになる。
指針:
- 現在Responses APIで長期会話を実装しているなら、
context_managementパラメータの設定を試してみる。 - スタンドアロン圧縮エンドポイントは明示的なコントロールが必要なFine-grainedな用途(バッチ処理など)に向いている。
- ZDRフレンドリー設計に注目するなら、規制産業向けエージェントの設計を見直す機会として活用できる。
次の一歩:
- 今日やること:公式ドキュメント(developers.openai.com/api/docs/guides/compaction)でサンプルコードを確認する。
- 今週やること:既存エージェントに
compact_thresholdを試験導入し、コスト変化を記録する。
7. 限界と未確定
- 返却される圧縮アイテムは不透明なデータ形式のため、圧縮によって具体的にどの情報が保持・削除されるかを開発者が確認する手段は現時点では公開されていない。
- 圧縮による品質への影響(例:重要な文脈が失われるリスク)の評価方法は、現在のドキュメントでは言及されていない。
- コンパクション機能の利用にかかる追加料金の有無は、公式ドキュメントで明示されていないため要確認だ。
8. 用語ミニ解説
- データをサーバーに保持しないAPI利用形式。(ZDR / Zero Data Retention)
9. 出典と日付
OpenAI(最終確認日:2026-02-28):https://developers.openai.com/api/docs/guides/compaction










