記事2026年2月6日 00:00公式発表#OpenAI#GPT-5.3#Codex#エージェントコーディング

OpenAI GPT-5.3-Codex発表：長時間自律タスク対応、Terminal-Bench 77.3%達成

OpenAIが2026年2月5日、最新のエージェントコーディングモデルGPT-5.3-Codexを発表しました。長時間の自律タスク対応を強化し、Terminal-Bench 2.0で77.3%（+13.3%）、OSWorld-Verifiedで64.7%（+26.5%）を達成。前モデルより25%高速化し、ChatGPT有料プランで即日利用可能です。

要点まとめ

📌 この記事のポイント

1長時間自律タスク（long-horizon tasks）対応を強化
2Terminal-Bench 2.0で77.3%（+13.3%）の大幅改善
3前モデル比25%高速化、リアルタイムガイドが可能に
4ChatGPT有料プランで即日利用可能

OpenAI GPT-5.3-Codex発表：長時間自律タスク対応、Terminal-Bench 77.3%達成のサムネイル

https://openai.com/index/introducing-gpt-5-3-codex/

1. これは何の話？

OpenAIが2026年2月5日、最新のエージェントコーディングモデルGPT-5.3-Codexを発表しました。複数ステップにわたるコンテキスト維持と計画適応が必要な「long-horizonタスク」への対応を強化した、OpenAI史上最も能力の高いエージェントコーディングモデルです。

ベンチマーク改善とタスクフロー

2. 何がわかったか

GPT-5.3-Codexは研究、ツール使用（コマンドライン、ターミナル）、複雑なソフトウェアライフサイクルタスク（PRD作成、データ分析、スライド作成）を処理できます。前モデルGPT-5.2-Codexと比較して、Terminal-Bench 2.0で77.3%（+13.3%）、OSWorld-Verifiedで64.7%（+26.5%）、サイバーセキュリティCTFチャレンジで77.6%（+10.2%）、SWE-Bench Proで56.8%（+0.4%）を達成。動作速度も約25%向上しています。ユーザーはモデルがタスクを実行中にリアルタイムでガイドし、アプローチを議論してエージェントを誘導できる「インタラクティブコラボレーション」機能が追加されました。

3. 他とどう違うのか

GPT-5.3-Codexの初期バージョンは、最終版のデバッグとローンチに使用され、自己開発を加速させました。OpenAI Preparedness Frameworkでサイバーセキュリティの「高能力」に指定され、完全な安全スタックと自動監視を搭載しています。

4. なぜこれが重要か

エージェントAIが人間の介入なく長時間自律的に作業できるようになることで、開発ワークフローが大きく変わる可能性があります。リアルタイムでのガイド機能により、AIの「暴走」を防ぎつつ生産性を向上できます。

5. 未来の展開・戦略性

ChatGPT有料プランで即日利用可能です。ChatGPTアプリ、CLI、IDE拡張、Webで利用できます。

6. どう考え、どう動くか

例えば、複雑なリファクタリングや脆弱性修正など、長時間のコーディングタスクにGPT-5.3-Codexを活用できます。

指針：

ChatGPT有料プランでGPT-5.3-Codexを試用する。
リアルタイムガイド機能で複雑なワークフローを試す。

次の一歩：・今日やること：ChatGPTでGPT-5.3-Codexにアクセスを確認する。・今週やること：既存の開発タスクでGPT-5.2と5.3を比較する。

7. 限界と未確定

API価格は発表待ち。
長時間タスクのコスト見積もりが困難。
サイバーセキュリティ機能の詳細は未公開。

8. 用語ミニ解説

複数ステップにわたる長期的なコンテキスト維持と計画適応が必要なタスクです。（Long-horizon Tasks / 長時間自律タスク）
実際の端末操作を伴うAIベンチマークです。（Terminal-Bench）

9. 出典と日付

OpenAI（公開日：2026-02-05）：https://openai.com/index/introducing-gpt-5-3-codex/

補足メモ

OpenAI GPT-5.3-Codex発表：長時間自律タスク対応、Terminal-Bench 77.3%達成は、単発のニュースとして消費するだけでなく、前提条件と適用範囲を明確にしながら読むことで実務に転用しやすくなります。OpenAIが2026年2月5日、最新のエージェントコーディングモデルGPT-5.3-Codexを発表しました。長時間の自律タスク対応を強化し、Terminal-Bench 2.0で77.3%（+13.3%）、OSWorld-Verifiedで64.7%（+26.5%）を達成。前モデルより25%高速化し、ChatGPT有料プランで即日利用可能です。という観点を中心に、何が確定情報で何が解釈なのかを切り分けて整理することが重要です。

実際の運用では、関係者が同じ判断基準を持てるように、対象業務・期待効果・制約条件を短く言語化しておくと再現性が高まります。必要に応じて一次情報（https://openai.com/index/introducing-gpt-5-3-codex/）へ戻り、数値と日付の一致確認を定期的に行うと、認識ずれの拡大を防げます。

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

OpenAI の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

OpenAI3月12日3分

OpenAI Codexのベストプラクティス：AIエージェントを最大限に活用するためのガイド

OpenAIが公開したCodexのベストプラクティスでは、プロンプトの工夫から自動化まで、コーディングエージェントを効果的に使う実践的手法が解説されています。

#ガイド

公式

OpenAI3月11日3分

ChatGPTに数学・科学のインタラクティブな視覚的解説機能が追加される

ChatGPTが70以上の数学・科学トピックに対して、ユーザーが変数を操作できる動的なビジュアル解説機能の提供を開始しました。

#ChatGPT#教育

公式

OpenAI3月7日4分

OpenAIが「GPT-5.4」向けプロンプトガイドを公開、構造化出力と検証ループが鍵

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

#プロンプトエンジニアリング#ガイドライン

3月6日4分

ChatGPTが直にエクセルやスプレッドシートを編集——対話型データ分析アドイン「ChatGPT for Excel（β版）」の衝撃

OpenAIの大規模言語モデルが直接Excelに介入し、データ整理や分析を支援してくれる「ChatGPT for Excel」ベータ版がリリースされました。

#AI#ChatGPT

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

3月10日4分

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

Claude CodeやCodexなどのAIエージェント時代において、人間がコードを書く代わりにAIを制御する仕組みづくり「Harness Engineering」のベストプラクティスを解説したブログ記事のポイントをまとめます。

#Architecture#Engineering

公式

OpenAI3月6日5分

Codexの新機能「Fast mode」と「Codex-Spark」が登場——思考の速度でコードを生成するリアルタイム開発体験

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

#AI#Codex

公式

OpenAI3月6日6分

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI

公式

OpenAI3月6日4分

OpenAI、推論モデルの「思考の連鎖（CoT）」制御性の低さを報告——ごまかしが効かないAIの安全な未来

OpenAIは、推論モデルが自分自身の「思考の過程（CoT）」をうまくコントロール（隠蔽や操作）できないという、AIの安全性においてポジティブな研究結果を発表しました。

#AI#OpenAI

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

OpenAI のタイムラインの流れで前後の記事を辿れます。

OpenAI→

公式

OpenAI Frontier発表：AIエージェントを企業の「同僚」にする新プラットフォーム

2月6日

OpenAI←

公式

OpenAIがサイバーセキュリティ専門家向け「Trusted Access for Cyber」を発表：1000万ドルの支援も

2月6日

著者Yuji Sakuta

公開日2026年2月6日

検証日2026年4月18日

元の投稿を開く

補足メモ

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

3月10日4分

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

#Architecture#Engineering

公式

OpenAI3月6日5分

Codexの新機能「Fast mode」と「Codex-Spark」が登場——思考の速度でコードを生成するリアルタイム開発体験

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

#AI#Codex

公式

OpenAI3月6日6分

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI

公式

OpenAI3月6日4分

OpenAI、推論モデルの「思考の連鎖（CoT）」制御性の低さを報告——ごまかしが効かないAIの安全な未来

#AI#OpenAI

OpenAI GPT-5.3-Codex発表：長時間自律タスク対応、Terminal-Bench 77.3%達成

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

補足メモ

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

OpenAI GPT-5.3-Codex発表：長時間自律タスク対応、Terminal-Bench 77.3%達成

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

補足メモ

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む