1. これは何の話?

Googleは、大幅に強化された「Gemini Deep Research」エージェントを、新しい「Interactions API」を通じてリリースしました。これにより、開発者はGoogleの最先端の自律型リサーチ機能を自身のアプリケーションに直接組み込むことが可能になります。また、Webリサーチエージェントの包括性をテストするための新しいベンチマーク「DeepSearchQA」もオープンソース化されました。

2. 何がわかったか

Gemini Deep Researchエージェントは、長期間のコンテキスト収集と統合タスクに最適化されており、その推論コアには事実性の高いGemini 3 Proが使用されています。主な性能数値:

  • HLE(Humanity's Last Exam):46.4%(フルセット)
  • DeepSearchQA:66.1%
  • BrowseComp:59.2%

エージェントは自律的に調査計画を立て、クエリを作成し、結果を読み、知識のギャップを特定して再度検索するという反復プロセスを実行します。ウェブサイトの深部まで特定のデータを取得する能力も向上しています。

Deep Researchの反復リサーチプロセス

3. 他とどう違うのか

Gemini Deep Researchは、単なる情報検索ツールではなく、自律的に複数のステップにわたる調査を行い、その結果を包括的なレポートに統合する能力を持っています。DeepSearchQAベンチマークは、従来の事実ベースのテストでは捉えきれなかった複雑なWebリサーチタスクにおける「包括性」を測る新しい基準を提供します。

4. なぜこれが重要か

開発者が高度なリサーチ機能を自身のアプリに組み込めるようになることで、金融サービス、バイオテクノロジー、市場調査など、高精度と深いコンテキスト理解が求められる分野での応用が加速します。Axiom Bioなどでは既に前臨床研究の加速に活用されています。

5. 未来の展開・戦略性

GoogleはGemini Deep ResearchをGoogle検索、NotebookLM、Google Finance、Geminiアプリなどにも統合・アップグレードしていく計画です。Interactions APIを通じた提供は、開発者エコシステムを巻き込み多様な活用事例を創出する狙いがあります。

6. どう考え、どう動くか

Gemini Deep Researchのようなエージェントは、情報収集・分析のあり方を大きく変える可能性があります。

指針:

  • DeepSearchQAベンチマークの内容を確認し、エージェント評価の新しい視点を学ぶ。
  • Interactions APIとDeep Researchエージェントを使った開発事例を追う。
  • 自分の業務や研究で、自律型リサーチエージェントが活用できる場面を考える。

次の一歩:

  • 今日やること:DeepSearchQAのデータセットとKaggleリーダーボードを確認する。
  • 今週やること:Gemini Deep ResearchがGoogleの各サービスでどう活用されているか調べる。

7. 限界と未確定

  • Interactions APIおよびGemini Deep Researchはまだプレビュー段階で、変更の可能性があります。
  • 「思考時間」を増やすことの効果については今後の研究が予定されています。
  • 価格体系の詳細は公式ドキュメントで確認が必要です。

8. 用語ミニ解説

  • DeepSearchQA:複雑で多段階の情報探索タスクにおけるエージェントの「包括性」を評価するGoogleのベンチマーク。17分野900件のタスクで構成。
  • HLE(Humanity's Last Exam):AIの高度な能力を測る包括的なベンチマーク。

9. 出典と日付

Google (公開日:2025-12-12/最終確認日:2025-12-12):https://blog.google/technology/developers/deep-research-agent-gemini-api/