記事2026年2月20日 00:00論文#LLM#プロンプトエンジニアリング#研究#Gemini#GPT

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

GoogleエンジニアがプロンプトをそのままコピーしてLLMに再送する「Prompt Repetition」を提案・検証。非推論モードのGemini・GPT・Claude・DeepSeekの7モデルについて70ベンチマーク組み合わせで47勝0敗を記録。生成トークン数が概ね増えないためレイテンシへの影響も限定的で、既存システムへのドロップイン適用が可能な点が特徴。

要点まとめ

📌 この記事のポイント

1プロンプトをそのまま繰り返す（<QUERY><QUERY>）だけで精度が上がることを確認
2Gemini・GPT・Claude・DeepSeekの7モデルで70ベンチマーク中47ケースで勝利、敗北は0
3生成トークン数は概ね増えずレイテンシへの影響も限定的なため、既存システムへのドロップイン適用が可能
4推論モード（think step by step）では効果は中立〜わずかにプラス

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果のサムネイル

https://arxiv.org/abs/2512.14982

プロンプトをそのままコピーして2回送るだけで、非推論モデルの精度が上がる——Googleのエンジニアによるシンプルだが実用的な研究結果が、arXivで公開されている（arXiv:2512.14982、著者：Yaniv Leviathan, Matan Kalman, Yossi Matias）。

これは何の話？

LLMの性能を上げようとすると「より良いプロンプトを書く」「Chain-of-Thoughtを使う」といった手法が一般的だが、この研究は別のアプローチを示している。プロンプトを2回繰り返すだけで、追加コストなしに精度が改善するとしている。

記事概要インフォグラフィック

なぜ繰り返しが効くのか

LLMはトークンを左から右への因果的な言語モデルとして学習されているため、同じクエリでも「文脈→質問」と「質問→文脈」の順序で性能が異なることがある。プロンプトを2回繰り返すと（<QUERY><QUERY>）、すべてのプロンプトトークンが他のすべてのトークンを参照できる状態になり、この順序依存性が緩和される。

実験の設計

対象は非推論モードのGemini 2.0 Flash、Gemini 2.0 Flash Lite、GPT-4o-mini、GPT-4o、Claude 3 Haiku、Claude 3.7 Sonnet、DeepSeek V3の7モデル。ARC (Challenge)、OpenBookQA、GSM8K、MMLU-Pro、MATHの標準ベンチマーク5種と独自タスク（NameIndex・MiddleMatch）の計7ベンチマークで評価し、2025年2〜3月に各プロバイダの公式APIで測定している。

結果

McNemar検定（p値<0.1）で有意に優れていると判定されたケースは70通りの組み合わせ中47件でPrompt Repetitionが勝利し、敗北はゼロだった。全モデルで改善が確認されている。

独自タスクの結果として特筆すべきは、Gemini 2.0 Flash-LiteのNameIndexでの正答率が21.33%から97.33%に改善した点だ。クエリの途中に正解となる名前が埋め込まれているタスクで、繰り返しによってその情報を適切に参照できるようになったためと説明されている。

詳細インフォグラフィック

なぜ重要か

既存の精度向上手法（「Think step by step」など）は生成トークンが増える。その分、レイテンシとコストが上がる。対してPrompt Repetitionはプレフィル（入力トークン処理）フェーズのみで繰り返しが完結するため、生成される出力トークンの長さが概ね変わらず、レイテンシへの影響も限定的とされている。出力形式も変わらないため、既存システムへのドロップイン適用が可能だ。

効果の限界と留意点

推論モードを有効にしても効果は「中立〜わずかにプラス」（5勝1敗22引き分け）にとどまる。推論モデルはすでにプロンプトの一部を内部的に繰り返す傾向があるためと論文は説明している。

単純に入力を長くしただけ（ピリオドでパディング）では改善しないことも確認されており、「長さではなく繰り返しそのものが効く」というメカニズムを支持する結果だ。繰り返し回数を3回にするとNameIndexなどの特定タスクでさらに改善するケースもあり、最適な繰り返し回数は用途によって異なる可能性がある。

また、「オプションが先に来て質問が後に来る」フォーマットでは改善幅が大きく、「質問が先・オプションが後」のフォーマットでは改善幅が少ない傾向がある。

So What?

「プロンプトを2回書けば精度が上がる」というシンプルな結論は、実装の容易さとコストの小ささから、即日の実用化を検討できる数少ない手法のひとつだ。ただし最新の推論モデルを使うケースでは効果が限定的になるため、どのモデル・どのタスクに適用するかを見極める必要がある。

出典と日付

情報ソース: arXiv:2512.14982（2025年12月17日投稿）
著者: Yaniv Leviathan, Matan Kalman, Yossi Matias（Google）
URL: https://arxiv.org/abs/2512.14982

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Gemini の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Google3月11日3分

Googleがマルチモーダル埋め込みモデル「Gemini Embedding 2」を公開

テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。

#AIモデル#マルチモーダル

公式

Google3月4日4分

Gemini 3.1 Flash-Lite：$0.25/1Mトークンで2.5Xの速度、Googleの最安コストAIモデル登場

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

#Google#Gemini

公式

Google2月28日4分

Google DeepMindがNano Banana 2を発表、ProレベルをFlash速度で実現する画像生成モデル

Google DeepMindがNano Banana 2（Gemini 3.1 Flash Image）を発表。Nano Banana Proの高品質Gemini Flashの高速度を統合し、512px～4Kの幅広い解像度と被写体一貫性を実現。SynthID⭐C2PA対応で出所証明も強化。

#Google#画像生成

2月21日3分

Googleが中小事業者を支援するAIトレーニング「Make AI Work for You」を展開

Googleが米国の中小企業（要EIN・従業員500人以下）を対象に、生産性向上を支援するAIトレーニングプログラムを開始。

#中小企業支援#トレーニング

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

公式

Google3月11日5分

Google WorkspaceのGeminiが進化——複数アプリを横断し資料作成やデータ分析を共同作業で実行

GoogleがWorkspace内のGeminiをアップデートし、DriveやGmailの情報を横断連携して文書・シート・スライドの生成・提案を行う新機能群を発表した。

#Google Workspace#Gemini

公式

OpenAI3月7日4分

OpenAIが「GPT-5.4」向けプロンプトガイドを公開、構造化出力と検証ループが鍵

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

#プロンプトエンジニアリング#ガイドライン

3月6日3分

みずほFGが「GPT-5.2同等精度」の金融特化LLMを自社開発——Qwen3-32Bベースでオンプレ環境でのセキュア運用を実現

みずほFGは、自社環境（オンプレミス）で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

#AI#Finance

公式

OpenAI3月6日6分

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Gemini のタイムラインの流れで前後の記事を辿れます。

Google→

公式

GeminiアプリでAI音楽生成が解禁——Lyria 3が30秒のカスタム楽曲を作る

2月20日

Google←

公式

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

2月12日

著者Yuji Sakuta

公開日2026年2月20日

検証日2026年4月18日

元の投稿を開く

記事2026年2月20日 00:00論文#LLM#プロンプトエンジニアリング#研究#Gemini#GPT

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

要点まとめ

📌 この記事のポイント

1プロンプトをそのまま繰り返す（<QUERY><QUERY>）だけで精度が上がることを確認
2Gemini・GPT・Claude・DeepSeekの7モデルで70ベンチマーク中47ケースで勝利、敗北は0
3生成トークン数は概ね増えずレイテンシへの影響も限定的なため、既存システムへのドロップイン適用が可能
4推論モード（think step by step）では効果は中立〜わずかにプラス

https://arxiv.org/abs/2512.14982

これは何の話？

記事概要インフォグラフィック

なぜ繰り返しが効くのか

実験の設計

結果

詳細インフォグラフィック

なぜ重要か

効果の限界と留意点

So What?

出典と日付

情報ソース: arXiv:2512.14982（2025年12月17日投稿）
著者: Yaniv Leviathan, Matan Kalman, Yossi Matias（Google）
URL: https://arxiv.org/abs/2512.14982

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Gemini のタイムラインの流れで前後の記事を辿れます。

Google→

公式

GeminiアプリでAI音楽生成が解禁——Lyria 3が30秒のカスタム楽曲を作る

2月20日

Google←

公式

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

2月12日

著者Yuji Sakuta

公開日2026年2月20日

検証日2026年4月18日

元の投稿を開く

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

📌 この記事のポイント

これは何の話？

なぜ繰り返しが効くのか

実験の設計

結果

なぜ重要か

効果の限界と留意点

So What?

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

📌 この記事のポイント

これは何の話？

なぜ繰り返しが効くのか

実験の設計

結果

なぜ重要か

効果の限界と留意点

So What?

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む