RAGシステムの進化

1. これは何の話?

「社内データをAIに食わせたが、思ったほど賢くない」——そんな企業現場の嘆きに答える、大規模なRAG(検索拡張生成)システムの実態調査レポートです。 本レビューでは、金融、医療、製造など企業ドメインを対象とした77本の高品質な研究論文(Primary Studies)を分析。PoC(概念実証)から一部の実運用に進んだ事例までを含め、どのような構成技術、評価指標、セキュリティ対策が議論されているのかを体系化しています。

[!WARNING] 本記事は査読前のPreprint論文をもとにした一次レビューであり、今後の改訂で数字や結論が変わる可能性があります。

2. 何がわかったか

  • 脱・単純ベクトル検索:成功事例の多くは、ベクトル検索(Dense Retrieval)だけでなく、キーワード検索(Sparse Retrieval)を組み合わせた「ハイブリッド検索」を採用しており、検索精度の底上げを図っていました。
  • ハルシネーションの抑制:複数の研究で、LLM単体と比較して、RAGの方が嘘の生成(ハルシネーション)が大きく減ることは示されています。ただし、依然として無視できないリスクは残存するため、過信は禁物です。
  • 新潮流の台頭:本論文の指摘に加え、2025年の技術トレンドを踏まえると、知識のつながりを重視する「GraphRAG」や、AIが自律的に検索戦略を立てる「Agentic RAG」といった高度な手法への収束が予測されます。

3. 他とどう違うのか

アカデミアでの「ベンチマークスコア」比較ではなく、「実運用での泥臭い課題(レイテンシ、データガバナンス、コスト)」に焦点を当てている点が重要です。 「理論上最強のモデル」を選ぶことより、「自社の汚いデータをどう整形するか(前処理)」や「コンプライアンスをどう守るか」といった実務的な知見が詰まっています。

4. なぜこれが重要か

2024年までが「とりあえずRAGを作ってみる」フェーズだったとすれば、2025年は「RAGを企業の基幹システムとして定着させる」フェーズに入ったからです。 このレポートは、失敗するRAGプロジェクトに共通する「データ品質の軽視」や「評価プロセスの欠如」を指摘しており、これから本格導入を目指す企業にとっての羅針盤となります。

5. 未来の展開・戦略性

「検索して答える」だけの受動的なRAGから、ユーザーの意図を汲んで複数の情報源を調査・統合する「能動的(Agentic)RAG」へと進化が進むでしょう。 また、テキストだけでなく、図面、音声、動画データも検索対象とする「マルチモーダルRAG」が、製造業やメディア業界で標準化していくと予測されます。

6. どう考え、どう動くか

「PDFをベクトルDBに入れたら終わり」という安易な設計は、もはや時代遅れです。

指針:

  • 検索アルゴリズムを見直す:まだ単純なCosine類似度検索しかしていないなら、「ハイブリッド検索(ベクトル+キーワード)+リランク(再順位付け)」の構成へ早急にアップデートしましょう。
  • GraphRAGを試す:社内規定や契約書など、文書間の「参照関係」が重要なデータに関しては、ナレッジグラフを活用したGraphRAGの導入PoCを行ってください。
  • 評価パイプラインを作る:RAGの回答品質を人手でチェックするのは限界があります。「Ragas」などの自動評価フレームワークを導入し、CI/CD的に精度を監視する体制を作ってください。

次の一歩: ・今日やること:自社のRAGシステムの検索部分が「ハイブリッド」になっているか仕様書を確認する。 ・今週やること:GraphRAGの主要ライブラリ(MicrosoftのGraphRAG等)のデモを触り、従来の検索との回答精度の違いを体感する。

7. 限界と未確定

  • データの「質」の壁:どんなに高度なAIを使っても、元データ(社内ドキュメント)が古かったり矛盾していたりすれば、正しい回答は出せません。「Garbage In, Garbage Out」の原則はRAGでも不変です。
  • コストの複雑化:Agentic RAGなど高度な処理を行うと、LLMの呼び出し回数(トークン消費)が激増し、APIコストが跳ね上がるリスクがあります。
  • セキュリティと権限:「役員しか見てはいけない文書」が検索結果に出てしまう事故(アクセス制御ミス)は依然として最大の懸念事項です。

8. 用語ミニ解説

ハイブリッド検索 (Hybrid Search) 「意味」を捉えるベクトル検索と、「単語」を捉えるキーワード検索を両方行い、結果をいいとこ取りで統合する手法。専門用語や固有名詞の検索に強い。

GraphRAG 情報を「点と線(グラフ構造)」で整理してから検索する手法。単なる単語の一致ではなく、「A社とB社の関係」といった構造的な文脈を理解して回答を作成できる。

9. 出典と日付

Preprints(投稿:2025-12-01 / 掲載:2025-12-04):https://www.preprints.org/manuscript/202512.0359