
DatabricksがRAGの課題を解決する「Instructed Retriever」を発表―精度70%向上
DatabricksはAIエージェントのデータ検索精度を向上させる新アーキテクチャ「Instructed Retriever」を発表しました。従来のRAGと比較して70%の精度向上を達成し、曖昧なクエリでも暗黙の条件を明示的な検索パラメータに変換できます。
LLM Utility / 8 件

DatabricksはAIエージェントのデータ検索精度を向上させる新アーキテクチャ「Instructed Retriever」を発表しました。従来のRAGと比較して70%の精度向上を達成し、曖昧なクエリでも暗黙の条件を明示的な検索パラメータに変換できます。

RAG(Retrieval-Augmented Generation)システムで回答精度73%から100%への改善を実現したチャンキング戦略検証の全記録。Large Chunk方式が複雑なParent-ChildやHypothetical Questionsより効果的だった理由と、Re-rankingで逆に精度が悪化した原因を解説。

> [!NOTE] > 本稿は査読前のプレプリント(arXiv:2512.17559)に基づいています。 医療AIの導入を検討する開発者や医療関係者向けに、LLMを活用した説明可能な初期診断チャットボットが提案されました。このシステムはGPT-4oをベースに、RAG(検索拡張生成)と説明可能AI技術を組み合わせています。患者と動的な対話を行いながら症状を抽出・正規化し、類似性マッチングと適応的質問によって潜在的な診断の優先順位付けを行い

医療分野のような高度な専門性が求められるQ&Aシステムを構築する際、どの手法が最も信頼できるかを検証した研究です。 具体的には、「一般的なAIモデルに検索機能をつけるだけ(Zero-Shot + RAG)」と、「医療データで事前に追加学習させたモデルに検索機能をつける(Fine-Tuned + RAG)」のどちらが優れているかを比較しました。 医療従事者やメディカルテックの開発者向けに、コストと精度のトレードオフを判断するための重要なエ

AIモデルの実用評価において、これまで不足していた「多言語・多文化」かつ「視覚情報(マルチモーダル)」を含む検索拡張生成(RAG)の性能を測るための新しいベンチマーク「M4-RAG」が登場しました。 世界中の42言語、56の方言をカバーし、80,000件以上の画像と質問のペアで構成されています。 単に言葉がわかるだけでなく、「その文化圏特有の画像の文脈」を理解し、適切な情報を外部から検索して回答できるかをテストします。 グローバル展開を

企業ドメインを対象としたRAG研究77本を徹底分析。「ただの全文検索」から脱却し、実運用に向けたハイブリッド検索や、自律エージェントを組み合わせた「第2世代RAG」への移行トレンドを読み解く

RAG(検索拡張生成)システムにおいて、検索結果の信頼性を高めるための新しい再ランキング(Re-ranking)手法「CER (Contrastive Evidence Re-ranking)」の提案です。 従来の検索では、質問文と表面的に似ているだけの文章や、主観的な意見が含まれる文章まで検索されてしまい、それがLLMの幻覚(Hallucination)の原因になっていました。 CERは、「事実としての証拠」と「主観的な説明」を区別し

2015〜2025年の77研究を整理し、企業の知識管理・文書自動化におけるRAG+LLMの適用領域、典型アーキテクチャ、評価手法、未解決課題を俯瞰したレビュー。