M4-RAG | ツールTipsライブラリ

記事論文

arXiv•2025年12月8日•4 min read

M4‑RAG: 多言語・多文化・マルチモーダルな大規模 RAG ベンチマーク

AIモデルの実用評価において、これまで不足していた「多言語・多文化」かつ「視覚情報（マルチモーダル）」を含む検索拡張生成（RAG）の性能を測るための新しいベンチマーク「M4-RAG」が登場しました。世界中の42言語、56の方言をカバーし、80,000件以上の画像と質問のペアで構成されています。単に言葉がわかるだけでなく、「その文化圏特有の画像の文脈」を理解し、適切な情報を外部から検索して回答できるかをテストします。グローバル展開を

#Benchmark#Multimodal#Multilingual