
記事論文
arXiv••4 min read
M4‑RAG: 多言語・多文化・マルチモーダルな大規模 RAG ベンチマーク
AIモデルの実用評価において、これまで不足していた「多言語・多文化」かつ「視覚情報(マルチモーダル)」を含む検索拡張生成(RAG)の性能を測るための新しいベンチマーク「M4-RAG」が登場しました。 世界中の42言語、56の方言をカバーし、80,000件以上の画像と質問のペアで構成されています。 単に言葉がわかるだけでなく、「その文化圏特有の画像の文脈」を理解し、適切な情報を外部から検索して回答できるかをテストします。 グローバル展開を
#Benchmark#Multimodal#Multilingual