編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

REST/REST+

Evaluation / 1

記事論文
arXiv3 min read

マルチモーダルLLMは同じ情報でも「見せ方」で答えが変わる——REST/REST+ベンチマークで不整合を測定

マルチモーダルLLM(MLLM)が同じ意味情報を持つ画像・テキスト・混合入力に対して一貫した回答を返せない問題を、REST/REST+ベンチマークで15モデル横断検証。OCR精度とは独立した不整合が存在し、安全性・信頼性に課題を示唆。

#論文#マルチモーダル#MLLM