Gemini 2.5 Pro

LLM / 1 件

記事論文

arXiv•2025年12月3日•4 min read

処方監査タスク向けに14種のエラーを網羅するRxBenchを構築し、18種のLLMと専門薬剤師の性能を比較評価した結果、Gemini 2.5などが人間レベルに到達したことを報告する。

#Medical AI#Benchmark#Safety