
記事論文
arXiv••4 min read
RxBench:処方監査でLLMと臨床薬剤師を比較評価するベンチマーク
処方監査タスク向けに14種のエラーを網羅するRxBenchを構築し、18種のLLMと専門薬剤師の性能を比較評価した結果、Gemini 2.5などが人間レベルに到達したことを報告する。
#Medical AI#Benchmark#Safety
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。