記事2025年12月3日•4 min readRxBench:処方監査でLLMと臨床薬剤師を比較評価するベンチマーク処方監査タスク向けに14種のエラーを網羅するRxBenchを構築し、18種のLLMと専門薬剤師の性能を比較評価した結果、Gemini 2.5などが人間レベルに到達したことを報告する。#Medical AI#Benchmark#Safety