編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

RxBench

Benchmark / 1

記事
4 min read

RxBench:処方監査でLLMと臨床薬剤師を比較評価するベンチマーク

処方監査タスク向けに14種のエラーを網羅するRxBenchを構築し、18種のLLMと専門薬剤師の性能を比較評価した結果、Gemini 2.5などが人間レベルに到達したことを報告する。

#Medical AI#Benchmark#Safety