
記事論文
arXiv••3 min read
EcomBench:Eコマース向けAIエージェントを実タスクで包括評価するベンチマーク
Eコマース分野のAIエージェント評価に特化した新ベンチマーク『EcomBench』を提案。検索・推薦・会話など複合タスクで3段階の難易度を設定し、深い情報検索や多段推論、クロスソース知識統合を測定する。
#論文#エージェント#Eコマース
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。