
記事論文
arXiv••3 min read
MCPAgentBench: LLMエージェントのMCPツール利用能力を評価する実世界ベンチマーク
LLMエージェントのMCPツール活用能力を測定するMCPAgentBench。実世界タスクとシミュレート環境の組み合わせで、複雑なマルチステップツール呼び出しの性能差を可視化します。
#MCP#LLMエージェント#ベンチマーク
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。