
記事公式発表
OpenAI••3 min read
OpenAI「FrontierScience」発表―AIの科学推論能力を測る新ベンチマーク
OpenAIがAIの科学推論能力を評価する新ベンチマーク「FrontierScience」を発表。PhD専門家が作成した700問超の難問で、GPT-5.2はオリンピアード形式で77.1%を達成したものの、オープンエンドな研究タスクでは25.3%に留まり、複雑な科学的問題解決に課題が残ることが判明。
#ベンチマーク#科学#OpenAI
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。