FrontierScience | ツールTipsライブラリ

記事公式発表

OpenAI•2025年12月17日•3 min read

OpenAIがAIの科学推論能力を評価する新ベンチマーク「FrontierScience」を発表。PhD専門家が作成した700問超の難問で、GPT-5.2はオリンピアード形式で77.1%を達成したものの、オープンエンドな研究タスクでは25.3%に留まり、複雑な科学的問題解決に課題が残ることが判明。

#ベンチマーク#科学#OpenAI