編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

Center for AI Safety

Research / 1

記事
4 min read

Humanity's Last Exam:AIがまだ解けない「人類最後の試験」ベンチマーク登場

Humanity's Last Exam(HLE)は、世界50カ国1000人の専門家が作成した2500問の高難度ベンチマークです。GPT-5やGemini 3でも正答率は低く、AIの限界を測る新たな指標として注目されています。

#ベンチマーク#AGI#AI評価