
記事
•4 min read
Humanity's Last Exam:AIがまだ解けない「人類最後の試験」ベンチマーク登場
Humanity's Last Exam(HLE)は、世界50カ国1000人の専門家が作成した2500問の高難度ベンチマークです。GPT-5やGemini 3でも正答率は低く、AIの限界を測る新たな指標として注目されています。
#ベンチマーク#AGI#AI評価
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。