編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

Bloom

AI Safety / 1

記事
3 min read

Anthropic Bloom:AIモデルの振る舞い評価をオープンソースで効率化

AIモデルの安全性評価に関心を持つ研究者や開発者向けに、Anthropicがオープンソースのエージェント型評価フレームワーク「Bloom」を発表しました。Bloomは研究者が指定した振る舞いを入力すると、その頻度と深刻度を評価するためのシナリオを自動的に準備し、テストを実行します。これまで手作業で行っていた評価シナリオの開発プロセスを大幅に効率化する設計です。 Bloomはエージェントを使ってユーザー、プロンプト、インタラクション環境を

#AI安全性#オープンソース#評価ツール