
記事
•3 min read
Anthropic Bloom:AIモデルの振る舞い評価をオープンソースで効率化
AIモデルの安全性評価に関心を持つ研究者や開発者向けに、Anthropicがオープンソースのエージェント型評価フレームワーク「Bloom」を発表しました。Bloomは研究者が指定した振る舞いを入力すると、その頻度と深刻度を評価するためのシナリオを自動的に準備し、テストを実行します。これまで手作業で行っていた評価シナリオの開発プロセスを大幅に効率化する設計です。 Bloomはエージェントを使ってユーザー、プロンプト、インタラクション環境を
#AI安全性#オープンソース#評価ツール