編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

W2S-AlignTree

Research / 1

記事
2 min read

W2S-AlignTree:弱いLLMで強いLLMを舵取りする推論時アラインメント

W2S-AlignTreeは弱いLLMを好み判定器として用い、モンテカルロ木探索で強いLLMの出力を推論時に誘導してアラインメントを高める手法です。

#LLM#研究