記事2025年11月14日•2 min readW2S-AlignTree:弱いLLMで強いLLMを舵取りする推論時アラインメントW2S-AlignTreeは弱いLLMを好み判定器として用い、モンテカルロ木探索で強いLLMの出力を推論時に誘導してアラインメントを高める手法です。#LLM#研究