Critical Action Reinforcement Learning

Reinforcement Learning / 1 件

記事論文

arXiv•2025年12月5日•2 min read

マルチステップ環境で全行動を均一に最適化する従来手法の非効率を指摘し、成功に決定的な行動に報酬を集中させるCARLを提案。LLMエージェントの長タスク成功率を底上げした。

#Reinforcement Learning#Agent#LLM