記事2025年12月5日•2 min readCARL:重要行動に焦点を当てたマルチステップ強化学習でエージェントを改善マルチステップ環境で全行動を均一に最適化する従来手法の非効率を指摘し、成功に決定的な行動に報酬を集中させるCARLを提案。LLMエージェントの長タスク成功率を底上げした。#Reinforcement Learning#Agent#LLM