紹介する論文 Reverse Curriculum Generation for Reinforcement Learning 概要 目標地点付近で目標を達成しやすい状態を初期状態とする(徐々に初期位置に近づける) 逆順に学習を行うことで,最終ゴールを知ることができ,局所解に陥りにくくなる 単純な初…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。