論文紹介: Bridging the Gap Between Value and Policy Based Reinforcement Learning

紹介する論文 Bridging the Gap Between Value and Policy Based Reinforcement Learning 概要 on-policyの学習の安定性とoff-policyのサンプル効率の高さを備えた手法エントロピー正則化強化学習の考え方に基づいた時に導き出される，価値関数と政策関数の…

2019-10-23

arxivライブラリを用いたSlackでの翻訳bot

「arxivAPIを叩いてsummaryをとってきて，その翻訳結果をSlackに投げる」という内容のブログが既に多く公開されています．ただ，Pythonのarxivライブラリを用いて処理を行なっているものが見当たらなかったため，これを用いて簡単に行う方法を掲載します． …

2019-10-14

論文紹介:Reverse Curriculum Generation for Reinforcement Learning

紹介する論文 Reverse Curriculum Generation for Reinforcement Learning 概要目標地点付近で目標を達成しやすい状態を初期状態とする（徐々に初期位置に近づける）逆順に学習を行うことで，最終ゴールを知ることができ，局所解に陥りにくくなる単純な初…

DDN's Library

強化学習に関する論文まとめやちょっとしたシステム開発について

2019-01-01から1年間の記事一覧

論文紹介: Bridging the Gap Between Value and Policy Based Reinforcement Learning

arxivライブラリを用いたSlackでの翻訳bot

論文紹介:Reverse Curriculum Generation for Reinforcement Learning