私を模倣しないAI（ゲーム編）その３（強化学習その３）: もう一人の自分

2021年06月12日

私を模倣しないAI（ゲーム編）その３（強化学習その３）

主な開発環境
・Ubuntu 18.04
・python 3.7.10
・tensorflow 1.14
・gym 0.15.7
・baselines

強化学習その２を、
さらにtotal_timesteps=30000000
まで増やしてみました。
私の１０年ものノートPCで、４日１５時間（116時間）もかかりました。
（その後、別途250時間かけてtotal_timesteps=60000000もやってみました。）
月曜の朝から、金曜日の夜まで、ひたすらゲームの学習を行った計算になります。

時にscore=200に至るときもありますが、
めったにございません。まあ、こんなもんなんですかね。
実際に、強化学習をやってみると、
色々とわかることがありますね。
（total_timestep　左：3000万回　右：6000万回）

Share on Tumblr

【このカテゴリーの最新記事】

posted by もう一人の自分 at 00:15| 人工知能（AI）