2021年06月12日
私を模倣しないAI(ゲーム編)その3(強化学習その3)
主な開発環境
・Ubuntu 18.04
・python 3.7.10
・tensorflow 1.14
・gym 0.15.7
・baselines
強化学習その2を、
さらにtotal_timesteps=30000000
まで増やしてみました。
私の10年ものノートPCで、4日15時間(116時間)もかかりました。
(その後、別途250時間かけてtotal_timesteps=60000000もやってみました。)
月曜の朝から、金曜日の夜まで、ひたすらゲームの学習を行った計算になります。
時にscore=200に至るときもありますが、
めったにございません。まあ、こんなもんなんですかね。
実際に、強化学習をやってみると、
色々とわかることがありますね。
(total_timestep 左:3000万回 右:6000万回)
・Ubuntu 18.04
・python 3.7.10
・tensorflow 1.14
・gym 0.15.7
・baselines
強化学習その2を、
さらにtotal_timesteps=30000000
まで増やしてみました。
私の10年ものノートPCで、4日15時間(116時間)もかかりました。
(その後、別途250時間かけてtotal_timesteps=60000000もやってみました。)
月曜の朝から、金曜日の夜まで、ひたすらゲームの学習を行った計算になります。
時にscore=200に至るときもありますが、
めったにございません。まあ、こんなもんなんですかね。
実際に、強化学習をやってみると、
色々とわかることがありますね。
(total_timestep 左:3000万回 右:6000万回)
【このカテゴリーの最新記事】
-
no image