アフィリエイト広告を利用しています

広告

posted by fanblog

2021年06月12日

私を模倣しないAI(ゲーム編)その3(強化学習その3)

主な開発環境
・Ubuntu 18.04
・python 3.7.10
・tensorflow 1.14
・gym 0.15.7
・baselines

強化学習その2を、
さらにtotal_timesteps=30000000
まで増やしてみました。
私の10年ものノートPCで、4日15時間(116時間)もかかりました。
(その後、別途250時間かけてtotal_timesteps=60000000もやってみました。)
月曜の朝から、金曜日の夜まで、ひたすらゲームの学習を行った計算になります。

時にscore=200に至るときもありますが、
めったにございません。まあ、こんなもんなんですかね。
実際に、強化学習をやってみると、
色々とわかることがありますね。
(total_timestep 左:3000万回 右:6000万回)

test6.giftest5.gif
検索

私が見た動画紹介コーナー

素敵です

プロフィール
もう一人の自分さんの画像
もう一人の自分
好きなことを仕事にしなかった
プロフィール
最新記事
カテゴリーアーカイブ
ファン
写真ギャラリー
×

この広告は30日以上新しい記事の更新がないブログに表示されております。