2021年05月30日
私を模倣するAI(ゲーム編)その2(模倣学習)
主な開発環境
・Raspbian GNU/Linux 10 (buster)
・python 3.7.3
・tensorflow 1.13.1(1.14.0ではtensorflow.cotribがみつかりませんとエラーが出ます)
・gym 0.15.7
・baselines
その1 で私がゲームをしたものがdemoとして出力されます。
それを読み込んで、模倣学習し、モデルとします。
https://ailog.site/2020/05/18/0518/を参考にしました。
以下は、私のdemoのみを利用するように変更した箇所です。
env = gym.make('Breakout-v0') #Breakout-v0に変更
env = MaxAndSkipEnv(env, skip=1) # 1フレームごとに行動を選択
完成した「私を模倣したAI」はbreakout_modelとして保存されました。
私のノートパソコンでは、CPUしか使えないのですが、
モデルの生成に約6時間くらいかかりました。
なお、クリアできた見本は1回もありませんでした。
下手なところが、私らしい…。
平均score=4.63(n=30)でした。
・Raspbian GNU/Linux 10 (buster)
・python 3.7.3
・tensorflow 1.13.1(1.14.0ではtensorflow.cotribがみつかりませんとエラーが出ます)
・gym 0.15.7
・baselines
その1 で私がゲームをしたものがdemoとして出力されます。
それを読み込んで、模倣学習し、モデルとします。
https://ailog.site/2020/05/18/0518/を参考にしました。
以下は、私のdemoのみを利用するように変更した箇所です。
env = gym.make('Breakout-v0') #Breakout-v0に変更
env = MaxAndSkipEnv(env, skip=1) # 1フレームごとに行動を選択
完成した「私を模倣したAI」はbreakout_modelとして保存されました。
私のノートパソコンでは、CPUしか使えないのですが、
モデルの生成に約6時間くらいかかりました。
なお、クリアできた見本は1回もありませんでした。
下手なところが、私らしい…。
平均score=4.63(n=30)でした。
【このカテゴリーの最新記事】
-
no image