2017年11月12日
AIの独学で超人の域へ、アルファ碁ゼロの衝撃
昨年1月囲碁AIソフト「アフファ碁」が世界のトップ棋士、韓国のイセドル九段を4勝1敗で下し世界に衝撃を与えたのは記憶にまだ新しい。
アルファ碁はグーグル傘下のAI開発会社、英デイープマインド社によって開発されたものだが、グーグルは初期の目的を達成したとアルファ碁を世間から見えなくしていた。
しかし英ディープマインド社は先月10月18日に英科学誌ネイチャーに「人間の知識無しで囲碁を極める」と題した論文を発表した。
其の論文によると、その後新たに「アルファ碁ゼロ」を開発し、以前のアルファ碁との対戦成績はなんと100勝全勝だったそうだ。
アルファ碁は高段者の膨大な棋譜を数百万の曲面に分解して画像データとして読み込み人間の脳の神経網を模したプログラム「ディープラーニング」で分析し曲面と有効な手関係を認識しながら何千万局ものAI同士の対局を繰り返し着手の精度を高めていったもの。
一方今回開発された「アルファ碁ゼロ」は基本ルールを授けただけで、高段者の棋譜を読み込む手続きを飛ばし、いきなり「ゼロ」同士の対局で臨み対局を繰り返して行った。
その進化の様子は、まるでうまれたばかりの赤ん坊が瞬く間に超人に成長するSFの世界を見るような状況だったそうだ。
@全くのゼロから対戦(学習)を始めてから3時間目では、ルールを覚えたばかりの子供がランダムに石を打つレベルだった。
A19時間後では着手の効率のいい隅から打ち始めるようになり、石の死活や石で囲む領土の概念を獲得した。
B70時間後では既に人間を超えるレベルに到達した。
ここに至るまでに一手0.4秒の速さで490万局の自己対局を繰り返し、前述した初代アルファ碁に100戦全勝した。
さらに
自己対局が2900万局に達した40日後には、初代の進化版で、昨年末〜今年初めに中国柯潔(かけつ)九段や井山裕太七冠ら世界トップ棋士に60戦全勝した「マスター」にも89勝11敗と圧勝した。
論文によると「ゼロ」は従来のアルファ碁で運用していた次の1手を探すネットワークと、形勢を判断するネットワークを一つに統合し、より確かな解を導き出せるよう新しいアルゴリズムを導入した結果、急激な棋力の向上と適格で安定した学習を可能にしたそうだ。
今回の衝撃ともいえる驚きはAI開発に人が培った専門知識を全く用いなかった事にある。
これまでのAI開発は事前にAIが学習するための膨大なデータが必要だった。
しかし今回の「ゼロ」は初期条件だけで、真のゼロから自己学習で進化し、短期間で人間を超えるレベルに達した。
囲碁の様にルールが明確なものについては、専門知識や膨大なデータを必要とせず、AIが必要なデータを自動で獲得し人間を超える高いレベルに進化することが照明された。
今回の囲碁での成果は、世の中の諸問題をAIが事前データ無しでも解決し得る事が出来る可能性を示したということになる。
勿論現実に横たわる各種課題・目標を解決する場合、ルールが明確でなく、最善手が一つということがない場合も多いとは思われるが、AIによる解決の可能性を示したといえる。
今後のグーグルの展開とこれに触発された世界の研究者の成果が期待される。
(本記事は日経産業新聞11月20日付け記事を参考にした)
尚AI囲碁ソフトが発売されるそうだ。(追記参照)ところで
日本国内最強の囲碁AIは「DEEP ZEN GO]だが、このソフトのプログラマー尾島陽児さんが
市販用にチューニングした商品を開発した。
商品名は「天頂の囲碁7 ZEN」でマイナビ出版が11月17日に発売する。
同社が2009年に初めて発売した「天頂の囲碁」の棋力は二段だったが、ディープラーニングを使って上達し、現在は前作の七段を超える九段の棋力に達したという。
ただまだ死活の責め合いではミスが出ることもあり今後の課題となっているそうだ。
ソフトの棋力は対局相手に6級から9段までレベルを調節出来る。
プロや他人同士の対局も検討出来、各局面の形勢判断や有力手を示してくれるという。
値段は12000円で家電量販店や同社の販売サイトから購入出来る。
アルファ碁はグーグル傘下のAI開発会社、英デイープマインド社によって開発されたものだが、グーグルは初期の目的を達成したとアルファ碁を世間から見えなくしていた。
しかし英ディープマインド社は先月10月18日に英科学誌ネイチャーに「人間の知識無しで囲碁を極める」と題した論文を発表した。
其の論文によると、その後新たに「アルファ碁ゼロ」を開発し、以前のアルファ碁との対戦成績はなんと100勝全勝だったそうだ。
アルファ碁は高段者の膨大な棋譜を数百万の曲面に分解して画像データとして読み込み人間の脳の神経網を模したプログラム「ディープラーニング」で分析し曲面と有効な手関係を認識しながら何千万局ものAI同士の対局を繰り返し着手の精度を高めていったもの。
一方今回開発された「アルファ碁ゼロ」は基本ルールを授けただけで、高段者の棋譜を読み込む手続きを飛ばし、いきなり「ゼロ」同士の対局で臨み対局を繰り返して行った。
その進化の様子は、まるでうまれたばかりの赤ん坊が瞬く間に超人に成長するSFの世界を見るような状況だったそうだ。
@全くのゼロから対戦(学習)を始めてから3時間目では、ルールを覚えたばかりの子供がランダムに石を打つレベルだった。
A19時間後では着手の効率のいい隅から打ち始めるようになり、石の死活や石で囲む領土の概念を獲得した。
B70時間後では既に人間を超えるレベルに到達した。
ここに至るまでに一手0.4秒の速さで490万局の自己対局を繰り返し、前述した初代アルファ碁に100戦全勝した。
さらに
自己対局が2900万局に達した40日後には、初代の進化版で、昨年末〜今年初めに中国柯潔(かけつ)九段や井山裕太七冠ら世界トップ棋士に60戦全勝した「マスター」にも89勝11敗と圧勝した。
論文によると「ゼロ」は従来のアルファ碁で運用していた次の1手を探すネットワークと、形勢を判断するネットワークを一つに統合し、より確かな解を導き出せるよう新しいアルゴリズムを導入した結果、急激な棋力の向上と適格で安定した学習を可能にしたそうだ。
今回の衝撃ともいえる驚きはAI開発に人が培った専門知識を全く用いなかった事にある。
これまでのAI開発は事前にAIが学習するための膨大なデータが必要だった。
しかし今回の「ゼロ」は初期条件だけで、真のゼロから自己学習で進化し、短期間で人間を超えるレベルに達した。
囲碁の様にルールが明確なものについては、専門知識や膨大なデータを必要とせず、AIが必要なデータを自動で獲得し人間を超える高いレベルに進化することが照明された。
今回の囲碁での成果は、世の中の諸問題をAIが事前データ無しでも解決し得る事が出来る可能性を示したということになる。
勿論現実に横たわる各種課題・目標を解決する場合、ルールが明確でなく、最善手が一つということがない場合も多いとは思われるが、AIによる解決の可能性を示したといえる。
今後のグーグルの展開とこれに触発された世界の研究者の成果が期待される。
(本記事は日経産業新聞11月20日付け記事を参考にした)
尚AI囲碁ソフトが発売されるそうだ。(追記参照)ところで
日本国内最強の囲碁AIは「DEEP ZEN GO]だが、このソフトのプログラマー尾島陽児さんが
市販用にチューニングした商品を開発した。
商品名は「天頂の囲碁7 ZEN」でマイナビ出版が11月17日に発売する。
同社が2009年に初めて発売した「天頂の囲碁」の棋力は二段だったが、ディープラーニングを使って上達し、現在は前作の七段を超える九段の棋力に達したという。
ただまだ死活の責め合いではミスが出ることもあり今後の課題となっているそうだ。
ソフトの棋力は対局相手に6級から9段までレベルを調節出来る。
プロや他人同士の対局も検討出来、各局面の形勢判断や有力手を示してくれるという。
値段は12000円で家電量販店や同社の販売サイトから購入出来る。
【このカテゴリーの最新記事】
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/6962566
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。
この記事へのトラックバック