読者です 読者をやめる 読者になる 読者になる

kon×hatena

コンピュータビジョン・パターン認識の研究をしています。聴覚障害のこと、専門のことその他もろもろを投稿していきます。

GoogleのAlphaGoまとめ

はじめに

以下のニュースが世間を騒がせています.
www3.nhk.or.jp

Googleの開発した囲碁AI「AlphaGo」がプロに勝利したというのです.
ただ,「勝った」ことばかりが持ち上げられており,詳細がどうにもつかめないので調べてみました.

ざっくり概要

ヨーロッパチャンピオン3度のプロ棋士 Fan Hui氏に5戦5勝.
この論文が本日付でNatureに掲載された.
http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

技術的なこと

AlphaGoの論文はNatureに記載されているようですが,有料で簡単には読めません.
そこで,Googleのブログから詳細を掴んでみます.

Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning


(追記)
このようなコメントを頂きました.ありがとうございます.

https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf
から論文が無料でダウンロードできるとComputer Go mailing list にありました。

ここから内容を確認できるようです.
(追記終わり)

これによると,ディープラーニングおよびモンテカルロ木探索,そして強化学習を組み合わせているようです.
このモンテカルロ木探索,あまり聞き慣れない単語ではありますが,囲碁AIのブレイクスルーとなった手法のようです.
なお,Facebookも1月の頭に囲碁AIを公開しており,こちらでもディープラーニングおよびモンテカルロ木探索を利用しています.
この2つの違いは,「強化学習」の有無でしょうか.

AlphaGoの実力はどれくらい?

囲碁の強さを表すelo ratingなる指標があります.これが非常にジャンプっぽく,わかりやすいです.
Go Ratings

このelo rating,Googleのブログでも紹介されており,それによると
http://3.bp.blogspot.com/-vK8GilvWdPU/Vqg8QhWTazI/AAAAAAAAA2g/OF2btDMTqNc/s1600/image00.png

  • AlphaGo :3200pt(プロ5段)#今回のAI
  • Fan Hui氏:2900pt(プロ2段)#ヨーロッパチャンピオンだが,中国基準では2段とのこと.
  • Crazy Stone :1900pt(アマ6段)#これまでで一番強力と言われた囲碁AI

となっており,これまでの囲碁AIがアマチュアの枠に留まっていたのを一気に飛び越えてしまった感じでしょうか.
なお,elo ratingにおける3200ptというのは,世界TOP200 程度のレベルのようです.

おわりに

AlphaGoの次回の対戦相手はelo rating 3515pt,世界5位のLee Sedol氏のようです.どうなるか注目です.
去年は将棋AIと将棋プロ棋士の戦いである電王戦に注目が集まりました.
これからは囲碁AIと囲碁プロ棋士の戦いに注目が集まりそうな予感です.