【番外編】あすからコンピュータ囲碁がトッププロ棋士に挑戦

コンピュータ将棋の話題をお伝えしている当ブログですが、今回は番外編として、コンピュータ囲碁を取り上げます。3月9日から5日間、コンピュータ囲碁とトッププロ棋士との五番勝負が行われ、YouTubeにてライブ中継されます。これを受け、従来のコンピュータチェスやコンピュータ将棋と同様、コンピュータ囲碁についても、来たるべき時が来た、もしくは、Xデーが近づいている、という話題が急速に盛り上がっており、コンピュータ将棋のコミュニティーでも無関心ではいられなくなっているのが、今回の記事の理由です。とはいえ当ブログの主旨はあくまでコンピュータ将棋ですので、主にコンピュータ将棋との比較を用いて、コンピュータ囲碁の最先端を紹介したいと思います。なお、リンク集としても使えるようにできるだけ各所へのリンクを含めますが、下記内容は一部、筆者の主観も含みます。

トッププロ棋士との対局

今年1月、米国グーグルから、コンピュータ囲碁システムAlphaGoが囲碁の欧州王者の樊麾 (Fan Hui) 氏を5勝0敗で破ったこと、および、世界的なトッププロ棋士の李世乭イ・セドル)九段と3月に対局を予定していることが発表されましたAlphaGoの情報については、発表内容を参照、もしくは関連情報を検索してご覧ください。

コンピュータ将棋とトッププロ棋士との対戦は、9年前の2007年、渡辺明竜王Bonanzaとの一戦が最初です。それ以前のプロとの平手対局(駒落ちでない対局)は多くはありませんでしたが、女流棋士には勝った対局があり、また2年さかのぼって2005年には、TACOS橋本崇載五段(当時、現八段)との対局で惜敗したものの一時勝勢を築き上げ、コンピュータ将棋の実力が人類トップに迫っていることを示していました(このときプロが追い詰められたことが、同年の禁止令につながったと言われています)。機は熟した、という雰囲気の中で行われたBonanza-渡辺竜王の一戦は、予想以上の接戦になったものの、結果は大方の予想通り渡辺竜王が112手で勝利しました。

これに対し、今回の対イ・セドル九段戦の発表は、まだまだコンピュータ囲碁が人類のトップに迫るには時間がかかる、と思われていたところだったため、世界中の開発者や学識経験者を驚かせました。また今回は5局の対局が行われるため、AlphaGoの実力をよりはっきりと知ることができるでしょう。

現在の強さ

ここ数年、人類との戦いにおけるコンピュータ囲碁の位置取りは「コンピュータ将棋を約10年遅れで追いかけている」というのが関係者のコンセンサスであったろうと思います。9年遅れでハンディキャップなしでのトッププロとの対局が実現したことは、それが妥当な見積もりであったことが示された、ともいえますが、もしAlphaGoイ・セドル九段を苦しめれば、もっと近づいている、と考えるべきでしょう。むしろAlphaGoが登場する直前まで「進歩が遅くなっている」と見られていたため、AlphaGoのインパクトが大きく感じられています。

進歩史

コンピュータに将棋を指させる研究が本格的に始動してからそろそろ40年になろうとしている現在まで、コンピュータ将棋のトップレベルは「1年あたり約100点のレーティング成長」を繰り返してきた、と考えられています。急激に進歩した、あるいは逆に停滞した、という時期変動はほぼなく、おおむね直線的に実力を伸ばしてきたと思われます。対戦成績をもとに計算されるELOレーティングは『200点のレート差がある対局者間では、レートの高い側が約76パーセントの確率で勝利する』という定義を持っていることから、「2年前の自分自身と多数の対局を行ったとして、3勝1敗ペースで勝ち越せる」といえるだけの実力向上を常時達成し続けてきた、ということになります。

対するコンピュータ囲碁の進歩はコンピュータ将棋ほど順調でなく、ブレイクスルーで一気に伸びた時期と伸び悩んだ時期が混在しています。最初のブレイクスルーは約10年前、Crazy Stoneが導入して成功したモンテカルロ木探索(PDF)です。この技術はたちまち開発者間に広まって主流となり、従来の評価関数型のコンピュータ囲碁を実力で完全に置き去りにしました。コンピュータチェスや将棋で成功した評価関数の開発は囲碁ではきわめて難しく、評価関数による先読みでもっとも評価値の高かった手を打つ方式のコンピュータ囲碁は低成長にとどまっていたのです。対するモンテカルロ木探索は、コンピュータがランダムに手を読み、読みの中でもっとも勝率の高かった手を実際に打つ、という信じられないような方法ですが、ランダムシミュレーション方式の改良や読みの効率化などを加えて実力を向上させ、人間のアマチュアの大半より強い、というレベルに5年ほどで達しました。

そのモンテカルロ木探索の伸び悩みが顕著になってきた現在、2度目のブレイクスルーを果たしたのは、近年の人工知能ブームを牽引する第1エンジンとして知られるディープラーニングです。画像認識等ですでに目覚ましい成果を挙げているこの技術は、グーグルの英国子会社ディープマインドによって囲碁の手を打つための学習に最適化され、学習によって強化されたAlphaGoFan Hui氏を5勝0敗にやり込めました(なお、非公式対局を含めると8勝2敗だったそうです)。グーグルによれば、ベースアルゴリズムに従来通りモンテカルロ木探索を採用している一方、ディープラーニングによって求めたバリューネットワーク、すなわち、置き去りにされていた評価関数の役割を果たすニューラルネットワークの高精度化に成功し、それを採用しているようです。

事前予想

9年前のBonanza-渡辺竜王戦は、渡辺竜王がほぼ間違いなく勝つであろう、という事前予想の通りの結果とはなりましたが、先述の通り予想外の接戦となり人々の記憶に残る一局となりました。11年前に橋本五段(当時)が危機に陥ったのは(恐らくは気の緩みがもたらした)アクシデントであった、というのが共通認識であり、まさか、はないであろう、と予想されたからこそ当時の対局が実現したといえます。その渡辺竜王はフリーソフトとして(今でも)公開されているBonanzaを徹底的に研究して対局に臨みました。ブログ記事ご本人が書いている通り、Bonanzaが角を切りたがる悪癖を出させれば楽勝、という罠をも含んだ周到な作戦を用意していました。しかしBonanzaも悪癖を回避する対策をあらかじめ加えており、罠を逃れました。

今回、イ・セドル九段は『少なくとも今回は勝つ自信がある』と表明しました。多くの囲碁棋士の評価も総じて「公開されたFan Hui氏との対局の棋譜を見る限りAlphaGoの打つ手はイ・セドルに勝ち目のあるレベルに達していない」というもののようです。しかしこの対局は昨年10月のものであり、その後5ヶ月間の進歩次第ではどうなるか分からない、と警戒する声も多くあります。また対局後の進歩については、イ・セドル九段も『今後人工知能が発展するならば1、2年後、その時は分からない勝負になるのではないだろうかと考える』と発言しているようです。AlphaGo対策は、特別な対策を用意するよりもコンディショニングに気をつけているようです。Bonanzaと違ってAlphaGoのソフトウェアが公開されている訳ではないので、それも当然かもしれません。

対人プロジェクト

AlphaGoは、グーグルが巨額の投資を行って研究開発している成果で、今までコンピュータ将棋に投入された資金の総額よりも恐らく大きな投資が行われていると想像されます。今までコンピュータ将棋でもっとも大規模な開発が行われたのは、情報処理学会創立50周年記念事業で開発されたあから2010でしょう。これは世界コンピュータ将棋選手権に出場しているコンピュータ将棋の複数の開発チームが大同団結して開発が行われ、2010年に清水市代女流王将(当時)に勝利を収めました。しかしその後対局が組まれることはなく、記念事業はわずか一局が指されたのみで2015年に終了宣言が出されています。プロ棋士とコンピュータ将棋の対決の場としてほとんどの方が思い出すのは電王戦、ということになるでしょう。こちらは世界コンピュータ将棋選手権とほぼ同様のチーム単位での対戦が今年まで行われており、これは今後も続くでしょう。コンピュータ将棋は、主に群雄割拠型の対人戦を行っている、というべきでしょう。

対してAlphaGoは、ディープブルー以来の大規模プロジェクト型といえます。今月19日(土)、20日(日)に開催される第9回UEC杯コンピュータ囲碁大会に出場するどのコンピュータ囲碁チームよりも大規模な開発プロジェクトであろうと思われます。残念ながら将棋は日本以外でほとんど知られていない競技のため、海外の人々にとっては、これがスタンダードな「人類の英知にコンピュータが挑む」スタイルだ、と考えられているでしょう。

グーグルがそれほどの勝負をするのなら、ということで、日本でもDeepZenGoプロジェクトが発足しました。これはUEC杯コンピュータ囲碁大会で2度優勝しているZenの技術をベースに(株)ドワンゴ日本棋院、ほか各方面の技術者が参加するプロジェクトで、詳しくはドワンゴのプレスリリースをご覧ください。Zenドワンゴの持つ紅莉栖(くりす)を用いたディープラーニングで強化しようと考えたことがプロジェクトのきっかけだそうです。このプロジェクトも近い将来のプロ棋士との対戦を意図しているものと思われます。

また、中国でも、現在の世界最強と目される中国人囲碁棋士、柯洁柯潔)九段と人工知能との対局プロジェクト(中国語)計画されているようです。このほか、第9回UEC杯コンピュータ囲碁大会に出場するFacebookをはじめとする世界的な大企業が今後独自のプロジェクトを立ち上げる可能性もありそうです。なお、第9回UEC杯コンピュータ囲碁大会の直後にも第4回電聖戦がありますが、こちらは置碁、すなわちプロ棋士にハンディキャップをもらっての対局で、プロを打倒するための対局ではありません。

技術的意義

先述したコンピュータ将棋の直線的な実力の伸びは、必然的にそうなったのではなく、一般のIT技術の影響も色濃く反映されています。約40年にわたって多くのソフト開発者がコンピュータ将棋を改良する努力を継続してきた一方で、ムーアの法則と呼ばれる半導体製造技術の進歩でCPU性能が向上してきたことが下支えとなり、それが10年ほど前までコンピュータ将棋の進歩を保証している面がありました。しかし2000年を過ぎてからCPUのリーク電流による熱問題が顕在化してCPUクロックの高速化が次第に困難になり、インテルのペンティアム4プロセッサは2005年に4GHzの手前でCPUクロック数の増大を止めました。この後もマルチCPU化やメモリ容量の増大は続くものの、CPUの高速化には期待できなくなりました。代わって、ほぼ同時期にBonanzaが評価関数の学習に成功し、これが他のソフトに普及して学習技術の改良が新たなコンピュータ将棋の成長エンジンになりました。この2つがつながった結果として、直線的な進歩が継続しました。コンピュータ将棋における学習の成果は、その後のビッグデータからの学習というホットな分野の成功を先取りしたものでした。

対するコンピュータ囲碁は、2006年までCPUクロック数増大の恩恵が得られにくい状況でしたが、モンテカルロ木探索が登場してからはクロック数だけでなくマルチCPUで性能向上しやすいことも相まって急速に強くなりました。そして、モンテカルロ木探索の改良が伸び悩みを見せている今、IT業界外でも広く知られるようになったディープラーニングが新たな成長エンジンになりました。ディープラーニングはすでに多方面で成功を収めていますが、「人類トップの囲碁プレイヤーに勝つ」という新たな目標を得たことで、新たな課題を克服し、それがさらに他分野に応用され…という好循環の加速が期待されます。

1997年、史上最強のチェスプレイヤーと呼ばれたガルリ・カスパロフを破ったディープブルーは賞賛を一身に浴び、IBMに絶大な広告効果をもたらしました。あから2010のプロジェクトが人工知能ブーム到来前の2010年に実現したことからも、知的ゲームで人類トップに挑戦する研究が注目を得やすいことが見て取れます。グーグルがこの広告効果を見込んで巨額の投資を継続すれば、ディープラーニングの研究開発が加速し、全人類が恩恵を受けることが期待されます。

また、オンリーワンの巨人だったディープブルーとは異なり、先述のDeepZenGoプロジェクトをはじめ後続のプレイヤーがキャッチアップを狙ってきそうです。こちらもディープラーニングがコア技術になる可能性が濃厚。激しい競争も人工知能技術の進歩を加速するでしょう。囲碁は東アジアを中心に普及している競技ではあるものの世界中にファンが存在し、人智が機械を上回る最後の聖域として人工知能分野で高い知名度を持ちます。今回のAlphaGoのチャレンジは、世界中の多くの研究開発者を触発することになるでしょう。

おわりに

今回の五番勝負、当ブログではイ・セドル九段の勝利を予想しますが、プロが危なげなく全勝、というわけにはいかないかもしれません。星取りに関わらず、AlphaGoの打ち回しは世界を驚かせるでしょう。その一点だけでも今回の五局は必見です。

真剣勝負には筋書きがありません。1997年にディープブルーと対局したカスパロフは最終第6局、序盤に信じられないような悪手を指して短手数で敗れ、引き分けなら訪れなかったその日を突如として迎えることになりました。2015年の電王戦FINALの最終第5局はわずか21手で開発者が投了しました。歴史の転換点は案外、必然的でなく唐突に訪れます。技術の進歩が人智に迫る必然と、やり直しのきかない勝負の偶然。この最高のテクノロジー・エンターテインメントを楽しみに待ちましょう。

1 Comment »

  1. きょうから第1期電王戦

    きょう4月9日(土)とあす10日(日)は、第1期電王戦第1局、▲Ponanza-△山崎隆之叡王が開催されます。新生電王戦の最大の特徴は2日制の対局であること。本日は第1局の1日目となります。 今回…

RSS feed for comments on this post · TrackBack URI

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です