ボナンザVS勝負脳: 404 Machine Learning Not Found

以前当ブログにて紹介したボナンザVS勝負脳――最強将棋ソフトは人間を超えるかが、404 Blog Not Foundにて絶賛されています。コンピュータ将棋関連書籍が著名なブログにて書評されることは従来考えられなかったことであり、コンピュータ将棋の関心の拡大に感慨を覚えるとともに、保木さん渡辺竜王の功績の大きさに頭が下がる思いです。

ただ、この分野の専門的な内容についてはさすがに難解なだけあって、多少の誤解を生じやすい面もありますので、当ブログにて若干の補足を加えます。たとえば、

難しそうであるが、乱暴に一言でまとめれば、「ボナンザ君に胃腸を与えた」ということである。あとは餌となる棋譜を食わせていけばいい。それで足りない栄養があったら、それを吸収するためのアルゴリズムを追加するなり調整するなりすればいい。

棋譜データを解析した結果をコンピュータの思考に反映させる、という手法は、ボナンザが始めたものではなく、ゲームプログラミングでは古典的なテーマです。人工知能分野一般の用語を使うと、これは機械学習の一応用、ということになります。より現代風に表現すれば、棋譜データベースからのデータマイニング、というところでしょうか。この分野には、ニューラルネットワーク遺伝的アルゴリズムベイジアンネットワークなど多数の手法があり、これらをゲームに応用する研究も古くから試みられています。コンピュータ将棋でも、学習というだけなら、ユーザの指し手を学習する機能を搭載したソフトが20年以上前から発売されています。トップレベルの強さを実現させた例としては、ボナンザ以前にも、激指実現確率探索アルゴリズムに用いるための確率の測定を羽生善治実戦集棋譜から行った例が報告されています。ゲームプログラミング一般まで話を広げると、今から50年以上も前に、アーサー・サミュエルが自ら学習して自動的に強くなるチェッカープログラムを開発したのが、よく知られた最初の成果です。

ですから、『Bonanza以前は、それを「どうやって食べればいいか」ということが知られていなかった、というよりそういう方向にはプログラマーたちは考えなかった』ということはもちろんありません。

コンピュータチェスもしくはコンピュータ将棋において、ボナンザ以上の成功を収めた学習システムは存在しなかった、という評価が与えられているのは事実です。将棋の駒の価値を学習させる研究のほとんどは、「歩<香<桂<銀<金<角<飛」という常識的な価値判断から大きく乖離した結果しか導けませんでした。ボナンザはこれを、人間からみてやや違和感がある、という水準にまで向上させたのです。渡辺竜王をはじめ多くの人々に知られたボナンザの角切りは、学習から得た個性的な価値判断によるものです。通常は損なはずのこの感覚は、とにかく敵の陣形を薄くしてミスを誘う、という実戦的なセオリーに適っているため、ボナンザは特に対人戦で強さを発揮することで広く知られるようになりました。

したがって、胃腸の比喩に値する学習システムを初めて作り上げた、という解釈だとすれば、評者の小飼弾氏の表現は的確といえます。しかしながら、棋譜データからの栄養分吸収システムがボナンザに始まったものでもなければボナンザで完結したものでもない、ということは、覚えておく必要があります。今のところコンピュータが人間のプロを上回れないのは、まさしく吸収できていない栄養分があるからであり、それを吸収するためのアルゴリズムを追加するなり調整するなりできる目処は未だ立っていないのです。

Bonanzaは、棋譜を喰らうことが出来る。それが意味するのは何か?

弾言しよう。電脳が人脳に勝つ日は、棋士たちが頑張れば頑張るほど近づくのだ、と。

もちろん人間の棋士のレベルは今後も向上することが期待されますが、それがコンピュータ将棋の進歩に貢献してくれる保証はありません。現代の人間のエキスパートは恐らく全員、6万局よりもはるかに少ない棋譜から勉強して強くなれたのであり、そこには充分に芳醇な情報がすでに含まれていたはずです。食えば食うだけ強くなるという条件が成り立つには、追加された棋譜が旧来の棋譜にない情報を含むことが必要ですが、それが未来の日付の棋譜に有意に含まれるという確たる根拠はありません。6万局のデータそれ自身の実質的な情報量はせいぜい6メガバイト程度であり、確かに電脳にとって稀少な量ですが、機械学習、もしくはデータマイニングの観点からは、もう充分に飽和に近づいている量である、とも推測できます。恐らく学習を導入しているコンピュータ将棋開発者の多くは、新しいデータに期待するよりも、旧来の棋譜からより多くの有益な情報を獲得することを目指しているのではないでしょうか。

そして棋士たちは、その日が来た時、悔しがるよりも、むしろ慶ぶべきだということを。

なぜなら、ボナンザを強くしたのは、開発者たる保木ではなく、6万局の棋譜を残した、1607年から連綿と続く棋士たちなのだから。

コンピュータの進化はまさしく人類の勝利である、という見方はまったくその通りであり、コンピュータ将棋のみならずあらゆる計算機科学分野にとって共通の理念でしょう。ボナンザの学術的な意義は、従来の機械学習にない文脈から明確な成果を導いたことであり、そのことをボナンザVS勝負脳から見出した小飼氏の慧眼はさすがといえます。ここで当ブログ主の希望的観測を交えると、ボナンザの方法は、コンピュータ囲碁モンテカルロアルゴリズムと並んで、ゲームプログラミングから生み出された革新的な学習アルゴリズムの萌芽として、次世代の機械学習分野に貢献する存在になるかもしれません。本書は、当ブログ主が思っていたよりも、人類と電脳の幸せなコラボレーションのイメージを共有させる力にあふれているようです。

3 Comments »

  1. 将棋ゲームが面白い
    http://syougii.seesaa.net/

  2. […] This post was mentioned on Twitter by erickqchan. erickqchan said: @button_ab あと革命的なソフトだったボナンザがソースコードを公開して確か著作権放棄したことで、一気に進歩してる感じ。合議制とか […]

  3. […] コンピュータ将棋協会blog >> ボナンザVS勝負脳: 404 Machine Lear…ブログにて紹介した、ボナンザvs勝負脳――最強将棋ソフトは人間を超えるかが、404 blog not foundにて絶賛されています […]

RSS feed for comments on this post · TrackBack URI

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です