不完全情報ゲームでも人間vsコンピュータ: ポーカー

Chinook成果で世界にその名を轟かせた、シェーファー教授カナダ・アルバータ大学)のグループが、今度はポーカーをプレイするコンピュータPolaris(ポラリス、北極星の意)で高額の賞金をかけて人間の世界レベルのプレイヤーと対戦しました

チェッカーが読みきられた、というニュースも大きなインパクトがありましたが、渡辺竜王vsボナンザもそうだったように、人間との真剣勝負もエキサイティングですね。対戦レポートのページにてユナボマーという過激なニックネームで人間プレイヤーが紹介されていることからも、その興奮を感じます。しかも、途中コンピュータがリードするも惜敗、という息詰まる展開でした。

ポーカーはいわゆる不完全情報ゲームです。将棋やチェッカーなどの場合、先後が決まったあとはすべての状況が目に見えますが、人間に親しまれているゲームには不確定の要素や見えない要素が鍵を握るものもたくさんあります。この点において、コンピュータは将棋にない難しさの克服を迫られます。この分野におけるコンピュータの成果としては、たとえば片上五段全国タイトルを獲得したことでも知られるバックギャモンで世界トッププレイヤーと渡り合ったTD-Gammonの研究などが有名です。バックギャモンは、未来のダイスの目が未知、という点で双方のプレイヤーにとって平等な不確かさを持っていますが、ポーカーのようなカードゲームは、手札を知るのは自分だけ、という情報の非対称性をもつゲームであり、このことがコンピュータにとって一層の難題となります。

…と話し込んでいるとますます将棋と関わりの薄い話になっていきますので、この方面にご興味のある方は上記のリンクをたどってみてください。私が今回のニュースでもっとも驚いたのは、Polarisの開発者がゲーム終了後直ちにゲームの分析をしてみせたことです。完全情報ゲームの将棋でも局後に的確な感想戦を行なうことは難しいのですが…。双方のプレイヤーが互いの技術をたたえあう姿は、まさに感想戦の作法を見ているようで、見習うべきものがあります。

なお今回の勝負は、カード運が公平になるデュプリケート形式で行なわれていることを、念のため補足しておきます。これは、プレーヤーA1, A2からなるチームAと、プレーヤーB1, B2からなるチームBとの対戦で、A1対B1、A2対B2のゲームが、A1とB2、A2とB1に常にまったく同じカードをそれぞれ配るという条件で並行して戦われる、という形式です。すなわち今回の結果は、どちらかが幸運に恵まれたものではない科学的妥当性の高いものといえます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です