コンピュータ将棋界で意外に知られていないこと、あるいは当ブログ主が知らないこと

[shogi] 日本コンピュータチェス協会(JCCA)について私が知っている100のこと(1)

「日本コンピュータチェス協会」と言ってもたぶん知っている人を探すほうが難しいだろう。しかし、コンピュータ将棋関係者ならば一度ぐらいは名前を聞いたことがあるかも知れない。

まったく知りませんでした。嗚呼。

知らなかったのは駒の価値の学習手法についても同じで、駒の価値のEloレーティング計算も、Bradley-Terryモデルも、それぞれ「棋理(遠見)」開発日記さんと、かずの心の贅肉さんの記事が初見でした。もっとも、知った後に論文を取り寄せて勉強していたりもしないわけですが(汗)。いずれの方法も、「歩<香<桂<銀<金<角<飛」の序列におおむね沿っていますね。ただ、少しだけ言い訳をさせていただくと、Eloレーティングは飛車の価値が低く、Bradley-Terryモデルは逆に飛車の価値が高すぎるように見えることもあって、チェックが甘くなっていました。

駒の価値の学習を用いない多くのコンピュータ将棋では、「歩<香<桂<銀<金<角<飛」に倣うような点数を大まかに見積もって実装し、その後の自己対戦や他のソフトとの対戦の繰り返しによって勝率が高くなるように手作業で微調整を行っている(行っていた)ものと推察されます。Bonanzaが現れるまでは、それだけで充分な成果のように見えましたし、学習によって求めた評価値が手作業にまさるという保証もありませんでした。Bonanzaが優れているのは、駒の価値だけでなく、駒組や駒の働きを加味した膨大な数の特徴ベクトルを設計し、その価値を学習で与えたことです。特徴ベクトルが1万を超えてしまっては、手作業はまったく追随不可能で、ここに学習ならではの強さが実現しました。

EloレーティングやBradley-Terryモデルも、適用範囲を駒の価値だけでなく特徴ベクトルの値にも一般化できそうに思われます。その一般化を成功させた実装が現れれば、これらの技術も存在感を増し、コンピュータ将棋の進歩に貢献してくれるのではないでしょうか。

コンピュータ将棋が領域限定的な強化で満足し、井の中の蛙に堕してしまわないためにも、上記のように多様な技術が適用されることは、人間と対戦するのと同様に、あるいはそれ以上に重要なことです。それだけ進歩のチャンスが増えますし、また他分野との技術的関連が深まることによってコンピュータ将棋の研究成果が広く世の役に立つ可能性も広がります。と、不勉強な当ブログ主が言っても説得力はないのですが、それでもブログネットワークを通じて広い知見にアクセスできたのは不幸中の幸い。今後とも的確なツッコミをお願いいたします。まずは手始めに、やねうらおさんが知っている100のことシリーズで勉強し直します。

2 Comments »

  1. […] コンピュータ将棋協会blog » コンピュータ将棋界で意外に知られてい … […]

  2. […] コンピュータ将棋協会blog » コンピュータ将棋界で意外に知られてい … […]

RSS feed for comments on this post · TrackBack URI

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です