Bonanzaの戦略
プロ棋士の渡辺竜王が、将棋ソフト「Bonanza」と対戦した。
将棋連盟は、プロ棋士が将棋ソフトとの公の場で対戦することを禁じているそうだ。
今回は、初の試みらしい、結果は、渡辺竜王が112手で勝った。
竜王は対戦感想で、「Bonanzaの指し手は、非常に人間臭かった」と言っていた。
私には、Bonanzaの成り立ちが衝撃的であった。
誤解を恐れずに大まかにまとめると。
1)Bonanzaの開発者は将棋を知らない。
2)Bonanzaが指す手は時間の許す限り全幅探索する。(力任せ探索)
3)Bonanzaに将棋のヒューリスティックスな知識は埋め込まれていない。
4)主戦略は単純で、過去の棋譜に一番近い手を探索する。
棋譜はプロ棋士3万局、アマ3万局を利用。
今までの将棋ソフトの常識と思われるもの
・強さの秘訣は、最善手の探索をいかに効率よく行うか。
・最善手の評価関数をできるだけ、実践に効果のあるものを作る。
・これらを実現するには、将棋の知識が必須なので開発者は将棋が強いほど望ましい。
従来の常識では、「将棋ソフトに、いかに強い将棋の思考ルールを組込むか」であったが、
Bonanzaは、「いかにに多数の棋譜の中から、現局面に近いものを探す」かである。
Bonanzaは、他人の将棋の真似をしているだけなのだ。
Bonanzaの戦略は、人が新しい言葉を覚え、別の会話の中で、その言葉を使っていく過程と同じに思える。
人は他人が話す「新しい言葉」と、その場の雰囲気(文脈)から、その言葉の利用方法を学習していると思われる。
その言葉の意味を一々定義して、覚えている訳ではなく、会話の文脈で覚えていく。
Bonanzaはたくさんの棋譜(将棋文脈)から、現局面の最善手を統計的データを利用し決めているだけだ。
Bonanzaは棋譜のデータは必要とするが、将棋の知識は必要ではなく、
必要なのは、入力パターンから、ある特定のパターンを探索する能力である。
※「将棋の知識は必要ではなく」は言い過ぎかもしれないが。
この事例は、ソフトウェアの開発戦略にも影響を与えるのではないかと思う。
ソフトウェアが、その目的分野のヒューリスティックスな知識を持つより、
その分野の統計的データ+強力なパターン比較能力を持つ方が能力が高いという結果である。
| 固定リンク

コメント