スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 不具合修正パックを更新 | トップページ | 三週間目に突入 »

セルフ対局も始める

ここの所、ブログ記事はイリーガルな感じなのだが、EdaxBoardを使ったEdaxとMasterReversiとのエンジン対局は継続中だ。しかし、未だに、100対局させれば、Edaxが10局程度は負けてしまうし、MasterReversiも1,2回は負ける。なので、この状況ではBookは公開できないので・・・

このブログを読んでいる人の中には、Edaxがそんなに負けるか? と、思っている人もいるかもしれないのだが、エンジン対局というのは、AI同士の戦いになる訳だ。

つまり、例えば、作者自身がEdaxと対局した場合、まず100%、勝つのはEdaxになるので、Edaxは強い、という印象を持つ事になるのだが、MasterReversiのAIというのは、1996年当時のパソコンで動作させても、当時の人間の世界チャンピオンに勝ってしまったLogistelloと同様の評価方式を採用し、今時のPCの性能をフルに発揮できる様に、マルチスレッドによる並列演算やSSE/AVX命令による多ビット演算にも対応するAIになる訳だ。

更には、その後、巷に登場した、より洗練されたリバーシプログラムであった所のWZebraとの何十万対局もの対局結果をBookに収めていたりもする。

と、いう事なので、デフォルト状態ではBookを持たないEdaxに対して、MasterReversiはWZebraとの対局をベースにした豊富なBookを使える分、有利なのだが、もしBookから外れた場合にも、その評価関数はEdaxと比べても、特に劣るという事はない訳だ。

更には、今回のエンジン対局では、Edaxのレベルはデフォルトの21にしてあるので、Edaxの評価関数は通常時には21手読みしかしないのに対し、MasterReversi側のレベルは5なので、通常時には24手読みをしている。

また、MasterReversiのレベル5では、30残からは読み切りを行うので、9割方は最善手を打つし、28残からは勝敗/完全読みを行うので、バグがない限り、100%、Draw以上の状況で、負ける事はない訳だ。

と、いう事なので、今回行っているエンジン対局で、EdaxがMasterReversiに負け越すのは当然と言えば当然なのだが、既に対局数が20,000対局を越えてきている現時点でも、まだ、10回に1回程度の頻度で負けるのは、作者的にも、少し意外だったりもしている訳だ。

何故なら、今回のエンジン対局では、EdaxのBookも更新しつつ行っているので、対局数が増えれば、Edax的にも、負ける手筋には進めなくなる筈なので、自ずと、Bookにある既存のDrawラインを選択する様になっていく筈だからだ。

にも関わらず、Edaxの負け数が順調に減っていかないのは、EdaxのBook登録では、実際に行われた対局の進行以外にも、そこで発生した各局面にEdaxの評価値を登録するからだ。

つまり、対局で負けた場合にも、Edaxとしては、今回の対局で負けたのは、ここの局面で、この手を打ったからで、実際には、この手を打っていれば負けなかった筈だ、みたいな感じで、Bookに代替手を同時に登録するのだが、エンジン対局の結果を見る限り、その代替手を打った場合にも、多くの場合、負けてしまっている訳だ。

と、いう事なので、Edaxというのは本当に強いのか? という疑問も沸いてくる訳だ。

つまり、今回のエンジン対局では、Edaxの評価関数の精度が高い事を前提にして、対局結果をそのままBookに登録しているのだが、もし、Edaxが勝てる筈の対局で負けているのだとすると、Bookの内容も信用できなくなる訳だ。

なので、今日から、MasterReversi同士のセルフ対局も開始した。もっとも、双方がBookを使うとDrawにしかならないので、基本的には、片方にはBookを使わせ、もう片方にはBookを使わせない設定で対局を行わせている。

「基本的には」、と、書いているのは、様々な手筋に満遍なく行く様に、Bookを使わせない方にも、20手目までのみ登録されているBookを使わせているからだ。

つまり、20手目までは、双方でBookに従ったDrawラインをランダムに選択しつつ進行し、その後は、Bookを使わない方は、評価関数による評価結果から、MasterReversi的に最善と思われる手筋を進む事になる訳だ。

その結果としては、Bookが正しければ、Bookを使う方が勝つか引き分ける筈なのだが、200対局程度が終わった現段階では、6割はDrawになり、残りの4割の殆ども、Bookを使う方が勝っていたのだが、3局だけ、Bookを使わない方が勝っていた。

と、いう事で、Bookに関しては、まだまだ安定しているとは言い難いので、来週早々の公開は無さそうなのだが、来週Endには安定しているのか、というと、それも何とも言えない感じになってきているので、どの辺で見切りを付けて公開しようかなあ、と、思ったりし始めている今日この頃だ。

ちなみに、勝ち負けが発生する場合、対局の途中でBookの手筋から外れる事になるのだが、エンジン対局の状況を見ていると、この外れる場所というのは、早くても22手目くらいで、20手目までにBookから外れている事は皆無だ。

つまり、Edax的にも、MasterReversiのBookにある20手目までのDrawラインについては、異論はない、みたいな感じになっている訳なので、前述の様に、セルフ対局でも、20手目までは、Bookを使わせる格好にした訳だ。

と、いう事なので、8x8のリバーシは、まだ完全解析はされていないのだが、20手目くらいまでの最善進行については、実質的には、ほぼ確定しているのかもしれない今日この頃だ。

もっとも、Edaxにしてみても、パターン評価が中心になっている事から、前述したLogistelloの系譜に含まれるリバーシソフトになる筈なので、MasterReversiと似たような見解を持つ事になるのは当たり前の事でしかない、という可能性もある。

なので、実際の所としては、20手目までの最善進行も嘘っぽいのかもしれないのだが・・・

« 不具合修正パックを更新 | トップページ | 三週間目に突入 »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66689035

この記事へのトラックバック一覧です: セルフ対局も始める:

« 不具合修正パックを更新 | トップページ | 三週間目に突入 »

2018年9月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google