スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« それでも仕上げに入る | トップページ | 結局は評価データ »

Bookにも仕上げが必要

ここの所、EdaxとMasterReversiとのエンジン対局を行いつつ、MasterReversiのFFO性能を向上させてきたのだが、来週にはMasterReversi Ver1.5.1をリリースすべく、纏め作業に入った。今回の主要アイテムはBookの更新になるのだが、評価データと評価関数の微変更も入る。

EdaxとMasterReversiとのエンジン対局は1ヶ月以上に及んだのだが、MasterReversi側はレベル5、Edax側はデフォルトのレベル21に設定していた。

で、EdaxにBook学習を行わせると、MasterReversiのBook登録とは異なり、学習させた対局の各局面を評価関数で評価して実際の対局で行われた着手以外に、評価関数で最善となる手も登録される。

なので、例えば、対局した局面の中に、Drawになる着手が複数ある局面が存在した場合には、次の対局では、過去に行われたDrawの着手以外の着手が選択される可能性が出てくる。

このため、通常は、Bookに実際に行われた着手しか登録しないMasterReversiとしては、手を広げるという意味では、Edaxとのエンジン対局は意味があった訳だ。

更に、Edaxは、過去に負けた対局でも、Book学習時に、負けた着手以外に評価関数で発見された最善手も登録するので、Draw以上となる着手が発見されていた場合、次の対局でも、Bookは、前回負けたその局面への門戸を開けた状態になっていて、その局面に到達した場合には、評価関数によって発見されたその着手を行う事になる。

その結果としては、多くの場合、また、Edaxは負ける事になる。何故なら、評価関数の評価値には、オフセットが付く事が良くあるからだ。

つまり、本来なら、-2と評価されるべき局面に+2のオフセットが付加されると、その局面の評価値はDrawになるので、対局を行っていると、その局面に誘導される事もあるのだが、実際には、-2の局面なので、順当に対局が進めば、-2石負け、という事になる。

そして、Book値としては、その対局結果である所の-2が登録されるのだが、Edaxの場合、それと同時に評価値の最善値も登録されるので、元々、Drawになると判定されていた着手が複数あった場合、実際の対局結果は-2でも、その局面のBook値はDrawと登録される事になる訳だ。

しかし、前述の様に、Drawとなるのは評価値に+2のオフセットが付いているから、でしかなかった場合、次回、その局面に到達しても、最初の着手と同様、というか、それ以上に悲惨な負け方をする事になるのが当たり前、という感じになる訳だ。

と、いう事で、評価値にオフセットが付いている場合、Edax的には、負けても負けても、再度、その局面に誘導しようとするし、その結果として、前回以上に悲惨な負け方をする事になるのだが、最初の負けの要因としては、オフセット以外に誤差というモノもありえる訳だ。

最初の負けの原因が評価値の誤差によるものであった場合、評価関数による次善手にも、当然、誤差が含まれている事を鑑みれば、二回目以降の対局では、その評価関数による次善手で勝てる事も無い話ではない。

なので、Edaxとの対局を続けていると、Drawだと思っていた局面が、実は、負けの局面だった、という事が判る場合もある。

このため、Edaxとのエンジン対局を継続していれば、その内、好さげな着手進行を網羅できる筈なので、かなり信頼性が高いBookの構築も可能かもしれないのだが、そういう事を言い出せば、リバーシの場合、完全解析だって、時間の問題でしかない訳だ。

と、いう事なので、作者的には、とりあえず今回は、何時終わるとも知れないEdaxとのエンジン対局には見切りを付けて纏め作業に入った訳なのだが、前述の様に、対局相手のEdaxのレベルは21だった訳だ。

つまり、Edaxの評価関数の設定は大して強くしていなかったので、新しい局面に到達した後、評価関数勝負で、少々の劣勢を跳ね除けて、MasterReversiが勝っていたケースも多々あった筈な訳だ。

このため、Bookには、本来なら負ける手筋で勝ったりDrawになったりしているモノも含まれている筈なので、今は、Edax+Unified Book 2010とのエンジン対局に切り替えている。

上記のBookはOkuhara氏の手によって巷にある強力なBookを合成したりして作成されているので、ほぼ間違いは無い筈だ。

なので、これとの対局で負けなければ、MasterReversiのBook的にも、まず、問題はない、という感じになる訳だ。

で、その現状としては、対局を始めて500回以内くらいには、MasterReversiが先手となった場合にのみ、数回の負けが発生したのだが、その後の1000対局くらいでは、勝ち負けは発生していない。

と、いう事なので、MasterReversiの新しいBook的には、あまり問題はない感じではあるのだが、Unified Book 2010も、Bookから外れる事は殆ど無い。

つまり、これだけ手を広げても、まだまだ、Unified Book 2010の手の上で踊っている感じしかしない訳なのだが、まあ、今回の更新で、MasterReversiのBook的にも、それなりに手は広がった筈ではある。

« それでも仕上げに入る | トップページ | 結局は評価データ »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66810456

この記事へのトラックバック一覧です: Bookにも仕上げが必要:

« それでも仕上げに入る | トップページ | 結局は評価データ »

2018年6月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google