WZebraに負け越すが
今は、新しいリバーシプログラムの開発フェーズなのだが、今の所、新しい評価関数はMasterReversi上で同等の評価を行わせる評価データとして構築している。なので、エンジン対局でWZebraなんかと対局させる事も出来るのだが、今の所、Bookなしでは負け越す。
MasterReversiには、WZebraとの対局結果等を収めたBookが標準添付されていて、デフォルト状態では、そのBookは有効化されているので、WZebraと普通に対局させれば、まず、負ける事はなく、勝つ事は頻繁にある。
なので、MasterReversiはWZebaよりも強い事になるのだが、現行版で双方共Bookを使わせない様にして対局させてみると、勝ったり負けたりになる筈だ。
これに対して、新しい評価関数を使った場合、今日の時点では、偶に勝つことはあるものの、その何倍も負けている。
このため、上記の結果だけを見ると、新しい評価関数を使ってしまうと、現行版よりも弱くなってしまう感じなのだが、実際問題としては、Bookに登録された着手進行については、評価関数は必要ない訳だ。
なので、今時の評価関数的には、Book登録が潤沢にある事を鑑みれば、Bookに登録されていない着手進行、つまり、主に、最善ライン以外の手に変化された場合に、本来なら有利な筈の展開をキープできるかどうかが重要になる訳だ。
と、いう事なので、作者的には、新しい評価関数では、主に、双方がBookを使用した状態で、WZebraの手を変化させた場合に、勝率がどうなるか、という事に、注目したいと思っている。
しかし、実際問題としては、双方にBookを使用させない状況で負けてしまうと、巷の人達的には、MasterReversiの評価関数よりもWZebraの評価関数の方が優秀、という判断をする事になる可能性も高い訳だ。
と、いう事なので、作者的には、とりあえず、WZebraにも負けない様にしておくかなあ、と、思っている訳なのだが、WZebraに負け越す一番大きな理由は、WZebraとの対局では、MasterReversiの学習データに存在しない局面に誘導される事が多いからだ。
なので、WZebarに勝たせようとするなら、逆に、MasterReversiが得意な局面に誘導すれば良い訳なので、そういう評価結果が得られる様な学習データを用意して再学習させれば良い訳だ。
と、いう事で、次バージョンのMasterReversiでは、Bookを修正すると共に、学習データも少し変更する事になりそうだ。
なので、イヨイヨ、リリースまでには時間がかかりそうなのだが、その時間の殆どはコンピュータが使うだけの事なので、作者的には、リリース前に別の事をやりだす可能性も無きにしも非ずになってきたかもしれない。
« まず、MasterReversiを変更 | トップページ | Vectorからは撤収? »
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66384726
この記事へのトラックバック一覧です: WZebraに負け越すが: