スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« Vectorからは撤収? | トップページ | 何とかなりそうなので »

現行版が優秀なのは判った

今は、新しいリバーシプログラムの開発フェーズなのだが、今の所、新しい評価関数はMasterReversi上で同等の評価を行わせる評価データとして構築している。しかし、この評価関数を使うとWZebraに負け越すので、何とかしようとしているのだが、時間がかかりそうだ。

新しい評価関数というのは、パターン評価を行う評価関数では、その評価値に直結する重み係数の幾つは正しく設定できない可能性がある、という問題を軽減するために、従来の評価項目を併用する評価関数だ。

で、この評価関数のメリットとしては、パターン評価の様な膨大な数の重み係数を求める必要がないので、幾つかの重み係数が正しく設定されなかった事から、評価局面の幾つかでは、とんでもない評価値が出力される、というリスクが無くなる、という事になる。

ただし、当然の事ながら、見た目上、異なる石の配置が行われた局面でも、石差だとか着手差だとかが同じ場合には、同じ局面評価値が出力される、という事になるので、パターン評価の場合ほど、その局面に直結した評価値は得られない、という事にもなる。

なので、とんでもない値が出力されるリスクは減る筈なのだが、パターン評価を行う事で、1997年に当時の世界チャンピオンを破ったLOGISTELLOの神通力の様なモノも、無くなるかもしれない訳だ。

で、実際に、とりあえず、32手目までは、従来の評価関数+辺と隅のパターン評価を行わせる格好にした新しい評価関数と、WZebraを、Book無しで対局させてみた所、WZebraに負け越す感じになった。

このため、今は、学習データを変更してみたり、従来関数の利用形態を変えてみたりしているのだが、WZebraの強さが際立つ感じになっている。

もっとも、現行版のMasterReversiに標準搭載されているパターン評価を行う評価データを使った場合には、Book付きではWZebraに圧勝するのだが、Book無しでも互角な感じの勝負にはなっている。

そして、新しい評価関数を使った場合、WZebraや現行版に全敗しているのか、というと、そんな事はなくて、ちゃんと偶には勝てている。

つまり、やはり、パターン評価を行う評価関数というのは、偶に変な評価値を出力するので、昔ながらの順当な手を打っていれば、勝てるケースもあるのだが、普通に出力された場合には、昔ながらの順当な手を打っていては、勝ち目は無い、という事なのかもしれない。

と、いう事なので、どうしようかなあ、という感じなのだが、とりあえず、今日まで色々と作業してきた所では、現行版のMasterReversiは、作者が意図した通りに使えている。

つまり、リバーシ用の実験システムとしても十分に使えているので、作者的にも、中々、頼もしい存在ではあるかもしれない。

« Vectorからは撤収? | トップページ | 何とかなりそうなので »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66391870

この記事へのトラックバック一覧です: 現行版が優秀なのは判った:

« Vectorからは撤収? | トップページ | 何とかなりそうなので »

2018年7月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google