スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« そろそろ時間切れ | トップページ | 中盤評価には二つのトリック »

やっぱり数が力かも

今は、新しいリバーシプログラムの開発フェーズなのだが、当初の開発期間としていた1ヶ月が過ぎたので、そろそろ時間切れだ。なので、締めの作業に入ろうとしているのだが、今回の開発で、MasterReversiのFFO性能と中盤の評価精度は、それなりに、向上した。

今回の開発では、評価データの再作成作業も行っているのだが、新しく作成したデータは150万対局分くらいある。しかし、これだけを使って評価データを学習させると、現行版よりも、少なくともFFO性能は劣る感じになる。

しかし、現行版の評価データを作成する時に使った学習データに新しく作成したデータを追加して新しい評価データを作成すると、現行版よりもFFO性能は向上するし、他ソフトとの対局なんかを行ってみると、中盤の評価精度も向上している感じだ。

もっとも、中盤の評価精度については、例えば、現行版ではBook無しで対局を行っていると、対局中に2回くらいBookの最善手とは異なる着手をしてしまう所が、新しい評価データだと、これが1回くらいに減る、という感じだ。

つまり、中盤の評価精度というのは、平均的に良いか悪いか、みたいな尺度では測れない感じで、その局面の評価値を正しく出力できる確率は? みたいな尺度になる感じだ。

なので、現行版でも、評価値を正しく出力できる局面が続けば、Book通りの最善手を打つし、相手がミスすれば、その分の評価値上昇が見られる。

現行版の評価値の問題というのは、評価値を正しく出力できない局面がそれなりに多い、という事で、Edaxなんかと対局させてみると、Edaxの評価値が+05なんて事になっていても、MasterReversiの評価値は0、なんて事もある訳だ。

もっとも、Edaxについても、対局中に評価値が+05になっても、その後、徐々に評価値が減り、最後は-02で2石負け、なんて事にも、それなりになっている。

なので、必ずしも、Edaxの評価値も信頼は出来ないのだが、上記の様な、ある意味、誤検出みたいな評価値の発生頻度はどちらが多いか、というと、現状では、MasterReversiの方が多い感じだった訳だ。

このため、今回は、序盤から中盤にかけては、学習データが不足していると評価値が正しく出力されない可能性が高いパターン評価ではなく、従来型の評価関数も併用させる格好の評価ルーチンにしたりしてみたのだが、この方式には短所もあるかもしれない。

具体的には、パターン評価の場合、局所パターンの組み合わせが豊富にあるのに対して、従来の関数型の場合、採れる値が限られる事になるので、評価値は安定する感じなのだが、様々な局面で個別な感じの評価値が出力される事もない訳だ。

つまり、パターン評価の場合、例えば、Book用の対局データを学習させると、多くの局面でBook値と同じ評価値を出力できる可能性が高くなるのだが、従来型の関数の場合、採れる値が限られるので、それに近い値は出力できても、様々な局面でBook値と同一の値を出力できる可能性は無くなる訳だ。

もっとも、今回作成した評価データでは、従来の関数型を使う場合にも、隅と辺についてはパターン評価を併用しているので、序盤から中盤にかけても、Book値とほぼ同様の評価値を出力できている事が多い。

しかし、どちらがより多くそんな感じに出来ているか、というと、やはり、パターン評価のみの方になる訳だ。

と、いう事で、パターン評価というのは、何度か書いてきた様に、学習データが少ないととんでもない評価値を出力する可能性が高いので、ある意味、危険な評価方式になるかもしれないのだが、学習データが存在している局面については、その学習データとほぼ同一の評価値を出力できる可能性が高いという点では便利な評価方式になるかもしれない。

で、前述の様に、今回は、新しい学習データを追加する事で、FFO性能や評価精度を上げられている感じだ。

そして、FFO60-79の結果についても、学習データを増やした評価データの方が良い結果を出しているので、今回、どうせなら、学習データの数は現行版の2倍程度、つまり、500万対局分くらいにしてみようか、と、思っている。

なので、新しい学習データの作成作業はもう少し続ける事にする。

« そろそろ時間切れ | トップページ | 中盤評価には二つのトリック »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66466460

この記事へのトラックバック一覧です: やっぱり数が力かも:

« そろそろ時間切れ | トップページ | 中盤評価には二つのトリック »

2018年10月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google