スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« EdaxをGUIで操作可能に | トップページ | MRSolverを弄ったり »

FFO性能は代わり映えせず?

今は、新しいリバーシプログラムの開発フェーズで、ここの所は新評価関数の精度を上げる為に学習データを再作成しているのだが、目標は200万件なので、今週一杯はかかりそうだ。しかし、効果は気になるので、毎日、その時点のデータで学習効果を確認している。

現時点で、新しく作成した学習データは115万件程度になっているのだが、この学習データを作成するにあたっては、MasterReversiのレベル1相当のセルフ対局を行わせている。

ただし、終盤については22残から完全読みを行わせているので、終盤22手が完全読みされている、という点では、現行版用の学習データと変わらない感じになっている。

で、新しい学習データも単独で100万件を越えてきたので、試しに、この新しいデータだけを学習させて新しい評価データを作成してみたのだが、MasterReversiの「評価パラメータの学習」ダイアログにある「評価誤差の確認」機能で確認すると、中盤の誤差は現行版よりも大きくなってしまっていた。

その理由は、学習データの多くで最善手を打っていない為、最善手が打たれる事を想定している評価値と食い違いが生じているのか、重み係数が上手く学習されていないのか、のどちらかになる筈だ。

で、念の為に、この状況の評価データを使ってFFOテストをやってみたのだが、現行版と比べて、かなり悪い結果になった。

ただし、この新しい学習データに、約22万件の現行版Book作成用データを追加して学習させると、前述の誤差も少なくなるし、FFO性能も現行版と同等程度の結果が出た。

つまり、新しい学習データというのは、ランダム局面からスタートし、対局結果が荒れている事も多いので、多分、このデータだけだと、上手く重み係数が学習できないのかもしれない。

逆に、Book作成用のデータはDrawやその付近の結果となる対局が大半なので、このデータを学習データに加える事で、重み係数が上手くバランスされる様になるのかもしれない。

その結果として、現状、新しい学習データとBook作成用データの組み合わせの約140万件の学習データを使った場合のFFO性能は現行版並になっているのだが、試しに現行版の学習データに新しい学習データを加えた約350万件のデータでも学習させてみた。

しかし、FFO性能については、その場合にも、現行版と同等程度しか出なかった。

と、いう事で、もう少し様子は見てみるのだが、上記の結果を見ていると、FFOテストに必要になる学習データとしては、現行版の学習データでも十分で、これ以上増やしても、性能には影響しないのかもしれない。

なので、FFO性能を上げるためには、評価関数のコードを弄る必要もあるかもしれないのだが、今回の開発の目的である所の序盤から中盤にかけての評価精度については、学習データによって、結構、変わってきている。

このため、そういう観点から見た場合には、新しい学習データにも十分な意味があるので、新しい学習データの追加作業はもう数日続ける事にする。

« EdaxをGUIで操作可能に | トップページ | MRSolverを弄ったり »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66442896

この記事へのトラックバック一覧です: FFO性能は代わり映えせず?:

« EdaxをGUIで操作可能に | トップページ | MRSolverを弄ったり »

2018年7月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google