スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« メモリリーク問題があった | トップページ | FFO性能は同等になった »

学習データは順調に増加中

今は、新しいリバーシプログラムの開発フェーズで、新評価関数は精度を上げたいと思っているので、2台のPCを使ってMasterReversiのセルフ対局で学習データの再作成作業を行っている。今日の時点で、データは60万対局分程度は作成できたのだが、まだ増やす。

学習データはどのくらいあれば良いのか、という点に関しては、真面目に考えた事は無いのだが、MasterReversiには「評価パラメータの学習」機能があって、それを使って学習させると、学習中に更新情報が表示される。

で、この更新情報には、「変化xxx (平均xxx)」という情報が表示されるのだが、この変化の次に出てくる数字は、その回の学習で変化した重み係数の絶対値の最大値を示していて、平均というのは、その回の学習で変化した重み係数の絶対値の平均値を示している。

なので、新しい評価データを追加して、新たに学習を行わせても、最初の学習時に、既に、前述の変化や平均がほぼ0になっていれば、新しい評価データは意味なし、という事になるので、学習データの数的には、もう十分、という事になる訳だ。

つまり、そんな感じになれば、理想的には、全重み係数が正しい値に収束しているので、もう学習データを増やしても意味が無い、という事になる訳なのだが、実際の所としては、全重み係数が正しい値に収束していたとしても、新しい学習データがその重み係数に従って評価される着手候補の最善手を打っていなければ、重み係数はその新しい学習データによって乱される事になる。

と、いう事なので、実際の所としては、学習データを幾ら増やしても、前述の変化や平均が最初の学習時点で0付近になる事は、まず、無い筈なので、作者的にも、どの程度の学習データを用意すれば良いのかは判っていない。

しかし、現行版のMasterReversi Ver1.4.3に添付している標準添付版の評価データは約250万対局分の学習データを使って学習させている。そして、調べてみた所、初版リリース直後の2008年頃のバージョンでも、学習データは200万対局を越えていた訳だ。

なので、作者的には、とりあえず、今回も、200万件オーバーの学習データ数にする事にしているのだが、少なくとも初版の頃に学習データを200万件くらい用意した理由は、少し前に書いたFFOテストの処理性能にあった訳だ。

つまり、初版リリース前の開発時、MasterReversiのFFO性能はWZebraの終盤解析ツールである所のscrzebraよりも劣っていたのだが、その最大の理由は、処理ノード数が多かった事にあった訳だ。

このため、作者的には、評価データの精度を上げて最善手探索に必要になる処理ノード数を減らそうとした訳だ。

で、学習データを増やして行った結果として、何とか、1スレッド動作時にも、scrzebra並の処理性能が出る様になったので、学習データの追加作業をヤメた、という感じだった訳だ。

で、その後は、学習データを増やす事なく、評価精度が高い事で有名なEdaxと比べても、FFO性能は遜色ない感じに出来たので、作者的には、学習データはこの程度で十分かなあ、と、思っていた訳なのだが、MasterReversiの学習データというのは、終盤22手は完全読みで置換してある訳だ。

何故、置換したのか、というと、これも、前述のFFO性能が出なかった時に必要性を感じて行った訳なのだが、この置換を行う前と行った後では、結構な、処理性能の違いが出た様に記憶している。

つまり、MasterReversiの学習データというのは、終盤については完全読みしてある為に精度が高い学習が行えるのだが、逆に言うと、序盤から中盤にかけては、必ずしも最善手が打たれている訳でもないので、あまり質が良い学習データでも無かった訳だ。

と、いう事なので、今回、序盤から中盤にかけての評価精度を上げる為に、より質が良い学習データに切り替えようとしている訳なのだが、その数的には、前述のFFO性能の事を鑑みれば、200万対局程度で十分かなあ、と、今の所は思っている。

上記の通りなので、現時点でも、新しい学習データを使って作成した評価データを使ってFFOテストを行ってみているのだが、現時点では、総合性能としては、まだ、現行版よりも1割程度劣っている。

しかし、項目によっては、現行版の性能を上回る性能のモノも出てきているので、FFO性能についても、今後の展開が楽しみではある今日この頃だ。

« メモリリーク問題があった | トップページ | FFO性能は同等になった »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66431721

この記事へのトラックバック一覧です: 学習データは順調に増加中:

« メモリリーク問題があった | トップページ | FFO性能は同等になった »

2018年11月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google