スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 学習データは順調に増加中 | トップページ | EdaxをGUIで操作可能に »

FFO性能は同等になった

今は、新しいリバーシプログラムの開発フェーズで、新評価関数は精度を上げたいと思っているので、学習データの再作成作業を行っている。現行版の学習データは約250万対局分あるのだが、新学習データはまだ130万程度だ。しかし、既にFFO性能は同等になった。

今日の時点で確認しているFFOテストはFFO40~59なので、完全読みの手数は20~30手という事になる。

で、既に書いてきている様に、現行版の学習データは終盤の22手は完全読みで置換してあるのだが、新学習データ用に行わせているセルフ対局についても、序盤から中盤にかけてはレベル1相当、つまり、8手読みなのだが、終盤については、22残から完全読みを行わせる様にしている。

と、いう事なので、新旧の何れについても、22手よりも読む手が少ない場合には、似たような学習データに基づいて学習されている感じになる。

しかし、30~22手については、現行版の学習データでは、それなりの善手が打たれているかどうかは微妙なのに対し、新学習データでは、とりあえず、MasterReversiのレベル1相当の手は打たれている訳だ。

なので、読みが深くなればなるほど、新学習データで学習させた評価関数の精度は現行版よりも良くなっている可能性が高い訳なので、それを使って最善手探索を行うFFOテストについては、新学習データを使って学習した評価関数の方が、処理を高速に行えても不思議はないかもしれない。

そして、今日の時点では、学習データ数はまだ少ないにも関わらず、新学習データで学習した新評価関数は、似たようなFFO性能を出せる様になっている。

似たような、というのは、全テストの合計時間は1秒程度高速になっていて、個別項目について見ていくと、1割程度高速なものもあれば、1割程度低速なものもある状況だ。

このため、もし、今日の時点で1割程度低速なテストが現行版と同等程度になれば、当然の事ながら、合計時間は現行版よりも短くなる筈なので、作者的には楽しみではある。

ちなみに、学習データは新評価関数と現行版と同等の評価関数の双方で使ってみている。

なので、もう少し学習データが増えた時点で、どちらの評価関数の方が望ましいか、というのを検証してみる事になる筈だ。

もっとも、新評価関数用の処理コードは、既にMasterReversiに組み込んであるので、標準添付版は現行版と同等の評価関数にする事にしたとしても、次バージョンでは、新評価関数も、ユーザーが学習させれば、使える様にする事になる筈だ。

« 学習データは順調に増加中 | トップページ | EdaxをGUIで操作可能に »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66435227

この記事へのトラックバック一覧です: FFO性能は同等になった:

« 学習データは順調に増加中 | トップページ | EdaxをGUIで操作可能に »

2018年9月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google