スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« レベル5ならEdaxにも勝つが | トップページ | メモリリーク問題があった »

学習データも自前で作成

今は、新しいリバーシプログラムの開発フェーズで、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、結局、評価関数の精度を上げたければ、それなりの学習データを揃える必要がありそうだ。なので、4コアCPUのPC2台で作成中だ。

MasterReversiは普通にインストールするとドキュメントフォルダーにMasterReversiProというフォルダーを作成し、その中にデータベースデータなんかを格納する。

なので、普通にインストールして普通に使っていると、PC1台につき、一つのMasterReversiしか動作させる事は出来ないのだが、MasterReversiには起動オプションがある。

で、その中には「/UseBootFolder」というモノがあるのだが、これを使うと、前述のドキュメントフォルダーの代わりに、MasterReversi.exeがあるフォルダーを各種データ用のフォルダーとさせる事が出来る。

つまり、この起動オプションを使えば、メモリ容量等が許す限りの複数のMasterReversiを独立・同時動作させる事が可能になる訳だ。

と、いう事で、今現在、手持ちの4コアCPUのPC2台で、MasterReversiのセルフ対局を行わせる事で、学習データを作成中なのだが、各PCでは、10個ずつ、MasterReversiが動作している。

10個動作させているのは、セルフ対局はレベル1同士で行わせているので、実質的に、シングルスレッド動作する期間が長いので、その程度動作させておかないと、CPU使用率が100%にはならないからだ。

で、上記では、セルフ対局を行わせている、と、書いているのだが、学習データというのは引き分けの対局ばかりでは使いものにならないので、より正確に書くと、セルフ対局の開始局面は、10~20手目までランダムに打たせた結果の局面にしている。

なので、普通にどちらかが大勝したり大負けしたりしているのだが、開始局面は「管理」メニューの「新規対局」-「ランダムスタート」を使って作成させているので、対局は、イキナリ、ランダムスタート局面から始まる。

で、その対局をデータベースに保存して、それを学習データにしているのだが、これも「管理」メニューの「評価データ」-「パラメータの学習」では、開始局面が指定されていても、そのデータを学習データとして使える様になっている訳だ。

つまり、序盤がランダムに打たれていても、それらの悪手が打たれた局面は学習データには含まれず、ランダムスタート後は、レベル1相当とはいえ、MasterReversi同士の対局になる訳なので、それなりの善手が打たれている。

そして、残り22箇所からは完全読みさせているので、品質的には、まあまあの学習データが作られている筈なのだが、問題は、1日にどの程度の量が作れるか、という事になる。

と、いう事で、作者的には、時間がかかりそうなので、自前で学習データを作る事はしてこなかったのだが、MasterReversiの初版をリリースした10年前と比べるとPC性能はそれなりに向上したので、今日、前述の様に、1台のPCで10個のMasterReversiを動作させる格好でデータを作成させる実験をしてみた所では、PCを2台動作させておけば、1日で30万対局分くらいのデータは作れそうな感触が得られた訳だ。

なので、今は、作成中なのだが、とりあえず、既に10万対局分くらいの新規データは作成されている。問題は、レベル1、つまり、8手読み程度のセルフ対局を学習データとして良いか、という事になるのだが、現行版の学習データは、IOSだとかGGSなんかの大昔のネットサイトでの対局データがベースになっている。

なので、実際の所、現行版の学習データはどれくらいマトモな手が打たれているかは判らないのだが、その古さ等を鑑みれば、多分、レベル1でも、それらの対局と比べれば、より良い着手進行になっている筈な訳だ。

と、いう事なので、今日から、自前の学習データを作り始めた訳なのだが、以前、10手目までBookを使用しつつ、Book値への誤差をランダムに目一杯入れる格好で、10手目までランダムな着手を行わせた30万対局程度のレベル1学習データを作っていた。

また、Book作成用の対局データについては、WZebra等とMasterReversiとの真剣な対局がベースになっていて、この対局が25万対局程度ある。

なので、上記の30+25=55万対局分の学習データについては、現行版でも使用したのだが、次の学習データにも、加えて良いかなあ、と、思っている。

と、いう事で、今日の時点で、上記の55万対局に、新たに作成された数万対局分の新規データをプラスして学習させたりしてみているのだが、今の所、使いものになりそうではあるものの、まだ、データが少ないので何とも言えない状況だ。

しかしまあ、上記の様に、1日で30万対局分も追加できるなら、必要なデータが揃うのは、文字通り、時間の問題の筈なので、あと数日、学習データを作成しつつ、それを使って学習を行い、どんな感じになるか試してみる事にする。

« レベル5ならEdaxにも勝つが | トップページ | メモリリーク問題があった »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66422669

この記事へのトラックバック一覧です: 学習データも自前で作成:

« レベル5ならEdaxにも勝つが | トップページ | メモリリーク問題があった »

2018年6月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google