スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 中盤評価には二つのトリック | トップページ | 良い感じなのかも »

精度を落とすトリックはヤメ

今は、新しいリバーシプログラムの開発フェーズなのだが、当初予定していた1ヶ月の開発期間が過ぎたので、今回は、MasterReversi Ver1.5.0をリリースするだけに留める。主な変更内容は評価精度の向上で、昨日書いた速度向上用のトリックを入れるのはヤメる。

何故ヤメるのか、というと、Edaxとのエンジン対局を行わせてみると、偶に、可笑しな評価値が沸き出してくる感じになったからだ。

具体的には、MasterReversiは強気に+5のアドバンテージがある、と、評価値を表示しているにも関わらず、Edaxは逆に自分が+5のアドバンテージがある、と、表示するみたいなシチュエーションが、偶に、発生した訳だ。

で、昨日書いた速度向上用のトリックを入れる前には、そんなシチュエーションは見た事が無かった上に、上記の場合には、最終的には、Edaxの評価値通り、MasterReversiの6石負けなんかになってしまった。

と、いう事で、やはり、昨日書いたトリックというのは、着手候補の並び替えが大幅に間違ってしまった場合には、最善手を発見できなくなるので、ある意味、評価精度を落とす事になる。

なので、評価精度を上げる事を目的としている今回の開発で、このトリックを入れるのは本末転倒という感じになってしまうので、入れるのはヤメる事にした訳だ。

その結果としては、主に序盤から中盤にかけての評価には時間がかかる様になるのだが、Corei5-4278UのMac mini Late2014で、レベル5でのBook無し対局で全体の思考時間は5分程度だ。

なので、大昔、WZwbraに24手読みなんかを行わせていた頃に比べれば、遅くなっているとはいっても、論外のレベルではない筈だ。

ちなみに、学習データの追加とFFO性能の確認は継続して行っている。

で、学習データについては、現行版用の学習データに新規データを追加した件数が今日の時点では420万件程度になっている。

これだけの学習データがあると、中々頼もしくはあるのだが、これを学習させる為には6時間程度かかる様になっている。

なので、中々、新しいデータを使ってFFO確認は出来ないのだが、何度かやってみた所では、Edaxが15分かかっているテストで、学習データによっては、MRSolverはやはり15分かかったり、10分しかかからなかったりしている。

と、いう事なので、FFO60-79の処理速度を上げる為には、処理コードについても、若干の調整は行っているのだが、学習データがもう少し増えれば、最新Edax並にならないかなあ、と、思ったりしている今日この頃だ。

« 中盤評価には二つのトリック | トップページ | 良い感じなのかも »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66473265

この記事へのトラックバック一覧です: 精度を落とすトリックはヤメ:

« 中盤評価には二つのトリック | トップページ | 良い感じなのかも »

2018年10月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google