スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 学習方法も変更しつつ | トップページ | レベル5ならEdaxにも勝つが »

やれる事はやったかも

今は、新しいリバーシプログラムの開発フェーズで、ここの所、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、やれる事はやってみたかもしれない。その感想としては、現行版よりも劇的に良くするのは難しいかもしれない。

と、いう事で、ここの所、学習のさせ方なんかも変更しつつ、色々な評価データを作ってみていたのだが、結局の所、重要になるのは学習データの量と質かなあ、という感じだ。

つまり、例えば、現行版の評価データでは、基本的には、各重み係数は4局面で一つのデータにしてあるのだが、これは、データサイズを小さくしたかった、という事もあるのだが、各局面毎にデータを作成するとすると、学習データが不足している感じがあったからだ。

しかしまあ、ここの所書いてきた様に、初版の頃と比べれば、学習データの量も倍増以上しているので、今回、局面毎に重み係数を割り当てる評価データも作ってみたのだが、この評価データを使って対局を行わせると、一手毎に局面評価値が大きく変化する感じになってしまった訳だ。

まあ、その辺は重み係数のスムーシング方法を変更すれば何とか出来る可能性はあるのだが、そんな事をしなければならないとしたら、データサイズを増やしてまで、一手毎に独立した重み係数を持たせる意味はあるのかなあ、という感じになってしまう訳だ。

と、いう事で、色々な評価データを作って試してみた所では、どれもパッとしない感じなので、新評価関数というのは、ずっと書いてきている様に、序盤では従来の評価関数を併用させる事でパターン評価を減らす、というだけのモノになるかもしれない。

« 学習方法も変更しつつ | トップページ | レベル5ならEdaxにも勝つが »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66417599

この記事へのトラックバック一覧です: やれる事はやったかも:

« 学習方法も変更しつつ | トップページ | レベル5ならEdaxにも勝つが »

2018年9月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google