MRSolverを弄ったり
今は、新しいリバーシプログラムの開発フェーズで、ここの所は新評価関数の精度を上げる為に学習データを再作成しているのだが、新規データを100万件オーバー追加してみても、FFO性能の向上は見られなかった。なので、MRSolverのコードを少し弄ったりしてみている。
« 2018年1月 | トップページ | 2018年3月 »
今は、新しいリバーシプログラムの開発フェーズで、ここの所は新評価関数の精度を上げる為に学習データを再作成しているのだが、新規データを100万件オーバー追加してみても、FFO性能の向上は見られなかった。なので、MRSolverのコードを少し弄ったりしてみている。
今は、新しいリバーシプログラムの開発フェーズで、ここの所は新評価関数の精度を上げる為に学習データを再作成しているのだが、目標は200万件なので、今週一杯はかかりそうだ。しかし、効果は気になるので、毎日、その時点のデータで学習効果を確認している。
今は、新しいリバーシプログラムの開発フェーズで、ここの所は新評価関数の精度を上げる為に学習データを再作成しているのだが、目標は200万件なので、今週一杯はかかりそうだ。なので、この時間を使って新プログラム用に開発したGUIでEdaxを操作可能にする。
今は、新しいリバーシプログラムの開発フェーズで、新評価関数は精度を上げたいと思っているので、学習データの再作成作業を行っている。現行版の学習データは約250万対局分あるのだが、新学習データはまだ130万程度だ。しかし、既にFFO性能は同等になった。
今は、新しいリバーシプログラムの開発フェーズで、新評価関数は精度を上げたいと思っているので、2台のPCを使ってMasterReversiのセルフ対局で学習データの再作成作業を行っている。今日の時点で、データは60万対局分程度は作成できたのだが、まだ増やす。
今は、新しいリバーシプログラムの開発フェーズで、新しい評価関数は、精度を上げたいと思っているので、昨日から2台のPCを使ってMasterReversiのセルフ対局で学習データの再作成を始めたのだが、今日の朝、Windows10 PCの方だけ、画面が真っ暗になっていた。
今は、新しいリバーシプログラムの開発フェーズで、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、結局、評価関数の精度を上げたければ、それなりの学習データを揃える必要がありそうだ。なので、4コアCPUのPC2台で作成中だ。
今は、新しいリバーシプログラムの開発フェーズで、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、結局、現行版と比べて劇的な精度の向上は無い感じだ。もっとも、レベル5にすれば、デフォルト設定のEdaxにも、結構、勝つ。
今は、新しいリバーシプログラムの開発フェーズで、ここの所、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、やれる事はやってみたかもしれない。その感想としては、現行版よりも劇的に良くするのは難しいかもしれない。
今は、新しいリバーシプログラムの開発フェーズで、ここの所、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、現行版と比べて劇的な変化が無いので、学習方法を色々と微変更しつつ、変化が無いか確認している。
今は、新しいリバーシプログラムの開発フェーズで、ここの所、新評価関数の有効性をMasterReversiの評価データ編集機能を使って確認していたのだが、その結果としては、現行版と入れ替えても良いかなあ、という感じはする。ただ、劇的に良くなった感じはしない。
今は、新しいリバーシプログラムの開発フェーズで、開発はそれなりに進んでいる。しかし、巷では、海賊版漫画サイトが話題になり、その合法性をNHKが保証したので、「漫画家や出版社は無料で読ませる努力が足りない」、と、上から目線で説教する輩まで現れた。
今は、新しいリバーシプログラムの開発フェーズで、とりあえず、新評価関数の精度をMasterReversiを使って検証しているのだが、10手目までBookを使わせると、WZebraには勝ち越し、EdaxGUIで動作する昔のEdax(Ver3.3.2)にも、勝ち越せる? といった感じにはなる。
今は、新しいリバーシプログラムの開発フェーズなのだが、とりあえず、外部関数を使ってMasterReversi上で同等の評価を行わせる評価データとして構築していた新しい評価関数については、内蔵関数を増やす事で、MasterReversiの標準機能だけで実現できる様にした。
今は、新しいリバーシプログラムの開発フェーズなのだが、今の所、新しい評価関数はMasterReversi上で同等の評価を行わせる評価データとして構築している。この評価関数を使うとWZebraに負け越していたのだが、学習方法を変えると何とかなりそうなので先に進む。
今は、新しいリバーシプログラムの開発フェーズなのだが、今の所、新しい評価関数はMasterReversi上で同等の評価を行わせる評価データとして構築している。しかし、この評価関数を使うとWZebraに負け越すので、何とかしようとしているのだが、時間がかかりそうだ。
今は、新しいリバーシプログラムの開発フェーズなのだが、今日、VectorのAG-Webカメラレコーダーにネガティブなコメントが付いた。そのコメントに対する返信みたいモノは書いておいたのだが、今時、こんな機能がついたライブラリは百害あって一利なしかもしれない。
今は、新しいリバーシプログラムの開発フェーズなのだが、今の所、新しい評価関数はMasterReversi上で同等の評価を行わせる評価データとして構築している。なので、エンジン対局でWZebraなんかと対局させる事も出来るのだが、今の所、Bookなしでは負け越す。
今は、新しいリバーシプログラムの開発フェーズなのだが、MasterReversiを使って色々と確認してみると、新しい評価関数は現行のMasterReversiのソレよりも良いモノと出来そうだ。ただし、性能面の検証が必要なので、まずは、MasterReversiを正式に変更して性能確認する。
今は、新しいリバーシプログラムの開発フェーズなのだが、MasterReversiには評価データの編集機能があって、新しい評価関数もDLLとして追加できる。なので、現時点では、新しい評価関数はMasterReversiに適用してテストしているのだが、レベル5に勝ってしまう。
今は、新しいリバーシプログラムの開発フェーズなのだが、これを開発しているのは、現行版MasterReversiの評価関数の弱点を克服できないかを模索する為でもある。弱点というのは、パターン評価の重み係数が変な場合、ヘンテコな評価値を出す事がある所だ。
今は、新しいリバーシプログラムの開発フェーズなのだが、テストコードを書いて動作させたり、MasterReversiの評価データ編集機能を使ってテストしたりしてみた結果、今日の時点で、新しいリバーシプログラムをどんな感じに作るか、というのは、大体決まったかもしれない。
今は、新しいリバーシプログラムの開発フェーズなのだが、MasterReversiの作者である所の作者が、何故、新しいプログラムを作ろうとしているのか、というと、MasterReversiには、それなりの存在意義があるのだが、採用しているパターン評価には、問題もあるからだ。
今は、新しいリバーシプログラムの開発フェーズで、今週から真面目な作業に入ろうとしているのだが、作者的には何がしたいのか、というと、精度が高い評価関数の開発だ。ただし、まずは、MasterReversiが採用したパターン評価を使わないで何処までやれるかを試したい。
今は、新しいリバーシプログラムの開発フェーズで、試しに色々と弱いAIを作ってみたのだが、その中には、一時期、囲碁用AIとして脚光を浴びていたモンテカルロ法を使ったものもある。このAIはランダムに打つAIよりは強いのだが、2手読みのMasterReversiにも勝てない。
今は、新しいリバーシプログラムの開発フェーズで、今日の時点で、弱いAIを幾つか作ったので、それらとの対局が可能にはなっている。で、何故、弱いAIを作ったのか、というと、後で作る強いAIがどの程度強いのかをデモンストレーションする時に使えるからなのだが。
今は、新しいリバーシプログラムの開発フェーズで、今日の時点で、いくつか実装してみた弱いAI同士を対局させたり出来る様になっている。ただ、あまりにも弱すぎて、巷のリバーシプログラムの最弱モードにも負けてしまう。なので、気分直しにYouTubeを見ていると・・・
今は、新しいリバーシプログラムの開発フェーズで、今日の時点で、とりあえず実装したAIと対局できる様にはなった。このプログラムはGUIを持っているのでMasterReversiのエンジン対局でMasterReversiのAIと対局させる事も出来るのだが、今の所、全く歯が立たない。