スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 並列演算処理の微調整 | トップページ | 更に3%程度は高速化 »

残す所、問題は2つのみだが

今は、Edax4.4のAVX2版のFFO性能が高かったので、MasterReversiについても高速化しているのだが、大昔から性能検証用に使ってきたFFO40-59では、Edax4.4のAVX2版と比較しても同等以上に出来ている。ただ、FFO60-79については、大幅に負けている項目が2つある。

と、いう事で、改良作業は中々終わらない訳なのだが、数日前に書いた様に、Edax4.4のAVX2版は、作者のMacBook Pro 15インチ 2016モデル上での8スレッド動作時に、FFO60-79で約93分の記録を出している。

これに対して、現行のMRSolverの記録は約118分なのだが、手元にある改良版MRSolverでは、記録は約106分にはなっている。

更に言えば、FFO76とFFO77を除けば、Edax4.4のAVX2版と比較しても、そん色ない項目も多いし、結構な大差を付けて勝っている項目も幾つかある状況だ。

にも関わらず、Edax側の総合性能が93分で、MRSolver側のソレが106分になっているのは、Edax側のFFO76が26分、FFO77が10分44秒になっているのに対し、MRSolver側のFFO76が40分、FFO77が18分程度になっているからだ。

つまり、この二項目で、(40-26)+(18-10) = 22分になるので、前述の様に、その他項目では頑張っているモノもあるのだが、全体でも、106-93=13分のビハインドになっている訳だ。

と、いう事なので、今は、上記の二項目について何とかならないモノかと、調整可能なパラメータを色々と弄ったりして状況の変化を見たりしているのだが、あまり大幅な変動はなくなってきている状況なので、この二項目については、評価データとの相性が悪い、という事で、諦める事にするかもしれない。

ちなみに、FFO76が約40分、FFO77が約18分というのは、AVX2命令を使っていない現行版と大差ない結果になっている。

つまり、AVX2命令を使えば、それだけで、1割程度の性能向上は期待できる筈なので、上記の数字はオカシイ、と、思った人もいる筈なのだが、その理由は、昨日書いた並列演算処理の微調整にある訳だ。

実際、並列演算処理の微調整を行わない様に変更し直してAVX2版の性能を測定してみると、FFO76については約36分、FFO77についても約18分という感じで、双方ともに、現行版よりも1割程度は良い結果が出る様になるのだが、実際の所、それでは、Edax4.4のAVX2版の性能には全く届かない訳だ。

なので、今回は、並列演算処理にも手を入れてみている訳なのだが、昨日書いた様に、一見、無駄なCPUリソースの使い方をしている現行版の並列演算処理の方が、より良い結果を出したりする事もある訳なので、自由度が高いMasterReversiの並列演算的には、調整は難しかったりする訳だ。

ちなみに、FFO76/77のスコアは+32/+34なので、確定石チェックによる性能向上/劣化も激しかったりする。

具体的には、確定石チェックを外してみると、処理性能は1.5倍程度悪くなったりしているのだが、逆に、より確定石チェックが頻繁に行われる様にしてみても、処理性能は数割は低下したりする。

そして、前述の様に、両方のテストを実行すると、現状では1時間程度かかる訳なので、中々、パラメータ調整は捗らない訳だ。

で、MasterReversiとEdaxとの違いとしては、MasterReversiが言うところのキャッシュのWay数がEdaxは4あり、MasterReversiのソレは2しかない、という事もあるのだが、試しにMasterReversi側のWay数を4にしてみても、処理性能に大差はない状況だ。

更に言うと、MRSolverの最大キャッシュサイズは512MBなのだが、隠し仕様として1024MBも設定可能にしてあるので、その設定にしてみても、処理性能に大差はない。

と、いう事なので、キャッシュ系の違いは、あまり関係ない、とは思っているのだが、並列演算の方式の違いから、MasterReversiの探索では、Edaxの探索よりも、より離れた局面を同時探索する事もあるので、キャッシュのヒット率はEdaxほど高くならない可能性もある事はある。

しかしまあ、今回は、そういう所にまで手を入れている余裕はないので、今週一杯くらいまで色々とやってみて、結果が出ない場合には、FFO60-79の性能については諦めて、リリース準備に入る事にする。

« 並列演算処理の微調整 | トップページ | 更に3%程度は高速化 »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66605420

この記事へのトラックバック一覧です: 残す所、問題は2つのみだが:

« 並列演算処理の微調整 | トップページ | 更に3%程度は高速化 »

2018年7月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google