スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« VS2017の不具合が悲しい | トップページ | Android/iOS版を日本限定化 »

性能の再測定とか

今日は、AVX2版MasterReversiの纏め作業をした後、公開予定の最終バイナリを使って、再度、FFO性能の測定をした。当然、その結果はMasterReversiのホームページにリンクを張っているFFO結果ページに追加するのだが、ブログには先に概要だけ掲載しておく。

最終バイナリを使ったAVX2版MRSolverのFFO40-59性能を現行のVer1.5.0のソレと比較すると以下の通りになる。

                                   8Thread         4Thread          2Thread       1Thread

MRSolver(Ver1.5.0)    221.7秒 (1.00)     257.0秒 (1.00)     436.7秒 (1.00)    791.1秒 (1.00)

MRSolver(AVX2版)    181.8秒 (0.82)     224.7秒 (0.87)     398.8秒 (0.91)    728.3秒 (0.92)

上記を見ると、AVX2版は、1Thread動作時には、現行版に対して1割弱の性能向上しかないのだが、8Thread動作時には2割近い性能向上がある事が判る。

ただし、MRSolverのAVX2版とEdaxのAVX2版を比較すると以下の通りとなる。

MRSolver(AVX2版)    181.8秒 (1.00)     224.7秒 (1.00)     398.8秒 (1.00)    728.3秒 (1.00)

Edax(AVX2版)           192.9秒 (1.06)     248.6秒 (1.10)    436.9秒 (1.10)     819.7秒 (1.13)

つまり、1Thread動作時には、13%程度高速に動作しているのだが、8Thread時には、その性能差は6%程度にまで低下する訳だ。

ただし、今度は、Edax同士の比較をしてみると、以下の通りとなる。

Edax(64Bit版)           229.5秒 (1.00)     295.4秒 (1.00)    514.3秒 (1.00)     953.3秒 (1.00)

Edax(AVX2版)           192.9秒 (0.84)     248.6秒 (0.84)    436.9秒 (0.85)     819.7秒 (0.86)

つまり、EdaxのAVX2版でも、スレッド数の増加に従って性能向上率の増加が見られる。

と、いう事で、上記のデータから何を読み取れるか、というのが理系的には重要になる訳なのだが、まず言える事は、今回のAVX2版の開発では、現行版で問題となっていた8スレッド動作時の性能向上率が芳しくない問題は軽減されている。

何故なら、現行版との比較では、スレッド数が増加するに従って性能向上率が高くなっているからなのだが、当然の事ながら、これは偶然の結果という訳ではなく、こういう結果が得られる様に、並列演算処理の微調整を行った結果になる訳だ。

もっとも、それでも、EdaxのAVX2版と比較すると、8スレッド動作時のアドバンテージはシングルスレッド動作時の半分程度にまで落ち込んでいるので、スレッド数の増加に伴う性能向上率はEdaxよりは劣る状況には変わりはない。

ただし、それでも、8スレッド動作時にも、MRSolverの方が高性能な訳なので、実際の所、風当りという点では、常に、MRSolverの方が強い風当たりを受けている訳だ。

つまり、メモリアクセス性能にボトルネックがある場合、より高性能な方がそのボトルネックの影響を強く受ける訳なので、上記の差というのは、その辺の影響もある訳だ。

と、いう事で、とりあえず、FFO40-59については、それらしい結果が出ているのだが、FFO60-79(8Threadのみ)については、ちょっとヘンテコな数字になる。以下がその結果だ。

MRSolver (Ver1.5.0)     118.2分 (1.00)

MRSolver(AVX2版)      106.6分 (0.90)

Edax(64Bit版)             129.1分 (1.09)

Edax(AVX2版)              93.2分 (0.79)

MRWorker(Ver1.5.0)      83.5分 (0.71)

MRWorker(AVX2版)      76.2分 (0.64)

で、上記を見ていると、MRSolverの現行版とAVX2版を比較すると、性能向上率は約1割程度しかないのだが、逆に、Edaxの通常版とAVX2版を比較すると、性能向上率はFFO49-59では15%程度だったのだが、こちらでは3割近くもある訳だ。

その結果として、FFO60-79については、MRSolverのAVX2版の性能はEdaxのAVX2版よりも劣る結果になっているのだが、双方共に、AVX2版のFFO60-79での性能向上率がFFO40-59のソレとかけ離れているのは興味深いかもしれない。

その理由は、より詳細な生データを見てみれば少しは判る筈なのだが、生データはホームページに掲載する時に見れる様にする予定なので、今日の所は、この程度にしておく事にする。

« VS2017の不具合が悲しい | トップページ | Android/iOS版を日本限定化 »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66626884

この記事へのトラックバック一覧です: 性能の再測定とか:

« VS2017の不具合が悲しい | トップページ | Android/iOS版を日本限定化 »

2018年7月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google