スポンサード リンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« Android/iOS版を日本限定化 | トップページ | AVX2版はプレミアム扱い »

Ver1.5.0 AVX2バイナリを公開

レジストユーザ向けのプレミアムアイテムとして、Ver1.5.0をベースにAVX2/BMI2命令を使用して高速化した実行ファイルパックを公開しました。Haswell(第4世代インテルCoreプロセッサー)以降の環境で利用可能で、通常、完全読み等が1~2割程度高速化されます。

実行ファイル(MasterReversi.exe/MRSolver.exe/MRWorker.exe)はそれらを格納したzipファイルを独自形式で圧縮した圧縮ファイルとして提供されます。

このため、AVX2バイナリを利用する為には、まず、この圧縮ファイルを解凍する必要があります。

解凍ソフトは配布パッケージに含まれていますので、特別な解凍ツールを別途用意する必要はありませんが、解凍するにあたっては、MasterReversi Professional用のレジストキーの入力が要求されます。

このため、本実行ファイルパックはMasterReversi Professionalのレジストキーを有しているレジストユーザー向けのプレミアムアイテムとなります。

AVX2バイナリでは、Ver1.5.0のソースコードをベースにしつつ、処理性能に大きく影響する幾つかの処理ルーチンをAVX2/BMI2命令を使って高速化しています。

例えば、着手候補の検出処理では、64ビットx4のデータに対して独立したシフト量でのシフト演算が行えるAVX2命令、着手用のFlip処理では、64ビットのビットボードの状況からテーブル参照用インデックスを得るのにBMI2命令の一つであるPEXT命令を使っています。

また、コンパイラに対してもAVX2命令の使用を許可していますので、意図的に改変したコード以外の部分でも、随所でAVX2命令用の256ビットレジスタを使った最適化が行われています。

更に、Ver1.5.0ではスレッド数の増加に伴う処理性能の増加量が少ない場合がありましたので、AVX2版では並列演算の処理内容についても微調整しています。

その結果として、比較的単純な局面に対する探索処理では、スレッド数の増加に伴う処理性能の増加量が増大しています。ただし、難解な局面に対する探索処理では、稀に、通常版よりも処理性能が劣化する場合もあり得ます。

このため、AVX2版を利用しても高速化されない場合もあり得ますが、上記の様な改良の結果として、通常は、AVX2版を利用した場合、完全読み等の探索処理の処理速度が1~2割程度は高速化されます。

AVX2版の処理性能については、FFOテストにより、従来版等と比較しつつ、検証してありますので、興味がある方は、FFOテスト結果(Ver1.5.0 + AVX2版) のページを参照して下さい。

MasterReversi Professional Ver1.5.0 AVX2バイナリはMasterReversiのホームページ からダウンロードできます。

« Android/iOS版を日本限定化 | トップページ | AVX2版はプレミアム扱い »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/534482/66631538

この記事へのトラックバック一覧です: Ver1.5.0 AVX2バイナリを公開:

« Android/iOS版を日本限定化 | トップページ | AVX2版はプレミアム扱い »

2018年10月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google