FC2ブログ

Windows10 で 8倍遅くなる 3DMark

と言っても DirectX 7 時代の 3DMark2000 の話ですが、下のスクショの通りです。22号機で試しました。

3dmark2000-22-7-10.jpg

3DMark99Max も1.5倍くらい遅いですが、他のバージョンは誤差程度の差しかありませんでした。
こちらの記事にも書きましたが、Windows10 の場合は DirectX 6 / DirectX 7 では 75 FPS でリミッターが効いてしまう様で 120Hz などの応答速度が高速なディスプレイでは、ディスプレイの性能が活かせない可能性がありそうです。
スポンサーサイト

昔の 3DMark をWin7で実行する。


経緯
 過去のアプリを中心に利用している筆者にとっては昔の3DMarkが滑らかで高スコアになるGPUとドライバは貴重です。会社が変わって寛大になったのかライセンスが公開された旧3DMark群は、そんな筆者にとっての宝物になります。今後組むPC達は、これら全てを完走させる事が完成までの目標の1つ(マイルストーン)になりそうです。

3DMarkPerformance2.png

見て判る通り nVidia の方が良い結果(2Dでも似た傾向)ですが、Vega2搭載の21号機が未完成=未計測ですし19号機は世代的にHD7970に入れ替えるべきで、20号機はFuryXにすべきですがNanoですからAMDには不利なグラフです。また、筆者の経験上はnVidia の方が壊れ易いですし演算性能やコストパフォーマンスはたぶんAMDの方が良いと思います。

当初は22号機だけWin10での結果を採用していましたが、記事タイトルが「Win7で実行する」なのでWin7で計測し直しました。Win10では 3DMark2000 と 99Max で 75 FPS の所にリミッターの様なものが有る様で 75 以上には FPS が上がらずスコアが低いです。

歴代 3DMark の入手

 インストーラを公式からダウンロードします。
 https://benchmarks.ul.com/legacy-benchmarks

3DMark99 MAX

 DirectX 6 用のベンチマークです。
 =>筆者は DirectX 6 の動作確認用に使っています。

1)7zipを使ってダウンロードした3DMark99Max.exeを解凍します。
 ダウンロードした3DMark99Max.exeは自己解凍形式の圧縮ファイルですが、自己解凍がWin7では実行出来ない為7zipで強制解凍します(32bit版のWin7なら自己解凍出来るかもしれません)

2)解凍したフォルダにあるSetup.exeを起動します。
 インストーラの指示に従ってデフォルトでインストールします。
 (ダウンロードページに制限解除ライセンスが公開されています)

3)互換性の設定でWindows98を選択します。
 これをしないと DirectX 6.1 をインストールしないと動かないといった趣旨のエラーになり起動できません。
 スタートメニューに3DMark99Maxフォルダが有り、その中に本体へのショートカットが有ります、ショートカットもしくは本体のプロパティを開いて互換性=>互換モード=>Windows98/WindowsMeを選択してOKボタン。

4)うまく動かない場合は KB2670838 をアンインストールします。
 筆者が2014年12月16日に書いた自分用メモにそう書いて有りましたが自分ではどうやってこれに辿りついたか憶えていません。

3DMark2000

 DirectX 7 用のベンチマークです。
 =>筆者は DirectX 7 の動作確認用に使っています。

1)インストールします。
 インストーラの指示に従ってデフォルトでインストールします。
 (ダウンロードページに制限解除ライセンスが公開されています)

2)インストール先フォルダにある本体をバイナリ編集します。
 グラボのメモリが4MB以上必要エラーの対策です。
 ※エラーにならない場合はあえて編集しなくても大丈夫だと思います。
 デフォルトでは下記にインストールされているはずです。
 C:\Program Files (x86)\MadOnion.com\3DMark2000\3DMark2000.exe
 バイナリエディタで下記のアドレスを編集します。
  0001 FB91 7F=>EB
  0001 FC07 7D=>EB
  0006 9962 7D=>EB
  0006 99AD 7D=>EB
  0007 3394 7D=>EB
 ネットから拾ってきた情報の二次公開なので自己責任で御願いします。
 上記の編集・保存後に起動すれば問題無く実行出来るはずです。

3DMark2001 SE

 DirectX 8 / Shader Model 1.x 用のベンチマークです。
 =>筆者は DirectX 8 の動作確認用に使っています。

 ※起動までに異様に時間が掛りますが辛抱強く待ちます。
  たぶん2~3分くらい待たされます。
  続いてメモリが128MB以上必要という警告が表示されますが
  OKを押すと普通に動きます。
 ※上記でOKを押してもRadeonの場合は起動しない事があります。
  その場合はいったんプロセスを終了して、下記で起動します。
   start /AFFINITY 1 3DMark2001SE.exe

3DMark03/05/06

 DirectX 9.0 用のベンチマークです。
 =>筆者は DirectX 9 の動作確認用に使っています。
  下記の違いが有ります。
  03 : シェーダモデル 1.x (部分的に 2.0)
  05 : シェーダモデル 2.0
  06 : シェーダモデル 3.0 (9.0c)

 ※ 3DMark03/05 では Systeminfo でエラーになりますが、
   3DMark06 をインストールすると解消します。

3DMark Vantage

 DirectX 10 / Shader Model 4.0 用のベンチマークです。
 =>筆者は DirectX 10 の動作確認用に使っています。

番外編
 
 CrystalMark 2004R7
  作者のひよひよさんが数年前に32コア対応のUpdateを
  最後に行ってくれました。3DMarkでは測ってくれないGDIを
  計測してくれますので旧アプリを愛する人には3DMarkと
  併せて使って頂きたい逸品です。

 HDBENCH Ver3.30
  描画以外は桁溢れしてまともに計測出来ませんが、
  描画スコアのみ参考に計測しています。
  エアロONでは Matrox G200 や ATi Rage128 などが
  競合になりますがエアロOFFで爆速化します。

 CINEBENCH R9/10/11/15
  注意:公式サイトでは旧バージョンを公開していません。
  OpenGLの簡易的な動作確認が出来ます。
  特にR11とR15は描画結果をリファレンス画像と比較して
  差異がどのくらい有るか測定してくれますので再現性の
  簡易確認が出来ます。

 
 
 

GDI 描画速度の謎

ゲームクリエータなら御存知の事なのかもしれませんが、GDIの描画速度は妙に速かったり遅かったりして筆者にとっては謎領域です。

クリエータ側のトレンドとしてはDirect3Dとか、或いはクロスプラットフォームな描画フレームワークを使うのでしょう、けど、これから作る物の話では無く、既にあるアプリを軽くて滑らかにしたいのがニーズって事で、、、そういう話、メディアとかステマの人はしませんよね。儲からない話ですから。
 
ベンチマークを実行してみた感じでは現時点での結論としてはHDBENCHのスコアはちょっと信用出来ないですがCrystalMarkと2DMarkはそれなりに信用出来そうで下記のグラフの状況が概ね信用出来そうです。数値は平均値を100とした相対値です。
※ 2DMarkはWin10では実行できませんでした。

GDI描画速度
GDIPerformance3.png

GeForceが世代毎に高速化してゆくのに対し、Radeonは何でしょねこれ、2Dは向上させる必要無しと判断しているかの様です(とは言えHD5870とHD6970の関係は順当ですが・・・)。

下のグラフはDirectDrawとDirect3Dを使った2D描画性能です。Radeonはソフトウエアエミュレーション、GeForceはハードウエアアクセラレーションですね。こちらも同様に22号機(Win10 Exterprise 2019 LTSC)では 2DMark11 の起動に失敗します(アプリケーションクラッシュ)、Windows7で試したところ高速動作しました。
D3DPerformance3.png

結論として2D描画は新しい世代のGeForceが良さそうです。

CrystalMark 2004R7 で複数回計測してみましたがエアロをONにしている時の方が GDI は若干早いです。
ですが、D2D と OGL は誤差程度の差しかないので再計測してない機体もあります。

22号機 ( RTX 2080ti x2 )
CDM22G.jpg
OpenGLのスコアが下記の17号機や13号機などより悪いですね、ちょっと残念。クリエータ向けドライバで後ほど試してみます。

17号機 ( GTX 780ti SLI )
CrystalMark2004R7-17G.jpg

13号機 ( GTX 580 SLI )
CrystalMark2004R7-13G.jpg

15号機#2 ( GTX 285 SLI )
CrystalMark2004R7-15G-2.jpg

15号機#1 ( 9800 GTX+ SLI )
CrystalMark2004R7-15G-1.jpg

20号機 ( R9-nano CFX )
CrystalMark2004R7-20G.jpg

19号機 ( Radeon HD6970 CFX )
CrystalMark2004R7-19G.jpg

12号機 ( Radeon HD5870 EF6 CFX )
CrystalMark2004R7-12G.jpg

10号機 ( Radeon HD4890 CFX )
CrystalMark2004R7-10G.jpg


同様にGDIでの描画速度を測るHDBENCHの場合は、逆にエアロをOFFにした時の方が早いです。
Ver3.30でエアロOFFですと物によっては Canopus SPECTRA 8400 に圧勝ですが、エアロをONにすると Matrox G200 や ATi Rage128 或いは nVidia RIVA TNT 辺りと競合します。
※ GTX580 と GTX285 の結果が不可解に悪いのでドライバを変えて再計測してみます。->変化無し。。。

22号機 ( RTX 2080ti x2 )
hdb.jpg

17号機 ( GTX 780ti SLI )
HDBENCH.jpg

13号機 ( GTX 580 SLI )
HDBENCH-13G.jpg

15号機#2 ( GTX 285 SLI )
HDBENCH-15G-2.jpg

15号機#1 ( 9800 GTX+ SLI )
HDBENCH-15G-1.jpg

20号機 ( R9-nano CFX )
HDBENCH-20G.jpg

19号機 ( Radeon HD6970 CFX )
HDBENCH-19G.jpg

12号機 ( Radeon HD5870 EF6 CFX )
HDBENCH-12G.jpg

10号機 ( Radeon HD4890 CFX )
HDBENCH-10G.jpg


こちらは某掲示板の2D描画スレで8年前に公開されていたGDIとD2Dの描画速度を計測するベンチですが、エアロをOFFにした時の方が僅かに早いです(何度実行しても同じ傾向、但しこの傾向は17号機だけでした・・・)、D2Dはエアロに関係無くGDIより一桁早いです(これも機体により様々でした)。

22号機 ( RTX 2080ti x2 )
アプリケーションクラッシュします(環境:Win10 Enterprise LTSC 2019)

17号機 ( GTX 780ti SLI )
2DMark2011-013-17G.jpg

13号機 ( GTX 580 SLI )
計測できず・・・
この機体はTESLA用マザーを流用したものですが、GPUの認識が一般的なマザーと異なり認識させるのに手間が掛りましたが計測できました。
2DMark2011-013-13G.jpg

15号機#2 ( GTX 285 SLI )
2DMark2011-013-15G-2.jpg

15号機#1 ( 9800 GTX+ SLI )
2DMark2011-013-15G-1.jpg

20号機 ( R9-nano CFX )
2DMark2011-013-20G.jpg

19号機 ( Radeon HD6970 CFX )
2DMark2011-013-19G.jpg

12号機 ( Radeon HD5870 EF6 CFX )
2DMark2011-013-12G.jpg

10号機 ( Radeon HD4890 CFX )
2DMark2011-013-10G.jpg


この差は何に由来し、GDI描画を軽くて滑らかにするにはどうしたら良いのでしょうかね?

当初計測した17号機を他の機体と比較してみましたが総体としては2D性能はnVidiaが優勢の印象です、但し Radeon R9-nano ( Fiji ) はそこそこ早いので Vega も早いかもです、Vegaの結果があれば連絡ください。とは言え R9-nano は計測値は早いものの描画自体はカクカク動くので見た目の印象としては nVidia 圧勝です。Kepler世代の中古品が2D性能を求める人には良いかもですと書いて締めくくろうと思いましたが、GPUだけで律速しているとも断定できていない為、未だ謎のままです。上記以外にも Radeon HD7970 / X1900 / 8800 Ultra / 7900 GTX などが手元にありますので追々計測して追記してゆく予定です。 9800 GTX+ と 8800 Ultra はメモリ帯域の差がどう影響するか見るのに良いかなと思っています。

 

CINEBENCH R20 のポータブル版が復活

少なくとも筆者が知る限りは

3/10 TECHP◎WERUP でポータブル版をDOWNLOAD出来た
3/11 TECHP◎WERUP からポータブル版が消えた(関連記事)
4/20 TECHP◎WERUP でポータブル版が復活、本家サイトからも直接DL可に

本日 TECHP◎WERUP と 本家サイトからDLしたファイルをバイナリ比較してみましたが完全一致しました。

以前(3/10頃)TECHP◎WERUPが公開していた物との差異は

 PDF形式の簡単な説明書 (最新版には付属していない)
 win_thumbnail.dll    (最新版に付属)
 msvcp140.dll      (最新版には付属していない)
 付属している結果一覧ファイルの中身が異なる

などが異なりますが、本体EXEや他のDLLは同一でした。

この差異が何を意味するのか。。。

CINEBENCH R20 を試す

CINEBENCH-R20-N16.jpg

結論:
 Win10と新CPUへの買い替えを促すための広告宣伝 兼 個人情報収集ソフトです。

特徴1:
 Win7以降の64bit版で動く様に作られていますが、Win7/Win8で動くポータブル版は公開停止(初公開から僅か数日で終了)、MSストアで公開中のWin10でしか動かないUWP版以外のダウンロード手段を禁止して個人情報とダウンロード履歴をMSが記録・収集しています。
 
特徴2:
 最新世代(2017以降)のCPUは、旧世代CPUの倍のスコアが出る仕組みです、新世代CPUの広告宣伝効果を狙っていると思われます。(実際、新世代CPUでは倍のスコアになると説明に書かれています)
 WS向けハイエンド品で比較した場合の傾向としては下のグラフの様に成り、2017年以降のCPUと、それ以前のCPUで大きな差が出る様になっています。

 R20TREND.png

 ※:筆者は21号機22号機で最新世代のデュアルソケット自作を開始していますが、未だパーツが揃っていませんしOSを何にしようか未だ決まっていないので計測してません。

-------以下、当初の記載-------

CINEBENCH R20 を筆者のPCで試してみたいと思います。

動作要件は
 Windows 7 SP1 64-bit or higher
 Intel or AMD 64-bit CPU
 with SSE3 & 4GB RAM

となっていますので Hammer 以外の64bit機ですね。。。と思ってダウンロードしようとするとMSのストアからしかダウンロードできず、しかも何故かMSストアでは本家サイトとは異なる動作要件になっておりOSが Windows10 10240.0 以降と書かれています。それに、デバイスがアカウントと紐づけられていないからダウンロード出来ませんとか、なんか色々と制限されてますねこれ。何がしたいんだろ。。。

ということで、計測できませんでしたし、嫌いになりました。

似たように嫌いになった人が居ないか検索してみたところ、TECHPWERUPポータブル版ひっそり公開公開取り消しされており、R15同様にDOWNLOADして、どのPCでも動作要件さえ満たせば自由に起動出来る様になっていましたしポータブル版は動作要件も本家サイトの記述通りです。が、たぶん、これが最後なんでしょうねと書いた2日後に公開終了でした。これ以降はMSストア以外からは入手できなくなり、誰がどのPCに入れたかを完全にMSが記録し(記録できないルートを、正当に聞こえる様なもっともらしい理由を提示して禁止し)、他社には情報公開せず、MSだけが個人情報を管理し、統計をとり、産業スパイに活用し、広告に使い、国や人で差別して個別に機能制限し、、、と。ホント嫌な時代になりましたね。

下は20号機(Piledriver 2.8GHz/TC-ALL 3.2GHz) の微妙な感じの結果です。20号機では2度計測しており、
 結果4: 16M/32C TC-ON => 3828
 結果9: 16M/16C TC-OFF => 2222
です。
CINEBENCH-R20-N20.jpg

 同じAMDで Piledriver と Threadripper が結果3と結果4に並んでいますが差がつきすぎと感じるのは筆者だけでしょうか?両者とも128bit-FMA演算機を2基(スレッドあたり1基)積んでおりピーク演算性能ならFLOPS値はクロック比で同じはずで、最適化の面でBulldozer系コア(XOP/FMA4など)は捨てられちゃってるという事ですかね。。。その意味ではY-Cruncherの方が平等に近いですがCINEBENCHはHyperThreadが効く為、並列演算機で律速しているのではなさそうで、複雑なロジックで演算しているのかもしれません。。。と書いていて自分で書いた記事を思い出しましたOrz、、こりゃ当然の結果ですね、=>Bullのコア=Zenのスレッドと考えればやはり変です。キャッシュの帯域幅に律速してるのか?それともDDR3->DDR4のメモリ帯域に律速?
CPUARCHPVSZ.png

IvyBridge-EPの12コア・ハイエンド品とRyzen7が同格(しかもRyzen7の方が少し早い)のも少し違和感です。後ほど17号機#2でも計測してみます=>計測結果6083(20C/40T TB-ALL 3.33GHz IvyBridge-EP)でThreadripper 1950X の計測結果 6670 には届きませんでしたが近いスコア、FMAの有無か、それともメモリ帯域やキャッシュ帯域なのか、何がこの差になっているのでしょうね。。。

以下、筆者所有の測定可能な機体で計測した結果です。

19号機(K10-D 2.8GHz)
 結果8: 12C/12T => 1882

15号機#2(K10-C 2.8GHz)
 結果12: 8C/8T => 1260

15号機#1(K8 2.8GHz)
 結果12: 4C/4T => 476

17号機#2(IvyBridge-EP 3GHz/TB-ALL 3.3GHz)
 結果4: 20C/40T TB-ON => 6083
 結果5: 20C/20T TB-OFF => 4331

17号機#1(SandyBridge-EP 3.1GHz@3GHz/TB-ALL 3.4GHz)
 結果4: 16C/32T TB-ON => 5025
 結果5: 16C/16T TB-OFF => 3496

13号機(Westmare-EP 3.07GHz/TB-ALL 3.33GHz)
 結果6: 12C/24T TB-ON => 3049
 結果9: 12C/12T TB-OFF => 2205
20号機でのTurbo-OFF/1M-1C設定の結果9と拮抗する結果9が出ましたが、Turbo-ONで1M-2C設定の20号機は伸びが13号機より良いです。コア数的には20号機の結果4と13号機の結果6が順当かと思います。

12号機(Herpertown 3GHz)
 結果10: 8C/8T => 1373

10号機(Dempsey 3GHz)
 結果12: 4C/4T => 275
 結果13: 4C/8T => フリーズ・・・

16号機(IsaiahII 2GHz)
 結果12: 4C/4T => 328
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて二十数台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です(以降、Bull/nano/Ryzenと数台仮組レベルで組んでいます)。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR