GTX460 1GB で CUDA SDK 3.2 を使って OpenCL 1.1

3夜連続で、なんだか長いタイトルになってしまいましたがw

タイトル通りの事を色々調べながらやってみました。

環境は13号機です。

今回やってみて判った事は、

1:当然ですが普通に動きました。

2:帯域が微妙。
 実測帯域が微妙な感じで
 ホスト→デバイス間が3.5GB/s、
 デバイス→ホスト間が2.5GB/sです。
 ミドルハイとは言え、PCI-Express 2.0 x16 の理論的な帯域は8GB/s
 なのですから少々微妙な気がします。と言うかPCIe 1.1世代の帯域ですね。
 とは言え、昨日や一昨日の計測値と比較すると圧倒的な差がある訳ですが・・・
 と言うか昨日の計測値も理論値の半分程度だったので、もしかしたら
 計測手法に問題が有るのかもしれません・・・
 プログラムを一から見直してみます。

余談ですが、昨日の記事を自分で読み返していて理論と論理を間違えて書いていた事に気付きましたw
具体的には「理論値」と書くべき所を「論理値」と書いてありました。
今まであまり気にもしていなかったのですが、過去にも同じ過ちをしていないかと調べてみましたら、過去記事にも同じように論理値と書いてありorz
もしかしたら過去の仕事でのドキュメントやメール等でも同じ過ちをしているかもしれず脂汗もんです・・・
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR