GPUで汎用コンピューティングを行うスレ
- 1 :デフォルトの名無しさん:2007/01/05(金) 18:33:47
- CUPじゃなくてGPUに計算させて255倍高速なプログラムを作成しよう
CUDA
http://developer.nvidia.com/object/cuda.html
GPGPU
http://www.gpgpu.org/
- 2 :デフォルトの名無しさん:2007/01/05(金) 18:36:06
- ∧_∧
( ´∀`)< ぬるぽ
- 3 :デフォルトの名無しさん:2007/01/05(金) 18:52:08
- CUP?
- 4 :デフォルトの名無しさん:2007/01/05(金) 18:57:58
- A cup of tea.
- 5 :デフォルトの名無しさん:2007/01/05(金) 19:46:34
- GPU以前にスレタイ検索する能力を身につけよう
http://pc10.2ch.net/test/read.cgi/tech/1128780920/
- 6 :デフォルトの名無しさん:2007/01/06(土) 00:28:02
- ケンブリッジ・ユニブ・プレスかよ
- 7 :デフォルトの名無しさん:2007/01/06(土) 00:28:59
- FPGA最強
- 8 :デフォルトの名無しさん:2007/01/06(土) 18:17:58
- >>5
そのスレはGPGPUしか扱っていないので、新たに建て増した。
- 9 :デフォルトの名無しさん:2007/01/14(日) 16:02:42
- CTMはどうした
- 10 :デフォルトの名無しさん:2007/01/14(日) 16:49:57
- GDPは?
- 11 :デフォルトの名無しさん:2007/01/14(日) 22:22:49
- 俺だったらCPUでがんばる
- 12 :デフォルトの名無しさん:2007/01/15(月) 05:02:13
- GPU = General Public Unko
- 13 :デフォルトの名無しさん:2007/01/21(日) 06:54:11
- CPU = Common Public Unlikely
- 14 :デフォルトの名無しさん:2007/01/30(火) 21:57:36
- ttp://www.cs.unc.edu/~naga/sc06.pdf
この論文にSGEMMが0.145sで実行できるとあるんだが7800GTXってそんなはえーの?
- 15 :デフォルトの名無しさん:2007/01/30(火) 22:10:13
- そうかも知れず。
どうやら客先担当者がCUDAやるために買うらしいから検証する羽目になりそうw
- 16 :デフォルトの名無しさん:2007/02/20(火) 03:22:54
- http://pc.watch.impress.co.jp/docs/2007/0219/nvidia.htm
- 17 :デフォルトの名無しさん:2007/02/20(火) 06:47:04
- お、Linux用のCUDAか。仕事仕事♪
>>16
情報THX。
- 18 :デフォルトの名無しさん:2007/02/28(水) 09:21:38
- macでは使えないのでしょうか?
- 19 :デフォルトの名無しさん:2007/03/11(日) 12:57:43
- >>18
今は使えない。けど、将来的には使えるようになると思うよ。
- 20 :デフォルトの名無しさん:2007/03/11(日) 13:51:51
- 専用プロセッサでわざわざ汎用的な処理を行わせようという
発想がよくわからんです
- 21 :デフォルトの名無しさん:2007/03/12(月) 13:06:30
- 汎用的な処理といってもターゲットは絞られてるけどね。
CGレンダリングとか動画のエンコードとか。
- 22 :デフォルトの名無しさん:2007/03/12(月) 17:32:14
- 動画のエンコードも、前後関係が出るループ部分が殆どなので、並列化出来ないから逆効果
ATIのAVIVO Converterみたいに、トランスフォーム処理とかじゃないと速度が出ない。
- 23 :デフォルトの名無しさん:2007/03/12(月) 20:49:14
- トランスコードね。
動画を別のフォーマットでエンコードしなおす処理。
- 24 :デフォルトの名無しさん:2007/03/14(水) 10:50:13
- 立ってるものは親でも使え、ですな
- 25 :デフォルトの名無しさん:2007/03/14(水) 11:03:34
- GPUのストリームプロセッサ1個あたりの性能は、汎用処理だとPenIII800Mhz程度らしいね。
並列化出来なければReadBackのオーバーヘッドも加わって完全に逆効果だな。
>>22
圧縮ではなく、単なる変換作業だったらCPUでビット演算を使った変形の方が高速な事が多いんじゃない?
基本的にGPUに送る前にバイト形式のデータをストリーム形式に変換しないといけないから
処理にかける配列->ストリーム形式にコピー->VRAMへ転送->シェーダーで並列演算->システムへReadBack
の手順だったら、
配列->ビット演算で変形しつつ新たな領域にコピー
の方が速い気が…。
エンコードに関しては間違いなくCPUの方が速いだろうけど。
- 26 :デフォルトの名無しさん:2007/03/16(金) 22:10:04
- そのうちマルチコアCPUが基本になるだろうからあまり流行らずに廃れそうだね
- 27 :デフォルトの名無しさん:2007/03/17(土) 11:46:50
- >>25
88GTXの場合それが128個搭載されてるわけだから、処理によっては結構高速化できそうだね。
- 28 :デフォルトの名無しさん:2007/03/17(土) 12:06:21
- >>27
その「処理によっては」がネックなんだよね。
- 29 :デフォルトの名無しさん:2007/03/20(火) 00:50:35
- GPUは環境依存が激しいらしいな
- 30 :デフォルトの名無しさん:2007/04/15(日) 15:06:57
- GPUで計算した場合、精度はfloatですか?
- 31 :デフォルトの名無しさん:2007/04/15(日) 15:13:15
- GPGPUが可能な一番安いグラフィックカードを教えてください。
- 32 :デフォルトの名無しさん:2007/04/15(日) 16:40:59
- nVidia以外で、どこかでベンチマークは公開されていないのだろうか?
- 33 :デフォルトの名無しさん:2007/04/15(日) 17:13:31
- >>30
float
ただし、ATIの一部の製品は24bit精度
>>31
どのライブラリを使うかによる。
基本的にプログラマブルシェーダーを搭載していれば可能なので
GeForce3以降
CUDAはGeForce8シリーズから
- 34 :デフォルトの名無しさん:2007/04/15(日) 17:26:53
- このスレは重複なので流行らないと思われ。誘導。
GPGPU
http://pc11.2ch.net/test/read.cgi/tech/1128780920/l50
>>33
> ただし、ATIの一部の製品は24bit精度
そもそも単精度実数の仮数部が24(+1)ビット。
NV G80でも乗算器は整数でも24ビットだったり。
ATIが24ビット云々は、NV30系が16ビット演算だったことに
対するアドバンテージとして出てきたフレーズじゃなかった?
- 35 :デフォルトの名無しさん:2007/04/16(月) 15:14:00
- SIMDに準じた書き方をしないと全然早くならないね
- 36 :デフォルトの名無しさん:2007/04/16(月) 22:24:00
- >>34
ATIの一部の製品が24ビットってのは仮数部が24ビットという話じゃないよ。
R300世代のピクセルシェーダ演算精度は仮数+指数+符号で24ビットだった。
http://pc.watch.impress.co.jp/docs/2003/0425/kaigai01.htm
> ATIが24ビット云々は、NV30系が16ビット演算だったことに
> 対するアドバンテージとして出てきたフレーズじゃなかった?
むしろNV30の低速な32ビット演算に対する速度的アドバンテージという意味合いが強かったと思う。
- 37 :デフォルトの名無しさん:2007/04/17(火) 01:05:28
- ATIのチップではまだできないよね。
フュージョンとの関係が気になる。
- 38 :デフォルトの名無しさん:2007/04/17(火) 22:41:36
- 来月みたいね
- 39 :デフォルトの名無しさん:2007/04/18(水) 18:34:46
- GeForce 8500 GTでも汎用計算は可能ですか?
- 40 :デフォルトの名無しさん:2007/04/19(木) 09:50:31
- 可能だけど劇おそ
- 41 :デフォルトの名無しさん:2007/04/23(月) 23:59:15
- CPUよりはマシだと思うけどね。
処理内容によるけど
- 42 :デフォルトの名無しさん:2007/04/24(火) 13:06:59
- CUDAでdoubleの処理が2007年中に可能になるって言うけど、これって新しいハードが出ればって事?
それとも、ライブラリの改善だけで今あるグラフィックカードでも可能になるの?
- 43 :デフォルトの名無しさん:2007/05/04(金) 16:01:09
- 無いものは無いんだから無理。
全てがプログラマブルなわけじゃねぇんだぞ。
- 44 :デフォルトの名無しさん:2007/05/23(水) 11:53:07
- Radeonの場合は、どのライブラリを使えばいいの?
- 45 :デフォルトの名無しさん:2007/05/26(土) 00:47:49
- BrookGPU
SH
Cg
さぁ好きなのを選べ
- 46 :デフォルトの名無しさん:2007/05/26(土) 11:20:51
- *.fx
- 47 :メモ:GeForce 8800 GTX 60.80.08.00.46 768MB:2007/06/01(金) 16:20:39
- [user@Serpens release]$ ./simpleTexture -noprompt
Loaded 'lena_bw.pgm', 512 x 512 pixels
Processing time: 0.229000 (ms)
1144.73 Mpixels/sec
Wrote './../../../projects/simpleTexture/data/lena_bw_out.pgm'
[user@Serpens release]$ ./scan -noprompt | grep time
Average time: 0.288580 ms
Average time: 0.284650 ms
Average time: 0.154460 ms
[user@Serpens release]$ more /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 3
model name : Intel(R) Xeon(TM) CPU 3.40GHz
stepping : 4
cpu MHz : 3401.455
cache size : 1024 KB
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat
pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe lm constant_tsc pni monito
r ds_cpl est tm2 cid xtpr
bogomips : 6804.08
- 48 :デフォルトの名無しさん:2007/06/03(日) 13:05:01
- FORTRANでGPUを使うことはできませんか?
- 49 :デフォルトの名無しさん:2007/06/03(日) 13:13:13
- >>48
気合い入れればできるよ
- 50 :デフォルトの名無しさん:2007/06/04(月) 10:17:44
- アッー!
- 51 :デフォルトの名無しさん:2007/06/05(火) 16:01:39
- 8800みたいな、元から汎用計算を視野に入れて開発されたGPUだと
プログラミングの面白みが無いな
- 52 :デフォルトの名無しさん:2007/06/05(火) 23:16:46
- 視野に入れてる割には・・・
・・・いや、なんでもないとです。
- 53 :デフォルトの名無しさん:2007/06/07(木) 10:40:53
- STLを使ったプログラムの並列化を考えているのですが、
cudaを使う場合、STLはあきらめるしかないのでしょうか?
vectorを使っているのですが、これをそのままGPUに送ることはできないものでしょうか?
- 54 :デフォルトの名無しさん:2007/06/08(金) 11:58:52
- >>53
vectorは事実上配列なので、イテレータをポインタに変換してやれば渡せると思う。
巧くいったら公開してね♥
- 55 :デフォルトの名無しさん:2007/06/08(金) 16:18:27
- http://progrape.jp/cs/
のサンプルを動かしてみた。
[user@Serpens work]$ time ./a.out > /dev/null
open GPU by CUNBODY-1 library: rev.hamada20070511 \(^o^)/
real 0m0.764s
user 0m0.454s
sys 0m0.265s
- 56 :デフォルトの名無しさん:2007/06/09(土) 22:25:34
- GeForce9世代にならないと、使い物にならないかもなー。
…GeForce7の頃は「GF8にならないとなー」とか言ってた気もするが。
- 57 :デフォルトの名無しさん:2007/06/22(金) 10:45:49
- GPGPUプログラミングを勉強したいのでグラフィックカードを
買いたいのですが、ググっていて
Accelewareっていう会社のGPUボードを見つけました。
これは、ATIとかNvidiaのグラフィックカードよりも、
もっと速いんでしょうか?
- 58 :デフォルトの名無しさん:2007/06/22(金) 11:36:38
- なんで、こんなところで聞く前に検索しないの?
5分もあればNVIDIAのマークが入った写真が見つかると思うが。
- 59 :デフォルトの名無しさん:2007/06/22(金) 11:42:41
- >58
検索してAccelewareを見つけたんですけれど、わからないのは、
AccelewareはNVIDIAのGPUを使って、本家NVIDIAのGPUカードより、
もっと高速になっているのかどうかという点です。
よろしく。
- 60 :デフォルトの名無しさん:2007/06/22(金) 13:00:12
- 判らないのは、何を根拠に「もっと高速」と思ったかという点です。
- 61 :デフォルトの名無しさん:2007/06/22(金) 13:03:42
- nvidiaはカードは出していない
- 62 :デフォルトの名無しさん:2007/06/22(金) 13:27:05
- ttp://www.nvidia.com/object/tesla_computing_solutions.html
これは日本で売っているのかな?
- 63 :デフォルトの名無しさん:2007/06/22(金) 15:38:18
- お前らも答えてやれよ…
つーか、Accelewareなんて聴いたこと無いんだが
GPGPUやりたいなら、メインでやってるnvidia使ったほうがいいんじゃない?
俺ATIでやってるけど、ATIでさえ仕様が違ってやりたいこと出来なかったりしたし。
8800シリーズにXP入れてやっておけば?よくわかんないけど
- 64 :デフォルトの名無しさん:2007/06/22(金) 15:46:47
- んで、8800GTXを載せたボードはELSAや玄人志向が出しているからその辺で買えばいい。
問題は、400Wオーバーの電源とPCIExpressX16のスロットと二枚分の空間だな。
- 65 :デフォルトの名無しさん:2007/06/22(金) 16:02:19
- >>59
よくわからんけど、Accelewareってのは電磁気系シミュレーションに特化したソリューション屋ってところか。
GPUはNVIDIAの8800系まんまっぽいけど、この会社はハードじゃなくて独自ソフトを中心に売ってる感じだな。
うちのシミュレーションソフトを使いたければハードもセットで買ってねって感じ。
自分でGPGPUのプログラミングをやりたいなら、こんなパッケージに手を出しても意味ない。
- 66 :デフォルトの名無しさん:2007/07/04(水) 05:12:40
- LINPACKの標準ベンチマークを取ってみたいのだけど、どこかにソースコードはない?
- 67 :デフォルトの名無しさん:2007/07/04(水) 20:51:08
- うん、しらない
- 68 :デフォルトの名無しさん:2007/07/04(水) 22:12:49
- >>66
もう少し詳しく。
標準ベンチがとりたいなら本家探せ。
- 69 :66:2007/07/05(木) 06:13:43
- 普通のgcc用などならアルのですが、GPGPUの性能を測りたいので、
それに特化したコードはないのでしょうか?
- 70 :デフォルトの名無しさん:2007/07/06(金) 02:08:19
- BLASライブラリを入れ替えてHPLでもやればいいんじゃない?
- 71 :デフォルトの名無しさん:2007/07/22(日) 15:43:28
- 【派遣ネガティブ根性チェック】
3つ以上、チェックがつけばアナタの性格はひん曲がっており、
ネガティブ負け組派遣人生を歩んでいます。
□派遣先正社員の作った糞開発ツールはたとえ腐っててもマンセーして使う
□派遣先の人事権のある社員の意見はたとえ間違っていてもマンセーする
□仕様とは正社員から口伝されるものだ
□耳で聞いた仕様を正確に覚えていないのは自分の責任だ
□昼食は必ず派遣先の社員と行くべきだ
□自分の仕事で問題が発生しても解決するのは派遣の仕事ではない
□派遣先から「いつまでもここで仕事してくださいね(安い金でw)」と言われて嬉しい
□自社で仕事なんてできるわけがない
□派遣労働の問題点の話題が出ると感情剥き出しにして反論する
□派遣労働の問題を指摘する人は嫌いだ
□派遣先には仕事だけでなくプライベートについてもグイグイ引っ張って欲しい
□奢ってくれる派遣先正社員を尊敬する
□自分の月額金額を知らないのは当然だ、単金を聞いてはいけない
□派遣先正社員より自分の生涯収入が低いのは当然だ
□チビは派遣先にかわいがってもらいやすから派遣には有利だ
- 72 :デフォルトの名無しさん:2007/08/26(日) 14:20:54
- ATIの場合どのライブラリがお薦めですか?
- 73 :デフォルトの名無しさん:2007/09/29(土) 08:12:36
- rand()を各スレッドごとにseedを持たせたいのですが、やり方を教えてください。
- 74 :デフォルトの名無しさん:2007/09/29(土) 22:05:26
- >>73
GPUで? 好きに実装したら?
- 75 :デフォルトの名無しさん:2007/10/01(月) 04:41:16
- どちらのGPUメーカが優位であると思いますか?
http://f1.gpupdate.net/ja/poll.php?action=vote&pollanswerID=4665&pollID=1149
ATI - 93% (838 投票)
nVIDIA - 7% (63 投票)
- 76 :デフォルトの名無しさん:2007/10/03(水) 14:58:04
- 8系のGPUを搭載したノートパソコンでCUDAをやっても効果ありますか?
- 77 :デフォルトの名無しさん:2007/10/03(水) 15:21:40
- 動作確認くらいには成るんじゃね?
ところで、LinuxでCUDAして暮らせるノートPC
って何が良いの?
- 78 :デフォルトの名無しさん:2007/10/05(金) 00:51:25
- >>75
そのリンク踏むと、F1富士開催がよかった、というのにポストされる
ねつ造マルチ乙
天国に行きなさい
- 79 :デフォルトの名無しさん:2008/01/22(火) 15:42:10
- 今日やっと8800GTを手に入れたので、早速やってみます
- 80 :デフォルトの名無しさん:2008/02/07(木) 17:21:07
- nvccってGeforce8系のGPUがないと使えないの?
- 81 :デフォルトの名無しさん:2008/02/07(木) 19:58:53
- ターゲットはそうですね。
- 82 :デフォルトの名無しさん:2008/02/07(木) 20:09:48
- エミュレーションで良ければどのパソコンでもコンパイルおよび実行できるよ
- 83 :デフォルトの名無しさん:2008/02/07(木) 20:11:18
- cuファイルにmainもすべてはいっているけど、cuファイルはcppファイルと何が違うのでしょうか?
- 84 :デフォルトの名無しさん:2008/02/07(木) 23:08:26
- >>83
CUDA用に拡張された記法を使えます。
- 85 :デフォルトの名無しさん:2008/03/06(木) 19:33:36
- 結局Geforce 9では64bit doubleはサポートされないのか?
- 86 :デフォルトの名無しさん:2008/03/06(木) 22:59:17
- GT200でもしないんじゃないか
- 87 :デフォルトの名無しさん:2008/03/17(月) 19:00:08
- 9800 GX2は結局1スロットに刺さったSLIと同じなの?
- 88 :デフォルトの名無しさん:2008/03/17(月) 19:38:36
- 8800GTと同じ世代のチップを二個載せただけじゃなかったかな。
8800GTS*2よりは速いけど、その次の世代が半ば見えてきたしねぇ。
- 89 :デフォルトの名無しさん:2008/03/17(月) 19:46:08
- じゃあCUDAでは2つのグリッドを作成しないとダメなのか?
- 90 :デフォルトの名無しさん:2008/03/17(月) 20:14:30
- さぁしらね。CUDAスレで聞いたら?
- 91 :デフォルトの名無しさん:2008/06/30(月) 17:17:12
- 最新のボードが出たのに...ageておくね。
- 92 :デフォルトの名無しさん:2008/07/08(火) 02:08:45
- Radeonの場合、何を使ってプログラムを組めばいいの?
CUDAのようなものはないの?
- 93 :デフォルトの名無しさん:2008/07/08(火) 05:56:52
- / \ /\ キリッ
. / (ー) (ー)\ "Radeon社ではお客様に世界最高峰のテクノロジーをご提供させて頂いております。"
/ ⌒(__人__)⌒ \ "お客様御自身でどのようにお使い頂いても良い様、開発環境はご自由にご選択頂けます。"
| |r┬-| |
\ `ー'´ /
ノ \
/´ ヽ
| l \
ヽ -一''''''"~~``'ー--、 -一'''''''ー-、.
ヽ ____(⌒)(⌒)⌒) ) (⌒_(⌒)⌒)⌒))
____
/_ノ ヽ、_\
ミ ミ ミ o゚((●)) ((●))゚o ミ ミ ミ だっておー!!!
/⌒)⌒)⌒. ::::::⌒(__人__)⌒:::\ /⌒)⌒)⌒)
| / / / |r┬-| | (⌒)/ / / //
| :::::::::::(⌒) | | | / ゝ :::::::::::/
| ノ | | | \ / ) /
ヽ / `ー'´ ヽ / /
| | l||l 从人 l||l l||l 从人 l||l
ヽ -一''''''"~~``'ー--、 -一'''''''ー-、
ヽ ____(⌒)(⌒)⌒) ) (⌒_(⌒)⌒)⌒))
- 94 :デフォルトの名無しさん:2008/07/30(水) 13:17:32
- ATiってnVIDIAのやってること何でもパクってくな
- 95 :デフォルトの名無しさん:2008/09/25(木) 04:25:21
- >>94
お互い様のような気が‥‥‥。というか、私的にはATIって廉価チップをつくっていた(mach)という印象がつよいですね。
- 96 :デフォルトの名無しさん:2008/09/25(木) 04:31:52
- 2ヶ月越しのレス乙
- 97 :デフォルトの名無しさん:2008/10/11(土) 01:20:16
- nvidiaがまだファブレスで、STMと組んで超ニッチなキワモノビデオチップを売り出すより前、
まだ設立されるかされないかって頃の話ですか。
nvidiaの初代チップNV-1はPowerVRなみのニッチ品だった...
構造の似たPowerVRの方はゲーム機に採用されたりして、ちょっとはメジャー化しそうになったのに対し、
NV1は何にも採用されないでニッチのまま消え去ったよな。
起死回生のRIVA128(NV5)が売れてなかったら、どうなってただろう。
- 98 :,,・´∀`・,,)っ-●◎○:2008/11/01(土) 19:30:11
- PVRって鳥伽巣だっけ
- 99 :デフォルトの名無しさん:2009/02/18(水) 23:14:27
- NECがPVRで作ったビデオカードを買った覚えがあるw
- 100 :デフォルトの名無しさん:2009/02/28(土) 09:36:38
- 100
20 KB
[ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]
■ おすすめ2ちゃんねる 開発中。。。 by FOX ★
このスレを見ている人はこんなスレも見ています。(ver 0.20)
PCが起動しない時に質問するスレ☆14 [自作PC]
【スパコン】スーパーコンピュータ関連情報【HPC】 [ハードウェア]
氷室京介 〜KYOSUKE HIMURO〜 Part518 [邦楽男性ソロ]
【スーパー】PS3でシミュレート【コンピュータ】 [シミュレート]
【科学技術計算】C言語とFortran どっちがいい? [シミュレート]
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 05.0.7.8 2008/11/13 アクチョン仮面 ★
FOX ★ DSO(Dynamic Shared Object)