cellプログラミングしちゃいなよ3
- 1 :デフォルトの名無しさん:2008/07/07(月) 08:55:08
- 前スレ
Cellプログラミングしちゃいなよ2
http://pc11.2ch.net/test/read.cgi/tech/1183091522/
- 14 :デフォルトの名無しさん:2008/07/17(木) 05:09:34
- Cell が GPU に敵う進化を続けられるかは別だが。
そもそもの HPC 的視点が、Cell は超並列プロセッサであり、GPU はハイパーSIMD/MIMD なわけだ。
それぞれに得意な分野があるから、どちらが滅んでどちらが栄えるという話ではない。
滅ばないとも言わないが。
- 15 :デフォルトの名無しさん:2008/07/17(木) 14:44:19
- 実際問題、超並列プロセッサっていっても、ハイパーSIMD/MIMDと変わらないような用途でしか使ってないだろう。
プロセッサがいくつかあって、すごいことがいつできるんだ。LinuxがSPEに仕事割り振れるようにでもなればなあ。
- 16 :デフォルトの名無しさん:2008/07/17(木) 15:29:40
- ブロードバンドエンジンは内蔵されたホストCPUがPen4程度の低性能、
スパースエンジンは並列度が落ちた挙句にホストCPUが外付け。
某芝の目指す方向はどこなんだか。
- 17 :デフォルトの名無しさん:2008/07/18(金) 00:24:09
- >>15
> 実際問題、超並列プロセッサっていっても、ハイパーSIMD/MIMDと変わらないような用途でしか使ってないだろう。
俺には単に、GPU での処理に向いたアプリケーションの、並列コンピュータからの置き換えが、まだまだ進んでいないだけのようの思える。
そいういう意味で無いなら、俺の知らない分野のことを言っているようだから、教えてくれると有り難い。
- 18 :デフォルトの名無しさん:2008/07/18(金) 01:41:44
- つーか超並列はMIMDでしか作らない訳だが。
- 19 :デフォルトの名無しさん:2008/07/19(土) 17:18:45
- Cellプログラミングをやろうと思い
PS3にxUbuntuをいれSynapticパッケージマネージャでCell-sdkとbinfbinfmts-supportを入れました。
spu-gcc でhello world
- 20 :デフォルトの名無しさん:2008/07/19(土) 17:21:01
- 途中で送信してしまいました
Cellプログラミングをやろうと思い
PS3にxUbuntuをいれSynapticパッケージマネージャでCell-sdkとbinfbinfmts-supportを入れました。
spu-gcc でhello worldを表示するプログラムをつくりコンパイルをするところまではできたのですが
いざ実行してみると
spu_create(): no such file or directory
spe_create_single: Bad address
とでてしまい実行できませんでした。
いろいろ調べても見たのですがこれといった解決策も見つからず途方にくれています。
原因をご存知の方がいらっしゃいましたら教えていただけないでしょうか。
- 21 :デフォルトの名無しさん:2008/07/19(土) 17:28:49
- 素直にfedoraかYellowdogにしれ。
- 22 :デフォルトの名無しさん:2008/07/19(土) 17:36:35
- レス有難うございます
xUbuntuだと結局Cellやるのには問題多いんですかね・・・
軽いって話を聞いたんですけど。無理そうならFedoraにしときます。
- 23 :デフォルトの名無しさん:2008/07/19(土) 20:07:23
- PS3で開発って辺りが結構無茶っぽい。
いいクロス開発環境ないのかねぇ。
- 24 :デフォルトの名無しさん:2008/07/19(土) 20:19:10
- SPU用のバイナリのファイル名が違ってるか作られてないのでは?
俺のとこはxじゃないUbuntu7.10だけど問題なくセルフ開発できてる
- 25 :デフォルトの名無しさん:2008/07/19(土) 22:21:43
- >>23
そうだよな
開発成果をBDまたは仮想BDで出力する環境が欲しい
- 26 :デフォルトの名無しさん:2008/07/20(日) 04:17:30
- 素直に一旦ゲーム屋に行けよw
- 27 :デフォルトの名無しさん:2008/07/21(月) 14:59:52
- >> 20
うちはxubuntuで上手く行ってる。24の指摘通りではないでしょうか。
- 28 :デフォルトの名無しさん:2008/07/21(月) 16:22:12
- >>24,27
レスありがとうございます。
はじめに実行したときcannot execute binary file と表示されたのでSPU用のバイナリが原因かもしれません。
それを解決するためにbinfbinfmts-supportを入れてみたのですが・・・解決にはなってなかったかもしれないですね。
SPU用のバイナリについて勉強不足であまりよくわからないので調べてみたいと思います。
- 29 :24:2008/07/21(月) 19:54:53
- SPU のは普通は直接起動できず,起動するのは PPU 用のバイナリ.
そこから spe_image_open と spe_program_load 使って load する.
さらに thread を 6つ創って spe_context_create, spe_context_run する.
SPU 用のバイナリを埋め込んじゃえば _open の方は要らない.
後,spu-gcc のオプションに -standalone を指定すれば,
直接起動できるプログラムを生成してくれたはず.
- 30 :デフォルトの名無しさん:2008/07/21(月) 22:19:00
- 本当にSPUを活用したいなら、
使える立場にいるならSPURSとか、
MARS,Ctk,そのほかの
SPU自律カーネルみたいなのを立てて
それにジョブを投げた方が楽だよ。
- 31 :デフォルトの名無しさん:2008/07/22(火) 17:07:48
- 仕事でやるんならそうだね
- 32 :デフォルトの名無しさん:2008/07/25(金) 17:42:28
- ftp://ftp.infradead.org/pub/Sony-PS3/mars
どうなんだい?
- 33 :デフォルトの名無しさん:2008/07/25(金) 17:46:45
- 追記
ftp://ftp.infradead.org/pub/Sony-PS3/mars/MARS-GATECH-20080711-final.pdf
- 34 :デフォルトの名無しさん:2008/07/25(金) 20:04:08
- 自分も是非感想を聞きたい。
- 35 :デフォルトの名無しさん:2008/07/25(金) 21:36:54
- 誰かファイル操作についてのCの制御文?(printfのようなもの)知らない?
知ってる分だけ伝授してほしいです
- 36 :デフォルトの名無しさん:2008/07/25(金) 22:18:18
- >>35
スレ違い。
- 37 :デフォルトの名無しさん:2008/07/25(金) 22:20:24
- MARSってコンテキスト量減らせるだけ?
- 38 :デフォルトの名無しさん:2008/07/26(土) 16:27:04
- MARSでやれるようなことは、GPGPUだとたぶん無理だと思う。こういうことにこそ、Cellの強みがあるんじゃないかな。
実際どれだけ使えるようになっているのかが問題だ。
- 39 :デフォルトの名無しさん:2008/07/26(土) 17:09:50
- データの入れ替えには対応してないみたいだな。(まだ)
- 40 :デフォルトの名無しさん:2008/07/26(土) 18:03:22
- CPUの省エネ、後編(CELL、BG/Lを参考に考える。)
http://www.ne.jp/asahi/comp/tarusan/main190.htm
電力消費量的にLSはよいと。うまくつかえればの話だけど。
それじゃあ、キャッシュとLSを二つ持って、使い分ければいいのかとも思うけど、
2つの使い分けを把握しないといけないから、煩わしさが増えると。
- 41 :デフォルトの名無しさん:2008/07/31(木) 11:56:30
- 「5年は追いつけないでしょう」──東芝が作るAVノートの新しい未来形・Qosmio G50の革新性とは
ttp://journal.mycom.co.jp/articles/2008/07/30/qosmio/001.html
通常
ttp://journal.mycom.co.jp/photo/articles/2008/07/30/qosmio/images/005l.jpg
supers engine
ttp://journal.mycom.co.jp/photo/articles/2008/07/30/qosmio/images/006l.jpg
これは結構いいな。
- 42 :デフォルトの名無しさん:2008/08/01(金) 12:39:21
- 問題はノートでここまでの要求があるかだが
- 43 :デフォルトの名無しさん:2008/08/01(金) 13:31:07
- 映画好きの人とか、結構、本気で欲しがるんじゃないか?
自宅で使うデスクノートとして。まあ、あくまでマニア需要かな。
でも、世間的に意外とこんなんで火がついたりとかありえそうな気もするが。
QosmioのSupersは直接いじれないらしから、すれ違いだけどね。
- 44 :デフォルトの名無しさん:2008/08/01(金) 18:24:08
- アプリは自作用のカードに乗らないから色々なメーカーに期待するって……
自作用カード出しても、エコシステムが回るほどアプリが出てくる思えないな。
- 45 :デフォルトの名無しさん:2008/08/09(土) 21:36:42
- Qosmio G50新兵器、SpursEngineがスゴすぎる件【前編】
http://ascii.jp/elem/000/000/157/157525/
NvidiaのGPUまわせば、SpursEngineいらないんじゃ…。
- 46 :デフォルトの名無しさん:2008/08/09(土) 21:38:57
- The Barcelona Supercomputing Center has a new prototype
to investigate the supercomputing of the future
http://www.bsc.es/media/1762.pdf
Roadrunnerを超えるCellスパコンができるらしい。
- 47 :デフォルトの名無しさん:2008/08/09(土) 21:52:37
- ついにベールを脱いだIntelのCPU&GPUハイブリッド「Larrabee」
http://pc.watch.impress.co.jp/docs/2008/0804/kaigai457.htm
Intel版Cellといろんなところで騒がれていますな。Cellとがちだけど、GPUとして
登場するところは大きな違いであり、?でもある。
- 48 :デフォルトの名無しさん:2008/08/09(土) 22:01:41
- そろそろCellも次世代のバージョンの詳細がでてくるだろうか。2PPE+32SPEがでる
っていう情報はでてるけど、それ以上の話はまだなくて、今まさに検討中なんだろう。
Sonyが腰が引け気味で、Toshibaが違った方向に進みつつあり、IBMはHPC路線で突き進んでいる。
また、PS3の状況は、次世代Cellに大きく関わってくるんだろう。PS3の状況はよくなりつつあるが、
まだ厳しそうだ。次世代に向けて動き出すときこのときに、今のような不透明な状況であることが、
次世代のCellに一体どう作用するか…。Sonyの求心力が弱まることで、よりIBM主導のアーキテクチャに
進むのだろうか?果たして…。
- 49 :デフォルトの名無しさん:2008/08/10(日) 01:51:45
- >>45
> Qosmio G50新兵器、SpursEngineがスゴすぎる件【前編】
> http://ascii.jp/elem/000/000/157/157525/
>
> NvidiaのGPUまわせば、SpursEngineいらないんじゃ…。
GPUでまっとうなC/C++使える日が来たらそうかもね。
- 50 :デフォルトの名無しさん:2008/08/10(日) 04:02:39
- MSが次のXBOXにLarrabee使うんじゃ
- 51 :デフォルトの名無しさん:2008/08/10(日) 09:51:21
- >>49
CUDAでいいんじゃね。
- 52 :デフォルトの名無しさん:2008/08/10(日) 10:02:33
- >>51
> >>49
> CUDAでいいんじゃね。
「まっとうなC/C++」というのはCUDAへの皮肉だよw
Cellの方がはるかに作りやすい。
まぁ作りやすい以上の動機があるからCUDAが使われているわけだけど。
- 53 :デフォルトの名無しさん:2008/08/10(日) 10:05:28
- 三角関数も全く使えなくても、最適化が馬鹿でも、メモリ転送命令が低レベルでしか実装されていなくても、
それでもCellの方がはるかに作りやすいんですね、判ります。
- 54 :デフォルトの名無しさん:2008/08/10(日) 10:15:24
- 超越関数使えるのは便利だわな。
それ以外のツッコミは的外れ。
- 55 :デフォルトの名無しさん:2008/08/10(日) 10:41:47
- 超越関数なんて(細かい注文付けなきゃ)簡単に実装できるだろ?
何が問題なんだ?
- 56 :デフォルトの名無しさん:2008/08/10(日) 11:31:49
- そりゃハードで超越関数の演算器持ってくれてた方がうれしいだろ。
- 57 :デフォルトの名無しさん:2008/08/10(日) 14:27:13
- ハードウェアの超越関数ってスループットが5サイクルくらいなんでしょ?
4要素計算しても20サイクル、馬鹿っ速いじゃないか。
- 58 :デフォルトの名無しさん:2008/08/10(日) 15:16:58
- 超越関数つーかsqrtがあれば十分だな。1/sqrtでも良いけど。
- 59 :デフォルトの名無しさん:2008/08/10(日) 16:28:14
- >>52
LSの容量制限でC++はやりにくかろう。結果的にCellもCUDAもそんなに変わらんと思うが。
- 60 :デフォルトの名無しさん:2008/08/11(月) 01:27:06
- >>59
そういうことはどっちもやってみてから言ってくれ。
- 61 :デフォルトの名無しさん:2008/08/11(月) 11:15:00
- どっちもCとちょっとの拡張で書ける程度だからねえ。書くだけならどっちもそこまで大差ないさ。
問題は最適化の段階だな。でも、これもコツを覚えて、そこそこの最適化でいいんならそんなには苦労しないと思う。
個人的な感想では、CUDAのメモリ周りの最適化がちょっと難ありか。Cellは最初からアラインメントとらないとそもそも
DMA転送できないようになっているから、あんまり考える必要ないが、CUDAの場合は、スレッドごとのDRAMへのアクセスパターンを
考えないと駄目というのが、う〜ん。あとshared memoryのバンクコンフリクトを考えないと、とんでもないことに
なるときがある。ここらへんを、コンパイラかハードでなんとかしてくれるといんだけど。
- 62 :デフォルトの名無しさん:2008/08/22(金) 21:02:45
- Qosmio G50新兵器、SpursEngineがスゴすぎる件【後編】
http://ascii.jp/elem/000/000/162/162488/index-3.html
円弧職人の夢がここに
- 63 :デフォルトの名無しさん:2008/08/25(月) 12:11:23
- ググってたらこんなんめっけた
http://www.ibm.com/developerworks/jp/power/library/j_pa-asmvis/
第 1 回 asmVis を試してみよう
http://www.ibm.com/developerworks/jp/power/library/j_pa-asmvis2/
第 2 回 パイプラインを最適化する
18 KB
[ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]
取りに行ったけどなかった。次は一時間後に取りに行くです。新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 05.0.7.3 2008/07/26
FOX ★ DSO(Dynamic Shared Object)