| レス送信モード |
|---|
結構良いGPU買っても、プログラムがGPU向けのコード書いてないと、GPUの恩恵は薄いんだね
1. プログラムが並列処理に対応していない (Sequential Processing)
特徴: 処理が「Aを計算してからBを計算する」のように、前後の依存関係が強い場合。
理由: CPUは高速な少数コアで順序立てて処理する(シリアル処理)のが得意です。GPUの並列計算コアは1つ1つの性能が低いため、順序依存のある処理では逆に遅くなるか、GPUを活用できません。
例: 複雑な条件分岐が多いコード、OSの管理タスク、データベースのトランザクション処理。
2. データがGPUメモリに乗らない、通信ボトルネック
特徴: 計算自体は単純でも、CPUとGPU間のデータ転送量が非常に多い場合。
理由: GPUで処理するためにはデータをCPU(メインメモリ)からGPU(VRAM)に転送する必要があります。この転送時間が計算時間を上回ると、GPUの高速化が無意味になり、むしろ低速になります。
| … | 1無題Name名無し 26/02/12(木)09:26:00 IP:133.106.*(ipv4)No.660225+3. プログラムがGPU加速(CUDA/OpenCL)に対応していない |
| … | 2無題Name名無し 26/02/12(木)20:56:43 IP:42.126.*(t-com.ne.jp)No.660230+GPUっていうのは、正しい表現ではcoプロセッサ、coCPUであります。 |
| … | 3無題Name名無し 26/02/12(木)21:12:46 IP:42.126.*(t-com.ne.jp)No.660231+そもそも、OSが搭載されている物理的なHDD・SDD装置は【【起動専用】とすべき】てあり、DMAを伴う高度アブリとか、デバイス先(機器)ドライバくらいしか入れないようにしておくのが正解で、大容量HDD・SDD装置♪も自慢にしとる馬鹿タレがよくいますが、OS=ハードのプログラムに不具合があった時に、そのほんとんどがOS(ソフト)側に原因があるワケで、「それを司る【DMA】」というOSのしくみ・プログラミングを学ぶようにしましょう。 |
| … | 4無題Name名無し 26/02/13(金)14:51:55 IP:27.81.*(dion.ne.jp)No.660236+そこまで知ってるなら陰謀論卒業したら |
| … | 5無題Name名無し 26/02/13(金)16:49:23 IP:133.106.*(ipv4)No.660238+正直に言って、GPU16Gで、3Dの行列計算を1億回するのと、メモリ128GBで3Dの行列計算を1億回するのとでは、どちらがどのくらい速い?そのほかは同じハードウェア構成として、計算して。 |
| … | 6無題Name名無し 26/02/13(金)16:49:39 IP:133.106.*(ipv4)No.660239+1. 処理速度の計算(スループット比較) |
| … | 7無題Name名無し 26/02/13(金)16:50:34 IP:133.106.*(ipv4)No.660240+3. 具体的な「速さ」の差(見積もり)「行列計算1億回」を、一般的な4×4単精度浮動小数点演算として想定すると:構成予想処理時間理由GPU (16GB)0.01秒 〜 0.1秒以下数千コアによる超並列処理CPU + RAM (128GB)1秒 〜 数秒以上数十コアによる逐次・小規模並列処理差:約10倍〜100倍、GPUの方が速い。結論としての回答「どちらがどのくらい速いか」という問いに対しては、**「データが16GBに収まる限り、GPU構成の方が数十倍から百倍以上速い」**となります。 |
| … | 8無題Name名無し 26/02/13(金)16:59:28 IP:133.106.*(ipv4)No.660241+GPUがない時代の話でしょうか? |
| … | 9無題Name名無し 26/02/14(土)03:13:30 IP:60.86.*(bbtec.net)No.660242+おいt-com |