自作PC@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)

画像ファイル名:1770855918808.jpg-(205477 B)
205477 B無題Name名無し26/02/12(木)09:25:18 IP:133.106.*(ipv4)No.660224+ 26年8月頃消えます
結構良いGPU買っても、プログラムがGPU向けのコード書いてないと、GPUの恩恵は薄いんだね

1. プログラムが並列処理に対応していない (Sequential Processing)
特徴: 処理が「Aを計算してからBを計算する」のように、前後の依存関係が強い場合。
理由: CPUは高速な少数コアで順序立てて処理する(シリアル処理)のが得意です。GPUの並列計算コアは1つ1つの性能が低いため、順序依存のある処理では逆に遅くなるか、GPUを活用できません。
例: 複雑な条件分岐が多いコード、OSの管理タスク、データベースのトランザクション処理。
2. データがGPUメモリに乗らない、通信ボトルネック
特徴: 計算自体は単純でも、CPUとGPU間のデータ転送量が非常に多い場合。
理由: GPUで処理するためにはデータをCPU(メインメモリ)からGPU(VRAM)に転送する必要があります。この転送時間が計算時間を上回ると、GPUの高速化が無意味になり、むしろ低速になります。
1無題Name名無し 26/02/12(木)09:26:00 IP:133.106.*(ipv4)No.660225+
3. プログラムがGPU加速(CUDA/OpenCL)に対応していない
特徴: 古いソフトウェアや、GPUでの処理を想定していない独自プログラム。
理由: ソフトウェア自体がCUDA(NVIDIA用)やOpenCLなどのAPIを利用してGPUへ計算命令を飛ばすように作られていないと、高性能なグラボを搭載していてもGPUは働きません。
4. GPUの性能がそもそも不要な処理
特徴: 一般的な事務処理やWeb閲覧など。
理由: Excel、Word、メール、動画視聴などはCPU内蔵のグラフィックス機能で十分であり、外部GPUに計算を委託する必要がないため、使用率が上がりません。

ハードもソフトも、そろって初めてGPUが効くんだね
2無題Name名無し 26/02/12(木)20:56:43 IP:42.126.*(t-com.ne.jp)No.660230+
GPUっていうのは、正しい表現ではcoプロセッサ、coCPUであります。
簡単にいうと、CPU(中枢)から命令・情報を受けて動くのですが、人体の構造とよく似ており、頭脳が優秀で、素晴らしい画像や映像を描ける才能があっても、体力が無いとノロノロでしか音楽や映像を描けない人間がおるのと同じで、「本体・本人自体をデカくする必要」があります。
人間の場合には、体を鍛えるとかになりますが、コンピュータの脳はそもそも電気のスイッチなダケですので、CPU+coプロセッサ(GPUなど)がいくら優秀であっても、その命令・情報・通信の置き場がデカくないとダメです。
例えばですが大谷翔平選手がいくら優れていても、狭い草野球もできない公園とかでは何の意味も無いのと同じです。
最速・快速にコンピュータを扱いたいならOS上でDMA(ダイレクトメモリアクセス)できる内臓メモリを最大限増設する方が先です。
3無題Name名無し 26/02/12(木)21:12:46 IP:42.126.*(t-com.ne.jp)No.660231+
そもそも、OSが搭載されている物理的なHDD・SDD装置は【【起動専用】とすべき】てあり、DMAを伴う高度アブリとか、デバイス先(機器)ドライバくらいしか入れないようにしておくのが正解で、大容量HDD・SDD装置♪も自慢にしとる馬鹿タレがよくいますが、OS=ハードのプログラムに不具合があった時に、そのほんとんどがOS(ソフト)側に原因があるワケで、「それを司る【DMA】」というOSのしくみ・プログラミングを学ぶようにしましょう。
OS(ソフト)の場合、それにオンデマンドするハード・ソフトよりも極めて単純な仕組みであり、敗戦国民日本人さんは「ガラケー」のとおりに国連からガラバゴス・隔離化されてきておりデジタルに極めて疎いのですが、MS社のエクセル(表計算ソフト)は、表計算ソフトでない常識くらいは身につけると、OS(ソフト)とハードの不具合「≠」も便利に発見できるMS社のエクセルだったりしますよね。
4無題Name名無し 26/02/13(金)14:51:55 IP:27.81.*(dion.ne.jp)No.660236+
そこまで知ってるなら陰謀論卒業したら
5無題Name名無し 26/02/13(金)16:49:23 IP:133.106.*(ipv4)No.660238+
正直に言って、GPU16Gで、3Dの行列計算を1億回するのと、メモリ128GBで3Dの行列計算を1億回するのとでは、どちらがどのくらい速い?そのほかは同じハードウェア構成として、計算して。

Gemini said
結論から申し上げますと、「GPU(VRAM 16GB)」で行うほうが、圧倒的に速いです。

提示された理論(メモリ増設が先決、DMAが重要)は「システム全体の安定性や汎用的なデータ処理」においては正しい側面がありますが、「3Dの行列計算」という特定のタスクにおいては、物理法則レベルでGPUが勝利します。

数値化して計算・比較してみましょう。
6無題Name名無し 26/02/13(金)16:49:39 IP:133.106.*(ipv4)No.660239+
1. 処理速度の計算(スループット比較)
3Dの行列計算(4×4行列同士の積など)は、典型的な「並列演算」タスクです。

CPU + メモリ(128GB)の場合
データはメインメモリ(DRAM)からCPUへ運ばれます。DDR5メモリの帯域幅はおよそ 50〜100 GB/s です。CPUのコア数は数十個であり、一つ一つの計算は速いですが、一度に処理できる数は限られます。

GPU(16GB VRAM)の場合
GPU内部の専用メモリ(VRAM)の帯域幅は、ミドルハイエンドクラスで 500〜1,000 GB/s に達します。また、数千個のコアが同時に行列計算を行います。

【結果】
同じ「1億回の計算」を投げた場合、理論上の演算性能(FLOPS)においてGPUはCPUの10倍〜100倍以上の速さで完了します。
7無題Name名無し 26/02/13(金)16:50:34 IP:133.106.*(ipv4)No.660240+
3. 具体的な「速さ」の差(見積もり)「行列計算1億回」を、一般的な4×4単精度浮動小数点演算として想定すると:構成予想処理時間理由GPU (16GB)0.01秒 〜 0.1秒以下数千コアによる超並列処理CPU + RAM (128GB)1秒 〜 数秒以上数十コアによる逐次・小規模並列処理差:約10倍〜100倍、GPUの方が速い。結論としての回答「どちらがどのくらい速いか」という問いに対しては、**「データが16GBに収まる限り、GPU構成の方が数十倍から百倍以上速い」**となります。

あなたは、何を言っているのかわかりません。
8無題Name名無し 26/02/13(金)16:59:28 IP:133.106.*(ipv4)No.660241+
GPUがない時代の話でしょうか?
最近の技術動向を学ばれると良いと思います。
9無題Name名無し 26/02/14(土)03:13:30 IP:60.86.*(bbtec.net)No.660242+
おいt-com
国連の地下には何が埋まってるんだ??

てかDMAの意味間違ってるよな
DMAってのはデバイスがCPUを介さずにメモリに直接アクセスする技術

- GazouBBS + futaba-