比较流畅的跑Qwen 3.6 27B 模型本地部署,使用AI PRO R9700,主机怎么配置
-
我刚配好,拼多多2800元, 2686v4*2,x99,1T,64g,不带显卡,显卡京东1.1万,电源700w,我自己换了1200w,长城750元。预装win10,本来想玩玩游戏再搞模型,win弹窗弹的难受,赶紧装了ubuntu,还在摸索,洋垃圾太强了
-
@kiner-liu AM5还有一款支持双卡的主板,铭瑄iCraft B850,1500RMB,也有两个PCIex16插槽,可以PCIe5.0 x8,性价比之选。
-
@ken-chan
根據我的觀測。
用於語言大模型的話
一般的話,vram是會疊加。
例如,40gb的大模型
可以選擇平均分配到兩張gpu
Pipeline parallel
就是20放在1號卡
另外,20放在2號卡。
運算的時候會先跑1號,跟住跑2號
不斷重複。
根據我的觀察,這樣gpu不會太熱。因為有一定的休息時間。
速度會比單卡慢少少。另外,可以設定為tensor parallel
同樣都是1號卡20gb 2號卡20gb
但兩張卡同時間運行。
每一個token計算完都會聚合在一起。
不斷重複。
好處是你可以同時間用到兩張gpu的 memory bandwidth
如果你的gpu 是800gb/s
兩張卡跑tp 就是800 x 2
不過要扣除每一token計算輸出時所用的時間
根據我的理解是,大約單卡是速度的1.5倍左右。但是,如果跑圖片或視頻就應該不能了
只能夠一張一張卡跑。記憶體不能疊加。 -
@kiner-liu AM5还有一款支持双卡的主板,铭瑄iCraft B850,1500RMB,也有两个PCIex16插槽,可以PCIe5.0 x8,性价比之选。