雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告

John Ato

--split-mode tensor,速度有明显提升，前提是cpu有双直连 pcie4.0x8通道
,

John Ato

单卡是vulkan更快(其实也有点不稳定,尤其prefill),双卡肯定是rocm更稳

stakira

rocm还是慢，我也把单卡7900 xtx移到了Linux机器上，rocm 只能跑到28，vulkan用自带驱动只有19，完全卸载驱动再安装官方驱动后vulkan稳定35。AMD驱动这个事还是挺讨厌的，实际上之前Windows上能跑到40上下。

John Ato

Qwen3.6-27B-UD-Q4_K_XL.gguf ,ubuntu24.04 vulkan 单卡 7900 xtx能到 50多的

David Zhang

@John-Ato 对，这数量级的decoding速度让人着迷。

John Ato

此主題已被删除！

John Ato

是的，双卡7900xtx也蛮好用的,能跑Q8,mtp后速度起飞,而且上下文可以打满256k,这样的生产力还是挺迷人的，目前的方案就已经足够做产品了。前提是要自己组硬件,有一定动手能力。我喜欢听蓝宝石显卡全力运作后风扇的"滋滋"声。

stakira

@John-Ato 是开mtp还是不开？

John Ato

mtp是必须要开的,然后用最新版本7.2.3rocm,自己编译最新版本llama.cpp

John Ato

,生产力相当可以了

terry

讲实话，这个方案性价比极高，因为既可以大模型，又可以ComfyUI，生产力拉满了，关键是安静，蓝宝石的这个白金版我非常喜欢，做工绝对优秀，钱都花在了刀刃上。

活着就是折腾

用的啥电源，双卡要6个8pin插头我的电源才4个，难受啊

stakira

@terry 怎么感觉我的 ASRock Phantom Gaming Radeon RX 7900 XTX 动静巨大

terry

@stakira 我的是蓝宝石，我的卡声音完全不及CPU风扇，视频里说了很多次了，大家买蓝宝石。

Q maria

@活着就是折腾
我也好奇。。这得1300w吧

koala

不知道我理解的对不对，这样设置双卡，也可以在这个服务器上跑爱马仕，然后让爱马仕控制另外一张卡跑ComfyUI？

williamlouis

@Q-maria 1200W可以。1300W 稳定。1300是推荐值。供电配件越稳定越好。而且更省电。不是大电源就会更费点。

Colt

@Chan-Ivan 请问楼主，散热有没有问题啊？看图两张7900XTX之间还有多少空间？

潘旭高

双卡紧贴，涡轮卡还好，非公开放散热（PULSE 是三风扇开放式），上下叠放上面那张会吸热风，E5-2666 v3 只有 40 条 PCIe 3.0，第一张卡 x16，第二张只有 x8 甚至 x4（看具体板子布局）。双卡跑大模型推理时带宽会成为小瓶颈，但对于推理影响有限

拐子001

不知道双路的x99会不会在pic通道上会好一些呢。

抡锤者