Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
--split-mode tensor,速度有明显提升,前提是cpu有双直连 pcie4.0x8通道 ,
单卡是vulkan更快(其实也有点不稳定,尤其prefill),双卡肯定是rocm更稳
rocm还是慢,我也把单卡7900 xtx移到了Linux机器上,rocm 只能跑到28,vulkan用自带驱动只有19,完全卸载驱动再安装官方驱动后vulkan稳定35。AMD驱动这个事还是挺讨厌的,实际上之前Windows上能跑到40上下。
Qwen3.6-27B-UD-Q4_K_XL.gguf ,ubuntu24.04 vulkan 单卡 7900 xtx能到 50多的
@John-Ato 对,这数量级的decoding速度让人着迷。
是的,双卡7900xtx也蛮好用的,能跑Q8,mtp后速度起飞,而且上下文可以打满256k,这样的生产力还是挺迷人的,目前的方案就已经足够做产品了。前提是要自己组硬件,有一定动手能力。我喜欢听蓝宝石显卡全力运作后风扇的"滋滋"声。
@John-Ato 是开mtp还是不开?
mtp是必须要开的,然后用最新版本7.2.3rocm,自己编译最新版本llama.cpp
,生产力相当可以了
讲实话,这个方案性价比极高,因为既可以大模型,又可以ComfyUI,生产力拉满了,关键是安静,蓝宝石的这个白金版我非常喜欢,做工绝对优秀,钱都花在了刀刃上。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗