技嘉Z890主板 256G DDR5内存两张Pro6000 96G 跑cpp Qwen3.6 27B BF16与同时双ComfyUI工作流长视频之运行

kos or

@b9704037 说:

反正我是自己把我一路從I卡A770 X79 X99這些東西拼拼湊湊起來的, 遇到的問題和瓶頸分享了

這一路走來花了半年嗎？

韦春花

@b9704037 为什么俺键盘上满是口水

kos or

@terry 说:

暂时就4090 48G能用好，就足够赚钱了。

哈哈對呀賺錢第一

韦春花

80G内存占用 2026-06-09 011400.png
不管VRAM转移到RAM、缓存模型复用都会用到大内存，比VRAM那价格感觉赚飞了。俺是怕4个槽插满问题多才只买了2根，可惜了两根才3400软妹币

九龙杨生

1、上BF16精度是不是太奢侈了一点啊，一般情况用不到那么高的精度吧；
2、如果用FP8精度单张卡应该就能满足大部分要求吧，当然富哥无敌！
3、我实际大概测试了一下，max-q版本性能应该不止低20%；我是用600W版本限制功耗到300W尝试了一下；

566656661

~~還真是貧窮限制了我的想像~~

如果能優化跟用NVFP4估計能跑Qwen 3.5 122B A10B 或者Coder Next了吧

b9704037

@kos-or 是的, 是蝦皮購買二手的母豬礦電, 只要2100, 但品質很好, 重量很沉
我們從2月開始接觸與摸索, 差不多確實快要半年了。

@韦春花好羨慕3400元真的好平價, 真的太值得了現在一條要價6500R

@九龙杨生我們使用ComfyUI大概會跑50-60GB, 單張剩下40GB, 我們想說盡量地去用乾淨, 所以選擇了BF16沒有選擇FP8, 主要是600W的硬體架構與散熱, 我們還要重新買power和換機殼, 想著他太吃電了, 就沒有選擇600W

@566656661 我們有試過A10B和35B A3B, 但是不知道為什麼算力都沒有辦法一下子開頭跑滿全力運算, 總是卡卡的, 後來還是用了27B稠密, 我們的感覺是A10B A3B像省油日本車, 27B稠密像是一台油門全開的跑車。

566656661

畢竟MoE就是10B Activation, 我自己是理解成一大群的10B模型的集合體, Dense就27B全部一起上, 27B打贏10B就不太意外了

Deepseek v4 pro自己就是1600B A49B ~~這個MoE比常用的開源模型還要大啊~~

张老师

嫉妒！我的仇富心理到达了顶端——哈哈，开玩笑的。

如果我跟我家里领导说，要买两张10万块的显卡，她肯定觉得我疯了。但要是通过话术磨上几天，再换个说法：“我们去买个车吧，最新款的特斯拉不错……”我很有信心能得逞，而且还能忽悠成顶配！因为去年我就是这么成功的。

仔细想想，我买车的时候从标配一路升到顶配，差价也够买一张好显卡了，但我当时并没有觉得肉疼。为什么到了买显卡这件事上，我却磨磨唧唧，看论坛犹豫了快两个月？

kos or

一般我都是看Local LLM 的帖子或youtube, 不碰硬體的
結果一下海才發現水很深 ~~~ 也有買錯配置的時候
先暫時這樣將就著等有需求以後再換硬體配置

laobenxiong

@b9704037 有一个问题请教下: 在某一个 VRAM 尺寸限制下, 是选用参数量大的模型, 还是选用量化精度高的模型, 效果更好? 其实我的问题就是, 你的配置有足够的 vram, 为什么还停留在 27B 的模型? 谢谢

566656661

沒有固定準則吧, 不過通常以量化過的大模型為主

舉個同系列的模型例子, Qwen 3有8B跟32B的模型, 假設VRAM能放得下, 8B原形BF16大約16GB權重, 32B的Q4 IQ4_XS GGUF大約17GB權重, 然而32B對比8B來說這個性能8B是怎麼都跟不上的

不過之前問好像有跑Qwen3.5 122B A10B

Yu Nickolas

CPU这么不重要吗？都不值得提一下名字，intel哭晕在厕所

CS6

@Yu-Nickolas 他沒有常駐服務CPU 不要太爛就沒差吧，頂多編譯/解碼久一點，但我猜老哥是攻頂了

laobenxiong

@566656661 问了下 whichllm, 它也推荐 qwen3.6-27b, 这个模型真能打呀

CS6

terry

@CS6 你也挺能折腾的，太君的网站你都找得到，问题是你买了怎么收货？支持vsia付款？

CS6

@terry vsia應該是可以的，至於我是在日商工作.....至於各位大神就靠三方集運或是直接飛一趟吧
窮人只好撿漏了

applejuice

重点有问题怎样搞

566656661

保養估計得要自己飛去日本了吧

抡锤者