跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 技嘉Z890主板 256G DDR5内存 两张Pro6000 96G 跑cpp Qwen3.6 27B BF16与同时双ComfyUI工作流长视频之运行

技嘉Z890主板 256G DDR5内存 两张Pro6000 96G 跑cpp Qwen3.6 27B BF16与同时双ComfyUI工作流长视频之运行

已定时 置顶直到 2026/6/14 15:41 已锁定 已移动 AI硬件
103 帖子 16 发布者 481 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • B b9704037

    大大覺得沒用沒有參考價值要刪掉就刪掉吧, 反正我是自己把我一路從I卡A770 X79 X99這些東西拼拼湊湊起來的, 遇到的問題和瓶頸分享了

    kos orK 在线
    kos orK 在线
    kos or
    编写于 最后由 编辑
    #70

    @b9704037 说:

    反正我是自己把我一路從I卡A770 X79 X99這些東西拼拼湊湊起來的, 遇到的問題和瓶頸分享了

    這一路走來花了半年嗎?

    1 条回复 最后回复
    0
    • B b9704037

      @williamlouis
      我一字一字把經歷打出來給你說雲, 我不懂什麼太深奧的東西, 我就一個凡人, 踩過的坑就這麼多, 避免有人踩坑, 分享一下我圖啥了, 發帖能賺錢? 我不知道你權限多高, 你覺得我這帖沒有用, 能刪了你就刪了吧, 反正我可能就發這一次貼文而已。

      證明我不是嘴巴說說, 我把我買過的東西都貼出來
      S__61808717.jpg S__61661192_0.jpg V1007.jpg

      韦 离线
      韦 离线
      韦春花
      编写于 最后由 编辑
      #71

      @b9704037 为什么俺键盘上满是口水🤤 🤤 🤤

      1 条回复 最后回复
      0
      • terryT terry

        @CS6 我上哪里去买这么贵的卡,不是有人在测试了吗?我暂时就4090 48G能用好,就足够赚钱了。

        kos orK 在线
        kos orK 在线
        kos or
        编写于 最后由 编辑
        #72

        @terry 说:

        暂时就4090 48G能用好,就足够赚钱了。

        哈哈 對呀 賺錢第一

        1 条回复 最后回复
        0
        • 韦 离线
          韦 离线
          韦春花
          编写于 最后由 编辑
          #73

          80G内存占用 2026-06-09 011400.png
          不管VRAM转移到RAM、缓存模型复用都会用到大内存,比VRAM那价格感觉赚飞了。俺是怕4个槽插满问题多才只买了2根,可惜了两根才3400软妹币

          1 条回复 最后回复
          0
          • 九龙杨生九 离线
            九龙杨生九 离线
            九龙杨生
            编写于 最后由 编辑
            #74

            1、上BF16精度是不是太奢侈了一点啊,一般情况用不到那么高的精度吧;
            2、如果用FP8精度单张卡应该就能满足大部分要求吧,当然富哥无敌!
            3、我实际大概测试了一下,max-q版本性能应该不止低20%;我是用600W版本限制功耗到300W尝试了一下;

            1 条回复 最后回复
            0
            • 5 离线
              5 离线
              566656661
              编写于 最后由 编辑
              #75

              還真是貧窮限制了我的想像

              如果能優化跟用NVFP4估計能跑Qwen 3.5 122B A10B 或者Coder Next了吧

              1 条回复 最后回复
              0
              • kos orK kos or

                电源:EVGA 1000W GT 就能推動這麼強的AI威力, 真是個寶貝呀~

                B 离线
                B 离线
                b9704037
                编写于 最后由 编辑
                #76

                @kos-or 是的, 是蝦皮購買二手的母豬礦電, 只要2100, 但品質很好, 重量很沉
                我們從2月開始接觸與摸索, 差不多確實快要半年了。

                @韦春花 好羨慕3400元真的好平價, 真的太值得了 現在一條要價6500R😢

                @九龙杨生 我們使用ComfyUI大概會跑50-60GB, 單張剩下40GB, 我們想說盡量地去用乾淨, 所以選擇了BF16沒有選擇FP8, 主要是600W的硬體架構與散熱, 我們還要重新買power和換機殼, 想著他太吃電了, 就沒有選擇600W

                @566656661 我們有試過A10B和35B A3B, 但是不知道為什麼算力都沒有辦法一下子開頭跑滿全力運算, 總是卡卡的, 後來還是用了27B稠密, 我們的感覺是A10B A3B像省油日本車, 27B稠密像是一台油門全開的跑車。

                5 1 条回复 最后回复
                0
                • B b9704037

                  @kos-or 是的, 是蝦皮購買二手的母豬礦電, 只要2100, 但品質很好, 重量很沉
                  我們從2月開始接觸與摸索, 差不多確實快要半年了。

                  @韦春花 好羨慕3400元真的好平價, 真的太值得了 現在一條要價6500R😢

                  @九龙杨生 我們使用ComfyUI大概會跑50-60GB, 單張剩下40GB, 我們想說盡量地去用乾淨, 所以選擇了BF16沒有選擇FP8, 主要是600W的硬體架構與散熱, 我們還要重新買power和換機殼, 想著他太吃電了, 就沒有選擇600W

                  @566656661 我們有試過A10B和35B A3B, 但是不知道為什麼算力都沒有辦法一下子開頭跑滿全力運算, 總是卡卡的, 後來還是用了27B稠密, 我們的感覺是A10B A3B像省油日本車, 27B稠密像是一台油門全開的跑車。

                  5 离线
                  5 离线
                  566656661
                  编写于 最后由 编辑
                  #77

                  @b9704037

                  畢竟MoE就是10B Activation, 我自己是理解成一大群的10B模型的集合體, Dense就27B全部一起上, 27B打贏10B就不太意外了

                  Deepseek v4 pro自己就是1600B A49B 這個MoE比常用的開源模型還要大啊

                  1 条回复 最后回复
                  0
                  • 张老师张 离线
                    张老师张 离线
                    张老师
                    编写于 最后由 编辑
                    #78

                    嫉妒!我的仇富心理到达了顶端——哈哈,开玩笑的。

                    如果我跟我家里领导说,要买两张10万块的显卡,她肯定觉得我疯了。但要是通过话术磨上几天,再换个说法:“我们去买个车吧,最新款的特斯拉不错……”我很有信心能得逞,而且还能忽悠成顶配!因为去年我就是这么成功的。

                    仔细想想,我买车的时候从标配一路升到顶配,差价也够买一张好显卡了,但我当时并没有觉得肉疼。为什么到了买显卡这件事上,我却磨磨唧唧,看论坛犹豫了快两个月?

                    1 条回复 最后回复
                    0
                    • kos orK 在线
                      kos orK 在线
                      kos or
                      编写于 最后由 kos or 编辑
                      #79

                      一般我都是看Local LLM 的帖子或youtube, 不碰硬體的
                      結果一下海才發現水很深 ~~~ 也有買錯配置的時候
                      先暫時這樣將就著 等有需求 以後再換硬體配置

                      B 1 条回复 最后回复
                      0
                      • B b9704037

                        我人生第一次接触AI就是看了版主抡锤者的视频
                        最早我贪图便宜买了2张Intel A770 16G但是如就像版主说的那样太折腾了,
                        好不容易跑通, 后来新模型出来又要重新搞一遍, I卡浪费了我的青春, 而我却什么也没得到。

                        后来换成了两张2080ti 22G魔改卡, 我们感受到了质的飞越,
                        但因为需要跑ComfyUI需要更大的Vram我们换了两张V100 32G虽然旧, 但依旧值回票价。
                        如今我们跑通了全流程, 直接倾家荡产换上了两张Pro6000 96G。

                        虽然贵, 但必须得说, 真的"太值了"。

                        主要是想给还在考虑Pro6000的朋友用力推一把, 不是要把你推向深渊, 而是让你展翅高飞。

                        也把一些我们中途遇到的困难和有想要入手的朋友分享, 至少面对困难之前会有心理准备

                        主机板:GIGABYTE Z890 AERO G
                        CPU:Intel Core Ultra 5 225
                        RAM:Micron DDR5 64GB 6400 ×4
                        显卡:NVIDIA Pro 6000 Max-Q / Pro 6000 96GB x2
                        电源:EVGA 1000W GT
                        存储 : 1TB NVMe x 2

                        S__61808713.jpg

                        我们使用了Qwen3.6 27B的 BF16模型 256K, 大约会占用60GB的显存
                        透过llama.cpp的调度分散到两张卡上面, 单卡会占用约30GB左右
                        在Hermes上实际应用都可以落在25~35t/s以上的速度, Thinking模式有开启, 因为我们实际测试过Thinking模式虽然会导致首字速度变慢, 但是确实智力上和提供的工具调用与来回答覆内容上都可以更加精准使得我们工作更加顺利。

                        每张卡剩余的约60初GB, 我们用来做ComfyUI, 单卡跑LTX2.3的状况, 基本上都可以扛住复杂的工作流, 大约最多占用到50GB, 而且720P / 40秒 的长影片可以轻松产出, 我们验证过Hermes运作时与ComfyUI同时运作时Pro6000本身自带ECC侦错, 可以防止跑大量资料堆积在显存上运算时记忆体发生错误。

                        要注意的事情
                        1.建议买Max-Q版本不建议买600W版本, 主要是600W的算力只比Max-Q多15-20%, 但供耗却多出一倍, 如果以商业角度来说, 在未来3年后保值性的部分Max-Q会比600W保值, 因为硬体规格是一样的, 600W版本只是用功率调升一倍, 去硬拉出15%的效能, 商业用户会更多的考虑功率与算力的比值, 而且以个人角度来说Max-Q很够了。

                        2.双显示卡, 如果要搭配比较新的主板如Z890, 很多板子其实没有支援PCIe拆分, 这个买的时候一定要看清楚, 不然买了没有支援会生气。

                        3.要同时支持llama.cpp, Hermes, 双显卡ComfyUI工作流, 内存一定要够大, 我们当初天真的以为128G够用了, 插了4条32G, 结果全部工作流塞再一起, 直接崩了, 后来又多花钱重新买了 4条 DDR5 6400 64G, 差点都得卖房卖车卖肾。

                        4.X79.X99平台我们因为贪图记忆体DDR3很便宜, 也买来使用过, 但效果太差了, llama.cpp与Hermes还可以没有问题, 但同时运作ComfyUI, 但LTX2.3选用大颗的模型与复杂工作流时, 很多节点他会大量快速的调用内存, 我们使用了 DDR3 1600 非常卡, 卡到我决定直接换成Z890 又重新破产了一次。

                        支援.png

                        5.BIOS问题, DDR5 4条 64G 同时插上去, 以BIOS版本没有更新的状况,很大概率, 你会点不开机, 卡住, 请一定要把BIOS更新, 且在购买记忆体前, 上网站查询他支援的品牌与频率, 上面没有不代表不能用, 而是代表你得赌, 赌他能不能开机, 赌对了像我一样用的飞起, 赌错了, 荷包又要失血了。

                        GPU0.png

                        这是我们现在的伺服器工作状态, 基本上就是这样常开着。

                        1. CPU, 会比较建议用Intel, 但买最便宜的就好了但一定要有内显, 不要让我们尊贵不凡的GPU去承担任何一点萤幕显示的效能, 再者我们这么多的工作很少看到CPU吃满, 另外主要是因为主机板的关系, 因为大多时候要真的能够支援DDR5 4条 64G的状况, 支援Intel的主机板, 胜率会比较高, AMD的主机板胜率比较低一些, 但这很看脸, 看运气, 看你平常有没有扶老奶奶过马路积阴德。

                        最后要说, 抡捶者版主给的资讯都很正确, 一路从Intel是拉基, 到2080Ti魔改卡, 到V100 32G, 到最后Pro6000原地直接飞起, 我们一路上都是花了真金白银, 真的就是你想省硬件, 那你折腾环境, 你不想折腾环境, 那你就得花硬件。

                        用上两张Pro6000的时候, 我们的感觉好像世界重新打开一样, 不管什么工作流什么GGUF, 再也不用烦恼环境问题, 硬体不足的问题, 真的非常快乐, 如果你也是一个有一些预算, 正在犹豫要pro5000. 4090 48G. 5090 32G的朋友, 请再多想想, 未来两三年如果硬体不够用带来的烦恼与后悔, 现在加一点点预算直上pro6000, 两年后的自己一定会感谢现在的自己。

                        最后感谢版主抡捶者, 带领我进入AI的领域, 让当初的我从I卡的拉圾堆, 勇敢地爬了出来。真诚的感恩。

                        L 在线
                        L 在线
                        laobenxiong
                        编写于 最后由 编辑
                        #80

                        @b9704037 有一个问题请教下: 在某一个 VRAM 尺寸限制下, 是选用参数量大的模型, 还是选用量化精度高的模型, 效果更好? 其实我的问题就是, 你的配置有足够的 vram, 为什么还停留在 27B 的模型? 谢谢

                        5 B 2 条回复 最后回复
                        0
                        • L laobenxiong

                          @b9704037 有一个问题请教下: 在某一个 VRAM 尺寸限制下, 是选用参数量大的模型, 还是选用量化精度高的模型, 效果更好? 其实我的问题就是, 你的配置有足够的 vram, 为什么还停留在 27B 的模型? 谢谢

                          5 离线
                          5 离线
                          566656661
                          编写于 最后由 566656661 编辑
                          #81

                          @laobenxiong

                          沒有固定準則吧, 不過通常以量化過的大模型為主

                          舉個同系列的模型例子, Qwen 3有8B跟32B的模型, 假設VRAM能放得下, 8B原形BF16大約16GB權重, 32B的Q4 IQ4_XS GGUF大約17GB權重, 然而32B對比8B來說這個性能8B是怎麼都跟不上的

                          不過之前問好像有跑Qwen3.5 122B A10B

                          L 1 条回复 最后回复
                          0
                          • Yu NickolasY 离线
                            Yu NickolasY 离线
                            Yu Nickolas
                            编写于 最后由 编辑
                            #82

                            CPU这么不重要吗?都不值得提一下名字,intel哭晕在厕所

                            CS6C 1 条回复 最后回复
                            0
                            • Yu NickolasY Yu Nickolas

                              CPU这么不重要吗?都不值得提一下名字,intel哭晕在厕所

                              CS6C 在线
                              CS6C 在线
                              CS6
                              编写于 最后由 编辑
                              #83

                              @Yu-Nickolas 他沒有常駐服務CPU 不要太爛就沒差吧,頂多編譯/解碼久一點,但我猜老哥是攻頂了

                              1 条回复 最后回复
                              0
                              • 5 566656661

                                @laobenxiong

                                沒有固定準則吧, 不過通常以量化過的大模型為主

                                舉個同系列的模型例子, Qwen 3有8B跟32B的模型, 假設VRAM能放得下, 8B原形BF16大約16GB權重, 32B的Q4 IQ4_XS GGUF大約17GB權重, 然而32B對比8B來說這個性能8B是怎麼都跟不上的

                                不過之前問好像有跑Qwen3.5 122B A10B

                                L 在线
                                L 在线
                                laobenxiong
                                编写于 最后由 编辑
                                #84

                                @566656661 问了下 whichllm, 它也推荐 qwen3.6-27b, 这个模型真能打呀f0be4eec-bf18-4921-af94-ab32c043232f-image.jpeg

                                1 条回复 最后回复
                                1
                                • CS6C 在线
                                  CS6C 在线
                                  CS6
                                  编写于 最后由 CS6 编辑
                                  #85

                                  我發現日本平台還有一張可以便宜的 NVIDIA RTX PRO 6000 Blackwell 96G ....35萬台幣
                                  可惜我湊不出錢,分享給各位勇者
                                  https://item.fril.jp/15eb5fb9b4137fe548d109e021d93eb6?_gl=1*1ria98d*Rakuma_gcl_au*MTM4MTc2MzQxNC4xNzgxMDAzODYx*_gcl_au*MTgzMjk3ODI3My4xNzgxMDAzODYx*_ga*OTcyNzI1MTI3LjE3ODEwMDM4NjA.*_ga_7KV9PBS698*czE3ODEwMDM4NjAkbzEkZzEkdDE3ODEwMDM4NzkkajQxJGwwJGgw

                                  terryT Q mariaQ B 3 条回复 最后回复
                                  0
                                  • CS6C CS6

                                    我發現日本平台還有一張可以便宜的 NVIDIA RTX PRO 6000 Blackwell 96G ....35萬台幣
                                    可惜我湊不出錢,分享給各位勇者
                                    https://item.fril.jp/15eb5fb9b4137fe548d109e021d93eb6?_gl=1*1ria98d*Rakuma_gcl_au*MTM4MTc2MzQxNC4xNzgxMDAzODYx*_gcl_au*MTgzMjk3ODI3My4xNzgxMDAzODYx*_ga*OTcyNzI1MTI3LjE3ODEwMDM4NjA.*_ga_7KV9PBS698*czE3ODEwMDM4NjAkbzEkZzEkdDE3ODEwMDM4NzkkajQxJGwwJGgw

                                    terryT 离线
                                    terryT 离线
                                    terry
                                    超级版主
                                    编写于 最后由 编辑
                                    #86

                                    @CS6 你也挺能折腾的,太君的网站你都找得到,问题是你买了怎么收货?支持vsia付款?

                                    油管:https://www.youtube.com/@抡锤者

                                    CS6C 1 条回复 最后回复
                                    0
                                    • terryT terry

                                      @CS6 你也挺能折腾的,太君的网站你都找得到,问题是你买了怎么收货?支持vsia付款?

                                      CS6C 在线
                                      CS6C 在线
                                      CS6
                                      编写于 最后由 CS6 编辑
                                      #87

                                      @terry vsia應該是可以的,至於我是在日商工作.....至於各位大神就靠三方集運或是直接飛一趟吧
                                      窮人只好撿漏了

                                      1 条回复 最后回复
                                      0
                                      • A 离线
                                        A 离线
                                        applejuice
                                        编写于 最后由 编辑
                                        #88

                                        重点有问题怎样搞

                                        1 条回复 最后回复
                                        0
                                        • 5 离线
                                          5 离线
                                          566656661
                                          编写于 最后由 编辑
                                          #89

                                          保養估計得要自己飛去日本了吧

                                          1 条回复 最后回复
                                          0

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组