跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 技嘉Z890主板 256G DDR5内存 两张Pro6000 96G 跑cpp Qwen3.6 27B BF16与同时双ComfyUI工作流长视频之运行

技嘉Z890主板 256G DDR5内存 两张Pro6000 96G 跑cpp Qwen3.6 27B BF16与同时双ComfyUI工作流长视频之运行

已定时 置顶直到 2026/6/14 15:41 已锁定 已移动 AI硬件
103 帖子 16 发布者 481 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • CS6C CS6

    @b9704037 你花更多的錢買了貴的硬件,才有機會去折騰更複雜的環境 應該說在商用的情境下,專業版的硬體設備有沒有經過優化的軟體架構會差滿多,如果你使用Win的話會建議你安裝 LTS版或者是IOT嵌入式的版本,至少不太會遇到更新爆開的問題,不過驅動上預載會變少需要手動安裝,

    B 离线
    B 离线
    b9704037
    编写于 最后由 编辑
    #58

    @terry 我覺得可以說說內存的事情, 看起來DDR4還是很好的選擇, 價錢比較合理一些, 插滿也沒有點不亮的問題, 頻率對於特大型的工作流也還算順利, 而且不會像DDR5插滿會有各種難度的事情, 一下點不開機, 開機後又看到降頻率, 也不會像DDR3跑到某些節點多拖時間的問題。

    terryT 1 条回复 最后回复
    1
    • B b9704037

      @terry 我覺得可以說說內存的事情, 看起來DDR4還是很好的選擇, 價錢比較合理一些, 插滿也沒有點不亮的問題, 頻率對於特大型的工作流也還算順利, 而且不會像DDR5插滿會有各種難度的事情, 一下點不開機, 開機後又看到降頻率, 也不會像DDR3跑到某些節點多拖時間的問題。

      terryT 离线
      terryT 离线
      terry
      超级版主
      编写于 最后由 编辑
      #59

      @b9704037 其实你认真排查下,你的脚本可能有问题,如果正常跑,你96G显存,除了载入模型,你不该用到内存的。即便是VAE用到,它也不吃内存带宽和频率,可能你有其它流程降级到了CPU。

      油管:https://www.youtube.com/@抡锤者

      B 1 条回复 最后回复
      0
      • CS6C CS6

        @b9704037 你花更多的錢買了貴的硬件,才有機會去折騰更複雜的環境 應該說在商用的情境下,專業版的硬體設備有沒有經過優化的軟體架構會差滿多,如果你使用Win的話會建議你安裝 LTS版或者是IOT嵌入式的版本,至少不太會遇到更新爆開的問題,不過驅動上預載會變少需要手動安裝,

        B 离线
        B 离线
        b9704037
        编写于 最后由 编辑
        #60

        @CS6 完全可以理解, 現在我們是公司三個人在用這個設備, 很偶爾才會有排隊的狀況, 我覺得使用率一旦變高, 就要開始折騰或是尋求專業的協助了

        terryT 1 条回复 最后回复
        0
        • B b9704037

          @CS6 完全可以理解, 現在我們是公司三個人在用這個設備, 很偶爾才會有排隊的狀況, 我覺得使用率一旦變高, 就要開始折騰或是尋求專業的協助了

          terryT 离线
          terryT 离线
          terry
          超级版主
          编写于 最后由 编辑
          #61

          @b9704037 你们可以把请求交给Hermes管理,让AI帮你们提交请求。自动队列就好了。这设备别说3个人,正常生产10个人也够了。

          油管:https://www.youtube.com/@抡锤者

          CS6C 1 条回复 最后回复
          0
          • terryT terry

            @b9704037 其实你认真排查下,你的脚本可能有问题,如果正常跑,你96G显存,除了载入模型,你不该用到内存的。即便是VAE用到,它也不吃内存带宽和频率,可能你有其它流程降级到了CPU。

            B 离线
            B 离线
            b9704037
            编写于 最后由 编辑
            #62

            @terry 你們正常跑ComfyUI的時候內存不會一直上下快速跳動嗎?

            terryT 1 条回复 最后回复
            0
            • terryT terry

              @b9704037 你们可以把请求交给Hermes管理,让AI帮你们提交请求。自动队列就好了。这设备别说3个人,正常生产10个人也够了。

              CS6C 在线
              CS6C 在线
              CS6
              编写于 最后由 编辑
              #63

              @terry Hermes管理前提是三個人的使用環境完全一致吧 🤔 ,我們是採用類 runpod 的模式讓用戶調用不同的 ComfyUI 工作流,才不會污染環境跟打架,再來是D I T工作流也要處理好,不然光是IO就會卡住

              1 条回复 最后回复
              0
              • B b9704037

                @terry 你們正常跑ComfyUI的時候內存不會一直上下快速跳動嗎?

                terryT 离线
                terryT 离线
                terry
                超级版主
                编写于 最后由 编辑
                #64

                @b9704037 会,但是波动很小,只有VAE阶段会大量调用内存,其它时候内存占用率一直是比较低的状态,4090 48G基本全流程都在显存里。xtx就会频繁切换,因为要卸载模型。Pro6000你设置GPU-Only参数看看,问下AI。

                油管:https://www.youtube.com/@抡锤者

                B 1 条回复 最后回复
                0
                • terryT terry

                  @b9704037 会,但是波动很小,只有VAE阶段会大量调用内存,其它时候内存占用率一直是比较低的状态,4090 48G基本全流程都在显存里。xtx就会频繁切换,因为要卸载模型。Pro6000你设置GPU-Only参数看看,问下AI。

                  B 离线
                  B 离线
                  b9704037
                  编写于 最后由 编辑
                  #65

                  @terry 好的 我這幾天花時間研究一下, 我研究完之後把心得貼上來, 哇, 我以為是我內存太差, 今天還花時間刷BIOS, 再上了DDR5 64G*4 花了14萬台幣, 虧爛了😲

                  CS6C terryT 2 条回复 最后回复
                  0
                  • B b9704037

                    @terry 好的 我這幾天花時間研究一下, 我研究完之後把心得貼上來, 哇, 我以為是我內存太差, 今天還花時間刷BIOS, 再上了DDR5 64G*4 花了14萬台幣, 虧爛了😲

                    CS6C 在线
                    CS6C 在线
                    CS6
                    编写于 最后由 编辑
                    #66

                    @b9704037 我真的覺得買 DDR5五超盤..... 當初要是買D4的話都可以上 TR5了,插好插滿

                    B 1 条回复 最后回复
                    0
                    • CS6C CS6

                      @b9704037 我真的覺得買 DDR5五超盤..... 當初要是買D4的話都可以上 TR5了,插好插滿

                      B 离线
                      B 离线
                      b9704037
                      编写于 最后由 编辑
                      #67

                      @CS6
                      我現在只能慶幸,我在五月底pro6000漲價前一刻買到 32萬的價錢, DDR5就只能當作出來混, 有一天終就要還的了😑

                      1 条回复 最后回复
                      0
                      • B b9704037

                        @terry 好的 我這幾天花時間研究一下, 我研究完之後把心得貼上來, 哇, 我以為是我內存太差, 今天還花時間刷BIOS, 再上了DDR5 64G*4 花了14萬台幣, 虧爛了😲

                        terryT 离线
                        terryT 离线
                        terry
                        超级版主
                        编写于 最后由 编辑
                        #68

                        @b9704037 DDR5不会亏的,256G搭配一个5070之类的跑DeepSeek V4 Flash。

                        油管:https://www.youtube.com/@抡锤者

                        1 条回复 最后回复
                        0
                        • kos orK 在线
                          kos orK 在线
                          kos or
                          编写于 最后由 kos or 编辑
                          #69

                          电源:EVGA 1000W GT 就能推動這麼強的AI威力, 真是個寶貝呀~

                          B 1 条回复 最后回复
                          0
                          • B b9704037

                            大大覺得沒用沒有參考價值要刪掉就刪掉吧, 反正我是自己把我一路從I卡A770 X79 X99這些東西拼拼湊湊起來的, 遇到的問題和瓶頸分享了

                            kos orK 在线
                            kos orK 在线
                            kos or
                            编写于 最后由 编辑
                            #70

                            @b9704037 说:

                            反正我是自己把我一路從I卡A770 X79 X99這些東西拼拼湊湊起來的, 遇到的問題和瓶頸分享了

                            這一路走來花了半年嗎?

                            1 条回复 最后回复
                            0
                            • B b9704037

                              @williamlouis
                              我一字一字把經歷打出來給你說雲, 我不懂什麼太深奧的東西, 我就一個凡人, 踩過的坑就這麼多, 避免有人踩坑, 分享一下我圖啥了, 發帖能賺錢? 我不知道你權限多高, 你覺得我這帖沒有用, 能刪了你就刪了吧, 反正我可能就發這一次貼文而已。

                              證明我不是嘴巴說說, 我把我買過的東西都貼出來
                              S__61808717.jpg S__61661192_0.jpg V1007.jpg

                              韦 离线
                              韦 离线
                              韦春花
                              编写于 最后由 编辑
                              #71

                              @b9704037 为什么俺键盘上满是口水🤤 🤤 🤤

                              1 条回复 最后回复
                              0
                              • terryT terry

                                @CS6 我上哪里去买这么贵的卡,不是有人在测试了吗?我暂时就4090 48G能用好,就足够赚钱了。

                                kos orK 在线
                                kos orK 在线
                                kos or
                                编写于 最后由 编辑
                                #72

                                @terry 说:

                                暂时就4090 48G能用好,就足够赚钱了。

                                哈哈 對呀 賺錢第一

                                1 条回复 最后回复
                                0
                                • 韦 离线
                                  韦 离线
                                  韦春花
                                  编写于 最后由 编辑
                                  #73

                                  80G内存占用 2026-06-09 011400.png
                                  不管VRAM转移到RAM、缓存模型复用都会用到大内存,比VRAM那价格感觉赚飞了。俺是怕4个槽插满问题多才只买了2根,可惜了两根才3400软妹币

                                  1 条回复 最后回复
                                  0
                                  • 九龙杨生九 在线
                                    九龙杨生九 在线
                                    九龙杨生
                                    编写于 最后由 编辑
                                    #74

                                    1、上BF16精度是不是太奢侈了一点啊,一般情况用不到那么高的精度吧;
                                    2、如果用FP8精度单张卡应该就能满足大部分要求吧,当然富哥无敌!
                                    3、我实际大概测试了一下,max-q版本性能应该不止低20%;我是用600W版本限制功耗到300W尝试了一下;

                                    1 条回复 最后回复
                                    0
                                    • 5 离线
                                      5 离线
                                      566656661
                                      编写于 最后由 编辑
                                      #75

                                      還真是貧窮限制了我的想像

                                      如果能優化跟用NVFP4估計能跑Qwen 3.5 122B A10B 或者Coder Next了吧

                                      1 条回复 最后回复
                                      0
                                      • kos orK kos or

                                        电源:EVGA 1000W GT 就能推動這麼強的AI威力, 真是個寶貝呀~

                                        B 离线
                                        B 离线
                                        b9704037
                                        编写于 最后由 编辑
                                        #76

                                        @kos-or 是的, 是蝦皮購買二手的母豬礦電, 只要2100, 但品質很好, 重量很沉
                                        我們從2月開始接觸與摸索, 差不多確實快要半年了。

                                        @韦春花 好羨慕3400元真的好平價, 真的太值得了 現在一條要價6500R😢

                                        @九龙杨生 我們使用ComfyUI大概會跑50-60GB, 單張剩下40GB, 我們想說盡量地去用乾淨, 所以選擇了BF16沒有選擇FP8, 主要是600W的硬體架構與散熱, 我們還要重新買power和換機殼, 想著他太吃電了, 就沒有選擇600W

                                        @566656661 我們有試過A10B和35B A3B, 但是不知道為什麼算力都沒有辦法一下子開頭跑滿全力運算, 總是卡卡的, 後來還是用了27B稠密, 我們的感覺是A10B A3B像省油日本車, 27B稠密像是一台油門全開的跑車。

                                        5 1 条回复 最后回复
                                        0
                                        • B b9704037

                                          @kos-or 是的, 是蝦皮購買二手的母豬礦電, 只要2100, 但品質很好, 重量很沉
                                          我們從2月開始接觸與摸索, 差不多確實快要半年了。

                                          @韦春花 好羨慕3400元真的好平價, 真的太值得了 現在一條要價6500R😢

                                          @九龙杨生 我們使用ComfyUI大概會跑50-60GB, 單張剩下40GB, 我們想說盡量地去用乾淨, 所以選擇了BF16沒有選擇FP8, 主要是600W的硬體架構與散熱, 我們還要重新買power和換機殼, 想著他太吃電了, 就沒有選擇600W

                                          @566656661 我們有試過A10B和35B A3B, 但是不知道為什麼算力都沒有辦法一下子開頭跑滿全力運算, 總是卡卡的, 後來還是用了27B稠密, 我們的感覺是A10B A3B像省油日本車, 27B稠密像是一台油門全開的跑車。

                                          5 离线
                                          5 离线
                                          566656661
                                          编写于 最后由 编辑
                                          #77

                                          @b9704037

                                          畢竟MoE就是10B Activation, 我自己是理解成一大群的10B模型的集合體, Dense就27B全部一起上, 27B打贏10B就不太意外了

                                          Deepseek v4 pro自己就是1600B A49B 這個MoE比常用的開源模型還要大啊

                                          1 条回复 最后回复
                                          0

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组