跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. 随便聊聊
  3. 關於GB10跟N1X

關於GB10跟N1X

已定时 已固定 已锁定 已移动 随便聊聊
19 帖子 6 发布者 82 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT 离线
    terryT 离线
    terry
    超级版主
    编写于 最后由 terry 编辑
    #4

    1,主机配置没什么问题,不需要升级,RTX Pro6000用来生图做视频都无敌。单张就足够豪华了,再买也是空置。小主机就更不用买了,就用好这一张卡,就是最好的方案。
    2,如果没有什么特别机密的,比如反攻大陆的档案,可以使用DeepSeek V4 Flash驱动Hermes,费用很小,体验会好很多。使用电报沟通也很流畅,比GPT更快。它的智能水平我也测试过很多次。Qwen3.5 122B知识面不错,但是它跑Hermes的话很蠢,完全不如3.6 27b。
    3,你可以买一个Mac mini或者如果有退役的笔记本,16G内存以上的,专门用来跑Hermes效果会更好。我的M1 16G跑起来的体验不错,32G内存+11800H处理器的笔记本,Ubuntu24.04系统,可以同时跑好几个Hermes,体验流畅,也相当稳定。
    4,可以补充一些真实图片,增加吸引力,不然你帖子太长了,一般人看不下去,我看的头疼。

    油管:https://www.youtube.com/@抡锤者

    怪物怪 1 条回复 最后回复
    2
    • williamlouisW williamlouis

      欢迎新人。我真全文阅读了。您想问点什么?升级建议。我是这么理解的。
      但是你现在不是跑的很顺畅了吗?升级要做点什么新项目?

      怪物怪 离线
      怪物怪 离线
      怪物
      编写于 最后由 编辑
      #5

      @williamlouis 因為122b的模型在使用上,只要操作電腦的時候遇到幾個比較複雜的問題,常常會突然罷工,就是跟我說:我接下來要如何如何,但過了幾小時依然沒反應,我也不確定是不是模型的問題,只是想說能升級就升級看看,謝謝

      1 条回复 最后回复
      0
      • terryT terry

        1,主机配置没什么问题,不需要升级,RTX Pro6000用来生图做视频都无敌。单张就足够豪华了,再买也是空置。小主机就更不用买了,就用好这一张卡,就是最好的方案。
        2,如果没有什么特别机密的,比如反攻大陆的档案,可以使用DeepSeek V4 Flash驱动Hermes,费用很小,体验会好很多。使用电报沟通也很流畅,比GPT更快。它的智能水平我也测试过很多次。Qwen3.5 122B知识面不错,但是它跑Hermes的话很蠢,完全不如3.6 27b。
        3,你可以买一个Mac mini或者如果有退役的笔记本,16G内存以上的,专门用来跑Hermes效果会更好。我的M1 16G跑起来的体验不错,32G内存+11800H处理器的笔记本,Ubuntu24.04系统,可以同时跑好几个Hermes,体验流畅,也相当稳定。
        4,可以补充一些真实图片,增加吸引力,不然你帖子太长了,一般人看不下去,我看的头疼。

        怪物怪 离线
        怪物怪 离线
        怪物
        编写于 最后由 编辑
        #6

        @terry 好的,謝謝您的建議,那我就不急著買了,等新的硬體出來再評估看看,122b的模型在hermes上面就是常常罷工,所以我才想升級,我的雲端版的hermes用的是kimi2.6,不過平常不太使用雲端版,改天再來試試您說的D...F,謝謝

        1 条回复 最后回复
        0
        • CHIA AN YANGC CHIA AN YANG

          個人直覺建議,有預算直接多一張rtx pro 6000 96g 我也是台灣小白 哈,台灣硬件真的貴得離譜..

          怪物怪 离线
          怪物怪 离线
          怪物
          编写于 最后由 编辑
          #7

          @CHIA-AN-YANG 您好,我覺得多一張96G顯卡,應該是目前環境下最順的,可是192G顯存跑不了375b的模型,我也不知道375b有沒有真的比較好,謝謝

          terryT CHIA AN YANGC 2 条回复 最后回复
          0
          • 5 在线
            5 在线
            566656661
            超凡大师
            编写于 最后由 编辑
            #8

            N1X基本上就是DGX Spark拔掉ConnectX-7網卡, 而ConnectX-7也是被很多人詬病說發熱嚴重 (畢竟就是伺服器裏拔出來的)

            DGX Spark本身就只是個實驗品, 給大學實驗室或者小團隊決定是否要用DGX H100伺服器, 然而Spark的強悍之處也就是用這個網卡聯接多部DGX Spark做成一個Cluster, 用Token速度換取大統一內存容量

            如果質疑自己是否需要DGX Spark的話, 那百份之九十以上是不需要

            更大參數的模型基本知識量會更多, 不過現在很多大參數的模型都在用MoE了, Deepseek自己也是Activation 49B

            怪物怪 1 条回复 最后回复
            2
            • kop wangK 离线
              kop wangK 离线
              kop wang
              超级版主
              编写于 最后由 kop wang 编辑
              #9

              通读了全文,很尴尬的一点是,从模型能力的角度考虑,目前并没有150~190GB能够吊打qwen3.6-27B的开源模型。

              目前而言,老的大体量模型体现的也只有知识容量的优势。Agent能力、注意力分配以及ToolCall能力在开源领域要么就是新的超大模型,要么就是qwen3.6-27B这类新的小模型。
              因为中等体量模型很长时间都没有更新过了。他们的后训练和能力对齐普遍跟不上时代需要。

              目前的中体量模型很像一个老教授。有知识,有认知,但是不会用手机,不会打字。

              所以如果是我,我就不会推荐楼主去购入新设备。边际收益递减的太过明显。无论是GB10 x2,还是RTX PRO 6000 x2,都没有明显超越PRO 6000 x1的场景出现。

              虚心交流,一起进步

              怪物怪 1 条回复 最后回复
              4
              • 怪物怪 怪物

                @CHIA-AN-YANG 您好,我覺得多一張96G顯卡,應該是目前環境下最順的,可是192G顯存跑不了375b的模型,我也不知道375b有沒有真的比較好,謝謝

                terryT 离线
                terryT 离线
                terry
                超级版主
                编写于 最后由 编辑
                #10

                @怪物 395b对于你跑Agent也不会更好,本地模型不会比在线的更好,无论你部署多大的。长期用建议你切换到DeepSeek,你说的这些模型我都用过。你要明白Agent需要的能力是大模型的一个很小的训练区域,但是很重要,在这个领域27b稠密模型有天然的推理效率优势,它只是很耗资源而已。如果你一定要全部本地,那么再买一个Pro6000确实很好,因为它确实很牛逼。

                油管:https://www.youtube.com/@抡锤者

                怪物怪 2 条回复 最后回复
                3
                • 5 566656661

                  N1X基本上就是DGX Spark拔掉ConnectX-7網卡, 而ConnectX-7也是被很多人詬病說發熱嚴重 (畢竟就是伺服器裏拔出來的)

                  DGX Spark本身就只是個實驗品, 給大學實驗室或者小團隊決定是否要用DGX H100伺服器, 然而Spark的強悍之處也就是用這個網卡聯接多部DGX Spark做成一個Cluster, 用Token速度換取大統一內存容量

                  如果質疑自己是否需要DGX Spark的話, 那百份之九十以上是不需要

                  更大參數的模型基本知識量會更多, 不過現在很多大參數的模型都在用MoE了, Deepseek自己也是Activation 49B

                  怪物怪 离线
                  怪物怪 离线
                  怪物
                  编写于 最后由 编辑
                  #11

                  @566656661 感謝您的分析,我想用更大的模型也不是為了多少能力,只是希望在hermes底下運作時不要常罷工,謝謝

                  5 1 条回复 最后回复
                  0
                  • kop wangK kop wang

                    通读了全文,很尴尬的一点是,从模型能力的角度考虑,目前并没有150~190GB能够吊打qwen3.6-27B的开源模型。

                    目前而言,老的大体量模型体现的也只有知识容量的优势。Agent能力、注意力分配以及ToolCall能力在开源领域要么就是新的超大模型,要么就是qwen3.6-27B这类新的小模型。
                    因为中等体量模型很长时间都没有更新过了。他们的后训练和能力对齐普遍跟不上时代需要。

                    目前的中体量模型很像一个老教授。有知识,有认知,但是不会用手机,不会打字。

                    所以如果是我,我就不会推荐楼主去购入新设备。边际收益递减的太过明显。无论是GB10 x2,还是RTX PRO 6000 x2,都没有明显超越PRO 6000 x1的场景出现。

                    怪物怪 离线
                    怪物怪 离线
                    怪物
                    编写于 最后由 编辑
                    #12

                    @kop-wang 感謝您的分析,我沒用過qwen27b的模型,但是我裝過qeen3.5:35b fp16的無審查模型,在hermes底下,分析限制級圖片的結果比122b模型還簡陋很多,也更容易罷工,我是以為35b的應該會比27b的強(是嗎?),但是很多人都推薦千問27b的模型,晚上我再來下載看看,請問您知道27b稠密無審查模型的完整名稱嗎?謝謝

                    kop wangK 1 条回复 最后回复
                    0
                    • terryT terry

                      @怪物 395b对于你跑Agent也不会更好,本地模型不会比在线的更好,无论你部署多大的。长期用建议你切换到DeepSeek,你说的这些模型我都用过。你要明白Agent需要的能力是大模型的一个很小的训练区域,但是很重要,在这个领域27b稠密模型有天然的推理效率优势,它只是很耗资源而已。如果你一定要全部本地,那么再买一个Pro6000确实很好,因为它确实很牛逼。

                      怪物怪 离线
                      怪物怪 离线
                      怪物
                      编写于 最后由 编辑
                      #13

                      @terry 好的,謝謝您的建議,我再來試試很多人推薦的27b模型,只是我不懂:稠密模型,是有特別的含義嗎?請問您知道有千問27b稠密無審查的模型嗎?有的話請問他的完整檔名是?我再用AI搜尋下載試試,謝謝

                      kop wangK terryT 2 条回复 最后回复
                      0
                      • 怪物怪 怪物

                        @kop-wang 感謝您的分析,我沒用過qwen27b的模型,但是我裝過qeen3.5:35b fp16的無審查模型,在hermes底下,分析限制級圖片的結果比122b模型還簡陋很多,也更容易罷工,我是以為35b的應該會比27b的強(是嗎?),但是很多人都推薦千問27b的模型,晚上我再來下載看看,請問您知道27b稠密無審查模型的完整名稱嗎?謝謝

                        kop wangK 离线
                        kop wangK 离线
                        kop wang
                        超级版主
                        编写于 最后由 编辑
                        #14

                        @怪物 楼主的错误可以理解,很多人人为模型的“体量”=“能力”。但实际上并不是如此。

                        体量只决定静态知识储备和统计学趋势(类似于一个人没手机,无工具情况下,自己的脑子里的知识总量和思维判断)。

                        能力就更为复杂一些。举个简单粗暴的例子,一个小学生+google,知识体量也一定赢过大学生自身脑容量,但是实际场景的问题解决,则不见得谁更强。

                        所以认知模型能力更相对客观的是看benchmark,也就是跑分。
                        我比较常用参考的跑分网站:https://benchlm.ai/llm-agent-benchmarks

                        我最推荐的Qwen3.6-27B非拒绝模型是https://huggingface.co/HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive

                        仅供参考。

                        虚心交流,一起进步

                        1 条回复 最后回复
                        2
                        • 怪物怪 怪物

                          @566656661 感謝您的分析,我想用更大的模型也不是為了多少能力,只是希望在hermes底下運作時不要常罷工,謝謝

                          5 在线
                          5 在线
                          566656661
                          超凡大师
                          编写于 最后由 566656661 编辑
                          #15

                          @怪物 说:

                          在hermes底下運作時不要常罷工,謝謝

                          我因為還沒有在Hermes上面遇到過罷工或者卡住的情況所以沒辦法給太多意見

                          OpenCode偶爾會卡住, 需要我踢一踢它

                          @怪物 说:

                          27b稠密無審查模型的完整名稱

                          我自己是在vLLM上用Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP, llama.cpp找一找帶有abliterated或者heretic字眼的模型就可以, 估計也有很多 (當然Uncensored也可以)

                          1 条回复 最后回复
                          0
                          • 怪物怪 怪物

                            @terry 好的,謝謝您的建議,我再來試試很多人推薦的27b模型,只是我不懂:稠密模型,是有特別的含義嗎?請問您知道有千問27b稠密無審查的模型嗎?有的話請問他的完整檔名是?我再用AI搜尋下載試試,謝謝

                            kop wangK 离线
                            kop wangK 离线
                            kop wang
                            超级版主
                            编写于 最后由 kop wang 编辑
                            #16

                            @怪物 稠密模型是相较于MoE模型来讲的。MoE是一个新技术,大知识总量,但是每次运行的时候只调用一部分参数,从而加快推理速度。

                            比如楼主说的Qwen3.6-35B-A3B,就是他的模型总知识量是35B参数,但每次运行,只会针对性使用3B参数来参与。

                            但是对于个人部署来讲,限制瓶颈普遍不在推理性能,而在内存总量,所以巨大的MoE模型对于个人部署价值非常有限。而小MoE模型,因为执行时参与运算的参数又过少,难免影响其注意力和推理能力。

                            虚心交流,一起进步

                            1 条回复 最后回复
                            0
                            • terryT terry

                              @怪物 395b对于你跑Agent也不会更好,本地模型不会比在线的更好,无论你部署多大的。长期用建议你切换到DeepSeek,你说的这些模型我都用过。你要明白Agent需要的能力是大模型的一个很小的训练区域,但是很重要,在这个领域27b稠密模型有天然的推理效率优势,它只是很耗资源而已。如果你一定要全部本地,那么再买一个Pro6000确实很好,因为它确实很牛逼。

                              怪物怪 离线
                              怪物怪 离线
                              怪物
                              编写于 最后由 编辑
                              #17

                              terry 好的,謝謝

                              1 条回复 最后回复
                              0
                              • 怪物怪 怪物

                                @terry 好的,謝謝您的建議,我再來試試很多人推薦的27b模型,只是我不懂:稠密模型,是有特別的含義嗎?請問您知道有千問27b稠密無審查的模型嗎?有的話請問他的完整檔名是?我再用AI搜尋下載試試,謝謝

                                terryT 离线
                                terryT 离线
                                terry
                                超级版主
                                编写于 最后由 编辑
                                #18

                                @怪物 如果要分析图片,还是大点的模型,122b这样的会更好,越大越好,理论上覆盖面更广,122b足够了。

                                油管:https://www.youtube.com/@抡锤者

                                1 条回复 最后回复
                                0
                                • 怪物怪 怪物

                                  @CHIA-AN-YANG 您好,我覺得多一張96G顯卡,應該是目前環境下最順的,可是192G顯存跑不了375b的模型,我也不知道375b有沒有真的比較好,謝謝

                                  CHIA AN YANGC 离线
                                  CHIA AN YANGC 离线
                                  CHIA AN YANG
                                  技术大牛 劳动模范
                                  编写于 最后由 编辑
                                  #19

                                  @怪物 如果兩張pro6000可以跑deepseek v4 flash 體驗應該是很不錯的,另外你把模型改用 qwen3.6 27b看看你會開心很多,我目前7900xtx 24g,單卡就玩的飛起了,讓cc or codex幫你把hermes你平常的工作流跑通寫成skill給hermes會好用很多的!!供你參考

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组