跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 对 M5 MAX 跑本地大模型有点失望

对 M5 MAX 跑本地大模型有点失望

已定时 已固定 已锁定 已移动 AI硬件
35 帖子 8 发布者 136 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT 离线
    terryT 离线
    terry
    编写于 最后由 编辑
    #2

    你3090本地跑Qwen3.6 27b就好了,122b只是知识面更广,涉及到这个用在线,跑hermes还是27b强,这有什么犹豫的。Pro6000 是用来跑多会话的,速度吊打3090,快几个级别,跑ComfyUI更是吊起来锤。不是一个级别的,不要拿普桑和法拉利比。

    油管:https://www.youtube.com/@抡锤者

    1 条回复 最后回复
    0
    • J johnnybegood

      最近网上看了很多 M5 MAX 跑模型的评测和视频, 虽然可以有很大的统一内存来装模型, 但是模型大了之后, 性能下降很多, 基本是 5-10个t/s , 没法用的状态, 如Qwen 122b a10b 也就是勉强在 20-25t/s 刚刚可用的状态, 如果上百GB的 deepseek 装上去, 真的就几个tokens/s , 没法用的状态。

      我自己的 3090 24G+ 64G内存卸载 122b a10b Q4也能跑到 15-20t/s ,感觉上差的不多。

      之前还想卖肾搞一套4-5万的 M5 MAX, 但是现在很犹豫了, 感觉没什么用。再说一下 6000pro , 96G显存, 122B a10b Q4量化文件本身也 70多G了,勉强放下, 如果是再大一些的模型, 6000pro一样也放不下, 跟 3090 24G+ 64G内存 也没有质的区别(从模型size来说), 所以感觉消费级硬件真的没什么太好的选择, 至于几台机器一起张量并行的评测也看了, 觉得也是一般般。

      ps. 以上不考虑实用、量产,只是考虑本地可跑的模型规模、速度。不对之处请指教。

      Tony WangT 离线
      Tony WangT 离线
      Tony Wang
      编写于 最后由 Tony Wang 编辑
      #3

      @johnnybegood

      M5 Max 跑 Qwen 122b a10b Q4 的话, 如果内存够, 不大可能只有 20-25t/s.

      我的M5 pro 跑 Qwen 27b 稠密加上MTP之后, 还能跑到20以上, 64k上下文时候掉到 17多.

      按这个速度推理, M5 max 是我显存带宽的两倍, 它能到 40t/s 以上.

      122b A10b 肯定比27b 稠密要快, 应该能跑到 60t/s以上, 我估计.

      另外, 122A10 的智力应该不如 27b 稠密, 只是知识面更宽.

      J 1 条回复 最后回复
      0
      • Tony WangT Tony Wang

        @johnnybegood

        M5 Max 跑 Qwen 122b a10b Q4 的话, 如果内存够, 不大可能只有 20-25t/s.

        我的M5 pro 跑 Qwen 27b 稠密加上MTP之后, 还能跑到20以上, 64k上下文时候掉到 17多.

        按这个速度推理, M5 max 是我显存带宽的两倍, 它能到 40t/s 以上.

        122b A10b 肯定比27b 稠密要快, 应该能跑到 60t/s以上, 我估计.

        另外, 122A10 的智力应该不如 27b 稠密, 只是知识面更宽.

        J 离线
        J 离线
        johnnybegood
        编写于 最后由 johnnybegood 编辑
        #4

        @Tony-Wang 对的, 我的实际工作场景主要需要知识面, 智力其次。 所以27b对我反而没那么好用。 另外我看了很多M4 M5 跑大模型的评测, 我觉得不是单纯靠 x2 这样去算的, 当模型规模大, 上下文变长后, 速度增长不是线性的。我可以非常确定(因为昨天刚看一个, 当M5 pro能跑 17t/s 的时候, M5 MAX只有 25t/s), 另外, 122B 现在好像没有MTP,这也是区别之一吧。

        我的 3090 24G 跑 27b 稠密加上 MTP都可以到 60t/s (在 ubuntu下 llama.cpp) , 那就是 M5 pro跟 3090 差了两倍多, 这个也是让我觉得苹果不太行。

        Tony WangT 1 条回复 最后回复
        0
        • kop wangK 离线
          kop wangK 离线
          kop wang
          编写于 最后由 编辑
          #5

          mac跑LLM,只是锦上添花。你要换一个角度来看。

          之前从来没有一个移动设备可以离电运行二线能力的LLM,且还能让prefill性能保持在一个堪用的级别。M5 MAX系列做到了。

          反之,如果你是“为了跑LLM买设备”,买mac就亏大了。

          虚心交流,一起进步

          1 条回复 最后回复
          0
          • J johnnybegood

            @Tony-Wang 对的, 我的实际工作场景主要需要知识面, 智力其次。 所以27b对我反而没那么好用。 另外我看了很多M4 M5 跑大模型的评测, 我觉得不是单纯靠 x2 这样去算的, 当模型规模大, 上下文变长后, 速度增长不是线性的。我可以非常确定(因为昨天刚看一个, 当M5 pro能跑 17t/s 的时候, M5 MAX只有 25t/s), 另外, 122B 现在好像没有MTP,这也是区别之一吧。

            我的 3090 24G 跑 27b 稠密加上 MTP都可以到 60t/s (在 ubuntu下 llama.cpp) , 那就是 M5 pro跟 3090 差了两倍多, 这个也是让我觉得苹果不太行。

            Tony WangT 离线
            Tony WangT 离线
            Tony Wang
            编写于 最后由 编辑
            #6

            @johnnybegood

            要用支持MLX的框架, MOE 模型现在做MTP不成熟, 主要是 MTP 很难和 专家路由对齐. 命中率会很低, 这个可能将来会有改善.

            上下文确实会严重拖慢速度. 不过也不应该拖慢那么多.

            我 35A3, 短上下文能到 接近 90, 64k之后, 大概稳定在 50以上.

            J 1 条回复 最后回复
            0
            • CS6C 离线
              CS6C 离线
              CS6
              编写于 最后由 编辑
              #7

              我工作上是 Pro6000 *8 的方案,只能說如果公司有錢就買一櫃沒啥煩惱,GPT-OSS-120B 沒壓力,但訓練上大家還是覺得不夠用,這本來就不是給我們這些窮人單卡作業的需求... ,8 張能落地跑很多情境,但絕大多數同事還是用 chatGPT 比較快,mac跑LLM,只是幫你搞定重複性高又不好寫程式自動化的小流程
              (只是分享 不建議購入,光是配套設施就很貴,沒事別玩機架式

              J 1 条回复 最后回复
              0
              • Tony WangT Tony Wang

                @johnnybegood

                要用支持MLX的框架, MOE 模型现在做MTP不成熟, 主要是 MTP 很难和 专家路由对齐. 命中率会很低, 这个可能将来会有改善.

                上下文确实会严重拖慢速度. 不过也不应该拖慢那么多.

                我 35A3, 短上下文能到 接近 90, 64k之后, 大概稳定在 50以上.

                J 离线
                J 离线
                johnnybegood
                编写于 最后由 johnnybegood 编辑
                #8

                @Tony-Wang 了解了, 谢谢, 3090 35a3b 可以到 135t/s , 128k上下文跑起来后 90-100

                1 条回复 最后回复
                0
                • CS6C CS6

                  我工作上是 Pro6000 *8 的方案,只能說如果公司有錢就買一櫃沒啥煩惱,GPT-OSS-120B 沒壓力,但訓練上大家還是覺得不夠用,這本來就不是給我們這些窮人單卡作業的需求... ,8 張能落地跑很多情境,但絕大多數同事還是用 chatGPT 比較快,mac跑LLM,只是幫你搞定重複性高又不好寫程式自動化的小流程
                  (只是分享 不建議購入,光是配套設施就很貴,沒事別玩機架式

                  J 离线
                  J 离线
                  johnnybegood
                  编写于 最后由 编辑
                  #9

                  @CS6 首先你家得有一套带地下室的别墅😊

                  1 条回复 最后回复
                  0
                  • Tony WangT 离线
                    Tony WangT 离线
                    Tony Wang
                    编写于 最后由 编辑
                    #10

                    嗯, Mac 肯定是不能打, M5 Max 以上, 我估计LLM凑合, ComfyUI就更差.

                    所以我也是打算再配置一台 N卡的机器.

                    rolex loR 1 条回复 最后回复
                    0
                    • CS6C 离线
                      CS6C 离线
                      CS6
                      编写于 最后由 编辑
                      #11

                      @tony-wang N卡除了 5090 / pro 6000 外還有窮人選擇嗎?

                      1 条回复 最后回复
                      0
                      • Tony WangT 离线
                        Tony WangT 离线
                        Tony Wang
                        编写于 最后由 Tony Wang 编辑
                        #12

                        我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                        对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                        CS6C kop wangK 2 条回复 最后回复
                        0
                        • Tony WangT Tony Wang

                          我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                          对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                          CS6C 离线
                          CS6C 离线
                          CS6
                          编写于 最后由 编辑
                          #13

                          @Tony-Wang 台幣 $245,000 這價格也是很難回本 😰
                          要捏一下薪水

                          1 条回复 最后回复
                          0
                          • Tony WangT 离线
                            Tony WangT 离线
                            Tony Wang
                            编写于 最后由 编辑
                            #14

                            没办法啊, 看中了它的48G. 如果是32G, 还有A卡可选, R9700性价比最高.

                            京东上 5090 的32G, 价格比我这个还高 😞 , 你们台湾还能有满血保修, 我们这边啥都没有.

                            1 条回复 最后回复
                            0
                            • Tony WangT Tony Wang

                              我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                              对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                              kop wangK 离线
                              kop wangK 离线
                              kop wang
                              编写于 最后由 编辑
                              #15

                              @Tony-Wang 巧了,今天京东自营刚刚到货,准备过两天发帖

                              虚心交流,一起进步

                              Tony WangT 1 条回复 最后回复
                              0
                              • kop wangK kop wang

                                @Tony-Wang 巧了,今天京东自营刚刚到货,准备过两天发帖

                                Tony WangT 离线
                                Tony WangT 离线
                                Tony Wang
                                编写于 最后由 编辑
                                #16

                                @kop-wang

                                丽台的么?

                                kop wangK 1 条回复 最后回复
                                0
                                • Tony WangT Tony Wang

                                  @kop-wang

                                  丽台的么?

                                  kop wangK 离线
                                  kop wangK 离线
                                  kop wang
                                  编写于 最后由 kop wang 编辑
                                  #17

                                  @Tony-Wang nv工包的,京东有两款,差价10元,买的38804的那款。

                                  虚心交流,一起进步

                                  Tony WangT 1 条回复 最后回复
                                  0
                                  • kop wangK kop wang

                                    @Tony-Wang nv工包的,京东有两款,差价10元,买的38804的那款。

                                    Tony WangT 离线
                                    Tony WangT 离线
                                    Tony Wang
                                    编写于 最后由 编辑
                                    #18

                                    @kop-wang

                                    期待分享, 我买的丽台的, 38999. 不过我要7月初才能回国装机.

                                    kop wangK 1 条回复 最后回复
                                    0
                                    • Tony WangT Tony Wang

                                      @kop-wang

                                      期待分享, 我买的丽台的, 38999. 不过我要7月初才能回国装机.

                                      kop wangK 离线
                                      kop wangK 离线
                                      kop wang
                                      编写于 最后由 编辑
                                      #19

                                      @Tony-Wang 京东plus会员优惠接近200,如果不急退了冲个会员再买。

                                      虚心交流,一起进步

                                      1 条回复 最后回复
                                      0
                                      • Tony WangT 离线
                                        Tony WangT 离线
                                        Tony Wang
                                        编写于 最后由 编辑
                                        #20

                                        来不及了, 已经下过单了 😞

                                        1 条回复 最后回复
                                        0
                                        • 5 在线
                                          5 在线
                                          566656661
                                          编写于 最后由 编辑
                                          #21

                                          現在就是迷你電腦配上RTX Pro 4500

                                          Tony WangT 1 条回复 最后回复
                                          1

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组