跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 对 M5 MAX 跑本地大模型有点失望

对 M5 MAX 跑本地大模型有点失望

已定时 已固定 已锁定 已移动 AI硬件
35 帖子 8 发布者 140 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • J 离线
    J 离线
    johnnybegood
    编写于 最后由 编辑
    #1

    最近网上看了很多 M5 MAX 跑模型的评测和视频, 虽然可以有很大的统一内存来装模型, 但是模型大了之后, 性能下降很多, 基本是 5-10个t/s , 没法用的状态, 如Qwen 122b a10b 也就是勉强在 20-25t/s 刚刚可用的状态, 如果上百GB的 deepseek 装上去, 真的就几个tokens/s , 没法用的状态。

    我自己的 3090 24G+ 64G内存卸载 122b a10b Q4也能跑到 15-20t/s ,感觉上差的不多。

    之前还想卖肾搞一套4-5万的 M5 MAX, 但是现在很犹豫了, 感觉没什么用。再说一下 6000pro , 96G显存, 122B a10b Q4量化文件本身也 70多G了,勉强放下, 如果是再大一些的模型, 6000pro一样也放不下, 跟 3090 24G+ 64G内存 也没有质的区别(从模型size来说), 所以感觉消费级硬件真的没什么太好的选择, 至于几台机器一起张量并行的评测也看了, 觉得也是一般般。

    ps. 以上不考虑实用、量产,只是考虑本地可跑的模型规模、速度。不对之处请指教。

    Tony WangT 1 条回复 最后回复
    0
    • terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #2

      你3090本地跑Qwen3.6 27b就好了,122b只是知识面更广,涉及到这个用在线,跑hermes还是27b强,这有什么犹豫的。Pro6000 是用来跑多会话的,速度吊打3090,快几个级别,跑ComfyUI更是吊起来锤。不是一个级别的,不要拿普桑和法拉利比。

      油管:https://www.youtube.com/@抡锤者

      1 条回复 最后回复
      0
      • J johnnybegood

        最近网上看了很多 M5 MAX 跑模型的评测和视频, 虽然可以有很大的统一内存来装模型, 但是模型大了之后, 性能下降很多, 基本是 5-10个t/s , 没法用的状态, 如Qwen 122b a10b 也就是勉强在 20-25t/s 刚刚可用的状态, 如果上百GB的 deepseek 装上去, 真的就几个tokens/s , 没法用的状态。

        我自己的 3090 24G+ 64G内存卸载 122b a10b Q4也能跑到 15-20t/s ,感觉上差的不多。

        之前还想卖肾搞一套4-5万的 M5 MAX, 但是现在很犹豫了, 感觉没什么用。再说一下 6000pro , 96G显存, 122B a10b Q4量化文件本身也 70多G了,勉强放下, 如果是再大一些的模型, 6000pro一样也放不下, 跟 3090 24G+ 64G内存 也没有质的区别(从模型size来说), 所以感觉消费级硬件真的没什么太好的选择, 至于几台机器一起张量并行的评测也看了, 觉得也是一般般。

        ps. 以上不考虑实用、量产,只是考虑本地可跑的模型规模、速度。不对之处请指教。

        Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        编写于 最后由 Tony Wang 编辑
        #3

        @johnnybegood

        M5 Max 跑 Qwen 122b a10b Q4 的话, 如果内存够, 不大可能只有 20-25t/s.

        我的M5 pro 跑 Qwen 27b 稠密加上MTP之后, 还能跑到20以上, 64k上下文时候掉到 17多.

        按这个速度推理, M5 max 是我显存带宽的两倍, 它能到 40t/s 以上.

        122b A10b 肯定比27b 稠密要快, 应该能跑到 60t/s以上, 我估计.

        另外, 122A10 的智力应该不如 27b 稠密, 只是知识面更宽.

        J 1 条回复 最后回复
        0
        • Tony WangT Tony Wang

          @johnnybegood

          M5 Max 跑 Qwen 122b a10b Q4 的话, 如果内存够, 不大可能只有 20-25t/s.

          我的M5 pro 跑 Qwen 27b 稠密加上MTP之后, 还能跑到20以上, 64k上下文时候掉到 17多.

          按这个速度推理, M5 max 是我显存带宽的两倍, 它能到 40t/s 以上.

          122b A10b 肯定比27b 稠密要快, 应该能跑到 60t/s以上, 我估计.

          另外, 122A10 的智力应该不如 27b 稠密, 只是知识面更宽.

          J 离线
          J 离线
          johnnybegood
          编写于 最后由 johnnybegood 编辑
          #4

          @Tony-Wang 对的, 我的实际工作场景主要需要知识面, 智力其次。 所以27b对我反而没那么好用。 另外我看了很多M4 M5 跑大模型的评测, 我觉得不是单纯靠 x2 这样去算的, 当模型规模大, 上下文变长后, 速度增长不是线性的。我可以非常确定(因为昨天刚看一个, 当M5 pro能跑 17t/s 的时候, M5 MAX只有 25t/s), 另外, 122B 现在好像没有MTP,这也是区别之一吧。

          我的 3090 24G 跑 27b 稠密加上 MTP都可以到 60t/s (在 ubuntu下 llama.cpp) , 那就是 M5 pro跟 3090 差了两倍多, 这个也是让我觉得苹果不太行。

          Tony WangT 1 条回复 最后回复
          0
          • kop wangK 离线
            kop wangK 离线
            kop wang
            编写于 最后由 编辑
            #5

            mac跑LLM,只是锦上添花。你要换一个角度来看。

            之前从来没有一个移动设备可以离电运行二线能力的LLM,且还能让prefill性能保持在一个堪用的级别。M5 MAX系列做到了。

            反之,如果你是“为了跑LLM买设备”,买mac就亏大了。

            虚心交流,一起进步

            1 条回复 最后回复
            0
            • J johnnybegood

              @Tony-Wang 对的, 我的实际工作场景主要需要知识面, 智力其次。 所以27b对我反而没那么好用。 另外我看了很多M4 M5 跑大模型的评测, 我觉得不是单纯靠 x2 这样去算的, 当模型规模大, 上下文变长后, 速度增长不是线性的。我可以非常确定(因为昨天刚看一个, 当M5 pro能跑 17t/s 的时候, M5 MAX只有 25t/s), 另外, 122B 现在好像没有MTP,这也是区别之一吧。

              我的 3090 24G 跑 27b 稠密加上 MTP都可以到 60t/s (在 ubuntu下 llama.cpp) , 那就是 M5 pro跟 3090 差了两倍多, 这个也是让我觉得苹果不太行。

              Tony WangT 离线
              Tony WangT 离线
              Tony Wang
              编写于 最后由 编辑
              #6

              @johnnybegood

              要用支持MLX的框架, MOE 模型现在做MTP不成熟, 主要是 MTP 很难和 专家路由对齐. 命中率会很低, 这个可能将来会有改善.

              上下文确实会严重拖慢速度. 不过也不应该拖慢那么多.

              我 35A3, 短上下文能到 接近 90, 64k之后, 大概稳定在 50以上.

              J 1 条回复 最后回复
              0
              • CS6C 离线
                CS6C 离线
                CS6
                编写于 最后由 编辑
                #7

                我工作上是 Pro6000 *8 的方案,只能說如果公司有錢就買一櫃沒啥煩惱,GPT-OSS-120B 沒壓力,但訓練上大家還是覺得不夠用,這本來就不是給我們這些窮人單卡作業的需求... ,8 張能落地跑很多情境,但絕大多數同事還是用 chatGPT 比較快,mac跑LLM,只是幫你搞定重複性高又不好寫程式自動化的小流程
                (只是分享 不建議購入,光是配套設施就很貴,沒事別玩機架式

                J 1 条回复 最后回复
                0
                • Tony WangT Tony Wang

                  @johnnybegood

                  要用支持MLX的框架, MOE 模型现在做MTP不成熟, 主要是 MTP 很难和 专家路由对齐. 命中率会很低, 这个可能将来会有改善.

                  上下文确实会严重拖慢速度. 不过也不应该拖慢那么多.

                  我 35A3, 短上下文能到 接近 90, 64k之后, 大概稳定在 50以上.

                  J 离线
                  J 离线
                  johnnybegood
                  编写于 最后由 johnnybegood 编辑
                  #8

                  @Tony-Wang 了解了, 谢谢, 3090 35a3b 可以到 135t/s , 128k上下文跑起来后 90-100

                  1 条回复 最后回复
                  0
                  • CS6C CS6

                    我工作上是 Pro6000 *8 的方案,只能說如果公司有錢就買一櫃沒啥煩惱,GPT-OSS-120B 沒壓力,但訓練上大家還是覺得不夠用,這本來就不是給我們這些窮人單卡作業的需求... ,8 張能落地跑很多情境,但絕大多數同事還是用 chatGPT 比較快,mac跑LLM,只是幫你搞定重複性高又不好寫程式自動化的小流程
                    (只是分享 不建議購入,光是配套設施就很貴,沒事別玩機架式

                    J 离线
                    J 离线
                    johnnybegood
                    编写于 最后由 编辑
                    #9

                    @CS6 首先你家得有一套带地下室的别墅😊

                    1 条回复 最后回复
                    0
                    • Tony WangT 离线
                      Tony WangT 离线
                      Tony Wang
                      编写于 最后由 编辑
                      #10

                      嗯, Mac 肯定是不能打, M5 Max 以上, 我估计LLM凑合, ComfyUI就更差.

                      所以我也是打算再配置一台 N卡的机器.

                      rolex loR 1 条回复 最后回复
                      0
                      • CS6C 离线
                        CS6C 离线
                        CS6
                        编写于 最后由 编辑
                        #11

                        @tony-wang N卡除了 5090 / pro 6000 外還有窮人選擇嗎?

                        1 条回复 最后回复
                        0
                        • Tony WangT 离线
                          Tony WangT 离线
                          Tony Wang
                          编写于 最后由 Tony Wang 编辑
                          #12

                          我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                          对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                          CS6C kop wangK 2 条回复 最后回复
                          0
                          • Tony WangT Tony Wang

                            我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                            对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                            CS6C 离线
                            CS6C 离线
                            CS6
                            编写于 最后由 编辑
                            #13

                            @Tony-Wang 台幣 $245,000 這價格也是很難回本 😰
                            要捏一下薪水

                            1 条回复 最后回复
                            0
                            • Tony WangT 离线
                              Tony WangT 离线
                              Tony Wang
                              编写于 最后由 编辑
                              #14

                              没办法啊, 看中了它的48G. 如果是32G, 还有A卡可选, R9700性价比最高.

                              京东上 5090 的32G, 价格比我这个还高 😞 , 你们台湾还能有满血保修, 我们这边啥都没有.

                              1 条回复 最后回复
                              0
                              • Tony WangT Tony Wang

                                我刚刚定了一块 pro 5000 48G, 主要用来跑 27b, 价格不到4万, 还有保修.

                                对比pro 6000 96G, 现在京东上都 12万, 15万, 甚至18万一张了.

                                kop wangK 离线
                                kop wangK 离线
                                kop wang
                                编写于 最后由 编辑
                                #15

                                @Tony-Wang 巧了,今天京东自营刚刚到货,准备过两天发帖

                                虚心交流,一起进步

                                Tony WangT 1 条回复 最后回复
                                0
                                • kop wangK kop wang

                                  @Tony-Wang 巧了,今天京东自营刚刚到货,准备过两天发帖

                                  Tony WangT 离线
                                  Tony WangT 离线
                                  Tony Wang
                                  编写于 最后由 编辑
                                  #16

                                  @kop-wang

                                  丽台的么?

                                  kop wangK 1 条回复 最后回复
                                  0
                                  • Tony WangT Tony Wang

                                    @kop-wang

                                    丽台的么?

                                    kop wangK 离线
                                    kop wangK 离线
                                    kop wang
                                    编写于 最后由 kop wang 编辑
                                    #17

                                    @Tony-Wang nv工包的,京东有两款,差价10元,买的38804的那款。

                                    虚心交流,一起进步

                                    Tony WangT 1 条回复 最后回复
                                    0
                                    • kop wangK kop wang

                                      @Tony-Wang nv工包的,京东有两款,差价10元,买的38804的那款。

                                      Tony WangT 离线
                                      Tony WangT 离线
                                      Tony Wang
                                      编写于 最后由 编辑
                                      #18

                                      @kop-wang

                                      期待分享, 我买的丽台的, 38999. 不过我要7月初才能回国装机.

                                      kop wangK 1 条回复 最后回复
                                      0
                                      • Tony WangT Tony Wang

                                        @kop-wang

                                        期待分享, 我买的丽台的, 38999. 不过我要7月初才能回国装机.

                                        kop wangK 离线
                                        kop wangK 离线
                                        kop wang
                                        编写于 最后由 编辑
                                        #19

                                        @Tony-Wang 京东plus会员优惠接近200,如果不急退了冲个会员再买。

                                        虚心交流,一起进步

                                        1 条回复 最后回复
                                        0
                                        • Tony WangT 离线
                                          Tony WangT 离线
                                          Tony Wang
                                          编写于 最后由 编辑
                                          #20

                                          来不及了, 已经下过单了 😞

                                          1 条回复 最后回复
                                          0

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组