跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化

请教大家M5 Max 128G MacBook Pro上的oMLX如何优化

已定时 已固定 已锁定 已移动 AI硬件
38 帖子 10 发布者 431 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Tony WangT 离线
    Tony WangT 离线
    Tony Wang
    编写于 最后由 编辑
    #17

    关掉会降智. 我用刑侦十题的变体(防止它被训练过), 测试27b, thinking模式下, 完美解答, 但是时间巨长. no think 模式下翻车. 其余35a3, 26a4, 还用了 ud, 开了thinking也都全部翻车.

    Z 1 条回复 最后回复
    1
    • Tony WangT Tony Wang

      关掉会降智. 我用刑侦十题的变体(防止它被训练过), 测试27b, thinking模式下, 完美解答, 但是时间巨长. no think 模式下翻车. 其余35a3, 26a4, 还用了 ud, 开了thinking也都全部翻车.

      Z 离线
      Z 离线
      zorg
      编写于 最后由 编辑
      #18

      @Tony-Wang 多谢,看来如果是算力瓶颈不知道用exo类似的方案是否可以提高速度。

      1 条回复 最后回复
      0
      • williamlouisW 离线
        williamlouisW 离线
        williamlouis
        编写于 最后由 编辑
        #19

        oMLX 用了后会让你跑起来。主要问题是温度激升。(物理解决。空调开着)对固态硬盘的寿命影响非常大。大约新机使用后。寿命会缩减到2-3年。最大可能2年就报废。1T的原装盘1400元左右。其实算算也不算什么。奔跑吧。少年

        个人主页:xlkj.org Telegram https://t.me/xinlinlu

        Z 1 条回复 最后回复
        0
        • williamlouisW williamlouis

          oMLX 用了后会让你跑起来。主要问题是温度激升。(物理解决。空调开着)对固态硬盘的寿命影响非常大。大约新机使用后。寿命会缩减到2-3年。最大可能2年就报废。1T的原装盘1400元左右。其实算算也不算什么。奔跑吧。少年

          Z 离线
          Z 离线
          zorg
          编写于 最后由 编辑
          #20

          @williamlouis 谢谢提醒,希望2年后ssd不要太超纲。

          1 条回复 最后回复
          0
          • Z 离线
            Z 离线
            zorg
            编写于 最后由 编辑
            #21

            另外大家有没有用过majentik的Qwen3.6 35B turboquangt版本的模型?不知道缓存管理和精准度如何?目前看好像最大就是35B,希望短期内能看到27B或者122B的版本。

            1 条回复 最后回复
            0
            • williamlouisW 离线
              williamlouisW 离线
              williamlouis
              编写于 最后由 编辑
              #22

              又不是越大越聪明。你提问测试下。够用就行的。

              个人主页:xlkj.org Telegram https://t.me/xinlinlu

              Z 1 条回复 最后回复
              0
              • williamlouisW williamlouis

                又不是越大越聪明。你提问测试下。够用就行的。

                Z 离线
                Z 离线
                zorg
                编写于 最后由 编辑
                #23

                @williamlouis 嗯,还没有看到27B的稠密,moe的话小的觉得还是差更多。

                1 条回复 最后回复
                0
                • Tony WangT Tony Wang

                  oMLX 和 LM Studio 比怎么样? 会有明显提升吗? 我之前试过vMLX, 还不如LM Studio和ollama, 当然可能是我优化的问题.

                  williamlouisW 离线
                  williamlouisW 离线
                  williamlouis
                  编写于 最后由 编辑
                  #24

                  @Tony-Wang 说:

                  oMLX

                  有明显提升 10倍的速度。我的设备90%是Mac。oMLX

                  个人主页:xlkj.org Telegram https://t.me/xinlinlu

                  1 条回复 最后回复
                  1
                  • Z 离线
                    Z 离线
                    zorg
                    编写于 最后由 编辑
                    #25

                    看起来M芯片还不错 截屏2026-05-15 12.08.10.png

                    terryT 1 条回复 最后回复
                    1
                    • Z zorg

                      看起来M芯片还不错 截屏2026-05-15 12.08.10.png

                      terryT 在线
                      terryT 在线
                      terry
                      编写于 最后由 编辑
                      #26

                      @zorg 数据很有参考价值,后续会抄作业,做到视频里,给老弟署名。

                      Z 1 条回复 最后回复
                      0
                      • terryT terry 固定了该主题
                      • terryT terry

                        @zorg 数据很有参考价值,后续会抄作业,做到视频里,给老弟署名。

                        Z 离线
                        Z 离线
                        zorg
                        编写于 最后由 编辑
                        #27

                        @terry 哪里,这是Tech Notice的测试,给大家参考

                        terryT 1 条回复 最后回复
                        0
                        • Z zorg

                          @terry 哪里,这是Tech Notice的测试,给大家参考

                          terryT 在线
                          terryT 在线
                          terry
                          编写于 最后由 编辑
                          #28

                          @zorg 也不错了,你多发点有意义的图,苹果讨论的人不多。

                          williamlouisW 1 条回复 最后回复
                          0
                          • terryT terry

                            @zorg 也不错了,你多发点有意义的图,苹果讨论的人不多。

                            williamlouisW 离线
                            williamlouisW 离线
                            williamlouis
                            编写于 最后由 编辑
                            #29

                            @terry 不讨论是真的不行。还在等更稳定的方案。omlx是个玩命的模式。我认为没有什么意义。

                            个人主页:xlkj.org Telegram https://t.me/xinlinlu

                            1 条回复 最后回复
                            1
                            • Z 离线
                              Z 离线
                              zorg
                              编写于 最后由 编辑
                              #30

                              我也是在看,turboquant会不会有加成。

                              terryT 1 条回复 最后回复
                              0
                              • Z zorg

                                我也是在看,turboquant会不会有加成。

                                terryT 在线
                                terryT 在线
                                terry
                                编写于 最后由 编辑
                                #31

                                @zorg 苹果的哥们多发点测试数据,自己也跑下。

                                1 条回复 最后回复
                                0
                                • Leon YL 离线
                                  Leon YL 离线
                                  Leon Y
                                  编写于 最后由 编辑
                                  #32

                                  一样的MBP 126GB,LM Studio跑久了机器会重启

                                  1 条回复 最后回复
                                  0
                                  • williamlouisW 离线
                                    williamlouisW 离线
                                    williamlouis
                                    编写于 最后由 编辑
                                    #33

                                    丐版真是不想说话。

                                    个人主页:xlkj.org Telegram https://t.me/xinlinlu

                                    1 条回复 最后回复
                                    0
                                    • 怪 离线
                                      怪 离线
                                      怪叔叔
                                      编写于 最后由 编辑
                                      #34

                                      可以试试用mtplx来跑27B

                                      Tony WangT 1 条回复 最后回复
                                      0
                                      • 系统 取消固定了该主题
                                      • 怪 怪叔叔

                                        可以试试用mtplx来跑27B

                                        Tony WangT 离线
                                        Tony WangT 离线
                                        Tony Wang
                                        编写于 最后由 编辑
                                        #35

                                        @怪叔叔 我测试了一下, 提升明显. 到64K的命中率仍然很高, 更长不知道了, 我的M5pro 跑不动.

                                        1 条回复 最后回复
                                        0
                                        • Z zorg

                                          大家好,我从今年元旦开始关注open claw的介绍和使用心得,碰巧过年时M5 max的MBP发布,就24期分期购入了128G的版本。本着先跑通再优化的思路先尝试了ollama,跑Qwen3.5 70B,学习openclaw。后来听大佬的话换到Qwen3.6 27B 8bit mlx。

                                          之后夜以继日的沉浸在学习的快感里,可能是看多了本地ai内容的视频,被算法推了抡锤者大佬的视频,受益匪浅,很认同楼主的世界观,AI本质还是我们的工具,了解他,学习他,思考并找到他能给我们赋能的功能,相比原来chatgpt和gemini的纯文字交流来说,体会到了哥伦布的爽感。

                                          目前我手里的硬件:AMDPC主机+32G内存+3090显卡,之前有过学习stable diffusion的经验,过年期间开始琢磨ltx2.3的其他玩家的玩法,只是偶尔生成参数控制不好内存溢出崩溃,敢在显卡涨价前在国外下单5090 32G,等下次回国带回来学习,希望如楼主所说能够更轻松的做一些音视频尝试。

                                          M5 max上运行openclaw一段时间发现这家伙确实阿尔兹海默现象逐渐出现,现在更多的是使用Hermes,不同的架构还是缓解很多。现状搭配是M5 Max专职运行oMLX,提供api给家里每个人的openclaw或者hermes使用,这两个月在公司运营,法务梳理,业务拓展上榜了我很多。业务生成音视频我也是告诉Hermes,让他去调用PC的comfy ui api完成,真是挺好玩的。

                                          由于家里所有成员开始更多的使用Hermes,现在M5 max也经常排着7/8个对话运行,响应速度开始在高峰时有感知的减慢,所以想跪求其他前辈的oMLX调优心法,让他能更流畅的运行,随附我现在的模型设置,先谢过各位,好人一生平安。

                                          截屏2026-05-11 00.25.04.png
                                          截屏2026-05-11 00.25.24.png

                                          williamlouisW 离线
                                          williamlouisW 离线
                                          williamlouis
                                          编写于 最后由 编辑
                                          #36

                                          @zorg 更新了个中间件。你可以去看看。应该有效果。我的硬盘应该是没你的贵。带宽不一样。

                                          个人主页:xlkj.org Telegram https://t.me/xinlinlu

                                          Z 1 条回复 最后回复
                                          0

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组