跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化

请教大家M5 Max 128G MacBook Pro上的oMLX如何优化

已定时 已固定 已锁定 已移动 AI硬件
38 帖子 10 发布者 429 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • williamlouisW williamlouis

    oMLX 用了后会让你跑起来。主要问题是温度激升。(物理解决。空调开着)对固态硬盘的寿命影响非常大。大约新机使用后。寿命会缩减到2-3年。最大可能2年就报废。1T的原装盘1400元左右。其实算算也不算什么。奔跑吧。少年

    Z 离线
    Z 离线
    zorg
    编写于 最后由 编辑
    #20

    @williamlouis 谢谢提醒,希望2年后ssd不要太超纲。

    1 条回复 最后回复
    0
    • Z 离线
      Z 离线
      zorg
      编写于 最后由 编辑
      #21

      另外大家有没有用过majentik的Qwen3.6 35B turboquangt版本的模型?不知道缓存管理和精准度如何?目前看好像最大就是35B,希望短期内能看到27B或者122B的版本。

      1 条回复 最后回复
      0
      • williamlouisW 离线
        williamlouisW 离线
        williamlouis
        编写于 最后由 编辑
        #22

        又不是越大越聪明。你提问测试下。够用就行的。

        个人主页:xlkj.org Telegram https://t.me/xinlinlu

        Z 1 条回复 最后回复
        0
        • williamlouisW williamlouis

          又不是越大越聪明。你提问测试下。够用就行的。

          Z 离线
          Z 离线
          zorg
          编写于 最后由 编辑
          #23

          @williamlouis 嗯,还没有看到27B的稠密,moe的话小的觉得还是差更多。

          1 条回复 最后回复
          0
          • Tony WangT Tony Wang

            oMLX 和 LM Studio 比怎么样? 会有明显提升吗? 我之前试过vMLX, 还不如LM Studio和ollama, 当然可能是我优化的问题.

            williamlouisW 离线
            williamlouisW 离线
            williamlouis
            编写于 最后由 编辑
            #24

            @Tony-Wang 说:

            oMLX

            有明显提升 10倍的速度。我的设备90%是Mac。oMLX

            个人主页:xlkj.org Telegram https://t.me/xinlinlu

            1 条回复 最后回复
            1
            • Z 离线
              Z 离线
              zorg
              编写于 最后由 编辑
              #25

              看起来M芯片还不错 截屏2026-05-15 12.08.10.png

              terryT 1 条回复 最后回复
              1
              • Z zorg

                看起来M芯片还不错 截屏2026-05-15 12.08.10.png

                terryT 离线
                terryT 离线
                terry
                编写于 最后由 编辑
                #26

                @zorg 数据很有参考价值,后续会抄作业,做到视频里,给老弟署名。

                Z 1 条回复 最后回复
                0
                • terryT terry 固定了该主题
                • terryT terry

                  @zorg 数据很有参考价值,后续会抄作业,做到视频里,给老弟署名。

                  Z 离线
                  Z 离线
                  zorg
                  编写于 最后由 编辑
                  #27

                  @terry 哪里,这是Tech Notice的测试,给大家参考

                  terryT 1 条回复 最后回复
                  0
                  • Z zorg

                    @terry 哪里,这是Tech Notice的测试,给大家参考

                    terryT 离线
                    terryT 离线
                    terry
                    编写于 最后由 编辑
                    #28

                    @zorg 也不错了,你多发点有意义的图,苹果讨论的人不多。

                    williamlouisW 1 条回复 最后回复
                    0
                    • terryT terry

                      @zorg 也不错了,你多发点有意义的图,苹果讨论的人不多。

                      williamlouisW 离线
                      williamlouisW 离线
                      williamlouis
                      编写于 最后由 编辑
                      #29

                      @terry 不讨论是真的不行。还在等更稳定的方案。omlx是个玩命的模式。我认为没有什么意义。

                      个人主页:xlkj.org Telegram https://t.me/xinlinlu

                      1 条回复 最后回复
                      1
                      • Z 离线
                        Z 离线
                        zorg
                        编写于 最后由 编辑
                        #30

                        我也是在看,turboquant会不会有加成。

                        terryT 1 条回复 最后回复
                        0
                        • Z zorg

                          我也是在看,turboquant会不会有加成。

                          terryT 离线
                          terryT 离线
                          terry
                          编写于 最后由 编辑
                          #31

                          @zorg 苹果的哥们多发点测试数据,自己也跑下。

                          1 条回复 最后回复
                          0
                          • Leon YL 离线
                            Leon YL 离线
                            Leon Y
                            编写于 最后由 编辑
                            #32

                            一样的MBP 126GB,LM Studio跑久了机器会重启

                            1 条回复 最后回复
                            0
                            • williamlouisW 离线
                              williamlouisW 离线
                              williamlouis
                              编写于 最后由 编辑
                              #33

                              丐版真是不想说话。

                              个人主页:xlkj.org Telegram https://t.me/xinlinlu

                              1 条回复 最后回复
                              0
                              • 怪 离线
                                怪 离线
                                怪叔叔
                                编写于 最后由 编辑
                                #34

                                可以试试用mtplx来跑27B

                                Tony WangT 1 条回复 最后回复
                                0
                                • 系统 取消固定了该主题
                                • 怪 怪叔叔

                                  可以试试用mtplx来跑27B

                                  Tony WangT 离线
                                  Tony WangT 离线
                                  Tony Wang
                                  编写于 最后由 编辑
                                  #35

                                  @怪叔叔 我测试了一下, 提升明显. 到64K的命中率仍然很高, 更长不知道了, 我的M5pro 跑不动.

                                  1 条回复 最后回复
                                  0
                                  • Z zorg

                                    大家好,我从今年元旦开始关注open claw的介绍和使用心得,碰巧过年时M5 max的MBP发布,就24期分期购入了128G的版本。本着先跑通再优化的思路先尝试了ollama,跑Qwen3.5 70B,学习openclaw。后来听大佬的话换到Qwen3.6 27B 8bit mlx。

                                    之后夜以继日的沉浸在学习的快感里,可能是看多了本地ai内容的视频,被算法推了抡锤者大佬的视频,受益匪浅,很认同楼主的世界观,AI本质还是我们的工具,了解他,学习他,思考并找到他能给我们赋能的功能,相比原来chatgpt和gemini的纯文字交流来说,体会到了哥伦布的爽感。

                                    目前我手里的硬件:AMDPC主机+32G内存+3090显卡,之前有过学习stable diffusion的经验,过年期间开始琢磨ltx2.3的其他玩家的玩法,只是偶尔生成参数控制不好内存溢出崩溃,敢在显卡涨价前在国外下单5090 32G,等下次回国带回来学习,希望如楼主所说能够更轻松的做一些音视频尝试。

                                    M5 max上运行openclaw一段时间发现这家伙确实阿尔兹海默现象逐渐出现,现在更多的是使用Hermes,不同的架构还是缓解很多。现状搭配是M5 Max专职运行oMLX,提供api给家里每个人的openclaw或者hermes使用,这两个月在公司运营,法务梳理,业务拓展上榜了我很多。业务生成音视频我也是告诉Hermes,让他去调用PC的comfy ui api完成,真是挺好玩的。

                                    由于家里所有成员开始更多的使用Hermes,现在M5 max也经常排着7/8个对话运行,响应速度开始在高峰时有感知的减慢,所以想跪求其他前辈的oMLX调优心法,让他能更流畅的运行,随附我现在的模型设置,先谢过各位,好人一生平安。

                                    截屏2026-05-11 00.25.04.png
                                    截屏2026-05-11 00.25.24.png

                                    williamlouisW 离线
                                    williamlouisW 离线
                                    williamlouis
                                    编写于 最后由 编辑
                                    #36

                                    @zorg 更新了个中间件。你可以去看看。应该有效果。我的硬盘应该是没你的贵。带宽不一样。

                                    个人主页:xlkj.org Telegram https://t.me/xinlinlu

                                    Z 1 条回复 最后回复
                                    0
                                    • williamlouisW williamlouis

                                      @zorg 更新了个中间件。你可以去看看。应该有效果。我的硬盘应该是没你的贵。带宽不一样。

                                      Z 离线
                                      Z 离线
                                      zorg
                                      编写于 最后由 编辑
                                      #37

                                      @williamlouis 多谢,我去试试,btw刚升级了Hermes0.14,又有新的功能,一起试试哈

                                      williamlouisW 1 条回复 最后回复
                                      0
                                      • Z zorg

                                        @williamlouis 多谢,我去试试,btw刚升级了Hermes0.14,又有新的功能,一起试试哈

                                        williamlouisW 离线
                                        williamlouisW 离线
                                        williamlouis
                                        编写于 最后由 编辑
                                        #38

                                        @zorg 作用不一样。我的一直在干活。列队很长。干不完的干。主要就靠功耗低活着。服务器都靠这个小ai 干活。人是干不过来的。过一段在给它雇一个 伙伴吧。还没想好是继续Mac 还是换 塔式主机了。这段学习考量。老特的配置 应该一个能顶Mac 4个还得多了。不考虑功耗和噪音。塔式是ztmd 合适啊。想研究搞一个 托管到 本地机房。有空研究下。本地 联通和移动应该都有对外业务。

                                        个人主页:xlkj.org Telegram https://t.me/xinlinlu

                                        1 条回复 最后回复
                                        0

                                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                        有了你的建议,这篇帖子会更精彩哦 💗

                                        注册 登录
                                        回复
                                        • 在新帖中回复
                                        登录后回复
                                        • 从旧到新
                                        • 从新到旧
                                        • 最多赞同


                                        • 登录

                                        • 没有帐号? 注册

                                        • 登录或注册以进行搜索。
                                        • 第一个帖子
                                          最后一个帖子
                                        0
                                        • 版块
                                        • 最新
                                        • 标签
                                        • 热门
                                        • 用户
                                        • 群组