请教大家M5 Max 128G MacBook Pro上的oMLX如何优化

zorg

@williamlouis 谢谢提醒，希望2年后ssd不要太超纲。

zorg

另外大家有没有用过majentik的Qwen3.6 35B turboquangt版本的模型？不知道缓存管理和精准度如何？目前看好像最大就是35B，希望短期内能看到27B或者122B的版本。

williamlouis

又不是越大越聪明。你提问测试下。够用就行的。

zorg

@williamlouis 嗯，还没有看到27B的稠密，moe的话小的觉得还是差更多。

williamlouis

@Tony-Wang 说:

oMLX

有明显提升 10倍的速度。我的设备90%是Mac。oMLX

zorg

看起来M芯片还不错截屏2026-05-15 12.08.10.png

terry

@zorg 数据很有参考价值，后续会抄作业，做到视频里，给老弟署名。

zorg

@terry 哪里，这是Tech Notice的测试，给大家参考

terry

@zorg 也不错了，你多发点有意义的图，苹果讨论的人不多。

williamlouis

@terry 不讨论是真的不行。还在等更稳定的方案。omlx是个玩命的模式。我认为没有什么意义。

zorg

我也是在看，turboquant会不会有加成。

terry

@zorg 苹果的哥们多发点测试数据，自己也跑下。

Leon Y

一样的MBP 126GB，LM Studio跑久了机器会重启

williamlouis

丐版真是不想说话。

怪叔叔

可以试试用mtplx来跑27B

Tony Wang

@怪叔叔我测试了一下, 提升明显. 到64K的命中率仍然很高, 更长不知道了, 我的M5pro 跑不动.

williamlouis

@zorg 更新了个中间件。你可以去看看。应该有效果。我的硬盘应该是没你的贵。带宽不一样。

zorg

@williamlouis 多谢，我去试试，btw刚升级了Hermes0.14，又有新的功能，一起试试哈

williamlouis

@zorg 作用不一样。我的一直在干活。列队很长。干不完的干。主要就靠功耗低活着。服务器都靠这个小ai 干活。人是干不过来的。过一段在给它雇一个伙伴吧。还没想好是继续Mac 还是换塔式主机了。这段学习考量。老特的配置应该一个能顶Mac 4个还得多了。不考虑功耗和噪音。塔式是ztmd 合适啊。想研究搞一个托管到本地机房。有空研究下。本地联通和移动应该都有对外业务。

抡锤者

请教大家M5 Max 128G MacBook Pro上的oMLX如何优化