请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
-
@Tony-Wang oMLX 和 LM Studio 定位不太一样:
-
oMLX 是专门为 Apple Silicon 优化的推理框架,底层用 MLX(Apple 自家的 ML 框架),对 M 系列芯片的内存带宽和神经引擎利用得更好,尤其是 Unified Memory 的管理。适合跑 MLX 格式的模型(如 mlx-community 的版本)。
-
LM Studio 更像是一个全功能 GUI 管理平台,底层可以用 llama.cpp、MLX、甚至 OpenAI API 兼容模式。它的优势是开箱即用、界面友好、支持各种格式的 GGUF 模型,但针对 M 系列的底层优化不如 oMLX 深入。
-
vMLX 确实有过稳定性问题,我见过不少反馈说有环境冲突。oMLX 迭代快,最近的版本改善了很多。
-
实际建议:如果你主要是用 Mac 跑推理且不介意命令行,oMLX 值得一试,尤其是 Unified Memory 模式下可以跑超过显存大小的模型。如果图省心、经常换不同模型玩,LM Studio 更方便。两个可以同时装不冲突。
-
-
模式不一样。钱花了就会有结果的。这个配置可以。苹果为维持销量也会通过各种方式不让你放弃这个配置。放心这个配置没问题。
-
关掉会降智. 我用刑侦十题的变体(防止它被训练过), 测试27b, thinking模式下, 完美解答, 但是时间巨长. no think 模式下翻车. 其余35a3, 26a4, 还用了 ud, 开了thinking也都全部翻车.
@Tony-Wang 多谢,看来如果是算力瓶颈不知道用exo类似的方案是否可以提高速度。
-
oMLX 用了后会让你跑起来。主要问题是温度激升。(物理解决。空调开着)对固态硬盘的寿命影响非常大。大约新机使用后。寿命会缩减到2-3年。最大可能2年就报废。1T的原装盘1400元左右。其实算算也不算什么。奔跑吧。少年
-
oMLX 用了后会让你跑起来。主要问题是温度激升。(物理解决。空调开着)对固态硬盘的寿命影响非常大。大约新机使用后。寿命会缩减到2-3年。最大可能2年就报废。1T的原装盘1400元左右。其实算算也不算什么。奔跑吧。少年
@williamlouis 谢谢提醒,希望2年后ssd不要太超纲。
-
又不是越大越聪明。你提问测试下。够用就行的。
-
又不是越大越聪明。你提问测试下。够用就行的。
@williamlouis 嗯,还没有看到27B的稠密,moe的话小的觉得还是差更多。
-
oMLX
有明显提升 10倍的速度。我的设备90%是Mac。oMLX
-
T terry 固定了该主题
-
@terry 不讨论是真的不行。还在等更稳定的方案。omlx是个玩命的模式。我认为没有什么意义。


