M5pro 64G LLM性能参考.
-
Studio 肯定体验更好, air适合做日常主力机, 轻便.
GPU还是很重要的, prefill 阶段主要拼算力, 我这个跑27b, prefill 300多, 属于很慢的了, 如果你开thinking, 有效的首字出来经常要1分钟以上, 属于体验很差的那种.
内存我个人认为反而不重要, 64G就够用了(专用, 如果你还用它上网办公剪辑视频, 那就不够了). 70b左右的moe也不会比30b左右的稠密更聪明. 除非你需要它知识面大, 比如写作之类的.
如果是Mac, 我还是赞同 @terry 的说法, 只有Max及以上才能打. 而且也只是在LLM 和 图片能打. 视频就别想了, 玩玩儿可以, 生产肯定不行.
@Tony-Wang 没事你的测试数据让我以后喷Apple的时候更有底气了
,说实话我希望苹果站起来,我特别喜欢studio那个形态,就是跑comfyui太废柴了,不然我想买一个。 -
Mac 适合 用 在线算力。做一个 API集合路由 狂剽 免费API。生产力肯定不行。办公室 缩减开资是可以实现的。chat生态推荐。
-
@Vittoria-Veloso 用肯定是能勉强用, 但是prefill太慢, 以及10几个token的decode, 感受很差.
@Tony-Wang 你用omlx真的,专门针对mac优化了。lmstudio还有ollama确实不大行。
-
@82445418 根本不可能
-
@Tony-Wang 那还不是没啥卵用
-
@Tony-Wang 其实油管频道有人说,没啥卵用,慢。
-
@Tony-Wang 可以,5090, pro 5000, 6000都行。
-
@Tony-Wang 可以,5090, pro 5000, 6000都行。
-
我靠, 我觉得还是可以抢救一下的, 刚才又在oMLX 加上了SpecPrefill , 加了一个qwen3.5 2B Q4 用来预测, PP狂涨.
这个对我做LLM wiki 还是很有价值的.

@Tony-Wang 那抢救一下,发点数据来,这就很有意义了。
-
@Tony-Wang 那抢救一下,发点数据来,这就很有意义了。


