M5pro 64G LLM性能参考.
-
Mac 适合 用 在线算力。做一个 API集合路由 狂剽 免费API。生产力肯定不行。办公室 缩减开资是可以实现的。chat生态推荐。
-
@Vittoria-Veloso 用肯定是能勉强用, 但是prefill太慢, 以及10几个token的decode, 感受很差.
@Tony-Wang 你用omlx真的,专门针对mac优化了。lmstudio还有ollama确实不大行。
-
@82445418 根本不可能
-
@Tony-Wang 那还不是没啥卵用
-
@Tony-Wang 其实油管频道有人说,没啥卵用,慢。
-
@Tony-Wang 可以,5090, pro 5000, 6000都行。
-
@Tony-Wang 可以,5090, pro 5000, 6000都行。
-
我靠, 我觉得还是可以抢救一下的, 刚才又在oMLX 加上了SpecPrefill , 加了一个qwen3.5 2B Q4 用来预测, PP狂涨.
这个对我做LLM wiki 还是很有价值的.

@Tony-Wang 那抢救一下,发点数据来,这就很有意义了。
-
@Tony-Wang 那抢救一下,发点数据来,这就很有意义了。



不改变mac跑AI废物的局面,这是硬件残疾,很难后天修复。