M5pro 64G LLM性能参考.

Reply to M5pro 64G LLM性能参考. on Wed, 20 May 2026 01:08:38 GMT

janebo — Wed, 20 May 2026 01:08:38 GMT

@terry 我也是无意中刷到才知道amd也可以玩模型，我之前一直在研究Mac，也在看mac studio 比较n卡实在太贵了，无意中发现现在a卡也能搞了，5k左右，我准备把手上的3060 12g出掉来升级一下，折腾一下a卡

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 17:51:43 GMT

terry — Tue, 19 May 2026 17:51:43 GMT

不改变mac跑AI废物的局面，这是硬件残疾，很难后天修复。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 16:37:11 GMT

Tony Wang — Tue, 19 May 2026 16:37:11 GMT

@terry

你看图片, 27b oQ4 MTP, pp已经到了 1131.8, tg 还能在 17.3.

不过我问了AI, 这个 SpecPrefill 技术不适合多轮对话, 会乱掉. 只适合长文本的一次性分析, 和几轮对话.

所以, 对于AI agent , 还是没啥用. 对于我LLM wiki, 倒是有点儿用, 不过那个, 我如果单独分析, 也就等一会儿就完了, 不着急了. 感觉这个技术有点儿鸡肋.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 16:31:18 GMT

terry — Tue, 19 May 2026 16:31:18 GMT

@Tony-Wang 那抢救一下，发点数据来，这就很有意义了。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 16:01:49 GMT

Tony Wang — Tue, 19 May 2026 16:01:49 GMT

@terry

我靠, 我觉得还是可以抢救一下的, 刚才又在oMLX 加上了SpecPrefill , 加了一个qwen3.5 2B Q4 用来预测, PP狂涨.

这个对我做LLM wiki 还是很有价值的.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:45:01 GMT

Tony Wang — Tue, 19 May 2026 15:45:01 GMT

@terry 说:

pro 5000， 6000都行。

我对噪音敏感, 已经排除掉了 5000, 6000. 如果不是噪音敏感, 我就入手你推荐的9700两张了. 我主要要LLM的算力, 视频也就是玩玩, 不用来生产.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:30:30 GMT

terry — Tue, 19 May 2026 15:30:30 GMT

@Tony-Wang 可以，5090， pro 5000， 6000都行。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:14:29 GMT

Tony Wang — Tue, 19 May 2026 15:14:29 GMT

看来我必须得搞 5090了, 无论如何得想办法降低噪音

等回国了就动手.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:13:26 GMT

terry — Tue, 19 May 2026 15:13:26 GMT

@Tony-Wang 其实油管频道有人说，没啥卵用，慢。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:12:33 GMT

Tony Wang — Tue, 19 May 2026 15:12:33 GMT

是啊, 所以结论不变, M5pro 跑27b 不行, Max 没准行.

@terry 号召有 Μ5max的测试一下, 有可能给 LLM 带来希望.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:10:14 GMT

terry — Tue, 19 May 2026 15:10:14 GMT

@Tony-Wang 那还不是没啥卵用

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 15:09:48 GMT

Tony Wang — Tue, 19 May 2026 15:09:48 GMT

今天oMLX发布了 0.3.9rc1, 支持了 native MTP, 我又测了一下加上了MTP机制的 27b oQ4, decode 明显提升, PP 基本不变.

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 14:47:48 GMT

Vittoria Veloso — Tue, 19 May 2026 14:47:48 GMT

@82445418 根本不可能

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 14:47:13 GMT

Vittoria Veloso — Tue, 19 May 2026 14:47:13 GMT

@Tony-Wang 你用omlx真的，专门针对mac优化了。lmstudio还有ollama确实不大行。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 08:23:46 GMT

terry — Tue, 19 May 2026 08:23:46 GMT

@janebo 论坛那么多大神在用xtx，就是Qwen3.6 27b就值回票价了，更何况也能comfyui，抄作业就是了。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 08:22:32 GMT

janebo — Tue, 19 May 2026 08:22:32 GMT

彻底打消了我对mac跑大模型的念想，我还在看省了九千，还是去买7900xtx,至少五千左右的价格能跑千文还是很强的性价比！

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 05:21:48 GMT

williamlouis — Tue, 19 May 2026 05:21:48 GMT

Mac 适合用在线算力。做一个 API集合路由狂剽免费API。生产力肯定不行。办公室缩减开资是可以实现的。chat生态推荐。

Reply to M5pro 64G LLM性能参考. on Tue, 19 May 2026 00:34:10 GMT

82445418 — Tue, 19 May 2026 00:34:10 GMT

彻底打消了我用 mac 跑本地生视频的念头

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 14:59:35 GMT

Tony Wang — Mon, 18 May 2026 14:59:35 GMT

我也是啊, 我喜欢苹果的安静, 优雅和全生态的无缝连接. 但是和算力不能得兼.

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 14:56:13 GMT

terry — Mon, 18 May 2026 14:56:13 GMT

@Tony-Wang 没事你的测试数据让我以后喷Apple的时候更有底气了，说实话我希望苹果站起来，我特别喜欢studio那个形态，就是跑comfyui太废柴了，不然我想买一个。

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 14:23:34 GMT

Tony Wang — Mon, 18 May 2026 14:23:34 GMT

@eddie-hk

Studio 肯定体验更好, air适合做日常主力机, 轻便.

GPU还是很重要的, prefill 阶段主要拼算力, 我这个跑27b, prefill 300多, 属于很慢的了, 如果你开thinking, 有效的首字出来经常要1分钟以上, 属于体验很差的那种.

内存我个人认为反而不重要, 64G就够用了(专用, 如果你还用它上网办公剪辑视频, 那就不够了). 70b左右的moe也不会比30b左右的稠密更聪明. 除非你需要它知识面大, 比如写作之类的.

如果是Mac, 我还是赞同 @terry 的说法, 只有Max及以上才能打. 而且也只是在LLM 和图片能打. 视频就别想了, 玩玩儿可以, 生产肯定不行.

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 14:05:18 GMT

Tony Wang — Mon, 18 May 2026 14:05:18 GMT

@Vittoria-Veloso 用肯定是能勉强用, 但是prefill太慢, 以及10几个token的decode, 感受很差.

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 14:04:02 GMT

Tony Wang — Mon, 18 May 2026 14:04:02 GMT

@terry 如果只是聊天, 基本够了, 如果是连接 Hermes, 那prefill 只有 300多, 时间太长, 等待回应会比较痛苦.

价格是不便宜, 大概要5000多加币, 不过是没办法的事. 这是我的主力机, 本来 air 就够用. 但是因为我近期要回国, 折腾台式机的话, 很难带回去. 所以就卖肾买了这个配置, 还不敢买max, 一是担心散热, 二是担心成为鸡肋.

不过现在看来, m5 max 是有可能跑 27b 稠密的, 毕竟它的高配GPU和带宽都是我这个的两倍.

Reply to M5pro 64G LLM性能参考. on Mon, 18 May 2026 08:22:54 GMT

Vittoria Veloso — Mon, 18 May 2026 08:22:54 GMT

@Tony-Wang 可以的，我的m5 32g，跑qwen 3.6 27B，开到90k上下文都可以，不过我使用 omlx，没用LM Studio。也还可以十几token，哥们儿你这配置可以开qwen 3.6 27B 8bit了，27GB，上下文开到96k左右了。