王思聪说:我喝豆浆就是喝一碗,倒一碗。


所以以下全是一个屌丝 帮 土豪在Mac M3 Utral 512G 上跑 AI。
- ds4+ deepseek V4 flash
框架ds4:https://github.com/antirez/ds4.git
deepseek V4 qt2, 本来可以直接用qt4(但我小家子气,怕效果不好)
启动参数:./ds4-server
--ctx 131072
--kv-disk-dir /tmp/ds4-kv
--kv-disk-space-mb 65536
- LM studio+ qwen3.6-27B( 同时跑了一下,可以运行,因为内存还有很多空间,但感觉单模型相应速度有下降)
装机过程比较顺利,没有太多暗坑,比较顺利!但也没有过细优化:
效果: 30Token/秒 ,虽然不是非常慢,但还是慢(和云端比),即便时同时多开(同时跑 Qwen和DSV4),只会更慢,没有明显的提升。因为GPU已经到了100%



