抡锤者

饲

牛逼！学习学习！

饲

@高乐天
感谢这位仁兄，我也一样是 ai max 395 目前用Ollama 跑 qwen3.6-27b 只有 12T/s
但是用了你介绍的方法，速度几乎翻倍了。以下贴上具体数据给大家参考一下。
再次感谢 @高乐天！

<当前运行环境 & 模型>

<最新测速结果>

阶段	Token 数	耗时	速度
Prompt 处理	45 tokens	421ms	~107 token/s
Token 生成（MTP）	500 tokens	24.8s	~20.2 token/s
总计	545 tokens	~25.2s	~21.6 token/s

饲养员