感謝大大無私分享,DFlash 概念很酷,跟 Pyramid 算法很像,更有效發揮顯卡效能!
另外想請問,DFlash 跟 MTP 不能混著用對吧?感覺是相互排斥的
Chang Ching-Chun
@Chang Ching-Chun
-
Lucebox DFlash + PFlash 编译与部署指南 Qwen3.6-27B 方便抄作业 (Linux) -
部署llm用于写代码,构建本地项目感謝大大,數據非常詳盡

-
分享自己的經驗 # 7900 XTX 本地 LLM 優化實測報告(Qwen3.6-27B)感謝大大無私分享

-
7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享感謝大神分享!好人一生平安