Lucebox DFlash + PFlash 7900XTX Qwen3.6-27B ~2.8–3.1x加速 测试数据分享
-
只能等它优化了,至少有专门优化的可以选择不是吗?
@QuincySnow 是啊,希望那哥们加油,最近一段好几天没大版本放出来,但是目前的4k性能跟vulkan差不多,不知道能不能更强,等一段时间再试试看。
-
-
如果是AMD卡的话可以使用https://github.com/Kaden-Schutt/hipfire ,目前还不太成熟,但是我是6650XT在Liunx跑Qwen 3.5 9B可以到达45 tok/s,且如果开启DFlash 之后更快
@QuincySnow 这个你需要自己改代码
-
@terry 更新了tq3_0, 你可以出场了

-
@David-Zhang 最近我不折腾了,我后面还要再买一张xtx再折腾,现在被油管这个AI视频政策弄的头疼,我这几天一直在纠结做什么内容,烦死了。
-
dflash 不错, pflash 要关注一下, 我让gemini 搜索作者承认pflash 不是无损的。 作为agent 我觉得无所谓, 但是编程就有点伤。还是等你们测试实际的效果。
-
@coin1860 嗯嗯,我这几天先测测看
-
问一下 这个配置是必须物理层面的linux环境吗 还是wsl2也可以照抄
-
系统 于 取消固定此主题
-
我以为llama.cpp mtp已经稳定在50-60很爽了,但是prefill在上下文时 prefill稳定的下降,agent影响很大
这个prefill 这么稳定,搞得我再想买一个7900xtx了!不知道质量如何 -
T terry 于 将此主题固定
-
T terry 于 取消固定此主题
-
,A abaalei 引用了 此主题
-
@david-zhang 请问,你这个7900xtx 256k上下文方案能跑多并发吗?还是只能一个。如果不能,你推荐买哪个显卡可以跑多并发?谢谢
,我特么被油管用魔障了。