这个Lucebox 有点牛
bin flamebox
@bin flamebox
-
Lucebox DFlash + PFlash 7900XTX Qwen3.6-27B ~2.8–3.1x加速 测试数据分享 -
分享自己的經驗 # 7900 XTX 本地 LLM 優化實測報告(Qwen3.6-27B)@terry 一开始没有问题,啥都装好了,跑llm一切正常。就是跑了个comfyui后不认驱动了。。。
之前测试过,如果跑llm的话,现在vulkan比rocm好太多了。
现在还是觉得装回windows方便不少,性能基本差不了多少,关键我不是24小时开机使用,偶尔直接玩玩游戏,win更合适
现在comfyui有windows桌面版一键直装了,直接内置装好rocm需要的python虚拟环境,比自己github clone方便很多了 -
分享自己的經驗 # 7900 XTX 本地 LLM 優化實測報告(Qwen3.6-27B)@terry

拿到手了。一开始用的是linux,一通环境全部装好了,什么rocm、vulkan乱七八糟的。本来挺顺的,但后来跑comfyui后却莫名卡死了,然后就不认驱动了
。怎么反复重装都没用,就算恢复到最开始的系统快照也是这样,莫名其妙!想一想,还是装回windows好了。。。
使用llama.cpp的vulkan后端,配合最新整合mtp的主线编译+mtp专用的量化模型。跑出的成绩还行吧。预填充500-600tk/s,输出有36-65tk/s。上下文我只拉到128k,显存占用不到21个G。
接入到claud code后,实际用起来比预期还好一点。果然预填充速度才是最重要的,如果当初买r9700,可能要差一截 -
分享自己的經驗 # 7900 XTX 本地 LLM 優化實測報告(Qwen3.6-27B)@terry 之前用n卡就是一直开Turboquant的,但现在看到各种说这卡开Turboquant prefill会严重慢,所以比较关心kv 开到Q4_0到底能稳定开到几k上下文。这两天显卡到了我也实测下
-
分享自己的經驗 # 7900 XTX 本地 LLM 優化實測報告(Qwen3.6-27B)昨天淘宝天猫入了全新的蓝宝白金版xtx,5500还能开专票,价格应该算不错了。赶紧来学习。
@chia-an-yang 请教lz现在用q4_0实用的上下文可以开到128k吗