7900XTX vLLM Qwen3.6-27B W4A16 kernel 41.5 tk/s 併發273 tk/s

Reply to 7900XTX vLLM Qwen3.6-27B W4A16 kernel 41.5 tk/s 併發273 tk/s on Sun, 31 May 2026 00:29:56 GMT

uly chen — Sun, 31 May 2026 00:29:56 GMT

附帶一題這個context 大小很極限是把ubuntu gdm圖形介面關掉跑無頭有gdm的會oom要再降

uly chen — Sun, 31 May 2026 00:23:04 GMT

補圖

terry — Sat, 30 May 2026 17:07:25 GMT

有需要的抄作业，反馈下，贴主补一点截图。单独VENV是必须，一定要和ComfyUI分开，我深受其害。