Reply to RTX 3080 20GB 上以 256k / ~45 tk/s 运行 Qwen3.6-35B-A3B-Q4-K-M(ubuntu) on Tue, 19 May 2026 12:43:12 GMT

Tide — Tue, 19 May 2026 12:43:12 GMT

@simo9052 我准备抄你的作业

Reply to RTX 3080 20GB 上以 256k / ~45 tk/s 运行 Qwen3.6-35B-A3B-Q4-K-M(ubuntu) on Tue, 19 May 2026 11:38:53 GMT

terry — Tue, 19 May 2026 11:38:53 GMT

跑27b要全量推理，你显存不够。35b专家之外可以卸载到内存里。你3080 20G能跑到这个水平很牛了。