4080s 32g 涨价了
-
@暧昧光影
一台主機跑兩張卡
Unbuntu環境
3090 24gb 跑Hermes agent llama.ccp本地模型
qwen3.6 27b q4 k m.gguf
Kv cach q4
dflash
MTP
turboquant
上下文128k
CUDA_VISIBLE_DEVICES=0 ./llama-server
-m qwen3.6-27b-q4_k_m.gguf
-c 131072
--flash-attn
--cache-type-k q4_0
--cache-type-v q4_0
--turbo-quant
--draft 2
-ngl 994080s 32gb 跑comfyui 自動批量生產視頻
CUDA_VISIBLE_DEVICES=1 python main.py --listen --highvram我問Gemini 的
-
@暧昧光影
一台主機跑兩張卡
Unbuntu環境
3090 24gb 跑Hermes agent llama.ccp本地模型
qwen3.6 27b q4 k m.gguf
Kv cach q4
dflash
MTP
turboquant
上下文128k
CUDA_VISIBLE_DEVICES=0 ./llama-server
-m qwen3.6-27b-q4_k_m.gguf
-c 131072
--flash-attn
--cache-type-k q4_0
--cache-type-v q4_0
--turbo-quant
--draft 2
-ngl 994080s 32gb 跑comfyui 自動批量生產視頻
CUDA_VISIBLE_DEVICES=1 python main.py --listen --highvram我問Gemini 的
-
4080s 32g的保修是个定时炸弹。像博主说的,软件硬件总得折腾一个,我选择9700,我宁可折腾软件
-
4080s 32g的保修是个定时炸弹。像博主说的,软件硬件总得折腾一个,我选择9700,我宁可折腾软件
@Heinlich-SS 我应该把话说清楚,小白建议折腾硬件,懂技术的人折腾软件。
-
@Sam-Hsu 方案不错。3090跑qwen 27b是真的猛,turboquant也不错,4080S 32 comfyui可以爽完。大部分情况下不需要买4090 48G,5090, RTX Pro5000之类的。