~/llama.cpp/build/bin/llama-server
--model ~/models/Qwen3.6-27B-OTQ-DYN-Q4_K_M.gguf
--mmproj ~/models/qwen3.6-27b-mmproj-F16.gguf
--n-gpu-layers 999
--ctx-size 192000
--flash-attn on
--temp 1.0
--top-p 0.95
--top-k 20
--presence-penalty 1.5
--chat-template-kwargs '{"enable_thinking":false}'
--port 8080
南方鹰
@南方鹰
-
技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 LLM 跑27b 模型 那位大哥给我一个参数 能跑的顺畅点 -
技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 LLM 跑27b 模型 那位大哥给我一个参数 能跑的顺畅点技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 LLM 跑27b 模型 那位大哥给我一个参数 能跑的顺畅点 折腾了一晚上 只有40T/S
-
技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 的配置 请问各路大神推荐本地部署什么模型比较好!还一块 3090 到时候装一起!双卡流
-
技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 的配置 请问各路大神推荐本地部署什么模型比较好!谢谢 大神指导!搭建好到时候上图给大家看看!对了系统用win 还 LINUX 呢?
-
技嘉 mz 32 -aro 主板 256 DDR4 2400 配4090 48g 显卡 的配置 请问各路大神推荐本地部署什么模型比较好!技嘉 mz 32 -aro 主板,
CPU :7302,
内存:256 DDR4 2400
魔改 4090 48g 显卡 水冷 的配置
请问各路大神推荐本地部署什么模型比较好!主要场景:文生图,当本地 爱马仕 的大脑用!
谢谢各位大神!!