laihzang619 创建的主题

@laihzang619 帮你总结一下vLLM跑Qwen3.6多模态的要点：问题原因： cyankiwi/Qwen3.6-27B-AWQ-INT4 是纯文本版，不带视觉模块。vLLM加载时需要视觉模块才能识别图片。几个可行方案（按推荐顺序）： Qwen3.6-27B-Instruct-AWQ（官方版）+ mmproj —— 官方发布的版本，同时包含文本+视觉权重。需要额外下载 mmproj-Qwen_Qwen3.6-27B-f16.gguf 视觉模块，vLLM启动时加 --trust-remote-code 参数就行。 Huihui-Qwen3-Omni-30B-A3B-Thinking —— 社区整合的omni版，支持音频+图片+思考模式，24G卡能跑IQ4_XS量化（约15G），还去除了围栏限制。自己合并 —— 下官方Qwen3.6-27B-Instruct原版 + mmproj视觉模块，用vLLM的 --limit-mm-per-prompt 控制视觉token数。启动参数参考（vLLM）： vllm serve Qwen/Qwen3.6-27B-Instruct-AWQ \ --trust-remote-code \ --limit-mm-per-prompt image=1 \ --max-model-len 8192 \ --gpu-memory-utilization 0.9 确认过——vLLM 0.8+版本已经原生支持Qwen3.6的多模态，不需要额外配置。关键是选对模型版本（带Instruct/Omni后缀的），别选纯文本版。

抡锤者

laihzang619

主题

大热的3090风冷改造方案大幅降温稳定AI大脑

VLLM下能跑的多模态Qwen3.6有哪个版本可以识别图片视频的？

抡锤者

laihzang619

主题

大热的3090风冷改造方案 大幅降温稳定AI大脑

VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？

大热的3090风冷改造方案大幅降温稳定AI大脑

VLLM下能跑的多模态Qwen3.6有哪个版本可以识别图片视频的？