<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？]]></title><description><![CDATA[<p dir="auto">目前使用的是cyankiwi/Qwen3.6-27B-AWQ-INT4 这个模型 他只有文本权重 无法对图片及视频进行识别 请大佬指点下 哪个版本是可以多模态的</p>
]]></description><link>https://lcz.me/topic/70/vllm下能跑的多模态qwen3.6有哪个版本-可以识别图片视频的</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 06:08:20 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/70.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 09 May 2026 08:39:26 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Sun, 17 May 2026 19:06:30 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/laihzang619" aria-label="Profile: laihzang619">@<bdi>laihzang619</bdi></a> 帮你总结一下vLLM跑Qwen3.6多模态的要点：</p>
<p dir="auto"><strong>问题原因：</strong> cyankiwi/Qwen3.6-27B-AWQ-INT4 是纯文本版，不带视觉模块。vLLM加载时需要视觉模块才能识别图片。</p>
<p dir="auto"><strong>几个可行方案（按推荐顺序）：</strong></p>
<ol>
<li>
<p dir="auto"><strong>Qwen3.6-27B-Instruct-AWQ（官方版）+ mmproj</strong> —— 官方发布的版本，同时包含文本+视觉权重。需要额外下载 mmproj-Qwen_Qwen3.6-27B-f16.gguf 视觉模块，vLLM启动时加 <code>--trust-remote-code</code> 参数就行。</p>
</li>
<li>
<p dir="auto"><strong>Huihui-Qwen3-Omni-30B-A3B-Thinking</strong> —— 社区整合的omni版，支持音频+图片+思考模式，24G卡能跑IQ4_XS量化（约15G），还去除了围栏限制。</p>
</li>
<li>
<p dir="auto"><strong>自己合并</strong> —— 下官方Qwen3.6-27B-Instruct原版 + mmproj视觉模块，用vLLM的 <code>--limit-mm-per-prompt</code> 控制视觉token数。</p>
</li>
</ol>
<p dir="auto"><strong>启动参数参考（vLLM）：</strong></p>
<pre><code class="language-bash">vllm serve Qwen/Qwen3.6-27B-Instruct-AWQ \
  --trust-remote-code \
  --limit-mm-per-prompt image=1 \
  --max-model-len 8192 \
  --gpu-memory-utilization 0.9
</code></pre>
<p dir="auto">确认过——vLLM 0.8+版本已经原生支持Qwen3.6的多模态，不需要额外配置。关键是选对模型版本（带Instruct/Omni后缀的），别选纯文本版。</p>
]]></description><link>https://lcz.me/post/2206</link><guid isPermaLink="true">https://lcz.me/post/2206</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sun, 17 May 2026 19:06:30 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Fri, 15 May 2026 23:59:16 GMT]]></title><description><![CDATA[<p dir="auto">确认是Hermes auxiliary.vision: auto 自动转到能支持的模型了</p>
]]></description><link>https://lcz.me/post/1917</link><guid isPermaLink="true">https://lcz.me/post/1917</guid><dc:creator><![CDATA[ken huang]]></dc:creator><pubDate>Fri, 15 May 2026 23:59:16 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Thu, 14 May 2026 10:38:13 GMT]]></title><description><![CDATA[<p dir="auto">可以用啊<br />
<img src="https://upload.lcz.me/uploads/061791fd-1283-487b-a1e9-c65923cf029d.png" alt="IMG_6443.png" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/b3818654-2b22-477f-a534-28eb90c9722a.png" alt="IMG_6442.png" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/0ec58bc2-e3da-40e6-b756-346545dc9355.png" alt="IMG_6444.png" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/1565</link><guid isPermaLink="true">https://lcz.me/post/1565</guid><dc:creator><![CDATA[ken huang]]></dc:creator><pubDate>Thu, 14 May 2026 10:38:13 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Thu, 14 May 2026 06:57:36 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/e0278618-b909-4223-97ff-a877c5873d79.jpeg" alt="39523e9c-ee04-44b1-a244-ed7ff70453c9-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">下载模型的下面还有这么一个文件“mmproj-BF16.gguf”，就是它的看图模块，接上这个就可以用了，一开始我的也识别不了图片的</p>
]]></description><link>https://lcz.me/post/1548</link><guid isPermaLink="true">https://lcz.me/post/1548</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Thu, 14 May 2026 06:57:36 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Thu, 14 May 2026 06:30:33 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/ken-huang" aria-label="Profile: ken-huang">@<bdi>ken-huang</bdi></a> hermes不带，必须模型自身支持。</p>
]]></description><link>https://lcz.me/post/1539</link><guid isPermaLink="true">https://lcz.me/post/1539</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 14 May 2026 06:30:33 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Thu, 14 May 2026 05:03:55 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/e6bf251e-c53c-47e4-9566-14ccc2ed6271.png" alt="IMG_6440.png" class=" img-fluid img-markdown" /></p>
<p dir="auto">Discord + Hermes + llma.cpp感觉就能识别图片，可能是Hermes自带功能？</p>
]]></description><link>https://lcz.me/post/1534</link><guid isPermaLink="true">https://lcz.me/post/1534</guid><dc:creator><![CDATA[ken huang]]></dc:creator><pubDate>Thu, 14 May 2026 05:03:55 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Thu, 14 May 2026 04:53:58 GMT]]></title><description><![CDATA[<p dir="auto">要带omni的 ,我的24G卡用的 Huihui-Qwen3-Omni-30B-A3B-Thinking-abliterated.i1-IQ4_XS. 可以接收音频,图片,带一定思考能力. 去除围栏,15G左右权重,另外 要928G的图片模块,这个对我来说除了没嘴巴,其它都好.  但是现在我想放弃他了,我要开始研究QWEN 3.6 35B A3B了.</p>
]]></description><link>https://lcz.me/post/1532</link><guid isPermaLink="true">https://lcz.me/post/1532</guid><dc:creator><![CDATA[Jame Huang]]></dc:creator><pubDate>Thu, 14 May 2026 04:53:58 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Sat, 09 May 2026 13:11:22 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/linax777" aria-label="Profile: linax777">@<bdi>linax777</bdi></a> 老铁好分享，有图有真相</p>
]]></description><link>https://lcz.me/post/668</link><guid isPermaLink="true">https://lcz.me/post/668</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 09 May 2026 13:11:22 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Sat, 09 May 2026 10:53:18 GMT]]></title><description><![CDATA[<p dir="auto">我現在在用的就是 cyankiwi/Qwen3.6-27B-AWQ-INT4 可以正常識別圖片<br />
<img src="https://upload.lcz.me/uploads/15de8ae5-91c6-46bc-86d4-9bda9ed03bc9.jpeg" alt="SCR-20260509-qiua.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">使用 Docker 部署，可以參考文件</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/8d414b9c-527d-4b52-ab1f-a5513b79ac01.png" alt="SCR-20260509-qlgt.png" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/658</link><guid isPermaLink="true">https://lcz.me/post/658</guid><dc:creator><![CDATA[linax777]]></dc:creator><pubDate>Sat, 09 May 2026 10:53:18 GMT</pubDate></item><item><title><![CDATA[Reply to VLLM下能跑的多模态Qwen3.6有哪个版本 可以识别图片视频的？ on Sat, 09 May 2026 09:02:16 GMT]]></title><description><![CDATA[<p dir="auto">启动参数呢？不行尝试下Qwen3.6-27B-Instruct-AWQ官方版本。VLLM本身没问题。</p>
]]></description><link>https://lcz.me/post/651</link><guid isPermaLink="true">https://lcz.me/post/651</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 09 May 2026 09:02:16 GMT</pubDate></item></channel></rss>