<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？]]></title><description><![CDATA[<p dir="auto">我想购买一个128G的</p>
<ol>
<li>主要是看中他满载功耗低，</li>
<li>统一内存又没有显存焦虑<br />
就是不知道跑Q4_K_M 或者 Q8 ，搭配opencode或者harmes在真实环境下，一般的速度分别是多少？</li>
</ol>
<p dir="auto">多谢各位大佬!</p>
]]></description><link>https://lcz.me/topic/713/请问有没有人可以帮助提供-amd-ai-max-395-跑qwen3.6-27b的速度情况</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 06:51:02 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/713.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 27 Jun 2026 06:34:33 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 23:53:05 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/8e9f89e3-11ca-4431-841d-2375c9db6d93.jpeg" alt="eb545d4d-4ed6-44a3-914c-86132c00d474-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/4548cba3-7c58-489f-a81d-b770ccd9b1fd.jpeg" alt="02b0a55e-ada6-4068-b479-dab05ba095e1-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/8586</link><guid isPermaLink="true">https://lcz.me/post/8586</guid><dc:creator><![CDATA[lxbs]]></dc:creator><pubDate>Sat, 27 Jun 2026 23:53:05 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 14:47:47 GMT]]></title><description><![CDATA[<p dir="auto">昨天拿到机器了，今天中午才把comfyui和模型下载完成。今天只是测试了一些视频，这几天我会测试一些LLM的东西。我个人还是比较期待‘大模型+comfyui’完全本地运行。的这种需求。</p>
]]></description><link>https://lcz.me/post/8570</link><guid isPermaLink="true">https://lcz.me/post/8570</guid><dc:creator><![CDATA[sirwang]]></dc:creator><pubDate>Sat, 27 Jun 2026 14:47:47 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 14:16:16 GMT]]></title><description><![CDATA[<p dir="auto">120B我只想到GPT-OSS-120B</p>
]]></description><link>https://lcz.me/post/8558</link><guid isPermaLink="true">https://lcz.me/post/8558</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sat, 27 Jun 2026 14:16:16 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 13:49:59 GMT]]></title><description><![CDATA[<p dir="auto">统一内存的方案优势在中等MoE模型，但是目前业界并没有什么拿得出手的122B这类的MoE模型。</p>
]]></description><link>https://lcz.me/post/8543</link><guid isPermaLink="true">https://lcz.me/post/8543</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Sat, 27 Jun 2026 13:49:59 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 13:06:57 GMT]]></title><description><![CDATA[<p dir="auto">Strix Halo只適合跑細小MoE, Dense基本上陣亡</p>
<p dir="auto">可以參考這個<a href="https://github.com/hec-ovi/vllm-awq4-qwen" rel="nofollow ugc">Repo</a></p>
<p dir="auto">附帶一點27B性能截圖:<br />
<img src="https://upload.lcz.me/uploads/51aad651-b2f6-4ff1-b7d9-61c0e3795a46.jpeg" alt="69c97069-e5bd-4ebd-959d-4eccd6aa9c1b-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/50ae4e5f-936f-4fe9-a13e-107bde14bdd7.jpeg" alt="010f1bfe-db33-45a7-b61a-0c2235f69071-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">只能説短問答可用吧...</p>
]]></description><link>https://lcz.me/post/8533</link><guid isPermaLink="true">https://lcz.me/post/8533</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sat, 27 Jun 2026 13:06:57 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 08:43:25 GMT]]></title><description><![CDATA[<p dir="auto">就是不太实用，Q4量化 10t/s左右。跑Agent会慢到吐血，prefill几分钟起步。</p>
]]></description><link>https://lcz.me/post/8504</link><guid isPermaLink="true">https://lcz.me/post/8504</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 27 Jun 2026 08:43:25 GMT</pubDate></item><item><title><![CDATA[Reply to 请问有没有人可以帮助提供 AMD AI MAX 395 跑Qwen3.6-27B的速度情况？ on Sat, 27 Jun 2026 07:37:57 GMT]]></title><description><![CDATA[<p dir="auto">我记得好像是 5t/s.<br />
Strix Halo 的推理性能受限于内存带宽而非算力：<br />
UMA 带宽约 215 GB/s（理论值）<br />
27B 模型的 decode 主要是权重流带宽瓶颈<br />
因此量化到 Q8_0 比 BF16 快约 75%，Q4 比 Q8 更快<br />
需要高速推理可以被劝退了。</p>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>精度</th>
<th>权重大小</th>
<th>显存占用</th>
<th>Decode 速度</th>
<th>适用场景</th>
</tr>
</thead>
<tbody>
<tr>
<td>BF16 (vLLM)</td>
<td>51.2 GB</td>
<td>~105 GB</td>
<td><strong>~4.3 t/s</strong></td>
<td>需原生精度、Vision 输入、Responses API</td>
</tr>
<tr>
<td>Q8_0 (llama.cpp)</td>
<td>~27 GB</td>
<td>~35 GB</td>
<td><strong>~7.5 t/s</strong></td>
<td>日常对话、Agent 循环、速度优先</td>
</tr>
<tr>
<td>Q4_K_M</td>
<td>~16.8 GB</td>
<td>更低</td>
<td><strong>~10-12 t/s</strong></td>
<td>长上下文、多模型并发</td>
</tr>
</tbody>
</table>
]]></description><link>https://lcz.me/post/8491</link><guid isPermaLink="true">https://lcz.me/post/8491</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Sat, 27 Jun 2026 07:37:57 GMT</pubDate></item></channel></rss>