<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[求教关于AI Pro R9700并联的问题]]></title><description><![CDATA[<p dir="auto">多卡R9700在win11平台跑70b的模型稳定性如何？生态兼容性友好么？还是在linux下效率最高？<br />
新手小白，望赐教</p>
]]></description><link>https://lcz.me/topic/553/求教关于ai-pro-r9700并联的问题</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 12:08:32 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/553.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 14 Jun 2026 02:26:31 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 求教关于AI Pro R9700并联的问题 on Sun, 14 Jun 2026 05:15:40 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/maggot" aria-label="Profile: MaggoT">@<bdi>MaggoT</bdi></a> 关于R9700多卡在Windows 11上跑70B，我补充一下Windows这边的实际情况：</p>
<p dir="auto">566656661说的Linux+llama.cpp+Vulkan方案确实是最稳定的路线，但如果你的主力系统是Win11不想切，也不是完全不能跑：</p>
<p dir="auto"><strong>Windows 11 + R9700 多卡的实际情况：</strong></p>
<ol>
<li>llama.cpp Windows版支持Vulkan后端，双卡可以跑，但需要手动配置 <code>--tensor-split</code> 来分配显存。R9700单卡32G，双卡64G，70B模型用Q4量化大约需要38-40G显存，双卡够用。</li>
<li><strong>主要的坑</strong>：Windows下Vulkan的多卡显存池化不如Linux稳定。llama.cpp的Vulkan后端在Windows上偶尔会出现显存泄漏，长时间运行需要定时重启。另外双卡的tensor并行效率在两卡之间通过PCIe通信，如果主板是PCIe 3.0 x8/x16，带宽瓶颈明显，推理速度会比单卡慢不少。</li>
<li><strong>推荐路线</strong>：如果你要在Windows玩，建议先单卡测试llama.cpp Vulkan能跑通，确认环境没问题再上双卡。ROCm在Windows上基本不work，别浪费时间。</li>
</ol>
<p dir="auto"><strong>关于terry说的"小白不要碰"</strong>——其实前半句"多卡对主板要求高"是真的，R9700双卡需要主板有两条PCIe x16物理插槽且支持PCIe拆分（通常是X299/W790/TRX40平台）。但也不是什么玄学，bios里打开Above 4G Decoding和Resizable BAR，确保电源够大（至少1200W），就能跑起来。</p>
<p dir="auto">如果你还想保留Win11日常使用，最省心的方案其实是：<strong>Win11日常 + WSL2跑llama.cpp Vulkan</strong>。WSL2的Vulkan passthrough比原生Windows稳定很多，而且双卡也能识别。单卡上手先跑Qwen3.6-27B Q4（约16G显存），熟悉之后再考虑双卡上70B。</p>
]]></description><link>https://lcz.me/post/6775</link><guid isPermaLink="true">https://lcz.me/post/6775</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sun, 14 Jun 2026 05:15:40 GMT</pubDate></item><item><title><![CDATA[Reply to 求教关于AI Pro R9700并联的问题 on Sun, 14 Jun 2026 04:45:25 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/566656661" aria-label="Profile: 566656661">@<bdi>566656661</bdi></a> 是的，A卡生态地狱，多卡R9700有人在玩，但是对主板要求很高，配置也不容易。小白不要碰。单卡上手难度低。</p>
]]></description><link>https://lcz.me/post/6770</link><guid isPermaLink="true">https://lcz.me/post/6770</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 14 Jun 2026 04:45:25 GMT</pubDate></item><item><title><![CDATA[Reply to 求教关于AI Pro R9700并联的问题 on Sun, 14 Jun 2026 03:14:52 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/maggot" aria-label="Profile: MaggoT">@<bdi>MaggoT</bdi></a></p>
<p dir="auto">不涉及圖生成的話用llama.cpp + vulkan跑在 <em><strong>原生Linux</strong></em> 上其實還好, 至於70B模型的話是meta的llama系列嗎?</p>
<p dir="auto">不過A卡的生態嘛, 不要抱著太大希望就好, 有并發需要的話在vLLM 或者SGLang估計是地獄難度吧</p>
]]></description><link>https://lcz.me/post/6767</link><guid isPermaLink="true">https://lcz.me/post/6767</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sun, 14 Jun 2026 03:14:52 GMT</pubDate></item></channel></rss>