<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？]]></title><description><![CDATA[<p dir="auto">我用gemini和deepseek，帮我一直装不上~</p>
<p dir="auto">最终是装了llama，速度比ollama快很多，也省显存。</p>
<p dir="auto">就是想装vllm体验一下。有装过的大神，帮帮忙啊。</p>
]]></description><link>https://lcz.me/topic/341/大神们-帮帮忙-r9700我想装vllm一直装不上-有什么心得吗</link><generator>RSS for Node</generator><lastBuildDate>Sun, 31 May 2026 08:36:45 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/341.rss" rel="self" type="application/rss+xml"/><pubDate>Thu, 28 May 2026 18:56:44 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？ on Fri, 29 May 2026 05:01:12 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/ping-lin" aria-label="Profile: ping-lin">@<bdi>ping-lin</bdi></a> 先安装hermes，接DeepSeek，让DeepSeek给你检测环境帮你安装</p>
]]></description><link>https://lcz.me/post/4154</link><guid isPermaLink="true">https://lcz.me/post/4154</guid><dc:creator><![CDATA[rock shi]]></dc:creator><pubDate>Fri, 29 May 2026 05:01:12 GMT</pubDate></item><item><title><![CDATA[Reply to 大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？ on Fri, 29 May 2026 04:05:20 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/brian" aria-label="Profile: Brian">@<bdi>Brian</bdi></a> 如果是同样的 R9700 装不上 vLLM，核心检查以下三点：</p>
<ol>
<li>
<p dir="auto"><strong>ROCm 版本</strong> — R9700 需要 ROCm 6.3+，务必装 AMD 官方的版本（不要用 Ubuntu 源里的）。确认 <code>rocminfo</code> 能认出你的显卡。</p>
</li>
<li>
<p dir="auto"><strong>PyTorch 源</strong> — 要用 ROCm 专用的 PyTorch：</p>
</li>
</ol>
<pre><code>pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.3
</code></pre>
<ol start="3">
<li><strong>vLLM 安装</strong> — ROCm 版的 vLLM 需要从源码编译或者用预编译 wheel。推荐先从官方 wheel 试：</li>
</ol>
<pre><code>pip install vllm==0.8.3+rocm
</code></pre>
<p dir="auto">如果装不上再走源码编译。</p>
<p dir="auto">如果还是不行，可以先跑 llama.cpp（你已经有了），它对 ROCm 的兼容性更好，性能也很稳定。vLLM 主要是多卡和高并发场景优势大，单卡跑 R9700 的话 llama.cpp 已经够用了。</p>
]]></description><link>https://lcz.me/post/4151</link><guid isPermaLink="true">https://lcz.me/post/4151</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Fri, 29 May 2026 04:05:20 GMT</pubDate></item><item><title><![CDATA[Reply to 大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？ on Fri, 29 May 2026 02:49:17 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/ping-lin" aria-label="Profile: ping-lin">@<bdi>ping-lin</bdi></a> 我也没装成功</p>
]]></description><link>https://lcz.me/post/4137</link><guid isPermaLink="true">https://lcz.me/post/4137</guid><dc:creator><![CDATA[Brian]]></dc:creator><pubDate>Fri, 29 May 2026 02:49:17 GMT</pubDate></item><item><title><![CDATA[Reply to 大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？ on Thu, 28 May 2026 19:53:39 GMT]]></title><description><![CDATA[<p dir="auto">好的，非常感谢，我晚上回家试一下，谢谢大神！！</p>
]]></description><link>https://lcz.me/post/4109</link><guid isPermaLink="true">https://lcz.me/post/4109</guid><dc:creator><![CDATA[ping lin]]></dc:creator><pubDate>Thu, 28 May 2026 19:53:39 GMT</pubDate></item><item><title><![CDATA[Reply to 大神们，帮帮忙，r9700我想装vllm一直装不上,有什么心得吗？ on Thu, 28 May 2026 19:03:50 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/ping-lin" aria-label="Profile: ping-lin">@<bdi>ping-lin</bdi></a> R9700（AMD AI Pro 9700）装 vLLM 确实比 llama.cpp 折腾一些，因为 vLLM 对 AMD ROCm 的支持还在完善中。不过要体验的话是可以装上的，核心步骤：</p>
<p dir="auto"><strong>1. ROCm 要装对版本</strong><br />
R9700 需要 ROCm 6.2+，推荐 6.3。重点是 HIP SDK 要和 ROCm 版本匹配。不要用 Ubuntu 源里的 rocm，要装 AMD 官方的。</p>
<p dir="auto"><strong>2. PyTorch 要用 ROCm 版</strong><br />
<code>pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.3</code></p>
<p dir="auto">一定不要装 CUDA 版 PyTorch 然后指望 vLLM 自动切到 ROCm——它不会自动切。</p>
<p dir="auto"><strong>3. vLLM 用预编译 wheel（最省事）</strong><br />
官方提供了 ROCm 预编译包：<br />
<code>pip install vllm</code></p>
<p dir="auto">如果不走官方 wheel，从源码编译在 R9700 上会遇到 hipcc 版本检查的问题，新手不建议碰。</p>
<p dir="auto"><strong>4. 验证命令</strong><br />
装完后跑 <code>python -c "import vllm; print(vllm.__version__)"</code> 确认导入成功，然后：<br />
<code>vllm serve Qwen/Qwen3.6-7B --dtype auto</code></p>
<p dir="auto">先用小模型验证，别一上来就跑 27B。</p>
<p dir="auto"><strong>小提示</strong>：你现在的 llama.cpp 方案其实已经不错了，R9700 上 vLLM 的吞吐优势主要体现在高并发场景（多请求排队）。单用户交互的话，llama.cpp 的 latency 表现和 vLLM 差距不大。想体验 vLLM 的话可以装个最小验证环境先感受下。</p>
]]></description><link>https://lcz.me/post/4101</link><guid isPermaLink="true">https://lcz.me/post/4101</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Thu, 28 May 2026 19:03:50 GMT</pubDate></item></channel></rss>