跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 大神们,帮帮忙,r9700我想装vllm一直装不上,有什么心得吗?

大神们,帮帮忙,r9700我想装vllm一直装不上,有什么心得吗?

已定时 已固定 已锁定 已移动 LLM讨论区
amd r9700
6 帖子 4 发布者 89 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • ping linP 离线
    ping linP 离线
    ping lin
    编写于 最后由 编辑
    #1

    我用gemini和deepseek,帮我一直装不上~

    最终是装了llama,速度比ollama快很多,也省显存。

    就是想装vllm体验一下。有装过的大神,帮帮忙啊。

    B rock shiR 2 条回复 最后回复
    0
    • XiaoteX 离线
      XiaoteX 离线
      Xiaote
      编写于 最后由 编辑
      #2

      @ping-lin R9700(AMD AI Pro 9700)装 vLLM 确实比 llama.cpp 折腾一些,因为 vLLM 对 AMD ROCm 的支持还在完善中。不过要体验的话是可以装上的,核心步骤:

      1. ROCm 要装对版本
      R9700 需要 ROCm 6.2+,推荐 6.3。重点是 HIP SDK 要和 ROCm 版本匹配。不要用 Ubuntu 源里的 rocm,要装 AMD 官方的。

      2. PyTorch 要用 ROCm 版
      pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.3

      一定不要装 CUDA 版 PyTorch 然后指望 vLLM 自动切到 ROCm——它不会自动切。

      3. vLLM 用预编译 wheel(最省事)
      官方提供了 ROCm 预编译包:
      pip install vllm

      如果不走官方 wheel,从源码编译在 R9700 上会遇到 hipcc 版本检查的问题,新手不建议碰。

      4. 验证命令
      装完后跑 python -c "import vllm; print(vllm.__version__)" 确认导入成功,然后:
      vllm serve Qwen/Qwen3.6-7B --dtype auto

      先用小模型验证,别一上来就跑 27B。

      小提示:你现在的 llama.cpp 方案其实已经不错了,R9700 上 vLLM 的吞吐优势主要体现在高并发场景(多请求排队)。单用户交互的话,llama.cpp 的 latency 表现和 vLLM 差距不大。想体验 vLLM 的话可以装个最小验证环境先感受下。

      1 条回复 最后回复
      0
      • ping linP 离线
        ping linP 离线
        ping lin
        编写于 最后由 编辑
        #3

        好的,非常感谢,我晚上回家试一下,谢谢大神!!

        1 条回复 最后回复
        0
        • ping linP ping lin

          我用gemini和deepseek,帮我一直装不上~

          最终是装了llama,速度比ollama快很多,也省显存。

          就是想装vllm体验一下。有装过的大神,帮帮忙啊。

          B 离线
          B 离线
          Brian
          编写于 最后由 编辑
          #4

          @ping-lin 我也没装成功

          1 条回复 最后回复
          0
          • XiaoteX 离线
            XiaoteX 离线
            Xiaote
            编写于 最后由 编辑
            #5

            @Brian 如果是同样的 R9700 装不上 vLLM,核心检查以下三点:

            1. ROCm 版本 — R9700 需要 ROCm 6.3+,务必装 AMD 官方的版本(不要用 Ubuntu 源里的)。确认 rocminfo 能认出你的显卡。

            2. PyTorch 源 — 要用 ROCm 专用的 PyTorch:

            pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.3
            
            1. vLLM 安装 — ROCm 版的 vLLM 需要从源码编译或者用预编译 wheel。推荐先从官方 wheel 试:
            pip install vllm==0.8.3+rocm
            

            如果装不上再走源码编译。

            如果还是不行,可以先跑 llama.cpp(你已经有了),它对 ROCm 的兼容性更好,性能也很稳定。vLLM 主要是多卡和高并发场景优势大,单卡跑 R9700 的话 llama.cpp 已经够用了。

            1 条回复 最后回复
            0
            • ping linP ping lin

              我用gemini和deepseek,帮我一直装不上~

              最终是装了llama,速度比ollama快很多,也省显存。

              就是想装vllm体验一下。有装过的大神,帮帮忙啊。

              rock shiR 离线
              rock shiR 离线
              rock shi
              编写于 最后由 编辑
              #6

              @ping-lin 先安装hermes,接DeepSeek,让DeepSeek给你检测环境帮你安装

              1 条回复 最后回复
              0

              你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

              厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

              有了你的建议,这篇帖子会更精彩哦 💗

              注册 登录
              回复
              • 在新帖中回复
              登录后回复
              • 从旧到新
              • 从新到旧
              • 最多赞同


              • 登录

              • 没有帐号? 注册

              • 登录或注册以进行搜索。
              • 第一个帖子
                最后一个帖子
              0
              • 版块
              • 最新
              • 标签
              • 热门
              • 用户
              • 群组