跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 請益 : 7900xtx llama.cpp 用 vulkan 還是 ROCm

請益 : 7900xtx llama.cpp 用 vulkan 還是 ROCm

已定时 已固定 已锁定 已移动 LLM讨论区
10 帖子 5 发布者 305 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 張耀東張 离线
    張耀東張 离线
    張耀東
    编写于 最后由 编辑
    #1

    如題,版主yt幾次提到 7900xtx跑 llamacpp 好像都是用 ROCm,想知道 vulkan 是否更好?
    用途 : hermess agent 跑 qwen 3.6。原本都用 claude code ,但之後 20美訂閱好像要拿掉 claude code 了想找 opencode hermess agent 或是 open claude code做替代,目前還只做簡單測試,因為開發虛擬機在win11 pro 的 hyper-v上。目前只有用windwos 的 ollama跑 qwen 3.6:27n 跑起來也有 30tk/s。後續想知道有沒有需要換到 linux server。

    jenaflexJ 1 条回复 最后回复
    0
    • terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #2

      rocm版本,AI会告诉你Vulkan还行,事实上rocm好。你如果能在win下跑到30t/s,那么到linux下也就这个速度。但是Linux下可以折腾下turboquant dflash等技术,vllm之类的。如果只是写代码我认为没必要。另外关于写代码,你可以研究下找个CN代理,下载CN版本的TRAE,估计注册的时候需要接收下短信,它是免费的,体验很好。

      1 条回复 最后回复
      0
      • 張耀東張 离线
        張耀東張 离线
        張耀東
        编写于 最后由 張耀東 编辑
        #3

        感謝回答,因為爬reddit 和 github 都是說 Vulkan比 ROCm好。我在 TRAE 剛出就知道 但我習慣用純CLI/TUI介面寫code,拋棄vscode很久了,目前開發環境也是 tmux neovim 直接在 terminal 跑 cli ai agent。打算和版主一樣 過半年再看看 等新技術有人折騰好了再用。

        1 条回复 最后回复
        0
        • terryT 离线
          terryT 离线
          terry
          编写于 最后由 编辑
          #4

          暂时没必要折腾,就等不够了再换

          1 条回复 最后回复
          0
          • G 离线
            G 离线
            gggg1234
            编写于 最后由 编辑
            #5

            个人感觉,vulkan pp慢 tg快,rocm pp快 tg慢,跑code agnet还是rocm更舒服

            1 条回复 最后回复
            0
            • 張耀東張 張耀東

              如題,版主yt幾次提到 7900xtx跑 llamacpp 好像都是用 ROCm,想知道 vulkan 是否更好?
              用途 : hermess agent 跑 qwen 3.6。原本都用 claude code ,但之後 20美訂閱好像要拿掉 claude code 了想找 opencode hermess agent 或是 open claude code做替代,目前還只做簡單測試,因為開發虛擬機在win11 pro 的 hyper-v上。目前只有用windwos 的 ollama跑 qwen 3.6:27n 跑起來也有 30tk/s。後續想知道有沒有需要換到 linux server。

              jenaflexJ 离线
              jenaflexJ 离线
              jenaflex
              编写于 最后由 编辑
              #6

              @張耀東

              TLDR,大部分时候 Rcom好
              下面这个博主是个老外软件工程师,做的测试(可以忽略那些 不好用的模型的结果)
              https://kyuz0.github.io/amd-r9700-ai-toolboxes/

              1 条回复 最后回复
              0
              • CHIA AN YANGC 离线
                CHIA AN YANGC 离线
                CHIA AN YANG
                编写于 最后由 编辑
                #7

                同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?

                terryT jenaflexJ 2 条回复 最后回复
                0
                • CHIA AN YANGC CHIA AN YANG

                  同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?

                  terryT 离线
                  terryT 离线
                  terry
                  编写于 最后由 编辑
                  #8

                  @CHIA-AN-YANG 差不多,没问题,ubuntu下也就是25-30

                  1 条回复 最后回复
                  0
                  • CHIA AN YANGC CHIA AN YANG

                    同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?

                    jenaflexJ 离线
                    jenaflexJ 离线
                    jenaflex
                    编写于 最后由 编辑
                    #9

                    @CHIA-AN-YANG 我 7900xt 20G,Windows11 下直接lm studio,rcom,qwen 3.5 或3.6 27b q4km,20k上下文,kv缓存q8,大约23-24 tokens/s

                    1 条回复 最后回复
                    0
                    • CHIA AN YANGC 离线
                      CHIA AN YANGC 离线
                      CHIA AN YANG
                      编写于 最后由 编辑
                      #10

                      謝謝兩位大神回復

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组