跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 7900xtx到底怎麼搞?搞四個小時了

7900xtx到底怎麼搞?搞四個小時了

已定时 已固定 已锁定 已移动 AI硬件
5 帖子 4 发布者 130 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 艷陽天艷 离线
    艷陽天艷 离线
    艷陽天
    编写于 最后由 编辑
    #1

    抱歉我是小白,我是安装在native Ubuntu 24.04 LTS, 之前的llama.cpp被minimax m2.7指导重新compile成纯CPU模式,现在我装上7900xtx,但一直缺东缺西的,已经搞超过四小时了,要疯了,免费的Claude也干掉两帐号的额度,现在改用minimax继续折腾,谁救救我呀?我可以删除llama.cop重新下载会更快吗?

    1 条回复 最后回复
    0
    • 艷陽天艷 离线
      艷陽天艷 离线
      艷陽天
      编写于 最后由 编辑
      #2

      minimax 再搞了半个小时,现在终于回覆说他成功使用Vulkan跑llama.cpp了,说7900xtx是RDNA3架构,不需要ROCm,他说的对吗?

      1 条回复 最后回复
      0
      • terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #3

        😢你看了我的视频没?你直接去llama.cpp github网站下载可执行程序就行了。用vulkan也行,不差。

        油管:https://www.youtube.com/@抡锤者

        1 条回复 最后回复
        0
        • XiaoteX 在线
          XiaoteX 在线
          Xiaote
          编写于 最后由 编辑
          #4

          @艷陽天 折腾4小时确实折磨,我帮你理一下思路,其实就两条路:

          方案一(最快):Vulkan + 预编译二进制
          minimax 说得对,7900XTX是RDNA3,Vulkan确实能用,而且性能不差多少。不用删除llama.cpp,直接从GitHub Releases下载预编译的Vulkan版二进制就行:

          1. 去 https://github.com/ggml-org/llama.cpp/releases 下载 llama-bench-vulkan 或带 vulkan 的 release
          2. 或者直接 wget https://github.com/ggml-org/llama.cpp/releases/latest/download/llama-bench-vulkan-x86_64-linux.tar.xz
          3. 解压就能用,不需要编译
            验证命令:./llama-cli -m /path/to/model.gguf -n 32 -ngl 99

          方案二(性能更好):ROCm + HIP编译
          Vulkan也够用,但如果想发挥7900XTX的全部性能,还是建议走ROCm:

          1. 装ROCm 6.2+:sudo apt install rocm-hip-libraries(从AMD官方源)
          2. 确认显卡能被识别:rocminfo 应该能看到 GFX1100
          3. 重新编译llama.cpp:
          cmake -B build -DGGML_HIP_ROCWMMA=ON -DCMAKE_C_COMPILER=hipcc -DCMAKE_CXX_COMPILER=hipcc
          cmake --build build --config Release -j$(nproc)
          
          1. 编译完 ./build/bin/llama-cli 就是ROCm版

          关于要不要删掉重下:不需要删。你现在的llama.cpp被编译成纯CPU模式了,重新编译一次就行,或者直接下载Vulkan预编译版更省事。两种方式互不冲突。

          建议先从方案一入手,5分钟就能跑起来,用Vulkan跑熟了再考虑折腾ROCm。加油!🚀

          1 条回复 最后回复
          0
          • G 离线
            G 离线
            goodhat5405
            编写于 最后由 goodhat5405 编辑
            #5

            其实还好,开着GMINI就装,左ctrl+C 右CTRL- V。再交换,一会就好了
            就是要明确思路,把自己要想的事,说说清楚,7900XTX很吊的

            1 条回复 最后回复
            1

            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

            有了你的建议,这篇帖子会更精彩哦 💗

            注册 登录
            回复
            • 在新帖中回复
            登录后回复
            • 从旧到新
            • 从新到旧
            • 最多赞同


            • 登录

            • 没有帐号? 注册

            • 登录或注册以进行搜索。
            • 第一个帖子
              最后一个帖子
            0
            • 版块
            • 最新
            • 标签
            • 热门
            • 用户
            • 群组