跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 买7900XTX 还是9700XT

买7900XTX 还是9700XT

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 11 发布者 193 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • kop wangK 离线
    kop wangK 离线
    kop wang
    编写于 最后由 kop wang 编辑
    #2

    如果只说绝对性能,7900XTX更强。但是问题是24GB显存只能极限容纳Q4_K_M+8位量化kv+128K上下文。结合你的需求,连驱动向量数据库的小模型都放不下了。

    如果说只是背景异步工作,那么R9700的32GB的显存能让你跑的更从容一些。比如可以适当提高模型精度,使用全量上下文长度等等。代价就是prefill和decode性能稍有下降。

    还有一点值得考虑,R9700只有涡轮版本。7900XTX则是下压风扇版本。他们的噪音体验有所区别。

    虚心交流,一起进步

    1 条回复 最后回复
    0
    • kop wangK kop wang 从 LLM讨论区 移动了该主题
    • H 离线
      H 离线
      huchaoran
      编写于 最后由 编辑
      #3

      我问了AI,是这么回复的:

      项目 7900XTX R9700
      ROCm 更成熟 新
      Vulkan优化 更成熟 快速进步
      社区资料 更多 少
      gfx支持 稳 gfx1201较新
      llama.cpp 非常成熟 已可用
      Windows AI 更成熟 新
      1 条回复 最后回复
      1
      • H huchaoran

        大佬们,看了坛主的视频,AMD显卡已经能在linux下跑LLM了,而且看介绍qwen 27b稠密模型很适合作为本地AI驱动hermes,那以当前的环境、驱动,是买7900XTX 还是9700XT?哪个更合适跑qwen 27b稠密 驱动hermes?hermes主要干一些自动搜文献整理、给zotero看论文、翻译、总结,以及给 obsidian写笔记的工作。实时对话不多。

        williamlouisW 离线
        williamlouisW 离线
        williamlouis
        编写于 最后由 编辑
        #4

        @huchaoran 个人意见。省钱还是 DS 在线。怕被 蒸馏。还是研究个大显存的。意向锁定了 AMD 。那么我建议上 9700 32G。战未来吗。显存这玩意 这俩卡升级 显存的价值不大。

        个人主页:xlkj.org Telegram https://t.me/xlkjorg

        1 条回复 最后回复
        0
        • XiaoteX 离线
          XiaoteX 离线
          Xiaote
          编写于 最后由 编辑
          #5

          @huchaoran 两位大佬的回复都挺到位的,我从 Hermes 实际使用的角度补充一下。

          Qwen 3.6 27B 确实是目前 Hermes Agent 的推荐模型,工具调用能力在本地模型里属于第一梯队。说说显存:

          24GB vs 32GB 的实际差别

          Qwen 3.6 27B Q4_K_M 大概占 16.5GB,加上 Hermes Agent 自身的工具运行(网页搜索、Zotero API 调用、Obsidian 插件通信等),24GB 跑满 128K 上下文的余量非常小。你提到的「自动搜文献整理、给 Zotero 看论文、翻译、总结」这些任务实际跑起来,Agent 在后台开多个工具调用时,余量不足容易 OOM。

          R9700 的 32GB 在这个场景下确实从容很多——可以上 Q6 量化甚至 Q8,上下文开满也不慌。

          ROCm 兼容性

          7900XTX 的 gfx1100 确实更成熟,但 R9700 (gfx1201) 在 ROCm 6.3+ 上已经有官方支持。llama.cpp 的 ROCm 后端和 vLLM 的 ROCm 分支都已经适配了。近期实测,llama.cpp + ROCm 跑 Qwen 3.6 27B 在 R9700 上已经稳定可用了。而且 R9700 的 vulkan 后端也在快速迭代。

          结论

          如果目标是「跑 Hermes Agent + Qwen 3.6 27B 做日常工作流」,我会推荐 R9700 32GB。绝对速度差一点(decode 大概差 20-30%),但 32GB 的余量让你能:上更高精度、跑更长上下文、同时开多个工具不掉链子。这对 Agent 工作流比纯推理速度更重要。

          你说的涡轮版本噪音问题,可以考虑换猫扇或者降压优化,坛子里有相关帖子可以参考。

          1 条回复 最后回复
          0
          • L 在线
            L 在线
            laobenxiong
            编写于 最后由 编辑
            #6

            都不提价格区别...

            kop wangK 1 条回复 最后回复
            1
            • L laobenxiong

              都不提价格区别...

              kop wangK 离线
              kop wangK 离线
              kop wang
              编写于 最后由 kop wang 编辑
              #7

              @laobenxiong 我个人理解,在楼主这个需求中,其实价格因素的占比很低。

              7900XTX和R9700他们的显存大小不同,能运行的模型参数是不同的。R9700能跑的参数,7900XTX就是跑不了。

              模型参数,是无法客观衡量这其中的价值的,也就谈不上性价比。
              同理,噪音问题,性能问题也一样。

              举个稍微夸张点的例子,张雪摩托,五菱面包,都是几万块钱。他们之间价格也有区别。你只能从他们之间的载货能力,赛道性能的角度探讨使用场景。你探讨张雪摩托比五菱面包便宜一万块其实是没意义的。

              虚心交流,一起进步

              1 条回复 最后回复
              0
              • AGIA 离线
                AGIA 离线
                AGI
                编写于 最后由 编辑
                #8

                先买一个7900xtx,不够用了,就再买一个,显存48g,价格和r9700一样

                1 条回复 最后回复
                0
                • G 离线
                  G 离线
                  goodhat5405
                  编写于 最后由 编辑
                  #9

                  4000一个不要纠结,先玩起来,比在这想重要得多

                  1 条回复 最后回复
                  1
                  • H 离线
                    H 离线
                    huchaoran
                    编写于 最后由 编辑
                    #10

                    价格不是问题,主要是电脑只有一个插槽了,被4090D占去了一个,只有一个X16插槽了,还只是X4的速度,意见没法考虑未来再加一个显卡的事情。4090D用来跑其它计算,7900XTX或者9700XT用来跑千问,所以纠结买哪个更合适点

                    1 条回复 最后回复
                    0
                    • sirwangS 离线
                      sirwangS 离线
                      sirwang
                      编写于 最后由 编辑
                      #11

                      新发布了个400. 160G显存,啥也不缺了。

                      terryT 1 条回复 最后回复
                      0
                      • sirwangS sirwang

                        新发布了个400. 160G显存,啥也不缺了。

                        terryT 在线
                        terryT 在线
                        terry
                        编写于 最后由 编辑
                        #12

                        @sirwang 那玩意就是395的马甲,尴尬的很,性能提升微乎其微,这么大的显存能干嘛?

                        油管:https://www.youtube.com/@抡锤者

                        sirwangS 1 条回复 最后回复
                        0
                        • terryT terry

                          @sirwang 那玩意就是395的马甲,尴尬的很,性能提升微乎其微,这么大的显存能干嘛?

                          sirwangS 离线
                          sirwangS 离线
                          sirwang
                          编写于 最后由 编辑
                          #13

                          @terry 硬件先走,生态慢慢适配嘛。😀

                          jenaflexJ 1 条回复 最后回复
                          0
                          • sirwangS sirwang

                            @terry 硬件先走,生态慢慢适配嘛。😀

                            jenaflexJ 离线
                            jenaflexJ 离线
                            jenaflex
                            编写于 最后由 编辑
                            #14

                            @sirwang 我个人觉得AI Max 395或者其马甲,玩具成分多一点,如果不贵,想玩可以搞,大不了以后AI性能更不上了,内存大可以跑很多PVE虚拟机。
                            最好是能直接出一个带x8 PCIE插槽得版本,插块4090 48GB就可以all-in-one了

                            1 条回复 最后回复
                            0
                            • kop wangK 离线
                              kop wangK 离线
                              kop wang
                              编写于 最后由 编辑
                              #15

                              那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                              统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                              mac最起码还有mlx兜底。

                              虚心交流,一起进步

                              A 1 条回复 最后回复
                              0
                              • kop wangK kop wang

                                那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                mac最起码还有mlx兜底。

                                A 在线
                                A 在线
                                applejuice
                                编写于 最后由 编辑
                                #16

                                @kop-wang 说:

                                那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                mac最起码还有mlx兜底。

                                Mac 高级版带宽还大不少

                                sirwangS 1 条回复 最后回复
                                0
                                • A applejuice

                                  @kop-wang 说:

                                  那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                  统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                  mac最起码还有mlx兜底。

                                  Mac 高级版带宽还大不少

                                  sirwangS 离线
                                  sirwangS 离线
                                  sirwang
                                  编写于 最后由 编辑
                                  #17

                                  @applejuice 等生态。

                                  INTEL 的卡也要出大显存的。对着AMD这种量的级别。带宽对着5090这个级别。不知道最终咋样。

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 登录或注册以进行搜索。
                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组