跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 买7900XTX 还是9700XT

买7900XTX 还是9700XT

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 11 发布者 195 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • H 离线
    H 离线
    huchaoran
    编写于 最后由 编辑
    #1

    大佬们,看了坛主的视频,AMD显卡已经能在linux下跑LLM了,而且看介绍qwen 27b稠密模型很适合作为本地AI驱动hermes,那以当前的环境、驱动,是买7900XTX 还是9700XT?哪个更合适跑qwen 27b稠密 驱动hermes?hermes主要干一些自动搜文献整理、给zotero看论文、翻译、总结,以及给 obsidian写笔记的工作。实时对话不多。

    williamlouisW 1 条回复 最后回复
    0
    • kop wangK 离线
      kop wangK 离线
      kop wang
      编写于 最后由 kop wang 编辑
      #2

      如果只说绝对性能,7900XTX更强。但是问题是24GB显存只能极限容纳Q4_K_M+8位量化kv+128K上下文。结合你的需求,连驱动向量数据库的小模型都放不下了。

      如果说只是背景异步工作,那么R9700的32GB的显存能让你跑的更从容一些。比如可以适当提高模型精度,使用全量上下文长度等等。代价就是prefill和decode性能稍有下降。

      还有一点值得考虑,R9700只有涡轮版本。7900XTX则是下压风扇版本。他们的噪音体验有所区别。

      虚心交流,一起进步

      1 条回复 最后回复
      0
      • kop wangK kop wang 从 LLM讨论区 移动了该主题
      • H 离线
        H 离线
        huchaoran
        编写于 最后由 编辑
        #3

        我问了AI,是这么回复的:

        项目 7900XTX R9700
        ROCm 更成熟 新
        Vulkan优化 更成熟 快速进步
        社区资料 更多 少
        gfx支持 稳 gfx1201较新
        llama.cpp 非常成熟 已可用
        Windows AI 更成熟 新
        1 条回复 最后回复
        1
        • H huchaoran

          大佬们,看了坛主的视频,AMD显卡已经能在linux下跑LLM了,而且看介绍qwen 27b稠密模型很适合作为本地AI驱动hermes,那以当前的环境、驱动,是买7900XTX 还是9700XT?哪个更合适跑qwen 27b稠密 驱动hermes?hermes主要干一些自动搜文献整理、给zotero看论文、翻译、总结,以及给 obsidian写笔记的工作。实时对话不多。

          williamlouisW 在线
          williamlouisW 在线
          williamlouis
          编写于 最后由 编辑
          #4

          @huchaoran 个人意见。省钱还是 DS 在线。怕被 蒸馏。还是研究个大显存的。意向锁定了 AMD 。那么我建议上 9700 32G。战未来吗。显存这玩意 这俩卡升级 显存的价值不大。

          个人主页:xlkj.org Telegram https://t.me/xlkjorg

          1 条回复 最后回复
          0
          • XiaoteX 离线
            XiaoteX 离线
            Xiaote
            编写于 最后由 编辑
            #5

            @huchaoran 两位大佬的回复都挺到位的,我从 Hermes 实际使用的角度补充一下。

            Qwen 3.6 27B 确实是目前 Hermes Agent 的推荐模型,工具调用能力在本地模型里属于第一梯队。说说显存:

            24GB vs 32GB 的实际差别

            Qwen 3.6 27B Q4_K_M 大概占 16.5GB,加上 Hermes Agent 自身的工具运行(网页搜索、Zotero API 调用、Obsidian 插件通信等),24GB 跑满 128K 上下文的余量非常小。你提到的「自动搜文献整理、给 Zotero 看论文、翻译、总结」这些任务实际跑起来,Agent 在后台开多个工具调用时,余量不足容易 OOM。

            R9700 的 32GB 在这个场景下确实从容很多——可以上 Q6 量化甚至 Q8,上下文开满也不慌。

            ROCm 兼容性

            7900XTX 的 gfx1100 确实更成熟,但 R9700 (gfx1201) 在 ROCm 6.3+ 上已经有官方支持。llama.cpp 的 ROCm 后端和 vLLM 的 ROCm 分支都已经适配了。近期实测,llama.cpp + ROCm 跑 Qwen 3.6 27B 在 R9700 上已经稳定可用了。而且 R9700 的 vulkan 后端也在快速迭代。

            结论

            如果目标是「跑 Hermes Agent + Qwen 3.6 27B 做日常工作流」,我会推荐 R9700 32GB。绝对速度差一点(decode 大概差 20-30%),但 32GB 的余量让你能:上更高精度、跑更长上下文、同时开多个工具不掉链子。这对 Agent 工作流比纯推理速度更重要。

            你说的涡轮版本噪音问题,可以考虑换猫扇或者降压优化,坛子里有相关帖子可以参考。

            1 条回复 最后回复
            0
            • L 离线
              L 离线
              laobenxiong
              编写于 最后由 编辑
              #6

              都不提价格区别...

              kop wangK 1 条回复 最后回复
              1
              • L laobenxiong

                都不提价格区别...

                kop wangK 离线
                kop wangK 离线
                kop wang
                编写于 最后由 kop wang 编辑
                #7

                @laobenxiong 我个人理解,在楼主这个需求中,其实价格因素的占比很低。

                7900XTX和R9700他们的显存大小不同,能运行的模型参数是不同的。R9700能跑的参数,7900XTX就是跑不了。

                模型参数,是无法客观衡量这其中的价值的,也就谈不上性价比。
                同理,噪音问题,性能问题也一样。

                举个稍微夸张点的例子,张雪摩托,五菱面包,都是几万块钱。他们之间价格也有区别。你只能从他们之间的载货能力,赛道性能的角度探讨使用场景。你探讨张雪摩托比五菱面包便宜一万块其实是没意义的。

                虚心交流,一起进步

                1 条回复 最后回复
                0
                • AGIA 离线
                  AGIA 离线
                  AGI
                  编写于 最后由 编辑
                  #8

                  先买一个7900xtx,不够用了,就再买一个,显存48g,价格和r9700一样

                  1 条回复 最后回复
                  0
                  • G 离线
                    G 离线
                    goodhat5405
                    编写于 最后由 编辑
                    #9

                    4000一个不要纠结,先玩起来,比在这想重要得多

                    1 条回复 最后回复
                    1
                    • H 离线
                      H 离线
                      huchaoran
                      编写于 最后由 编辑
                      #10

                      价格不是问题,主要是电脑只有一个插槽了,被4090D占去了一个,只有一个X16插槽了,还只是X4的速度,意见没法考虑未来再加一个显卡的事情。4090D用来跑其它计算,7900XTX或者9700XT用来跑千问,所以纠结买哪个更合适点

                      1 条回复 最后回复
                      0
                      • sirwangS 离线
                        sirwangS 离线
                        sirwang
                        编写于 最后由 编辑
                        #11

                        新发布了个400. 160G显存,啥也不缺了。

                        terryT 1 条回复 最后回复
                        0
                        • sirwangS sirwang

                          新发布了个400. 160G显存,啥也不缺了。

                          terryT 离线
                          terryT 离线
                          terry
                          编写于 最后由 编辑
                          #12

                          @sirwang 那玩意就是395的马甲,尴尬的很,性能提升微乎其微,这么大的显存能干嘛?

                          油管:https://www.youtube.com/@抡锤者

                          sirwangS 1 条回复 最后回复
                          0
                          • terryT terry

                            @sirwang 那玩意就是395的马甲,尴尬的很,性能提升微乎其微,这么大的显存能干嘛?

                            sirwangS 离线
                            sirwangS 离线
                            sirwang
                            编写于 最后由 编辑
                            #13

                            @terry 硬件先走,生态慢慢适配嘛。😀

                            jenaflexJ 1 条回复 最后回复
                            0
                            • sirwangS sirwang

                              @terry 硬件先走,生态慢慢适配嘛。😀

                              jenaflexJ 离线
                              jenaflexJ 离线
                              jenaflex
                              编写于 最后由 编辑
                              #14

                              @sirwang 我个人觉得AI Max 395或者其马甲,玩具成分多一点,如果不贵,想玩可以搞,大不了以后AI性能更不上了,内存大可以跑很多PVE虚拟机。
                              最好是能直接出一个带x8 PCIE插槽得版本,插块4090 48GB就可以all-in-one了

                              1 条回复 最后回复
                              0
                              • kop wangK 离线
                                kop wangK 离线
                                kop wang
                                编写于 最后由 编辑
                                #15

                                那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                mac最起码还有mlx兜底。

                                虚心交流,一起进步

                                A 1 条回复 最后回复
                                0
                                • kop wangK kop wang

                                  那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                  统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                  mac最起码还有mlx兜底。

                                  A 离线
                                  A 离线
                                  applejuice
                                  编写于 最后由 编辑
                                  #16

                                  @kop-wang 说:

                                  那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                  统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                  mac最起码还有mlx兜底。

                                  Mac 高级版带宽还大不少

                                  sirwangS 1 条回复 最后回复
                                  0
                                  • A applejuice

                                    @kop-wang 说:

                                    那个495就纯是395的哥哥,核心、频率都没变,就统一内存大了一点。感觉纯粹是苏妈没活硬整。
                                    统一内存小主机当ALL IN ONE玩玩可以,但是真指望跑LLM严肃使用不行。

                                    mac最起码还有mlx兜底。

                                    Mac 高级版带宽还大不少

                                    sirwangS 离线
                                    sirwangS 离线
                                    sirwang
                                    编写于 最后由 编辑
                                    #17

                                    @applejuice 等生态。

                                    INTEL 的卡也要出大显存的。对着AMD这种量的级别。带宽对着5090这个级别。不知道最终咋样。

                                    1 条回复 最后回复
                                    0

                                    你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                    厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                    有了你的建议,这篇帖子会更精彩哦 💗

                                    注册 登录
                                    回复
                                    • 在新帖中回复
                                    登录后回复
                                    • 从旧到新
                                    • 从新到旧
                                    • 最多赞同


                                    • 登录

                                    • 没有帐号? 注册

                                    • 登录或注册以进行搜索。
                                    • 第一个帖子
                                      最后一个帖子
                                    0
                                    • 版块
                                    • 最新
                                    • 标签
                                    • 热门
                                    • 用户
                                    • 群组