跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 分享:4090/48G, R9700/32G, AI Max 395 (8060S) 跑大语言模型的实测数据

分享:4090/48G, R9700/32G, AI Max 395 (8060S) 跑大语言模型的实测数据

已定时 已固定 已锁定 已移动 LLM讨论区
13 帖子 8 发布者 487 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT terry

    @Fred 我草,这绝对精华帖子,我要做一个单独视频,给老弟署名。你给弄几张 截图啊,最好是黑乎乎的背景,显得逼格高点。卡和设备给我再拍几张图片发进来。我做完视频加入这个链接,让大家来膜拜下你。

    FredF 离线
    FredF 离线
    Fred
    编写于 最后由 编辑
    #4

    @terry 说:

    @Fred 我草,这绝对精华帖子,我要做一个单独视频,给老弟署名。你给弄几张 截图啊,最好是黑乎乎的背景,显得逼格高点。卡和设备给我再拍几张图片发进来。我做完视频加入这个链接,让大家来膜拜下你。

    哈哈不用单做视频特哥。我经常看你油管,学到很多东西,想着回报一下你。我的资料你随便用在视频里面。我是属于那种闲散玩法,比较佛系,有时间就来吹吹牛逼,分享点内容。不过我这个配置是有误导性的:不推荐显卡坞,有条件一定是尽量PCIE直连。我这是属于放养式玩法,不是生产力的标配,可靠性,性能都比PCIE直连差点意思。

    terryT 1 条回复 最后回复
    0
    • David ZhangD David Zhang

      作业牛逼,可以置顶!

      FredF 离线
      FredF 离线
      Fred
      编写于 最后由 编辑
      #5

      @David-Zhang 说:

      作业牛逼,可以置顶!

      谢谢看帖和肯定!

      1 条回复 最后回复
      0
      • FredF Fred

        @terry 说:

        @Fred 我草,这绝对精华帖子,我要做一个单独视频,给老弟署名。你给弄几张 截图啊,最好是黑乎乎的背景,显得逼格高点。卡和设备给我再拍几张图片发进来。我做完视频加入这个链接,让大家来膜拜下你。

        哈哈不用单做视频特哥。我经常看你油管,学到很多东西,想着回报一下你。我的资料你随便用在视频里面。我是属于那种闲散玩法,比较佛系,有时间就来吹吹牛逼,分享点内容。不过我这个配置是有误导性的:不推荐显卡坞,有条件一定是尽量PCIE直连。我这是属于放养式玩法,不是生产力的标配,可靠性,性能都比PCIE直连差点意思。

        terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #6

        @Fred 赶紧补图,我好白嫖一期,你这配置怎么能算误导呢?再说了,还得看我怎么写视频脚本对吧。

        FredF 1 条回复 最后回复
        0
        • terryT terry

          @Fred 赶紧补图,我好白嫖一期,你这配置怎么能算误导呢?再说了,还得看我怎么写视频脚本对吧。

          FredF 离线
          FredF 离线
          Fred
          编写于 最后由 编辑
          #7

          @terry 说:

          @Fred 赶紧补图,我好白嫖一期,你这配置怎么能算误导呢?再说了,还得看我怎么写视频脚本对吧。

          行。明天我再硬件板块那个原贴里补些细节图。

          1 条回复 最后回复
          0
          • James WeiJ 离线
            James WeiJ 离线
            James Wei
            编写于 最后由 编辑
            #8

            我是395用户,最近上了MTP,体验感好了很多,Qwen3.5-122B-A10B-Q4KXL可以跑到32t/s,Qwen3.6-35B-A3B-Q8KXL可以跑到55t/s,APEX-balance量化可以跑到75t/s, Qwen3.6-27B-Q4KXL可以跑到25t/s

            FredF 1 条回复 最后回复
            0
            • James WeiJ James Wei

              我是395用户,最近上了MTP,体验感好了很多,Qwen3.5-122B-A10B-Q4KXL可以跑到32t/s,Qwen3.6-35B-A3B-Q8KXL可以跑到55t/s,APEX-balance量化可以跑到75t/s, Qwen3.6-27B-Q4KXL可以跑到25t/s

              FredF 离线
              FredF 离线
              Fred
              编写于 最后由 编辑
              #9

              @James-Wei 说:

              我是395用户,最近上了MTP,体验感好了很多,Qwen3.5-122B-A10B-Q4KXL可以跑到32t/s,Qwen3.6-35B-A3B-Q8KXL可以跑到55t/s,APEX-balance量化可以跑到75t/s, Qwen3.6-27B-Q4KXL可以跑到25t/s

              对。我也测试过那个PR,MTP确实是对TG速度效果显著。目前还有些限制,必然PP速度降低,多模态功能被抹掉,我就暂时不上,坐等MTP合入llama.cpp主线,然后AI MAX 395就能凭空性能翻倍了。

              1 条回复 最后回复
              0
              • xiaopbroX 离线
                xiaopbroX 离线
                xiaopbro
                编写于 最后由 编辑
                #10

                实测R9700,和楼主说的一样,跑qwen3.6-27b-q4挺慢的

                1 条回复 最后回复
                1
                • P 离线
                  P 离线
                  Pita
                  编写于 最后由 编辑
                  #11

                  這真的是超級乾貨了...一百個讚

                  1 条回复 最后回复
                  0
                  • M 离线
                    M 离线
                    mark
                    编写于 最后由 编辑
                    #12

                    牛逼啊.... 感谢楼主分享.
                    祝楼主福如东海,寿比南山.

                    1 条回复 最后回复
                    0
                    • terryT terry 取消固定了该主题
                    • terryT terry 固定了该主题
                    • L 离线
                      L 离线
                      linghu007
                      编写于 最后由 编辑
                      #13

                      R9700还是在我意向购买的最终目标中,因为架构更新,未来支持更久,虽然慢点,但可以支持4卡并联,性价比也高。

                      1 条回复 最后回复
                      0
                      • 系统 取消固定了该主题

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组