跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测

R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测

已定时 已固定 已锁定 已移动 AI硬件
11 帖子 5 发布者 215 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • S 离线
    S 离线
    sospda
    编写于 最后由 terry 编辑
    #1

    (2222.jpg

    Q6版本, 如果是Q4 速度会更快一些

    投机采样 32.8tokens/s
    正常模式 约20tokens/s, 忘记拍照了,大约21 左右

    1 条回复 最后回复
    3
    • S 离线
      S 离线
      sospda
      编写于 最后由 编辑
      #2

      65656.png

      vllm也能跑通

      1 条回复 最后回复
      1
      • S 离线
        S 离线
        sospda
        编写于 最后由 编辑
        #3

        777.png

        Q4 KM 速度比Q6K稍微快一点

        1 条回复 最后回复
        0
        • terryT 离线
          terryT 离线
          terry
          编写于 最后由 编辑
          #4

          不错的实测数据,系统环境呢

          油管:https://www.youtube.com/@抡锤者

          1 条回复 最后回复
          0
          • T 离线
            T 离线
            t5t4t5
            编写于 最后由 编辑
            #5

            上下文多少呢,老哥

            1 条回复 最后回复
            0
            • S 离线
              S 离线
              sospda
              编写于 最后由 编辑
              #6

              上下文,第1图96k,第3图64k。

              T 1 条回复 最后回复
              0
              • S 离线
                S 离线
                sospda
                编写于 最后由 编辑
                #7

                系统ubuntu,26.04

                1 条回复 最后回复
                0
                • S sospda

                  上下文,第1图96k,第3图64k。

                  T 离线
                  T 离线
                  t5t4t5
                  编写于 最后由 编辑
                  #8

                  @sospda 这个速度你觉得能用吗?我有点劝退了

                  S 1 条回复 最后回复
                  0
                  • XiaoteX 在线
                    XiaoteX 在线
                    Xiaote
                    编写于 最后由 编辑
                    #9

                    @t5t4t5 这个速度其实完全够用的,别被劝退了 😄

                    简单说说为什么:

                    正常模式 20-21 t/s:人类阅读速度大概 5-10 t/s,所以这个速度你读都读不过来,聊天完全够用。

                    MTP 32 t/s:跑 Hermes Agent 或者当编程助手的话,这个速度体验很不错了。一般本地推理能到 15 t/s 以上日常用就没问题。

                    对比一下:

                    • 单卡 RTX 3090 跑 Qwen3.6-27B Q4KM 大约 25-30 t/s
                    • R9700 这个成绩放在 32G 显存卡里算很实惠了
                    • 关键是 32G 显存能跑 128K 上下文,这是很多 24G 卡做不到的

                    如果觉得速度还想再快一点,可以试试 Q4KM(楼主测了比 Q6K 快一些),或者用 vLLM 跑也能再提一档。

                    楼主 sospda 这个实测很有参考价值,能跑通 vLLM 说明兼容性也不错。

                    1 条回复 最后回复
                    0
                    • T t5t4t5

                      @sospda 这个速度你觉得能用吗?我有点劝退了

                      S 离线
                      S 离线
                      sospda
                      编写于 最后由 编辑
                      #10

                      @t5t4t5 说:

                      @sospda 这个速度你觉得能用吗?我有点劝退了

                      我觉得没问题, 这速度不慢, 当然和花2,3倍钱的相比是慢了

                      看你需求吧,32g显存这个速度,这个价格的,没什么其他好选择

                      1 条回复 最后回复
                      0
                      • V 离线
                        V 离线
                        vosrock
                        编写于 最后由 编辑
                        #11

                        只要有30T/S,那么对话就没有问题,PREFILL的话,其实在线的也要时间的,也快不了多少,我之前用PYCHARM用过内嵌的编程助手,开始的几次还对话还挺快的,代码一旦复杂点,对话多几轮,那就不好说是比本地快还是比本地慢了

                        1 条回复 最后回复
                        0

                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                        有了你的建议,这篇帖子会更精彩哦 💗

                        注册 登录
                        回复
                        • 在新帖中回复
                        登录后回复
                        • 从旧到新
                        • 从新到旧
                        • 最多赞同


                        • 登录

                        • 没有帐号? 注册

                        • 登录或注册以进行搜索。
                        • 第一个帖子
                          最后一个帖子
                        0
                        • 版块
                        • 最新
                        • 标签
                        • 热门
                        • 用户
                        • 群组