跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 版主7900XTX 24G 蓝宝石 白金版 折腾日记。折腾过程从入手到成功全过程。部分版主个人开发架构分享。

版主7900XTX 24G 蓝宝石 白金版 折腾日记。折腾过程从入手到成功全过程。部分版主个人开发架构分享。

已定时 已固定 已锁定 已移动 AI硬件
18 帖子 7 发布者 474 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • williamlouisW 离线
    williamlouisW 离线
    williamlouis
    超级版主
    编写于 最后由 编辑
    #1

    六月八日下午:
    到货,拍摄开箱视频。留存。防止后期纠纷。
    开箱后查看SN码。发现是A25开头怀疑是旧卡。仔细观察金手指。有明显使用痕迹。观察其他部件没有长期烤鸡痕迹。联系客服。客服让官网注册保修。显示为2026年6月1日。思考后点了收货。大概率是官返品。我认为可以接受。反正有3年保修。
    9ba2a4ee-401c-4d5f-bb1d-cc64493845a9-image.jpeg
    时间紧张。还有工作没搞。(就是真没搞,又突发了情况)
    装上显卡后发现电源是2*8pin 输出。电源功率是够大。但是单线路输出不足。这块就是我自己记错了。以为有3路输出。没办法停工,去京东拍了个振华3代1000W。注意:只有这款是振华最便宜直接3路输出带3条线。其他低瓦数的也可以用。就是线只有2条。节约时间直接上这个了。关于电源的问题。一次性讲清。1托2显卡供电能不能用。答案是可以的。但是在显卡峰值工作的时间。线路会发热。小品牌电源盒可能会冒烟。我就是用1托2接法暂时点亮了显卡。看了下显卡的芯片。体质测试只能明天跑了。记录下折腾配置

    部件 型号/规格
    CPU Intel i7-4790K(LGA1150,4核8线程)
    主板 技嘉 Z97-HD3(Z97芯片组,PCIe 3.0)
    内存 32GB DDR3
    显卡 蓝宝石 RX 7900 XTX 白金版 24GB(目前1张,计划再加1张)
    硬盘 1TB 固态
    电源 现有电源(8Pin供电为1托2转接,功率偏紧张)
    系统 准备/已装 Ubuntu 24.04 Server(Linux)
    用途 本地AI算力,跑 Qwen3.6-27B 等开源大模型

    其他计划折腾设备简介:路由:Gl inet BE6500.电脑:Mac mini M4 32G版。IBM 笔记本2台 集成显卡工作本。Windows 系统 Linux mint 23 系统。华为 M5 平板一台 鸿蒙系统。 步步高 平板一台 安卓系统。iPad 9 一台 iOS系统。网络 连接 DMIT BWG 一主一备 防止与管理的20台服务器失联。外援在线算力:claude 4.7 DeepSeek V4 pro。其他已经放弃。
    静待明日更新。

    个人主页:xlkj.org Telegram https://t.me/xlkjorg

    1 条回复 最后回复
    4
    • G 离线
      G 离线
      goldkim
      编写于 最后由 编辑
      #2

      我也刚入了一枚明天到货,期待楼主继续更新

      1 条回复 最后回复
      0
      • terryT terry 从 网络技术 移动了该主题
      • terryT 离线
        terryT 离线
        terry
        超级版主
        编写于 最后由 编辑
        #3

        可以,官方正品,这玩意基本不会坏,坏了也有保障,其实性价比蛮高的。主要是省心,缺点就是没3090强。

        油管:https://www.youtube.com/@抡锤者

        1 条回复 最后回复
        0
        • tingqu liT 离线
          tingqu liT 离线
          tingqu li
          编写于 最后由 编辑
          #4

          我也在海鲜市场掏了一张 蓝宝石 RX 7900 XTX 白金版 ,现在未运行成功,来学习学习。

          1 条回复 最后回复
          0
          • williamlouisW 离线
            williamlouisW 离线
            williamlouis
            超级版主
            编写于 最后由 编辑
            #5

            昨天电源到了。快晚上才到货。换电源比重装台新的还费劲。整完已经要23点了。很累。今天开始折腾。大家有需要测试的模型可以告诉我。这台主机暂时不用工作。纯娱乐。

            个人主页:xlkj.org Telegram https://t.me/xlkjorg

            1 条回复 最后回复
            0
            • williamlouisW 离线
              williamlouisW 离线
              williamlouis
              超级版主
              编写于 最后由 编辑
              #6

              装上一个。测试智力8/10 。可以接受的范围。
              模型

              Qwen3.6-27B-Q4_K_M.gguf(非 MTP 版)
              来源: unsloth/Qwen3.6-27B-GGUF
              大小: 16 GB,VRAM 占用 ~18 GB
              
              
              启动参数
              
              HSA_OVERRIDE_GFX_VERSION=11.0.0
              
              llama-server \
                  -m Qwen3.6-27B-Q4_K_M.gguf \
                  -c 16384 \
                  --parallel 1 \
                  -ngl 99 \
                  -b 512 \
                  -ub 256 \
                  --no-warmup \
                  --host 0.0.0.0 --port 8081 \
                  --temp 0.7 --repeat-penalty 1.1 --top-p 0.9 \
                  --reasoning off
              
              
              显卡驱动
              
              GPU:   AMD Radeon RX 7900 XTX (gfx1100, 24 GB)
              ROCm:  7.2.1
              HIP:   7.2.53211
              驱动:  3581.0 (HSA1.1, LC)
              llama.cpp: b9544 (ggml 0.13.1, HIP 后端)
              
              
              速度
              
              生成: ~25 tok/s(126 tokens / 5s)
              上下文: 16384 tokens,单槽位
              

              b36a5a0c-08ac-4d30-9e5f-11fac5542f9a-image.jpeg
              消耗:deepseek-v4-pro │ 117K/1M
              错题:长链条逻辑(7 步以上)
              题:A、B、C、D、E 五人站一排。已知:
              A 不在两端
              B 在 C 的左边且两人不相邻
              D 和 E 相邻
              E 不在最右
              C 不在最左
              问:从左到右的顺序是什么?
              答案:D-E-A-B-C 或 E-D-A-B-C?验证:
              D-E-A-B-C:A 不在两端✓,B 在 C 左且不相邻?B-C 相邻✗。
              E-D-A-C-B:B 在 C 左✗。
              D-E-B-A-C:B 在 C 左不相邻✓,D-E 相邻✓,E 不在最右✓,C 不在最左✓,A 不在两端✓。
              再验:D-E-B-A-C,B 在 C 左且不相邻(中间隔 A)✓。答案:D-E-B-A-C。
              常识物理(反直觉)
              题:一架飞机在赤道上空悬停(相对地面静止不动,不绕地球飞),12 小时后它会落在起飞点的正上方、东边、还是西边?为什么?
              答案:西边。地球自西向东转,大气层随地球转,但飞机悬停时相对惯性空间静止,地面向东转,所以飞机相对地面向西移动。
              晚上回来试试 谷歌的模型。

              个人主页:xlkj.org Telegram https://t.me/xlkjorg

              1 条回复 最后回复
              0
              • S 离线
                S 离线
                sospda
                编写于 最后由 编辑
                #7

                deepseek 得出 共7组解:

                | # | 左→右 |
                |:-:|:-----:|
                | 1 | B A C E D |
                | 2 | B D E A C |
                | 3 | B E D A C |
                | 4 | B A D E C |
                | 5 | B A E D C |
                | 6 | D E B A C |
                | 7 | E D B A C |
                

                本地Qwen3.6 b27 得出答案:有三种可能

                1. B A C E D
                2. B A E D C
                3. B E D A C
                

                答案不全,但是没错

                williamlouisW 1 条回复 最后回复
                0
                • S sospda

                  deepseek 得出 共7组解:

                  | # | 左→右 |
                  |:-:|:-----:|
                  | 1 | B A C E D |
                  | 2 | B D E A C |
                  | 3 | B E D A C |
                  | 4 | B A D E C |
                  | 5 | B A E D C |
                  | 6 | D E B A C |
                  | 7 | E D B A C |
                  

                  本地Qwen3.6 b27 得出答案:有三种可能

                  1. B A C E D
                  2. B A E D C
                  3. B E D A C
                  

                  答案不全,但是没错

                  williamlouisW 离线
                  williamlouisW 离线
                  williamlouis
                  超级版主
                  编写于 最后由 编辑
                  #8

                  @sospda 你也是7900XTX 24G 吗?

                  个人主页:xlkj.org Telegram https://t.me/xlkjorg

                  1 条回复 最后回复
                  0
                  • S 离线
                    S 离线
                    sospda
                    编写于 最后由 编辑
                    #9

                    我的是r9700 ,我用的是Q5 KM

                    1 条回复 最后回复
                    0
                    • williamlouisW 离线
                      williamlouisW 离线
                      williamlouis
                      超级版主
                      编写于 最后由 编辑
                      #10

                      那就好。同模型你对了。我的错了。那就不好折腾了。我准备试试别的模型。我主要的考量是智力。快慢无所谓。

                      个人主页:xlkj.org Telegram https://t.me/xlkjorg

                      1 条回复 最后回复
                      0
                      • williamlouisW 离线
                        williamlouisW 离线
                        williamlouis
                        超级版主
                        编写于 最后由 williamlouis 编辑
                        #11

                        参考无审查版本优化27B K4
                        bash
                        echo high | sudo tee /sys/class/drm/card1/device/power_dpm_force_performance_level

                        然后启动 llama.cpp:
                        
                        bash
                        cd /opt/llama.cpp
                        HSA_OVERRIDE_GFX_VERSION=11.0.0 ./build/bin/llama-server \
                          -m models/Qwen3.6-27B-Q4_K_M.gguf \
                          -c 65536 -ngl 99 \
                          --flash-attn on \
                          --cache-type-k q4_0 --cache-type-v q4_0 \
                          --parallel 1 --reasoning off --no-warmup \
                          --temp 0.7 --repeat-penalty 1.1 --top-p 0.9 \
                          --host 0.0.0.0 --port 8081
                        

                        优化后 提升上下文到64K 可以和Hermes 联动
                        API 完全正常。下面是在 Mac 端 Hermes 的配置方法:

                        Mac 端 Hermes 连接 llama.cpp
                        
                        你需要在 Mac 上打开终端,执行以下命令:
                        
                        bash
                        1. 设置 provider 为自定义端点
                        hermes config set model.provider custom
                        
                        2. 设置 API 地址(指向你的 Linux 机器)
                        hermes config set model.base_url http://192.168.8.247:8081/v1
                        
                        3. llama.cpp 不需要 API key,但填一个占位值
                        hermes config set model.api_key not-needed
                        
                        4. 设置模型名(必须与 llama-server 返回的一致)
                        hermes config set model.default Qwen3.6-27B-Q4_K_M.gguf
                        
                        
                        然后重启 Hermes(或 /reset)即可。
                        
                        
                        
                        网络连通性
                        
                        你的 Linux 机器 IP 是 192.168.8.247,端口 8081。
                        
                        先确认 Mac 能访问:
                        
                        bash
                        curl http://192.168.8.247:8081/v1/models
                        
                        
                        - 如果通 → 直接用上面的配置
                        - 如果不通 → 可能是防火墙或不在同一子网,可以通过 SSH 隧道转发:
                        
                        bash
                        在 Mac 上建立 SSH 隧道
                        ssh -L 8081:localhost:8081 [email protected] -N
                        
                        然后 base_url 改为:
                        hermes config set model.base_url http://localhost:8081/v1
                        
                        
                        
                        
                        等效的 config.yaml 直接编辑
                        
                        也可以直接编辑 ~/.hermes/config.yaml:
                        
                        yaml
                        model:
                          provider: custom
                          base_url: http://192.168.8.247:8081/v1
                          api_key: not-needed
                          default: Qwen3.6-27B-Q4_K_M.gguf
                        
                        
                        
                        
                        总结:核心就是告诉 Hermes 用一个自定义的 OpenAI 兼容端点,指向你的 llama.cpp server。llama.cpp 的 llama-server 内置了 /v1/chat/completions 和 /v1/models 端点,Hermes 直接就能用。
                        

                        ef263ec2-65fe-4ae6-9153-f6ae009c0120-image.jpeg
                        2b51614a-e17c-4e7b-9cc0-173e34717084-image.jpeg
                        先这样。睡觉。明天继续。

                        个人主页:xlkj.org Telegram https://t.me/xlkjorg

                        1 条回复 最后回复
                        2
                        • terryT terry 固定了该主题
                        • williamlouisW 离线
                          williamlouisW 离线
                          williamlouis
                          超级版主
                          编写于 最后由 williamlouis 编辑
                          #12

                          485d2525-0d9e-422d-9d59-be42b92ce7c8-image.jpeg
                          测试:Qwen3.6-27B-Uncensored-HauhauCS-Balanced-MTP-Q4_K_P.gguf 参照论坛水友配置安装成功。
                          受限于平台其他硬件性能我只跑了。32-41 token/s 的速度。上下文和预期一样 可以128K。惊喜的是智力10题这个模型都回答正确了。这说明优化策略不是消耗原模型的智力基础上实现的。确实做到提速增智了。
                          参数如下
                          kp 运行状态

                          | 项目         | 详情                                                |
                          |--------------|-----------------------------------------------------|
                          | 模型         | Qwen3.6-27B-Uncensored-HauhauCS-Balanced-MTP-Q4_K_P |
                          | 端口         | 8080                                                |
                          | 量化         | Q4_K_P(17.5GB)                                    |
                          | 上下文       | 128K (131,072 tokens)                               |
                          | 生成速度     | ~33 tok/s                                           |
                          | Prompt 处理  | ~48 tok/s                                           |
                          | MTP 推测解码 | 18 drafts → 13 accepted(72% 采纳率)               |
                          | GPU DPM      | auto(设为 high 可到 ~35 tok/s)                    |
                          | 参数         | 27.3B                                               |
                          
                          与 km 的关键差异:
                          - 上下文 128K vs 32K
                          - MTP 推测解码加速(--spec-type draft-mtp)
                          - --no-mmap(MTP 必需)
                          - V-cache q4_0(省显存给 128K 上下文)
                          - 端口 8080(km 之前用 8081)
                          

                          个人主页:xlkj.org Telegram https://t.me/xlkjorg

                          AGIA 1 条回复 最后回复
                          0
                          • S 离线
                            S 离线
                            sospda
                            编写于 最后由 编辑
                            #13

                            用rocm比vulkan聪明一点,7个答案都给出了。计算时间差不多。
                            rocm也是q5,但是k q5,v q4

                            让我逐步推理:
                            五个位置 1-5(从左到右),条件:

                            1. A 不在两端 → A ∈ {2,3,4}
                            2. B 在 C 左边且不相邻 → B < C,C - B ≥ 2
                            3. D 和 E 相邻 → |D - E| = 1
                            4. E 不在最右 → E ≠ 5
                            5. C 不在最左 → C ≠ 1
                              关键推导:
                              C 只能在 3 或 5:
                              • C=2:B < 2 且 2-B ≥ 2 → B ≤ 0,不可能
                              • C=4:B ≤ 2,但无论怎么排,D和E都无法相邻
                              • C=5:B ≤ 3,可行
                              • C=3:B=1,也可行
                              经穷举,共有 7 种满足条件的排列:
                              编号 排列
                              1 D, E, B, A, C
                              2 E, D, B, A, C
                              3 B, D, E, A, C
                              4 B, E, D, A, C
                              5 B, A, D, E, C
                              6 B, A, E, D, C
                              7 B, A, C, E, D
                              结论:题目条件不足以确定唯一顺序。 7 种排列都满足全部 5 个条件。
                              如果你确认题目没有遗漏条件,可以告诉我,我帮你再检查一下是否某个条件我理解有误。
                            1 条回复 最后回复
                            0
                            • S 离线
                              S 离线
                              sospda
                              编写于 最后由 编辑
                              #14

                              同一个模型,rocm的v cache还是q4,结果智力反而更高一点。
                              不过日常用rocm的tokens速度是比vulkan慢点。

                              1 条回复 最后回复
                              0
                              • williamlouisW williamlouis

                                485d2525-0d9e-422d-9d59-be42b92ce7c8-image.jpeg
                                测试:Qwen3.6-27B-Uncensored-HauhauCS-Balanced-MTP-Q4_K_P.gguf 参照论坛水友配置安装成功。
                                受限于平台其他硬件性能我只跑了。32-41 token/s 的速度。上下文和预期一样 可以128K。惊喜的是智力10题这个模型都回答正确了。这说明优化策略不是消耗原模型的智力基础上实现的。确实做到提速增智了。
                                参数如下
                                kp 运行状态

                                | 项目         | 详情                                                |
                                |--------------|-----------------------------------------------------|
                                | 模型         | Qwen3.6-27B-Uncensored-HauhauCS-Balanced-MTP-Q4_K_P |
                                | 端口         | 8080                                                |
                                | 量化         | Q4_K_P(17.5GB)                                    |
                                | 上下文       | 128K (131,072 tokens)                               |
                                | 生成速度     | ~33 tok/s                                           |
                                | Prompt 处理  | ~48 tok/s                                           |
                                | MTP 推测解码 | 18 drafts → 13 accepted(72% 采纳率)               |
                                | GPU DPM      | auto(设为 high 可到 ~35 tok/s)                    |
                                | 参数         | 27.3B                                               |
                                
                                与 km 的关键差异:
                                - 上下文 128K vs 32K
                                - MTP 推测解码加速(--spec-type draft-mtp)
                                - --no-mmap(MTP 必需)
                                - V-cache q4_0(省显存给 128K 上下文)
                                - 端口 8080(km 之前用 8081)
                                
                                AGIA 离线
                                AGIA 离线
                                AGI
                                编写于 最后由 AGI 编辑
                                #15

                                @williamlouis
                                和你同一个模型,就是量化不一样,用的q5量化,上下文设置的96000, kv都是q8, 结果是:
                                Screenshot From 2026-06-11 18-47-22.png

                                还有其他结果, grok expert:
                                Screenshot From 2026-06-11 18-46-29.png

                                gpt 5.5 thinking web:
                                Screenshot From 2026-06-11 18-48-27.png

                                Gemini 3.1 Pro:
                                Screenshot From 2026-06-11 18-53-11.png

                                codex 5.5 xhigh:
                                Screenshot From 2026-06-11 18-58-53.png

                                Claude web版本一直不给结果...

                                显存占用情况:
                                Screenshot From 2026-06-11 19-01-07.png

                                1 条回复 最后回复
                                0
                                • williamlouisW 离线
                                  williamlouisW 离线
                                  williamlouis
                                  超级版主
                                  编写于 最后由 williamlouis 编辑
                                  #16

                                  折腾了下 KIMI 2.6 果然拉了。退不了费。过期不续。尝试了科学指导方案。没有效果。KIMI 就是拉缸状态了。

                                  6bc48c9a-5568-460f-a8af-42c02ed31916-image.jpeg
                                  这点钱充的毫无价值。

                                  个人主页:xlkj.org Telegram https://t.me/xlkjorg

                                  A 1 条回复 最后回复
                                  0
                                  • williamlouisW williamlouis

                                    折腾了下 KIMI 2.6 果然拉了。退不了费。过期不续。尝试了科学指导方案。没有效果。KIMI 就是拉缸状态了。

                                    6bc48c9a-5568-460f-a8af-42c02ed31916-image.jpeg
                                    这点钱充的毫无价值。

                                    A 离线
                                    A 离线
                                    abaalei
                                    编写于 最后由 编辑
                                    #17

                                    @williamlouis k2.6我遇到最大的问题他当时刚可以在nvidia nim白嫖后,我接入了agent然后,会疯狂刷感叹号,telegram连续刷4 5 条感叹号给我。😂 😂

                                    1 条回复 最后回复
                                    0
                                    • 系统 取消固定了该主题
                                    • williamlouisW 离线
                                      williamlouisW 离线
                                      williamlouis
                                      超级版主
                                      编写于 最后由 编辑
                                      #18

                                      上几个利民的风扇。原机功耗才350瓦 就CPU 有个扇。7900XTX显存温度飙到97度。。。。
                                      大家折腾也开着 显卡监控窗。注意下温度。不要硬上。
                                      方案:radeontop(可视化界面)
                                      类似 htop 的交互式 AMD GPU 监控工具:
                                      bash

                                      安装

                                      sudo apt install radeontop

                                      运行(自动刷新,无需额外参数)

                                      sudo radeontop
                                      自动实时刷新,彩色界面显示 GPU 利用率、显存带宽、温度等

                                      到货换上再继续。

                                      个人主页:xlkj.org Telegram https://t.me/xlkjorg

                                      1 条回复 最后回复
                                      0

                                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                      有了你的建议,这篇帖子会更精彩哦 💗

                                      注册 登录
                                      回复
                                      • 在新帖中回复
                                      登录后回复
                                      • 从旧到新
                                      • 从新到旧
                                      • 最多赞同


                                      • 登录

                                      • 没有帐号? 注册

                                      • 登录或注册以进行搜索。
                                      • 第一个帖子
                                        最后一个帖子
                                      0
                                      • 版块
                                      • 最新
                                      • 标签
                                      • 热门
                                      • 用户
                                      • 群组