跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

jenaflexJ

jenaflex

@jenaflex
关于
帖子
44
主题
3
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • [申请精华帖]秀一下刚到的R9700,以及初步配置llama.cpp
    jenaflexJ jenaflex

    可以开始玩啦
    升级下Linux kernel 到6.17

    inxi -G
    Graphics:
      Device-1: Intel HD Graphics 530 driver: i915 v: kernel
      Device-2: AMD driver: amdgpu v: kernel
      Display: x11 server: X.Org v: 21.1.11 with: Xwayland v: 23.2.6 driver: X:
        loaded: modesetting unloaded: fbdev,vesa dri: iris gpu: i915
        resolution: 1920x1200~60Hz
      API: EGL v: 1.5 drivers: iris,kms_swrast,radeonsi,swrast
        platforms: gbm,x11,surfaceless,device
      API: OpenGL v: 4.6 compat-v: 4.5 vendor: intel mesa
        v: 25.2.8-0ubuntu0.24.04.1 renderer: Mesa Intel HD Graphics 530 (SKL GT2)
      API: Vulkan v: 1.3.275 drivers: N/A surfaces: xcb,xlib
    
    

    XFX_R9700.jpg

    硬件配置:
    i3-6100 (2核4线程 3.7GHz)(国内海鲜市场+海运)
    16GB DDR4 2666
    线下$40淘到的华硕Z170 败家之眼ROG Maximus VIII Hero

    其实这上述是我的开放测试平台,如果都没啥问题,我就给它挪到一个 戴尔T7920工作站了(也是线下二手)
    那台是Xeon Gold 6130
    32GB ECC

    操作系统选择:
    我习惯用Linux Mint 22.3(Kernel 6.17,等效于Ubuntu24.04),因为其桌面更像Windows操作习惯,并且整体也更精简稳健,内存消耗小,不像Ubuntu有时候给你硬塞一些花里胡哨的东西。

    Mint安装的时候,还自带一个傻瓜化工具,能在已经安装了Windows的SSD上重新分割分区,来装双系统。

    走的弯路#1:没有在BIOS禁用Intel 核显
    本意是想两者共存,核显可以干点别的事(比如视频转码)
    但是无论怎么在grub里面加参数(比如,禁用Intel的3D加速、休眠),一开x11vnc,都会kernel panic宕机。
    原因“x11vnc的高频抓屏触发了Intel核显老旧的休眠唤醒 Bug,直接把系统内核卡死了。”

    走的弯路#2:尝鲜Ubuntu 26.04
    最初在Mint22.3,用LM-Studio Rocm版llama.cpp 无法识别R9700(系统识别正常)。用Gemini查了一圈,以为是kernel和linux-firmware太老,所以图省事就去尝鲜刚刚发布的Ubuntu 26.04(kernel 7.0)。
    结果,Ubuntu26.04 自带的Rocm是7.1,虽然LM-Studio的Rocm版llama.cpp识别了R9700,仍然是加载模型卡在99%。升级Rocm到7.2.3的复杂度和用Mint 22.3(U24.04)没差别。

    初步成功
    最后回到Mint22.3,配置好了,先是简单测试,感觉24t/s有点小失望,还有优化空间。

    • LM-Studio的Vulkan,完全懒人傻瓜化,打开即用,23t/s
      vulkan.jpg

    • 编译Rocm llama.cpp-server
      LM-Studio 没有针对 AMD R9700编译的Rocm llama.cpp
      已经尝试通过加launch参数 - 伪装RDNA3的办法,加载模型会长时间卡在97%

    遂自己编译 llama.cpp, 24t/s
    rocm_llamacpp.png

    详细过程如下

    1. 升级Linux-firmware
    git clone git://git.kernel.org/pub/scm/linux/kernel/git/firmware/linux-firmware.git
    sudo rsync -av linux-firmware/amdgpu/ /lib/firmware/amdgpu/
    sudo update-initramfs -u
    # 最后重启
    
    1. 安装ROCm 7.2.3 & Toolchain
    # Install the ROCm repository and base userspace
    wget https://repo.radeon.com/amdgpu-install/7.2.3/ubuntu/noble/amdgpu-install_7.2.3.70203-1_all.deb
    sudo apt install ./amdgpu-install_7.2.3.70203-1_all.deb
    sudo amdgpu-install --usecase=rocm --no-dkms
    
    # Install specific development headers and the LLVM compiler
    sudo apt install rocm-llvm hipblas-dev rocblas-dev
    sudo usermod -a -G render,video $USER
    
    1. 编译适用gfx1201(R9700)的llama.cpp
      注:如果编译中要是缺东西,往往是路径给错了
    git clone https://github.com/ggerganov/llama.cpp
    cd llama.cpp && mkdir build && cd build
    
    cmake .. -DGGML_HIP=ON \
        -DAMDGPU_TARGETS=gfx1201 \
        -DCMAKE_C_COMPILER=/opt/rocm-7.2.3/llvm/bin/clang \
        -DCMAKE_CXX_COMPILER=/opt/rocm-7.2.3/llvm/bin/clang++ \
        -DCMAKE_PREFIX_PATH=/opt/rocm-7.2.3
    
    make llama-server -j$(nproc)
    

    最后跑起来
    先测下40k上下文,开了Flash Attention, KV Q8

    ~/llama.cpp/build/bin/llama-server -m /home/<user>/.lmstudio/models/lmstudio-community/Qwen3.6-27B-GGUF/Qwen3.6-27B-Q4_K_M.gguf --port 1234 -ngl 999 -c 40960 -fa on --cache-type-k q8_0 --cache-type-v q8_0 --threads 2
    

    去浏览器输入 localhost:1234,就可以看到对话窗口(如之前截图)

    AI硬件 amd rocm r9700

  • 新手不要碰DGX Spark(重要事情说三遍)
    jenaflexJ jenaflex

    TLDR:新手不要碰DGX Spark(GB10)
    如果你没有大量经验的话,别碰!

    • 你就算错买了 AMD AI Max 395 128GB,大不了还能用来打游戏,当Proxmox server用。

    • 你就算错买了 Mac Studio 128GB,还很保值,大不了还能卖掉。

    DGX Spark的芯片SM121最初的设计是一个 游戏APU(N1X)和AI(GB10)两吃产品,并且跳票了超过一年多(出处:Moore' law is Dead. https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。

    因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。

    SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题,被NV官方论坛里的开发者诟病很多(自己Google一下就知道了)。

    这么小众的产品(还是个半成品),你不能指望NV会让团队花很多精力去修正生态问题。

    不差钱,就RTX 6000 Blackwell 96GB
    至于同样$3500-4000预算,怎么花,见仁见智了。

    • 想玩120b moe大模型(非生产力),其实可以考虑Mac 128GB,玩腻了,保值卖掉。

    • 生产力,就还是N卡,买你买得起,且用得到的。听老特建议就好

    AI硬件 dgx spark gb10

  • hermes怎么玩会有趣一些
    jenaflexJ jenaflex

    @densha 二手退役的笔记本,或者Dell Micro,HP Mini,Lenovo Tiny那种一公升小主机,都很适合。而且最好在小主机上装Proxmox,然后上面部署虚拟机(还能时不时做 系统快照),万一被Hermes搞崩了,就回滚到之前快照就行。不熟悉Proxmox,也可以用VirtualBox

    AI Agent

  • 说一下我自己的20年硬件攒机的经验.
    jenaflexJ jenaflex

    @y2k 说:

    2002读大一的时候,就行玩qq聊天,那时候啥都不会,没钱买资料,又想学,于是每周去学校图书馆占位看电脑报,一周出2期,学校每日期都会买下供学生看,我就是看了一整年电脑报,从一个菜鸟变成老鸟,之后去图吧各种捡垃圾,玩amd超频,结果是索然无味的,但是过程乐趣无穷

    超频乐趣无穷,就是相当于当年的“赛博斗蛐蛐”😆

    AI硬件

  • 说一下我自己的20年硬件攒机的经验.
    jenaflexJ jenaflex

    @terry 搞AI赛博小妹吧😁

    AI硬件

  • 看到一个很优雅的5090, 有点儿动心
    jenaflexJ jenaflex

    @Tony-Wang 大坑,别买。网上论坛说不稳定,并且显卡不是标准的,没法拆出来单用。

    AI硬件

  • 2026年6月1日开启版主申请
    jenaflexJ jenaflex

    @terry 好的,不着急,我也看看我兴趣在哪个版块比较多。我之前玩Homelab,Linux比较多,comfy-ui经验比较少。总之,谢谢老特信任。

    站点公告

  • Mac mini m4 24G又或者16G的定位?
    jenaflexJ jenaflex

    @Devin-Hi
    对,我也不看好苹果能成为真正的通用AI生产力,最多是消费端的特定优化场景,用来提升用户体验的(也是苹果用户粘性所在)。但苹果买错了也没事,保值,马上出掉就行。最坑的是,看那些网红Demo,买错Intel GPU 😏

    苹果在AI布局慢了很多拍,加上没有服务器、企业用户的快速迭代,就很难成为通用生产力。

    就哪怕Google和Amazon的自研芯片,都可能因为有海量的、实实在在的生产力的需求,而在软、硬件迭代上要快很多。

    NVIDIA更是十多年如一日,养着大量的工程师来给客户修bug、听取反馈、迭代,提高用户和社区粘性。
    AMD之前落后NV很多,就是没有资源在这个方向上砸,而现在真在追赶。

    而Intel,那以前是意气风发(挤牙膏)、唯我独尊,更是不太会去听取用户和社区,而现在则是起步晚、步步慢。

    LLM讨论区

  • 4090 48G和rtx pro6000
    jenaflexJ jenaflex

    @Daniel 我最近要测试PVE的虚拟机+GPU硬件直通 vs Baremetal(即Linux原生直连GPU)
    不过会是R9700,看一下有没有性能损失。我估计在5%以内

    AI硬件

  • 【紧急】Nginx潜伏18年漏洞!不用密码直接远程控制,30%服务器中招 | CVE-2026-42945 Nginx Rift漏洞。
    jenaflexJ jenaflex

    用Cloudflare Tunnels的反代,和Nginx效果也差不多吧,躲在Cloudflare后面安全多了

    网络技术

  • 新手不要碰DGX Spark(重要事情说三遍)
    jenaflexJ jenaflex

    @terry 老特带咱们入门,教学相长😁
    感觉DGX Spark本意是给 开发者 用的试验平台,调试成功以后再无(痛)缝(苦)迁移到大显存的服务器。但是,其实DGX Spark的调试的坑可能比直接上服务器、或专业卡 还要坑。

    AI硬件 dgx spark gb10

  • 说一下我自己的20年硬件攒机的经验.
    jenaflexJ jenaflex

    ZOL、太平洋回忆满满哈哈哈哈,还存着很多 电脑自作、微型计算机杂志呢,我自己装的第一台电脑是 AMD Socket 939的速龙3000+ 搭配nVidia芯片组(GeForce 6100/nForce 410)。
    现在偶尔逛chiphell哈哈哈哈
    当年最眼馋的显卡是 nVidia 6800 GT,可惜当时穷学生一个,买不起。

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组