分享小tips:装好后首次打开,初始化环节配置API环节报错,无法配置国内minimax API key,执行命令hermes model就可以,十分方便。
YQ YQ
-
Hermes Agent webui 原生 Windows 支持 ,被官方采纳合并代码了. -
【求助】铭凡HX99G 打算 eGPU上7900XTX 24G,是否可行 -
【求助】铭凡HX99G 打算 eGPU上7900XTX 24G,是否可行@yq-yq HX99G上eGPU的方案技术上可行,不过有几个点需要注意:
1. 接口选择
HX99G支持USB4(40Gbps),eGPU用USB4/雷电3/4的 enclosure即可。不过USB4的eGPU enclosure选择比较少,建议确认支持AMD卡再下单。更好的选择是看HX99G有没有OCulink接口(mini PC很多预留了),OCulink x4带宽约32Gbps,延迟比USB4低,体验更好。2. 性能预期
eGPU走USB4/OCulink的话,带宽大约只有直插PCIe x16的15-20%。7900XTX跑大模型的话,推理速度大约会损失20-30%(不像游戏那么敏感),实测27B模型在eGPU上能到35-45 t/s左右,日常用足够。3. 二手卡问题
terry说的有道理,但如果你找的是在保的二手(比如京东自营还在保修期内),风险可控。7900XTX 24G显存确实是目前性价比最高的AI卡之一,显存够用、驱动(ROCm/Vulkan)也比N卡生态成熟。建议优先找有京东自营记录且剩余保修期>1年的。4. 软件配置
eGPU装卡后,Windows下建议:- 先用DDU彻底卸载旧驱动
- 装最新AMD Adrenalin驱动
- 跑llama.cpp用Vulkan后端(兼容性最好)
- 如果蓝屏/掉驱动,检查USB4线缆质量(建议买认证的40Gbps线)
总的来说:如果已有7900XTX,买个eGPU enclosure是可行的;如果还没买卡,可以考虑直接组一台itx或二手工作站机箱,省去eGPU的折腾和性能损失。
谢谢,非常详细!如果再组一台主机,考虑未来扩展双7900XTX,但不想机箱太大,有什么建议吗。另外,双7900XTX相对于双3090 24G(NVLINK),token输出速率差距有多少,对7900和3090还有点纠结
-
【求助】铭凡HX99G 打算 eGPU上7900XTX 24G,是否可行 -
【求助】铭凡HX99G 打算 eGPU上7900XTX 24G,是否可行 -
【求助】铭凡HX99G 打算 eGPU上7900XTX 24G,是否可行铭凡HX99G是日常主力PC,体积小,放桌面上不占空间,带8G独显,玩玩老3A游戏也能打,几年用下来还比较满意。
年初用oracle VPS养龙虾,搭配minimax年付最低套餐,几乎是每天不间断使用,基本够用,编程就用闲鱼买的2个google AI pro学生账号,antigravity轮流用,用claude讨论需求搭主干框架,用gemini flash写叶子模块。
5月关注到老特,想让HX99G尝试跑一下本地大模型,其实没啥目的,就是纯折腾,打算后面跟老特学习做视频(给自己强行加戏),查了一下资料,官方的DEG1扩展坞没有USB4接口,要动外壳,改用天钡AG02(带800W电源),显卡看了一圈,3080 20G,3090 24G,最后看论坛大神在windows下用7900XTX生成速度还不错,打算抄作业。
有点犹豫的是,3090 24G虽然是矿卡但支持NVLINK,未来要玩70B或者老特说的720P视频可以再买一张,但7900XTX没NVLINK感觉再买一张速度应该不太行?
另外查了价格,京东新卡7900XTX 白金5600多,闲鱼有两个选择,一个是讯景7900xtx海外版。一个是所谓戴尔OEM整机备件 RX7900XTX-24GB 公版 准新库存卡,都是4000出头。我倾向戴尔这个,因为体积小一点,做工好一点,但不知道这个所谓戴尔OEM整机备件这个说法是否靠谱。
盼论坛大神指点这套方案是否可行,打算近期下单,回头测完交作业。