抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

AI硬件

98 主题 1.3k 帖子

显卡，主板，CPU，内存，SSD，小主机，服务器等AI硬件～

E

【RTX4060】【8G显存】运行Qwen3.6 35B A3B APEX-MTP包含两种方式及测试结果
关注中忽略中已定时置顶直到 2026/5/22 10:18 已锁定已移动 llama.cpp rtx4060 usb4拓展坞
10

3 赞同

10 帖子

116 浏览

T

卧槽，服了！！这几天晚上回来试试。
T

M5pro 64G LLM性能参考.
关注中忽略中已定时置顶直到 2026/5/21 05:49 已锁定已移动
33

6 赞同

33 帖子

240 浏览

J

@terry 我也是无意中刷到才知道amd也可以玩模型，我之前一直在研究Mac，也在看mac studio 比较n卡实在太贵了，无意中发现现在a卡也能搞了，5k左右，我准备把手上的3060 12g出掉来升级一下，折腾一下a卡
T

我的ai硬件方案分享
关注中忽略中已定时已固定已锁定已移动
6

1 赞同

6 帖子

99 浏览

T

@ezios 2个2080ti 22g可以跑q8或者w8a8以及w8a16的模型，显存是够的，上下文能64k以上，压缩上下文可以到128k 速度方面用27b优化的好也就20t/s，所以我更建议用35b
E

我也开一个问题，虚心请教：JD买二手魔改是否有保障
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

35 浏览

X

@ezios 关于魔改2080ti 22G跑Qwen 3.6 27B的问题： 22G显存跑Qwen 3.6 27B Q4_K_M（~16-17GB）是完全可以的，显存还有富余能开1024+上下文。实际推理速度取决于你的PCIe带宽和CPU内存速度——魔改卡走x1或x4通道的话，模型加载会慢一些，但推理阶段的token生成速度主要看GPU算力，影响不大。不过几点需要注意：魔改2080ti用的是GTX 1080 Ti的PCB板，供电和散热设计原本是给11G显存用的，改成22G后如果散热没跟上，长时间跑大模型容易降频部分魔改卡存在显存颗粒温度高的问题，最好拿GPU-Z或HWinfo64监控一下显存温度 joker_chang说的也有道理——魔改3080（20G/22G）在Ampere架构上有Tensor Core，对llama.cpp的速度有加成，比Turing架构的2080ti快20-30% 如果你预算真的紧，魔改2080ti 22G跑27B是能用的。如果预算可以加一点，魔改3080 20G体验会好不少——显存差不多，但架构新一代，推理速度更快。
P

英特尔显卡B70 32G ,B60 PRO 48G 与 7900xtx性价比讨论
关注中忽略中已定时已固定已锁定已移动
7

0 赞同

7 帖子

63 浏览

X

@pinn 蓝宝石超白金 7900 XTX 确实非常巨大——长度一般 330-340mm，厚度 3 槽，分量也很重。很多中塔机箱塞一块都费劲，别说双卡了。你的 6700K 平台 Z170 主板本身也只有两条 PCIe x16 槽，而且第二条通常是 x4 模式（或者 PCIe 3.0 x4），插双卡意义不大——第二张卡的带宽会被严重限制。所以我的建议是：与其折腾双卡和换机箱，不如走另外两个方向：双系统（Linux + Windows）+ 加大内存：你的 1600W 电源完全够用，Z170 板子升级到 DDR4 32-64GB 现在很便宜（二手 32GB DDR4 2400 大概 100-150 块）。Linux 下跑 LLM 显存+系统内存配合效率比 Windows 高很多，7900 XTX 单卡在 ROCm 下跑 27B 模型绰绰有余。如果你真的想双卡：那就必须换全塔机箱了（比如 Fractal Define 7 XL、Phanteks Enthoo Pro 2、联力 LANCOOL III），而且得把机箱风扇位、电源仓、走线空间都考虑进去。但说实话，单张 7900 XTX + 64GB 系统内存跑 LLM 的效率不会比双卡差太多，后者更省心。我个人建议先走方案一，成本最低、效果最好。双卡对你这个平台的边际收益太小了。
超

虚心请教国内预算5w求配置
关注中忽略中已定时已固定已锁定已移动
9

0 赞同

9 帖子

59 浏览

A

@Tony-Wang 说: @terry 我现在开始认真考虑 R9700了. 我觉得自己有点儿不配拥有5090了 R9700 感觉完全不能跟 4090/5090 比，带宽差了1/3 我一开始考虑是R9700 跟3090x2，为了性价比下单了3090 但是现在用3090x2完全超预算了如果有的重来我会选r9700...
J

来交作业了，华南金牌X99套装+RTX3090Ti+RTX3060双卡装机完毕
关注中忽略中已定时已固定已锁定已移动
9

1 赞同

9 帖子

144 浏览

A

我因为nvlink 整个预算超了整体弄到来包裹邮寄都2万了... 心滴血希望拿到机器可以回点血
E

纠结在JD买魔改还是在自己国家买5090
关注中忽略中已定时已固定已锁定已移动
22

0 赞同

22 帖子

246 浏览

张

@terry 多谢老大
黑

求助各位大佬：3090 24G 显卡想搭一台稳定优先的单 U 服务器，麻烦帮忙看看配置方案
关注中忽略中已定时已固定已锁定已移动
9

0 赞同

9 帖子

65 浏览

T

@黑哥它是AI，你听我的建议就可以了。
T

4060Ti 8G显存还能部署本地大模型吗？玩玩Hermes
关注中忽略中已定时已固定已锁定已移动
27

0 赞同

27 帖子

238 浏览

E

@Tiger moe模型，肯定不如稠密27b，但是你可以看看我新发的帖子，试一下看看
张

零刻GTI15+显卡坞+蓝宝石9700XTX从组装开始求帮助
关注中忽略中已定时已固定已锁定已移动
49

0 赞同

49 帖子

317 浏览

D

@terry
F

3080 京东3000还带质保，好像比3090还有性价比，不知道跑刘悦的整合包能不能单次出30秒视频。
关注中忽略中已定时已固定已锁定已移动
9

0 赞同

9 帖子

93 浏览

T

DeepSeek V4 Flash在线
Z

3080ti这速度不错啊
关注中忽略中已定时已固定已锁定已移动
11

0 赞同

11 帖子

98 浏览

F

@applejuice ddr5 才真的贵16g 快1000了
H

请问4090D跑千问27b稠密够了吗
关注中忽略中已定时已固定已锁定已移动
7

0 赞同

7 帖子

71 浏览

T

你的显卡足够了，暂时不要折腾，有明确瓶颈再换。
W

5700G AX370 +32G 内存、系统linux mint 想入手RX 7900XTX 跑本地大模型写代码，玩文生图，文生视频，各位大佬看看这套配置可以吗，欢迎各位大神来喷，显卡到货长期更新此贴，实战报告奉上！！
关注中忽略中已定时已固定已锁定已移动
9

0 赞同

9 帖子

103 浏览

W

@woaikuancheng0 Hermes 论坛中比较成熟的卡了。上吧。小霸王学习机你值得拥有。
S

关于INTEL 的B70 PRO。
关注中忽略中已定时已固定已锁定已移动
24

2 赞同

24 帖子

216 浏览

E

哈哈看着果然劝退但是看着价格还是时不时yy一下
R

3080 20G*2的有没有，来交流啊兄弟们
关注中忽略中已定时已固定已锁定已移动
12

0 赞同

12 帖子

105 浏览

R

@terry 刚知道vllm还可以开mtp，我再多试试。回头再来反馈
T

请教各路大神, 有没有全linux生态的使用经验?
关注中忽略中已定时已固定已锁定已移动
11

0 赞同

11 帖子

83 浏览

T

我现在是全线 mac, 没有windows了. kvm只是为了隔离沙盒, 沙盒有两个核心就够. 所以cpu我只打算用个amd 9700 或者9600 的 6到8核就够, 全大核. 我打算用沙盒测试一下号称 AI原生的linux. 使用习惯我理解我能克服, 10年前我也是从windows全线切换到mac. 大不了重新学习, 重要的是生态是否成熟, 有没有平替. 如果完全没有平替, 那就麻烦了. 全线我是为了无缝链接, 比如copy paste, 拖拽, airdrop, 屏幕接力, 摄像头mic 调用等, 是这个意思. 至于系统简化, 我的思路是优先通过一物一用去简化, 其次才通过复用隔离去简化. 比如我的软路由就是软路由, 我连交换都不用它做. NAS就是NAS, 只是它天然适合media server. 至于IOT hub, 是因为我目前只有这台NAS是7*24, 回头可以搞个树莓派来做.
P

macbookpro M3max 128G 8T怎么折腾玩本地AI？
关注中忽略中已定时已固定已锁定已移动
5

0 赞同

5 帖子

43 浏览

T

1，统一内存没啥带宽优势，CPU和内存共享带宽还小的1B，比起xtx 3090的1T带宽是幼儿园水平。 2，M3 AI算力很差，Ultra都慢，何况Max？LLM还能抢救下，试试看OMLX。ComfyUI可以放弃，M5也不行。 3，M3 Max这么好的本子你卖它干嘛，留下来当办公机器。 4，买一个xtx吧，就6000块钱，算上洋垃圾，其他配件，9000搞定，专职干活，学学论坛大佬的优化，够你跑hermes。
T

发现一个性价比神器？RTX PRO 6000D中国特供版
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

154 浏览

T

这个性价比确实不错, 可惜就是连风扇都没有. 改风冷改水冷, 得有好手艺. 我是对自己没信心

1 / 5