抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

AI硬件

243 主题 3.9k 帖子

显卡，主板，CPU，内存，SSD，小主机，服务器等AI硬件～

贩

震惊！萌新从0开始酣战4天，被Hermes和豆包连续坑害6小时原因竟是……
关注中忽略中已定时已固定已锁定已移动
14

0 赞同

14 帖子

122 浏览

贩

@harry820 好的哥，我去b站看一下怎么个事，超个作业，太感谢啦。还可以反过来分析图片，这个我之前都没接触过哇，我试试去。我觉得我们的三大件可能是在一家店买的
I

两个星期攒够钱买rtx pro 4500 开箱
关注中忽略中已定时已固定已锁定已移动 rtxpro4500
8

5 赞同

8 帖子

261 浏览

I

@albertsoo-dev 可以先搜寻看看可否有现货。。。
M

8g的HBM矿卡170hx解封了
关注中忽略中已定时已固定已锁定已移动
16

0 赞同

16 帖子

191 浏览

H

群里有人测试过，170HX是由于显存缺陷才进行的屏蔽，现在打开了都是残废的，多数卡只能开到20-32g，实际不能长期稳定运行
L

大热的3090风冷改造方案大幅降温稳定AI大脑
关注中忽略中已定时已固定已锁定已移动 rtx3090
48

3 赞同

48 帖子

791 浏览

L

@applejuice 说: 3 slot 对，3 slot
老

AMD R9700 32G 硬体配置分享 + --highvram 显存溢出导致黑屏重启的解决经验
关注中忽略中已定时已固定已锁定已移动
3

1 赞同

3 帖子

53 浏览

F

比如你要做自动视频的时候，可以做批量化的处理，就是加载一个模型就把这个模型需要弄的工作流全部做完，然后保存中间文件，然后再进行下一步的操作加载下一步用得到的模型就行了。毕竟32g的显存在视频工作流里面也不是太大，肯定还要分批来实施的。我最近也在研究自动化视频方面的东西，一点小小的心得。
F

rtx pro 5000 真实算力
关注中忽略中已定时已固定已锁定已移动 rtxpro5000
19

1 赞同

19 帖子

984 浏览

F

@terry 有道理，性能就这样了。个人用已经足够了
怪

關於能本地運行DeepSeek V4 Flash大模型的配置
关注中忽略中已定时已固定已锁定已移动 deepseek
14

3 赞同

14 帖子

281 浏览

T

@soop-ladios 挺好，两台能跑DeepSeek V4就是最大的价值，没必要犹豫ComfyUI。
李

V100 32G 魔改卡能入手吗？
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

120 浏览

S

@李明之前貼過兩張V100 32G跑Qwen3.6 27B Q8的測速給你參考: model test t/s peak t/s ttfr (ms) est_ppt (ms) e2e_ttft (ms) qwen-3.6-27b pp2048 834.28 ± 19.56 2508.84 ± 171.52 2197.12 ± 171.52 2508.84 ± 171.52 qwen-3.6-27b tg128 30.56 ± 0.79 38.67 ± 1.70 qwen-3.6-27b pp2048 @ d4096 937.27 ± 20.09 6170.01 ± 97.33 5858.29 ± 97.33 6170.01 ± 97.33 qwen-3.6-27b tg128 @ d4096 30.53 ± 0.49 38.00 ± 0.82 qwen-3.6-27b pp2048 @ d8192 952.76 ± 8.60 10102.94 ± 101.45 9791.23 ± 101.45 10102.94 ± 101.45 qwen-3.6-27b tg128 @ d8192 30.05 ± 0.74 36.67 ± 1.70 qwen-3.6-27b pp2048 @ d16384 925.11 ± 11.23 18209.55 ± 38.89 17897.84 ± 38.89 18209.55 ± 38.89 qwen-3.6-27b tg128 @ d16384 27.19 ± 1.32 34.33 ± 0.47 qwen-3.6-27b pp2048 @ d32768 854.63 ± 5.92 37259.34 ± 281.61 36947.63 ± 281.61 37259.34 ± 281.61 qwen-3.6-27b tg128 @ d32768 27.10 ± 0.80 35.33 ± 0.94 也有跑orinth-1.0-35b Q8的測試, 他是基於qwen 3.6 35BA3B去微調的, 大概可以100 t/s: model test t/s peak t/s ttfr (ms) est_ppt (ms) e2e_ttft (ms) ornith-35b pp2048 785.61 ± 15.97 2483.07 ± 66.69 2362.38 ± 66.69 2483.07 ± 66.69 ornith-35b tg128 106.71 ± 4.49 109.00 ± 5.72 ornith-35b pp2048 @ d4096 803.66 ± 14.44 7060.92 ± 293.27 6940.24 ± 293.27 7060.92 ± 293.27 ornith-35b tg128 @ d4096 102.15 ± 1.64 104.00 ± 1.41 ornith-35b pp2048 @ d8192 792.75 ± 2.92 12035.29 ± 105.50 11914.60 ± 105.50 12035.29 ± 105.50 ornith-35b tg128 @ d8192 103.90 ± 0.75 105.33 ± 0.47 ornith-35b pp2048 @ d16384 791.20 ± 7.30 21444.59 ± 125.59 21323.90 ± 125.59 21444.59 ± 125.59 ornith-35b tg128 @ d16384 104.99 ± 4.85 107.33 ± 5.31 ornith-35b pp2048 @ d32768 763.53 ± 9.87 41675.67 ± 664.23 41554.98 ± 664.23 41675.67 ± 664.23 ornith-35b tg128 @ d32768 98.68 ± 0.85 101.00 ± 0.82 GGUF模型都可以跑, 其他的幾乎不用玩了. 現在這個容量之下 , 除了Qwen 3.6 27B / 35BA3B好像也沒其他甚麼模型可以用了.
A

3090x2 nvlink 翻车
关注中忽略中已定时已固定已锁定已移动 rtx3090
13

0 赞同

13 帖子

443 浏览

V

我觉得能跑就行了，反正也只是跑轻量的脏活或者简单工作，也没必要投入太多资金。
J

想问这个配置是买N卡好还是AMD卡？显卡买7900XTX还是3080矿卡20G ?预算有限
关注中忽略中已定时已固定已锁定已移动
5

0 赞同

5 帖子

105 浏览

S

听大神的没错，我有个256G（实际只能128G用于推理）的DDR4惠普服务器也不知道该如何加显卡。
C

交作业：X99 CD3+E5 2666 +128G DDR3 + AMD AI Pro 9700，成功安装ubuntu，等不及跟大家分享。后续再更新
关注中忽略中已定时已固定已锁定已移动 amd r9700
71

4 赞同

71 帖子

3k 浏览

用

@Chungen-Jiang R9700 很奇葩的设计，峰值会100°，，然后还不oom。神奇吧。。只要开任务核心就100°。。
K

RTX 5070Ti 16GB 顯卡挖礦2.0 ～小小鏟子挖呀挖呀挖
关注中忽略中已定时已固定已锁定已移动
37

1 赞同

37 帖子

1k 浏览

X

@rongda-weng 两者跑 ComfyUI 各有优劣：魔改 4080S 32G 的优势在 CUDA 生态。ComfyUI 绝大多数自定义节点（ControlNet、IPAdapter、AnimateDiff 等）都是 CUDA 优先，安装即用，不需要额外配置。TensorRT 加速也仅限 NVIDIA。如果魔改稳定、散热跟得上，出图速度确实比 R9700 快。 R9700 32G 的优势在稳定和省心。原生 32GB，不用承担魔改带来的显存虚焊、驱动崩溃风险。ROCm 6.3+ 对 ComfyUI 的支持在改善，但仍有部分节点需要手动调整或降级到 ONNX。（参考我之前发的 R9700 ComfyUI 踩坑帖。）建议：如果是主力干活机、追求省心稳定，R9700 32G 更靠谱。如果是折腾向、愿意承担魔改风险、追求极致出图速度，魔改 4080S + CUDA 在 ComfyUI 上体验更好（前提是魔改没问题）。核心抉择：稳定 vs 极限性能。看你对"爽"的定义更倾向哪边。
R

一个7900 xtx 24G 装机单，期望：稳定、高性价比、可拓展，请大神点评
关注中忽略中已定时已固定已锁定已移动 7900xtx
16

0 赞同

16 帖子

288 浏览

T

@fcme 这是个重要信息，只要能处理指令就好，编程我会选在线的。你最好能发个帖子详细介绍下性能，我看是否值得折腾，35b要能用，还是非常重要的，比27b快太多了。而且它不用折腾SG-Lang。
L

X99-AD4运行7900XTX黑屏，求助
关注中忽略中已定时已固定已锁定已移动 7900xtx x99
18

0 赞同

18 帖子

209 浏览

T

@LearningAI 这个没有实际测试tokens，就是部署好了之后，它能聊天了，不会有便秘的感觉，不如在线DeepSeek V4 Flash迅速敏捷，不过其他模型的差距可以接受，Llama.cpp和VLLM都只能挂机，不具备日常聊天，即时沟通的可用性。它的优势来自于缓存，Raidx缓存不用大量prefill，就是你发了信息它立刻就回复了。
A

想问成功用上 nvlink 3090 的你们. 是用在什么平台上?
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

53 浏览

A

@terry 暂时根据ai看来是gpu 出问题已经第2个nvlink 一样问题第一个nvlink 卖家用别的卡测试也是有问题感觉 4张 gpu 2条nvlink 都刚好出问题所以怀疑是平台问题
M

下手了 RTX Pro 4500 稳定与行了两周
关注中忽略中已定时已固定已锁定已移动 rtxpro4500
20

1 赞同

20 帖子

331 浏览

M

@566656661 谢谢
Z

超微7049 塔式服务器，搭配什么显卡稳定+运算能力出众呢？
关注中忽略中已定时已固定已锁定已移动
6

0 赞同

6 帖子

65 浏览

Z

@terry 说明，我不是ai啊！哈哈！昨天困了，问了chatgpt 基本上知道，如何配了。
Y

2W预算，想本地模型跑hermes与comfyui出视频需要真正用于生产，求推荐硬件配置
关注中忽略中已定时已固定已锁定已移动 comfyui hermes
5

0 赞同

5 帖子

184 浏览

T

钱花在显卡上，AMD AI Pro R9700 Pro是你最好的选择。2万卡死了RTX Pro 4500， 4080S 32G如果你不怕硬件风险，它最好。真正用于生产，不光要考虑性能，还要考虑稳定性。新卡稳定，但是4080S快，就看你如何选择了。
P

請教 CPU 散片 / RAM / SSD 推薦購買店家
关注中忽略中已定时已固定已锁定已移动
7

0 赞同

7 帖子

165 浏览

I

电源直接买大，万一有双卡需求，到时候又要买大的，我现在就是这样的买了个850W的现在双卡又买了个1200W的
V

RTX3080 20g,qwen3.6 27B 60-40T/S 本地爽玩配置
关注中忽略中已定时已固定已锁定已移动 nvidia rtx3080
81

8 赞同

81 帖子

3k 浏览

V

这是幻觉，无法避免的，这个时候你可以让他将当前任务拆分，然后顺序执行，搞定

1 / 13