抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

AI硬件

98 主题 1.3k 帖子

显卡，主板，CPU，内存，SSD，小主机，服务器等AI硬件～

F

小小秀一下我的AI RIG
关注中忽略中已定时已固定已锁定已移动
50

4 赞同

50 帖子

762 浏览

P

@Fred @Fred 我的大玩具也装好了，哈哈哈～～
B

老款 dell 塔式工作站 7920 升级 AI视频工作站
关注中忽略中已定时已固定已锁定已移动
8

0 赞同

8 帖子

79 浏览

B

谢谢好的收到指导。
H

作为一个ai新手，想尝鲜尝试和学习，打算入一张V100 16G的，但是为啥论坛里完全不聊这张卡？真的是没有生产力？还是性价比太低？
关注中忽略中已定时已固定已锁定已移动
25

0 赞同

25 帖子

582 浏览

陳

@y2k 對大佬崇敬之心油然而生，不為別的，就單為這顆知恥近乎勇的心
H

给你们看看我运行Hermes的设备
关注中忽略中已定时已固定已锁定已移动
5

2 赞同

5 帖子

175 浏览

H

@williamlouis 关键词rock64，但是这是9年前的产品了。现在还是要用树莓派，我这个4g内存。现在新树莓派4g肯定比这rock64 性能高。当时买1000多点人民币好像。
W

此主题已被删除！
关注中忽略中已定时已固定已锁定已移动
4

-3 赞同

4 帖子

43 浏览
W

严格按推荐购买了入门配置。软件折腾的道路求指引。
关注中忽略中已定时已固定已锁定已移动 3090
5

0 赞同

5 帖子

112 浏览

T

分享不错，DDR3那么便宜你不上64？32你的场景也够用了。你就Llama.cpp跑 qwen3.6 27b就行了，该有的技术都会有。
H

定了一台HP OMEN 5090的机器。
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

75 浏览

T

@Hank-Wang 来发使用体验，记得截图，国外不要折腾洋垃圾，人工贵。
J

想搭建服务器让小团队使用
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

79 浏览

T

单卡大显存最省心。
A

买了2张5060Ti，谁能跑最便宜的Qwen 27B？
关注中忽略中已定时已固定已锁定已移动
33

0 赞同

33 帖子

875 浏览

J

@terry OK ,谢谢，马上处理掉
S

关于 7900 xtx 与 AMD 驱动
关注中忽略中已定时已固定已锁定已移动
8

0 赞同

8 帖子

155 浏览

Q

@pilipala 楼主自己说的啊，游戏还是要打的，要是steam OS就能不用win也能畅玩了。我也有点好奇，因为我也有类似的想法，所以我去问了下chatGPT，它告诉我大多数文档都是默认Ubuntu的，作为Arch得自己修包，所以还是不太行。
菠

不知道有没有卖整机、洋垃圾组成的算力机器？
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

74 浏览

W

@菠菜多基础机构都这么LOW了。3090就行
J

入手了pro6000 有没有兄弟一起研究的？
关注中忽略中已定时已固定已锁定已移动
14

1 赞同

14 帖子

142 浏览

T

找个风扇吹一下就好，最好是能够照顾到电源接口。反正我之前都是600W满功耗跑了好几晚上，确实是比较烫的。所以后面我准备弄两个额外的风扇对着吹，这样应该就很保险了。
D

请教pro6000同时跑comfyui视频和hermes+qwen3.6-27B-Q4任务会部会卡？
关注中忽略中已定时已固定已锁定已移动
18

0 赞同

18 帖子

300 浏览

T

VLLM_ATTENTION_BACKEND=FlashInfer VLLM_PROFILER_ESTIMATE_CUDAGRAPHS=1 python3 -m vllm.entrypoints.openai.api_server --model /models/qwen/Qwen3.6-27B-FP8 --trust-remote-code --max-model-len 102400 --kv-cache-dtype fp8_e4m3 --gpu-memory-utilization 0.55 --enable-chunked-prefill --enable-prefix-caching --max-num-batched-tokens 8192 --max-num-seqs 2 --speculative-config '{"method": "mtp", "num_speculative_tokens": 3}' --served-model-name "Qwen-27B-FP8" --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3 --host 0.0.0.0 --port 8000 [image: f848e14d-f6a8-4b07-bc00-ae5226fce67c.jpeg] 我用的这个参数，然后comfyui做的生成视频工作流，研究了一晚上暂时没有崩过，comfyui跑起来的额时候能到40GB左右的样子通常不会超过40GB。vllm我之前设置的0.58也不会崩，后面为了保险降到了0.55；不过我这是100K上下文，暂时就我一个人在用。不清楚如果后面有并发了会不会崩。
陳

求教，顯卡的選擇
关注中忽略中已定时已固定已锁定已移动
12

0 赞同

12 帖子

96 浏览

陳

@terry 是的我就是看上32g的，那我那個6600xt剩下打遊戲的功能了⋯
G

准备想上rtx pro5000 72g内存版本，不知道在comfyui下，wan2.2可以一次性跑多少秒的视频不崩？有经验的朋友可以指点下么？
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

95 浏览

X

@gxmulyj RTX Pro 5000 72G上Wan2.2的话，分享几个实测经验供参考： Wan2.1 I2V 14B的显存占用： fp8权重约16GB，加上teacache缓存、latent、VAE解码，全程约28-32GB 72G显存完全够跑官方原生workflow，还能开高分辨率（比如720p原图+大tile）速度方面，50步+teacache 0.06约40-60秒一帧（看分辨率），比4090/48G舒服不少提速的几个关键点： Teacache开0.06-0.08，不影响质量但速度快30%-40% 用K采样器+DDIM替代默认的Euler，同质量步数少多卡时注意tensor split分配——72G单卡其实比两张40G分卡更好，不用跨卡通信想更快还可以：试试KJ工作流（比原生Wan2.2 workfow快，特哥也推荐过）降分辨率到512×512出片后再用ESRGAN放大，抽卡效率更高 72G目前是Wan2.2的甜点区域——单卡能跑完整工作流，又不会像48G那样需要超分或降低配置。期待你到手后分享实测数据！
Y

关于没钱人的3090 24G装机探讨！！大神帮我过过目，
关注中忽略中已定时已固定已锁定已移动
7

0 赞同

7 帖子

148 浏览

Y

@David-Zhang 感谢回复只跑模型想生产下
Y

跑27b模型购买设备请教
关注中忽略中已定时已固定已锁定已移动
16

0 赞同

16 帖子

602 浏览

T

@applejuice 3090早特么停产了，100%矿卡，给你保你相信就没啥问题，关键是互信。
P

装机翻车了，求救
关注中忽略中已定时已固定已锁定已移动
36

1 赞同

36 帖子

478 浏览

P

@joker_chang 多卡推荐长城的N系列，我已经用上了。你的配置单里是G系列吧，也很不错。
쿄

4万2这个配置值吗？
关注中忽略中已定时已固定已锁定已移动
9

0 赞同

9 帖子

193 浏览

O

请问用什么插件让4张3090并行出视频
L

汇报一下最近在南美洲厄瓜多尔的显卡价格
关注中忽略中已定时已固定已锁定已移动
2

0 赞同

2 帖子

100 浏览

T

我看，简直就是抢钱，但你其实机会挺大，现在AI就是兄妹狂飙，英语汉语的天下，你懂西班牙语，结合当地流量机制，就是翻译汉语内容也发了

3 / 5