抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

随便聊聊

106 主题 1.1k 帖子

随便聊聊

V

新手報到，多多指教
关注中忽略中已定时已固定已锁定已移动
7

3 赞同

7 帖子

85 浏览

T

@Vincent-Chen 你通过 telegram 和line 都能控制 AI agent, AI agent 提前配置好, 就能控制ComfyUI 出图. telegram 和微信我是实测过的, 没问题. line我没测过, 但是Hermes的文档里说是支持的. 另外, 50岁大叔这里一大把.
5

现在线上出图出视频这么便宜了？
关注中忽略中已定时已固定已锁定已移动
1

0 赞同

1 帖子

111 浏览

尚无回复
H

4090 48G最适合跑什么LLM？
关注中忽略中已定时已固定已锁定已移动
5

0 赞同

5 帖子

126 浏览

M

视频模型，只能单卡跑，不是chat或者多模态模型。
L

汇报一下最近在南美洲厄瓜多尔的显卡价格
关注中忽略中已定时已固定已锁定已移动
3

0 赞同

3 帖子

196 浏览

K

台灣最近一波調漲也差不多是這個價位了, 網友回報歐洲也是, 我不清楚北美市場 => RTX PRO 6000 Blackwell Workstation 96GB 15961 美元
P

我现在已经把电脑装好了,现在不知道要做下一步是什么
关注中忽略中已定时已固定已锁定已移动
3

0 赞同

3 帖子

119 浏览

M

哈哈 , 你是什么系统? windows吗> ? 弄个 lm studio , 可以跑本地模型
S

论坛BUG
关注中忽略中已定时已固定已锁定已移动
2

0 赞同

2 帖子

65 浏览

T

没事，小问题，不在乎，偶尔有点小错误，我也不至于为了这个去改代码。
李

云一个，中国海关刚停止了5090D v2的进口许可
关注中忽略中已定时已固定已锁定已移动
14

0 赞同

14 帖子

244 浏览

V

@Tony-Wang 说: @voyage2005 我在安省, 你看截图, 最低的5555, 稍好的品牌都6000以上, 加13%的税, 再乘以5. 3万打不住了. 你截图的亚马逊售价偏贵，加拿大电脑配件店找canadacomputers.com,memoryexpress.com 和 newegg.ca [image: d1aaa2f4-d74d-4fdf-b43f-1045aa5abe59.jpeg]
T

歪个楼，有玩 3D 打印的吗？😀
关注中忽略中已定时已固定已锁定已移动
15

2 赞同

15 帖子

279 浏览

B

试试build123d吧
W

严格按推荐购买了入门配置。软件折腾的道路求指引。
关注中忽略中已定时已固定已锁定已移动 rtx3090
5

0 赞同

5 帖子

221 浏览

T

分享不错，DDR3那么便宜你不上64？32你的场景也够用了。你就Llama.cpp跑 qwen3.6 27b就行了，该有的技术都会有。
H

定了一台HP OMEN 5090的机器。
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

135 浏览

T

@Hank-Wang 来发使用体验，记得截图，国外不要折腾洋垃圾，人工贵。
J

想搭建服务器让小团队使用
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

148 浏览

T

单卡大显存最省心。
M

新人报道，请问有R9700的专门讨论版么？
关注中忽略中已定时已固定已锁定已移动
3

0 赞同

3 帖子

122 浏览

J

@Max 有R9700专属标签，方便定位帖子，或者搜索
A

买了2张5060Ti，谁能跑最便宜的Qwen 27B？
关注中忽略中已定时已固定已锁定已移动 AI硬件
47

0 赞同

47 帖子

2k 浏览

K

我用的是llama.cpp + Ubuntu + 2 x RTX5070 Ti in PP 來跑同樣一個模型, 最佳MTP draft-n 設定居然會不同有趣了
S

关于 7900 xtx 与 AMD 驱动
关注中忽略中已定时已固定已锁定已移动
8

0 赞同

8 帖子

263 浏览

Q

@pilipala 楼主自己说的啊，游戏还是要打的，要是steam OS就能不用win也能畅玩了。我也有点好奇，因为我也有类似的想法，所以我去问了下chatGPT，它告诉我大多数文档都是默认Ubuntu的，作为Arch得自己修包，所以还是不太行。
菠

不知道有没有卖整机、洋垃圾组成的算力机器？
关注中忽略中已定时已固定已锁定已移动
4

0 赞同

4 帖子

146 浏览

W

@菠菜多基础机构都这么LOW了。3090就行
J

入手了pro6000 有没有兄弟一起研究的？
关注中忽略中已定时已固定已锁定已移动 AI硬件
14

1 赞同

14 帖子

235 浏览

?

找个风扇吹一下就好，最好是能够照顾到电源接口。反正我之前都是600W满功耗跑了好几晚上，确实是比较烫的。所以后面我准备弄两个额外的风扇对着吹，这样应该就很保险了。
D

请教pro6000同时跑comfyui视频和hermes+qwen3.6-27B-Q4任务会部会卡？
关注中忽略中已定时已固定已锁定已移动
18

0 赞同

18 帖子

433 浏览

?

VLLM_ATTENTION_BACKEND=FlashInfer VLLM_PROFILER_ESTIMATE_CUDAGRAPHS=1 python3 -m vllm.entrypoints.openai.api_server --model /models/qwen/Qwen3.6-27B-FP8 --trust-remote-code --max-model-len 102400 --kv-cache-dtype fp8_e4m3 --gpu-memory-utilization 0.55 --enable-chunked-prefill --enable-prefix-caching --max-num-batched-tokens 8192 --max-num-seqs 2 --speculative-config '{"method": "mtp", "num_speculative_tokens": 3}' --served-model-name "Qwen-27B-FP8" --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3 --host 0.0.0.0 --port 8000 [image: f848e14d-f6a8-4b07-bc00-ae5226fce67c.jpeg] 我用的这个参数，然后comfyui做的生成视频工作流，研究了一晚上暂时没有崩过，comfyui跑起来的额时候能到40GB左右的样子通常不会超过40GB。vllm我之前设置的0.58也不会崩，后面为了保险降到了0.55；不过我这是100K上下文，暂时就我一个人在用。不清楚如果后面有并发了会不会崩。
陳

求教，顯卡的選擇
关注中忽略中已定时已固定已锁定已移动
12

0 赞同

12 帖子

180 浏览

陳

@terry 是的我就是看上32g的，那我那個6600xt剩下打遊戲的功能了⋯
G

准备想上rtx pro5000 72g内存版本，不知道在comfyui下，wan2.2可以一次性跑多少秒的视频不崩？有经验的朋友可以指点下么？
关注中忽略中已定时已固定已锁定已移动 AI硬件
4

0 赞同

4 帖子

165 浏览

X

@gxmulyj RTX Pro 5000 72G上Wan2.2的话，分享几个实测经验供参考： Wan2.1 I2V 14B的显存占用： fp8权重约16GB，加上teacache缓存、latent、VAE解码，全程约28-32GB 72G显存完全够跑官方原生workflow，还能开高分辨率（比如720p原图+大tile）速度方面，50步+teacache 0.06约40-60秒一帧（看分辨率），比4090/48G舒服不少提速的几个关键点： Teacache开0.06-0.08，不影响质量但速度快30%-40% 用K采样器+DDIM替代默认的Euler，同质量步数少多卡时注意tensor split分配——72G单卡其实比两张40G分卡更好，不用跨卡通信想更快还可以：试试KJ工作流（比原生Wan2.2 workfow快，特哥也推荐过）降分辨率到512×512出片后再用ESRGAN放大，抽卡效率更高 72G目前是Wan2.2的甜点区域——单卡能跑完整工作流，又不会像48G那样需要超分或降低配置。期待你到手后分享实测数据！
Y

关于没钱人的3090 24G装机探讨！！大神帮我过过目，
关注中忽略中已定时已固定已锁定已移动
7

0 赞同

7 帖子

242 浏览

Y

@David-Zhang 感谢回复只跑模型想生产下

3 / 6