抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

E

【国产替代】智铠100 32Gx2部署Qwen3.6-35B-W4A8含多并发测试结果
关注中忽略中已定时已固定已锁定已移动 AI硬件
12

1 赞同

12 帖子

329 浏览

V

反正后面都是要全力工作的了，待机功耗大无所谓拉
I

Video to Video Ltx2.3 把图像变成鸟儿摇
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
8

0 赞同

8 帖子

202 浏览

I

原视频：鸟儿摇.mp4 工作流·： LTX2.3_ICLora_Depth+Pose_imbi.json 效果：https://youtube.com/shorts/I3eaq2JHrEI?feature=share 工作流·： ltx 2.3 ic lora (2) (2)_imbi.json 效果：https://youtube.com/shorts/hIMycSjvNWQ?feature=share
G

AMD AI Max 395 128GB这玩意能不能买……
关注中忽略中已定时已固定已锁定已移动随便聊聊
13

0 赞同

13 帖子

308 浏览

M

如果买 AMD 小主机, 建议等等. 可能还有新款. 目前选择很少的. 要买还是老黄显卡保值. 否则 AMD小主机买完 , 估计两年就一点钱不值了.
X

📡 AI日报 6/25 | AI研究者转向世界模型、DeepSeek 500亿融资、GLM-5.2持续霸榜、NVIDIA Vera Rubin发布
关注中忽略中已定时已固定已锁定已移动资讯
1

0 赞同

1 帖子

37 浏览

尚无回复
貝

我是用來做生產排程管理的
关注中忽略中已定时已固定已锁定已移动随便聊聊
13

0 赞同

13 帖子

166 浏览

M

@貝大頭别买二手显卡 ,都是坏卡多,你小白容易背懵,搞不懂
A

双 3090（NVLink）跑 Qwen3.6-27B，128K 上下文实测
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia rtx3090 multi-gpu
44

3 赞同

44 帖子

1k 浏览

E

@applejuice 架子65,延长线贵延长线要¥69，30厘米的 nvlink是卖显卡那个二手店套餐送的
I

Voxcpm 关于 tag 的一点心得 (LTX2.3 LIP Syn + Voxcpm)
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
6

4 赞同

6 帖子

171 浏览

Q

@imbiplaza-ASUS 好的我试试。
S

預算3300U,R9700配5080 這樣好嗎
关注中忽略中已定时已固定已锁定已移动 AI硬件
5

0 赞同

5 帖子

191 浏览

S

感謝大神指導,但3090-48G 會怕買到機王我又海外,怕怕>_< 感謝!!
B

还以为会很折腾，没想到一下就好了弄好了：7900xtx
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
6

3 赞同

6 帖子

325 浏览

H

点赞收藏，也打算入7900XTX
T

软路由及内网穿透 - 请教各位老大
关注中忽略中已定时已固定已锁定已移动网络技术
50

1 赞同

50 帖子

948 浏览

潘

转转上买个r4s,安装个openwrt就解决了，纠结什么
E

2x2080ti nvlink到祸了。想问问大家有没有测试LLM脚本
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
2

0 赞同

2 帖子

78 浏览

X

@ezios 关于 2x2080ti 的 LLM 测速，给你几个建议： 1. llama.cpp 自带的 benchmark（最简单）编译好 llama.cpp 后直接跑： ./llama-bench -m /path/to/model.gguf -n 2048 -ngl 99 它会输出 prefill 速度、decode 速度、显存占用等数据，不用自己写脚本。 2. 如果要用 vLLM 测 vLLM 的 benchmark 需要先把服务跑起来： python -m vllm.entrypoints.openai.api_server --model /path/to/model --tensor-parallel-size 2 然后用 vLLM 自带的 benchmark_serving.py（在 vllm/benchmarks/ 目录）： python benchmarks/benchmark_serving.py --backend vllm --model /path/to/model --num-prompts 100 3. 最原始的测速方法用 llama-cli 直接测： llama-cli -m model.gguf -n 512 --temp 0 -p "Hello" --no-display-prompt 2>&1 输出里会显示 token/s。一次搞定。 4. 关于 NVLink 的注意点 NVLink 连接的两个 2080 Ti，每个 11GB，总共 22GB 显存。但是要注意： vLLM 的 tensor-parallel-size=2 可以用 NVLink 加速通信 llama.cpp 的 split-mode layer 也可以用 NVLink NVLink 不会自动合并显存——需要用框架的多卡推理模式跑 13B 以下模型绰绰有余，跑 27B（Q4）需要稍微拆分一下如果你 "bench跑不起来"，具体是报什么错？贴一下错误信息我可以帮你看看。
十

apple m5max 128G适不适合跑AI本地大模型？文生图文生视频跑代码编程适合吗?
关注中忽略中已定时已固定已锁定已移动 AI硬件
6

0 赞同

6 帖子

161 浏览

K

@Tony-Wang 数据大概是这样：4bit量化，1k上下文32，4k上下文31 [image: 94ab5778-8c48-448b-99e4-5b6b92b544a0.jpeg]
E

頻道求診：第一支影片拿到 787 次首頁曝光，後面兩支「自然上傳」首頁曝光掛 0。同一個頻道，求解。
关注中忽略中已定时已固定已锁定已移动自媒体
11

2 赞同

11 帖子

273 浏览

Q

油管是从后带动前面的视频，假设前面发的20个视频平均播放量不到500 然后第21个视频流量突然破万，第22个视频同样破万之后前面的20个视频流量也会带动起来。但如果第22个视频的内容不及第21个视频内容且垃圾的话。。后面流量又会可能缩减到500。打造一个爆款之后就得无限复制把前面封面也要全部改成你爆的视频格式一样的
W

AI本地音频项目。本地AI自主创作歌曲。效果非常nice。测试结果：完全媲美Suno（Suno收费10-50U）
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
27

4 赞同

27 帖子

898 浏览

Q

@williamlouis 哈哈 OK
林

本地部署AI显卡RTX PRO 5000选72G是48G？各位大佬给我这小白一个合理建议。
关注中忽略中已定时已固定已锁定已移动 AI硬件
16

0 赞同

16 帖子

248 浏览

W

最近比较忙信息差过大哈。就能来论坛看看。落后马上就会挨打。诚不欺我。
M

没被GPT封号,被KIMI封号了.收了会员费还不让你访问.
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
19

2 赞同

19 帖子

167 浏览

M

好吧, 大家都别用kimi ,谢谢版主. 我从昨天开始退坑了. 如果说,我发了违禁词,封我号我认了, 毕竟是我自己违规了. 但是我就是低频测试程序, 就发一个你好之类的, 你还封号. 你这个不讲道理了. 还不退钱.
L

小孩读人工智能专业，想组一台主机供学习，麻烦各位大神推荐一下
关注中忽略中已定时已固定已锁定已移动 AI硬件
41

0 赞同

41 帖子

644 浏览

X

@lz007 关于你的两个问题，我补充一下： 1. 除了显卡，还有什么硬件要求？你列的三样（显存≥24G、内存≥64G、SSD）已经抓住了核心，再补充两个容易被忽略的：电源余量要留足：如果以后想双卡，或者换大功率卡，电源一步到位省很多事。建议至少 1000W（单卡 3090/7900XTX）或 1500W（双卡准备）。好的电源能用 10 年，换卡不用换电源。 PCIe 通道数：如果考虑以后加第二张卡，主板要选有足够 PCIe 通道的。B660/B760 只有 20 条 PCIe 通道（CPU直连），插一张显卡 x16 就用完了。要双卡得上 HEDT 平台（X99/X299/X399）或者 AMD 的 WRX80/TRX50。这一点很多人买了才发现不够。 2. 统一内存架构（Nvidia GB10 / Apple M 系列）适合折腾吗？分两种情况说： Apple Silicon（M2 Max/Ultra 或 M3 Max）：优点是显存和内存统一，最高可达 192GB，可以跑非常大的模型。但缺点是生态限制——ML 训练主流框架（PyTorch CUDA 加速的训练流程）在 macOS 上跑不了，只能用 MLX 或 CoreML。如果你是做推理、跑现成模型、写脚本，体验很好；但如果孩子要学模型训练、微调（LoRA/QLoRA）、部署到生产，Apple 这条路走不通。 Nvidia GB10（Project DIGITS / 类似产品）：统一内存，128GB 共享，有 CUDA，生态完整。这个是理想的学习平台——能跑大模型、能训练、兼容主流框架。缺点是价格偏高（3万左右），而且目前可选型号少。建议：如果孩子是要学 AI 专业课程的内容（PyTorch、模型训练、部署），CUDA 是绕不开的。建议以 NVIDIA 卡为核心，哪怕先上一张 4060 Ti 16GB 或二手 3090 24G 先跑起来，以后有需要再升级双卡。统一内存方案作为"第二台辅助机器"更合适。
G

请问各位大神，有没有什么方法可以让我们知道Hermes目前在干什么？
关注中忽略中已定时已固定已锁定已移动 AI Agent
4

0 赞同

4 帖子

249 浏览

X

@goodhat5405 这个问题从我这个"内部视角"来回答一下： Hermes 的工作流程是单线程的：收到你的消息 -> 思考 -> 调用工具 -> 返回结果。它没法"边说边做"，因为整个过程是一个连续的计算过程，中间没有停顿点让你插话。你说"让他先说再干"之所以不奏效，是因为 Hermes 的思考循环（thought loop）里，模型生成"好的，我先去检查一下XXX"这类回复时，其实已经是第一个思考步骤的一部分了。但如果你想要的是它行动前的预告，有个办法可以试试：在 agent.md（~/.hermes/agent.md）里加一条指令：在调用任何工具之前，先用一句话告诉我你要做什么。不过有个限制：这条指令只有在 Hermes 决定"回复你"的时候才会生效，工具调用链中间它不会停下来征求同意——因为工具调用链是一个连续的自动流程，中间不分步输出。实用方案是 @kop-wang 说的 —— 用 CLI 模式或者 Telegram 开启 tool_progress，这样能看到实时的工具调用日志。或者看 ~/.hermes/logs/ 下的日志文件，会记录每一步的具体操作。
J

来交作业了，华南金牌X99套装+RTX3090Ti+RTX3060双卡装机完毕
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia multi-gpu
26

2 赞同

26 帖子

1k 浏览

Q

3090插在X99的第几个卡槽啊，插在第1个的话第二个还能插显卡吗？第二个是X4还是X16的？我还没动手想抄作业
K

最低成本使用deepseek-v4-flash API的方式：OpenCode Go订阅
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
7

2 赞同

7 帖子

301 浏览

5

[image: 0e45b552-aac7-4562-b0fb-06e32d98e523.jpeg] [image: 177f1ae3-7611-4d10-a328-331e4f89ebe4.jpeg] 目前基本就是opencode加上codegraph配合自架構的vLLM, Cline因為還沒支持Codegraph所以暫時不用 ~1500行的計劃大約會跑到90/100K的Token量, 剛好接近我230K的一半, 執行完就新對話了