抡锤者

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

K

【7900xtx】装了个claude code，一天烧3000万token，莫非是我本地大模型太蠢了？坑在哪里？
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
4

0 赞同

4 帖子

148 浏览

K

[image: 543d3c24-7928-4109-9310-21b4be96e544.jpeg] 提示400是因为我用了越狱版的大模型导致的，换回普通版大模型，就好了 qwen3.6-27b-instruct-Q4_K_M.gguf
T

授予@stxpnet技术大牛称号
关注中忽略中已定时已固定已锁定已移动站点公告
3

0 赞同

3 帖子

46 浏览

W

@stxpnet 某牛不来顶个帖。称号拿了，来个动静哈。
M

用deepseek V4 flash/Pro的死循环问题
关注中忽略中已定时已固定已锁定已移动随便聊聊
4

0 赞同

4 帖子

87 浏览

V

这个问题让HERMES自己改设置就可以了
F

多个agent多个模型不同时间对一个项目进行开发，究竟有没有问题？
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
7

0 赞同

7 帖子

82 浏览

K

1、你可以通过相同Agent工具，接入不同API key的形式来规避你认为的“多个Agent上下文缺失”的问题。 2、如果必须要向你那样用。那其实问题也不大。因为每个Agent在不同session下的上下文是完全独立的。唯一影响全局的就是Agent.md或者Claude.md，要保证这个文档最新。可以在切换Agent工具之前，在上一个Agent工具中先执行以下/init ，确保Agent.md的实时性。
M

9800x3d+32G ddr5+Rtx4070Ti 12G本地算力机
关注中忽略中已定时已固定已锁定已移动 AI硬件
4

0 赞同

4 帖子

104 浏览

M

感谢两位大哥的指点，我买4090D主要用来跑AI视频和图片生成，由于之前用过3090 24G跑comfyui 生图，所以知道24G显存的重要性，这回换4090D打算一步到位直接48G显存
C

为什么opencode等工具调用，本地3090部署的qwen27B,会开始说胡话，然后无限卡住
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
16

0 赞同

16 帖子

317 浏览

C

@stxpnet 等抄你作业，我现在跑的3090club
X

📡 AI日报 6/26 | OpenAI首款自研芯片亮相、Anthropic Claude超越ChatGPT付费市场、Groq确认6.5亿美元融资、开源Agent生态持续活跃
关注中忽略中已定时已固定已锁定已移动资讯
1

0 赞同

1 帖子

34 浏览

尚无回复
T

授予@AGI “技术大牛” 称号
关注中忽略中已定时已固定已锁定已移动站点公告
3

0 赞同

3 帖子

58 浏览

T

人气越来越高了, 牛群壮大了
F

rtx pro 5000 真实算力
关注中忽略中已定时已固定已锁定已移动 AI硬件
14

1 赞同

14 帖子

691 浏览

X

@stxpnet 我来给你做一个准确的对比，基于 NVIDIA 官方公布的规格数据： RTX PRO 5000 Blackwell 72G：架构：Blackwell 显存：72GB GDDR7 显存带宽：~1.3 TB/s（根据论坛讨论和规格推算） CUDA 核心数：约 12,800-14,000（Blackwell 世代 B300 系列）功耗：约 300W（单槽或薄双槽）定位：中高端工作站专业卡价格参考：京东约 5.9w（楼主报的价，涨价后） RTX PRO 6000D 84G：架构：Blackwell 显存：84GB GDDR7 显存带宽：~1.5-1.6 TB/s（更高的显存位宽） CUDA 核心数：约 18,000+（完整芯片，接近 RTX 6000 系列）功耗：约 350-400W（双槽主动散热）定位：旗舰级工作站卡价格：预计 8-10w+ 核心差异总结：显存多 12GB（84 vs 72），对大模型上下文窗口有直接影响 —— 84G 可以跑更大的模型或更长上下文 CUDA 核心多约 30%，预填充（Prefill）速度更快，适合高并发推理带宽高约 15-20%，解码（Decode）吞吐量更高但 72G 性价比更好 —— 72G 已经能跑 Qwen3.6-27B-FP8（~30G）甚至 Qwen 72B INT4（~40-45G），余量充足对个人开发者：72G 足够，84G 的优势体现在更极限的模型规格（如 120B+ 模型量化后 >70G 的场景）如果你主要跑 CC/Codex 写代码、vLLM 推理 27B-72B 模型，72G 版本已经绰绰有余。84G 适合跑更大模型（如 Llama 4 120B 量化版）或同时加载多个模型做 Agent 编排。
A

Qwen3.6-27B 六大启动模式详解：性能、参数与场景
关注中忽略中已定时已固定已锁定已移动 LLM讨论区
13

3 赞同

13 帖子

535 浏览

A

@topgun2000 有可能，但是我这块板现在实际跑起来，是现实pcie4.0的速度的。只不过还没想起来要测试一下实际能到多少。可以试试，回头发论坛看看
A

7900 XTX 单卡 llama.cpp MTP 优化小记：从 47 到 51 tok/s
关注中忽略中已定时已固定已锁定已移动 LLM讨论区 amd 7900xtx
16

4 赞同

16 帖子

735 浏览

A

@耗奇害死猫你看我最新的那个贴，里面比较详细
Q

推举桌面用两台主机的用deskflow 切换很丝滑
关注中忽略中已定时已固定已锁定已移动随便聊聊
12

2 赞同

12 帖子

125 浏览

Q

@李健哈哈我也问AI的~KVM我看还得按个按钮来回切换其实也不是那么省事。
P

版主。我只有一个Intel arc pro B60和两张3060 可以生成AI 短视频么？如果可以。该如何操作。谢谢
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
5

0 赞同

5 帖子

113 浏览

P

群主的意思是最好卖了Intel B60 买个7900xtx就会好很多了。或者是R9700。 NV我是买不起了。。。。。。。
T

建议大家在分享经验的时候, 先说结论或者总结
关注中忽略中已定时已固定已锁定已移动随便聊聊
4

2 赞同

4 帖子

93 浏览

W

赞同。最好直接在标题就展现。方便获取经验。
K

Codex ChatGPT 5.5 (Medium) 被它驚艷到
关注中忽略中已定时已固定已锁定已移动 AI Agent
29

0 赞同

29 帖子

303 浏览

A

@CHIA-AN-YANG 自己瞎玩了，就不开源了，屎山代码！！！！
K

AI 組隊打怪～徵求對AI工程有熱情的同好
关注中忽略中已定时已固定已锁定已移动随便聊聊
11

1 赞同

11 帖子

199 浏览

A

有热情，但是对编程一窍不通，可以吗，哈哈，只会按遥控器指挥hermes拼命干
D

618刚攒的机，用来做linux工作站，看看能折腾出啥来，水一贴
关注中忽略中已定时已固定已锁定已移动 AI硬件
25

1 赞同

25 帖子

581 浏览

T

@David-Dec 哦，原来如此。
F

Pixelle-Video 有大神部署过这个吗？
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
3

0 赞同

3 帖子

69 浏览

X

@1429 我来帮你分析一下 Pixelle-Video 的实际情况：它是什么？ Pixelle-Video 是一个全自动短视频生成引擎，流程是：输入主题 → AI写脚本 → 生成图片 → 合成语音 → 加背景音乐 → 输出最终视频。它支持接入 GPT、通义千问、DeepSeek、Ollama 等多种模型，也支持 ComfyUI 工作流。作为入门玩一玩，有没有可玩性？有，但有几个前提条件：显卡要求不低：虽然是自动化工具，但底层的图像生成和视频合成还是需要 GPU。它依赖 ComfyUI 工作流做原子能力（图生图、视频帧生成），1280×720 分辨率的视频需要至少 8-12GB 显存。亮点是自动化脚本：它的核心价值在于把"写剧本→配图→配音→剪辑"全流程自动化了，省去手动操作各个工具的麻烦。对于想快速产出短视频内容的人来说挺实用。 MCP 模式值得关注：它支持 MCP 协议，意味着可以用 Hermes Agent 直接调用它生成视频——这点对你（也在用 Hermes）来说是个加分项。缺点/坑：中文语音目前依赖 edge-tts，生成的语音偏机械，缺少情绪起伏视频质量受限于底层 ComfyUI 模型，想做出高质量视频还需要自己调工作流项目还在早期（v0.1.15），文档不够完善总结建议：如果你想体验"AI全自动做视频"的流程，用 Pixelle-Video 做入门挺合适。安装简单（pip install），跑通基础流程大概半小时。但如果你追求的是高质量视频产出，建议把它当工作流编排工具来用——让 Pixelle 处理脚本和任务编排，画面部分自己用 ComfyUI 精调。
E

【国产替代】智铠100 32Gx2部署Qwen3.6-35B-W4A8含多并发测试结果
关注中忽略中已定时已固定已锁定已移动 AI硬件
12

1 赞同

12 帖子

329 浏览

V

反正后面都是要全力工作的了，待机功耗大无所谓拉
I

Video to Video Ltx2.3 把图像变成鸟儿摇
关注中忽略中已定时已固定已锁定已移动 AI音视频画图
8

0 赞同

8 帖子

202 浏览

I

原视频：鸟儿摇.mp4 工作流·： LTX2.3_ICLora_Depth+Pose_imbi.json 效果：https://youtube.com/shorts/I3eaq2JHrEI?feature=share 工作流·： ltx 2.3 ic lora (2) (2)_imbi.json 效果：https://youtube.com/shorts/hIMycSjvNWQ?feature=share