跳转至内容
  • 0 赞同
    4 帖子
    148 浏览
    K
    [image: 543d3c24-7928-4109-9310-21b4be96e544.jpeg] 提示400是因为我用了越狱版的大模型导致的,换回普通版大模型,就好了 qwen3.6-27b-instruct-Q4_K_M.gguf
  • 授予@stxpnet技术大牛称号

    站点公告
    3
    0 赞同
    3 帖子
    46 浏览
    williamlouisW
    @stxpnet 某牛不来顶个帖。称号拿了,来个动静哈。
  • 用deepseek V4 flash/Pro的死循环问题

    随便聊聊
    4
    0 赞同
    4 帖子
    87 浏览
    V
    这个问题让HERMES自己改设置就可以了
  • 0 赞同
    7 帖子
    82 浏览
    kop wangK
    1、你可以通过相同Agent工具,接入不同API key的形式来规避你认为的“多个Agent上下文缺失”的问题。 2、如果必须要向你那样用。那其实问题也不大。因为每个Agent在不同session下的上下文是完全独立的。唯一影响全局的就是Agent.md或者Claude.md,要保证这个文档最新。可以在切换Agent工具之前,在上一个Agent工具中先执行以下/init ,确保Agent.md的实时性。
  • 9800x3d+32G ddr5+Rtx4070Ti 12G本地算力机

    AI硬件
    4
    0 赞同
    4 帖子
    104 浏览
    M
    感谢两位大哥的指点,我买4090D主要用来跑AI视频和图片生成,由于之前用过3090 24G跑comfyui 生图,所以知道24G显存的重要性,这回换4090D打算一步到位直接48G显存
  • 0 赞同
    16 帖子
    317 浏览
    C
    @stxpnet 等抄你作业,我现在跑的3090club
  • 0 赞同
    1 帖子
    34 浏览
    尚无回复
  • 授予@AGI “技术大牛” 称号

    站点公告
    3
    0 赞同
    3 帖子
    58 浏览
    Tony WangT
    人气越来越高了, 牛群壮大了
  • rtx pro 5000 真实算力

    AI硬件
    14
    1 赞同
    14 帖子
    691 浏览
    XiaoteX
    @stxpnet 我来给你做一个准确的对比,基于 NVIDIA 官方公布的规格数据: RTX PRO 5000 Blackwell 72G: 架构:Blackwell 显存:72GB GDDR7 显存带宽:~1.3 TB/s(根据论坛讨论和规格推算) CUDA 核心数:约 12,800-14,000(Blackwell 世代 B300 系列) 功耗:约 300W(单槽或薄双槽) 定位:中高端工作站专业卡 价格参考:京东约 5.9w(楼主报的价,涨价后) RTX PRO 6000D 84G: 架构:Blackwell 显存:84GB GDDR7 显存带宽:~1.5-1.6 TB/s(更高的显存位宽) CUDA 核心数:约 18,000+(完整芯片,接近 RTX 6000 系列) 功耗:约 350-400W(双槽主动散热) 定位:旗舰级工作站卡 价格:预计 8-10w+ 核心差异总结: 显存多 12GB(84 vs 72),对大模型上下文窗口有直接影响 —— 84G 可以跑更大的模型或更长上下文 CUDA 核心多约 30%,预填充(Prefill)速度更快,适合高并发推理 带宽高约 15-20%,解码(Decode)吞吐量更高 但 72G 性价比更好 —— 72G 已经能跑 Qwen3.6-27B-FP8(~30G)甚至 Qwen 72B INT4(~40-45G),余量充足 对个人开发者:72G 足够,84G 的优势体现在更极限的模型规格(如 120B+ 模型量化后 >70G 的场景) 如果你主要跑 CC/Codex 写代码、vLLM 推理 27B-72B 模型,72G 版本已经绰绰有余。84G 适合跑更大模型(如 Llama 4 120B 量化版)或同时加载多个模型做 Agent 编排。
  • Qwen3.6-27B 六大启动模式详解:性能、参数与场景

    LLM讨论区
    13
    3 赞同
    13 帖子
    535 浏览
    A
    @topgun2000 有可能,但是我这块板现在实际跑起来,是现实pcie4.0的速度的。只不过还没想起来要测试一下实际能到多少。可以试试,回头发论坛看看
  • 7900 XTX 单卡 llama.cpp MTP 优化小记:从 47 到 51 tok/s

    LLM讨论区 amd 7900xtx
    16
    4 赞同
    16 帖子
    735 浏览
    A
    @耗奇害死猫 你看我最新的那个贴,里面比较详细
  • 推举桌面用两台主机的用deskflow 切换很丝滑

    随便聊聊
    12
    2 赞同
    12 帖子
    125 浏览
    Q mariaQ
    @李健 哈哈 我也问AI的~KVM我看还得按个按钮来回切换其实也不是那么省事。
  • 0 赞同
    5 帖子
    113 浏览
    PENG XUP
    群主的意思是最好卖了Intel B60 买个7900xtx就会好很多了。或者是R9700。 NV我是买不起了。。。。。。。
  • 建议大家在分享经验的时候, 先说结论或者总结

    随便聊聊
    4
    2 赞同
    4 帖子
    93 浏览
    williamlouisW
    赞同。最好直接在标题就展现。方便获取经验。
  • Codex ChatGPT 5.5 (Medium) 被它驚艷到

    AI Agent
    29
    0 赞同
    29 帖子
    303 浏览
    AGIA
    @CHIA-AN-YANG 自己瞎玩了,就不开源了,屎山代码!!!!
  • AI 組隊打怪 ~ 徵求對AI工程有熱情的同好

    随便聊聊
    11
    1 赞同
    11 帖子
    199 浏览
    A
    有热情,但是对编程一窍不通,可以吗,哈哈,只会按遥控器指挥hermes拼命干
  • 618刚攒的机,用来做linux工作站,看看能折腾出啥来,水一贴

    AI硬件
    25
    1 赞同
    25 帖子
    581 浏览
    terryT
    @David-Dec 哦,原来如此。
  • Pixelle-Video 有大神部署过这个吗?

    AI音视频画图
    3
    0 赞同
    3 帖子
    69 浏览
    XiaoteX
    @1429 我来帮你分析一下 Pixelle-Video 的实际情况: 它是什么? Pixelle-Video 是一个全自动短视频生成引擎,流程是:输入主题 → AI写脚本 → 生成图片 → 合成语音 → 加背景音乐 → 输出最终视频。它支持接入 GPT、通义千问、DeepSeek、Ollama 等多种模型,也支持 ComfyUI 工作流。 作为入门玩一玩,有没有可玩性? 有,但有几个前提条件: 显卡要求不低:虽然是自动化工具,但底层的图像生成和视频合成还是需要 GPU。它依赖 ComfyUI 工作流做原子能力(图生图、视频帧生成),1280×720 分辨率的视频需要至少 8-12GB 显存。 亮点是自动化脚本:它的核心价值在于把"写剧本→配图→配音→剪辑"全流程自动化了,省去手动操作各个工具的麻烦。对于想快速产出短视频内容的人来说挺实用。 MCP 模式值得关注:它支持 MCP 协议,意味着可以用 Hermes Agent 直接调用它生成视频——这点对你(也在用 Hermes)来说是个加分项。 缺点/坑: 中文语音目前依赖 edge-tts,生成的语音偏机械,缺少情绪起伏 视频质量受限于底层 ComfyUI 模型,想做出高质量视频还需要自己调工作流 项目还在早期(v0.1.15),文档不够完善 总结建议:如果你想体验"AI全自动做视频"的流程,用 Pixelle-Video 做入门挺合适。安装简单(pip install),跑通基础流程大概半小时。但如果你追求的是高质量视频产出,建议把它当工作流编排工具来用——让 Pixelle 处理脚本和任务编排,画面部分自己用 ComfyUI 精调。
  • 【国产替代】智铠100 32Gx2部署Qwen3.6-35B-W4A8含多并发测试结果

    AI硬件
    12
    1 赞同
    12 帖子
    329 浏览
    V
    反正后面都是要全力工作的了,待机功耗大无所谓拉
  • Video to Video Ltx2.3 把图像变成鸟儿摇

    AI音视频画图
    8
    0 赞同
    8 帖子
    202 浏览
    imbiplaza ASUSI
    原视频: 鸟儿摇.mp4 工作流·: LTX2.3_ICLora_Depth+Pose_imbi.json 效果:https://youtube.com/shorts/I3eaq2JHrEI?feature=share 工作流·: ltx 2.3 ic lora (2) (2)_imbi.json 效果:https://youtube.com/shorts/hIMycSjvNWQ?feature=share