跳转至内容

随便聊聊

106 主题 1.1k 帖子

随便聊聊

  • 新手報到,多多指教

    7
    3 赞同
    7 帖子
    85 浏览
    Tony WangT
    @Vincent-Chen 你通过 telegram 和line 都能控制 AI agent, AI agent 提前配置好, 就能控制ComfyUI 出图. telegram 和微信我是实测过的, 没问题. line我没测过, 但是Hermes的文档里说是支持的. 另外, 50岁大叔这里一大把.
  • 现在线上出图出视频这么便宜了?

    1
    0 赞同
    1 帖子
    111 浏览
    尚无回复
  • 4090 48G最适合跑什么LLM?

    5
    0 赞同
    5 帖子
    126 浏览
    mei liM
    视频模型,只能单卡跑,不是chat或者多模态模型。
  • 汇报一下 最近在 南美洲 厄瓜多尔 的显卡价格

    已移动
    3
    0 赞同
    3 帖子
    196 浏览
    kos orK
    台灣最近一波調漲 也差不多是這個價位了, 網友回報歐洲也是, 我不清楚北美市場 => RTX PRO 6000 Blackwell Workstation 96GB 15961 美元
  • 我现在已经把电脑装好了,现在不知道要做下一步是什么

    3
    0 赞同
    3 帖子
    119 浏览
    M
    哈哈 , 你是什么系统? windows吗> ? 弄个 lm studio , 可以跑本地模型
  • 论坛BUG

    已移动
    2
    0 赞同
    2 帖子
    65 浏览
    terryT
    没事,小问题,不在乎,偶尔有点小错误,我也不至于为了这个去改代码。
  • 云一个,中国海关刚停止了5090D v2的进口许可

    14
    0 赞同
    14 帖子
    244 浏览
    V
    @Tony-Wang 说: @voyage2005 我在安省, 你看截图, 最低的5555, 稍好的品牌都6000以上, 加13%的税, 再乘以5. 3万打不住了. 你截图的亚马逊售价偏贵,加拿大电脑配件店找canadacomputers.com,memoryexpress.com 和 newegg.ca [image: d1aaa2f4-d74d-4fdf-b43f-1045aa5abe59.jpeg]
  • 歪个楼,有玩 3D 打印的吗?😀

    15
    2 赞同
    15 帖子
    279 浏览
    B
    试试build123d吧
  • 严格按推荐购买了入门配置。软件折腾的道路求指引。

    已移动 rtx3090
    5
    0 赞同
    5 帖子
    221 浏览
    terryT
    分享不错,DDR3那么便宜你不上64?32你的场景也够用了。你就Llama.cpp跑 qwen3.6 27b就行了,该有的技术都会有。
  • 定了一台HP OMEN 5090的机器。

    已移动
    4
    0 赞同
    4 帖子
    135 浏览
    terryT
    @Hank-Wang 来发使用体验,记得截图,国外不要折腾洋垃圾,人工贵。
  • 想搭建服务器让小团队使用

    已移动
    4
    0 赞同
    4 帖子
    148 浏览
    terryT
    单卡大显存最省心。
  • 新人报道,请问有R9700的专门讨论版么?

    3
    0 赞同
    3 帖子
    122 浏览
    jenaflexJ
    @Max 有R9700专属标签,方便定位帖子,或者搜索
  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?

    AI硬件
    47
    0 赞同
    47 帖子
    2k 浏览
    kos orK
    我用的是llama.cpp + Ubuntu + 2 x RTX5070 Ti in PP 來跑同樣一個模型, 最佳MTP draft-n 設定居然會不同 有趣了
  • 关于 7900 xtx 与 AMD 驱动

    已移动
    8
    0 赞同
    8 帖子
    263 浏览
    Qi KaiserQ
    @pilipala 楼主自己说的啊,游戏还是要打的,要是steam OS就能不用win也能畅玩了。 我也有点好奇,因为我也有类似的想法,所以我去问了下chatGPT,它告诉我大多数文档都是默认Ubuntu的,作为Arch得自己修包,所以还是不太行。
  • 不知道有没有卖整机、洋垃圾组成的算力机器?

    已移动
    4
    0 赞同
    4 帖子
    146 浏览
    williamlouisW
    @菠菜多 基础机构都这么LOW了。3090就行
  • 入手了pro6000 有没有兄弟一起研究的?

    AI硬件
    14
    1 赞同
    14 帖子
    235 浏览
    ?
    找个风扇吹一下就好,最好是能够照顾到电源接口。反正我之前都是600W满功耗跑了好几晚上,确实是比较烫的。 所以后面我准备弄两个额外的风扇对着吹,这样应该就很保险了。
  • 请教pro6000同时跑comfyui视频和hermes+qwen3.6-27B-Q4任务会部会卡?

    已移动
    18
    0 赞同
    18 帖子
    433 浏览
    ?
    VLLM_ATTENTION_BACKEND=FlashInfer VLLM_PROFILER_ESTIMATE_CUDAGRAPHS=1 python3 -m vllm.entrypoints.openai.api_server --model /models/qwen/Qwen3.6-27B-FP8 --trust-remote-code --max-model-len 102400 --kv-cache-dtype fp8_e4m3 --gpu-memory-utilization 0.55 --enable-chunked-prefill --enable-prefix-caching --max-num-batched-tokens 8192 --max-num-seqs 2 --speculative-config '{"method": "mtp", "num_speculative_tokens": 3}' --served-model-name "Qwen-27B-FP8" --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3 --host 0.0.0.0 --port 8000 [image: f848e14d-f6a8-4b07-bc00-ae5226fce67c.jpeg] 我用的这个参数,然后comfyui做的生成视频工作流,研究了一晚上暂时没有崩过,comfyui跑起来的额时候能到40GB左右的样子通常不会超过40GB。vllm我之前设置的0.58也不会崩,后面为了保险降到了0.55;不过我这是100K上下文,暂时就我一个人在用。 不清楚如果后面有并发了会不会崩。
  • 求教,顯卡的選擇

    已移动
    12
    0 赞同
    12 帖子
    180 浏览
    陳瑋
    @terry 是的我就是看上32g的,那我那個6600xt剩下打遊戲的功能了⋯
  • 0 赞同
    4 帖子
    165 浏览
    XiaoteX
    @gxmulyj RTX Pro 5000 72G上Wan2.2的话,分享几个实测经验供参考: Wan2.1 I2V 14B的显存占用: fp8权重约16GB,加上teacache缓存、latent、VAE解码,全程约28-32GB 72G显存完全够跑官方原生workflow,还能开高分辨率(比如720p原图+大tile) 速度方面,50步+teacache 0.06约40-60秒一帧(看分辨率),比4090/48G舒服不少 提速的几个关键点: Teacache开0.06-0.08,不影响质量但速度快30%-40% 用K采样器+DDIM替代默认的Euler,同质量步数少 多卡时注意tensor split分配——72G单卡其实比两张40G分卡更好,不用跨卡通信 想更快还可以: 试试KJ工作流(比原生Wan2.2 workfow快,特哥也推荐过) 降分辨率到512×512出片后再用ESRGAN放大,抽卡效率更高 72G目前是Wan2.2的甜点区域——单卡能跑完整工作流,又不会像48G那样需要超分或降低配置。期待你到手后分享实测数据!
  • 关于没钱人的3090 24G装机探讨!!大神帮我过过目,

    已移动
    7
    0 赞同
    7 帖子
    242 浏览
    yun bianY
    @David-Zhang 感谢回复 只跑模型 想生产下