跳转至内容

AI硬件

98 主题 1.3k 帖子

显卡,主板,CPU,内存,SSD,小主机,服务器等AI硬件~

  • 小小秀一下我的AI RIG

    50
    4 赞同
    50 帖子
    762 浏览
    P
    @Fred @Fred 我的大玩具也装好了,哈哈哈~~
  • 老款 dell 塔式工作站 7920 升级 AI视频工作站

    8
    0 赞同
    8 帖子
    79 浏览
    Black ShuaiB
    谢谢 好的 收到指导。
  • 0 赞同
    25 帖子
    582 浏览
    陳瑋
    @y2k 對大佬崇敬之心油然而生,不為別的,就單為這顆知恥近乎勇的心
  • 给你们看看我运行Hermes的设备

    5
    2 赞同
    5 帖子
    175 浏览
    Hank WangH
    @williamlouis 关键词rock64,但是这是9年前的产品了。现在还是要用树莓派,我这个4g内存。现在新树莓派4g肯定比这rock64 性能高。当时买1000多点人民币好像。
  • 此主题已被删除!

    4
    -3 赞同
    4 帖子
    43 浏览
  • 严格按推荐购买了入门配置。软件折腾的道路求指引。

    3090
    5
    0 赞同
    5 帖子
    112 浏览
    terryT
    分享不错,DDR3那么便宜你不上64?32你的场景也够用了。你就Llama.cpp跑 qwen3.6 27b就行了,该有的技术都会有。
  • 定了一台HP OMEN 5090的机器。

    4
    0 赞同
    4 帖子
    75 浏览
    terryT
    @Hank-Wang 来发使用体验,记得截图,国外不要折腾洋垃圾,人工贵。
  • 想搭建服务器让小团队使用

    4
    0 赞同
    4 帖子
    79 浏览
    terryT
    单卡大显存最省心。
  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?

    33
    0 赞同
    33 帖子
    875 浏览
    jianyuan zhangJ
    @terry OK ,谢谢,马上处理掉
  • 关于 7900 xtx 与 AMD 驱动

    8
    0 赞同
    8 帖子
    155 浏览
    Qi KaiserQ
    @pilipala 楼主自己说的啊,游戏还是要打的,要是steam OS就能不用win也能畅玩了。 我也有点好奇,因为我也有类似的想法,所以我去问了下chatGPT,它告诉我大多数文档都是默认Ubuntu的,作为Arch得自己修包,所以还是不太行。
  • 不知道有没有卖整机、洋垃圾组成的算力机器?

    4
    0 赞同
    4 帖子
    74 浏览
    williamlouisW
    @菠菜多 基础机构都这么LOW了。3090就行
  • 入手了pro6000 有没有兄弟一起研究的?

    14
    1 赞同
    14 帖子
    142 浏览
    t68823878T
    找个风扇吹一下就好,最好是能够照顾到电源接口。反正我之前都是600W满功耗跑了好几晚上,确实是比较烫的。 所以后面我准备弄两个额外的风扇对着吹,这样应该就很保险了。
  • 请教pro6000同时跑comfyui视频和hermes+qwen3.6-27B-Q4任务会部会卡?

    18
    0 赞同
    18 帖子
    300 浏览
    t68823878T
    VLLM_ATTENTION_BACKEND=FlashInfer VLLM_PROFILER_ESTIMATE_CUDAGRAPHS=1 python3 -m vllm.entrypoints.openai.api_server --model /models/qwen/Qwen3.6-27B-FP8 --trust-remote-code --max-model-len 102400 --kv-cache-dtype fp8_e4m3 --gpu-memory-utilization 0.55 --enable-chunked-prefill --enable-prefix-caching --max-num-batched-tokens 8192 --max-num-seqs 2 --speculative-config '{"method": "mtp", "num_speculative_tokens": 3}' --served-model-name "Qwen-27B-FP8" --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3 --host 0.0.0.0 --port 8000 [image: f848e14d-f6a8-4b07-bc00-ae5226fce67c.jpeg] 我用的这个参数,然后comfyui做的生成视频工作流,研究了一晚上暂时没有崩过,comfyui跑起来的额时候能到40GB左右的样子通常不会超过40GB。vllm我之前设置的0.58也不会崩,后面为了保险降到了0.55;不过我这是100K上下文,暂时就我一个人在用。 不清楚如果后面有并发了会不会崩。
  • 求教,顯卡的選擇

    12
    0 赞同
    12 帖子
    96 浏览
    陳瑋
    @terry 是的我就是看上32g的,那我那個6600xt剩下打遊戲的功能了⋯
  • 0 赞同
    4 帖子
    95 浏览
    XiaoteX
    @gxmulyj RTX Pro 5000 72G上Wan2.2的话,分享几个实测经验供参考: Wan2.1 I2V 14B的显存占用: fp8权重约16GB,加上teacache缓存、latent、VAE解码,全程约28-32GB 72G显存完全够跑官方原生workflow,还能开高分辨率(比如720p原图+大tile) 速度方面,50步+teacache 0.06约40-60秒一帧(看分辨率),比4090/48G舒服不少 提速的几个关键点: Teacache开0.06-0.08,不影响质量但速度快30%-40% 用K采样器+DDIM替代默认的Euler,同质量步数少 多卡时注意tensor split分配——72G单卡其实比两张40G分卡更好,不用跨卡通信 想更快还可以: 试试KJ工作流(比原生Wan2.2 workfow快,特哥也推荐过) 降分辨率到512×512出片后再用ESRGAN放大,抽卡效率更高 72G目前是Wan2.2的甜点区域——单卡能跑完整工作流,又不会像48G那样需要超分或降低配置。期待你到手后分享实测数据!
  • 关于没钱人的3090 24G装机探讨!!大神帮我过过目,

    7
    0 赞同
    7 帖子
    148 浏览
    yun bianY
    @David-Zhang 感谢回复 只跑模型 想生产下
  • 跑27b模型购买设备请教

    16
    0 赞同
    16 帖子
    602 浏览
    terryT
    @applejuice 3090早特么停产了,100%矿卡,给你保你相信就没啥问题,关键是互信。
  • 装机翻车了,求救

    36
    1 赞同
    36 帖子
    478 浏览
    P
    @joker_chang 多卡推荐长城的N系列,我已经用上了。你的配置单里是G系列吧,也很不错。
  • 4万2这个配置值吗?

    9
    0 赞同
    9 帖子
    193 浏览
    Ocean WangO
    请问用什么插件 让4张3090并行出视频
  • 汇报一下 最近在 南美洲 厄瓜多尔 的显卡价格

    2
    0 赞同
    2 帖子
    100 浏览
    terryT
    我看,简直就是抢钱,但你其实机会挺大,现在AI就是兄妹狂飙,英语汉语的天下,你懂西班牙语,结合当地流量机制,就是翻译汉语内容也发了