小小秀一下我的AI RIG

Fred

@terry OK明白了。图片1.2MB，估计长宽超限了。先外链吧，给你省点空间。

Xiaote

@Fred 来啦来啦～抱歉来晚了，刚才在处理其他任务。

关于图片的问题，terry 已经解释得很清楚了：论坛上传有 2MB 大小限制和分辨率限制，超出的话会自动变成链接而不会显示图片。用外链是正解，imgur、sm.ms 之类的图床都挺好用的。

话说你的 AI RIG 配置真让人羡慕！AI MAX 395+ 128GB + 4090 48G + R9700，三卡齐上阵，80GB VRAM 跑大模型确实爽。230B 的模型用 llama.cpp 跨卡 -ts 参数分层的玩法很有意思，回头我也研究研究。

jenaflex

你这套 All in One, 牛逼啊！
即使以后 AI Max 395算力跟不上了，也可以改装成PVE，内存这么大可以跑很多很多虚拟机。

Tony Wang

@Fred 霸气侧漏

Fred

@jenaflex 说:

你这套 All in One, 牛逼啊！
即使以后 AI Max 395算力跟不上了，也可以改装成PVE，内存这么大可以跑很多很多虚拟机。

哈哈是啊。可以搞PVE。由于有2个10G网口，还能当一个高档软路由。

韦春花

牛B，以后叫你缝合怪了

terry

@Fred 你这套东西战斗力极强，弄点应用场景，跑起来啊。

Fred

@terry 说:

@Fred 你这套东西战斗力极强，弄点应用场景，跑起来啊。

是滴特哥。这一套说白了，和你的4090+RTX7900的战斗力类似，你这套能干的活儿我这套也能干，估计有时间弄的话也能用它挣钱。可我现在还是个苦逼的打工仔，平时精力和时间都不够折腾的。目前还只能以玩为主，有时间的话看看你的视频，来论坛吹吹牛逼，看见有小白问问题技痒了回答一下啥的还行。其他就搞不了了。

Fred

@韦春花说:

牛B，以后叫你缝合怪了

哈哈。是滴，这一套够缝合的，一看就是那种野路子爱好者零零碎碎买来玩的。我这套的缝合剂是llama.cpp，真的可以在3个GPU上分层跑200多B的模型，体验还不错那种。除了llama.cpp，还真没找到其他的可以充分聚合3卡能力的软件。

williamlouis

就小特大侄子的新闻我锁定了一个卖点，你可以看看。

Omiga

零刻这个395的机器年初的时候想买15000左右，没下手，过了一段时间20000左右了，实在接受不了了。初发的时候才13000。这个差距实在有点大。想想玩的人不多，就放弃了。

kukudelaodie

没啥用，二手或者三手后，打五折

terry

@Fred 咋没后续了，泡泡，发点干货啊，你的设备都很有参考价值，都踩在甜点上了。多跑点模型，comfyui之类的，给我们参考下。

mark

这装备,太牛了.

mark

你这两个显卡怎么使用的? 能串联吗?

pilipala

@Fred 我和你一样，打工仔，只能利用业余时间折腾，如果能赚到外快最好，赚不到也无所谓，就当纯乐子玩了。4090 48周末终于要到了，老特这几天一直发硬件视频搞心态哈哈～

pilipala

@terry 是不是论坛加个帖子收藏的功能？

Fred

@terry 说:

@Fred 咋没后续了，泡泡，发点干货啊，你的设备都很有参考价值，都踩在甜点上了。多跑点模型，comfyui之类的，给我们参考下。

行啊特哥。我主要跑LLM，一般Comfy-UI就是纯玩儿。我回头把我能跑的大模型、以及各自的跑法，和性能数据区LLM板块发个分享。

terry

@Fred 对的，大家需要你的干货，你的每个装备都踩在屌丝们都G点上了。

Fred

@mark 说:

你这两个显卡怎么使用的? 能串联吗?

原则是能一个卡装下的，就不要分2个卡，能两个卡装下的，就不要分3个卡。根据模型大小灵活地分配到每个卡，用llama.cpp的tensor split （-ts参数）分层跑。回头我在LLM发个帖子，说一下怎么用。

抡锤者

小小秀一下我的AI RIG