小小秀一下我的AI RIG

Fred

@韦春花说:

牛B，以后叫你缝合怪了

哈哈。是滴，这一套够缝合的，一看就是那种野路子爱好者零零碎碎买来玩的。我这套的缝合剂是llama.cpp，真的可以在3个GPU上分层跑200多B的模型，体验还不错那种。除了llama.cpp，还真没找到其他的可以充分聚合3卡能力的软件。

williamlouis

就小特大侄子的新闻我锁定了一个卖点，你可以看看。

Omiga

零刻这个395的机器年初的时候想买15000左右，没下手，过了一段时间20000左右了，实在接受不了了。初发的时候才13000。这个差距实在有点大。想想玩的人不多，就放弃了。

kukudelaodie

没啥用，二手或者三手后，打五折

terry

@Fred 咋没后续了，泡泡，发点干货啊，你的设备都很有参考价值，都踩在甜点上了。多跑点模型，comfyui之类的，给我们参考下。

mark

这装备,太牛了.

mark

你这两个显卡怎么使用的? 能串联吗?

pilipala

@Fred 我和你一样，打工仔，只能利用业余时间折腾，如果能赚到外快最好，赚不到也无所谓，就当纯乐子玩了。4090 48周末终于要到了，老特这几天一直发硬件视频搞心态哈哈～

pilipala

@terry 是不是论坛加个帖子收藏的功能？

Fred

@terry 说:

@Fred 咋没后续了，泡泡，发点干货啊，你的设备都很有参考价值，都踩在甜点上了。多跑点模型，comfyui之类的，给我们参考下。

行啊特哥。我主要跑LLM，一般Comfy-UI就是纯玩儿。我回头把我能跑的大模型、以及各自的跑法，和性能数据区LLM板块发个分享。

terry

@Fred 对的，大家需要你的干货，你的每个装备都踩在屌丝们都G点上了。

Fred

@mark 说:

你这两个显卡怎么使用的? 能串联吗?

原则是能一个卡装下的，就不要分2个卡，能两个卡装下的，就不要分3个卡。根据模型大小灵活地分配到每个卡，用llama.cpp的tensor split （-ts参数）分层跑。回头我在LLM发个帖子，说一下怎么用。

David Zhang

@Fred 坛子里最缺你这样的大佬，牛逼的装备，一饱眼福啊！

Fred

https://lcz.me/topic/143/分享-4090-48g-r9700-32g-ai-max-395-8060s-跑大语言模型的实测数据

作业交了 @terry

张老师

牛逼啊，这设备！

Fred

@pilipala 说:

@Fred 我和你一样，打工仔，只能利用业余时间折腾，如果能赚到外快最好，赚不到也无所谓，就当纯乐子玩了。4090 48周末终于要到了，老特这几天一直发硬件视频搞心态哈哈～

哈哈。我也是看了老特视频，才去狗东淘了一块4090魔改卡的。爽真是爽，特别是在有对比的情况下。就是肉有点疼，好在狗东的物流也比较靠谱。

johnnybegood

@Fred 这一套跟 6000 pro 96g 比起来如何呢？

Fred

@johnnybegood 说:

@Fred 这一套跟 6000 pro 96g 比起来如何呢？

这两者相比属于是用法拉利对比大众高尔夫GTI了。PRO 6000单卡大显存，N卡最新架构，算力比5090略强，从生态，到实际的性能，都比这3货加起来还强不少。但我没法给你准确的数字，只知道肯定是PRO 6000强。
考虑价格，我这套就算5万5吧，PRO 6000单卡7万，加配个主机，稍微配寒碜一点的主机估计总共8万5拿下吧。我觉得3万差价基本上就是两者性能上的差距。
但是需要知道一点，我这个大众高尔夫GTI也不是一无是处，PRO 6000单卡跑230B大模型估计够呛，如果还想所有层都在显存里，更是不足够的。但我这个3个GPU加起来就可以跑出来不错的感受。

terry

@Fred 你已经是顶配了，能把你的设备发挥出一半战力，就能赚到很多钱了。

Fred

来补些图：
图1：注意看，在下面一层有一个关键设备：大疆POWER 1000。当成一个UPS来用，都花了这么多小钱钱，买了卡买了机器，不要吝啬把电源配得保险一些，别因为电源闪断，或者电压不稳或者突然断电，烧了卡之后还要找修显卡的张哥，就麻烦大了。
替代文字

图2：4090显卡，以及狗东999的显卡坞，USB4和Ocuulink双接口，自带800w电源，很不错。但两个特别提醒：

不要买2个这种同样显卡坞插到同一台主机。因为它有个白痴低级失误：它的雷电UUID好像是固定的，没法改，每个显卡坞都是一样的UUID。因此在Linux下，只能识别一个这种显卡坞。当时我本来是买了2个这个显卡坞，但第二个始终不识别，这个问题当时折腾我好久。最后买了退，退了换，最后换了品牌，有了不同的TB UUID才搞定。着着实实享受了一把狗东的售后服务。
4090和R9700，都是12PIN+4PIN的PCI-E电源线，这个显卡坞不带这种线，只带3个8PIN线，需要自己买转接，或者显卡如果带也行。

图3：霸气的绿联显卡坞，自带850W金牌电源，自带12PIN+4PIN，自带8PIN，通吃一切显卡。缺点是不便宜啊，显卡坞2000+的就不算便宜了：
替代文字

图4：颜值在线的R9700，这卡是真好看。但它在显卡坞上有个毛病要注意：如果主机不开机，它的风扇会狂转。
替代文字

图5图6：主机AI MAX 395，零刻的128G版本，刚去查了一下狗东，狗日的涨价到21000了！我当时买的时候14000。后面带2个10G网口，2个USB4 type-c，前置带指纹解锁（Windows才能用）。我插了2个显卡坞，都是type-c，后面看着也不拥挤，还好。我这个机器是Linux无头服务器，也不用它打游戏啥的，因此随意插了一个hdmi的线到显示器。干干净净的，不挤。
替代文字

总结一下几个坑：

不要买2个同样型号的狗东999显卡坞
R9700外置，如果主机不开，风扇会狂转，此时只能自己去关显卡坞的电源
尽量上个UPS，对你的几万块的资产稍微好点

抡锤者

小小秀一下我的AI RIG