小小秀一下我的AI RIG

Fred

@mark 说:

你这两个显卡怎么使用的? 能串联吗?

原则是能一个卡装下的，就不要分2个卡，能两个卡装下的，就不要分3个卡。根据模型大小灵活地分配到每个卡，用llama.cpp的tensor split （-ts参数）分层跑。回头我在LLM发个帖子，说一下怎么用。

David Zhang

@Fred 坛子里最缺你这样的大佬，牛逼的装备，一饱眼福啊！

Fred

https://lcz.me/topic/143/分享-4090-48g-r9700-32g-ai-max-395-8060s-跑大语言模型的实测数据

作业交了 @terry

张老师

牛逼啊，这设备！

Fred

@pilipala 说:

@Fred 我和你一样，打工仔，只能利用业余时间折腾，如果能赚到外快最好，赚不到也无所谓，就当纯乐子玩了。4090 48周末终于要到了，老特这几天一直发硬件视频搞心态哈哈～

哈哈。我也是看了老特视频，才去狗东淘了一块4090魔改卡的。爽真是爽，特别是在有对比的情况下。就是肉有点疼，好在狗东的物流也比较靠谱。

johnnybegood

@Fred 这一套跟 6000 pro 96g 比起来如何呢？

Fred

@johnnybegood 说:

@Fred 这一套跟 6000 pro 96g 比起来如何呢？

这两者相比属于是用法拉利对比大众高尔夫GTI了。PRO 6000单卡大显存，N卡最新架构，算力比5090略强，从生态，到实际的性能，都比这3货加起来还强不少。但我没法给你准确的数字，只知道肯定是PRO 6000强。
考虑价格，我这套就算5万5吧，PRO 6000单卡7万，加配个主机，稍微配寒碜一点的主机估计总共8万5拿下吧。我觉得3万差价基本上就是两者性能上的差距。
但是需要知道一点，我这个大众高尔夫GTI也不是一无是处，PRO 6000单卡跑230B大模型估计够呛，如果还想所有层都在显存里，更是不足够的。但我这个3个GPU加起来就可以跑出来不错的感受。

terry

@Fred 你已经是顶配了，能把你的设备发挥出一半战力，就能赚到很多钱了。

Fred

来补些图：
图1：注意看，在下面一层有一个关键设备：大疆POWER 1000。当成一个UPS来用，都花了这么多小钱钱，买了卡买了机器，不要吝啬把电源配得保险一些，别因为电源闪断，或者电压不稳或者突然断电，烧了卡之后还要找修显卡的张哥，就麻烦大了。
替代文字

图2：4090显卡，以及狗东999的显卡坞，USB4和Ocuulink双接口，自带800w电源，很不错。但两个特别提醒：

不要买2个这种同样显卡坞插到同一台主机。因为它有个白痴低级失误：它的雷电UUID好像是固定的，没法改，每个显卡坞都是一样的UUID。因此在Linux下，只能识别一个这种显卡坞。当时我本来是买了2个这个显卡坞，但第二个始终不识别，这个问题当时折腾我好久。最后买了退，退了换，最后换了品牌，有了不同的TB UUID才搞定。着着实实享受了一把狗东的售后服务。
4090和R9700，都是12PIN+4PIN的PCI-E电源线，这个显卡坞不带这种线，只带3个8PIN线，需要自己买转接，或者显卡如果带也行。

图3：霸气的绿联显卡坞，自带850W金牌电源，自带12PIN+4PIN，自带8PIN，通吃一切显卡。缺点是不便宜啊，显卡坞2000+的就不算便宜了：
替代文字

图4：颜值在线的R9700，这卡是真好看。但它在显卡坞上有个毛病要注意：如果主机不开机，它的风扇会狂转。
替代文字

图5图6：主机AI MAX 395，零刻的128G版本，刚去查了一下狗东，狗日的涨价到21000了！我当时买的时候14000。后面带2个10G网口，2个USB4 type-c，前置带指纹解锁（Windows才能用）。我插了2个显卡坞，都是type-c，后面看着也不拥挤，还好。我这个机器是Linux无头服务器，也不用它打游戏啥的，因此随意插了一个hdmi的线到显示器。干干净净的，不挤。
替代文字

总结一下几个坑：

不要买2个同样型号的狗东999显卡坞
R9700外置，如果主机不开，风扇会狂转，此时只能自己去关显卡坞的电源
尽量上个UPS，对你的几万块的资产稍微好点

terry

@Fred 抄作业的材料凑足了，又能水一集。

Fred

再补，llama.cpp单卡命令行。

和分卡命令行：

vllm命令行:

Fred

@terry 说:

@Fred 抄作业的材料凑足了，又能水一集。

行。这些帖子特哥您看着随便用。

pilipala

@Fred 老哥的4090是狗东哪家买的，看看是不是一家，我的万一翻车了就买你那家的，还有R9700是1万1入的么？

张老师

@Fred 说:

不要买2个同样型号的狗东999显卡坞

这个有什么说法吗？插到同一台机器上会Bug？

Fred

@pilipala 说:

@Fred 老哥的4090是狗东哪家买的，看看是不是一家，我的万一翻车了就买你那家的，还有R9700是1万1入的么？

我在一家叫做天成智算买的，不过还是推荐自营的那两家。我这个的发货过程有点波折，他们一开始给我填了一个错误的单号，第二天就显示我已经收货了，实际上我连毛都没看到，货也显示被发到了浙江某个地址，跟我完全不在一个省。
后来他们重新填了单号。货到之后我用Linux的gpu-burn工具压测一小时没问题，这几天用下来感觉还是不错，我就给他们确认收货了。

Fred

@张老师说:

@Fred 说:

不要买2个同样型号的狗东999显卡坞

这个有什么说法吗？插到同一台机器上会Bug？

第二个不识别，用tbctl list命令只能看见第一个。后来我反复测试，发现他们家显卡坞的每个设备UUID都相同。如果2个雷电设备UUID相同，Linux的tb驱动在授权（enroll）雷电设备的时候，是以UUID来区分设备的，结果是第二个没法用uuid授权了。因此我的第二个显卡坞不识别，我也没找到修改uuid的方法（据说是烧录在显卡坞固件的），最后就不折腾了，把第二个退了。

张老师

@Fred 说:

第二个不识别，用tbctl list命令只能看见第一个。后来我反复测试，发现他们家显卡坞的每个设备UUID都相同。如果2个雷电设备UUID相同，Linux的tb驱动在授权（enroll）雷电设备的时候，是以UUID来区分设备的，结果是第二个没法用uuid授权了。因此我的第二个显卡坞不识别，我也没找到修改uuid的方法（据说是烧录在显卡坞固件的），最后就不折腾了，把第二个退了。

感谢大神回复，明白了

极品青蛙

@fred 我零刻gti15用的零刻600w显卡坞，就2个8pin，请教个接7900xtx这3个8pin的方案，豆包和卖家说价买个1分2的线插第二个8pin口，不要求性能发挥满，只要不烧卡就行，感谢！

terry

@极品青蛙不行，很勉强，系统限制303w，这是linux限制，单8pin就150w，长期满载肯定不行，不用尝试，我的显卡和你一样。必须换显卡坞。显卡用那个什么AI Pro R9700就能扛住。不过你这个显卡坞是一体的，换成其他的性能估计会打折。你看下机器是否带oculink，带的话卖一个oclink显卡坞，或者买个雷电3的。

Fred

@极品青蛙说:

@fred 我零刻gti15用的零刻600w显卡坞，就2个8pin，请教个接7900xtx这3个8pin的方案，豆包和卖家说价买个1分2的线插第二个8pin口，不要求性能发挥满，只要不烧卡就行，感谢！

还是稳妥起见，显卡坞有3个8P才保险。你看这些个帖子吧，很多人反对这样做：https://forums.tomshardware.com/threads/can-i-use-a-3-x-8-pin-7900-xtx-with-only-2-x-8-pins-connected-to-it.3809019/
https://linustechtips.com/topic/1475161-is-rx-7900-xtx-able-to-work-from-2-pcie-cables-instead-of-3/

抡锤者

小小秀一下我的AI RIG