<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[小小秀一下我的AI RIG]]></title><description><![CDATA[<p dir="auto"><img src="https://file.chenp.net/api/public/dl/DT4MAOIk?inline=true" alt="上传图片说超负荷报错算了用外链" class=" img-fluid img-markdown" /></p>
<p dir="auto"><strong>从左到右：</strong></p>
<ol>
<li>主机是AI MAX 395+ 128G统一内存</li>
<li>中间是一个霸气的绿联显卡坞插了一个R9700，USB4连接到主机</li>
<li>右边是一个4090 48G魔改涡轮卡，插在京东999显卡坞上，USB4连接到主机</li>
</ol>
<p dir="auto"><strong>可以干啥：</strong><br />
同时存在A卡、N卡、集成显卡（APU），一共有80G的VRAM，128G的UMA，可以跑这些组合：</p>
<ol>
<li>llama.cpp 特殊编译选项（后面附），可以识别所有卡，可以跨卡用<code>-ts</code>参数跑230B的量化大模型，速度还可以；</li>
<li>可以在N卡上用vLLM跑Qwen3.6 27B Q6量化的模型，充分发挥vLLM的MTP功能，推理速度和Prefill速度都比llama.cpp更快；</li>
<li>可以在A卡、N卡上分别跑Comfy-UI；</li>
<li>主机AI MAX 395+的APU上因为内存大，可以跑一个Qwen3.5 122B的MoE模型，上下文短点的情况下速度也还可以。</li>
<li>……其他各种组合还可以发挥发挥</li>
</ol>
<p dir="auto"><strong>附llama.cpp编译参数</strong><br />
即让同一个llama.cpp即能识别A卡（ROCm设备），又能识别N卡（CUDA设备），还能用Vulkan通吃所有卡：</p>
<pre><code class="language-bash">cmake -S . -B build \
    -DGGML_HIP=ON \
    -DGGML_VULKAN=ON \
    -DGGML_CUDA=ON \
    -DCMAKE_CUDA_ARCHITECTURES=89 \
    -DGGML_RPC=ON \
    -DLLAMA_HIP_UMA=ON \
    -DAMDGPU_TARGETS="gfx1030;gfx1031;gfx1151;gfx1201" \
    -DCMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc \
    -DGGML_BACKEND_DL=ON \
    -DGGML_NATIVE=OFF \
    -DCMAKE_BUILD_TYPE=Release \
 &amp;&amp; cmake --build build -j$(nproc) \
 &amp;&amp; cmake --install build
</code></pre>
<p dir="auto">说明：关键点是查好自己显卡的代号，然后正确设置<code>CMAKE_CUDA_ARCHITECTURES</code>，<code>AMDGPU_TARGETS</code>这几个宏。然后编译成功，用<code>llama-cli --list-devices</code>命令能看到自己的卡就说明成功了：</p>
<pre><code class="language-bash">fred@ai395:~$ llama-cli --list-devices
......
Available devices:
  CUDA0: NVIDIA GeForce RTX 4090 (48508 MiB, 558 MiB free)
  ROCm0: Radeon 8060S Graphics (126976 MiB, 99084 MiB free)
  ROCm1: AMD Radeon AI PRO R9700 (32624 MiB, 32556 MiB free)
  Vulkan0: NVIDIA GeForce RTX 4090 (49386 MiB, 782 MiB free)
  Vulkan1: AMD Radeon AI PRO R9700 (RADV GFX1201) (32624 MiB, 32566 MiB free)
  Vulkan2: Radeon 8060S Graphics (RADV GFX1151) (127488 MiB, 111400 MiB free)
</code></pre>
<p dir="auto">vLLM在N卡单跑Qwen3.6 27B Q6大模型的命令行：</p>
<pre><code class="language-bash">export MODEL=/home/fred/llama-models/QuantTrio/Qwen3.6-27B-AWQ-6Bit
export SERVED_MODEL_NAME=Qwen3.6-27B-vLLM
export DOCKER_IMG=vllm/vllm-openai:latest
export HOST_PORT=8000

podman run --name ${SERVED_MODEL_NAME} --device nvidia.com/gpu=all \
    -v /tmp:/workspace \
    -v $MODEL:$MODEL \
    --env "HF_TOKEN=$HF_TOKEN" \
    -p 8000:8000 \
    --ipc=host \
    $DOCKER_IMG $MODEL \
    --max-model-len 200000 \
    --speculative-config '{"method": "mtp", "num_speculative_tokens": 3}' \
    --kv-cache-dtype fp8 \
    --tensor-parallel-size 1 \
    --enable-prefix-caching \
    --max-num-batched-tokens 8192 \
    --max-num-seqs 2 \
    --served-model-name ${SERVED_MODEL_NAME} \
    --enable-auto-tool-choice \
    --reasoning-parser qwen3 \
    --tool-call-parser qwen3_coder \
    --gpu-memory-utilization 0.9 \
    --host 0.0.0.0 \
    --port 8000
</code></pre>
<p dir="auto"><strong>其他说明</strong></p>
<ul>
<li>模型可以全速跑，但前提是全量的模型必须能fit进某一个卡的VRAM，这样USB4不会造成降速。</li>
<li>用llama.cpp的<code>-ts</code>选项跨卡跑模型，可以充分利用各卡的显存，由于USB4的时延比PCIE高，所以性能稍有损失，但不大，因为跨卡数据交换量不大且交换并不频繁。</li>
<li>vLLM不可跨A卡和N卡跑Tensor Parallel，只能跨多个A卡和多个N卡（因为底层的PyTorch只能支持一个版本）。</li>
<li>我在llama.cpp和vLLM前端顶了一个可以自动切换模型的代理工具<code>llama-swap</code>，定义好之后用起来是很方便的。</li>
<li>操作系统是Fedora Linux 43，驱动跟着社区更新就行（时不时的<code>dnf update</code>一下）。</li>
<li><strong>要懂点Linux，不然不要这么玩</strong>，还是要懂些技术才能搞定的。</li>
</ul>
<p dir="auto"><strong>秀完了</strong><br />
这一套东西，加起来还是得5万左右。现在AI MAX 395又涨价了，可能现在得5万5左右了。目前还只是纯玩，平时实在没时间琢磨怎么用它赚钱。</p>
]]></description><link>https://lcz.me/topic/117/小小秀一下我的ai-rig</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 06:56:16 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/117.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 12 May 2026 15:11:59 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Sun, 17 May 2026 07:21:40 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> <a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 我的大玩具也装好了，哈哈哈～～</p>
]]></description><link>https://lcz.me/post/2097</link><guid isPermaLink="true">https://lcz.me/post/2097</guid><dc:creator><![CDATA[pilipala]]></dc:creator><pubDate>Sun, 17 May 2026 07:21:40 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Sat, 16 May 2026 04:57:27 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/hank-wang" aria-label="Profile: Hank-Wang">@<bdi>Hank-Wang</bdi></a> 支持随便一个显卡坞都支持，性能损失太大。雷电5，oculink都完全跑不满性能的一半。</p>
]]></description><link>https://lcz.me/post/1951</link><guid isPermaLink="true">https://lcz.me/post/1951</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 16 May 2026 04:57:27 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Sat, 16 May 2026 02:13:39 GMT]]></title><description><![CDATA[<p dir="auto">显卡坞有没有可以支持5090这样显卡的？不知道有没有这样用过。</p>
]]></description><link>https://lcz.me/post/1930</link><guid isPermaLink="true">https://lcz.me/post/1930</guid><dc:creator><![CDATA[Hank Wang]]></dc:creator><pubDate>Sat, 16 May 2026 02:13:39 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 05:58:25 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%9E%81%E5%93%81%E9%9D%92%E8%9B%99" aria-label="Profile: 极品青蛙">@<bdi>极品青蛙</bdi></a> <a href="/post/1773">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: fred">@<bdi>fred</bdi></a> 我零刻gti15用的零刻600w显卡坞，就2个8pin，请教个接7900xtx这3个8pin的方案，豆包和卖家说价买个1分2的线插第二个8pin口，不要求性能发挥满，只要不烧卡就行，感谢！<br />
<img src="https://upload.lcz.me/uploads/ed0030bd-b12d-40e7-9fd9-c73935aec32c.jpg" alt="mmexport1778824176979.jpg" class=" img-fluid img-markdown" /></p>
</blockquote>
<p dir="auto">还是稳妥起见，显卡坞有3个8P才保险。你看这些个帖子吧，很多人反对这样做：<a href="https://forums.tomshardware.com/threads/can-i-use-a-3-x-8-pin-7900-xtx-with-only-2-x-8-pins-connected-to-it.3809019/" rel="nofollow ugc">https://forums.tomshardware.com/threads/can-i-use-a-3-x-8-pin-7900-xtx-with-only-2-x-8-pins-connected-to-it.3809019/</a><br />
<a href="https://linustechtips.com/topic/1475161-is-rx-7900-xtx-able-to-work-from-2-pcie-cables-instead-of-3/" rel="nofollow ugc">https://linustechtips.com/topic/1475161-is-rx-7900-xtx-able-to-work-from-2-pcie-cables-instead-of-3/</a></p>
]]></description><link>https://lcz.me/post/1779</link><guid isPermaLink="true">https://lcz.me/post/1779</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Fri, 15 May 2026 05:58:25 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 05:52:46 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%9E%81%E5%93%81%E9%9D%92%E8%9B%99" aria-label="Profile: 极品青蛙">@<bdi>极品青蛙</bdi></a> 不行，很勉强，系统限制303w，这是linux限制，单8pin就150w，长期满载肯定不行，不用尝试，我的显卡和你一样。必须换显卡坞。显卡用那个什么AI Pro R9700就能扛住。不过你这个显卡坞是一体的，换成其他的性能估计会打折。你看下机器是否带oculink，带的话卖一个oclink显卡坞，或者买个雷电3的。</p>
]]></description><link>https://lcz.me/post/1774</link><guid isPermaLink="true">https://lcz.me/post/1774</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Fri, 15 May 2026 05:52:46 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 05:49:58 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: fred">@<bdi>fred</bdi></a> 我零刻gti15用的零刻600w显卡坞，就2个8pin，请教个接7900xtx这3个8pin的方案，豆包和卖家说价买个1分2的线插第二个8pin口，不要求性能发挥满，只要不烧卡就行，感谢！<br />
<img src="https://upload.lcz.me/uploads/ed0030bd-b12d-40e7-9fd9-c73935aec32c.jpg" alt="mmexport1778824176979.jpg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/1773</link><guid isPermaLink="true">https://lcz.me/post/1773</guid><dc:creator><![CDATA[极品青蛙]]></dc:creator><pubDate>Fri, 15 May 2026 05:49:58 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 04:49:51 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> <a href="/post/1746">说</a>:</p>
<p dir="auto">第二个不识别，用tbctl list命令只能看见第一个。后来我反复测试，发现他们家显卡坞的每个设备UUID都相同。如果2个雷电设备UUID相同，Linux的tb驱动在授权（enroll）雷电设备的时候，是以UUID来区分设备的，结果是第二个没法用uuid授权了。因此我的第二个显卡坞不识别，我也没找到修改uuid的方法（据说是烧录在显卡坞固件的），最后就不折腾了，把第二个退了。</p>
</blockquote>
<p dir="auto">感谢大神回复，明白了</p>
]]></description><link>https://lcz.me/post/1763</link><guid isPermaLink="true">https://lcz.me/post/1763</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Fri, 15 May 2026 04:49:51 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 03:59:48 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E5%BC%A0%E8%80%81%E5%B8%88" aria-label="Profile: 张老师">@<bdi>张老师</bdi></a> <a href="/post/1724">说</a>:</p>
<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> <a href="/post/1693">说</a>:</p>
<p dir="auto">不要买2个同样型号的狗东999显卡坞</p>
</blockquote>
<p dir="auto">这个有什么说法吗？插到同一台机器上会Bug？</p>
</blockquote>
<p dir="auto">第二个不识别，用tbctl list命令只能看见第一个。后来我反复测试，发现他们家显卡坞的每个设备UUID都相同。如果2个雷电设备UUID相同，Linux的tb驱动在授权（enroll）雷电设备的时候，是以UUID来区分设备的，结果是第二个没法用uuid授权了。因此我的第二个显卡坞不识别，我也没找到修改uuid的方法（据说是烧录在显卡坞固件的），最后就不折腾了，把第二个退了。</p>
]]></description><link>https://lcz.me/post/1746</link><guid isPermaLink="true">https://lcz.me/post/1746</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Fri, 15 May 2026 03:59:48 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 03:56:07 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/pilipala" aria-label="Profile: pilipala">@<bdi>pilipala</bdi></a> <a href="/post/1723">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 老哥的4090是狗东哪家买的，看看是不是一家，我的万一翻车了就买你那家的，还有R9700是1万1入的么？</p>
</blockquote>
<p dir="auto">我在一家叫做天成智算买的，不过还是推荐自营的那两家。我这个的发货过程有点波折，他们一开始给我填了一个错误的单号，第二天就显示我已经收货了，实际上我连毛都没看到，货也显示被发到了浙江某个地址，跟我完全不在一个省。<br />
后来他们重新填了单号。货到之后我用Linux的gpu-burn工具压测一小时没问题，这几天用下来感觉还是不错，我就给他们确认收货了。</p>
]]></description><link>https://lcz.me/post/1745</link><guid isPermaLink="true">https://lcz.me/post/1745</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Fri, 15 May 2026 03:56:07 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 01:25:47 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> <a href="/post/1693">说</a>:</p>
<p dir="auto">不要买2个同样型号的狗东999显卡坞</p>
</blockquote>
<p dir="auto">这个有什么说法吗？插到同一台机器上会Bug？</p>
]]></description><link>https://lcz.me/post/1724</link><guid isPermaLink="true">https://lcz.me/post/1724</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Fri, 15 May 2026 01:25:47 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Fri, 15 May 2026 01:25:27 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 老哥的4090是狗东哪家买的，看看是不是一家，我的万一翻车了就买你那家的，还有R9700是1万1入的么？</p>
]]></description><link>https://lcz.me/post/1723</link><guid isPermaLink="true">https://lcz.me/post/1723</guid><dc:creator><![CDATA[pilipala]]></dc:creator><pubDate>Fri, 15 May 2026 01:25:27 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 17:59:29 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> <a href="/post/1694">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 抄作业的材料凑足了，又能水一集。</p>
</blockquote>
<p dir="auto">行。这些帖子特哥您看着随便用。</p>
]]></description><link>https://lcz.me/post/1698</link><guid isPermaLink="true">https://lcz.me/post/1698</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 17:59:29 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 17:58:21 GMT]]></title><description><![CDATA[<p dir="auto">再补，llama.cpp单卡命令行。<br />
<img src="https://upload.lcz.me/uploads/5bde134d-3072-40a7-a7fc-ebd6200fd55e.jpeg" alt="743adb22-7fbe-4fa4-b2fe-f9edafd884f2-image.jpeg" class=" img-fluid img-markdown" /><br />
和分卡命令行：<br />
<img src="https://upload.lcz.me/uploads/e33a45b7-b65c-47c8-9b9f-546f16b0fbe2.jpeg" alt="151a7009-e0de-4cdc-8741-4de75dbe0373-image.jpeg" class=" img-fluid img-markdown" /><br />
vllm命令行:<br />
<img src="https://upload.lcz.me/uploads/8ea374fe-c27d-4a8d-8dd6-c04a4e80aecf.jpeg" alt="f1b756bf-c403-465e-9edf-29b6e307492b-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/1697</link><guid isPermaLink="true">https://lcz.me/post/1697</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 17:58:21 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 17:46:39 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 抄作业的材料凑足了，又能水一集。</p>
]]></description><link>https://lcz.me/post/1694</link><guid isPermaLink="true">https://lcz.me/post/1694</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 14 May 2026 17:46:39 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 17:23:44 GMT]]></title><description><![CDATA[<p dir="auto">来补些图：<br />
图1：注意看，在下面一层有一个关键设备：大疆POWER 1000。当成一个UPS来用，都花了这么多小钱钱，买了卡买了机器，不要吝啬把电源配得保险一些，别因为电源闪断，或者电压不稳或者突然断电，烧了卡之后还要找修显卡的张哥，就麻烦大了。<br />
<img src="https://file.chenp.net/api/public/dl/NWnhRsRo?inline=true" alt="替代文字" class=" img-fluid img-markdown" /></p>
<p dir="auto">图2：4090显卡，以及狗东999的显卡坞，USB4和Ocuulink双接口，自带800w电源，很不错。但两个特别提醒：</p>
<ol>
<li><strong>不要买2个这种同样显卡坞</strong>插到同一台主机。因为它有个白痴低级失误：它的雷电UUID好像是固定的，没法改，每个显卡坞都是一样的UUID。因此在Linux下，只能识别一个这种显卡坞。当时我本来是买了2个这个显卡坞，但第二个始终不识别，这个问题当时折腾我好久。最后买了退，退了换，最后换了品牌，有了不同的TB UUID才搞定。着着实实享受了一把狗东的售后服务。</li>
<li>4090和R9700，都是12PIN+4PIN的PCI-E电源线，这个显卡坞不带这种线，只带3个8PIN线，需要自己买转接，或者显卡如果带也行。<br />
<img src="https://file.chenp.net/api/public/dl/9W7mR5MV?inline=true" alt="替代文字" class=" img-fluid img-markdown" /></li>
</ol>
<p dir="auto">图3：霸气的绿联显卡坞，自带850W金牌电源，自带12PIN+4PIN，自带8PIN，通吃一切显卡。缺点是不便宜啊，显卡坞2000+的就不算便宜了：<br />
<img src="https://file.chenp.net/api/public/dl/WX7j0Cw1?inline=true" alt="替代文字" class=" img-fluid img-markdown" /></p>
<p dir="auto">图4：颜值在线的R9700，这卡是真好看。但它在显卡坞上有个毛病要注意：如果主机不开机，它的风扇会狂转。<br />
<img src="https://file.chenp.net/api/public/dl/KHyTRgb6?inline=true" alt="替代文字" class=" img-fluid img-markdown" /></p>
<p dir="auto">图5图6：主机AI MAX 395，零刻的128G版本，刚去查了一下狗东，狗日的涨价到21000了！我当时买的时候14000。后面带2个10G网口，2个USB4 type-c，前置带指纹解锁（Windows才能用）。我插了2个显卡坞，都是type-c，后面看着也不拥挤，还好。我这个机器是Linux无头服务器，也不用它打游戏啥的，因此随意插了一个hdmi的线到显示器。干干净净的，不挤。<br />
<img src="https://file.chenp.net/api/public/dl/XBmqNz9t?inline=true" alt="替代文字" class=" img-fluid img-markdown" /><br />
<img src="https://file.chenp.net/api/public/dl/OL4R17A9?inline=true" alt="替代文字" class=" img-fluid img-markdown" /></p>
<p dir="auto">总结一下几个坑：</p>
<ol>
<li>不要买2个同样型号的狗东999显卡坞</li>
<li>R9700外置，如果主机不开，风扇会狂转，此时只能自己去关显卡坞的电源</li>
<li>尽量上个UPS，对你的几万块的资产稍微好点</li>
</ol>
]]></description><link>https://lcz.me/post/1693</link><guid isPermaLink="true">https://lcz.me/post/1693</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 17:23:44 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 16:41:28 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 你已经是顶配了，能把你的设备发挥出一半战力，就能赚到很多钱了。</p>
]]></description><link>https://lcz.me/post/1683</link><guid isPermaLink="true">https://lcz.me/post/1683</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 14 May 2026 16:41:28 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 15:21:59 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> <a href="/post/1653">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 这一套跟 6000 pro 96g 比起来如何呢？</p>
</blockquote>
<p dir="auto">这两者相比属于是用法拉利对比大众高尔夫GTI了。PRO 6000单卡大显存，N卡最新架构，算力比5090略强，从生态，到实际的性能，都比这3货加起来还强不少。但我没法给你准确的数字，只知道肯定是PRO 6000强。<br />
考虑价格，我这套就算5万5吧，PRO 6000单卡7万，加配个主机，稍微配寒碜一点的主机估计总共8万5拿下吧。我觉得3万差价基本上就是两者性能上的差距。<br />
但是需要知道一点，我这个大众高尔夫GTI也不是一无是处，PRO 6000单卡跑230B大模型估计够呛，如果还想所有层都在显存里，更是不足够的。但我这个3个GPU加起来就可以跑出来不错的感受。</p>
]]></description><link>https://lcz.me/post/1656</link><guid isPermaLink="true">https://lcz.me/post/1656</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 15:21:59 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 15:08:07 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 这一套跟 6000 pro 96g 比起来如何呢？</p>
]]></description><link>https://lcz.me/post/1653</link><guid isPermaLink="true">https://lcz.me/post/1653</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Thu, 14 May 2026 15:08:07 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 14:31:24 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/pilipala" aria-label="Profile: pilipala">@<bdi>pilipala</bdi></a> <a href="/post/1589">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 我和你一样，打工仔，只能利用业余时间折腾，如果能赚到外快最好，赚不到也无所谓，就当纯乐子玩了。4090 48周末终于要到了，老特这几天一直发硬件视频搞心态哈哈～</p>
</blockquote>
<p dir="auto">哈哈。我也是看了老特视频，才去狗东淘了一块4090魔改卡的。爽真是爽，特别是在有对比的情况下。就是肉有点疼，好在狗东的物流也比较靠谱。</p>
]]></description><link>https://lcz.me/post/1648</link><guid isPermaLink="true">https://lcz.me/post/1648</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 14:31:24 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 14:04:50 GMT]]></title><description><![CDATA[<p dir="auto">牛逼啊，这设备！</p>
]]></description><link>https://lcz.me/post/1643</link><guid isPermaLink="true">https://lcz.me/post/1643</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Thu, 14 May 2026 14:04:50 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 13:48:41 GMT]]></title><description><![CDATA[<p dir="auto"><a href="https://lcz.me/topic/143/%E5%88%86%E4%BA%AB-4090-48g-r9700-32g-ai-max-395-8060s-%E8%B7%91%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%9A%84%E5%AE%9E%E6%B5%8B%E6%95%B0%E6%8D%AE">https://lcz.me/topic/143/分享-4090-48g-r9700-32g-ai-max-395-8060s-跑大语言模型的实测数据</a></p>
<p dir="auto">作业交了 <a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a></p>
]]></description><link>https://lcz.me/post/1639</link><guid isPermaLink="true">https://lcz.me/post/1639</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 13:48:41 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 13:48:36 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 坛子里最缺你这样的大佬，牛逼的装备，一饱眼福啊！</p>
]]></description><link>https://lcz.me/post/1638</link><guid isPermaLink="true">https://lcz.me/post/1638</guid><dc:creator><![CDATA[David Zhang]]></dc:creator><pubDate>Thu, 14 May 2026 13:48:36 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 13:18:38 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/mark" aria-label="Profile: mark">@<bdi>mark</bdi></a> <a href="/post/1585">说</a>:</p>
<p dir="auto">你这两个 显卡 怎么使用的? 能串联吗?</p>
</blockquote>
<p dir="auto">原则是能一个卡装下的，就不要分2个卡，能两个卡装下的，就不要分3个卡。根据模型大小灵活地分配到每个卡，用llama.cpp的tensor split （-ts参数）分层跑。回头我在LLM发个帖子，说一下怎么用。</p>
]]></description><link>https://lcz.me/post/1602</link><guid isPermaLink="true">https://lcz.me/post/1602</guid><dc:creator><![CDATA[Fred]]></dc:creator><pubDate>Thu, 14 May 2026 13:18:38 GMT</pubDate></item><item><title><![CDATA[Reply to 小小秀一下我的AI RIG on Thu, 14 May 2026 13:18:26 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/fred" aria-label="Profile: Fred">@<bdi>Fred</bdi></a> 对的，大家需要你的干货，你的每个装备都踩在屌丝们都G点上了。</p>
]]></description><link>https://lcz.me/post/1601</link><guid isPermaLink="true">https://lcz.me/post/1601</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 14 May 2026 13:18:26 GMT</pubDate></item></channel></rss>