<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法]]></title><description><![CDATA[<h4>起因</h4>
<p dir="auto">最近逛论坛看到有大佬论证 X99 支持 PCIe 4.0 ，说是华强北的板厂在 BIOS 里加了 PCIe 4.0 的选项，实际也能协商到 4.0。看着挺诱人的——毕竟 X99 板子便宜，Xeon E5 v3/v4 白菜价，要是真能跑 4.0，配上两张 RX 7900 XTX 跑 LLM 的 TP（张量并行），跨卡通信带宽直接翻倍，美滋滋。<br />
（原始贴现在因为论坛的搜索改版，已经找不回来了，大概意思就是该大佬通过几个命令，都能读出来协商的是16GB/s的带宽，然后推定x99支持pcie4.0）</p>
<p dir="auto">但冷静下来一想：<strong>X99 的 PCIe 控制器是集成在 CPU 里的</strong>，Haswell-E/Broadwell-E 的 IMC 和 PCIe root complex 都是 Intel 定死的规格，只到 PCIe 3.0。华强北再牛逼，能改 BIOS 设置，总不能重做 CPU 的硅片吧？</p>
<p dir="auto">于是决定<strong>不靠嘴炮，上机实测</strong>。</p>
<h4>测试平台</h4>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>项目</th>
<th>规格</th>
</tr>
</thead>
<tbody>
<tr>
<td>主板</td>
<td>6卡直插矿板 X99-6Plus</td>
</tr>
<tr>
<td>CPU</td>
<td>Intel Xeon E5-2682 v4（Broadwell-EP）</td>
</tr>
<tr>
<td>被测 GPU</td>
<td>RTX 3080 Ti（GA102，支持 PCIe 4.0）</td>
</tr>
<tr>
<td>OS</td>
<td>Ubuntu Linux</td>
</tr>
<tr>
<td>测试工具</td>
<td>nvidia-smi / lspci / gpu-pcie-bench</td>
</tr>
</tbody>
</table>
<blockquote>
<p dir="auto">本来是打算测两张 7900 XTX 的，但它们在跑推理工作中，就不打扰了。拿 3080 Ti 测，结果是一样的——瓶颈在 CPU/主板侧，不在 GPU 侧。</p>
</blockquote>
<h4>第一步：看协商状态</h4>
<pre><code class="language-bash">nvidia-smi --query-gpu=pcie.link.gen.current,pcie.link.gen.max,pcie.link.width.current --format=csv
</code></pre>
<p dir="auto">结果：</p>
<pre><code>1, 3, 16
</code></pre>
<ul>
<li><code>current = 1</code>：空闲降到了 PCIe 1.0，正常省电行为</li>
<li><code>max = 3</code>：<strong>最大只支持 PCIe 3.0</strong> <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f534.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--red_circle" style="height:23px;width:auto;vertical-align:middle" title="🔴" alt="🔴" /></li>
<li><code>width = 16</code>：通道数正常</li>
</ul>
<p dir="auto">关键就是 <code>max = 3</code>——如果真解锁了 4.0，这里应该显示 4。</p>
<p dir="auto">再来看看 lspci：</p>
<pre><code class="language-bash">sudo lspci -s 02:00.0 -vvv | grep -E "LnkCap|LnkSta"
</code></pre>
<pre><code>LnkCap: Speed 8GT/s, Width x16
LnkSta: Speed 2.5GT/s (downgraded), Width x16
</code></pre>
<ul>
<li><strong>LnkCap（能力）</strong>：<code>Speed 8GT/s</code> = PCIe 3.0（Gen3 = 8GT/s，Gen4 = 16GT/s）</li>
<li><strong>LnkSta（当前）</strong>：<code>Speed 2.5GT/s</code> = 空闲降到了 Gen1<br />
（这里其实存在一个问题，之前看到贴子的时候，汇报是Speed 16GT/s，可能是指那2张7900xtx吧）</li>
</ul>
<p dir="auto">到这里已经很明显了：<strong>硬件能力上就不支持 Gen4</strong>。</p>
<h4>第二步：实际跑带宽</h4>
<p dir="auto">协商是一回事，实际能不能跑出那个速度是另一回事。上 <code>gpu-pcie-bench</code>（<a href="https://github.com/tpoechtrager/gpu-pcie-bench%EF%BC%89%E5%81%9A%E5%AE%9E%E9%99%85" rel="nofollow ugc">https://github.com/tpoechtrager/gpu-pcie-bench）做实际</a> PCIe 吞吐测试。</p>
<pre><code class="language-bash"># 安装
git clone --depth=1 https://github.com/tpoechtrager/gpu-pcie-bench.git
cd gpu-pcie-bench &amp;&amp; make

# 跑测试
./bin/x86_64/gpu-pcie-bench --device 0 --rounds 50 --direction both --unit gb
</code></pre>
<p dir="auto"><strong>实测结果：</strong></p>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th style="text-align:center">Buffer 大小</th>
<th style="text-align:center">Host→Device（CPU→GPU）</th>
<th style="text-align:center">Device→Host（GPU→CPU）</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:center">512 KB</td>
<td style="text-align:center">9.30 GB/s</td>
<td style="text-align:center">9.73 GB/s</td>
</tr>
<tr>
<td style="text-align:center">1 MB</td>
<td style="text-align:center"><strong>10.03 GB/s</strong></td>
<td style="text-align:center"><strong>10.54 GB/s</strong></td>
</tr>
<tr>
<td style="text-align:center">10 MB</td>
<td style="text-align:center"><strong>11.33 GB/s</strong></td>
<td style="text-align:center"><strong>11.47 GB/s</strong></td>
</tr>
<tr>
<td style="text-align:center">100 MB</td>
<td style="text-align:center">9.05 GB/s</td>
<td style="text-align:center">4.36 GB/s</td>
</tr>
<tr>
<td style="text-align:center">1 GB</td>
<td style="text-align:center">8.99 GB/s</td>
<td style="text-align:center">5.13 GB/s</td>
</tr>
<tr>
<td style="text-align:center">2 GB</td>
<td style="text-align:center">8.98 GB/s</td>
<td style="text-align:center">5.14 GB/s</td>
</tr>
</tbody>
</table>
<p dir="auto"><strong>对比理论值：</strong></p>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>标准</th>
<th style="text-align:center">理论单向带宽</th>
<th style="text-align:center">实测典型值</th>
</tr>
</thead>
<tbody>
<tr>
<td>PCIe 3.0 x16</td>
<td style="text-align:center">~15.75 GB/s</td>
<td style="text-align:center"><strong>~9-11.5 GB/s</strong> <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/2705.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--white_check_mark" style="height:23px;width:auto;vertical-align:middle" title="✅" alt="✅" /> 符合预期</td>
</tr>
<tr>
<td>PCIe 4.0 x16</td>
<td style="text-align:center">~31.5 GB/s</td>
<td style="text-align:center"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/274c.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--x" style="height:23px;width:auto;vertical-align:middle" title="❌" alt="❌" /> 差得远</td>
</tr>
<tr>
<td>PCIe 3.0 x8</td>
<td style="text-align:center">~7.88 GB/s</td>
<td style="text-align:center">大 buffer D2H 接近这个值</td>
</tr>
</tbody>
</table>
<p dir="auto">注意大 buffer 的 Device→Host 掉到 ~5 GB/s，这个是因为 <strong>Xeon E5-2682 v4 的 DDR4 内存带宽成了瓶颈</strong>——数据从 GPU 读回来要写进系统内存，老平台的内存控制器跟不上。这进一步说明：哪怕 GPU 再快，<strong>整个平台的 PCIe 子系统的天花板就在那里</strong>。</p>
<h4>结论：所谓的"魔改 PCIe 4.0"到底是什么？</h4>
<p dir="auto">拆穿来看，无非是三件事：</p>
<ol>
<li><strong>GPU 端是真支持 Gen4</strong>——RTX 3080 Ti 和 RX 7900 XTX 自身都支持 PCIe 4.0，会向上报 Capability</li>
<li><strong>寨板焊了 Gen4 的 retimer/switch 芯片</strong>——为了兼容性，物理层芯片用支持 4.0 的</li>
<li><strong>BIOS 菜单直接从 GPU 的 Capability 里读选项显示出来</strong>——但实际 CPU-PCH 的链路仍然是 Gen3 握手</li>
</ol>
<p dir="auto">一句话总结：</p>
<blockquote>
<p dir="auto"><strong>插槽是 4.0 的皮，链路是 3.0 的芯。</strong></p>
</blockquote>
<p dir="auto">PCIe 协商是双向的——<strong>一方说 4.0 没用，双方都支持才是真 4.0</strong>。CPU 那端的 root complex 不支持，插宇宙最快的显卡也没用。</p>
<h4>对 X99 双卡跑 LLM 的启示</h4>
<p dir="auto">如果你像我一样，想在 X99 上插两张卡跑 TP（张量并行），除了确认是 3.0 不是 4.0 之外，还要注意：</p>
<ul>
<li>X99 的 CPU 只有 <strong>40 条 PCIe 通道</strong></li>
<li>两张 GPU 如果都插 x16 槽，实际可能是 <strong>x16 + x8</strong>（CPU 的 PCIe lane 分配限制）</li>
<li>如果第二张卡是 x8，那 PCIe 3.0 x8 ≈ <strong>~5-7 GB/s</strong>，TP 模式的通信会成为明显瓶颈</li>
<li>PP（流水线并行）比 TP 友好一些，但依然有影响</li>
</ul>
<p dir="auto">当然，单卡推理完全没所谓——模型加载到显存后，PCIe 只做偶尔的数据传输，瓶颈在算力和显存带宽上。</p>
<h4>附：Windows 上怎么测？</h4>
<p dir="auto">如果是在 Windows 下，推荐：</p>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>工具</th>
<th>用法</th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>GPU-Z</strong></td>
<td>打开 → 点问号旁边的「Render Test」按钮 → 看 Bus Interface 那行从 <code>@ x16 1.1</code> 升到 <code>@ x16 3.0</code> 就是 Gen3，升到 <code>@ x16 4.0</code> 才是真 Gen4</td>
</tr>
<tr>
<td><strong>AIDA64</strong></td>
<td>Tools → GPGPU Benchmark，看 Host→Device / Device→Host 的带宽</td>
</tr>
<tr>
<td><strong>nvidia-smi</strong></td>
<td>Windows 版一样可以用：<code>nvidia-smi --query-gpu=pcie.link.gen.current,pcie.link.gen.max,pcie.link.width.current --format=csv</code></td>
</tr>
</tbody>
</table>
<h4>快速排查命令（Linux）</h4>
<pre><code class="language-bash"># 1. 看 GPU 协商到的最大版本
nvidia-smi --query-gpu=pcie.link.gen.max --format=csv

# 2. 看 PCIe 设备能力（Gen3=8GT/s, Gen4=16GT/s）
sudo lspci -s &lt;GPU_BUS&gt; -vvv | grep LnkCap

# 3. 跑实际带宽（最靠谱）
gpu-pcie-bench --device 0 --direction both --unit gb
</code></pre>
<p dir="auto">数据说话，别信 BIOS 菜单里的花活。</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/3df22b67-7f3d-4d56-847e-48a790adedc4.jpeg" alt="c25acc51-c60a-416b-ad6e-d3600b89a880-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/708/实测-x99-pcie-4.0-是真是假-用实际带宽测试拆穿华强北黑魔法</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 08:03:37 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/708.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 26 Jun 2026 13:04:00 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Tue, 30 Jun 2026 06:17:10 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/abaalei" aria-label="Profile: abaalei">@<bdi>abaalei</bdi></a> <a href="/post/8405">说</a>:</p>
<p dir="auto">当然，单卡推理完全没所谓——模型加载到显存后，PCIe 只做偶尔的数据传输，瓶颈在算力和显存带宽上。</p>
</blockquote>
<p dir="auto">看到这里我就放心，我的华南金牌X99-CD4的第1槽插了3090Ti（三风扇版本）后，第2槽位被挡住了，3060只能插在第3槽。</p>
<p dir="auto">还好，我两张卡是分配跑不同的模型<img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f604.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--smile" style="height:23px;width:auto;vertical-align:middle" title="😄" alt="😄" /></p>
]]></description><link>https://lcz.me/post/8842</link><guid isPermaLink="true">https://lcz.me/post/8842</guid><dc:creator><![CDATA[joker_chang]]></dc:creator><pubDate>Tue, 30 Jun 2026 06:17:10 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Sat, 27 Jun 2026 07:32:59 GMT]]></title><description><![CDATA[<p dir="auto">应该没那做测试的 7900XTX 破。我那台就是 3.0的插槽。现在又扔去吃灰了。坐等7900XTX 涨价 。</p>
]]></description><link>https://lcz.me/post/8489</link><guid isPermaLink="true">https://lcz.me/post/8489</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Sat, 27 Jun 2026 07:32:59 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Sat, 27 Jun 2026 07:29:48 GMT]]></title><description><![CDATA[<p dir="auto">不用想那么多了。不可能让你拿旧机器来压着新机器涨价的。</p>
]]></description><link>https://lcz.me/post/8487</link><guid isPermaLink="true">https://lcz.me/post/8487</guid><dc:creator><![CDATA[sirwang]]></dc:creator><pubDate>Sat, 27 Jun 2026 07:29:48 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Sat, 27 Jun 2026 03:54:05 GMT]]></title><description><![CDATA[<p dir="auto">soc的主控都不支持，主板怎么能支持。但是现在那些商家，V4的soc 用法d3的板子怎么搞的难道兼容向下吗，又没有人试过，问了ai 说主板做了兼容。</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/31c23e1b-edfe-4d44-bd1a-bbd2d7573af0.jpeg" alt="445e2098-9080-418b-8585-83d808c2c3ea-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/8474</link><guid isPermaLink="true">https://lcz.me/post/8474</guid><dc:creator><![CDATA[mei li]]></dc:creator><pubDate>Sat, 27 Jun 2026 03:54:05 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Fri, 26 Jun 2026 22:23:53 GMT]]></title><description><![CDATA[<p dir="auto">非常有意义，真正要上PCIE 4的话，还是买AMD的7k系列CPU的寨板套装，贵了不少，但是性能也强悍。</p>
]]></description><link>https://lcz.me/post/8437</link><guid isPermaLink="true">https://lcz.me/post/8437</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Fri, 26 Jun 2026 22:23:53 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Fri, 26 Jun 2026 17:32:50 GMT]]></title><description><![CDATA[<p dir="auto">赞。这对很多采购用户是非常重要的。</p>
]]></description><link>https://lcz.me/post/8427</link><guid isPermaLink="true">https://lcz.me/post/8427</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Fri, 26 Jun 2026 17:32:50 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Fri, 26 Jun 2026 17:01:26 GMT]]></title><description><![CDATA[<p dir="auto">帅！ 就喜欢这种数据党。</p>
]]></description><link>https://lcz.me/post/8424</link><guid isPermaLink="true">https://lcz.me/post/8424</guid><dc:creator><![CDATA[John Pan]]></dc:creator><pubDate>Fri, 26 Jun 2026 17:01:26 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Fri, 26 Jun 2026 14:09:05 GMT]]></title><description><![CDATA[<p dir="auto">我剛好在猶豫購買PCIe 4.0 x 16 的 Riser adpater 延長線, 就怕商家吹牛 買到品質不好的 導致32GB/s 降速到16G/s 以下 <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f61e.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--disappointed" style="height:23px;width:auto;vertical-align:middle" title=":(" alt="😞" /></p>
]]></description><link>https://lcz.me/post/8418</link><guid isPermaLink="true">https://lcz.me/post/8418</guid><dc:creator><![CDATA[kos or]]></dc:creator><pubDate>Fri, 26 Jun 2026 14:09:05 GMT</pubDate></item><item><title><![CDATA[Reply to 【实测】X99 PCIe 4.0 是真是假？用实际带宽测试拆穿华强北黑魔法 on Fri, 26 Jun 2026 13:17:18 GMT]]></title><description><![CDATA[<p dir="auto">你这也太牛了, 我linux 动手能力,没有你强.</p>
]]></description><link>https://lcz.me/post/8407</link><guid isPermaLink="true">https://lcz.me/post/8407</guid><dc:creator><![CDATA[mark]]></dc:creator><pubDate>Fri, 26 Jun 2026 13:17:18 GMT</pubDate></item></channel></rss>