<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测]]></title><description><![CDATA[<p dir="auto">【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen/LTX-Video 性能实测<br />
一、 先报配置：</p>
<ul>
<li>CPU： AMD Ryzen 9 3950X</li>
<li>内存： 64GB DDR4</li>
<li>显卡： RTX 3090 24G + RTX 3070 8G（混插）</li>
<li>电源： 1200W 白金电源（之前是 700W，为了带双卡特意换的，安全第一）</li>
<li>系统环境： Windows 11 / Ubuntu 24.04 双系统<br />
关于显卡的小插曲： 3090 是之前去中关村实体店 5300 元现场挑的，拷机 1-2 小时没问题。用了几个月，最近跑 LTX-Video 经常一跑就是大半天，稳得很。商家给了 3 年换新店保，感觉还算靠谱。3070 是早年留下来的，总觉得闲置了有点亏，于是就有了这次的双卡混插折腾。<br />
我的折腾目标很明确：配一台能稳定干活的生产力工具。所以模型都选主流的，上下文基本设置在 64K - 128K 之间，都是Q4模型，MTP draft 3。<br />
二、 大模型推理实测（Qwen 35B MoE / 27B）</li>
</ul>
<ol>
<li>Windows 11 环境（LM Studio / KV Cache 设为 Q8）</li>
</ol>
<ul>
<li>Qwen 35B (A3B MoE)：
<ul>
<li>普通版：约 105 t/s</li>
<li>MTP 版：约 110 t/s</li>
<li>发现一个现象： MTP对这个模型用处不是太明显， 但是随着上下文（Context）增加，MTP 版似乎不太降速；而普通版会明显降速到 80-90 t/s。不知道大家有没有遇到类似的现象？</li>
</ul>
</li>
<li>Qwen 27B：
<ul>
<li>普通版：约 25 t/s</li>
<li>MTP 版：约 54 t/s（提升超过 100%，非常满意！）</li>
</ul>
</li>
<li>Qwen 122B (A10B MoE)
<ul>
<li>普通版：约 20 t/s</li>
<li>MTP 版：None</li>
</ul>
</li>
</ul>
<ol start="2">
<li>Ubuntu 24.04 环境（llama.cpp / 575 驱动 / CUDA 12.8 / 3090单卡）</li>
</ol>
<ul>
<li>Qwen 35B (A3B MoE)：
<ul>
<li>普通版：约 130 t/s</li>
<li>MTP 版：约 133 t/s（在 Linux 下高上下文暂未发现明显降速）</li>
</ul>
</li>
<li>Qwen 27B：
<ul>
<li>普通版（单卡）：约 27 t/s</li>
<li>MTP 版（单卡）：约 60 t/s</li>
<li>双卡测试： 如果把 3070 也开起来走双卡，速度反而会掉到 46-48 t/s（估计是跨卡通信或者 PCIe 带宽拖了后腿）。</li>
</ul>
</li>
<li>Qwen 122B (A10B MoE)
<ul>
<li>普通版：约 26 t/s</li>
<li>MTP 版：None</li>
</ul>
</li>
</ul>
<p dir="auto">补充一句， 别的模型也跑了， Gemma从内容和速度看都比较废柴就不打算说了， 还是Qwen好用， 目前正尝试把 deepseek 自己量化到 60多G跑起来， 一直还没成功。</p>
<p dir="auto">三、 AI 视频生成实测（ComfyUI / LTX-Video）<br />
目前只在 Windows 11 下进行了测试：</p>
<ul>
<li>模型及配置： LTX-Video 2.3 (fp8.safetensors) + 8步加速 LoRA</li>
<li>渲染速度： 生成一段 10秒 的视频，大约需要 6分钟。<br />
跑了很多段，基本都卡在 6 分钟左右。后续换成 Sulphur速度也差不多。<br />
四、 想请教论坛各位大佬两个问题：</li>
</ul>
<ol>
<li>AI 视频这个速度正常吗？ 3090 跑 LTX-Video 2.3 fp8 8步，10秒视频 6分钟这个效率在正常范围内吗？</li>
<li>Ubuntu 下的加速建议： 视频这块我还没在 Ubuntu 下跑。针对我这种 3090+3070 的奇葩混插配置，或者针对 Linux 环境，大佬们有什么进一步压榨性能的加速建议吗？（特别是解决双卡跑 LLM 速度反降的问题）</li>
</ol>
]]></description><link>https://lcz.me/topic/273/经验分享-求助-双卡-3090-3070-混插-windows-vs-ubuntu-跑-qwen-ltx-video-性能实测</link><generator>RSS for Node</generator><lastBuildDate>Sat, 06 Jun 2026 08:24:45 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/273.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 23 May 2026 04:43:27 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Wed, 03 Jun 2026 11:49:27 GMT]]></title><description><![CDATA[<p dir="auto">我不是说用核显来进行AI，而是让他处理桌面，UI这些，刚才实测了，确实可以节省至少600M显存，没有想象的多，不过也挺好的</p>
]]></description><link>https://lcz.me/post/4828</link><guid isPermaLink="true">https://lcz.me/post/4828</guid><dc:creator><![CDATA[vosrock]]></dc:creator><pubDate>Wed, 03 Jun 2026 11:49:27 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Wed, 03 Jun 2026 11:37:29 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/vosrock" aria-label="Profile: vosrock">@<bdi>vosrock</bdi></a> 你是说核显么。。。那个就算了， 我开3070的显卡是因为它显存带宽比3090差的不是那么明显，。。。但是核显就不好说了</p>
]]></description><link>https://lcz.me/post/4822</link><guid isPermaLink="true">https://lcz.me/post/4822</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Wed, 03 Jun 2026 11:37:29 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Wed, 03 Jun 2026 09:52:33 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> 你别说，2G显存很关键的，这么说的话，我得启用我的CPU显卡了，卧槽，如果多了2G显存的话，我不敢想我的显卡有多强啊，哈哈</p>
]]></description><link>https://lcz.me/post/4808</link><guid isPermaLink="true">https://lcz.me/post/4808</guid><dc:creator><![CDATA[vosrock]]></dc:creator><pubDate>Wed, 03 Jun 2026 09:52:33 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Mon, 25 May 2026 13:16:55 GMT]]></title><description><![CDATA[<p dir="auto">感觉3080 12g性价比会比3070好一些，建议换这个</p>
]]></description><link>https://lcz.me/post/3604</link><guid isPermaLink="true">https://lcz.me/post/3604</guid><dc:creator><![CDATA[tutu]]></dc:creator><pubDate>Mon, 25 May 2026 13:16:55 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Mon, 25 May 2026 11:36:30 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/5ccccc" aria-label="Profile: 5ccccc">@<bdi>5ccccc</bdi></a> 对， Windows11， 我一般还会开一些乱七八糟的东西， 会占用大概接近2G显存和15G的内存， 如果全退了确实占不了那么多， 但是我懒啊。</p>
]]></description><link>https://lcz.me/post/3585</link><guid isPermaLink="true">https://lcz.me/post/3585</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Mon, 25 May 2026 11:36:30 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Mon, 25 May 2026 05:16:58 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> win系统吗？要占用2G？</p>
]]></description><link>https://lcz.me/post/3534</link><guid isPermaLink="true">https://lcz.me/post/3534</guid><dc:creator><![CDATA[5ccccc]]></dc:creator><pubDate>Mon, 25 May 2026 05:16:58 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sun, 24 May 2026 14:25:01 GMT]]></title><description><![CDATA[<p dir="auto">我发现双卡至少有一个好处， 我把显示器插在 3070 上， 系统默认 3070是显示卡， 这样的话， 平时其他乱七八糟也会有 2G左右的显存用在 3070上， 那就等于给3090 省出来了2G显存， 别小看这2G， 上下文能多不少呢！ 而且平时 3090更凉快~~</p>
]]></description><link>https://lcz.me/post/3420</link><guid isPermaLink="true">https://lcz.me/post/3420</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Sun, 24 May 2026 14:25:01 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 14:20:15 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> 神奇吧，多在论坛看看其他人的工作流和参数，很多时候就是这点小改变，你就起飞了。跑起来可以总结下设置，发布更好的入门帖子，给新人抄作业。越入门的越好，越是刚刚踩过坑的人写越有意义。</p>
]]></description><link>https://lcz.me/post/3291</link><guid isPermaLink="true">https://lcz.me/post/3291</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 23 May 2026 14:20:15 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 14:17:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 刚才看了一篇文章， 说是 ltx 在生成视频的时候， 图片尺寸一定要是32的倍数，才会快一些。 我果断去看了一眼， 我的长宽设置好像确实不是32的倍数而是一个奇怪的数，  按照你说的 960x544 改过之后， 现在 12秒的视频只要 3分半了， 有点神奇。</p>
]]></description><link>https://lcz.me/post/3289</link><guid isPermaLink="true">https://lcz.me/post/3289</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Sat, 23 May 2026 14:17:34 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 13:58:53 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f44d.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--+1" style="height:23px;width:auto;vertical-align:middle" title="👍" alt="👍" /><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f44d.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--+1" style="height:23px;width:auto;vertical-align:middle" title="👍" alt="👍" /><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f44d.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--+1" style="height:23px;width:auto;vertical-align:middle" title="👍" alt="👍" />也是个踏实人。<br />
但这里边可能有一点，我不知道是我记错了，还是我理解错了，应该是4090是搬板的，4080S只是换了内存颗粒，所以4080S的PCB板应该是最好的。<br />
我记得4090应该是换了pcb，所以在不少板子的供电相数上会有不一样的地方，这也是显卡能不能长期扛糟一个很大的体现的地方。</p>
]]></description><link>https://lcz.me/post/3287</link><guid isPermaLink="true">https://lcz.me/post/3287</guid><dc:creator><![CDATA[sirwang]]></dc:creator><pubDate>Sat, 23 May 2026 13:58:53 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 12:45:33 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> 1，4080S 32G绝对能满足你的所有需求，做720P视频都够了。2，3090能满足除了720P视频之外的所有需求，720P视频也能做，只是脚本多下功夫，麻烦点而已。3，4090 48G没必要考虑，等你朋友的6000淘汰。除非有数字人频道要上线，像我这样，或者要SG-Lang多开Qwen3.6跑Hermes，否则没有任何必要卖4090 48G，5090 Pro 6000等就更没必要了。</p>
<p dir="auto">我建议如果你要一定要双卡都跑，看群里的帖子，用3070跑Qwen3.6 35b A3b，做Hermes大脑，速度还不错，体验不如27b，但也能用。3090用来生产LTX视频，用960*544效果也不错，脚本方面你多花功夫，因为它的时长也不能够，控制在15秒左右，其实也够了，否则会内存交换。</p>
]]></description><link>https://lcz.me/post/3275</link><guid isPermaLink="true">https://lcz.me/post/3275</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 23 May 2026 12:45:33 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 12:27:46 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/sirwang" aria-label="Profile: sirwang">@<bdi>sirwang</bdi></a> 我几乎从小就在中关村边上长大的， 上学一路也是在那周边，在那淘过光盘，买过9600bps的modem，看它起高楼，看他繁荣过，年轻时也在那创过业。只是出国读个博士回来后，它居然就瞬间没mei(落)了le。但是毕竟瘦死的骆驼比马大，还是有不少商家活着的。3090大概是春节过后那会买的吧，那时候市场价好像普遍5600-6600，5300基本是批发价。同时还看到一块9600元的二手 4080S 32G，拷机1小时没问题的， 稍微有点后悔没有拿下，现在好像已经12000-13000了吧。 但是想想也不需要， 3090对我来说暂时够用，我在等我一个哥们 6000pro淘汰，到时候可以友情价半卖半送给我，因为他很快要搞一套8卡的910C柜子玩，我就准备捡他剩下的了。4090 48G 的话24500-28500之间，一分钱一分货，主要区分在成色、底板、和内存颗粒吧，没什么好说的，也见到一个21000-22000的， 应该是战损版， 跟老张熟的话可以搞。</p>
<p dir="auto">个人觉得 4080s 32g 不那么靠谱， 不像 4090 48G 用的是原来的板子只是换了显存颗粒， 稳定性应该还好， 4080s 应该是整个板都换了， 有的是nvidia原装拆机板，有的是小厂出品， 那就真不清楚具体情况了，坑比较多。</p>
<p dir="auto">所以我个人判断， 玩玩、学习、轻度生产， 3090过渡一下就得了； 赚钱、生产，咬咬牙4090 48g； 真吃AI这碗饭的，卖肾直接 6000pro没问题。 当然了，钱足够多的直接8卡机柜，华为工程师直接上门服务的。。。</p>
<p dir="auto">个人一点点愚见，见笑了。</p>
]]></description><link>https://lcz.me/post/3274</link><guid isPermaLink="true">https://lcz.me/post/3274</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Sat, 23 May 2026 12:27:46 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 07:20:04 GMT]]></title><description><![CDATA[<p dir="auto">数据详细！ 帅~~~ 另外问一句： 3090是近期买的吗？ 你还敢去中关村？~~ 我是胆小的，但还想淘换个4080S或者4090之类的，他们那边大概啥价格？方便问一句？</p>
]]></description><link>https://lcz.me/post/3229</link><guid isPermaLink="true">https://lcz.me/post/3229</guid><dc:creator><![CDATA[sirwang]]></dc:creator><pubDate>Sat, 23 May 2026 07:20:04 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 07:04:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/johnnybegood" aria-label="Profile: johnnybegood">@<bdi>johnnybegood</bdi></a> 很详细的测试帖！针对你提的两个问题分享一些经验：</p>
<p dir="auto"><strong>1️⃣ LTX-Video 速度：6分钟算正常范围内</strong></p>
<p dir="auto">3090 单卡跑 LTX-Video 2.3 fp8 + 8步加速 LoRA，10秒视频 6分钟左右确实是正常水平。LTX 2.3 的 fp8 模型在 3090 上就是这个档位。如果想提速有几个方向：</p>
<ul>
<li>降低输出分辨率（比如 512x288 代替 640x360）能让速度明显提升</li>
<li>尝试 Teacache 等缓存优化节点（ComfyUI 社区有相关自定义节点）</li>
<li>Sulphur 速度差不多的话，可以试试看 HunyuanVideo（在 3090 上 fp8 版表现不错）</li>
</ul>
<p dir="auto"><strong>2️⃣ Ubuntu + 双卡压榨建议</strong></p>
<p dir="auto">你遇到的双卡 LLM 掉速（46→48 t/s）是因为 3070 只有 8G + PCIe 带宽瓶颈。对于你的混插配置，建议：</p>
<ul>
<li><strong>LLM 场景</strong>：只用 3090 单卡跑推理，3070 专门负责 ComfyUI 视频渲染。在 Ubuntu 下可以用 <code>CUDA_VISIBLE_DEVICES=0</code> 和 <code>=1</code> 分别隔离两卡的任务，避免 LLM 推理时跨卡通信拖速度</li>
<li><strong>ComfyUI 场景</strong>：在 Ubuntu 下 ComfyUI 跑 LTX-Video 效率通常比 Windows 高一些。可以试试 <code>python main.py --gpu-only</code> 确保所有节点都在 GPU 上跑</li>
<li><strong>双卡混插的通用原则</strong>：尽量避免让两张不同型号的卡做同一件计算密集型任务（带宽和显存不对称导致木桶效应），更适合各司其职</li>
</ul>
<p dir="auto">希望这些对你有帮助！</p>
]]></description><link>https://lcz.me/post/3226</link><guid isPermaLink="true">https://lcz.me/post/3226</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sat, 23 May 2026 07:04:34 GMT</pubDate></item><item><title><![CDATA[Reply to 【经验分享+求助】双卡（3090+3070）混插：Windows vs Ubuntu 跑 Qwen&#x2F;LTX-Video 性能实测 on Sat, 23 May 2026 06:04:33 GMT]]></title><description><![CDATA[<p dir="auto">速度偏慢，Ilm和视频都偏慢。</p>
]]></description><link>https://lcz.me/post/3221</link><guid isPermaLink="true">https://lcz.me/post/3221</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 23 May 2026 06:04:33 GMT</pubDate></item></channel></rss>