<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[试一试玩转  LTX-2.3 AI lip-sync （唇形同步模型）]]></title><description><![CDATA[<h3>前文：</h3>
<p dir="auto">之前一直使用一款 极度简捷的唇形同步节点 Comfyui_Sonic,<br />
还有，一定一定要参考我怎样copy 人物原音，不要只是用voxcpm<br />
<a href="https://lcz.me/topic/641/%E8%AF%95%E4%B8%80%E8%AF%95%E7%94%A8ai-%E6%8A%8A-%E7%8E%8B%E7%A5%96%E8%B4%A4-%E8%BF%98%E5%8E%9F%E6%88%90%E9%A6%99%E6%B8%AF%E9%85%8D%E9%9F%B3">用ai 把 王祖贤 还原成香港配音</a></p>
<p dir="auto"><a href="https://github.com/smthemex/ComfyUI_Sonic" rel="nofollow ugc">https://github.com/smthemex/ComfyUI_Sonic</a></p>
<p dir="auto">这个唇形同步可以简单到只要上载图像，上载语音，不用任何Prompt,<br />
他就自动产出相当出色的唇形同步画面。</p>
<p dir="auto"><a href="https://upload.lcz.me/uploads/e3d972a8-a2a3-4035-84f4-b31e9889fba6.json" rel="nofollow ugc">ComfyUI_Sonic 的工作流</a></p>
<p dir="auto">效果参考这个视频：<br />
<a href="https://youtu.be/9mzmB2aDgi8" rel="nofollow ugc">https://youtu.be/9mzmB2aDgi8</a></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/76d011a3-902e-4d2e-adf6-ef7b22514f59.jpeg" alt="f0c44edb-421a-4b80-9d71-440b83306b1b-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">缺点是：没有缺点，只不过我想试一试，比这个更加简单的。。<br />
<em>vram不足，处理时间太过长，这是我的缺点，不是他的缺点</em></p>
<p dir="auto">最终还是找回 LTX-2.3 AI lip-sync</p>
<hr />
<h3>官方对于LTX-2.3 AI lip-sync的介绍：</h3>
<p dir="auto">直接在Comfyui里面下载：<br />
<img src="https://upload.lcz.me/uploads/2fb638cb-c4ab-448c-930a-193dbbed3c98.png" alt="Screenshot 2026-06-21 235300.png" class=" img-fluid img-markdown" /></p>
<p dir="auto">LTX-2.3 AI唇形同步模型采用音频到视频的转换流程，生成高度精准的人物说话视频。通过将参考图像与语音或歌唱音轨相结合，该模型能够完美匹配角色的嘴部动作、头部运动和自然面部表情。</p>
<h3>模型工作原理</h3>
<ul>
<li>
<p dir="auto">音频驱动生成：LTX-2.3 并非将嘴部动作粘贴到静态面部，而是将音频文件直接编码到潜在空间中。这样一来，除了嘴唇的动作之外，还能产生微妙的微表情、眉毛动作和自然的头部倾斜。</p>
</li>
<li>
<p dir="auto">TalkVid ID-LoRA：为了使角色的面部在多个镜头或较长的视频中保持一致，您可以使用专门的身份 LoRA。</p>
</li>
<li>
<p dir="auto">三标签提示系统：为了获得最佳效果，提示通常分为三个标签：[视觉] 用于摄像机/灯光，[语音] 用于确切的歌词或词语，[声音] 用于背景音频。</p>
</li>
</ul>
<h3>最佳平台和工作流程</h3>
<p dir="auto">ComfyUI 工作流程：为了完全控制角色的面部一致性、循环播放和音频注入，</p>
<p dir="auto">总之讲到玩就是劲就对了。。。</p>
<hr />
<p dir="auto">其他的checkpoint照旧之前的ltx2.3, 如果你已经玩得非常熟悉，进入这里，一定也是照样顺顺利利，<br />
对了，在官方得工作流，我加了两点自己的东西：</p>
<ul>
<li>加了自己对于画面的 auto height and auto width 的玩法，</li>
<li>另外在输出的时候加了Rtx Video Super Resolution</li>
</ul>
<p dir="auto"><img src="https://upload.lcz.me/uploads/fa9fcaee-f501-4d98-b9a4-17ad3152b8db.png" alt="Screenshot 2026-06-21 232945.png" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/86dcdc09-d4a7-4fe9-8ade-5c104645fad2.png" alt="Screenshot 2026-06-21 233559.png" class=" img-fluid img-markdown" /></p>
<p dir="auto">试一试用这个Prompt</p>
<pre><code>static camera fixed on character, smooth infront-tracking shot

scene: Sunlit coastal road trip, clear coastal background

character: same as image

action: gestures naturally while talking to the camera

camera: Fixed on character, smooth infront shot
</code></pre>
<p dir="auto"><a href="https://upload.lcz.me/uploads/5a0dd726-f69b-4eed-b901-0ca13d238e54.json" rel="nofollow ugc">video_ltx2_3_ia2v_imbi.json</a></p>
<hr />
<h3>效果：</h3>
<p dir="auto">Comfyui Sonic Lip Syn<br />
<a href="https://youtube.com/shorts/xOVSaBwaL3I?feature=share" rel="nofollow ugc">https://youtube.com/shorts/xOVSaBwaL3I?feature=share</a></p>
<p dir="auto">Ltx2.3 Lip Syn<br />
<a href="https://youtube.com/shorts/I9Ri89pytAs?feature=share" rel="nofollow ugc">https://youtube.com/shorts/I9Ri89pytAs?feature=share</a></p>
]]></description><link>https://lcz.me/topic/650/试一试玩转-ltx-2.3-ai-lip-sync-唇形同步模型</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 13:37:03 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/650.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 21 Jun 2026 16:07:13 GMT</pubDate><ttl>60</ttl></channel></rss>