<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[VoxCPM2 語音克隆 TTS 生成音色不穩定]]></title><description><![CDATA[<p dir="auto">想請教一下各位大神，前幾天嘗試部署 VoxCPM2<br />
並使用語音克隆功能來給我的 Hermes 妹妹發聲<br />
提供了約一分鐘的 wav 音頻當 reference<br />
但是每次生成的語音音色都不太一樣，聽著很不舒服<br />
使用極致克隆好像有 bug 更慘，生成多次後音色都變了<br />
不知道大神們有沒有遇上這種狀況，又是如何解決？</p>
]]></description><link>https://lcz.me/topic/21/voxcpm2-語音克隆-tts-生成音色不穩定</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 08:02:37 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/21.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 05 May 2026 05:21:09 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Mon, 11 May 2026 07:22:45 GMT]]></title><description><![CDATA[<p dir="auto">我觉得indextts挺好用的，在苹果下生成速度还过得去</p>
]]></description><link>https://lcz.me/post/973</link><guid isPermaLink="true">https://lcz.me/post/973</guid><dc:creator><![CDATA[weidong]]></dc:creator><pubDate>Mon, 11 May 2026 07:22:45 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Mon, 11 May 2026 06:27:55 GMT]]></title><description><![CDATA[<p dir="auto">我所有的电脑都是洋垃圾E5平台，一台是5070TI 128G内存，一台3060 12G+64内存，一台2070 8G+32G内存，前两台跑龙虾+comfyui ,第三台只能办公了</p>
]]></description><link>https://lcz.me/post/970</link><guid isPermaLink="true">https://lcz.me/post/970</guid><dc:creator><![CDATA[zeroxin]]></dc:creator><pubDate>Mon, 11 May 2026 06:27:55 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 12:40:14 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E5%BC%A0%E8%80%81%E5%B8%88" aria-label="Profile: 张老师">@<bdi>张老师</bdi></a> 主力工作机器不要和AI部署机器放到一起是对的，你就给显卡配置个洋垃圾，让它独立运行，使劲造，坏了就重装。思路是对的。</p>
]]></description><link>https://lcz.me/post/765</link><guid isPermaLink="true">https://lcz.me/post/765</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 10 May 2026 12:40:14 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 11:45:29 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> <a href="/post/739">说</a>:</p>
<p dir="auto">不需要卖肾。</p>
</blockquote>
<p dir="auto">哈哈，学你视频里幽默的方式，好的，我有空了去搞个洋垃圾组合也试试Ubuntu 服务器吧！到时候过来分享哦</p>
]]></description><link>https://lcz.me/post/758</link><guid isPermaLink="true">https://lcz.me/post/758</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Sun, 10 May 2026 11:45:29 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 09:15:30 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E5%BC%A0%E8%80%81%E5%B8%88" aria-label="Profile: 张老师">@<bdi>张老师</bdi></a> 那挺慢的，你换Linux就能快点。不需要卖肾。</p>
]]></description><link>https://lcz.me/post/739</link><guid isPermaLink="true">https://lcz.me/post/739</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 10 May 2026 09:15:30 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 09:02:06 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 大神好，感谢回复，目前我这套模式还可以接受1:3的比例吧，一分钟，3分钟时间渲染！至于到其他系统里面去折腾，等我也去旁边医院里问一下我的一个肾值多少钱，是否能买下4090 48G的显卡！买了显卡我再去折腾吧！哈哈</p>
]]></description><link>https://lcz.me/post/738</link><guid isPermaLink="true">https://lcz.me/post/738</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Sun, 10 May 2026 09:02:06 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 08:20:03 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E5%BC%A0%E8%80%81%E5%B8%88" aria-label="Profile: 张老师">@<bdi>张老师</bdi></a> 你试试看Linux，wsl2都比它快很多，我4090能跑到50t/s，xtx 20t/s，你看看你的日志对比下就知道了，voxcpm的win整合包一般速读哦堵很慢。</p>
]]></description><link>https://lcz.me/post/733</link><guid isPermaLink="true">https://lcz.me/post/733</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 10 May 2026 08:20:03 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Sun, 10 May 2026 07:30:57 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/7f22732b-8e04-431a-8d8b-13cdc356f00e.jpeg" alt="e480ef84-2116-4dd5-a373-667a283a1ad3-image.jpeg" class=" img-fluid img-markdown" /><br />
<img src="https://upload.lcz.me/uploads/48448517-8c87-49a9-8fc6-29b10c44ba24.jpeg" alt="c892e235-3ff2-438b-adea-a38b39db3871-image.jpeg" class=" img-fluid img-markdown" /><br />
刚刚前几天做了这个项目，我对它进行了很多的魔改，当时也遇到了克隆声音效果不好，必须把参数调得很高，那样的话渲染的时间又很长！<br />
然后通过音色设计，抽卡一个比较靠谱的声音，记住它的种子号！然后又遇到了长文爆显存，后来就变成了分段渲染（刚好可以修改不满意的部分，而不用整段渲染），但是分段渲染，又遇到了同一个种子声音发出了不同的声音！最后想了一个办法，分段渲染时，先渲染一段相同的语句作为参考点（不显示）强制让它分段渲染的声音一致！反正这个项目折腾了很久！总算可以商用的版本！</p>
]]></description><link>https://lcz.me/post/730</link><guid isPermaLink="true">https://lcz.me/post/730</guid><dc:creator><![CDATA[张老师]]></dc:creator><pubDate>Sun, 10 May 2026 07:30:57 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Thu, 07 May 2026 13:32:21 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 對啊 我選他主要是可以本地運行廣東話TTS<br />
而且音色不像Elevenlabs 有點機械音的感覺<br />
用幾十分鐘的內容訓練個LoRa就連上面講會走音的問題也秒殺掉<br />
但有些字他總是讀錯 還在研究怎樣解決 哈</p>
]]></description><link>https://lcz.me/post/462</link><guid isPermaLink="true">https://lcz.me/post/462</guid><dc:creator><![CDATA[0xsltomorrow]]></dc:creator><pubDate>Thu, 07 May 2026 13:32:21 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Thu, 07 May 2026 00:32:23 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/t68823878" aria-label="Profile: t68823878">@<bdi>t68823878</bdi></a> 不要用comfyui部署，直接在linux下就可以部署Qwen TTS， 改天我测试下，上次我记得跑过整合包，稍微体验了下。过几天试试看。</p>
]]></description><link>https://lcz.me/post/381</link><guid isPermaLink="true">https://lcz.me/post/381</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 00:32:23 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Thu, 07 May 2026 00:01:23 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 就是挺简单根据刘悦那个视频教程来就行了，<a href="https://www.youtube.com/watch?v=HUPxh1sCDpA" rel="nofollow ugc">https://www.youtube.com/watch?v=HUPxh1sCDpA</a><br />
主要优势就是声音比较自然，AI味不明显，用来设计音色也是很不错的，我弄的语音音色就是用它抽卡抽出来的；<br />
当然我也试了用comfyui工作流来QWEN3 TTS，出来的效果比不上整合包，具体原因我也没有深入研究，整合包出来效果就是要好很多。</p>
]]></description><link>https://lcz.me/post/373</link><guid isPermaLink="true">https://lcz.me/post/373</guid><dc:creator><![CDATA[t68823878]]></dc:creator><pubDate>Thu, 07 May 2026 00:01:23 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Wed, 06 May 2026 06:09:19 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/0xsltomorrow" aria-label="Profile: 0xsltomorrow">@<bdi>0xsltomorrow</bdi></a> 多谢，那意义不大，我不想升级。1.5挺好的，我只做中英文，我感觉够强了，过犹不及。</p>
]]></description><link>https://lcz.me/post/298</link><guid isPermaLink="true">https://lcz.me/post/298</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Wed, 06 May 2026 06:09:19 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 23:09:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/t68823878" aria-label="Profile: t68823878">@<bdi>t68823878</bdi></a> 刘悦的包好不好用，我下载了，没怎么测试，主要是voxcpm太好用了，发个帖子分享下啊，付出一点。</p>
]]></description><link>https://lcz.me/post/276</link><guid isPermaLink="true">https://lcz.me/post/276</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 23:09:34 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 22:40:57 GMT]]></title><description><![CDATA[<p dir="auto">我是才开始接触AI音视频，综合对比了一下，我用的刘悦大神的QWEN TTS 1.7B文字转语音整合包，除了长篇幅几千字会出现吞字外，感觉音频质量还是在线的。而且你是不是参考语音片段太长了，都1分钟了，一般不都是10秒左右吗？</p>
]]></description><link>https://lcz.me/post/272</link><guid isPermaLink="true">https://lcz.me/post/272</guid><dc:creator><![CDATA[t68823878]]></dc:creator><pubDate>Tue, 05 May 2026 22:40:57 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 18:49:09 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/linax777" aria-label="Profile: linax777">@<bdi>linax777</bdi></a> voxcpm是流式API，你可以分段的，音频可以用ffpmeg代码修理，qwen TTS 在克隆方面远不如voxcpm，它的优势是多音色。</p>
]]></description><link>https://lcz.me/post/267</link><guid isPermaLink="true">https://lcz.me/post/267</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 18:49:09 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 08:15:44 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/0xsltomorrow" aria-label="Profile: 0xsltomorrow">@<bdi>0xsltomorrow</bdi></a> Ultimate Clone 沒試過太多次<br />
使用 HTTP API 調用 生成幾次之後就變成隨機音色 女聲變男聲<br />
再試幾天沒有改善可能要換成使用 Qwen3-TTS</p>
]]></description><link>https://lcz.me/post/202</link><guid isPermaLink="true">https://lcz.me/post/202</guid><dc:creator><![CDATA[linax777]]></dc:creator><pubDate>Tue, 05 May 2026 08:15:44 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 07:38:15 GMT]]></title><description><![CDATA[<p dir="auto">它可以克隆音色，然后你用工具微调下，再克隆，干嘛要抽卡呢？voxcpm可以直接运行你知道吗？直接用python脚本调用，别说几十秒，我的视频都是七八分钟，十几分钟的。脚本一步到位🤪</p>
]]></description><link>https://lcz.me/post/199</link><guid isPermaLink="true">https://lcz.me/post/199</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 07:38:15 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 07:26:23 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/linax777" aria-label="Profile: linax777">@<bdi>linax777</bdi></a> 請問你 Ultimate Clone 一段話時間大概多長？<br />
我用粵語的 沒加載LoRa情況下每句不能超過10秒<br />
10秒開始他就變成一種新的方言了</p>
]]></description><link>https://lcz.me/post/198</link><guid isPermaLink="true">https://lcz.me/post/198</guid><dc:creator><![CDATA[0xsltomorrow]]></dc:creator><pubDate>Tue, 05 May 2026 07:26:23 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 07:22:09 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 2.0 可以抽卡設計音色 但不一定抽到好卡<br />
另外增加了日語、韓語及多種方言支援 <s>(其他方言我不懂，但日、韓、粵語聽起來都是怪怪的)</s></p>
]]></description><link>https://lcz.me/post/197</link><guid isPermaLink="true">https://lcz.me/post/197</guid><dc:creator><![CDATA[0xsltomorrow]]></dc:creator><pubDate>Tue, 05 May 2026 07:22:09 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 05:37:38 GMT]]></title><description><![CDATA[<p dir="auto">只是用最新版。 是用 vllm 容器開啟模型 沒有詳細日誌 晚點再研究</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/3ce93b56-b558-4665-90d5-1cf1d861861c.png" alt="SCR-20260505-mctb.png" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/188</link><guid isPermaLink="true">https://lcz.me/post/188</guid><dc:creator><![CDATA[linax777]]></dc:creator><pubDate>Tue, 05 May 2026 05:37:38 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 05:33:48 GMT]]></title><description><![CDATA[<p dir="auto">你的运行日志要贴出来，或者有截图，然后你载入了modescope采样器没？贴日志。</p>
]]></description><link>https://lcz.me/post/187</link><guid isPermaLink="true">https://lcz.me/post/187</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 05:33:48 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 05:30:15 GMT]]></title><description><![CDATA[<p dir="auto">1.5不挺好用的吗，我都用1.5，2有什么特殊改进吗？我抽时间试试看。</p>
]]></description><link>https://lcz.me/post/186</link><guid isPermaLink="true">https://lcz.me/post/186</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 05:30:15 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 05:27:08 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 4月出 2版了。目前最新是2.0.2</p>
]]></description><link>https://lcz.me/post/185</link><guid isPermaLink="true">https://lcz.me/post/185</guid><dc:creator><![CDATA[linax777]]></dc:creator><pubDate>Tue, 05 May 2026 05:27:08 GMT</pubDate></item><item><title><![CDATA[Reply to VoxCPM2 語音克隆 TTS 生成音色不穩定 on Tue, 05 May 2026 05:23:51 GMT]]></title><description><![CDATA[<p dir="auto">我用的是1.5，2出来了？村里刚通网。</p>
]]></description><link>https://lcz.me/post/183</link><guid isPermaLink="true">https://lcz.me/post/183</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 05 May 2026 05:23:51 GMT</pubDate></item></channel></rss>