問大神推薦 可以改歌詞和 唱歌語音 的模型 和工作流
-
如題
下載了 SingerSuper Comfyui 環境設定不了劉悅的包不能改歌詞 而且時長好像只有30-60秒 。看看大神們有沒介紹 -
看看我的分享 是不是 适合你。直接能做新歌的开源。
-
看看我的分享 是不是 适合你。直接能做新歌的开源。
@williamlouis ACE1.5 我有用,很強大 。不過我想把現在的歌,把歌詞改了 或者換一個人唱 。好像Beyond 不再猶豫,有一句 問句天幾高心中志比天更高,我就想改做NSFW歌詞 。哈哈 謝謝
-
@youtubevic 你这个需求其实可以分为两个不同的任务,我分别说说:
1. 改歌词(不换人声)
如果你只想改歌词、保留原唱的声音,目前开源方案比较难做到完美分离。建议思路:- 先用 UVR5(Ultimate Vocal Remover)把人声和伴奏分离,提取干声(vocals)
- 用 ACE 或 RVC 模型提取原唱的音色特征
- 把改好的歌词用 Fish Speech / CosyVoice 重新合成,但是用原唱的音色
- 最后和伴奏重新混音
这个流程比较复杂,但效果最好。ComfyUI 里可以用 F5-TTS 或 Edge TTS 节点直接生成新歌声。
2. 换人唱(Cover)
如果你只是想换一个人来唱这首歌,那不需要改原唱音色:- SingerSuper 确实只有30-60秒,因为它用的是扩散模型推理,长音频会有质量下降问题
- 推荐用 RVC + GPT-SoVITS 组合:先用 RVC 提取目标歌手的音色,然后用 GPT-SoVITS 把歌词重新合成
- ComfyUI 里有 RVC 节点可以直接用,不需要单独部署环境
- 时长方面 GPT-SoVITS 没有严格限制,几分钟的歌曲都可以
3. 关于 NSFW 歌词
如果你要改 Beyond 的歌词做翻唱,注意版权合规问题。如果是个人学习/娱乐用途倒没关系,但不建议公开发布修改后的商业歌曲。需要的话我可以帮你整理一个 ComfyUI 工作流结构图。
-
@williamlouis ACE1.5 我有用,很強大 。不過我想把現在的歌,把歌詞改了 或者換一個人唱 。好像Beyond 不再猶豫,有一句 問句天幾高心中志比天更高,我就想改做NSFW歌詞 。哈哈 謝謝
@youtubevic 你的想法不需要用 AI工作流弄。你用个能消声的软件。消声。再用 ACE1.5 发声。之后合成下不就行了。当你的项目不是批量化的时候。不要想着让工作流实现。