跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI音视频画图
  3. VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]

VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]

已定时 已固定 已锁定 已移动 AI音视频画图
10 帖子 2 发布者 98 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • luck erwinL 离线
    luck erwinL 离线
    luck erwin
    编写于 最后由 luck erwin 编辑
    #1

    大家好,已经安装完了 VoxCPM LTX2.3 的数字人 AI 生产环境。
    這两天,在实操上有些问题,想要在这边请教各位大佬。

    关于 VoxCPN 在实务上的应用,我发现每当大量生成文字转语音档案时,总是会出现一种情况:每 10 个档案中就会有 1 到 3 个档案的声线会跑掉。

    我每个文字转语音的排程安排如下:

    1. 生成内容:中文 85 字
    2. 生成时长:大概 15 秒

    在 Python 脚本的部分,試著优化:将每次抽卡的种子生成随机顺序都固定为 1

    但是实际运行后还是会有10个档案,会有 1 到 2 个档案的声线会跑掉。

    请问各位大佬有遇过这样的问题吗?是否有解决方面的经验可以分享,谢谢。

    1 条回复 最后回复
    0
    • terryT 在线
      terryT 在线
      terry
      编写于 最后由 编辑
      #2

      你不要使用抽卡,生成音色用QwenTTS,或者克隆成熟音色,VoxCPM长处不在这里。你下载个刘悦的Qwen TTS整合包抽卡就好了。

      1 条回复 最后回复
      0
      • luck erwinL 离线
        luck erwinL 离线
        luck erwin
        编写于 最后由 编辑
        #3

        收到 立馬下載[Qwen TTS整合包抽卡]試試 謝謝指點

        1 条回复 最后回复
        0
        • terryT 在线
          terryT 在线
          terry
          编写于 最后由 编辑
          #4

          还有问题就截图日志,贴图到这里,voxcpm我长期在用,每天都用。我没啥问题,我用的1.5

          1 条回复 最后回复
          0
          • luck erwinL 离线
            luck erwinL 离线
            luck erwin
            编写于 最后由 编辑
            #5

            先跟大佬說明一下還環境奘況:
            HW 筆記本 : 275HX+64GB RAM + 5090 24GB

            目前是依照大佬的建議 : 先在WIN跑通流程

            軟體版本是 劉悅大神安裝包 :
            LTX-2.3 gguf
            VoxCPM 2.0

            剛才跑了一個全英文的數字人排程 單個排程切成5秒 共計66個排程

            看了結果 全部66個wav檔案 沒有發現聲線跑掉的問題。
            會在測試 :

            1. 中文語音 縮短時間 由15秒改成10秒 看看會不會有聲線跑掉的問題
            2. 英文語音 加長時間 由5秒改成10秒 看看會不會有聲線跑掉的問題

            驗證 語言 與 時長的關係。

            因為聲線跑掉的py 執行畫面的log 暫時沒看到報錯,尚不知道原因;也請教大佬AI Model ( LTX2.3 或 VoxCPM )的debug log 你都看哪個資料夾? 或是 另外在py 腳本埋入debug log?

            謝謝

            31ae5cac-2f9a-4520-bdcc-ba56a254b7be-image.jpeg
            8f01d7ad-8a5a-4d9e-a608-c9d9b4180ef6-image.jpeg

            1 条回复 最后回复
            0
            • terryT 在线
              terryT 在线
              terry
              编写于 最后由 编辑
              #6

              VoxCPM 2.0不要用,用voxCPM 1.5,和我保持一致,另外你的整合包有问题,在WSL2虚拟机下安装速度会快不少,快两倍都不止。Linux下更快。因为VoxCPM需要魔搭社区的采样器,降燥,你问下Gemini,让它教你在WSL2下跑VoxCPM,这一步无法绕过。

              1 条回复 最后回复
              0
              • luck erwinL 离线
                luck erwinL 离线
                luck erwin
                编写于 最后由 编辑
                #7

                好的 感謝大佬分享 讓我們少走彎路
                感恩

                1 条回复 最后回复
                0
                • luck erwinL 离线
                  luck erwinL 离线
                  luck erwin
                  编写于 最后由 编辑
                  #8

                  更新實操紀錄 :

                  測試版本 VoxCPM 2.0

                  測試手法 :

                  1. 使用自訂義的聲音模型
                  2. 中文語音 縮短時間 由15秒改成8秒 看看會不會有聲線跑掉的問題

                  測試結果 :
                  合併後兩分43秒的音頻,出現一次聲線跑掉(約7~8秒 聲音是非自訂義聲音模型)

                  小結論 :
                  VoxCPM 2.0 可能對中文有聲線輸出不穩定的問題,縮短時常可改善,但依然會出現聲線跑掉的問題

                  下一步 :
                  依照大佬建議 改成 VoxCPM 1.5 版本

                  terryT 1 条回复 最后回复
                  0
                  • luck erwinL luck erwin

                    更新實操紀錄 :

                    測試版本 VoxCPM 2.0

                    測試手法 :

                    1. 使用自訂義的聲音模型
                    2. 中文語音 縮短時間 由15秒改成8秒 看看會不會有聲線跑掉的問題

                    測試結果 :
                    合併後兩分43秒的音頻,出現一次聲線跑掉(約7~8秒 聲音是非自訂義聲音模型)

                    小結論 :
                    VoxCPM 2.0 可能對中文有聲線輸出不穩定的問題,縮短時常可改善,但依然會出現聲線跑掉的問題

                    下一步 :
                    依照大佬建議 改成 VoxCPM 1.5 版本

                    terryT 在线
                    terryT 在线
                    terry
                    编写于 最后由 编辑
                    #9

                    @luck-erwin 我没你想的那么好,我就是懒,有稳定的版本我绝不会升级,这一条很重要。

                    1 条回复 最后回复
                    0
                    • luck erwinL 离线
                      luck erwinL 离线
                      luck erwin
                      编写于 最后由 编辑
                      #10

                      您真內行 XD

                      工程師:程式能跑就不要去動它!
                      工程師:程式能跑就不要去動它!
                      能跑就好,結果一樣

                      5bff81b4-1fa3-4e53-a3fa-cc03306962db-image.jpeg

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组