跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

luck erwinL

luck erwin

@luck erwin
关于
帖子
10
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。
    luck erwinL luck erwin

    謝謝 @terry @xiaote 二位大大經驗分享

    寶貴經驗讓我們少走彎路

    感恩

    AI音视频画图

  • 请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。
    luck erwinL luck erwin

    請問大佬的意思是不用 劉悅大神包的comfyUI 的工作流
    改成自訂義的comfyUI嗎?

    也請問 目前工作環境視 Win11 + 5090 24GB
    544x960 24fps視頻長度超過15秒 有大概率爆顯存
    請問把工作流遷移到wsl2 除了加快生產速度外,也有機會拉大視頻切片的長度嗎?
    謝謝
    6588b75a-74e8-4539-9962-7980308d22a6-image.jpeg

    AI音视频画图

  • 请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。
    luck erwinL luck erwin

    请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。

    目前使用时,画面切片和数字人切片之间的画面会有跳动或动作不连续的问题。

    请问各位大大有解决的经验吗?也请提供一些解决思路,谢谢。

    执行的参数如下:
    1.每个切片的 seed值都是一样的,目前设定值为 1

    1. 每个切片的 prompt 都是一样的。目前使用的 prompt 是:照片中的人对着观众说话

    3.每个视频切片长度是10秒

    1. 合成后的视频长度为 7 分钟
    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    您真內行 XD

    工程師:程式能跑就不要去動它!
    工程師:程式能跑就不要去動它!
    能跑就好,結果一樣

    5bff81b4-1fa3-4e53-a3fa-cc03306962db-image.jpeg

    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    更新實操紀錄 :

    測試版本 VoxCPM 2.0

    測試手法 :

    1. 使用自訂義的聲音模型
    2. 中文語音 縮短時間 由15秒改成8秒 看看會不會有聲線跑掉的問題

    測試結果 :
    合併後兩分43秒的音頻,出現一次聲線跑掉(約7~8秒 聲音是非自訂義聲音模型)

    小結論 :
    VoxCPM 2.0 可能對中文有聲線輸出不穩定的問題,縮短時常可改善,但依然會出現聲線跑掉的問題

    下一步 :
    依照大佬建議 改成 VoxCPM 1.5 版本

    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    好的 感謝大佬分享 讓我們少走彎路
    感恩

    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    先跟大佬說明一下還環境奘況:
    HW 筆記本 : 275HX+64GB RAM + 5090 24GB

    目前是依照大佬的建議 : 先在WIN跑通流程

    軟體版本是 劉悅大神安裝包 :
    LTX-2.3 gguf
    VoxCPM 2.0

    剛才跑了一個全英文的數字人排程 單個排程切成5秒 共計66個排程

    看了結果 全部66個wav檔案 沒有發現聲線跑掉的問題。
    會在測試 :

    1. 中文語音 縮短時間 由15秒改成10秒 看看會不會有聲線跑掉的問題
    2. 英文語音 加長時間 由5秒改成10秒 看看會不會有聲線跑掉的問題

    驗證 語言 與 時長的關係。

    因為聲線跑掉的py 執行畫面的log 暫時沒看到報錯,尚不知道原因;也請教大佬AI Model ( LTX2.3 或 VoxCPM )的debug log 你都看哪個資料夾? 或是 另外在py 腳本埋入debug log?

    謝謝

    31ae5cac-2f9a-4520-bdcc-ba56a254b7be-image.jpeg
    8f01d7ad-8a5a-4d9e-a608-c9d9b4180ef6-image.jpeg

    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    收到 立馬下載[Qwen TTS整合包抽卡]試試 謝謝指點

    AI音视频画图

  • VoxCPM 實操問題請教 : [ 多次抽卡生成 會有20%左右的檔案聲線會跑掉 ]
    luck erwinL luck erwin

    大家好,已经安装完了 VoxCPM LTX2.3 的数字人 AI 生产环境。
    這两天,在实操上有些问题,想要在这边请教各位大佬。

    关于 VoxCPN 在实务上的应用,我发现每当大量生成文字转语音档案时,总是会出现一种情况:每 10 个档案中就会有 1 到 3 个档案的声线会跑掉。

    我每个文字转语音的排程安排如下:

    1. 生成内容:中文 85 字
    2. 生成时长:大概 15 秒

    在 Python 脚本的部分,試著优化:将每次抽卡的种子生成随机顺序都固定为 1

    但是实际运行后还是会有10个档案,会有 1 到 2 个档案的声线会跑掉。

    请问各位大佬有遇过这样的问题吗?是否有解决方面的经验可以分享,谢谢。

    AI音视频画图

  • 抡锤者社区正式上线
    luck erwinL luck erwin

    慶祝抡锤者社区正式上线 讚讚讚~~~

    站点公告
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组