跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

star liS

star li

@star li
关于
帖子
1
主题
1
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 请教,我的硬件能不能做数字人?:pray: :pray:
    star liS star li

    各位好,我最近在折腾自媒体,想自建一套数字人视频生产线,有两个场景想请教。

    场景一:固定背景的口播视频(优先做)

    用我自己或授权他人的形象,输入一段文本 → 自动生成短视频。背景固定不动,核心要求是口型和语音自然同步、过渡流畅,不要那种糊嘴、抖动的廉价感。

    场景二:动态背景的口播视频(进阶)

    基于"边走边拍"的实拍素材(人物在移动、背景一直在变),配上文案,生成新视频,要求嘴部看起来像真人在说话。我知道这个比场景一难,主要想问可行性和坑在哪。

    我的硬件资源(纯本地,不想长期依赖云端付费)

    ┌─────────────┬───────────────────────────────────────────────────────────────────────┐
    │ 角色 │ 配置 │
    ├─────────────┼───────────────────────────────────────────────────────────────────────┤
    │ 主服务器 │ i9-10900X(10C20T)/ 64GB / RTX 3080 10GB / Ubuntu,24×7 在线 │
    ├─────────────┼───────────────────────────────────────────────────────────────────────┤
    │ AI 训练备机 │ i7-9700K(OC 4.6GHz)/ 64GB / RTX 3080 10GB / Win11 + WSL2 Ubuntu 24.04 │
    ├─────────────┼───────────────────────────────────────────────────────────────────────┤
    │ 移动推理 │ i7-10700F / 32GB / RTX 3060 Ti 8GB / Windows │
    ├─────────────┼───────────────────────────────────────────────────────────────────────┤
    │ 剪辑日常机 │ MacBook Pro 14" M5 / 24GB 统一内存 / macOS │
    └─────────────┴───────────────────────────────────────────────────────────────────────┘

    也就是说:2 块 RTX 3080(10GB)+ 1 块 3060 Ti(8GB),可以分流跑训练和推理,不差核心数和内存,但单卡显存只有 10GB 是硬约束。
    如果硬件实在不行可以考虑升级到3090 24G。

    我也有软件开发背景,最近在学AI,感谢各位的耐心解答!🙏 🙏

    AI音视频画图
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组