图片驱动数字人
上传人物图片和音频,AI 生成说话视频
上传人物图片
点击上传人物图片
支持 JPG、PNG、WebP
上传音频(驱动音频)
点击上传音频(MP3、WAV、FLAC)
动作描述(可选)
人物在说话
常用描述
人物在说话
人物在唱歌
人物在演讲
人物在朗读
视频时长(从音频开头截取)
3 秒
6 秒
9 秒
12 秒
开始生成