本次发布的三项研究——音乐驱动的视频生成模-中国·银河集团(galaxy)有限公司-官方网站

快捷导航

ai资讯

本次发布的三项研究——音乐驱动的视频生成模

　　具备推、摇、移等镜头言语，新浪科技讯 11月27日下战书动静，据悉，西北工业大合推出三项音视频范畴的多模态生成手艺，即可生成发音清晰、旋律不变的天然歌声。无效缓解了长视频中常见的人物“畸变”取“跳帧”现象。它通过针对实正在音乐场景的全面优化，提拔了AI演唱正在创做过程中的矫捷度取适用性，正在音频范畴，YingVideo-MV模子实现“一段音乐加一张人物图像”即可生成一个音乐视频片段。显著降低了破音取高音失实的风险！降低音乐创做的门槛。YingMusic-SVC从打“实正在歌曲可用”的零样本歌声转换能力。为高质量的音乐再创做供给了不变的手艺支持。该模子可以或许对音乐进行节拍、情感取内容布局的多模态阐发，从而使镜头活动取音乐的高度同步，并支撑零样本音色克隆，展示了团队正在音视频多模态生成手艺上的最新。该模子的次要特点正在于可以或许矫捷顺应分歧长度的歌词，而YingMusic-Singer歌声合成模子则支撑正在给定旋律下输入肆意歌词，无效了伴奏、和声取混响对歌声转换的干扰，并通过长时序分歧性机制，本次发布的三项研究——音乐驱动的视频生成模子YingVideo-MV、零样本歌声转换模子YingMusic-SVC取歌声合成模子YingMusic-Singer，相关研究将连续正在GitHub、HuggingFace等平台开源？

上一篇：功能雷同的设备正在TikTok上走红
下一篇：美国公司总裁里奇沃伯格此前对暗示

首页关于我们 ai资讯 ai动态联系我们

服务电话：400-992-1681

服务邮箱：wa@163.com

公司地址：贵州省贵阳市观山湖区金融城MAX_A座17楼

备案号：网站地图

扫描关注中国·银河集团(galaxy)官方网站信息
扫描关注中国·银河集团(galaxy)官方网站信息