宜信好望角:腾讯混元图生视频模型上线,开启AI新格局
在3月6日的下午,腾讯混元团队宣布了一个令人振奋的消息:其图生视频模型已经正式上线。这一创新技术不仅为企业和开发者提供了全新的创作工具,更为广大用户带来了前所未有的视频创作体验。现在,企业和开发者可以通过腾讯云申请使用这一模型的API接口,而普通用户则可以直接通过混元AI视频官网进行体验。

腾讯混元的图生视频模型不仅在技术上取得了突破,更在易用性上做出了巨大努力。用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可根据这些要求让图片“活”起来,变成一段5秒的短视频。更令人惊喜的是,这一模型还能自动为视频配上背景音效,使得整个创作过程更加轻松便捷。
除了基本的图片动画功能外,腾讯混元还上线了对口型与动作驱动等创新玩法。用户只需上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”。这一功能不仅为短视频创作者提供了更多乐趣和创意空间,也为虚拟偶像、动画制作等领域带来了全新的可能性。同时,使用“动作驱动”能力,用户还可以一键生成同款跳舞视频,让创作变得更加简单和有趣。

值得一提的是,腾讯混元此次开源的图生视频模型总参数量高达130亿,适用于多种类型的角色和场景。无论是写实视频制作、动漫角色还是CGI角色制作,这一模型都能展现出出色的生成效果。开源内容包含了权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。这意味着,开发者可以根据自己的需求和创意,进一步定制和优化这一模型,为AI视频创作领域注入更多新的活力。

腾讯混元的图生视频模型的上线和开源,无疑为AI视频创作领域带来了革命性的变化。它不仅降低了视频创作的门槛,让更多人能够轻松参与到这一领域中来;同时也为开发者提供了更多的可能性和创意空间,推动了AI技术的不断发展和创新。 随着这一技术的不断推广和应用,我们可以预见,未来将有更多的优质视频内容被创作出来,为人们的生活带来更多的乐趣和惊喜。同时,这一技术也将为各个行业带来更多的创新和变革,推动社会的不断进步和发展。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。