宜信好望角：腾讯混元图生视频模型上线，开启AI新格局

发布时间1：2025-04-14 18:30 来源：网络阅读量：7432 会员投稿

在3月6日的下午，腾讯混元团队宣布了一个令人振奋的消息：其图生视频模型已经正式上线。这一创新技术不仅为企业和开发者提供了全新的创作工具，更为广大用户带来了前所未有的视频创作体验。现在，企业和开发者可以通过腾讯云申请使用这一模型的API接口，而普通用户则可以直接通过混元AI视频官网进行体验。

腾讯混元的图生视频模型不仅在技术上取得了突破，更在易用性上做出了巨大努力。用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可根据这些要求让图片“活”起来，变成一段5秒的短视频。更令人惊喜的是，这一模型还能自动为视频配上背景音效，使得整个创作过程更加轻松便捷。

除了基本的图片动画功能外，腾讯混元还上线了对口型与动作驱动等创新玩法。用户只需上传一张人物图片，并输入希望“对口型”的文字或音频，图片中的人物即可“说话”或“唱歌”。这一功能不仅为短视频创作者提供了更多乐趣和创意空间，也为虚拟偶像、动画制作等领域带来了全新的可能性。同时，使用“动作驱动”能力，用户还可以一键生成同款跳舞视频，让创作变得更加简单和有趣。

值得一提的是，腾讯混元此次开源的图生视频模型总参数量高达130亿，适用于多种类型的角色和场景。无论是写实视频制作、动漫角色还是CGI角色制作，这一模型都能展现出出色的生成效果。开源内容包含了权重、推理代码和LoRA训练代码，支持开发者基于混元训练专属LoRA等衍生模型。这意味着，开发者可以根据自己的需求和创意，进一步定制和优化这一模型，为AI视频创作领域注入更多新的活力。

腾讯混元的图生视频模型的上线和开源，无疑为AI视频创作领域带来了革命性的变化。它不仅降低了视频创作的门槛，让更多人能够轻松参与到这一领域中来；同时也为开发者提供了更多的可能性和创意空间，推动了AI技术的不断发展和创新。随着这一技术的不断推广和应用，我们可以预见，未来将有更多的优质视频内容被创作出来，为人们的生活带来更多的乐趣和惊喜。同时，这一技术也将为各个行业带来更多的创新和变革，推动社会的不断进步和发展。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。