商汤科技发布可控人物视频生成算法模型Vimi

来源：AIbase· 2024-07-04 13:46:15

商汤科技正式推出了其首个具有里程碑意义的“Vimi”可控人物视频生成大模型。

微信截图_20240704103446.png

Vimi作为商汤科技基于其强大的日日新大模型能力研发的产物，实现了前所未有的视频生成灵活性。它能够灵活接收来自动作视频、精美动画、丰富声音素材乃至文字描述的多元化输入，作为驱动元素，精准地操控并转化人物类图片，最终生成与目标动作完美匹配的人物视频。这一过程不仅展现了AI技术对于复杂场景的高度适应性，也体现了商汤在视频生成技术上的深厚积累。

微信截图_20240704103219.png

尤为值得一提的是，Vimi在可控性上的卓越表现。它超越了传统图片表情控制技术的局限，不仅能够细腻地调整人物的表情变化，更实现了对肢体动作的精准操控。这一突破性的能力使得Vimi能够生成出既符合逻辑又生动自然的视频内容，同时，在头发、服饰、背景等细节处理上也达到了前所未有的精细度，支持光影的自然变化，为观众带来沉浸式的视觉体验。

在视频生成的稳定性与时长上，Vimi同样展现出了非凡的实力。它能够稳定地生成长达1分钟的单镜头人物视频，这一成就突破了现有大模型AI视频生成在时长上的限制。更重要的是，随着视频时长的增加，Vimi生成的视频画面质量始终保持如一，不会出现劣化或失真的情况，确保了视频内容的连贯性和高质量。

您可能关注: AI视频 AI算法商汤科技 AI科技

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/3339.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇中国生成式AI专利申请量全球第一！远超美国、韩国、日本

下一篇李彦宏：文心快码正在逐步渗透百度内部已有约30%的代码由A

相关推荐