Vidu:可生成16秒、1080P视频的模型




生数科技与清华大学共同发布了中国首个长时长、高一致性、高动态性视频大模型:Vidu。


这款模型被视为国内首个达到Sora级别的视频模型。


Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。


Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。


能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。


在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。


北京生数科技有限公司(简称“生数科技”)成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。

公司致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式AI在艺术设计、游戏制作、影视后期、内容社交等场景的商业赋能,通过AI提升人类的创造力和生产力。


如果想详细了解,可以点开视频下方的链接。

谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢


官网:https://www.shengshu-ai.com/home


视频:https://youtu.be/QGCojQsNHC4

留言