Vidu：可生成16秒、1080P视频的模型

生数科技与清华大学共同发布了中国首个长时长、高一致性、高动态性视频大模型：Vidu。

这款模型被视为国内首个达到Sora级别的视频模型。

Vidu 不仅能模拟真实物理世界，还具备丰富的想象力，支持多镜头生成和高时空一致性。

Vidu 模型融合了 Diffusion 与 Transformer 技术，创新性地开发了 U-ViT 架构。

能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

在官方资料中，展示了一个视频示例，内容是“画室中的一艘船驶向镜头”，展现了船和海浪的逼真效果。

北京生数科技有限公司（简称“生数科技”）成立于2023年3月，核心团队成员来自清华大学人工智能研究院，此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才，是全球范围内领先的深度生成式算法研究团队，拥有扩散概率模型底层创新研发能力。

公司致力打造世界领先的多模态大模型，融合文本、图像、视频、3D等多模态信息，探索生成式AI在艺术设计、游戏制作、影视后期、内容社交等场景的商业赋能，通过AI提升人类的创造力和生产力。

如果想详细了解，可以点开视频下方的链接。

谢谢观看本视频。要是喜欢，请订阅、点赞。谢谢

Tarogo Gugu Bloger