7月30日,国产视频模式Vidu()全球首发,开放文本生成视频、图片生成视频两大核心功能,提供4秒、8秒两种时长选择,分辨率最高可达1080P,30秒即可生成4秒短片。目前,圣数科技推出了Vidu免费版和标准版,免费版可生成4秒视频,支持超清和1个并行任务,标准版可生成4秒和8秒视频,每月费用7.99美元,支持超清、商业使用,超清后可去水印,支持2个并行任务。

澎湃新闻测试。提示:一只穿着运动服的哈巴狗在一家中餐馆里吃面条,桌子上放着一杯热气腾腾的茶,餐厅干净整洁,背后的时钟显示已经是中午12点半了。
圣树科技表示,目前市面上的AI视频工具大多局限于写实风格,或源于现实的想象。除了能够实现常见的写实等多样风格外,维度还增加了动画风格选项。该功能不仅保持了动画风格的一致性,还显著提升了画面的稳定性,避免了其他视频生成工具“动画化”时常见的画面跳变、风格突变等问题。在画面质感方面,无论是科幻、西部、爱情、动画等类型的电影,维度都能生成符合相应风格的画面片段。此外,维度还能生成电影级的特效画面,比如烟雾、眩光效果、CG特效等。

由 Vidu 生成的特效片段。
在“图片转视频”板块,Vidu推出了角色一致性功能,用户可以上传头像或自定义角色图片,通过文字描述指定角色在任意场景中执行任意动作。该功能可简化视频制作流程,节省角色形象设计和调整时间,提供创作自由。

Paper 对此进行了测试。上传一张熊猫照片并将其作为起始帧,提示:熊猫吃竹子。
圣数科技表示,Vidu可以理解并生成提示词中的文字,包括字母、数字等,并能生成文字效果。Vidu还能精准表达第一人称、延时摄影等镜头语言,用户只需对提示词进行细化,即可提升视频的可控性。

测试者:The Paper。提示:一辆红色汽车在高速公路上行驶,距离 120 公里/小时的限速标志越来越近。高速公路周围树木茂密,颇具动漫风格。
但屏幕上并没有显示限速120公里的标志,而是出现了“200kh”。
圣数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究所,首席科学家朱军为清华大学教授。朱军曾表示,维度的快速突破源于团队在贝叶斯机器学习、多模态大模型等方面的长期积累和诸多原创成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个与团队深度融合、完全自主研发的架构。


