国产视频大模型 Vidu 全球上线,30 秒生成 4 秒片段,功能强大

   日期:2024-07-31     来源:网络整理    作者:二手钢材网    浏览:140    评论:0    
核心提示:·国产视频大模型Vidu全球上线,开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒片段只需30秒。免费版可生成4秒视频,支持超清和一个并行任务,标准版可生成4秒和8秒视频,每月7.99美元,支持超清、商用、超清后去除水印,支持两个并行任务。

7月30日,国产视频模式Vidu()全球首发,开放文本生成视频、图片生成视频两大核心功能,提供4秒、8秒两种时长选择,分辨率最高可达1080P,30秒即可生成4秒短片。目前,圣数科技推出了Vidu免费版和标准版,免费版可生成4秒视频,支持超清和1个并行任务,标准版可生成4秒和8秒视频,每月费用7.99美元,支持超清、商业使用,超清后可去水印,支持2个并行任务。

图片

澎湃新闻测试。提示:一只穿着运动服的哈巴狗在一家中餐馆里吃面条,桌子上放着一杯热气腾腾的茶,餐厅干净整洁,背后的时钟显示已经是中午12点半了。

圣树科技表示,目前市面上的AI视频工具大多局限于写实风格,或源于现实的想象。除了能够实现常见的写实等多样风格外,维度还增加了动画风格选项。该功能不仅保持了动画风格的一致性,还显著提升了画面的稳定性,避免了其他视频生成工具“动画化”时常见的画面跳变、风格突变等问题。在画面质感方面,无论是科幻、西部、爱情、动画等类型的电影,维度都能生成符合相应风格的画面片段。此外,维度还能生成电影级的特效画面,比如烟雾、眩光效果、CG特效等。

图片

由 Vidu 生成的特效片段。

在“图片转视频”板块,Vidu推出了角色一致性功能,用户可以上传头像或自定义角色图片,通过文字描述指定角色在任意场景中执行任意动作。该功能可简化视频制作流程,节省角色形象设计和调整时间,提供创作自由。

图片

Paper 对此进行了测试。上传一张熊猫照片并将其作为起始帧,提示:熊猫吃竹子。

圣数科技表示,Vidu可以理解并生成提示词中的文字,包括字母、数字等,并能生成文字效果。Vidu还能精准表达第一人称、延时摄影等镜头语言,用户只需对提示词进行细化,即可提升视频的可控性。

图片

测试者:The Paper。提示:一辆红色汽车在高速公路上行驶,距离 120 公里/小时的限速标志越来越近。高速公路周围树木茂密,颇具动漫风格。

但屏幕上并没有显示限速120公里的标志,而是出现了“200kh”。

圣数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究所,首席科学家朱军为清华大学教授。朱军曾表示,维度的快速突破源于团队在贝叶斯机器学习、多模态大模型等方面的长期积累和诸多原创成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个与团队深度融合、完全自主研发的架构。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2