谷歌DeepMind推出Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI领先地位

   日期:2024-12-17     来源:网络整理    作者:二手钢材网    浏览:173    评论:0    
核心提示:谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真实感和定制化体验。2是谷歌的视频生成工具,能够生成多样化主题和风格的高质量视频。2的更新能力整合到谷歌生态系统中的相关应用中……我们预计明年会分享更多的更新内容。

谷歌介绍,Veo 2是谷歌的视频生成工具,可以生成各种主题和风格的高质量视频。谷歌在博客文章中表示,该模型在真实感方面表现出色,可以捕捉人类表情和电影效果等细节。它增强了对物理和电影学的理解,使用户能够生成令人惊叹的内容,包括跟踪镜头、广角构图等。

例如,Veo 2 熟悉电影拍摄的语言。用户可以请求某种类型的风格、指定镜头、建议电影效果,Veo 2 将以高达 4K 的分辨率进行渲染,并将视频长度延长至几分钟。例如,如果您需要“穿过场景中心的低角度跟踪镜头”或“科学家通过显微镜观察的特写镜头”,Veo 2 就可以实现。说“18mm 镜头”,Veo 2 就知道生成广角镜头;要求“浅景深”,它会模糊背景并突出主题。

_谷歌模型下载_谷歌3d视频

值得注意的是,这个分辨率是Sora型号的4倍,视频长度是Sora型号的6倍多。

然而,这些优势目前仍停留在理论上。在谷歌的实验性视频创建工具中,Veo 2生成的视频被限制为720p分辨率和8秒长度。 (相比之下,Sora 的最大输出为 1080p、20 秒的剪辑。)

_谷歌模型下载_谷歌3d视频

谷歌表示,虽然视频生成模型倾向于“隐藏”不需要的细节,例如多余的手指或意外的物体,但 Veo 2 在这方面表现得更真实,并且生成错误的频率更低。

此外,Veo 2 生成的视频包含隐形水印,将其标记为人工智能生成的内容,从而降低误用或误归属的风险。

产品副总裁Eli告诉媒体,随着该模型逐渐准备好大规模使用,谷歌将通过其AI开发者平台提供Veo 2。

谷歌3d视频_谷歌模型下载_

“未来几个月,我们将根据用户反馈继续迭代,并寻求将 Veo 2 的更新功能集成到 生态系统中的相关应用中……我们预计明年会分享更多更新。”

开发者和创作者目前可以通过 Labs 访问该工具,预计到 2025 年将广泛集成到 Play 等平台中。

同时,3.0模型在图像构图和细节精度方面得到了增强,支持从写实到抽象的多种风格,能够生成更丰富的纹理,更忠实地响应用户提示。

谷歌模型下载_谷歌3d视频_

谷歌模型下载__谷歌3d视频

目前,3已通过谷歌实验室工具在100多个国家上线,让世界各地的用户能够尝试其前沿功能。

此外,谷歌还推出了 Whisk,这是一款结合了 3D 和可视化分析功能的创意工具。用户可以输入图像、生成详细的文本描述、重新混合样式或设计个性化作品,例如数字娃娃或珐琅徽章。

_谷歌模型下载_谷歌3d视频

据谷歌介绍,Whisk 结合了 3 个模型的视觉理解和描述能力。该模型自动为用户的图像生成详细的文本描述,并将这些描述传递给 3。这个过程允许用户以有趣的新方式重新混合主题、场景和风格。

谷歌模型下载__谷歌3d视频

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2