量子比特 |公众号
继量子芯片之后,谷歌又来抢“双12直播”流量了!
就在刚刚,谷歌新一代大模型2.0突然亮相,并再次由谷歌CEO皮查伊亲自正式宣布。

新一代模型专为AI Agent打造。谷歌表示,2.0版本已经提供给部分开发者进行内部测试,并正在快速将其整合到手机、搜索等产品线中。
好消息是,2.0 Flash实验版模型已于今日在网页开放大家都可以玩,手机版也即将上线。
此外,谷歌还推出了一项名为Deep的新功能。基于高级推理和长上下文能力,它可以直接帮助你做研究助理的工作——给你一个课题,自己出一份报告。有点儿。

该新功能目前已在版本中提供。
谷歌的举动,再加上Sora表现不佳,新一天的直播还没开始,就已经有人开始唱衰了:
什么是护城河?


“智能代理时代的新AI模型”
在 CEO 、CEO 和 CTO Koray 共同撰写的博文中,2.0 的官方定位是:

智能代理时代的人工智能模型。
多模态的新进展以及原生工具的使用使我们能够构建新的人工智能代理,使我们更接近实现通用助手的愿景。
这是如何体现的?在首次推出2.0 Flash实验版的同时,谷歌还推出了一项名为Deep (深度研究)的新智能功能。
您可以将其视为研究助理,生成有关复杂主题的研究报告。这有点像科学研究版的人工智能搜索。
2.0的另一个关键关键词是:多模态。
Flash 2.0实验版除了支持图像、视频、音频的多模态输入外,还支持多模态输出。

它不仅仅是图像和文本的简单混合,而且是可控的多语言文本转语音(TTS)输出。它还可以直接在本地调用工具,例如搜索、代码工具和第三方用户定义的函数。
闻起来像插件。
然而,作为一个实验模型,其文本转语音和本机图像生成功能目前仅提供给早期访问合作伙伴。谷歌透露,Flash 2.0将于1月份正式推出,并将提供更多不同尺寸的型号。
根据公布的基准测试结果,无论是多模态图片和视频能力,还是编码、数学等能力,仅Flash实验版2.0的性能就几乎完全超越1.5 Pro 002。
而且速度是 1.5 Pro 的两倍。

谷歌表示,明年初,将把2.0扩展到更多产品,例如Astra。

是在I/O大会上推出的一款,旨在与GPT-4o的语音功能竞争。
此次,Astra在2.0的基础上更新了以下功能:
谷歌还提到,正在将Astra移植到眼镜等更多移动终端。
此外,谷歌透露,他们正在与其他游戏开发商合作,测试基于2.0的游戏代理的实力。
这些代理可以根据屏幕上的动作推理游戏,并实时与玩家交谈以建议行动。
玩《突击队》、《部落冲突》、《农场日记》,场景:
除了在网络上提供之外,2.0 Flash实验模型还通过AI和AI API提供给开发者。

跳槽到谷歌的洛根表示,他们创造了人工智能的新体验,展示了2.0视频理解、原生工具使用和空间理解的入门应用。

那么,你觉得这个Agent就够了吗?

参考链接:
[1]
[2]#ai-游戏-


