现任首席执行官戴米斯过去常常在午夜到凌晨 3 点之间完成一些他最有成就感的工作。他称自己为“夜行者”,独处时阅读科学论文,提出新想法,并进行简单的思考。
如今,我的清晨工作时间已经变得“不够用”。他的许多团队成员在硅谷的谷歌总部工作,那里的上班时间比伦敦早八个小时。因此,他的视频会议经常持续到当地时间的第二天。 “大约 18 个月前,我的睡眠时间表仍然很好,”他若有所思地说。随着谷歌与 Brain 合并,他也被任命为该部门的负责人。从此,宝贵的安静时光不复存在。
这是一个巨大的责任。尽管谷歌多年来一直在谈论成为一家人工智能优先的公司,但当前的生成式人工智能热潮是由谷歌于 2022 年 11 月推出的。将新兴技术转化为实际产品后,谷歌现在被迫与无数其他公司竞争,包括微软和谷歌合作伙伴微软。
谷歌正在专注于一种大型语言模型(LLM),它可以为谷歌搜索“人工智能概述”摘要、起草 Gmail 电子邮件等提供支持。它还取代了它成为系统中默认的语音AI。然而,它还无法成为领先的人工智能聊天机器人,它具有内置搜索等新功能,并且正在与谷歌进行更直接的竞争。谷歌的一些人工智能产品发布也变成了公关噩梦,暴露出明显的缺陷,比如“建议用胶水把奶酪粘到披萨上”。谷歌愿意传播可能出错的AI,意味着其早期更为谨慎的态度已经发生。这是一个明显的转变,之后表明当前技术的不成熟不会阻碍其采用:“坦率地说,我从来不相信社会可以容忍如此多的幻想,但事实就是如此,”首席运营官莉拉说。
尽管如此,谷歌仍受益于其竞争优势:只需点击一下即可让大量人使用人工智能技术。 “目前,每一款拥有 10 亿用户的 产品都已集成,”产品副总裁 Eli 表示。 “我们有9个产品,用户超过10亿。”
俗话说:“原来我们现在是谷歌的发动机室”。然而,谷歌的使命远不止于此,谷歌、谷歌、谷歌等公司都致力于实现通用人工智能(AGI)。尽管 AGI 的确切定义各不相同,但业界一致认为 AGI 涵盖的领域比目前更广泛。 20 多年前,肖恩·莱格 (Shane Legg) 建议将 AGI 作为本 (Ben) 所写的一本书的书名,从而普及了这个术语。
现在,作为首席 AGI 科学家,莱格将 AGI 定义为“在人们通常可以执行的认知任务中至少与人类能力相匹配的东西”。对于某个实体(不一定是谷歌)何时实施 AGI 留下了很大的余地,他们说,“10 年内有 50% 的机会”,同时也说,“如果更早发生,我会很高兴。” ”不会感到惊讶。”
他谦虚而友善,说话平静但很快。他一生取得了伟大的成就,最近因其与同事约翰的这项工作而被授予世界最高荣誉——诺贝尔奖。是人工智能辅助蛋白质研究的一项突破,可能会彻底改变药物发现。
尽管如此,他的职业生涯正在进入一个新的、充满挑战的阶段。多年来,他一直受到人工智能解决人类最大挑战的潜力的启发,这是他和谷歌共同的愿景,这使他能够以极大的自主权追求这一目标。但现在他必须将这一点与不断增加的压力结合起来,不断引入新技术并保持产品的相关性。成功将取决于他平衡科学理想与商业现实的能力。

我十月初去的时候,经过几天的毛毛细雨,伦敦的天空已经放晴,阳光洒进会议室。他向我解释了他如何努力确保工作场所没有硅谷特有的密不透风的氛围。
办公室很独特。它以“交流电之父”特斯拉命名和装饰,并向世界第一位程序员艾达、“人工智能之父”艾伦等科技杰出人物致敬。这并不奇怪;也有致敬哲学家、哲人的;还有一个以英国小说家玛丽命名,她最著名的作品《弗兰肯斯坦》讲述了200年前人工智能错误的故事;这里还有一家以科幻小说作家艾萨克 (isaac) 命名的咖啡馆,他于 1942 年提出了机器人三定律——第一定律是“机器人不得伤害人类,也不允许人类因不作为而受到伤害”。
他们的图书馆收藏了各种主题的纸质书籍,尤其对物理学家大卫于1997年出版的量子理论书籍《现实的结构》(The of )特别感兴趣。图书馆还拥有科技风格的艺术品,包括大堂的两个巨大的玻璃纤维多面体。根据标语,这些结构是由英美雕塑家詹姆斯创作的,目的是“赋予数值计算的抽象美以坚硬而闪亮的触感”。
他说,这种多学科的氛围反映了他多元化的兴趣,涵盖“哲学、艺术和人文学科”。 “在价值观和社会方面,我也这么认为。我觉得世界需要投资它想要的人工智能——而不仅仅是加州的一百平方英里。”
游戏是另一个重要因素。 1976 年出生于伦敦,父亲是希腊裔塞浦路斯人,母亲是新加坡人。年仅4岁时,他就在国际象棋锦标赛中击败了父亲和叔叔。 8岁时,他通过参加国际象棋锦标赛赚到了足够的钱来购买他的第一台个人电脑;后来他拥有了一台 Amiga 500,这台电脑至今仍铭刻在他的记忆中。令人印象深刻的是,他们已经从谷歌其他部门招募了一位联合创始人。
17 岁时,他开始专业开发视频游戏,其中包括一款销量数百万份的游乐园模拟器游戏。 1997年,当他从剑桥大学计算机科学专业毕业时,IBM的国际象棋计算机深蓝击败了世界冠军加里。被它迷住了。但他说,这一具有里程碑意义的时刻也是“一个奇怪的死胡同”。深蓝是所谓专家系统的一个例子,该系统是为国际象棋大师而生的,但无法接受训练来玩其他游戏,更不用说执行其他类型的工作了。
事实证明,他对人工智能的另一种方法感兴趣:神经网络。通过模仿人脑的工作方式,基于该模型构建的软件可以学习像人类一样做很多事情。该技术一直受到计算能力的限制,但相信随着超级计算机变得更加强大,神经网络可以取得长足的进步。
这家初创公司成立于2010年,非常低调,最初的网站只有一个标志,没有其他内容。在早期,该公司开发了可以玩 20 世纪 70 年代 Atari 视频游戏的软件,并不是因为世界需要计算机来玩 Atari 游戏,而是作为开发能够自行找出规则和目标的 AI 的起点。没有编码它们需要花费很大的精力。(旧的 Atari 游戏卡带仍然堆放在游戏室中。)
在破解《Space 》和《》之后,我将注意力转向了一个更大的挑战:Go。这款已有 2500 年历史的棋盘游戏非常复杂,以至于许多人认为计算机可能永远无法掌握它。 2016 年,软件击败了传奇围棋大师李世石——这是人工智能历史上比失败更伟大的时刻。第二年,出现了一个名为“零”的新版本。它可以自学成为一名更好的围棋棋手,而无需使用人类棋局数据进行训练。这是人工智能的另一项重大进步。学习的方式,但速度更快。


然而,它作为一家独立公司的短暂生命很快就结束了。谷歌于 2014 年 1 月以 4 亿至 6.5 亿美元的价格收购了这家初创公司——与目前 1,570 亿美元的估值相比,这个数字微乎其微,但在当时却是一笔不小的数目。当时,投资者对人工智能并不看好,作为一家初创公司,“筹集 1000 万美元非常困难”,他回忆道。通过共同开发人工智能,他结识了谷歌联合创始人拉里·佩奇和布林。
该公司首批员工之一、现任高级总监海伦·金 (Helen King) 表示,出售给谷歌“意味着他不必一直花时间与投资者交谈”。 “他可以专注于推动研究向前发展。”
在与李世石的比赛进行中,他的思绪转向了比游戏内容更丰富的人工智能研究。 “在我看来,下一步是走出实验室并将其应用于现实世界的问题,”他说。 “蛋白质折叠是我的首要任务。”确定蛋白质如何折叠成 3D 结构可以为药物发现和其他生物过程提供见解。技术领域提供了关键的见解,但这是一个非常艰巨的过程,在数十亿种可能性中只识别出了大约 10 个这样的结构。一位 20 世纪 90 年代的大学朋友在他的脑海中植入了人工智能可以提供帮助的可能性,当时他们在酒吧玩桌上足球时会痴迷地谈论人工智能。
一项自动化该流程的举措已启动并命名。第一个版本赢得了 2018 年两年一度的蛋白质预测竞赛,这对于生物技术和人工智能来说都是一个更加非凡的进步。这也证明了研究第一的文化可以在谷歌内部蓬勃发展。他在写完关于使用机器学习进行蛋白质预测的博士论文后加入了公司,他在 2021 年告诉我,在那里工作“就像每天参加人工智能会议一样”。
今年5月,谷歌首席执行官将在I/O开发者大会上登台。这感觉像是一个姗姗来迟的举动(当时在谷歌工作了十多年),但时机非常完美,因为他的工作很快成为公司未来的核心。
他穿着标志性的蓝色衬衫,戴着蓝框眼镜,发布了一段视频,展示了谷歌对下一代人工智能代理的实验愿景“Astra”。 Astra 由智能手机或智能眼镜提供支持并设计为在智能手机或智能眼镜上运行。
在某些方面,这感觉像是一种竞争的必然结果:如果谷歌不发明世界上最好的带眼睛的人工智能助手,其他人就会发明。类似的功能已经预览,包括可以解决手写数学问题和根据面部表情读取人们情绪的功能。即使是苹果公司,尽管对人工智能采取了谨慎的态度,但也提供了更多的相机辅助智能。
不过,他告诉我,他“深度参与”了 Astra 的开发,但他所做的不仅仅是构建一个更智能的 AI 助手。教会软件了解其周围环境也是实现AGI的关键。他说,要让计算机像人类一样思考,“你不能只生活在语言和数学的世界中。你必须了解物理世界。”
只关注通用人工智能何时到来会低估研究人员和其他研究机构已经取得的进展。例如,人工智能已经在理解多种语言方面击败了人类,这是谷歌 20 多年来一直热衷的话题。 Legg说,一名优秀的LLM“可以说100种语言,并且可以非常流利地讲30种或40种语言。据我所知,没有人能做到这一点。”某些版本的法学硕士现在提供多达 102 个会话,语言包括英语、法语和西班牙语,以及科萨语、马拉地语和乌尔都语等。

无论我们距离实现AGI有多远,我们都在推进具有巨大潜力的研究项目和机会,而这些项目和机会与谷歌的直接利润无关。 2021年,该公司成立了一家名为Labs的公司,致力于技术商业化,由科林担任首席执行官,首席商务官科林担任总裁。 Labs 目前拥有 150 名员工和独立的办公空间,专注于加速药物发现和开发,提供另一个接触现实世界的机会。
此外,研究人员正在开展其他项目来解决现实世界的挑战:使用人工智能在不到一分钟的时间内生成准确的 10 天天气预报。 GNoME 已鉴定出 220 万种新无机晶体,其中包括 38 万种稳定晶体,可用于制造从电池到太阳能电池板等各种产品。他们与洛桑联邦理工学院瑞士等离子体中心合作开发了 Torax,以帮助预测如何控制核聚变所需的高于太阳的温度。
“我们拥有世界上一些最好的融合专家、生物学家和材料科学家,”研究副总裁科利说。
这些努力的范围正是时任首席执行官拉里·佩奇九年前创建这家拥有谷歌和其他子公司的公司时所考虑的。他希望开发“登月计划”——可能会改变世界的新业务,这些业务可能需要数年时间才能孵化,并且不一定与谷歌现有的成功挂钩。
如今,其中一些项目已经失去了光彩。即使是其最著名、最有前途的项目,Waymo 的自动驾驶出租车(与其共同开发其软件),也仅在凤凰城、洛杉矶和旧金山实现了全面商业部署。但Labs无疑是一个一级项目。希望找到更多这样的项目并使它们具有商业可行性:“我们现在有了一些蓝图,”说。
在大型上市公司内部运营一个雄心勃勃的研究实验室的想法并不新鲜。了解贝尔实验室和施乐帕洛阿尔托研究中心这两个最著名的实验室的历史。 “这就是我的全部灵感——他们的黄金时代、他们的全盛时期——这就是我想要创造的,”他说。
即使经过深思熟虑和谷歌规模的资源,也没有什么是万无一失的。技术分析师埃文斯指出,尽管 AT&T 与贝尔实验室取得了成功——发明了激光器、晶体管、光伏电池等——“但建立一个通用的创新实验室并推出产品却很困难。”尽管施乐帕洛阿尔托研究中心是 20 世纪 70 年代现代计算许多元素的诞生地,但它之所以出名,部分原因是施乐未能充分利用它们。
尽管如此,实验室已经过了概念验证阶段。今年 1 月,该公司宣布与制药巨头礼来公司 (Eli Lilly) 和礼来公司 (Eli Lilly) 建立战略合作伙伴关系,据称这将为其帮助开发的药物带来近 30 亿美元的预付款和可能的特许权使用费。以前也是这样。
对于 来说,30 亿美元根本不算什么。该公司2023年的收入将为3070亿美元,主要来自广告。这笔资金无法满足该公司的近期需求:将突破性的人工智能功能注入其现有的、无处不在的软件产品中。然而,预测是有希望的。

“人工智能还有什么比治疗可怕的疾病更好的用途呢?”他问道。 “但我认为,最终它也将非常有价值。我认为这并不矛盾。”
一款为作家和研究人员提供的人工智能增强型笔记工具似乎最不可能在网上获得 15 分钟的名气。但在 9 月底,谷歌通过音频概览(去年推出的免费网络应用程序的一项新功能)吸引了 、X 和 Play 上的用户。向其提供参考资料(例如 PDF 和网页),它会使用它在两个合成主机之间就任何主题创建类似播客的对话。他们的对话听起来如此自然——充满了“嗯”、“啊”、笑话和离题——以至于毫无戒心的听众可能会误认为这是由真人主演的一些晦涩难懂的节目。
他看起来有点兴奋,因为他对病毒般的喜爱感到高兴(这与谷歌早期人工智能的一些失误形成鲜明对比),他说他对人们的反应感到高兴,有些人称之为“时刻”。 “在科学领域,你发表一篇论文,得到审稿人,然后你会看到引用,诸如此类的事情,”他说,这“在某些方面更直观,也非常令人兴奋。”
然而,并不是所有人都对科技行业急于开发日益强大的法学硕士、使基于法学硕士的产品广泛使用以及更接近通用人工智能感到兴奋。谷歌内部一直存在紧张关系,被称为“人工智能教父”的 Brain 领导人之一在成立后不久就辞职就证明了这一点。他说,他离开是为了更自由地谈论未来的危险。

未来生命研究所执行董事表示,谷歌最近推出的功能表明“他们被迫与LLM竞争,因为一旦大门打开,每个人都必须这样做。”该非营利组织将于 2023 年 3 月成立。3 月份发布了一封公开信,呼吁暂停法学硕士项目六个月的发展,并已得到超过 33,000 人的签名。 “我认为这有点不幸,因为我真的很喜欢设计人工智能来解决我们实际遇到的问题的目标。”
尽管谷歌和其他人工智能公司一样没有理会暂停研究的呼吁,但这封信确实引发了关于通用人工智能潜在存在风险的更坦率的讨论。今年 5 月,Legg、首席执行官 Sam、联合创始人达里奥和微软 CTO Kevin Scott 签署了一封令人震惊的 23 字公开信:“减轻人工智能灭绝的风险应该成为全球优先事项。其他社会规模的风险,例如比如流行病和核战争。”
他强调,他并不认为可怕的情况是不可避免的;控制 AGI 可能比某些人担心的要简单。但他解释说,通过签署这封信,他打算发表一个声明。 “我想确保谈论这些事情的人受到另一群人的保护,他们说,‘这里没什么可看的,一切都会好起来的——这只是正常的技术,’”他说。
负责任地部署人工智能可能最近才成为头条新闻,但从其早期就已广为人知:“当我采访 Legg 时,他谈到了智能和安全的重要性,”现任负责早期招聘的高级主管 King 表示。 2018年,随着公司的重点从游戏人工智能转向具有更大潜在影响的工作,拥有一支专门从事这项工作的团队将至关重要。

她负责组建该委员会,此前曾在英特尔和其他公司工作多年,最近担任首席运营官。起初,“我们实际上将其称为‘稍后命名的委员会’,因为我们不想暗示风险很高,”她回忆道。 “我们的目标是建立一种一致的文化,但可以指导和解决其中一些问题。”
随着时间的推移,CTBNL 的正式名称变成了“安全与责任委员会”。该委员会由来自公司各个部门的领导组成,为正在进行的项目提供反馈,重点是在潜在问题实际出现之前识别它们。 “早期参与是参与并真正帮助塑造和影响工作的最佳方式,”负责任发展总监 Dawn 说。
这种对人工智能安全的预期方法并没有阻止谷歌发布具有明显缺陷的功能,例如那些搜索人工智能概述的功能,这些功能无法理解人类何时在开玩笑,而不是提供有用的建议。 King 表示:“通过我们所做的所有测试,我们永远不会覆盖世界上每个人可能尝试的所有内容,因为人类是有创造力的。”他指出,在某些情况下,问题可能更多地与特定于产品的实现有关。而不是提供给其他 团队的核心技术。 “每次我们看到安全问题时,它对我们都很有用,因为这样我们就可以推动模型开发的变化。”
谷歌不得不为用户发现的故障道歉,强调其在 2020 年后时代推出新功能的紧迫性。根据《泰晤士报》乔恩四月份发表的一篇文章,我对人们越来越重视将人工智能快速商业化以造福大众感到不安,这导致了与 Brain 的合并。
最初,“我有点担心我们的研究路线图会受到损害,”他向我承认。但随着时间的推移,他认为整合谷歌人工智能专业知识和技术堆栈的好处变得更加明显:“我们是一家以研究为主导的公司。我们仍然是一个以研究为主导的部门。这与我们对世界的影响完全互补”。 Astra 项目就是一个例子,10 月份, 进行了重组,让专人负责应用程序,从而缩小了产品与其基础 LLM 之间的差距。
在其伦敦总部,走廊墙壁上贴满了海报,纪念该公司研究人员在2018年和2018年等科学期刊上发表的每一篇论文。它似乎并没有屈服于短期竞争压力。 “他一直坚持的一件事,我完全同意他的观点,那就是我们应该使用科学的方法来完成所有这些工作,”詹姆斯说。詹姆斯自谷歌成立以来就认识谷歌,并于 2022 年加入谷歌担任高级副总裁。总裁,专注于技术与社会的融合。 “我们应该做实验,我们应该严谨,我们应该发表论文。”
这就是“部分”——关注它是保护它的第一步。
原文链接:
本文来自微信公众号“学术头条”,作者:Harry;编译:阮文云,36氪授权发布。


