有人惊呼,AI工程师正在跨越国界“征服城市和领土”,进入科学研究领域。也有人评价:对于AI来说,这只是一个开始。与其将2024年诺贝尔化学奖颁给AI工程师或人工智能,还不如颁给蛋白质的三维结构。这是除了DNA遗传密码之外的另一种生命密码。
没有蛋白质,生命就不可能存在。蛋白质作为化学工具的惊人多功能性体现在生命的巨大多样性上。
结构决定功能。面对复杂蛋白质结构的预测,过去耗时数年的工作使用了2024年诺贝尔化学奖获得者德米斯·哈萨比斯(Demis)和约翰·M.(John M.)开发的人工智能。智能工具现在只需几分钟即可完成。
除了根据氨基酸序列预测蛋白质的结构——从线性序列可以预测其折叠三维结构——在AI模型的帮助下,人们在深入了解上述内容后,获得了更大的想象空间。蛋白质结构代码 - 创造具有新功能的蛋白质。这可能会带来新的纳米材料、靶向药物、更快的疫苗开发、最小的传感器和更绿色的化学工业。它还让我们更好地了解生命是如何运作的,包括为什么会出现一些疾病、如何产生抗生素耐药性,或者为什么一些微生物可以分解塑料。

据诺贝尔奖官网消息,今年三位诺贝尔化学奖获得者破解了蛋白质惊人结构的密码。
蛋白质结构:多次获得诺贝尔奖的领域
自 19 世纪起,化学家就知道蛋白质对生命过程很重要。但直到 20 世纪 50 年代,化学工具才足够精确,研究人员开始更详细地探索蛋白质。
剑桥大学研究人员 John 和 Max 在 20 世纪 90 年代末取得了突破性发现,他们成功地使用 X 射线晶体学方法展示了第一个蛋白质 3D 模型。为了表彰这一发现,他们于 1962 年获得了诺贝尔化学奖。
然后,研究人员主要使用 X 射线晶体学,成功地“拍摄”了大约 200,000 种不同蛋白质的图像,这通常需要付出巨大的努力。这为2024年诺贝尔化学奖奠定了基础。
美国科学家克里斯蒂安·安芬森 ( ) 使用各种化学技巧成功地使现有蛋白质展开然后折叠起来。有趣的观察是蛋白质每次都呈现完全相同的形状。
1961年,他得出结论:蛋白质的三维结构完全由蛋白质中的氨基酸序列决定。这为他赢得了 1972 年诺贝尔化学奖。
人们开始假设,如果化学家知道蛋白质的氨基酸序列,他们应该能够预测其三维结构。这是一个令人兴奋的想法。如果他们成功了,他们将不再需要使用精密的 X 射线晶体学,并节省大量时间。
为了鼓励该领域更快的发展,研究人员于 1994 年启动了一个名为“蛋白质结构预测批判性评估”(CASP) 的项目,该项目后来演变为一项竞赛。
但人们发现预测蛋白质的结构非常困难。研究人员在竞赛中预测的结构与实际结构之间的一致性几乎没有改善。直到 2018 年,国际象棋特级大师、神经科学专家和人工智能先驱 Demis 进入该领域,才取得了突破。
纸牌游戏高手参加蛋白质结构预测“奥林匹克”竞赛

达米斯·哈萨比斯 (Damis ) 1976 年出生于英国伦敦,2009 年获得伦敦大学学院博士学位,现任谷歌首席执行官。
德米斯·哈萨比斯(Demis )年轻时就表现出了非凡的国际象棋天赋,后来成为一名成功的游戏开发者和人工智能专家。
他 4 岁开始下棋,13 岁达到大师水平。十几岁时,他开始了程序员和成功的游戏开发人员的职业生涯。他开始探索人工智能并涉足神经科学,为人工智能开发更好的神经网络。
2010年,他与他人共同创立了AI公司,这是一家专注于开发复杂人工智能模型的公司,并于2014年将公司出售给谷歌。2016年,他开发的人工智能击败了围棋世界冠军,震惊了世界。
然而,哈萨比斯并不想局限于棋盘游戏。他希望人工智能技术能够解决对人类更重要的问题。 2018年,他带领团队开始研究蛋白质结构预测。
当项目遇到瓶颈时,John Jope的加入成为关键的助推器。
约翰·乔普 (John Jope) 1985 年出生于美国阿肯色州小石城,2017 年获得芝加哥大学博士学位,现任谷歌高级研究科学家。

乔普拥有物理学和蛋白质动力学背景,以其对人工智能的独特见解为该项目注入了新的活力。他与哈萨比斯联手彻底改进了AI模型。
此前,约翰·乔普对宇宙的迷恋促使他学习物理和数学。
2008 年,当他开始在一家使用超级计算机模拟蛋白质及其动力学的公司工作时,他意识到物理知识可以帮助解决医学问题。
2011年,乔普开始攻读理论物理学博士学位,并对蛋白质产生了新的兴趣。
2017年,他刚刚完成博士学位,就听到谷歌已经秘密开始预测蛋白质结构的传言。他向他们发送了一份工作申请。他在蛋白质模拟方面的经验意味着他对如何改进它们有创造性的想法。
新版本的创新基于乔普对蛋白质的理解。
全新人工智能架构为第14届CASP大赛及时交出好成绩。 2020年,当CASP组织者评估结果时,他们明白生物化学的50年挑战已经结束。在大多数情况下,其性能几乎与 X 射线晶体学一样好,这是令人震惊的。 CASP 创始人之一 John Moult 在 2020 年 12 月 4 日结束比赛时问道:“现在怎么办?”

当 Demis 和 John Jope 确认它确实有效后,他们计算了所有人类蛋白质的结构。然后,他们预测了研究人员在绘制地球生命地图时迄今为止发现的几乎所有蛋白质(2 亿种蛋白质)的结构。
谷歌还公开了该代码,以便任何人都可以访问它。人工智能模型已成为研究人员的金矿。截至 2024 年 10 月,已有来自约 190 个国家的超过 200 万人使用它。
药物、疫苗和传感器:设计一种具有从未存在过的全新结构的蛋白质
另一位诺贝尔化学奖得主、华盛顿大学教授大卫·贝克也研究蛋白质。在软件的帮助下,他设计了自然界中不存在的具有新的特殊结构的蛋白质。
大卫·贝克(David Baker)1962年出生于美国华盛顿州西雅图,师从兰迪·谢克曼(2013年诺贝尔生理学或医学奖获得者),1989年毕业于加州大学伯克利分校,获得生物化学博士学位。他目前是华盛顿大学生物化学教授和华盛顿大学医学院蛋白质设计研究所所长。
蛋白质通常由20种不同的氨基酸组成,可以说是生命的基石。
天然蛋白质的范围是有限的。为了增加获得具有全新功能的蛋白质的可能性,贝克的研究小组希望从头开始创造它们。

20 世纪 90 年代末,David Baker 开始开发可以预测蛋白质结构的计算机软件: ()。
贝克说:“如果你想建造一架飞机,你不是从改造一只鸟开始;相反,你要了解空气动力学的基本原理,并根据这些原理建造一架飞行器。”
构建全新蛋白质的领域称为“从头”。研究小组绘制了一种具有全新结构的蛋白质,然后要求 计算哪些氨基酸序列可以产生所需的蛋白质。
为此, 搜索所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。然后对这些片段进行优化并给出单一结果——氨基酸序列。
为了研究该软件的可靠性,贝克的团队将基因引入细菌中,以产生所需蛋白质的氨基酸序列。然后他们使用 X 射线晶体学来确定蛋白质的结构。
事实证明,罗塞塔实际上可以制造蛋白质。研究人员开发的蛋白质Top7与他们设计的结构几乎相同。
对于从事蛋白质设计的研究人员来说,Top7蛋白质是晴天霹雳。由于以前创造新蛋白质的人只能模仿现有的结构,因此Top7的独特结构在自然界中并不存在。
2003 年,大卫·贝克 (David Baker) 成功设计了一种新的蛋白质,这种蛋白质不同于任何其他使用氨基酸“构建模块”的蛋白质。从那时起,他的研究小组不断创造出一种又一种富有想象力的蛋白质,包括可用作药物、疫苗、纳米材料和微型传感器的蛋白质。
诺贝尔化学奖委员会主席海纳·林克表示:“今年公认的一项发现与神奇蛋白质的构建有关。另一项发现与实现 50 年前的梦想有关:根据氨基酸预测蛋白质这两项发现开启了巨大的可能性。”


