Ingenious AI Solution to Protein Puzzle 获得诺贝尔化学奖
这2024 年诺贝尔化学奖认可德米斯·哈萨比斯,约翰·普普尔和大卫·贝克用于机器学习为了应对生物学的最大挑战之一:预测蛋白质的 3D 形状并从头开始设计它们。
今年的奖项之所以脱颖而出,是因为它表彰了源自一家科技公司的研究:DeepMind,这是一家人工智能研究初创公司,后来被2014 年的 Google.以前的大多数诺贝尔化学奖都颁发给了学术界的研究人员。
许多获奖者继续成立初创公司,以进一步扩大和商业化他们的开创性工作——例如,CRISPR 基因编辑技术和量子点——但研究从头到尾都不是在商业领域完成的。
尽管诺贝尔物理学奖和化学奖是单独颁发的,但 2024 年这两个领域的获奖研究之间存在着迷人的联系。
物理学奖去了两位计算机科学家谁为机器学习奠定了基础,而化学奖获得者则因使用机器学习来解决生物学最大的谜团之一:蛋白质如何折叠而获得奖励。
2024 年诺贝尔奖强调了这种人工智能以及今天的科学如何经常跨越传统界限,融合不同的领域以取得突破性的成果。
蛋白质折叠的挑战
蛋白质是生命的分子机器。它们构成了我们身体的很大一部分,包括肌肉、酶、激素、血液、头发和软骨。
了解蛋白质的结构至关重要,因为它们的形状决定了它们的功能。
回到 1972 年,克里斯蒂安·安芬森 (Christian Anfinsen) 获得诺贝尔奖在化学中,用于显示蛋白质的氨基酸构建块的序列决定蛋白质的形状,这反过来又会影响其功能。如果蛋白质折叠不正确,它可能无法正常工作,并可能导致以下疾病阿尔茨海默病,囊肿性纤维化或糖尿病.
蛋白质的整体形状取决于构成它的氨基酸中所有原子之间的微小相互作用、吸引力和排斥力。有些人想在一起,有些人不想。蛋白质根据数千次这些化学相互作用将自身扭曲和折叠成最终形状。
几十年来,生物学面临的最大挑战之一是仅根据蛋白质的氨基酸序列来预测蛋白质的形状。
尽管研究人员现在可以预测形状,但我们仍然不了解蛋白质是如何在几微秒内操纵成它们的特定形状并最大限度地减少所有原子间相互作用的排斥的。
为了了解蛋白质的工作原理并防止错误折叠,科学家们需要一种方法来预测蛋白质的折叠方式,但解决这个难题并非易事。
2003 年,华盛顿大学生物化学家大卫·贝克写罗塞塔,一种用于设计蛋白质的计算机程序。他证明,通过这种方法,可以通过以下方式逆转蛋白质折叠问题设计蛋白质形状,然后预测创建它所需的氨基酸序列。
这是一个惊人的飞跃,但为计算选择的形状很简单,计算也很复杂。需要进行重大的范式转变,以常规设计具有所需结构的新型蛋白质。
机器学习的新时代
机器学习是一种人工智能,计算机通过分析大量数据来学习解决问题。它已应用于各个领域,从玩游戏和语音识别自自动驾驶汽车和科研.
机器学习背后的理念是使用数据中的隐藏模式来回答复杂的问题。
这种方法在 2010 年取得了巨大的飞跃,当时 Demis Hassabis 与他人共同创立深度思维,这是一家旨在将神经科学与 AI 相结合以解决现实世界问题的公司。
哈萨比斯 4 岁时就成为了国际象棋神童,他很快就成为头条新闻阿尔法零,一个自学下棋的 AI。2017 年,AlphaZero 彻底击败了世界顶级的计算机国际象棋程序 Stockfish-8。
AI 能够从自己的游戏玩法中学习,而不是依赖预先编程的策略,这标志着 AI 世界的一个转折点。
不久之后,DeepMind 将类似的技术应用于围棋,围棋是一种古老的棋盘游戏,以其巨大的复杂性而闻名。2016 年,其 AI 程序AlphaGo 系列击败了世界顶级球员之一李世石广泛观看的比赛让数百万人震惊.
2016 年,Hassabis 将 DeepMind 的重点转移到一个新的挑战上:蛋白质折叠问题。在约翰·普普尔是一位具有蛋白质科学背景的化学家,AlphaFold 项目开始了。
该团队使用一个由实验确定的蛋白质结构的大型数据库来训练 AI,这使其能够学习蛋白质折叠的原理。
结果是AlphaFold2 阿尔法折叠,这是一种可以从蛋白质的氨基酸序列中以非常准确度预测蛋白质的 3D 结构的 AI 。
这是一项重大的科学突破。此后,AlphaFold 已经预测了超过 2 亿种蛋白质的结构——基本上是科学家迄今为止测序的所有蛋白质。这庞大的蛋白质结构数据库现已免费提供,加速了生物学、医学和药物开发方面的研究。
对抗疾病的设计师蛋白
了解蛋白质如何折叠和功能对于设计新药至关重要。酶是一种蛋白质,在生化反应中充当催化剂,可以加速或调节这些过程。
治疗癌症或糖尿病,研究人员通常靶向参与疾病通路的特定酶。通过预测蛋白质的形状,科学家可以弄清楚小分子(潜在的候选药物)可能与它结合的位置,这是第一步设计新药.
2024 年,DeepMind 上线AlphaFold 阿尔法折叠3,是 AlphaFold 程序的升级版本,不仅可以预测蛋白质形状,还可以识别小分子的潜在结合位点。这一进步使研究人员更容易设计出精确靶向正确蛋白质的药物。
谷歌收购了 Deepmind据报道2014 年为五亿美元.Google DeepMind 现在开始了一项新的冒险,同构实验室,使用这些 AlphaFold3 预测与制药公司合作进行实际药物开发。
就 David Baker 而言,他继续为蛋白质科学做出重大贡献。他在华盛顿大学的团队开发了一种基于 AI 的方法,称为”全家幻觉“,他们用它来从头开始设计全新的蛋白质。
幻觉是新的模式——在本例中是蛋白质——是合理的,这意味着它们与 AI 训练数据中的模式非常吻合。
这些新蛋白质包括一种发光酶,表明机器学习可以帮助创造新型合成蛋白质。这些 AI 工具提供了设计功能性酶和其他蛋白质的新方法,这些酶和其他蛋白质永远不可能自然进化。
AI 将开启研究的新篇章
Hassabis、Jumper 和 Baker 获得诺贝尔奖的成就表明,机器学习不仅仅是计算机科学家的工具,它现在是生物学和医学未来的重要组成部分。
通过解决生物学中最棘手的问题之一,2024 年获奖者为药物发现、个性化医疗甚至我们对生命本身化学的理解开辟了新的可能性。
马克·季默, 化学教授,Connecticut College