化学界“AlphaGo”问世:基于1000多万个化学反应,加速合成人类所需的化合物

科学
化学界“AlphaGo”问世:基于1000多万个化学反应,加速合成人类所需的化合物
麻省理工科技评论 2018年4月11日

2018年4月11日

如今,科学家们已经构建出了化学界的“Alphago”:科学家们在《Nature》上发文证明,AI能够以前所未有的速率进行逆向合成反应。
科学
如今,科学家们已经构建出了化学界的“Alphago”:科学家们在《Nature》上发文证明,AI能够以前所未有的速率进行逆向合成反应。

人工智能带来的革命仍在继续:从沃森(Waston)机器人不到10分钟诊断出白血病,到AlphaGo击败世界排名第一的围棋选手;从战场到太空,随处都可见其身影。其实,AI也早已渗透进科研领域,成为科学家进行学术研究的新手段。现在,科学家们已经构建出了化学界的“Alphago”:科学家们在《Nature》上发文证明,AI能够以前所未有的速率进行逆向合成分析。

15234369056464df7d2eaba.jpg

在化学研究中,由简单的原料开始合成一个复杂化合物是非常困难的。而逆向合成则是设计化合物生产的标准方法,即化学家们通过逆向思维,从想要制造的化合物分子开始,然后分析可以通过哪些容易得到的试剂和反应序列来合成它,这种方法被广泛用于制造药物和其他产品。

逆合成分析法于20世纪60年代由哈佛大学教授E. J. Corey提出。Corey教授因发现这一方法,获得了1990年的诺贝尔化学奖。过去,科学家们一直使用计算机辅助有机合成的方式,来完成逆合成分析过程。尽管这种方法可以提高合成效率,然而传统的计算机辅助方式合成速度仍然较慢,且提供的分子质量参差不齐。人类还是需要手动搜索化学反应数据库,来找到制造分子的最佳方法。而 Segler团队开发的新AI工具则使这一过程大大缩短。在未来,人类发现新药或者其他产品的速度将有望达到全新水平。


化学反应也如同下棋

其实,化合物的产生和下棋也有异曲同工之妙。相关的化合物可以被分解成基本组成成分,这些成分便是“棋子”,而计算机程序为这些“棋子”提供不同的路径,然后再在实验室中将它们合成。当然,理论上来看这似乎是很容易的事情,但在实践中却遇到了困难。Segler说:“化学领域比围棋界有更多的可能性,问题也要复杂得多。”

152343690548053dc5a84f6.jpg

图丨和两种传统合成方法相比(红色和绿色),使用新型人工智能算法(蓝色)在较短时限内可以完成更多分子的合成路线预测。

而在最新的研究中,新的AI工具通过深度学习神经网络来学习所有已知的单步有机化学反应——大约1240万个。这使它能够预测在任何单一步骤中可以使用的化学反应。AI工具重复应用这些神经网络来规划多步骤合成,解构所需的分子,直到最终得到可用的试剂。这项工作得到了德国研究基金会的资助。

15234369055493cc0b0f044.jpg

图 | 逆合成分析法示意图

Segler说:“逆向合成是有机化学中的终极学科,一名化学家需要数年的学习才能掌握它——这像下棋一样,除了要学习专业知识外,还需要敏锐的直觉和极强创造力。我们所展示出的是:计算机本身就可以从现有的文献中学习种种规则及这些规则的应用。”目前,许多来自不同学科的研究人员正在着手研究将深度神经网络与蒙特卡洛搜索树相结合。蒙特卡洛搜索树是一种用来评估游戏中移动情况的方法。每走一步,计算机会模拟无数种可能发生的情况,比如如何使象棋游戏结束,计算机会选择最佳方式去走。

类似地,机器也可以使用这种深度神经网络,来寻找化学合成中的最佳方式。信息系统专家兼该项研究作者Mike Preuss则用一句话总结了这次的化学界“Alphago”的成功秘诀:“深度神经网络用于预测哪些分子会参加反应。蒙特卡洛搜索树来预测反应的可能性”。具体而言,该团队开发的AI算法拥有一个包含1200万个已知反应的数据库,其深层的神经网络程序可以从1200万个已知反应中不断学习,而不是在硬性规则中进行编程。而数据库提供的数据越多,算法可以探索的化学途径就越多,预测合成路线的准确度也就越高。

这个算法还运用了类似于AlphaGo的蒙特卡罗树搜索,可将目标分解成数千个可能的节点,在每一步化学反应后评估最有可能成功的下一步,并进一步探索这个“分支”。在一次测试中,Waller的小组使用该算法尝试绘制治疗阿尔茨海默病的某种药物中间体的六步合成路线。结果算法在5.4秒内就计算出了与文献反应相同的途径。正如Segler说,“人们认为,像教计算机下国际象棋一样,将大量规则输入计算机,就能够实现想要的效果。但这并不奏效——化学是非常复杂的,它不能仅用简单的规则去理解。事实告诉我们,有新反应的出版物数量每十年就会翻一番。化学家和程序员都无法跟上这种变化。我们需要AI的帮助。”


药物合成领域的里程碑

那么,这次的化学界“Alphago”究竟本事如何呢?在一项双盲AB测试中,Muenster 的研究人员发现,AI生成的合成路线丝毫不逊于经过测试生成的的合成路线。Segler和他的团队为了测试新AI工具所产生的途径是否能被有经验的化学家分辨出来,向来自中国和德国的两个研究所的45位有机化学家展示了9个分子的两种潜在合成路线:一种由AI合成的途径,另一种途径是由人类设计的。结果,有机化学家们并不能区分出来。

Segler说,“我们希望化学家能通过我们的方法,使用更少的资源,进行更少的实验,生产出能够提高我们的生活水平的物质。”事实上,自20世纪60年代以来,研究人员一直在试图利用计算机能力规划有机化学合成,但收效甚微。那个时候,有机化学实验室看上去还像是炼金术的天堂:成排的试剂瓶,老旧的木制试管,以及俯在案边忙碌的化学家。经过50年的快速发展,实验室场景在改变,不过,科研人员工作的本质没变,有机化学家仍需要不断描绘所需要的反应顺序,然后试着遵循这一顺序用手煞费苦心地进行操作。而随着人工智能技术的发展,人们开始试图将机器和人工智能整合至科研进程中,通过创造能自动合成有机分子的设备,将化学家们解放出来。

尽管这次的成果并不是第一次在药物合成中运用AI工具,但是,化学家们仍将这一发展视为药物合成领域的一个里程碑,这不仅是因为它可以加速药物发现过程,也是因为它是目前使用AI来标记潜在反应路线的最有效程序之一。2018年3月,韩国Ulsan国立科学技术研究院的化学家Grzybowski报告说,他已经在实验室测试了新AI工具算法建议的8条化学反应途径,并且都成功了。值得一提的是,Segler团队的新AI工具的工作原理有别于Grzybowski及其团队此前发明的加速化学合成的Chematica(它需要人将有机化学规则输入到该系统中供程序使用),因为它只从数据中学习,不需要人类输入规则。

瑞典计算化学家Ola Engkvist对这项工作印象深刻。他说:“提高合成化学的成功率,对药物研发项目的速度和效率以及降低成本都有巨大的好处。”Segler也透露,这个AI工具已经引起了几家制药公司的兴趣,但他并不认为有机化学家会因此失业。“AI将成为化学家的助手,”他打了一个比方,“GPS导航设备可能会使纸质地图变得多余,但不是使汽车驾驶员变得多余。”“在过去的60年里,科学家们一直试图通过人工编码的方式,将合成规则指定给计算机,”Waller博士在论文中写道:“和传统方法不同的是,我们使用了具备规划能力、符号象征能力及自动化学习能力的强大算法,这对于计算机能否在化学合成中发挥辅助作用至关重要。而这一技术也为满足人类在农业、医疗及材料科学等领域的需求奠定了坚实的基础。”

麻省理工科技评论

From Tech to Deeptech