预存
    Document
    当前位置:文库百科文章详情
    当机器学习来到材料与化学中时,会发生什么?
    来源:测试GO 时间:2021-10-22 17:41:08 浏览:4927次

    引言

    未来,基础科研领域的发展将构筑于数据与人工智能的基础之上。对此,我们应该抓住AI时代的发展契机,积极构建基础科研数据库,高效利用人工智能技术,抢占技术创新高地,实现材料、化学、物理等基础科研领域的大发展。

    往期课程回放:

    2016年,谷歌AlphaGo的横空出世,将世人的焦点吸引到了人工智能领域。短短两年时间,人工智能技术在商业领域获得了空前的成功。语音识别、图像识别、无人驾驶、智慧金融等领域,无一不在影响着人们的生活。但不为大众所关注的是,人工智能技术在科研领域也掀起了巨大的“波澜”。

    2018年7月,《Nature》期刊上发表的一篇题为“分子和材料研究用的机器学习”的文章,对人工智能技术在材料、化学中的作用进行了综述。文章认为,计算化学/材料学的研究流程已经更迭至第三代。第一代是“结构-性能”计算,主要利用局部优化算法从结构预测出性能;第二代为“晶体结构预测”,主要利用全局优化算法从元素组成预测出结构与性能;第三代为“统计驱动的设计”,主要利用机器学习算法从物理、化学数据预测出元素组成、结构和性能。

    同年,英国格拉斯哥大学研究人员采用机器学习算法,开发出可预测化学反应的有机化学合成机器人。在学习了100种(10%)化学反应后,该智能机器人能够以80%的准确度预测出其他化学反应,并且还能够预测出人类未知的新型化学反应。

    事实上,材料、化学、物理等基础科研领域的研究过程中都充满了“大数据”,从设计、实验、测试到证明等环节,科学家们都离不开数据的搜集、选择和分析。机器学习(Machine LearningML)作为一门多领域交叉学科,涉及概率论、统计学、凸分析、算法复杂度理论等多门学科,擅长在海量数据中寻找隐藏的因果关系,可用于解决基础科研中的种种问题,因此得到了科研工作者的广泛关注。

    那么,当机器学习来到材料与化学中时,到底会触碰出什么样的火花呢?

    有鉴于此,笔者一览国内外顶级期刊上近期涉及机器学习的相关研究,介绍解读了其中部分有关材料及化学的最新研究成果,希望能带领大家走进这个领域,并给相关科研工作者带来一丝启发。

    最新研究成果

    1、Science Advances:利用机器学习对不同纳米多孔材料进行指纹识别以获得最佳储氢条件

    随着电动汽车的快速发展,氢燃料电池正凸显出越来越重要的作用。市场上已经出现了部分氢燃料电池汽车,但这些汽车储存的氢气压缩压力高达700 bar,一旦发生交通事故极易造成氢气泄漏甚至产生爆炸。研究表明,通过向汽车燃料箱加注吸附储氢材料能够有效解决以上问题。

    截止目前,科学家们已经探索了多种类型的纳米多孔材料(NPMs),包括沸石、碳基材料和金属有机框架(MOFs)等用于吸附储氢。高通量分子模拟一直是筛选纳米多孔材料是否具有吸附特性的主要方法,即通过模拟来计算材料特性。为了降低高通量筛选过程的计算成本,机器学习算法逐渐开始被用于根据NPMs的结构信息预测吸附特性。

    有鉴于此,美国明尼苏达大学的Siepmann[1]报道了一种机器学习方法,用于在单个机器学习模型中预测不同NPMs的气体吸附与温度及压力的函数关系。作者使用从沸石、金属有机骨架和超交联聚合物的高通量模拟中获得的数据,开发了一种机器学习模型,该模型可以同时预测多种材料在不同的压力和温度范围内的吸附载荷,并且能够在给定的压差下确定具有最高工作容量的最佳储氢温度。

    此外,作者还利用机器学习为每个NPMs进行了指纹编码,用于区分其吸附行为。最后,作者发现机器学习对阳离子交换沸石给出的预测最佳温度和储氢容量与实验结果非常吻合。本文的方法和结果为储氢材料的设计提供了新的指导方针,并进一步拓展了机器学习在高通量材料研发领域的可能性。

    图1 用于预测NPMs中气体吸附荷载的机器学习模型

    2、Nature贝叶斯反应优化作为化学合成的工具

    无论是在开发救生药物中,还是在研制新材料时,优化合成反应对于化学研究都至关重要。但是,反应优化需要反复进行实验,平衡众多耦合变量之间的相互冲突,如反应底物、催化剂、试剂、添加剂、溶剂、浓度、温度和反应器类型,并且经常涉及在成千上万种可能的实验条件中寻找最佳条件。

    然而,由于时间、成本和材料的限制,在标准的优化反应中,化学研究人员只能评估这些条件的一小部分。有经验的化学家也只能通过搜寻文献中相似的化学反应并根据经验、机理理解和经验数据等进行简单的推测,只能将最有影响力的反应参数进行实验。贝叶斯优化作为一种基于迭代响应面的全局优化算法,在机器学习模型中表现出卓越的性能,目前在化学反应中已逐渐开始崭露头角, 但关于其在合成化学中用于反应优化的应用和评估依然鲜有报道。

    有鉴于此,普林斯顿大学Doyle[2]报道了贝叶斯反应优化框架和开放源代码软件工具的开发情况,该工具可让化学家轻松的将最新的优化算法集成到他们的日常实验中作者收集了钯催化直接芳基化反应的大型基准数据集,对反应优化中的人为决策进行了贝叶斯优化,并将贝叶斯优化应用于光延反应和脱氧氟化反应的优化工作中。

    结果表明,贝叶斯优化在平均优化效率(实验数量)和一致性(结果与初始可用数据的差异)方面均优于人类决策。这项工作表明,在日常实验中采用贝叶斯优化方法,可以对实验条件进行更明智及数据化的分析处理,从而促进功能化学品的有效合成。

    图2 贝叶斯优化机制

    3、JACS:利用机器学习发现并优化制备铜催化剂所需的添加剂

    通过电化学反应将CO2还原成化学品是碳资源循环利用的重要方式。铜基催化剂可以将CO电化学还原得到一系列产物,包括C1(CO,HCOOH,CH4,CH3OH)和C2+(C2H4,C2H6,C2H5OH,C3H7OH)。催化剂制备中的添加剂能调控CO2还原的选择性。通过机器学习进行有效的数据分析,可以加速发现和优化潜在的新催化剂。

    有鉴于此,厦门大学汪骋教授课题组[3]报道了在制备用于电化学CO2还原(CO2RR)的铜(Cu)催化剂过程中,利用机器学习发现和优化添加剂的过程。该过程包括三个迭代循环:“实验测试——机器学习分析——预测和重新设计”。作者以铜盐为原料,利用电化学沉积法制备铜催化剂,并且加入不同的金属盐和有机分子作为添加剂。经过三次反复的实验测试、机器学习分析、预测和重新设计,确定了锡(Sn)盐是获得CO和HCOOH的重要添加剂,脂肪醇是促进C2+生成的重要添加剂。通过对不同添加剂制备催化剂表征发现,脂肪醇可能在电沉积过程中促进Cu2O立方体的形成。

    在实验条件下,Cu2O立方体被还原为金属Cu,对C2+产物具有高选择性,与文献报道的氧化物衍生铜(OD-Cu)的性能一致。经过数次机器学习循环后,作者获得了对CO、HCOOH和C2+产物具有选择性的催化剂。

    这一工作凸显了机器学习通过从有限数量的实验数据中有效提取信息来加速材料开发的潜力。虽然只研究了约300个不同催化剂,但机器学习对数据的高效分析几乎复现了近年来铜基催化剂研究的所有主要结论,意义重大。

    图3 Cu基电催化剂的制备及三个迭代循环过程

    4、ACS Catalysis:机器学习辅助催化剂优化

    近年来,将CO2作为C1源应用于化工生产引起了学术界和工业界的广泛关注。然而,将CO2直接转化为芳烃需要苛刻的反应条件,通常需要的温度高于300℃。其中,利用CO2和H2作为甲基化剂是一种实现CO2更高平衡转化率的策略。但是关于使用CO2/H2作为甲基化剂进行C-甲基化的研究却鲜有报道,因此迫切需要开发一种在温和条件下将普通芳香族化合物进行甲基化的催化剂体系以有效地将其转化为具有更高附加值的化学产品。

    有鉴于此,日本北海道大学Toyao[4]报道了一种TiO2负载Re(Re/TiO2;Re=1 wt%)和H-β(SiO2/Al2O3=40)的组合催化剂,利用CO2和H2作为甲基化剂,对芳香烃进行了催化甲基化反应。通过对间二甲苯进行催化甲基化反应,该催化剂组合物显示出优异的合成甲基苯性能,从而使总甲基化产物的收率很高(以CO2和间二甲苯为基础计算,分别为10%和57%)。在作者设定的反应条件下,该催化剂在气相中产生的副产物相对较少。同时,该催化剂在甲苯甲基化方面表现良好,对比其他研究的催化剂组合,对甲基化产物具有高收率和高选择性。

    此外,作者还使用了基于机器学习技术的数据来识别控制催化性能的重要输入变量,从而优化用于甲基化反应的催化剂。对比使用常规方法优化的催化剂,通过机器学习进行优化,制备出来具有1.8 wt%Re负载量的改良Re/TiO2催化剂,将其与沸石催化剂组合对CO2/H2的苯甲基化反应表现出最好的催化活性

    4 组合催化剂的结构示意图

    5、Angewan机器学习在电池全尺度研究中的应用

    以锂电池为代表的储能器件在当前能源系统中发挥着越来越重要的作用。发展高安全、高能量密度的电池体系是能源领域的共性问题,也是实现“碳中和”目标的重要技术手段。然而,电池体系复杂的界面结构与反应特征极大地限制了高比能电池体系的快速发展与应用,传统“试错”法也很难在短期内突破当前技术瓶颈。新兴的机器学习方法可以建立基于数据驱动的新研究范式,已成为化学和材料学研究中的重要手段,为高比能电池研究提供了新的机遇。

    有鉴于此,清华大学张强课题组[5]从微观、介观和宏观尺度全面总结了机器学习方法在电池研究中的应用和未来展望,强调了人类智慧在当前电池机器学习研究中的重要性。作者认为,机器学习在电池研究中的应用包括多个方面,借助机器学习方法开发高效、高精度的计算方法,可以实现更大尺度的分子模拟,探索电池中复杂的界面和非晶相结构、界面反应热力学和动力学行为、界面离子输运性质的微观机制,从而深入理解电池中的微观化学原理。同时,机器学习方法在分析大数据方面具有天然优势,在建立电池材料的构效关系、分析实验表征数据、监测电池状态、预测电池寿命等方面具有极大的应用前景。

    此外,由于电池设计开发中面临着诸多工艺参数的优化,比如电解液配方设计、复合电极设计、充放电协议优化等,使用机器学习方法则可以实现高维空间的快速优化,极大的降低实验成本和周期。结合机器学习、多尺度模拟和实验方法,可以建立基于数据驱动的下一代电池研发方法,加速下一代高比能电池体系的实用化进程。这一研究范式同样适用于其他功能材料的设计和器件的开发。

    图5 机器学习在电池全尺度研究中的应用

    6、Energy Storage Materials:利用机器学习迅速准确预测锂硫电池中,硫宿主与多硫化锂的结合能

    近年来,由于能源需求的增加,二次电池系统得到了广泛的研究,如锂离子电池、锂硫电池、锌离子电池、钠离子电池等。在这些储能系统中,锂硫电池因其理论能量密度高而备受关注。然而,多硫化锂(LiPS)的穿梭效应严重降低了电池的循环寿命,在充放电过程中,生成的Li2S4、Li2S6和Li2S8等可溶性多硫化物会迁移到锂金属负极上与之反应,造成不可逆的容量损失。

    金属氧化物、硫化物、磷化物和氮化物等可以有效锚定LiPS并抑制穿梭效应,从而提高电池循环稳定性。然而,目前仍然很难获得在宿主材料的不同点位(例如顶部、桥、洞点位)对LiPS的结合能,因此必须进行重复且枯燥的实验来探索各种宿主材料对穿梭效应的抑制能力。

    随着计算化学的迅速发展,第一性原理计算已被引入锂硫电池领域,以预测宿主材料对LiPS的锚定强度。值得注意的是,在迁移和转化过程中会出现不同构型的LiPS,因此有必要研究不同空间构型、随机点位的结合能。

    有鉴于此,上海交通大学李金金等提出了一种超快速和精确的机器学习方法,来预测吸附在具有任意构型和随机点位的宿主材料上LiPS的结合能,该方法可以综合评价这些宿主材料对锂硫电池穿梭效应的抑制作用。作者提出的机器学习法与DFT法具有相同的预测精度,但比其快6个数量级。最重要的是,基于机器学习法,只需要1/7的数据集就可以显示出很高的预测精度,而不是像从零训练(FS)那样需要数千甚至数万个数据集。所提出的机器学习方法实现了对具有任意构型和活性点位的宿主材料的LiPS结合强度的准确和快速预测。这项工作为分子吸附在新兴储能材料及其电池系统领域的潜在应用打开了大门。

    6 DFT和机器学习法吸附示意图

    参考文献

    [1] Yangzesheng Sun, Robert F. DeJaco, Zhao Li, et al. Fingerprinting diverse nanoporous materials for optimal hydrogen storage conditions using meta-learning. Sci. Adv. 2021, 7, 1126. DOI: 10.1126/sciadv.abg3983.

    [2] Shields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021). DOI: 10.1038/s41586-021-03213-y.

    [3] Ying Guo, Xinru He, Yuming Su, et al. Machine-Learning-Guided Discovery and Optimization of Additives in Preparing Cu Catalysts for CO2 Reduction. Journal of the American Chemical Society 2021 143 (15), 5755-5762. DOI: 10.1021/jacs.1c00339.

    [4] Kah Wei Ting, Haruka Kamakura, Sharmin S. Poly, et al. Catalytic Methylation of m-Xylene, Toluene, and Benzene Using CO2 and H2 over TiO2-Supported Re and Zeolite Catalysts: Machine-Learning-Assisted Catalyst Optimization. ACS Catalysis 2021 11 (9), 5829-5838. DOI: 10.1021/acscatal.0c05661.

    [5] Xiang Chen, Xinyan Liu, Xin Shen, et al. Applying Machine Learning in Rechargeable Batteries from Microscale to Macroscale. Angew. Chem. Int. Ed. 10.1002/anie.202107369.

    [6] Haikuo Zhang, Zhilong Wang , Jiahao Ren, et al. Ultra-fast and accurate binding energy prediction of shuttle effect-suppressive sulfur hosts for lithium-sulfur batteries using machine learning. Energy Storage Materials 35 (2021) 88–98. DOI: 10.1016/j.ensm.2020.11.009.

    PS:推荐一个非常好用的科研小程序“测试GO”,专注【材料测试+模拟计算】科研服务,测试狗团队开发,提供同步辐射、球差电镜和常用材料表征,承接第一性原理计算、分子动力学、有限元计算等,有需要的朋友可以扫描下方二维码了解详情哦~


    评论 / 文明上网理性发言
    12条评论
    全部评论 / 我的评论
    最热 /  最新
    全部 3小时前 四川
    文字是人类用符号记录表达信息以传之久远的方式和工具。现代文字大多是记录语言的工具。人类往往先有口头的语言后产生书面文字,很多小语种,有语言但没有文字。文字的不同体现了国家和民族的书面表达的方式和思维不同。文字使人类进入有历史记录的文明社会。
    点赞12
    回复
    全部
    查看更多评论
    相关文章

    别只盯一区!这些二三区化学期刊,发文量多,速度快,真的还不错!

    2021-06-19

    Nature盘点8篇: 北大、南大、密大、亚琛工大等最新前沿成果报道丨生化材9月精选

    2019-10-25

    MOF&COF顶刊精选:罗建平、陈龙、Yaghi、王为、林子俺、尹学博、师唯顶刊大盘点

    2019-12-06

    ​机器学习顶刊精选:看人工智能如何助力材料研究

    2019-12-05

    包信和院士成果精选丨用坚守不渝开启催化世界

    2019-12-06

    ​发光材料顶刊精选:杨阳、陈平、安达千波矢、唐本忠、夏志国顶刊大盘点

    2019-12-05

    项目推荐/Project
    机器学习

    机器学习

    热门文章/popular

    基础理论丨一文了解XPS(概念、定性定量分析、分析方法、谱线结构)

    手把手教你用ChemDraw 画化学结构式:基础篇

    晶体结构可视化软件 VESTA使用教程(下篇)

    【科研干货】电化学表征:循环伏安法详解(上)

    电化学实验基础之电化学工作站篇 (二)三电极和两电极体系的搭建 和测试

    【科研干货】电化学表征:循环伏安法详解(下)

    微信扫码分享文章