CN111177915B

CN111177915B - 一种催化材料高通量计算方法和系统

Info

Publication number: CN111177915B
Application number: CN201911357736.3A
Authority: CN
Inventors: 程道建; 许昊翔
Original assignee: Beijing University of Chemical Technology
Current assignee: Beijing University of Chemical Technology
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2023-06-27
Anticipated expiration: 2039-12-25
Also published as: CN111177915A

Abstract

本方案提供了一种基于大数据和机器学习算法的催化材料高通量计算方法和系统，其中，该方法的步骤包括：根据基于大数据和机器学习算法构建的催化剂构效关系模型，筛选满足目标催化性能的待确认催化材料；待确认催化材料催化性能的预测结果与计算结果之间的偏差在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料。本申请所述技术方案提供一种结合大数据和机器学习并应用于催化剂高通量计算的途径，可以提高催化材料的筛选精度和筛选速度。

Description

一种催化材料高通量计算方法和系统

技术领域

本申请涉及催化材料研发领域，特别涉及一种基于大数据和机器学习算法的催化材料高通量计算方法和系统。

背景技术

无论是化工生产过程还是能源储存与转化过程，它们所涉及的化学反应过程都需要相应的催化剂才能顺利进行。催化剂是众多工业领域最关键的核心技术之一，催化剂的性能决定着一种生产过程能否实现，以及其经济性。目前绝大多数的催化剂研发工作仅凭实验手段需要花费大量耗时的重复试验才能筛选出相对理想的催化剂。随着理论方法的日臻完善和计算能力的不断提升，人们可以借助各种不同的理论计算方法来建立催化反应的微观动力学，进而研究催化剂的催化作用机理。然而，由于催化剂大多以过渡金属为催化活性组分，而过渡金属表面反应位点的结构特征繁多，它们在不同反应中所起的作用机制也各不相同，所以只依靠理论计算进行研究时，难以从众多候选本征物理化学性质中找出关键因素。

发明内容

本申请提供了一种基于机器学习算法的催化材料筛选方法和系统。

根据本申请实施例的第一个方面，提供了一种基于机器学习算法的催化材料筛选方法，该方法的步骤包括：

根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料；

基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料。

在一种优选地实施例中，所述基于机器学习算法构建的催化剂构效关系模型的构建步骤包括：

利用催化剂颗粒模型的反应位点的结构特征，以及不同表面模型上的反应物、中间产物和最终产物的吸附能，基于机器学习算法，训练获得结构特征-吸附能关联模型；

利用不同表面模型上的反应物、中间产物和最终产物的吸附能，基于机器学习算法，训练获得吸附能比例关联模型；

利用不同表面模型上的化学反应的反应热以及反应能垒，基于机器学习算法，训练获得反应能垒-反应热比例关联模型；

利用上述模型，基于机器学习算法，获得结构-吸附-性能关联模型，即催化剂构效关系模型。

在一种优选地实施例中，构建催化剂构效关系模型之前的步骤包括：

构建由单助剂或双助剂修饰的晶面指数的表面模型；

根据表面模型的表面能，构建催化剂颗粒模型。

在一种优选地实施例中，所述构建所述催化剂构效关系模型的前一步骤还包括：

对催化剂表面模型进行计算模拟；

结合微观动力学分析获取主/副反应的最优反应路径及其反应速率。

结合表面模型的主/副反应的反应速率和颗粒模型上每种晶面的比例，转化成该颗粒模型在反应环境条件下的催化反应动力学信息；

利用上述反应动力学评估方法，获取催化剂模型的理论催化性能。

在一种优选地实施例中，所述根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料的前一步骤包括；

对基于机器学习算法构建的催化剂构效关系模型进行精度验证。

在一种优选地实施例中，所述对基于机器学习算法构建的催化剂构效关系模型进行精度验证的步骤包括：

利用训练集数据判断催化剂构效关系模型的预测精度是否达标；所述训练集数据包括：表面模型相图、催化剂颗粒模型、催化剂模型的理论催化性能中的一种或多种；

若是，则进行测试集数据的精度验证。

在一种优选地实施例中，若否，则通过基于机器学习算法继续训练，矫正催化剂构效关系模型。

在一种优选地实施例中，所述对基于机器学习算法构建的催化剂构效关系模型进行精度验证的步骤还包括：

利用测试集数据判断催化剂构效关系模型的预测精度是否达标；所述测试集数据包括：表面模型相图、催化剂颗粒模型、催化剂模型的理论催化性能中的一种或多种；

若是，则根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料。

在一种优选地实施例中，若否，则重新进行训练集数据的精度验证。

在一种优选地实施例中，若基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，未在预定偏差范围内；则结合待确认催化材料对应的颗粒模型、催化性能理论值，基于机器学习算法继续训练，矫正催化剂构效关系模型。

根据本申请实施例的第二个方面，提供了一种基于机器算法的催化材料筛选系统，该系统包括：

筛选单元，根据基于大机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料；

确认单元，基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料。

在一种优选地实施例中，该系统还包括：模型构建单元；所述模型构建单元具体执行如下步骤：

利用上述模型，基于机器学习算法，获得结构-吸附-性能关联模型，即催化剂构效关系模型；或者，

根据矫正数据，基于机器学习算法继续训练，矫正催化剂构效关系模型。

在一种优选地实施例中，该系统还包括：精度验证单元，基于训练集数据和测试集数据，对基于机器学习算法构建的催化剂构效关系模型进行精度验证。

在一种优选地实施例中，该系统还包括：为模型构建单元提供基础数据的结构数据库和催化性能数据库；

所述结构数据库包括：表面模型相图、催化剂颗粒模型；

所述催化性能数据库包括：催化剂模型的理论催化性能。

在一种优选地实施例中，所述确认单元还包括：若基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，未在预定偏差范围内；则将待确认催化材料对应的颗粒模型、催化性能理论值反馈给模型构建单元；模型构建单元基于机器学习算法继续训练，矫正催化剂构效关系模型。

有益效果

本申请所述技术方案提供采用催化剂高通量计算的方法对催化材料进行筛选，能够有效提高催化材料的筛选精度和筛选速度；

本申请所述技术方案能够根据高通量计算数据，更新调整构效关系模型。本申请所述技术方案易于实现，操作简单，可自动化、智能化地完成催化材料的精确筛选。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出本方案所述基于机器学习算法的催化材料筛选方法的示意图；

图2示出本方案实施例所述催化材料筛选方法的示意图。

具体实施方式

为了使本申请实施例中的技术方案及优点更加清楚明白，以下结合附图对本申请的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本申请的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

经过分析研究，现有技术中通过利用机器学习算法可以对海量的实验、理论计算所得数据进行有效的“学习”，并利用基于数据挖掘建立的模型对未知事物进行预测。虽然机器学习算法在新材料设计领域取得了一定的进展，但是大多数局限于关注材料的力、热、光、电、磁等相对简单的本征物理性质。由于催化性能涉及复杂的化学反应过程，把机器学习算法运用于催化材料的理论设计仍鲜有报道，最多只涉及其对反应物分子的吸附性质。另外这些相关研发工作仍然存在问题亟待解决：作为机器学习算法模型训练集的大数据均是来源于已有的晶体数据库，在筛选模型建立之后，由于训练集没有得到滚动更新，筛选模型也没法得到升级和修正，这使得建立的筛选模型外推能力较弱，即搜寻新型材料的准确性不足。这为加快高性能催化材料的开发进度来说带来了巨大困难。因此，本方案意在提供一种能自动更新的基于机器学习的催化材料高通量理论筛选方法，以提高催化材料的筛选精度和筛选速度。

如图1所示，本方案提供了一种基于机器学习算法的催化材料筛选方法，该方法包括如下步骤：

一种基于机器学习的催化材料高通量理论筛选方法，包括如下步骤：

S1、搭建具有常见晶面指数的表面模型。计算出表面模型在不同温度、压力下的相图。为了获得表面模型的相图，首先从Material Project晶体结构数据库中获取金属晶体体相结构，沿常见晶面指数的方向切割，搭建具备不同晶面指数的表面模型。用表面吉布斯自由能确定在特定反应温度、条件下反应物分子或原子与表面模型的最稳定配位方式。用表面吉布斯自由能确定在特定反应温度、条件下表面模型中所有原子的最稳定分布方式。利用Langmuir吸附等温线确定表面模型在反应环境中的达到吸附平衡时的构型。

S2、根据经典WulffConstruction定则和表面模型的表面能，构建金属颗粒模型，把表面模型和颗粒模型储存入催化剂结构数据库。其中，构建颗粒模型的方式为：根据经典WulffConstruction定则，晶体晶面的表面能能够决定晶体的几何形貌特征，表面能越低，该晶面在晶体中的暴露面积越大。根据量化计算获得的不同晶面的表面能，借助开源软件WULFFMAN可以构建出表面能最低的颗粒模型，并给出各个暴露晶面的比例。最后采用分子模拟程序或全局优化算法获取颗粒模型的平衡结构。

S3、基于化学反应的反应路径网络，在表面模型上计算模拟其反应过程。

S4、结合微观动力学分析获取各基元反应的反应速率。找到主(副)反应的最优反应路径及其反应速率。

S5、结合在表面模型上主(副)反应的反应速率和颗粒上每种晶面的比例，转化成该颗粒模型在反应环境条件下的各个催化反应动力学信息。

S6、利用上述方法获取催化剂结构数据库中模型的反应动力学相关信息，储存入催化性能数据库。其中，所述的反应动力学理论评估方法为：使用基于第一性原理软件包(如VASP、QE、CP2K等)执行量子化学计算，根据反应网络里所包含的吸附物种，计算在不同金属表面模型上的反应物、中间产物、最终产物的吸附能。搜寻每个吸附稳态之间的反应路径(即基元反应)，并获取相应的过渡态结构、能量等信息和活化能垒。微观动力学分析过程如下：通过阿伦尼乌斯方程、活化能垒、基于过渡态振动熵的配分函数计算得到基元反应的反应速率常数；依据反应物种的吸附能、基元反应的反应速率常数和反应物种表面覆盖率的稳态近似假设推算出反应网络中每个吸附物种的覆盖度，及各个基元反应的反应速率。通过比较不同反应路径的速控步的反应速率，找到主反应及副反应的最优反应路径。最后结合金属表面模型的主(副)反应的反应速率和颗粒模型上每种晶面的比例，转化成颗粒模型在特定反应环境条件下的催化反应动力学信息，如反应物的转化速率、产物的选择性、表观活化能、反应物的反应级数等。

S7、把结构数据库和催化性能数据库的数据随机分为两份，一部分作为测试集，一部分作为训练集。优选地，对于把结构数据库和催化性能数据库的数据随机分为两份，作为机器学习算法的训练集和测试集,具体为其中训练集数据量占总数据量的50～70％，测试集数据量占总数据量的20～30％，使用scikit-learn的KFold方法，对训练集进行划分。

S8、提取结构数据库中催化剂模型的每个原子的特征性质，作为输入数据，而计算模拟所得的反应物、中间产物、最终产物在催化剂模型上的吸附能作为输出数据。建立第一个神经网络，训练得到单个原子对吸附能的关联模型。将催化剂模型中的所有原子对应的吸附能预测值相加，得到催化剂模型的吸附能预测值，即结构-吸附关联模型。具体地，对于基于催化剂模型结构特征的吸附能预测模型的构建步骤包括：利用机器学习算法建立结构-吸附关联模型。提取结构数据库中催化剂模型所有原子的电子特征信息和几何特征信息，如元素的本征电子性质(如价电子分布，电负性，电子亲和能，电离能等)，配位数、曲率角、与吸附物的距离等结构特征。利用深度前馈神经网络构建单个原子的结构-吸附关联模型：排除多余的特征信息，从众多特征信息中鉴别出最有效的特征空间，筛选出与吸附能关联性高的结构特征并加入权重参数，构建结构描述符，搜寻结构描述符与吸附能之间的线性甚至非线性模型。使用Adam算法和10折交叉验证训练神经网络，神经网络的超参数由网格搜索得出。将体系中所有原子对应的吸附能贡献值相加，得到催化材料的吸附性能。

S9、把计算模拟所得的反应物、中间产物、最终产物的吸附能作为输入数据，而催化性能数据库的理论催化性能作为输出数据。建立第二个神经网络，训练得到吸附-理论催化性能关联模型。具体地，对于建立吸附-理论催化性能等高线图的建立方法为：由微观动力学模型可知化学反应的主(副)产物生成速率，由反应网络里所包含的吸附物种的吸附能与每个基元反应的活化能垒所决定。参数之间的内在关联式包含两种：(i)基元反应的活化能垒与反应热之间有一定的正相关关系；(ii)由于以相同原子与表面接触的吸附物种的吸附能之间存在关联，所以可以用特定原子或小分子的吸附强度关联反应网络所涉及的所有反应物种的吸附能，拟合出相应的表达式，即吸附能关联式。利用深度前馈神经网络亦可建立上述两个关联式，结合上述两个关联式和微观动力学模型即可获得吸附-理论催化性能关联模型。

S10、把机器学习模型给出的结构-吸附-性能关联模型，即催化剂构效关系模型作为目标函数，用于寻找目标问题的最优解。具体地，把机器学习平台给出的催化剂构效关系模型作为目标函数。首先随机生成初始的颗粒模型，并随机生成颗粒模型中每个原子的初速度；使用拟牛顿算法对颗粒模型中原子的坐标进行力平衡优化计算，得到局部优化后的新颗粒模型的结构；利用构效关系模型预测局部优化后的颗粒模型的催化性能；通过全局最优算法(如遗传算法等)更新颗粒模型中原子的速度和坐标，重新随机生成与前一颗粒模型相同尺寸颗粒模型，使用拟牛顿算法对新颗粒模型中的原子的速度和坐标进行力平衡优化计算，得到局部优化后的新颗粒模型的结构；利用催化剂构效关系模型预测局部优化后的新颗粒模型的催化性能，将局部优化后的新颗粒模型与前一颗粒模型中催化性能高的颗粒模型作为优选颗粒模型。

S11、根据目标函数筛选出目标催化性能优异的催化材料，比较催化剂构效关系模型的催化性能预测结果与量化计算结果。如果偏差10％以内，则认为成功筛选出达到目标催化性能的催化材料。

S12、如果催化性能的预测结果与量化计算结果有较大偏差，把该样品的相关数据(包括颗粒模型和催化性能)加入机器学习算法的训练集，对构效关系模型进一步校正升级。再把更新的构效关系模型作为目标函数，搜索新的有潜力的催化材料。

本方案为了配合催化材料筛选方法的实施，进一步提供了一种基于机器学习算法的催化材料筛选系统，该系统包括：筛选单元和确认单元。筛选单元根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料；再利用确认单元基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料。此外，确认单元还会继续判断，若基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，未在预定偏差范围内；则将待确认催化材料对应的颗粒模型、催化性能理论值反馈给模型构建单元；模型构建单元基于机器学习算法继续训练，矫正催化剂构效关系模型。

本方案中，可以在筛选系统中构建一个模型构建单元来根据已经存储的或动态更新的计算数据，基于机器学习算法，构建催化剂构效关系模型；或，根据矫正数据，基于机器学习算法，矫正催化剂构效关系模型。模型构建单元构建催化剂构效关系模型的具体步骤包括：

本方案中，为了提高催化剂构效关系模型的精度，在筛选系统中进一步设置有精度验证单元；精度验证单元能够基于训练集数据和测试集数据，对催化剂构效关系模型进行精度验证。其中，训练集数据和测试集数据是把结构数据库和催化性能数据库的数据随机分为两份，作为机器学习算法的训练集和测试集，具体为其中训练集数据量占总数据量的50～70％，测试集数据量占总数据量的20～30％，使用scikit-learn的KFold方法，对训练集进行划分。所述结构数据库包括：高通量催化反应后催化剂的表征数据、表面模型相图、催化剂颗粒模型；所述催化性能数据库包括：高通量催化性能测试数据和催化剂模型的理论催化性能。

下面通过实例对本方案作进一步说明。

如图1所示，一种基于大数据和机器学习的催化材料高通量计算方法。本实例以优化乙烯环氧化银基工业催化剂助剂的流程为例，催化材料筛选的步骤如下：

S1、使用软件Material Studio搭建由单助剂或双助剂(助剂种类考虑所有过渡金属及碱金属)修饰的银表面模型。计算出助剂修饰的银表面模型在不同温度、压力下的相图。该步骤中，为了获得助剂修饰的银表面模型的相图，可以利用Material确Studio软件导出银元素晶胞模型，切割出特定晶向指数的表面，负载上过渡金属或碱金属原子，作为助剂修饰的银表面模型。用表面吉布斯自由能确定在特定反应温度、条件下氧原子与银表面模型的最稳定配位方式。用表面吉布斯自由能确定在特定反应温度、条件下银表面模型中助剂原子的最稳定分布方式。用Langmuir吸附等温线确定银表面在乙烯环氧化反应环境中的达到吸附平衡时的构型：

当氧分子和乙烯分子在银表面达到吸附平衡时，氧分子和乙烯分子的吸附速率等于其脱附速率。速率方程式如下：

下式即为Langmuir吸附的计算关系式(K是Langmuir等温吸附常数，ΔG是吉布斯自由能，k_B是玻尔兹曼常数，T是温度，S_ads和S_gas分别是吸附体系和气体的熵)：

对于特定反应环境(温度、氧气和乙烯分压)下，计算氧原子和乙烯分子在银表面以不同覆盖度吸附时的平均吸附能，获得一系列数据。分别代入

式子两边。当等式两边数值最接近时，对应的覆盖度即为氧气和乙烯在银表面的平衡吸附构型。

S2、根据经典Wulff Construction定则和助剂修饰的银表面模型的表面能，构建助剂修饰的银催化剂颗粒模型，一并储存入催化剂结构数据库。具体地，根据经典WulffConstruction定则，助剂修饰的银晶面的表面能能够决定助剂修饰的银晶体的几何形貌特征，表面能越低，该晶面在晶体中的暴露面积越大。根据量化计算获得的不同晶面的表面能，借助开源软件WULFFMAN可以构建出表面能最低的金属颗粒模型，并给出各个暴露晶面的比例。最后采用分子模拟程序平台和全局优化算法RPSO获取助剂修饰的银颗粒的平衡结构。金属原子之间相互作用势能采用常用的TB-SMA(Tight-binding second-momentapproximation scheme，简称TB-SMA)金属多体作用势。

S3、使用基于第一性原理软件包Quantum Espresso执行量子化学计算，基于乙烯环氧化反应的反应路径网络，在助剂修饰的银表面模型进行计算模拟，获取表面模型上的反应物、中间产物、最终产物的吸附能，每个基元反应的活化能垒。在计算氧原子和乙烯分子在银表面模型上的吸附时，考虑不同的吸附位，找到其最优吸附位。通过计算可能反应路径中每个基元反应的反应物、可能的反应中间体和产物的吸附能，使用CI-NEB(ClimbingImage Nudged Elastic Band)的过渡态计算方法搜索稳定吸附态之间的最低耗能反应路径，并获得其鞍点状态的能量，即确定了每个基元反应的能垒。

S4、结合微观动力学分析获取各基元反应的反应速率。找到生成目标产物环氧乙烷的主反应和生成副产物乙醛的副反应的最优反应路径，计算其反应速率。

S5、结合助剂修饰的银表面模型的主(副)反应的反应速率和助剂修饰的银颗粒上每种晶面的比例，转化成助剂修饰的银催化剂颗粒模型在反应环境条件下反应动力学信息。

基于步骤S4和S5，对形成理论评估乙烯环氧化反应动力学的方法进行具体描述。微观动力学分析过程如下：通过阿伦尼乌斯方程、活化能垒、基于过渡态振动熵的配分函数计算得到基元反应的反应速率常数；依据反应物种的吸附能、基元反应的反应速率常数和反应物种表面覆盖率的稳态近似假设推算出反应网络中每个吸附物种的覆盖度，及各个基元反应的反应速率。通过比较不同反应路径的速控步的反应速率，找到主反应及副反应的最优反应路径。最后结合助剂修饰的银表面模型的主(副)反应的反应速率和助剂修饰的银颗粒模型上每种晶面的比例，转化成银颗粒模型在特定反应环境条件下的催化乙烯环氧化的反应动力学信息，包括乙烯的转化速率、环氧乙烷的选择性、表观活化能、乙烯与氧气的反应级数。

S6、利用上述反应动力学评估方法获取催化剂结构数据库中模型的理论催化性能，如乙烯的转化率和环氧乙烷的选择性等，储存入催化性能数据库。

S7、建立机器学习模型，把结构数据库和催化性能数据库的数据随机分为两份，作为机器学习算法的训练集和测试集。其中，对于把结构数据库和催化性能数据库的数据随机分为两份，作为机器学习算法的训练集和测试集,具体为其中训练集数据量占总数据量的70％，测试集数据量占总数据量的30％，使用scikit-learn的KFold方法，对训练集进行划分。

S8、提取结构数据库中银表面模型的反应位点的电子与几何结构特征、所含元素特征性质，使用这些候选结构特征作为输入数据，而计算模拟所得的反应物、中间产物、最终产物在金属表面模型上的吸附能作为输出数据。建立第一个神经网络，训练得到单个金属原子的结构-吸附关联模型。将表面模型中的所有金属原子对应的吸附能预测值相加，得到整体的吸附能预测值。建立基于助剂修饰的银表面结构特征的吸附能预测模型。银表面对小分子的吸附强度由吸附位点及其局域环境的电子结构和几何结构共同决定，如吸附位点及周围所含元素的一些本征电子性质(如价电子分布，电负性，电子亲和能，电离能等)，吸附位点的配位数、曲率角、电荷分布、功函数等结构特征。基于深度前馈伸进网络对单个原子的结构-吸附性能构建模型，使用Adam算法和10折交叉验证训练神经网络。神经网络的超参数由网格搜索得出。将体系中所有原子的吸附能相加，得到整体的吸附性能。该模型基于Python以及TensorFlow编写。在本具体实施实例中，机器学习算法构建了以反应位点原子的氧化形成焓为主体的结构描述符。

S9、把计算模拟所得的反应物、中间产物、最终产物在表面模型上的吸附能作为输入数据，而表面模型的理论催化性能作为输出数据。建立第二个神经网络，训练得到吸附-理论催化性能关联模型。具体地，建立吸附-理论催化性能关联模型。由微观动力学模型可知化学反应的主(副)产物生成速率，由反应网络里所包含的吸附物种的吸附能与每个基元反应的活化能垒所决定。这些参数之间的内在关联式包含两种：(i)基元反应的活化能垒与反应热之间有一定的正相关关系；(ii)乙烯环氧化反应网络中包含的反应物种均通过氧原子或碳原子与表面接触，所以可以用氧原子和甲基分子的吸附强度(ΔG_O和ΔG_CH3)关联反应网络所涉及的所有反应物种的吸附能。利用深度前馈神经网络亦可建立上述两个关联式，结合上述两个关联式和微观动力学模型即可获得吸附-理论催化性能关联模型。

S10、以环氧乙烷选择性作为目标催化性能，把机器学习模型给出的结构-吸附-性能关联模型，即乙烯环氧化银基催化剂的构效关系模型，作为目标函数，用于寻找提升银催化剂环氧乙烷选择性的最优助剂组合。具体地，把机器学习平台给出的构效关系模型转化换成目标函数。通过申请人自主研发的RPSO算法随机生成初始的银颗粒模型，并随机生成银颗粒模型中每个原子的初速度；使用拟牛顿算法对银颗粒模型中原子的坐标进行力平衡优化计算，得到局部优化后的新的银颗粒模型的结构；利用构效关系模型预测局部优化后的银颗粒模型的催化性能；通过RPSO算法中坐标更新公式与随机学习算子的结合来更新的银颗粒模型中银原子的速度和坐标，重新随机生成与前一银颗粒模型相同尺寸的新的银颗粒模型，使用拟牛顿算法对新的银颗粒模型中的银原子的速度和坐标进行力平衡优化计算，得到局部优化后的新的银颗粒模型的结构；利用催化剂构效关系模型预测局部优化后的新的银颗粒模型的催化性能，将局部优化后的新的银颗粒模型与前一银颗粒模型中催化性能高的银颗粒模型作为优选银颗粒模型。

S11、针对目标函数筛选出的助剂组合修饰的银基催化剂，比较构效关系模型的环氧乙烷选择性预测结果与量化计算结果。如果偏差10％以内，则认为成功筛选出环氧乙烷选择性达标的助剂组合。

S12、如果环氧乙烷选择性的预测结果与量化计算结果有较大偏差，把该样品的相关数据(包括银颗粒模型和相应反应动力学参数)加入构效关系模型的训练集，对构效关系模型进一步校正升级。再把更新的构效关系模型作为目标函数，搜索新的候选助剂组合。

综上所述，本申请所述技术方案能够通过基于机器学习算法构建的催化剂构效关系模型，将理论计算模拟结果和筛选出新的催化剂计算结果之间形成相互印证的关系，从而提高催化材料的筛选精度和筛选速度。本申请所述技术方案能够根据计算数据的更新，调整构效关系模型，充分将高通量理性设计催化剂推向实际应用，极大地加快催化剂的设计速度，从而大大降低催化剂开发成本。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上仅为本发明的实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均包含在申请待批的本发明的权利要求范围之内。

Claims

1.一种基于大数据和机器学习算法的催化材料高通量计算方法，其特征在于，该方法的步骤包括：

根据基于大数据和机器学习算法构建的催化剂构效关系模型，筛选满足目标催化性能的待确认催化材料；

待确认催化材料催化性能的预测结果与计算结果之间的偏差在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料；

所述基于大数据和机器学习算法构建的催化剂构效关系模型的构建步骤包括：

2.根据权利要求1所述的催化材料高通量计算方法，其特征在于，构建所述催化剂构效关系模型之前的步骤包括：

构建具有不同晶面指数的表面模型；

根据表面模型的表面能，构建催化剂颗粒模型；

所述构建所述催化剂构效关系模型的前一步骤还包括：

对催化剂表面模型进行计算模拟；

结合量化计算模拟与微观动力学分析获取主/副反应的最优反应路径及其反应速率；

利用上述步骤，获取催化剂模型的理论催化性能。

3.根据权利要求1所述的催化材料高通量计算方法，其特征在于，所述根据基于大数据和机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料的前一步骤包括；

对基于大数据和机器学习算法构建的催化剂构效关系模型进行精度验证。

4.根据权利要求3所述的催化材料高通量计算方法，其特征在于，所述对基于大数据和机器学习算法构建的催化剂构效关系模型进行精度验证的步骤包括：

若是，则进行测试集数据的精度验证；

若否，则通过基于机器学习算法继续训练，矫正催化剂构效关系模型；

所述对基于大数据和机器学习算法构建的催化剂构效关系模型进行精度验证的步骤还包括：

若是，则根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料；

若否，则重新进行训练集数据的精度验证。

5.根据权利要求1所述的催化材料高通量计算方法，其特征在于，若基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，未在预定偏差范围内；则结合待确认催化材料对应的颗粒模型、催化性能理论值，基于机器学习算法继续训练，矫正催化剂构效关系模型。

6.一种基于机器学习算法的催化材料筛选系统，其特征在于，该系统包括：

筛选单元，根据基于机器学习算法构建的催化剂构效关系模型，初步筛选满足目标催化性能的待确认催化材料；

确认单元，基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，在预定偏差范围内的情况下，确定待确认催化材料为达到目标催化性能的催化材料；

该系统还包括：模型构建单元；所述模型构建单元具体执行如下步骤：

7.根据权利要求6所述的催化材料筛选系统，其特征在于，该系统还包括：精度验证单元，基于训练集数据和测试集数据，对催化剂构效关系模型进行精度验证。

8.根据权利要求6所述的催化材料筛选系统，其特征在于，该系统还包括：为模型构建单元提供基础数据的结构数据库和催化性能数据库；

所述结构数据库包括：随机高通量催化反应后催化剂的表征数据、表面模型相图、催化剂颗粒模型；

所述催化性能数据库包括：高通量催化性能测试数据和催化剂模型的理论催化性能；

所述确认单元还包括：若基于催化剂构效关系模型对待确认催化材料进行预测的催化性能预测结果与待确认催化材料的计算结果的偏差，未在预定偏差范围内；则将待确认催化材料对应的颗粒模型、催化性能理论值作为矫正数据反馈给模型构建单元；模型构建单元基于机器学习算法继续训练，矫正催化剂构效关系模型。