CN115331747B - 过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 - Google Patents
过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 Download PDFInfo
- Publication number
- CN115331747B CN115331747B CN202210907042.8A CN202210907042A CN115331747B CN 115331747 B CN115331747 B CN 115331747B CN 202210907042 A CN202210907042 A CN 202210907042A CN 115331747 B CN115331747 B CN 115331747B
- Authority
- CN
- China
- Prior art keywords
- oxygen evolution
- electrocatalyst
- model
- transition metal
- metal hydroxide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- C—CHEMISTRY; METALLURGY
- C25—ELECTROLYTIC OR ELECTROPHORETIC PROCESSES; APPARATUS THEREFOR
- C25B—ELECTROLYTIC OR ELECTROPHORETIC PROCESSES FOR THE PRODUCTION OF COMPOUNDS OR NON-METALS; APPARATUS THEREFOR
- C25B1/00—Electrolytic production of inorganic compounds or non-metals
- C25B1/01—Products
- C25B1/02—Hydrogen or oxygen
- C25B1/04—Hydrogen or oxygen by electrolysis of water
-
- C—CHEMISTRY; METALLURGY
- C25—ELECTROLYTIC OR ELECTROPHORETIC PROCESSES; APPARATUS THEREFOR
- C25B—ELECTROLYTIC OR ELECTROPHORETIC PROCESSES FOR THE PRODUCTION OF COMPOUNDS OR NON-METALS; APPARATUS THEREFOR
- C25B11/00—Electrodes; Manufacture thereof not otherwise provided for
- C25B11/04—Electrodes; Manufacture thereof not otherwise provided for characterised by the material
- C25B11/051—Electrodes formed of electrocatalysts on a substrate or carrier
- C25B11/073—Electrodes formed of electrocatalysts on a substrate or carrier characterised by the electrocatalyst material
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/30—Hydrogen technology
- Y02E60/36—Hydrogen production from non-carbon containing sources, e.g. by water electrolysis
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Metallurgy (AREA)
- Materials Engineering (AREA)
- Electrochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Inorganic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Investigating Or Analyzing Non-Biological Materials By The Use Of Chemical Means (AREA)
- Electrolytic Production Of Non-Metals, Compounds, Apparatuses Therefor (AREA)
Abstract
本发明涉及一种过渡金属氢氧化物析氧电催化剂的智能设计方法及系统,属于无机材料设计技术领域,能够准确快速预测过渡金属氢氧化物电催化剂的析氧活性,解决在广域成分空间中高效搜索具有低OER过电位的候选过渡金属氢氧化物电催化剂配方的难题;该方法包括:析氧活性预测模型构建:先对高维稀疏的实例数据进行稠密特征表示,再进行模型构建,得到训练好的析氧活性预测模型;过渡金属氢氧化物析氧电催化剂设计:根据电催化剂的设计要求,用穷举法得到所有满足要求的电催化剂,并用所述析氧活性预测模型对其分别进行预测,得到所有所述电催化剂的预测结果;根据所述预测结果确定最终设计的电催化剂。
Description
技术领域
本发明涉及无机材料设计技术领域,尤其涉及一种基于机器学习的过渡金属氢氧化物析氧电催化剂的设计方法及系统。
背景技术
电催化水分解制备氢气是前景广阔的获得清洁能源的方法。在水分解的两个半反应中,析氧反应(OER)涉及四个电子的转移,它依赖于O-H键断裂和O-O键形成两个步骤,因此其动力学过程十分缓慢,开发高效的OER电催化剂对于电解水制氢十分重要。最近,低成本的过渡金属基催化剂,如钴基、镍基和铁基钙钛矿、氧化物和氢氧化物,受到了极大的关注。其中,氢氧化物因其优异的本征活性和高活性表面积而成为OER电催化剂最有吸引力的候选者。此外,先前的研究表明,异质金属(Ce、Cr、V、W等)掺杂到Ni、Co或Fe基氢氧化物可以调节局部配位环境和电子结构,从而提高电催化性能。同时,氢氧化物的相种类,例如层状双氢氧化物(LDHs)、α相等对OER催化性能影响也不容忽视;此外,催化剂的形貌特征往往会影响活性位点的数量和OER活性。因此,为了开发新型氢氧化物催化剂,对不同组成、相和形貌的电催化OER性能进行定量准确地预测和估计尤为重要。
通常,科学家利用密度泛函理论通过计算不同中间体的吸附能,提供了间接推断OER活性趋势的途径,但很难直接给出OER活性的定量预测,特别是,催化剂往往包含化学元素、相、形貌等大的潜在候选空间,密度泛函理论尚不足以指导成分、相的选择和形貌的构建。因此,氢氧化物电催化剂的析氧活性预测仍然是挑战。
因此,有必要研究一种基于机器学习的过渡金属氢氧化物析氧电催化剂的设计方法来应对现有技术的不足,以解决或减轻上述一个或多个问题。
发明内容
有鉴于此,本发明提供了一种过渡金属氢氧化物析氧电催化剂的智能设计方法及系统,能够准确快速预测过渡金属氢氧化物电催化剂的析氧活性,解决在广域成分空间中高效搜索具有低OER过电位的候选过渡金属氢氧化物电催化剂配方的难题。
一方面,本发明提供一种基于机器学习的过渡金属氢氧化物析氧电催化剂的设计方法,所述方法包括:
析氧活性预测模型构建:先对高维稀疏的实例数据进行化学空间稠密特征表示,再进行模型构建,得到训练好的析氧活性预测模型;
过渡金属氢氧化物析氧电催化剂设计:根据电催化剂的设计要求,用穷举法得到所有满足要求的电催化剂,并用所述析氧活性预测模型对其分别进行预测,得到所有所述电催化剂的预测结果;根据所述预测结果确定最终设计的电催化剂。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,析氧活性预测模型构建的具体步骤包括:
S11、采集实例数据,实例数据类型包括化学成分、相种类、产物形貌、电解液pH值、工作电极类型和析氧过电位;
S12、对采集到的数据进行稠密特征表示;
采用标签编码的方式对所述相种类、所述产物形貌和所述工作电极类型进行编码;
获取每个所述化学成分中各元素的摩尔分数,并按摩尔分数降序的方式选出主要元素;
S13、以所述主要元素的原子序数和摩尔分数,编码后的所述相种类、所述产物形貌和所述工作电极类型,以及所述电解液pH值作为输入,以对应的所述析氧过电位作为输出,对原始模型进行训练,得到所述析氧活性预测模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述主要元素的数量为3或4。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述原始模型为支持向量回归模型、随机森林回归模型、K近邻回归模型、贝叶斯岭回归模型、eXtreme梯度提升回归模型、梯度提升回归模型和Adaboost回归模型中的任意一种。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述原始模型为随机森林回归模型,所述随机森林回归模型的设置包括:最大深度设置为7,学习器个数设置为70。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
针对全部实例数据计算SHAP值,根据所述SHAP值度量每个数据类型对析氧活性预测模型预测结果的贡献度。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,析氧活性预测模型构建时采用重采样的方式训练出若干具有细微区别的所述析氧活性预测模型;具体内容包括:
对用于训练的实例数据放回式采样若干次,用每次采样的实例数据分别作为训练集进行模型训练,从而得到若干个具有细微区别的所述析氧活性预测模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,具有细微区别的所述析氧活性预测模型的数量为800-1200。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,用得到的若干个具有细微区别的析氧活性预测模型对每一个穷举出的电催化剂进行预测,使每一个电催化剂对应若干过电位预测结果并计算均值;
将穷举出的所有电催化剂按均值升序排序,选出前n个所述电催化剂,根据元素出现频率确定最终设计的电催化剂的元素;
n为正整数且小于重采样训练得到的析氧活性预测模型的数量。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,n为10。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,用穷举法得到所有满足NiaFebX1-a-b设计要求的电催化剂的内容包括:
化学成分穷举:
a的变化范围为0.05到0.95,步长为0.05;
b的变化范围为0.05到0.95,步长为0.05;
X为第三元素,范围取自元素Co、W、V、Ru、P、Au、Ce、Ir、Al、Mo、Zn、Mn、S、Se、Ti、Cr、Li、Pt和La中的任意一种;
产物形貌设置为剥离或超薄纳米片;
相种类设置为无定型相;
工作电极类型设置为玻碳电极;
电解液pH值设置为13.6。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,针对确定的最终设计的电催化剂的元素,进行细化穷举,再进行析氧活性预测模型预测并重新计算过电位预测结果的均值;将均值最小的过电位预测结果对应的电催化剂作为最终设计的电催化剂。
另一方面,本发明提供一种基于机器学习的过渡金属氢氧化物析氧电催化剂的设计系统,所述系统包括:
析氧活性预测模型构建模块,用于对采集的高维稀疏的实例数据进行化学空间稠密特征表示,再进行模型构建,得到训练好的析氧活性预测模型;
过渡金属氢氧化物析氧电催化剂设计模块,用于根据电催化剂的设计要求,用穷举法得到所有满足要求的电催化剂,并用所述析氧活性预测模型对其分别进行预测,得到所有所述电催化剂的预测结果;根据所述预测结果确定最终设计的电催化剂。
与现有技术相比,上述技术方案中的一个技术方案具有如下优点或有益效果:本发明采用高维稀疏的化学空间稠密特征表示方法,并根据成分、形貌、相、电解液pH值、工作电极类型和OER性能,利用随机森林算法,构建过渡金属氢氧化物电催化剂的析氧活性预测模型,实现析氧活性的准确、快速预测;同时结合穷举法和重采样技术,在广域成分空间搜索OER过电位低的候选过渡金属氢氧化物电催化剂配方,实现过渡金属氢氧化物电催化剂理性设计,对于具有高效开发过渡金属氢氧化物电催化剂具有重要指导意义。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一个实施例提供的化学成分特征稠密表示示意图;
图2是本发明一个实施例提供的低过电位的氢氧化物电催化剂设计流程图;
图3是本发明一个实施例提供的氢氧化物电催化剂设计结果与文献报道的对比图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种基于机器学习的过渡金属氢氧化物电催化剂的析氧活性预测方法,该方法包括了高维稀疏的化学空间稠密特征表示方法,并根据成分、形貌、相、电解液pH值、工作电极类型和OER性能,利用随机森林算法,构建过渡金属氢氧化物电催化剂的析氧活性预测模型,实现析氧活性的准确、快速预测。同时结合穷举法和重采样技术,在广域成分空间搜索OER过电位低的候选过渡金属氢氧化物电催化剂配方,实现过渡金属氢氧化物电催化剂理性设计,对于具有高效开发过渡金属氢氧化物电催化剂具有重要指导意义。
本发明的技术解决方案包括如下步骤:
(1)数据采集与准备:
采集并记录实验过程可能影响氢氧化物电催化剂OER过电位的化学成分、相种类、产物形貌、电解液pH值、工作电极类型。记录在10mA/cm2电流密度下电催化剂的析氧过电位。ORE为电催化析氧反应。
对原始采集数据进行预处理,去除重复、缺失值较多的数据,形成可建模用的数据集。
(2)数据表示:
对氢氧化物电催化剂化学成分、相种类、产物形貌和工作电极类型进行表示。其中,相种类、产物形貌和工作电极类型三个特征值属于离散变量,且不同相之间、产物形貌之间和工作电极类型之间并列、独立,所以采用标签编码的方式对相种类、产物形貌和工作电极类型进行编码。对于化学成分,由于氢氧化物电催化剂通常以Ni、Co或Fe为基,掺杂元素涉及过渡金属元素、稀土元素等二十余种,成分空间巨大,因为化学成分如果采用One-hot编码方式会造成数据高维且稀疏,因此本方法提出一种高维稀疏化学成分特征表示方法,对每个数据实例使用前三个主要化学元素(如果有更多的数据实例包含四个元素,则可以将主成分扩展到第四个,这取决于数据分布)的原子序数和摩尔分数进行表示,其中第一个(1st)、第二个(2nd)和第三个(3rd)主要元素按其摩尔分数的降序排列。高维稀疏化学成分特征表示方法如图1所示。
(3)建立过电位预测模型:将数据集按8:2分为训练集和测试集,机器学习算法选自支持向量回归(SVR)、随机森林回归(RFR)、K近邻回归(KNR)、贝叶斯岭回归(BR)、eXtreme梯度提升回归(XGBR)、梯度提升回归(GBR)和Adaboost回归(AdaBR)中的任意一种,进行模型训练。训练时将第一主要元素、第二主要元素和第三主要元素的原子序数和摩尔分数、相和形貌种类、工作电极和电解液pH值作为输入,该催化剂对应的实测过电位作为输出。对选用的机器学习模型进行网格搜索,并以5折交叉验证调整训练集上的参数以避免过度拟合。本申请一个实施例选用RFR模型来实现,RFR模型的最大深度max_depth设置为7,学习器个数n_estimators设置为70,RFR模型的准确性和不确定性最佳。n_estimators作为学习器的个数,太小或者太大,容易导致分类欠拟合或过拟合,取决于化学成分、相种类、产物形貌、电解液pH值、工作电极类型对过电位的影响关系,需要同每个学习器的决策树最大深度max_depth配合设置。这里我们对比了在训练集进行5折交叉验证下不同n_estimators和max_depth组合情况下过电位预测效果,如表1所示。
表1
模型编号 | 1 | 2 | 3 | 4 | 5 | 7 | 8 | 9 |
学习器数量 | 50 | 50 | 50 | 50 | 50 | 70 | 70 | 70 |
最大深度 | 3 | 5 | 7 | 9 | 11 | 3 | 5 | 7 |
均方根误差 | 66.74 | 66.74 | 59.38 | 67.25 | 68.12 | 72.88 | 66.87 | 52.19 |
不确定性 | 592.77 | 589.32 | 490.12 | 490.31 | 490.31 | 555.40 | 488.66 | 481.92 |
模型编号 | 10 | 11 | 13 | 14 | 15 | 16 | 17 | |
学习器数量 | 70 | 70 | 90 | 90 | 90 | 90 | 90 | |
最大深度 | 9 | 11 | 3 | 5 | 7 | 9 | 11 | |
均方根误差 | 57.33 | 58.61 | 67.58 | 66.89 | 58.27 | 66.2 | 69.77 | |
不确定性 | 493.23 | 493.23 | 478.24 | 500.15 | 490.12 | 524.89 | 524.89 |
利用该参数,在全部训练集上重新训练过电位RFR模型,并在保留测试集上对其进行评估。
(4)特征重要性分析:为了进一步分析三个主要成分、相、形态、pH值对过电位之间影响规律,在全部数据实例上计算Shapley Additive exPlanations(SHAP)值,度量每个特征对模型预测的贡献。
SHAP是Python开发的一个"模型解释"包,可以解释任何机器学习模型的输出。其名称来源于Shapley Additive exPlanation,在合作博弈论的启发下SHAP构建一个加性的解释模型,所有的特征都视为“贡献者”。对于每个预测样本,模型都产生一个预测值,SHAPvalue就是该样本中每个特征所分配到的数值.
计算SHAP值的具体做法如下:基于博弈论思想,将所有反应物和合成参数视为“贡献者”,构建一个加性的解释模型
yi=ybase+f(xi1)+f(xi2)+…+f(xik)
其中,第i个样本为xi,第i个样本的第j个特征为xij,模型对该样本的预测值为yi,模型基线为ybase,f(xij)为xij的SHAP值,即第i个样本中第j个特征对最终预测值yi的贡献值。对于每个预测样本,模型都产生一个预测值,SHAP value就是该样本中每个特征所分配到的数值。当f(xij)>0时,说明该特征提升了预测值,也正向作用;反之,说明该特征使得预测值降低,有反作用。传统的feature importance、permutation importance等重要性分析方法,可以计算得到第一主要元素、第二主要元素和第三主要元素的原子序数和摩尔分数、相和形貌种类、工作电极和电解液pH值影响过电位大小的综合重要性,但无法计算该特征如何影响预测结果。SHAP value能对于反映出每一个样本中的第一主要元素、第二主要元素和第三主要元素的原子序数和摩尔分数、相和形貌种类、工作电极和电解液pH值的影响力,并表现出影响的正负性。
(5)具有低过电位的氢氧化物电催化剂设计:设计工作流程如图2所示,首先定义并穷举成分搜索空间,利用重采样方法,在新采样数据集上采样1000次并训练1000个RFR模型,并对成分搜索空间进行预测,计算得到预测过电位的均值与方差,对预测结果按照过电位均值升序排列,对前10名的候选材料进行合成、表征和性能测试。具体操作如下:
a.首先,设计NiaFebX1-a-b的搜索空间,其中a为Ni的摩尔分数,变化范围为0.05到0.95,步长为0.05,b为Fe的摩尔分数,范围为0.05到0.95,步长为0.05,X为第三种元素,范围取自Co,W,V,Ru,P,Au,Ce,Ir,Al,Mo,Zn,Mn,S,Se,Ti,Cr,Li,Pt和La元素,Ni、Fe和X的摩尔分数之和为1。产物形貌设置为剥离/超薄纳米片,相种类设置为无定型相,工作电极的类型设置为玻碳电极(GC),电解液pH值为13.6。因此,候选催化剂的搜索空间大小约为6800。
b.为了避免预测的偶然性,并且增强模型对广域未知空间的探索能力,我们通过使用重采样方法,对步骤(1)原始收集的训练数据进行有放回采样1000次,构造1000个有细微区别的新训练样本集。经过步骤(2)特征表示,并利用步骤(3)选择的模型,在新构造的1000个新训练样本集上重新训练1000个RFR模型。这1000个模型对同一样本会产生1000个过电位预测结果。
c.将上述操作a设计的6800个搜索空间样本输入到1000个模型中,每一个搜索空间样本均得到1000个过电位预测结果,对每一个样本分别计算1000个模型预测结果的均值(μ)和标准差(σ),将预测μ进行升序排列,作为对6800个搜索空间成分筛选的评价依据。
d.设计目标是寻找具有最低过电位的候选成分。根据排序推荐结果的前10名,可以看到La作为第三个元素被预测为良好的过电位频率最高。为了进一步指导实验,对推荐的NiFeLa体系进行搜索空间细化,设计Ni的摩尔分数范围仍未为0.05到0.95,将步长细化为0.02,Fe的摩尔分数仍范围为0.05到0.95,步长细化为0.02,La元素含量与Ni和Fe之和为1,其余特征设置参照操作a。
e.重复上述操作c,对细化后的NiFeLa体系的过电位进行预测和排序,推荐得到具有最低过电位的成分。
f.对推荐成分进行实验合成、形貌表征和性能测试,在巨大搜索空间中一次实验即可获得具有最优过电位的新催化剂。
实施例1:
以NiCoFeX氢氧化物OER电催化剂的过电位(OP)预测为例。
首先,从63篇已发表的文献中手动收集包含NiCoFeX氢氧化物OER催化剂的化学成分、相、产物形貌、电解液的pH值和工作电极的类型以及测量的OP值数据,OP统一在10mA/cm2下测量获得。
化学元素X涵盖W、V、Ru、P、Au、Ce、Ir、Al、Mo、Zn、Mn、S、Se、Ti、Cr、Li、Pt和La等。相种类涵盖层状双氢氧化物(LDH)相、α相、γ相、无定形态。工作电极的类型为玻碳电极(GC)、泡沫镍(NF)、碳布/纸(C)、泡沫铁(IF)、钛网、Au/AuO/Pt网和泡沫铜(CF)等。电解液的pH值有1mol/L KOH和0.1mol/L KOH两种情况,分别对应13.6和13的pH值。产物形貌包括普通片状、剥离/超薄纳米片、多孔片、薄膜、纳米颗粒、纳米线和花瓣状等。
对产物形貌、相种类和工作电极类型分别采用标签编码方式进行编码。用数值{1,2,3,4,5,6,7}依次来表示普通片状、剥离/超薄纳米片、多孔片、薄膜、纳米颗粒、纳米线和花瓣状产物形貌。对于电极类型,可以使用{1,2,3,4,5,6,7}依次来描述玻璃碳、泡沫镍、碳布/纸、泡沫铁、钛网、Au/AuO/Pt网和泡沫铜。此外,对于相种类,使用{1,2,3,4}来描述LDH、α、γ、无定型相。
对于化学成分,掺杂元素的空间巨大,但含有掺杂元素的数据样本数量却很少,整个数据集是高维稀疏的。如果直接用化学元素来描述成分空间,就会有21个元素特征,而且大部分都是零。这种稀疏的特征表示(88个条目,25个特征)将大大增加后续机器学习对过电位预测的泛化误差。在收集到的88个化学成分中,5.68%的化学成分只含有一种化学元素,57.95%含有两种化学元素,34.09%含有三种化学元素,2.27%含有四种化学元素。其中,共有97.73%含有三种或三种以下的化学元素。通过化学元素进行稠密表示来代替稀疏表示,将化学元素特征维度从21减少到6。为每个数据实例使用前三个主要化学元素,每个主要元素,利用其原子序数及其摩尔分数进行表示。其中第一个(1st)、第二个(2nd)和第三个(3rd)主要元素按其摩尔分数的降序排列。
建立过电位预测模型。将数据集按8:2分为训练集和测试集,机器学习算法选自支持向量回归(SVR)、随机森林回归(RFR)、K近邻回归(KNR)、贝叶斯岭回归(BR)、eXtreme梯度提升回归(XGBR)、梯度提升回归(GBR)和Adaboost回归(AdaBR)。对于每个机器学习模型进行网格搜索,以5折交叉验证调整训练集上的参数以避免过度拟合。网格搜索方法主要用于模型调参,即帮助我们找到一组最合适的模型设置参数,使得模型的预测达到更好的效果,这组参数与模型训练过程中学习到的参数不同,它需要在训练前预设好,我们称其为超参数。网格搜索方法通过将给定的参数列表中的值进行随机组合,并分别评估每个组合的模型效果,从而找到一组最优的超参数。RFR模型的最大深度max_depth设置为7,学习器个数n_estimators设置为70,RFR模型的准确性和不确定性最佳。利用该参数,在全部训练集上重新训练过电位RFR模型,并在保留测试集上对其进行评估。然后,计算整个数据集上特征的SHAP值,度量每个特征对过电位模型预测的贡献。
进一步,利用OP模型设计具有高催化活性的新型催化剂。具体地:
a.首先,设计NiaFebX1-a-b的搜索空间,其中a为Ni的摩尔分数,变化范围为0.05到0.95,步长为0.05,b为Fe的摩尔分数,范围为0.05到0.95,步长为0.05,X为第三种元素,范围取自Co,W,V,Ru,P,Au,Ce,Ir,Al,Mo,Zn,Mn,S,Se,Ti,Cr,Li,Pt和La元素,Ni、Fe和X的摩尔分数之和为1。产物形貌设置为剥离/超薄纳米片,相种类设置为无定型相,工作电极的类型设置为玻碳电极(GC),电解液pH值为13.6。因此,候选催化剂的搜索空间大小约为6800。
b.为了避免预测的偶然性,并且增强模型对广域未知空间的探索能力,我们通过使用重采样方法,对步骤(1)原始收集的训练数据进行有放回采样1000次,构造1000个有细微区别的新训练样本集。经过步骤(2)特征表示,并利用步骤(3)选择的模型,在新构造的1000个新训练样本集上重新训练1000个RFR模型。这1000个模型对同一样本会产生1000个过电位预测结果。
c.将上述操作a设计的6800个搜索空间样本输入到1000个预测模型中,每一个搜索空间样本均获得1000个过电位预测结果,对每一个样本分别计算1000个模型预测结果的均值(μ)和标准差(σ),将预测μ进行升序排列,作为对6800个搜索空间成分筛选的评价依据。
d.设计目标是寻找具有最低过电位的候选成分。根据排序推荐结果的前10名,可以看到La作为第三个元素被预测为良好的过电位频率最高。为了进一步指导实验,对推荐的NiFeLa体系进行搜索空间细化,设计Ni的摩尔分数范围仍未为0.05到0.95,将步长细化为0.02,Fe的摩尔分数仍范围为0.05到0.95,步长细化为0.02,La元素含量与Ni和Fe之和为1,其余特征设置参照操作a。
e.重复上述操作c,对细化后的NiFeLa体系的过电位进行预测和排序,推荐得到具有文献未被报道的具有良好过电位的候选成分Ni0.77Fe0.13La0.1。
f.对推荐成分进行实验合成、形貌表征和性能测试,实验结果与预测结果的相对误差仅为3.84%,在巨大的搜索空间中仅一次实验即可获得具有最优过电位的新催化剂。新催化剂与文献报道的过电位性能对比如图3所示。
以上对本申请实施例所提供的一种基于机器学习的过渡金属氢氧化物析氧电催化剂的设计方法,进行了详细介绍。以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,所述方法包括:
析氧活性预测模型构建:先对高维稀疏的实例数据进行化学空间稠密特征表示,再进行模型构建,得到训练好的析氧活性预测模型;
过渡金属氢氧化物析氧电催化剂设计:根据电催化剂的设计要求,用穷举法得到所有满足要求的电催化剂,并用所述析氧活性预测模型对其分别进行预测,得到所有所述电催化剂的预测结果;根据所述预测结果确定最终设计的电催化剂;
析氧活性预测模型构建的具体步骤包括:
S11、采集实例数据,实例数据类型包括电催化剂的化学成分、相种类、产物形貌、电解液pH值、工作电极类型和析氧过电位;
S12、对采集到的数据进行稠密特征表示;
采用标签编码的方式对所述相种类、所述产物形貌和所述工作电极类型进行编码;
获取每个所述化学成分中各元素的摩尔分数,并按摩尔分数降序的方式选出主要元素;
S13、以所述主要元素的原子序数和摩尔分数,编码后的所述相种类、所述产物形貌和所述工作电极类型,以及所述电解液pH值作为输入,以对应的所述析氧过电位作为输出,进行模型训练,得到所述析氧活性预测模型。
2.根据权利要求1所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,所述析氧活性预测模型的原始模型为支持向量回归模型、随机森林回归模型、K近邻回归模型、贝叶斯岭回归模型、eXtreme梯度提升回归模型、梯度提升回归模型和Adaboost回归模型中的任意一种。
3.根据权利要求2所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,所述原始模型为随机森林回归模型,所述随机森林回归模型的设置包括:最大深度设置为7,学习器个数设置为70。
4.根据权利要求1所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,所述方法还包括:
针对全部实例数据计算SHAP值,根据所述SHAP值度量每个数据类型对析氧活性预测模型预测结果的贡献度。
5.根据权利要求1所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,析氧活性预测模型构建时采用重采样的方式训练出若干具有细微区别的所述析氧活性预测模型;具体内容包括:
对用于训练的实例数据放回式采样若干次,用每次采样的实例数据分别作为训练集进行模型训练,从而得到若干个具有细微区别的所述析氧活性预测模型。
6.根据权利要求5所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,用得到的若干个具有细微区别的析氧活性预测模型对每一个穷举出的电催化剂进行预测,使每一个电催化剂对应若干过电位预测结果并计算均值;
将穷举出的所有电催化剂按均值升序排序,选出前n个所述电催化剂,根据元素出现频率确定最终设计的电催化剂的元素;
n为正整数且小于重采样训练得到的析氧活性预测模型的数量。
7.根据权利要求6所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,用穷举法得到所有满足NiaFebX1-a-b设计要求的电催化剂的内容包括:
化学成分穷举:
a的变化范围为0.05到0.95,步长为0.05;
b的变化范围为0.05到0.95,步长为0.05;
X为第三元素,范围取自元素Co、W、V、Ru、P、Au、Ce、Ir、Al、Mo、Zn、Mn、S、Se、Ti、Cr、Li、Pt和La中的任意一种;
产物形貌设置为剥离或超薄纳米片;
相种类设置为无定型相;
工作电极类型设置为玻碳电极;
电解液pH值设置为13.6。
8.根据权利要求7所述的过渡金属氢氧化物析氧电催化剂的智能设计方法,其特征在于,针对确定的最终设计的电催化剂的元素,进行细化穷举,再进行析氧活性预测模型预测并重新计算过电位预测结果的均值;将均值最小的过电位预测结果对应的电催化剂作为最终设计的电催化剂。
9.一种过渡金属氢氧化物析氧电催化剂的智能设计系统,其特征在于,所述系统用于实现权利要求1-8任一所述的过渡金属氢氧化物析氧电催化剂的智能设计方法;所述系统包括:
析氧活性预测模型构建模块,用于对采集的高维稀疏的实例数据进行化学空间稠密特征表示,再进行模型构建,得到训练好的析氧活性预测模型;
过渡金属氢氧化物析氧电催化剂设计模块,用于根据电催化剂的设计要求,用穷举法得到所有满足要求的电催化剂,并用所述析氧活性预测模型对其分别进行预测,得到所有所述电催化剂的预测结果;根据所述预测结果确定最终设计的电催化剂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210907042.8A CN115331747B (zh) | 2022-07-29 | 2022-07-29 | 过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210907042.8A CN115331747B (zh) | 2022-07-29 | 2022-07-29 | 过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115331747A CN115331747A (zh) | 2022-11-11 |
CN115331747B true CN115331747B (zh) | 2023-03-21 |
Family
ID=83919911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210907042.8A Active CN115331747B (zh) | 2022-07-29 | 2022-07-29 | 过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115331747B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017091832A1 (en) * | 2015-11-29 | 2017-06-01 | The Regents Of The University Of California | Mesoporous nickel-iron-manganese-alloy based metal/metal oxide composite thick film catalysts |
DE102017205339A1 (de) * | 2017-03-29 | 2018-10-04 | Forschungszentrum Jülich GmbH | Chemisch beständiger, oxidischer Elektrokatalysator für die Sauerstoffentwicklung während der alkalischen Wasserelektrolyse basierend auf BaCoO3-delta, Verfahren zu seiner Herstellung und ihn umfassende Anode sowie katalytisch aktives und chemisch stabiles Reaktionsprodukt davon |
CN112626558B (zh) * | 2020-12-29 | 2021-10-26 | 派尔森环保科技有限公司 | 一种利用废弃三元镍钴锰酸锂制备高活性三元金属氧化物析氧催化剂的方法 |
CN113223628B (zh) * | 2021-04-19 | 2022-08-12 | 浙江大学 | 一种基于机器学习技术辅助金属氧化物scr催化剂快速筛选的方法 |
-
2022
- 2022-07-29 CN CN202210907042.8A patent/CN115331747B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115331747A (zh) | 2022-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Exner | A universal descriptor for the screening of electrode materials for multiple-electron processes: beyond the thermodynamic overpotential | |
Somoza-Tornos et al. | Process modeling, techno-economic assessment, and life cycle assessment of the electrochemical reduction of CO2: a review | |
Endrődi et al. | Continuous-flow electroreduction of carbon dioxide | |
Yao et al. | Machine learning for a sustainable energy future | |
Agarwal et al. | The electrochemical reduction of carbon dioxide to formate/formic acid: engineering and economic feasibility | |
CN108830423B (zh) | 一种基于预报域的年径流预测方法 | |
CN106897775A (zh) | 基于贝叶斯集成学习的软测量建模方法 | |
WO2020186109A2 (en) | Systems and methods for determining molecular structures with molecular-orbital-based features | |
CN106914254A (zh) | 碱性电化学能量转换反应用催化剂组合物及其用途 | |
Li et al. | Machine learning-assisted low-dimensional electrocatalysts design for hydrogen evolution reaction | |
Malek et al. | A data-driven framework for the accelerated discovery of CO2 reduction electrocatalysts | |
CN114022311A (zh) | 基于时序条件生成对抗网络的综合能源系统数据补偿方法 | |
CN115331747B (zh) | 过渡金属氢氧化物析氧电催化剂的智能设计方法及系统 | |
CN112132177A (zh) | 基于机器学习快速预测abo3钙钛矿带隙的在线预报方法 | |
Ding et al. | Inspecting design rules of metal-nitrogen-carbon catalysts for electrochemical CO2 reduction reaction: From a data science perspective | |
Wu et al. | Discharge performance recovery of a solid oxide fuel cell based on a prognostic-based control strategy | |
Günay et al. | Analysis of PEM and AEM electrolysis by neural network pattern recognition, association rule mining and LIME | |
Roy et al. | A route map of machine learning approaches in heterogeneous Co2 reduction reaction | |
Günay et al. | Evaluation of polymer electrolyte membrane electrolysis by explainable machine learning, optimum classification model, and active learning | |
CN116701919B (zh) | 一种陀螺式氢燃料发电机的优化监测方法及系统 | |
CN110797119B (zh) | 健康风险智能监测装置和迁移学习方法 | |
Xin et al. | Interpretable Machine Learning for Catalytic Materials Design toward Sustainability | |
Bilgiç et al. | Modeling of Artificial Neural Networks for Hydrogen Production via Water Electrolysis | |
CN116108963A (zh) | 一种基于集成学习模块的电力碳排放预测方法及设备 | |
Nahid et al. | Home occupancy classification using machine learning techniques along with feature selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |