CN112927769A - 基于孔径分布曲线的MOFs材料缺陷结构预测方法 - Google Patents
基于孔径分布曲线的MOFs材料缺陷结构预测方法 Download PDFInfo
- Publication number
- CN112927769A CN112927769A CN202110114781.7A CN202110114781A CN112927769A CN 112927769 A CN112927769 A CN 112927769A CN 202110114781 A CN202110114781 A CN 202110114781A CN 112927769 A CN112927769 A CN 112927769A
- Authority
- CN
- China
- Prior art keywords
- defect
- mofs
- model
- distribution curve
- pore size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007547 defect Effects 0.000 title claims abstract description 157
- 238000009826 distribution Methods 0.000 title claims abstract description 114
- 239000012621 metal-organic framework Substances 0.000 title claims abstract description 83
- 239000000463 material Substances 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000011148 porous material Substances 0.000 title claims abstract description 50
- 239000003446 ligand Substances 0.000 claims abstract description 53
- 238000010801 machine learning Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 29
- 239000013078 crystal Substances 0.000 claims abstract description 11
- 238000005094 computer simulation Methods 0.000 claims abstract description 9
- 238000012217 deletion Methods 0.000 claims abstract description 5
- 230000037430 deletion Effects 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000013110 organic ligand Substances 0.000 claims description 4
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 239000013207 UiO-66 Substances 0.000 description 10
- 238000011160 research Methods 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012900 molecular simulation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005054 agglomeration Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于孔径分布曲线的MOFs材料缺陷结构预测方法,首先,以一种MOFs的完美晶体结构为母体,基于计算机模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;然后基于计算机模拟计算出所有缺陷结构的孔径分布曲线,对孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;再利用数据集训练机器学习模型;最后将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。本发明可通过孔径分布曲线快速准确地确定MOFs材料的缺陷含量。
Description
技术领域
本发明涉及MOFs材料缺陷程度测量技术领域,特别涉及一种基于孔径分布曲线的MOFs材料缺陷结构预测方法。
背景技术
金属有机骨架(Metal-organic frameworks,MOFs)材料是一种新型多孔材料,由金属离子或无机团簇通过有机配体以配位键或共价键桥接形成的具有一维、二维或三维周期性无限网络结构的无机-有机杂化材料。MOFs具有发达的孔隙结构、较高的比表面积和孔隙率以及结构的可调节性和稳定性,相比于其他传统多孔材料在吸附分离方面具有优异的性能。与传统晶体缺陷的产生过程相似,若MOFs的自组装合成过程被外界因素所干扰,则会产生具有配体缺失和金属簇缺失两种缺陷类型的MOFs材料。向MOFs结构中有意地引入这两种缺陷可以调节其外表面性质、内部孔隙结构以及产生额外的开放金属位点,由此合成的缺陷MOFs在吸附、分离、催化等方面具有相比于完美结构更为优异的性能,用缺陷工程对MOFs材料进行改性是具有潜力的一种方法。
目前,原位实验表征技术(如XRD等)的精度仍难以探测出MOFs上微小的结构变化,因此大部分关于缺陷MOFs的研究停留在对缺陷的定性表征以及对缺陷含量的调控上。然而,传统的实验表征技术相当费时费力,耗费的时间和实验成本在一定程度上阻碍了针对缺陷MOFs的构-效关系研究。而计算机分子模拟虽然能够从分子层面上定量研究MOFs缺陷的构-效关系,但是传统的分子模拟是一种计算密集型技术,倘若计算机系统研究MOFs材料中所有可能的缺陷类型,这将产生海量的计算量,会耗费巨大的计算资源和时间成本。因此,本领域需要一种快速预测MOFs材料缺陷结构的方法,能够比较精准地描述缺陷的含量。
发明内容
本发明的第一目的在于克服现有技术的缺点与不足,提供一种基于孔径分布曲线的MOFs材料缺陷结构预测方法,该方法可以利用孔径分布曲线快速预测MOFs材料的缺陷含量,准确度高且具有普适性。
本发明的第二目的在于提供一种基于孔径分布曲线的MOFs材料缺陷结构预测装置。
本发明的第三目的在于提供一种计算机可读存储介质。
本发明的第四目的在于提供一种计算设备。
本发明的第一目的通过下述技术方案实现:一种基于孔径分布曲线的MOFs材料缺陷结构预测方法,包括如下步骤:
S1、以一种MOFs的完美晶体结构为母体,基于计算机模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
S2、基于计算机模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
S3、对步骤S2中的孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
S4、利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
S5、将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
优选的,在步骤S1中,遍历缺陷的含量范围为0.1~0.9;缺陷的分布采用Warren-Cowley参数定量描述,参数范围为-1.0~1.0;
Warren-Cowley参数定义为:
其中,α表示Warren-Cowley参数;假设有机配体分为A、B两组,定义A组中的配体为A配体,定义B组中的配体为B配体,B配体表示缺陷形成时丢失的配体,A配体表示剩余的配体,PA(B)表示B配体在A配体邻近,也即A、B配体连接同一个节点所出现的概率;xB表示B配体占所有配体的比例。
优选的,通过蒙特卡洛方法计算孔径分布,生成孔径分布曲线。
优选的,在步骤S4训练机器学习模型的过程中,采用随机取样的方式并按比例将数据集划分训练集和测试集,利用训练集建模,利用测试集评估模型所预测的缺陷含量的准确性,以对模型进行调参。
更进一步的,评估模型的预测准确性时,计算的误差包括可决系数、平均绝对误差、均方差、均方根误差。
优选的,机器学习模型包括决策回归树、随机森林、k近邻、梯度提升回归树的其中一种;调节模型超参数的方法包括网格搜索法、随机搜索法、贝叶斯优化的其中一种。
本发明的第二目的通过下述技术方案实现:一种基于孔径分布曲线的MOFs材料缺陷结构预测装置,包括:
缺陷结构数据库生成模块,用于以一种MOFs的完美晶体结构为母体,模拟遍历该MOFs配体缺失缺陷的含量,生成MOFs的缺陷结构数据库;
孔径分布曲线计算模块,用于模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
数据集构建模块,用于对孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
模型训练模块,用于利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
预测模块,用于将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
本发明的第三目的通过下述技术方案实现:一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现本发明第一目的所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法。
本发明的第四目的通过下述技术方案实现:一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现本发明第一目的所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明结合机器学习技术与传统分子模拟方法,提出了基于孔径分布曲线的MOFs材料缺陷结构预测方法,该方法以一种MOFs材料所有可能的缺陷结构为基础,以孔径分布曲线为机器学习模型的输入特征,利用机器学习来实现预测MOFs材料的缺陷含量,既能做到准确度高,又能高效完成缺陷的预测,能够为后续研究缺陷MOFs的定量构效关系提供高质量的材料学数据。
(2)本发明方法基于缺陷材料的孔径分布曲线即可快速预测缺陷材料的缺陷含量,因此容易应用至多种MOFs材料缺陷程度的定量测量上,具有较高的普适性,有利于促进MOFs材料缺陷工程构-效关系研究的发展。
附图说明
图1为本发明基于孔径分布曲线的MOFs材料缺陷结构预测方法的流程图。
图2为4种典型缺陷UiO-66材料的孔径分布曲线图。
图3为决策树模型预测的UiO-66材料缺陷含量与实际缺陷含量的散点图。
图4为随机森林模型预测的UiO-66材料缺陷含量与实际缺陷含量的散点图。
图5为梯度加速回归树模型预测的UiO-66材料缺陷含量与实际缺陷含量的散点图。
图6为k近邻模型预测的UiO-66材料缺陷含量与实际缺陷含量的散点图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
本实施例公开了一种基于孔径分布曲线的MOFs材料缺陷结构预测方法,如图1所示,包括如下步骤:
S1、以一种MOFs的完美晶体结构为母体,基于计算机模拟遍历该MOFs“配体缺失”缺陷的含量和分布,生成MOFs的缺陷结构数据库,该数据库可含有400种以上的缺陷结构。
这里,遍历缺陷的含量范围为0.1~0.9,缺陷的含量是指丢失配体占所有配体的比例,比例越大,缺陷的含量越大。
缺陷的分布可采用Warren-Cowley参数定量描述,参数范围为-1.0~1.0,涵盖了MOFs的均匀-随机-团聚状态,其中,-1.0表示丢失的配体在材料中均匀分布,1.0表示团聚分布,0则表示随机分布。Warren-Cowley参数定义为:
其中,α表示Warren-Cowley参数;假设有机配体分为A、B两组,定义A组中的配体为A配体,定义B组中的配体为B配体,B配体表示缺陷形成时丢失的配体,A配体表示剩余的配体,PA(B)表示B配体在A配体邻近(即A、B配体连接同一个节点)所出现的概率;xB表示B配体占所有配体的比例。
S2、基于计算机模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线。这里,采用的是蒙特卡洛(MC)方法来计算孔径分布,进而生成孔径分布曲线。蒙特卡洛方法主要是使用一个虚拟的原子探针在材料结构中随机插入,不同的探针大小可以探测到不同的孔径,采样次数可达20000次以上。当然,在其他实施例中,也可以采用其他计算方法来生成孔径分布曲线。
S4、利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求。
其中,机器学习模型包括决策回归树、随机森林、k近邻、梯度提升回归树的其中一种。
调节模型超参数的方法包括网格搜索法、随机搜索法、贝叶斯优化的其中一种。
在训练过程中,可采用随机取样的方式并按比例(如7:3或8:2)将数据集划分训练集和测试集,利用训练来建模,利用测试集来评估模型所预测的缺陷含量的准确性,以对模型进行调参。
模型的预测准确性可通过计算预测的缺陷结构与数据集中的已知缺陷结构之间的误差来评估,这里,误差包括可决系数(determined coefficients,R2)、平均绝对误差(mean absolute error,MAE)、均方差(mean square error,MSE)、均方根误差(root-mean-square error,RMSE)。
误差公式如下:
其中,i为缺陷结构数据库中的缺陷结构样本的序号;nsamples为缺陷结构数据库中的缺陷结构样本个数;xi为实际的缺陷含量,yi为机器学习模型预测的缺陷含量,y为预测的缺陷含量的平均值。
S5、对于待测的MOFs材料,采用蒙特卡洛(MC)方法计算得到孔径分布曲线,然后将该孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出该MOFs材料的缺陷含量。
为进一步说明上述方法,本实施例还以UiO-66为例进行验证:
(1)以UiO-66的完美晶体结构为母体,基于计算机模拟生出多种缺陷结构:先把模拟尺寸扩展至3×3×3晶胞大小,然后对UiO-66的“配体缺失”缺陷含量在[0.1,0.9]范围内以0.05间隔取值,缺陷分布以Warren-Cowley参数描述,在[-0.1,0.38]范围内以0.02间隔取值,一共衍生出425种缺陷结构,这425种缺陷结构组成数据集。
如图2为四种典型的缺陷UiO-66材料的孔径分布曲线,分别为缺陷含量为0.1且均匀分布、缺陷含量为0.3且集中分布、缺陷含量为0.6且较为集中分布,以及缺陷含量为0.9且较为集中分布的缺陷材料。
采用随机抽样的方式抽取数据集中80%的数据样本作为训练集,用于机器学习模型的构建,剩余20%的数据样本作为测试集,用于评估机器学习模型的预测准确性。
(4)选用了四种机器学习模型,分别为决策树模型、随机森林、梯度加速回归树以及k近邻模型,来训练成预测模型。
具体来说,以孔径分布曲线作为各模型的输入特征,以缺陷含量为各模型的输出的预测变量,采用5折交叉验证方法以及R2配合网格搜索方法对模型的超参数进行调参,取在训练集上分数最高的那组超参数作为最佳的参数组合。
四种模型的调参结果以及在训练集上的分数如表1所示。
表1
由表1可知,四种机器学习模型在训练集上的5折交叉验证分数在0.884~0.966之间,说明基于孔径分布曲线所训练出的模型在训练集上具有较好的性能。四种模型的调参及训练时间总共在2分钟内,预测推理时间可忽略不计,因此相比于耗时耗力的传统实验表征方法更具有高效快速的显著优势。
(5)基于步骤(4)中所训练好的机器学习模型,对测试集进行缺陷含量的预测。四种模型在测试集上的5折交叉验证分数如表1所示,对训练集中样本的缺陷含量预测结果如图3~6所示。
从图3~6中可知,四种机器学习模型在训练集和测试集上的R2分数相近,说明在测试集上模型并没有发生过拟合,在测试集上分数较高,说明模型具有较好的泛化能力。基于孔径分布曲线预测得到的缺陷含量与数据集中的已知缺陷含量之间的RMSE在0.0459~0.0697之间,数值较小,说明模型确实能够比较准确地预测缺陷UiO-66材料的缺陷含量。
实施例2
本实施例公开了一种基于孔径分布曲线的MOFs材料缺陷结构预测装置,可实现实施例1中的MOFs材料缺陷结构预测方法,该装置包括:
缺陷结构数据库生成模块,用于以一种MOFs的完美晶体结构为母体,模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
孔径分布曲线计算模块,用于模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
数据集构建模块,用于对孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集,并将数据集;
模型训练模块,用于利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
预测模块,用于将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
在此需要说明的是,本实施例的装置仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
实施例3
本实施例公开了一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现实施例1所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法,具体如下:
S1、以一种MOFs的完美晶体结构为母体,模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
S2、模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
S3、对步骤S2中的孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
S4、利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
S5、将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
本实施例中的计算机可读存储介质可以是磁盘、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、U盘、移动硬盘等介质。
实施例4
本实施例公开了一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现实施例1所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法,具体如下:
S1、以一种MOFs的完美晶体结构为母体,模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
S2、模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
S3、对步骤S2中的孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
S4、利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
S5、将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
本实施例中所述的计算设备可以是台式电脑、笔记本电脑、平板电脑或其他具有处理器功能的终端设备。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于孔径分布曲线的MOFs材料缺陷结构预测方法,其特征在于,包括如下步骤:
S1、以一种MOFs的完美晶体结构为母体,基于计算机模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
S2、基于计算机模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
S3、对步骤S2中的孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
S4、利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
S5、将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
3.根据权利要求1所述的MOFs材料缺陷结构预测方法,其特征在于,通过蒙特卡洛方法计算孔径分布,生成孔径分布曲线。
5.根据权利要求1所述的MOFs材料缺陷结构预测方法,其特征在于,在步骤S4训练机器学习模型的过程中,采用随机取样的方式并按比例将数据集划分训练集和测试集,利用训练集建模,利用测试集评估模型所预测的缺陷含量的准确性,以对模型进行调参。
6.根据权利要求5所述的MOFs材料缺陷结构预测方法,其特征在于,评估模型的预测准确性时,计算的误差包括可决系数、平均绝对误差、均方差、均方根误差。
7.根据权利要求1所述的MOFs材料缺陷结构预测方法,其特征在于,机器学习模型包括决策回归树、随机森林、k近邻、梯度提升回归树的其中一种;调节模型超参数的方法包括网格搜索法、随机搜索法、贝叶斯优化的其中一种。
8.一种基于孔径分布曲线的MOFs材料缺陷结构预测装置,其特征在于,包括:
缺陷结构数据库生成模块,用于以一种MOFs的完美晶体结构为母体,模拟遍历该MOFs配体缺失缺陷的含量和分布,生成MOFs的缺陷结构数据库;
孔径分布曲线计算模块,用于模拟计算缺陷结构数据库中所有缺陷结构的孔径分布曲线;
数据集构建模块,用于对孔径分布曲线进行间隔取点,得到不同孔径下对应的孔径分布,并整理成数据集;
模型训练模块,用于利用数据集训练机器学习模型,以孔径分布曲线作为模型输入特征,以孔径分布曲线所对应的缺陷含量作为模型输出的预测目标变量,迭代模型的超参数,直至模型的预测准确性满足精度要求;
预测模块,用于将待测的MOFs材料的孔径分布曲线输入到训练好的机器学习模型中,由机器学习模型预测出对应的缺陷含量。
9.一种计算机可读存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1至7中任一项所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法。
10.一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现权利要求1至7中任一项所述的基于孔径分布曲线的MOFs材料缺陷结构预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114781.7A CN112927769B (zh) | 2021-01-26 | 2021-01-26 | 基于孔径分布曲线的MOFs材料缺陷结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114781.7A CN112927769B (zh) | 2021-01-26 | 2021-01-26 | 基于孔径分布曲线的MOFs材料缺陷结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112927769A true CN112927769A (zh) | 2021-06-08 |
CN112927769B CN112927769B (zh) | 2022-05-24 |
Family
ID=76167355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110114781.7A Expired - Fee Related CN112927769B (zh) | 2021-01-26 | 2021-01-26 | 基于孔径分布曲线的MOFs材料缺陷结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112927769B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114705824A (zh) * | 2022-03-30 | 2022-07-05 | 广州市光铭金属制品有限责任公司 | 一种金属元件产品缺陷检测方法及系统 |
CN114743617A (zh) * | 2022-04-13 | 2022-07-12 | 北京化工大学 | 一种高效的MOFs材料搜索与生成方法 |
US11971340B1 (en) * | 2022-11-24 | 2024-04-30 | Nanjing Tech University | Method for predicting lattice defect in metal-organic framework membrane |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120297982A1 (en) * | 2011-04-04 | 2012-11-29 | Massachusetts Institute Of Technology | Methods for Electrochemically Induced Cathodic Deposition of Crystalline Metal-Organic Frameworks |
CN107189074A (zh) * | 2017-05-26 | 2017-09-22 | 西安电子科技大学 | 基于脂质体膜的金属有机骨架材料的表面功能化修饰方法 |
WO2017210874A1 (en) * | 2016-06-08 | 2017-12-14 | Xia, Ling | Imperfect mofs (imofs) material, preparation and use in catalysis, sorption and separation |
WO2018065555A1 (en) * | 2016-10-06 | 2018-04-12 | Immaterial Labs Ltd | Metal-organic frameworks, methods for their manufacture and uses thereof |
CN108268750A (zh) * | 2018-01-19 | 2018-07-10 | 吉林大学 | 基于枚举Wyckoff位置组合的假想无机晶体结构预测方法 |
CN109883954A (zh) * | 2019-02-18 | 2019-06-14 | 北京交通大学 | 一种基于MOFs表面缺陷型光子晶体传感器及其制作方法 |
CN110694693A (zh) * | 2019-09-10 | 2020-01-17 | 温州大学 | 一种碳布负载的MoSx/UiO-66复合材料及制备方法与用途 |
CN110964207A (zh) * | 2019-11-22 | 2020-04-07 | 华南理工大学 | 自由基可控释放缺陷配位金属有机骨架及制备方法与应用 |
CN111205469A (zh) * | 2020-01-19 | 2020-05-29 | 中山大学 | 一种超微孔锆基金属有机骨架材料及其制备方法和应用 |
CN111783338A (zh) * | 2020-06-30 | 2020-10-16 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的微观组织金属强度分布预测方法及装置 |
CN112126072A (zh) * | 2020-09-17 | 2020-12-25 | 福建工程学院 | 一种超四面体金属有机框架材料、其制备方法及应用 |
-
2021
- 2021-01-26 CN CN202110114781.7A patent/CN112927769B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120297982A1 (en) * | 2011-04-04 | 2012-11-29 | Massachusetts Institute Of Technology | Methods for Electrochemically Induced Cathodic Deposition of Crystalline Metal-Organic Frameworks |
WO2017210874A1 (en) * | 2016-06-08 | 2017-12-14 | Xia, Ling | Imperfect mofs (imofs) material, preparation and use in catalysis, sorption and separation |
WO2018065555A1 (en) * | 2016-10-06 | 2018-04-12 | Immaterial Labs Ltd | Metal-organic frameworks, methods for their manufacture and uses thereof |
CN107189074A (zh) * | 2017-05-26 | 2017-09-22 | 西安电子科技大学 | 基于脂质体膜的金属有机骨架材料的表面功能化修饰方法 |
CN108268750A (zh) * | 2018-01-19 | 2018-07-10 | 吉林大学 | 基于枚举Wyckoff位置组合的假想无机晶体结构预测方法 |
CN109883954A (zh) * | 2019-02-18 | 2019-06-14 | 北京交通大学 | 一种基于MOFs表面缺陷型光子晶体传感器及其制作方法 |
CN110694693A (zh) * | 2019-09-10 | 2020-01-17 | 温州大学 | 一种碳布负载的MoSx/UiO-66复合材料及制备方法与用途 |
CN110964207A (zh) * | 2019-11-22 | 2020-04-07 | 华南理工大学 | 自由基可控释放缺陷配位金属有机骨架及制备方法与应用 |
CN111205469A (zh) * | 2020-01-19 | 2020-05-29 | 中山大学 | 一种超微孔锆基金属有机骨架材料及其制备方法和应用 |
CN111783338A (zh) * | 2020-06-30 | 2020-10-16 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的微观组织金属强度分布预测方法及装置 |
CN112126072A (zh) * | 2020-09-17 | 2020-12-25 | 福建工程学院 | 一种超四面体金属有机框架材料、其制备方法及应用 |
Non-Patent Citations (4)
Title |
---|
刘治鲁 等: "金属有机骨架的高通量计算筛选研究进展", 《化学学报》 * |
柳泽伟: "金属-有机骨架材料吸附分离性能的功能化改性计算化学研究及高通量筛选", 《中国博士学位论文全文数据库 工程科技Ⅰ辑》 * |
段崇雄 等: "金属-有机骨架材料水相合成路线研究进展(英文)", 《SCIENCE CHINA MATERIALS》 * |
王敏: "静电纺纳米纤维基水凝胶的构筑及其在金属离子回收利用方面的研究", 《中国博士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114705824A (zh) * | 2022-03-30 | 2022-07-05 | 广州市光铭金属制品有限责任公司 | 一种金属元件产品缺陷检测方法及系统 |
CN114743617A (zh) * | 2022-04-13 | 2022-07-12 | 北京化工大学 | 一种高效的MOFs材料搜索与生成方法 |
US11971340B1 (en) * | 2022-11-24 | 2024-04-30 | Nanjing Tech University | Method for predicting lattice defect in metal-organic framework membrane |
Also Published As
Publication number | Publication date |
---|---|
CN112927769B (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112927769B (zh) | 基于孔径分布曲线的MOFs材料缺陷结构预测方法 | |
CN112382352B (zh) | 基于机器学习的金属有机骨架材料结构特征快速评估方法 | |
Stanislawska et al. | Modeling global temperature changes with genetic programming | |
Lloyd | I—Elisabeth A. Lloyd: Varieties of support and confirmation of climate models | |
Fock | Global sensitivity analysis approach for input selection and system identification purposes—A new framework for feedforward neural networks | |
CN113642666B (zh) | 一种基于样本扩充和筛选的主动增强软测量方法 | |
Nan et al. | Groundwater parameter estimation using the ensemble Kalman filter with localization | |
CN113360983B (zh) | 一种边坡可靠度分析与风险评估方法 | |
Stiskalek et al. | The scatter in the galaxy–halo connection: a machine learning analysis | |
CN114898826A (zh) | 基于mof的机器学习算法优选方法、存储介质及计算设备 | |
CN114861519B (zh) | 复杂地质条件下初始地应力场加速优化反演方法 | |
Li et al. | Computer simulation of gas generation and transport in landfills: VI—Dynamic updating of the model using the ensemble Kalman filter | |
WO2022082739A1 (zh) | 基于卷积神经网络预测蛋白和配体分子结合自由能的方法 | |
CN115062551B (zh) | 一种基于时序神经网络的湿物理过程参数化方法 | |
CN114692529B (zh) | 一种cfd高维响应的不确定度量化方法、装置、计算机设备 | |
Abdollahzadeh et al. | A parallel GA-EDA hybrid algorithm for history-matching | |
CN111274689B (zh) | 在历史拟合中寻求储层物性组合的非唯一解的方法及设备 | |
CN113808681A (zh) | 基于SHAP-CatBoost快速预测ABO3型钙钛矿材料比表面积的方法及其系统 | |
CN112381270A (zh) | 基于甲烷吸附等温线的MOFs材料缺陷预测方法 | |
CN112307670A (zh) | 基于bagging集成神经网络的压水堆堆芯参数预测模型设计方法 | |
CN112016956A (zh) | 基于bp神经网络的矿石品位估值方法及装置 | |
Micciche | Modeling long-range memory with stationary markovian processes | |
CN111062118A (zh) | 一种基于神经网络预测分层的多层软测量建模系统及方法 | |
Liang et al. | Diffusion behavior study of model diesel components in polymer membranes based on neural network for pattern recognition | |
Sun et al. | Surrogate Neural Networks to Estimate Parametric Sensitivity of Ocean Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220524 |