CN111755081A - 一种高甲烷吸附率MOFs生成与筛选的方法 - Google Patents
一种高甲烷吸附率MOFs生成与筛选的方法 Download PDFInfo
- Publication number
- CN111755081A CN111755081A CN202010374619.4A CN202010374619A CN111755081A CN 111755081 A CN111755081 A CN 111755081A CN 202010374619 A CN202010374619 A CN 202010374619A CN 111755081 A CN111755081 A CN 111755081A
- Authority
- CN
- China
- Prior art keywords
- mofs
- methane adsorption
- screening
- samples
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 title claims abstract description 66
- 239000012621 metal-organic framework Substances 0.000 title claims abstract description 58
- 238000001179 sorption measurement Methods 0.000 title claims abstract description 31
- 238000012216 screening Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000013210 evaluation model Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 2
- 230000015654 memory Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 230000002194 synthesizing effect Effects 0.000 abstract description 3
- 230000000306 recurrent effect Effects 0.000 abstract description 2
- 238000003062 neural network model Methods 0.000 abstract 1
- 239000013110 organic ligand Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0027—General constructional details of gas analysers, e.g. portable test equipment concerning the detector
- G01N33/0036—General constructional details of gas analysers, e.g. portable test equipment concerning the detector specially adapted to detect a particular component
- G01N33/0047—Organic compounds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Combustion & Propulsion (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种高甲烷吸附率MOFs生成与筛选的方法,获取到数据集内MOFs的简化分子线性输入规范并利用SMILES计算分子指纹,使用循环神经网络模型生成大量假设性MOFs的SMILES表示形式,设计评估模型来判断生成样本的有效性,同时设计并比较不同分类器与不同输入数据的分类效果,筛选出性能最佳的分类器,最后使用训练好的分类器对评估为有效的假设性MOFs的样本进行甲烷吸附性能的预测,筛选出高甲烷吸附率的假设性MOFs,为在实验室合成高甲烷吸附率的MOFs提供参考。
Description
技术领域
本发明属于功能MOFs智能生成和筛选技术领域,特别涉及一种高甲烷吸附率MOFs生成与筛选的方法。
背景技术
甲烷是一种应用十分广泛的清洁能源,但是它的传统存储方式比较耗能,人们仍在寻找更加的存贮方式。由于金属有机骨架化合物(Metal-Organic Frameworks,MOFs)是由无机金属中心(金属离子或金属簇)与桥连的有机配体通过自组装相互连接形成的一类具有周期性网络结构的晶态多孔材料,它具有纳米级孔隙,这些孔隙使MOFs能够有效地捕获气体分子,所以MOFs可以用于甲烷的存储,进而具有更高的甲烷吸附率的MOFs是技术人员研究的重点。
对于寻找或设计新型MOFs这个问题,传统的研究思路是通过合成新配体或改变配位方式等方式来获得高性能的新型结构的MOFs。然而传统方法需要大量人工参与,实验进展缓慢。随着MOFs十几年来的发展,已经积累了大量数据,使得通过人工智能进行数据训练设计并且筛选有效的化学结构的新材料成为可能。
发明内容
本发明的目的在于提供一种高甲烷吸附率MOFs生成与筛选的方法,通过人工智能进行数据训练设计并且筛选具有高甲烷吸附率化学结构的MOFs以提高搜索效率,为在实验室合成高甲烷吸附率的MOFs提供参考依据。
技术方案如下:
一种高甲烷吸附率MOFs生成与筛选的方法,包括以下步骤:
1)计算SMILES表示形式;
2)使用SMILES计算分子指纹;
3)构建并训练RNN模型生成假设性MOFs的SMILES表示形式;
4)构建评估模型判断RNN模型生成样本的有效性;
5)筛选性能最佳分类器;
6)通过性能最佳分类器对评估为有效MOFs的假设样本进行甲烷吸附性能的预测以筛选出高甲烷吸附率的假设性MOFs。
优选的,所述步骤2)中分子指纹形式包括MACCS、RDKit、Morgan和Avalon。
优选的,所述步骤3)中,RNN模型采用最原始的输入和输出序列等长的结构,采用LSTM提升模型处理长期依赖的能力,模型的损失函数采用交叉熵。
优选的,所述步骤4)中,首先计算数据集内每个样本的MACCS、RDkit、Morgan和Avalon分子指纹的Tanimoto系数以衡量最大相似度,并求其平均值得到相应数据分布图,再计算RNN模型生成样本与数据集内样本的MACCS、RDkit、Morgan和Avalon分子指纹的平均最大相似度,最后设定置信区间,若生成样本的计算结果在对应置信区间内,则认为生成样本属于有效MOFs的假设样本。
优选的,所述步骤5)具体为:将数据集内大部分样本作为训练集,另一部分样本作为测试集,运用卷积神经网络、长短期记忆网络、多层感知机、朴素贝叶斯、k最邻近、逻辑回归、支持向量机分类器,结合训练集内的SMILES表示形式和分子指纹输入数据对MOFs的甲烷吸附率的高低进行训练,使用测试集内的数据对计算出的各分类器的准确率、精确率、召回率、F1分数、AUC分类指标进行度量以筛选出综合性能最佳的分类器。
本发明的有益效果为:
一、本发明设计模型时无需由专家对MOF各项性质进行计算,极大地节约了时间和人力;
二、本发明训练出的RNN模型可学习到高性能MOFs的共性为生成新材料提供可能;
三、本发明的评估模型避免了生成样本的评估的人为筛选;
四、本发明方法挑选出的的分类器分类效果准确,针对甲烷的高吸附率MOFs的筛选准确率和效率高。
附图说明
图1是本发明一种高甲烷吸附率MOFs生成与筛选的方法的流程图。
图2是本发明中MOFs的一些有机配体的SMILES表示形式。
图3是本发明中RNN模型的结构图。
图4是本发明中RNN模型学习生成SMILES为“OC/C=C/C=C/CO”的分子的例子。
图5是本发明中7种分类器的PR曲线和ROC曲线。
图6是本发明中RNN模型训练过程中的损失图像。
图7是本发明中分子指纹在数据集内最大相似度的频率直方图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合实施例对本发明提供的高甲烷吸附率MOFs生成与筛选的方法进行详细描述。以下实施例仅用于说明本发明而非用于限制本发明的范围。
本发明提供的高甲烷吸附率MOFs生成与筛选的方法:包括以下步骤:
第一步,计算MOFs数据集内样本的简化分子线性输入规范(SMILES)表示形式;
第二步,使用SMILES计算MACCS、RDKit、Morgan、Avalon分子指纹;
第三步,设计并训练循环神经网络(RNN)模型生成大量假设性MOFs的SMILES表示形式,模型采用最原始的输入和输出序列等长的结构,其中RNN模块采用LSTM以提升模型处理长期依赖的能力,模型的损失函数采用交叉熵;
第四步,设计评估模型来判断RNN模型生成样本的有效性,首先计算数据集内每个样本的MACCS、RDkit、Morgan、Avalon分子指纹的最大相似度(使用Tanimoto系数进行衡量),并求其平均值得到相应数据分布图,再计算模型生成样本与数据集内样本的4种分子指纹的平均最大相似度,最后设定符合实验要求的置信度,若生成样本的计算结果在对应置信区间内,则认为生成样本与数据集内样本是相似的,属于有效MOFs的样本;
第五步,设计并筛选出性能最佳的分类器,将数据集内80%样本作为训练集,20%样本作为测试集,运用卷积神经网络(Convolutional Neural Networks,CNN)、长短期记忆网络(Long Short-Term Memory,LSTM)、多层感知机(Multilayer Perceptron,MLP)、朴素贝叶斯(Naive Bayes,NB)、k最邻近(k-Nearest Neighbor,kNN)、逻辑回归(LogisticRegression,LR)、支持向量机(Support Vector Machine,SVM)分类器,结合训练集内的SMILES表示形式、MACCS、RDKit、Morgan、Avalon分子指纹输入数据对MOFs的甲烷吸附率的高低进行训练。使用测试集内的数据对计算出的各个分类器的准确率、精确率、召回率、F1分数、ROC曲线下与坐标轴围成的面积(AUC)等5项分类指标进行度量,挑选出综合性能最佳的分类器;
第六步,训练好的分类器对评估为有效MOFs的样本进行甲烷吸附性能的预测,筛选出高甲烷吸附率的假设性MOFs。
实施例1
采用实际数据分析本发明提出的模型效果。实验根据图1所示的流程图用Python实现,使用NVIDIA Tesla K80 GPU对模型进行训练。本发明使用的数据库是2016年Chung YG等人发表于《Science Advances》上的论文“In silico discovery of metal-organicframeworks for precombustion CO2capture using a genetic algorithm”得到的包含51163种MOFs的晶体信息文件(CIF)的数据库。SMILES用一串字符串描述一个化学结构,分子指纹将分子解构并编码成位串,通过简单的“是-否”检查是否存在预定义的一组功能组,MACCS、RDKit、Morgan、Avalon指纹是长度不等的二进制字符串。本发明使用Open Babel软件将CIF转化为SMILES并用RDKit工具包计算与SMILES对应的4种分子指纹作为模型训练的数据集,将数据集内80%的数据作为训练集,其余为测试集。图2是MOFs的一些有机配体的SMILES表示形式。
图3显示了RNN模型的原理,xt是第t层的输入,ht是第t层的隐藏状态,它负责整个神经网络的记忆功能,由上一层的隐藏状态ht-1和本层的输入xt共同决定。ot是第t层的输出,模型的线性关系参数U、V、W都是共享的。图4举了模型生成SMILES为“OC/C=C/C=C/CO”的分子的例子。SMILES的每种字符都使用独热向量进行编码,当前字符的输出目标是下一个字符。由于SMILES的长度是不同的,设置结束符“\n”,遇到结束符循环停止。若目标与实际输出不同,模型产生损失,损失函数采用交叉熵。训练过程中使用随机梯度下降算法减小模型的损失,学习率设置为0.0001。图6显示了RNN模型训练过程的模型损失图像。图6(a)将批尺寸设置为128,损失曲线震荡较多,效果不佳;图6(b)将批尺寸设置为256,损失曲线更加稳定,收敛到0.3附近。模型生成效果如表1所示。
表1各时期模型生成效果
设定评估模型时,首先计算了样本的4种分子指纹分别在数据集内最大相似度的频率直方图,如图7所示。图7(a)显示存在约16000个样本的MACCS指纹最大相似度为1,这意味着对于这16000中的每一个样本,数据集内至少存在一个与其MACCS指纹完全相同的样本。其余数据约呈线性分布,最小值为0.0965。图7(b)显示除约1800个样本的RDKit指纹最大相似度为1外,其余样本的Rdkit指纹最大相似度大致服从高斯分布,均值为0.8923,最小值为0.5357。图7(c)显示样本的Morgan指纹具有最高频率的最大相似度是0.4917,剩余数据呈指数函数并分布在最高频的两侧,最小值为0.0965。图7(d)显示样本的Avalon指纹的最大相似度呈高斯分布,均值0.8019,最小值0.5077。然后,求得样本的4种分子指纹在数据集内最大相似度的平均值的频率直方图,如图7(e)所示,认定为服从高斯分布,最小值0.5077,均值0.8019。设定评估模型设定区间置信度99.87%,置信区间为[0.5949,1],计算模型生成样本与训练集内样本的4种分子指纹的平均最大相似度,若处于置信区间内,则认定它属于假设性MOFs。
构造分类器对MOFs的甲烷吸附率的高低进行分类时,本发明将CNN、LSTM、MLP、NB、kNN、LR、SVM等7种分类模型与SMILES表示形式、MACCS、RDKit、Morgan、Avalon分子指纹等5种输入数据进行组合,共有35种组合情况。图5是本发明中7种已挑选出各自最佳输入数据的分类器的PR曲线和ROC曲线,图像显示使用SMILES作为数据输入,CNN作为分类器时分类效果最佳,此时准确率为0.9437,精确率为0.9421,召回率为0.9440,F1分数为0.9430,AUC为0.9866,各项分类指标均为最佳。
对RNN模型的生成样本进行评估,以生成10000个样本为例,生成SMILES的语法正确率为63.89%,认定属于假设性MOFs的样本占语法正确样本的88.26%,认定属于假设性MOFs的样本中属于高甲烷吸附率MOFs的概率是16.44%。
上面结合实施例对本发明的实例作了详细说明,但是本发明并不限于上述实例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出的各种变化,也应视为本发明的保护范围。
Claims (5)
1.一种高甲烷吸附率MOFs生成与筛选的方法,其特征在于,包括以下步骤:
1)计算SMILES表示形式;
2)使用SMILES计算分子指纹;
3)构建并训练RNN模型生成假设性MOFs的SMILES表示形式;
4)构建评估模型判断RNN模型生成样本的有效性;
5)筛选性能最佳分类器;
6)通过性能最佳分类器对评估有效的MOFs的假设样本进行甲烷吸附性能的预测以筛选出高甲烷吸附率的假设性MOFs。
2.根据权利要求1所述的高甲烷吸附率MOFs生成与筛选的方法,其特征在于,所述步骤2)中分子指纹形式包括MACCS、RDKit、Morgan和Avalon。
3.根据权利要求2所述的高甲烷吸附率MOFs生成与筛选的方法,其特征在于,所述步骤3)中,RNN模型采用最原始的输入和输出序列等长的结构,采用LSTM提升模型处理长期依赖的能力,模型的损失函数采用交叉熵。
4.根据权利要求3所述的高甲烷吸附率MOFs生成与筛选的方法,其特征在于,所述步骤4)中,首先计算数据集内每个样本的MACCS、RDkit、Morgan和Avalon分子指纹的Tanimoto系数以衡量最大相似度,并求其平均值得到相应数据分布图,再计算RNN模型生成样本与数据集内样本的MACCS、RDkit、Morgan和Avalon分子指纹的平均最大相似度,最后设定置信区间,若生成样本的计算结果在对应置信区间内,则认为生成样本属于有效MOFs的假设样本。
5.根据权利要求4所述的高甲烷吸附率MOFs生成与筛选的方法,其特征在于,所述步骤5)具体为:将数据集内大部分样本作为训练集,另一部分样本作为测试集,运用卷积神经网络、长短期记忆网络、多层感知机、朴素贝叶斯、k最邻近、逻辑回归、支持向量机分类器,结合训练集内的SMILES表示形式和分子指纹输入数据对MOFs的甲烷吸附率的高低进行训练,使用测试集内的数据对计算出的各分类器的准确率、精确率、召回率、F1分数、AUC分类指标进行度量以筛选出综合性能最佳的分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010374619.4A CN111755081B (zh) | 2020-05-06 | 2020-05-06 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010374619.4A CN111755081B (zh) | 2020-05-06 | 2020-05-06 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111755081A true CN111755081A (zh) | 2020-10-09 |
CN111755081B CN111755081B (zh) | 2024-09-20 |
Family
ID=72673788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010374619.4A Active CN111755081B (zh) | 2020-05-06 | 2020-05-06 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111755081B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634993A (zh) * | 2020-12-30 | 2021-04-09 | 中国科学院生态环境研究中心 | 化学品雌激素受体激活活性的预测模型及筛查方法 |
CN114743617A (zh) * | 2022-04-13 | 2022-07-12 | 北京化工大学 | 一种高效的MOFs材料搜索与生成方法 |
WO2023149173A1 (ja) * | 2022-02-01 | 2023-08-10 | 住友化学株式会社 | 情報処理方法、プログラム、情報処理装置、モデルの生成方法、金属有機構造体の製造方法、金属有機構造体及び複合体 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038348A (zh) * | 2017-05-04 | 2017-08-11 | 四川大学 | 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法 |
CN108205613A (zh) * | 2017-12-11 | 2018-06-26 | 华南理工大学 | 一种化合物分子间相似度的计算方法及系统与它们的应用 |
CN109658989A (zh) * | 2018-11-14 | 2019-04-19 | 国网新疆电力有限公司信息通信公司 | 基于深度学习的类药化合物毒性预测方法 |
CN110021341A (zh) * | 2019-02-21 | 2019-07-16 | 华东师范大学 | 一种基于异构网络的gpcr药物和靶向通路的预测方法 |
CN110444250A (zh) * | 2019-03-26 | 2019-11-12 | 广东省微生物研究所(广东省微生物分析检测中心) | 基于分子指纹和深度学习的高通量药物虚拟筛选系统 |
CN110459274A (zh) * | 2019-08-01 | 2019-11-15 | 南京邮电大学 | 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用 |
CN110534164A (zh) * | 2019-09-26 | 2019-12-03 | 广州费米子科技有限责任公司 | 基于深度学习的药物分子生成方法 |
KR20200030769A (ko) * | 2018-09-13 | 2020-03-23 | 한국과학기술원 | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 |
-
2020
- 2020-05-06 CN CN202010374619.4A patent/CN111755081B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038348A (zh) * | 2017-05-04 | 2017-08-11 | 四川大学 | 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法 |
CN108205613A (zh) * | 2017-12-11 | 2018-06-26 | 华南理工大学 | 一种化合物分子间相似度的计算方法及系统与它们的应用 |
KR20200030769A (ko) * | 2018-09-13 | 2020-03-23 | 한국과학기술원 | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 |
CN109658989A (zh) * | 2018-11-14 | 2019-04-19 | 国网新疆电力有限公司信息通信公司 | 基于深度学习的类药化合物毒性预测方法 |
CN110021341A (zh) * | 2019-02-21 | 2019-07-16 | 华东师范大学 | 一种基于异构网络的gpcr药物和靶向通路的预测方法 |
CN110444250A (zh) * | 2019-03-26 | 2019-11-12 | 广东省微生物研究所(广东省微生物分析检测中心) | 基于分子指纹和深度学习的高通量药物虚拟筛选系统 |
CN110459274A (zh) * | 2019-08-01 | 2019-11-15 | 南京邮电大学 | 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用 |
CN110534164A (zh) * | 2019-09-26 | 2019-12-03 | 广州费米子科技有限责任公司 | 基于深度学习的药物分子生成方法 |
Non-Patent Citations (4)
Title |
---|
MICHAEL FERNANDEZ ET AL.: "Large-Scale Quantitative Structure−Property Relationship (QSPR) Analysis of Methane Storage in Metal−Organic Frameworks", 《THE JOURNAL OF PHYSICAL CHEMISTRY》, 21 March 2013 (2013-03-21), pages 7681 - 7689 * |
NORBERTO SANCHES-CRUZ ET AL.: "Statistical-based database fingerprint: chemical space dependent representation of compound databases", 《JOURNAL OF CHEMINFORMATICS》, vol. 55, no. 2018, 22 November 2018 (2018-11-22) * |
赵瑞 等: "虚拟筛选技术辅助SERT抑制剂高通量筛选模型的建立及应用", 《药学学报》, vol. 50, no. 09, 12 September 2015 (2015-09-12) * |
邓华: "农药相关数据库的信息整合及稳定G-四链的农药小分子类似物发掘", 《中国优秀硕士学位论文全文数据库 工程科技I辑》, no. 02, 15 February 2020 (2020-02-15) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634993A (zh) * | 2020-12-30 | 2021-04-09 | 中国科学院生态环境研究中心 | 化学品雌激素受体激活活性的预测模型及筛查方法 |
WO2023149173A1 (ja) * | 2022-02-01 | 2023-08-10 | 住友化学株式会社 | 情報処理方法、プログラム、情報処理装置、モデルの生成方法、金属有機構造体の製造方法、金属有機構造体及び複合体 |
JP2023112544A (ja) * | 2022-02-01 | 2023-08-14 | 住友化学株式会社 | 情報処理方法、プログラム、情報処理装置、モデルの生成方法、金属有機構造体の製造方法、金属有機構造体及び複合体 |
JP7340636B2 (ja) | 2022-02-01 | 2023-09-07 | 住友化学株式会社 | 情報処理方法、プログラム、情報処理装置、モデルの生成方法、金属有機構造体の製造方法、金属有機構造体及び複合体 |
CN114743617A (zh) * | 2022-04-13 | 2022-07-12 | 北京化工大学 | 一种高效的MOFs材料搜索与生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111755081B (zh) | 2024-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Asif et al. | Ensemble knowledge distillation for learning improved and efficient networks | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN111755081B (zh) | 一种高甲烷吸附率MOFs生成与筛选的方法 | |
CN108228716B (zh) | 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法 | |
CN106709820A (zh) | 一种基于深度置信网络的电力系统负荷预测方法及装置 | |
CN111008224B (zh) | 一种基于深度多任务表示学习的时间序列分类和检索方法 | |
CN110287985B (zh) | 一种基于带变异粒子群算法的可变拓扑结构的深度神经网络图像识别方法 | |
Gu et al. | Bayesian Takagi–Sugeno–Kang fuzzy model and its joint learning of structure identification and parameter estimation | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
CN106453294A (zh) | 基于模糊淘汰机制的小生境技术的安全态势预测方法 | |
CN111882042A (zh) | 用于液体状态机的神经网络架构自动搜索方法、系统及介质 | |
Essiet et al. | Big data analysis for gas sensor using convolutional neural network and ensemble of evolutionary algorithms | |
CN115080383A (zh) | 模型状态差分的深度神经网络测试用例生成方法 | |
CN118014155A (zh) | 基于提升堆叠学习的碳排放预测系统和方法及介质 | |
Zhu et al. | An Efficient Hybrid Feature Selection Method Using the Artificial Immune Algorithm for High‐Dimensional Data | |
CN117574776A (zh) | 一种面向任务规划的模型自学习优化方法 | |
Wang et al. | Efficient deep convolutional model compression with an active stepwise pruning approach | |
CN115860056A (zh) | 一种用于混合气体浓度预测的传感器阵列神经网络方法 | |
Wong et al. | Neural networks and genetic algorithm for economic forecasting | |
Shi et al. | A study of support vector regression-based fuzzy c-means algorithm on incomplete data clustering | |
CN114387525B (zh) | 一种基于模型协同的遥感图像变化检测网络快速压缩方法 | |
CN112800670B (zh) | 驾驶认知模型多目标结构优化方法及装置 | |
CN117668701B (zh) | Ai人工智能机器学习系统及方法 | |
CN115206456B (zh) | 基于属性编辑流的分子生成方法 | |
Li et al. | An Ant-based Optimizer for the Training of Convolutional Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |