CN110534164A - 基于深度学习的药物分子生成方法 - Google Patents
基于深度学习的药物分子生成方法 Download PDFInfo
- Publication number
- CN110534164A CN110534164A CN201910818097.XA CN201910818097A CN110534164A CN 110534164 A CN110534164 A CN 110534164A CN 201910818097 A CN201910818097 A CN 201910818097A CN 110534164 A CN110534164 A CN 110534164A
- Authority
- CN
- China
- Prior art keywords
- layers
- training
- molecule
- data
- drug molecule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 58
- 229940079593 drug Drugs 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 118
- 238000012546 transfer Methods 0.000 claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 30
- 230000000306 recurrent effect Effects 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 9
- 241001269238 Data Species 0.000 abstract description 8
- 238000013526 transfer learning Methods 0.000 abstract description 4
- 238000003062 neural network model Methods 0.000 abstract 1
- 239000012634 fragment Substances 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 3
- 238000010504 bond cleavage reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Image Analysis (AREA)
Abstract
本发明是一种基于深度学习的药物分子生成方法,采用循环神经网络作为学习和生成药物分子的神经网络模型。该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
Description
技术领域
本发明属于药物分子领域,特别涉及基于深度学习的药物分子生成方法。
背景技术
药物是用以预防、治疗及诊断疾病的物质。在理论上,药物是指凡能影响机体器官生理功能及细胞代谢活动的化学物质都属于药物的范畴。
在公告号CN109741798A,名称为“有机分子的立体异构全集自动化生成方法”的中国发明专利中,公开了一种有机分子的立体异构全集自动化生成方法,(1)将输入分子切分成一组片段;(2)用得到的异构片段到片段模板库中匹配片段模板;(3)根据片段模板信息生成出对应片段的所有异构;(4)遍历所有的异构片段及其位点,将步骤(1)中断的键两端的片段,按断键原子的所有可能的位点进行组装,得到所有的立体异构;如果需要过滤,则可以按照指定的过滤规则进行过滤。本发明可以很方便的描述相似片段的立体异构,并大量减少片段数量,极大地降低片段库的构建难度。分片段,再遍历片段的所有立体异构,然后根据位点组合拼装,可以容易地生成一个分子的所有立体异构。
以上公开的专利通过遍历所有的异构片段及其位点,按断键原子的所有可能的位点进行组装,得到所有的立体异构,再遍历片段的所有立体异构,然后根据位点组合拼装,生成一个分子的所有立体异构,但是以上立体异构的获得过于复杂,成本较高,并不利于新药物的发现和研发。
目前药物研发中,新药分子的发现主要有两种技术,高通量药物筛选(HTS)和基于片段的药物设计(FBDD)。HTS是一种利用已有的化合物进行的体外的实验筛选,而FBDD是挑选有利的片段组合或延伸得到新药物分子,获得高活性的候选药物;以上两种方法均存在盲目性大、生物实验次数较多、成本大、对于部分药物靶点很难筛选到理想的化合物、命中化合物的类药性较差的缺点。
发明内容
为解决上述问题,本发明的目的在于提供一种不需要具体的生物实验、高效、低成本的基于深度学习的药物分子生成方法。
本发明的另一个目的在于提供可以生成类药性好、可合成性好、具有指定靶点的活性的、有新的骨架的新分子的基于深度学习的药物分子生成方法。
为实现上述目的,本发明的技术方案如下。
一种基于深度学习的药物分子生成方法,其特征在于,该方法的具体操作步骤如下:
S1:通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;
S2:通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;
S3:通过生成阶段,利用迁移训练模型生成分子数据。
该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
进一步地,所述步骤S1具体为:采用SMILES(简化分子线性输入规范)格式表示分子,SMILES是一种用ASCII字符串明确描述已知的分子结构的字符序列;获取已知各种靶点的药物分子作为预训练数据;对字符序列进行数据编码过滤,生成适合循环神经网络输入的整数序列;将数据编码过滤后的数据输入循环神经网络进行训练;手动调整每次训练的超参数(学习率,训练步数),保留交叉熵损失函数值最小的训练模型;保留多次训练过程中较佳的模型作为预训练模型。通过ASCII字符串描述分子的结构,保证分子对应的字符序列的唯一性。通过将多种靶点的药物分子作为训练模型的预训练数据为循环神经网络的学习提供学习语法和特征,保证循环神经网络学习过程中学习的全面性和准确性,数据编码过滤包括分子的SMILES语句拆分,并根据字母表进行编码,转换成二维矩阵形式的数据,同时把分子的SMILES长度超过一定数量的分子进行剔除,以满足循环神经网络训练的输入。通过手动对每次训练过程中模型超参数的不断调节和优化,使训练模型能够达到最优的学习效果,其中模型超参数包括学习率,训练步数等,通过该训练模型产生的数据与已知的分子的相关特性进行比对,即保留交叉熵损失函数值最小的训练模型,以判断该训练模型是否能够达到对分子的基本特征和语法的学习。通过多个靶点分子信息的选取、多次训练学习,保留较佳的训练模型作为预训练模型。
进一步地,所述步骤S2具体为:根据需要,读取某个靶点药物分子作为迁移训练数据;选取预训练阶段筛选出的较佳的循环神经网络的预训练模型;将数据编码过滤后的迁移训练数据输入循环神经网络进行训练;手动调整每次训练的超参数,保留交叉熵损失函数值最小的训练模型;保存最好的循环神经网络的迁移训练模型。通过在预训练模型启动过程中对模型超参数的调节,使该迁移训练模型的效果达到最佳。
进一步地,所述步骤S3具体为:运行迁移训练模型,批量生成整数序列的分子数据;对批量生成的整数序列分子数据依次进行数据反编码和分子数据标准化;对标准化后的分子数据,过滤无效分子和去除重复分子;当生成的分子数量达到预先设定的分子数量时,保存生成的分子数据。通过将迁移训练数据输入到迁移训练模型中,获得期望的分子数据信息,生成阶段产生的分子数据涉及未知的分子数据,即为新的分子。通过对生成的分子数据库进行数据反编码和分子数据标准化确保生成的字符序列的唯一性,保证生成的分子为新的分子。
进一步地,所述循环神经网络包括Embedding层、GRU层、Dense层、Attention层和Softmax函数,所述整数序列作为Embedding层的输入,所述Embedding层的输出作为GRU层的输入,所述GRU层的输出作为Attention层的输入、所述Attention层的输出作为Dense层的输入,所述Dense层的输出作为Softmax函数的输入,其中Embedding层、GRU层、Dense层、Attention层和Softmax函数依次循环执行。其中:Embedding层用于把分子的整数序列的每一个整数转换成向量,变成向量序列。GRU是一种常见的循环神经网络的循环单元,这里采用了叠加了两层的GRU。Dense层为全连接层,每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。Attention层:注意力层,计算每次循环的状态的权重,自动分配不同的权重系数。
进一步地,所述GRU设计为两层,两层所述GRU的输入输出依次连接。GRU设计为两层确保训练模型能够更准确和完善。
进一步地,所述模型参数包括学习率、训练步数。通过对学习率、训练步数的调节保证训练模型能够更准确和完善。
进一步地,所述数据编码过滤原则包括将分子的SMILES语句拆分,根据字母表进行编码,转换成二维矩阵形式的数据,同时分子的SMILES长度设置为136。通过对分子的SMILES语句拆分及对分子的SMILES长度设置为136,确保分子的SMILES语句能够作为循环神经网络的输入的字符序列,同时确保分子对应的字符序列的唯一性。
进一步地,所述预训练数据库包括ChEMBL数据库,ChEMBL数据库为已知有活性的具有类药性的分子数据库。
本发明是一种基于深度学习的药物分子生成方法,其特征在于,该方法的具体操作步骤如下:
S1:通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;
S2:通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;
S3:通过生成阶段,利用迁移训练模型生成分子数据。
该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
附图说明
图1是本发明的基于深度学习的药物分子生成方法的预训练阶段的流程图。
图2是本发明的基于深度学习的药物分子生成方法的迁移训练阶段的流程图。
图3是本发明的基于深度学习的药物分子生成方法的生成阶段的流程图。
图4是本发明的基于深度学习的药物分子生成方法的循环神经网络的流程图。
图5、图6、图7是本发明的基于深度学习的药物分子生成方法的生成阶段生成的分子的三个例子。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为实现上述目的,本发明的技术方案如下。
参照图1-7,一种基于深度学习的药物分子生成方法,该方法的具体操作步骤如下:
S1:通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;
S2:通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;
S3:通过生成阶段,利用迁移训练模型生成分子数据。
该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
参照图1,在本实施例中,所述步骤S1具体为:采用SMILES(简化分子线性输入规范)格式表示分子,SMILES是一种用ASCII字符串明确描述已知的分子结构的字符序列;获取已知各种靶点的药物分子作为预训练数据;对字符序列进行数据编码过滤,生成适合循环神经网络输入的整数序列;将数据编码过滤后的数据输入循环神经网络进行训练;手动调整每次训练的超参数(学习率,训练步数),保留交叉熵损失函数值最小的训练模型;保留多次训练过程中较佳的模型作为预训练模型。通过ASCII字符串描述分子的结构,保证分子对应的字符序列的唯一性。通过将多种靶点的药物分子作为训练模型的预训练数据为循环神经网络的学习提供学习语法和特征,保证循环神经网络学习过程中学习的全面性和准确性,数据编码过滤包括分子的SMILES语句拆分,并根据字母表进行编码,转换成二维矩阵形式的数据,同时把分子的SMILES长度超过一定数量的分子进行剔除,以满足循环神经网络训练的输入。通过手动对每次训练过程中模型超参数的不断调节和优化,使训练模型能够达到最优的学习效果,其中模型超参数包括学习率,训练步数等,通过该训练模型产生的数据与已知的分子的相关特性进行比对,即保留交叉熵损失函数值最小的训练模型,以判断该训练模型是否能够达到对分子的基本特征和语法的学习。通过多个靶点分子信息的选取、多次训练学习,保留较佳的训练模型作为预训练模型。
参照图2,在本实施例中,所述步骤S2具体为:根据需要,读取某个靶点药物分子作为迁移训练数据;选取预训练阶段筛选出的较佳的循环神经网络的预训练模型;将数据编码过滤后的迁移训练数据输入循环神经网络进行训练;手动调整每次训练的超参数,保留交叉熵损失函数值最小的训练模型;保存最好的循环神经网络的迁移训练模型。通过在预训练模型启动过程中对模型超参数的调节,使该迁移训练模型的效果达到最佳。
参照图3,在本实施例中,所述步骤S3具体为:运行迁移训练模型,批量生成整数序列的分子数据;对批量生成的整数序列分子数据依次进行数据反编码和分子数据标准化;对标准化后的分子数据,过滤无效分子和去除重复分子;当生成的分子数量达到预先设定的分子数量时,保存生成的分子数据。通过将迁移训练数据输入到迁移训练模型中,获得期望的分子数据信息,生成阶段产生的分子数据涉及未知的分子数据,即为新的分子。通过对生成的分子数据库进行数据反编码和分子数据标准化确保生成的字符序列的唯一性,保证生成的分子为新的分子。
参照图4,在本实施例中,所述循环神经网络包括Embedding层、GRU层、Dense层、Attention层和Softmax函数,所述整数序列作为Embedding层的输入,所述Embedding层的输出作为GRU层的输入,所述GRU层的输出作为Attention层的输入、所述Attention层的输出作为Dense层的输入,所述Dense层的输出作为Softmax函数的输入,其中Embedding层、GRU层、Dense层、Attention层和Softmax函数依次循环执行。其中:Embedding层用于把分子的整数序列的每一个整数转换成向量,变成向量序列。GRU是一种常见的循环神经网络的循环单元,这里采用了叠加了两层的GRU。Dense层为全连接层,每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。Attention层:注意力层,计算每次循环的状态的权重,自动分配不同的权重系数。
在本实施例中,所述GRU设计为两层,两层所述GRU的输入输出依次连接。GRU设计为两层确保训练模型能够更准确和完善。
在本实施例中,所述模型参数包括学习率、训练步数。通过对学习率、训练步数的调节保证训练模型能够更准确和完善。
在本实施例中,所述数据编码过滤原则包括将分子的SMILES语句拆分,根据字母表进行编码,转换成二维矩阵形式的数据,同时分子的SMILES长度设置为136。通过对分子的SMILES语句拆分及对分子的SMILES长度设置为136,确保分子的SMILES语句能够作为循环神经网络的输入的字符序列,同时确保分子对应的字符序列的唯一性。
在本实施例中,所述预训练数据库包括ChEMBL数据库,ChEMBL数据库为已知有活性的具有类药性的分子数据库。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于深度学习的药物分子生成方法,其特征在于,该方法的具体操作步骤如下:
S1:通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;
S2:通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;
S3:通过生成阶段,利用迁移训练模型生成分子数据。
2.如权利要求1所述的一种基于深度学习的药物分子生成方法,其特征在于,所述步骤S1具体为:
S11:采用SMILES(简化分子线性输入规范)格式表示分子,SMILES是一种用ASCII字符串明确描述已知的分子结构的字符序列;
S12:获取已知各种靶点的药物分子作为预训练数据;
S13:对字符序列进行数据编码过滤,生成适合循环神经网络输入的整数序列;
S14:将数据编码过滤后的数据输入循环神经网络进行训练;
S15:手动调整每次训练的超参数(学习率,训练步数),保留交叉熵损失函数值最小的训练模型;
S16:保留多次训练过程中较佳的模型作为预训练模型。
3.如权利要求2所述的一种基于深度学习的药物分子生成方法,其特征在于,所述步骤S2具体为:
S21:根据需要,读取某个靶点药物分子作为迁移训练数据;
S22:选取预训练阶段筛选出的较佳的循环神经网络的预训练模型;
S23:将数据编码过滤后的数据输入循环神经网络进行训练;
S24:手动调整每次训练的超参数,保留交叉熵损失函数值最小的训练模型;
S25:保存最好的循环神经网络的迁移训练模型。
4.如权利要求3所述的一种基于深度学习的药物分子生成方法,其特征在于,所述步骤S3具体为:
S31:运行迁移训练模型,批量生成整数序列的分子数据;
S32:对批量生成的整数序列分子数据依次进行数据反编码和分子数据标准化;
S33:对标准化后的分子数据,过滤无效分子和去除重复分子;
S34:当生成的分子数量达到预先设定的分子数量时,保存生成的分子数据。
5.如权利要求4所述的一种基于深度学习的药物分子生成方法,其特征在于,所述循环神经网络包括Embedding层、GRU层、Dense层、Attention层和Softmax函数,所述整数序列作为Embedding层的输入,所述Embedding层的输出作为GRU层的输入,所述GRU层的输出作为Attention层的输入、所述Attention层的输出作为Dense层的输入,所述Dense层的输出作为Softmax函数的输入,其中Embedding层、GRU层、Dense层、Attention层和Softmax函数依次循环执行。
6.如权利要求5所述的一种基于深度学习的药物分子生成方法,其特征在于,所述GRU设计为两层,两层所述GRU的输入输出依次连接。
7.如权利要求6所述的一种基于深度学习的药物分子生成方法,其特征在于,所述模型超参数包括学习率、训练步数。
8.如权利要求7所述的一种基于深度学习的药物分子生成方法,其特征在于,所述数据编码过滤原则包括将分子的SMILES语句拆分,根据字母表进行编码,转换成二维矩阵形式的数据,同时分子的SMILES长度设置为136。
9.如权利要求8所述的一种基于深度学习的药物分子生成方法,其特征在于,所述预训练数据库包括ChEMBL数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818097.XA CN110534164A (zh) | 2019-09-26 | 2019-09-26 | 基于深度学习的药物分子生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818097.XA CN110534164A (zh) | 2019-09-26 | 2019-09-26 | 基于深度学习的药物分子生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110534164A true CN110534164A (zh) | 2019-12-03 |
Family
ID=68665742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910818097.XA Pending CN110534164A (zh) | 2019-09-26 | 2019-09-26 | 基于深度学习的药物分子生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110534164A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110970099A (zh) * | 2019-12-10 | 2020-04-07 | 北京大学 | 一种基于正则化变分自动编码器的药物分子生成方法 |
CN111199779A (zh) * | 2019-12-26 | 2020-05-26 | 中科曙光国际信息产业有限公司 | 一种基于分子对接的虚拟药物筛选方法和装置 |
CN111755081A (zh) * | 2020-05-06 | 2020-10-09 | 北京化工大学 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
CN112116963A (zh) * | 2020-09-24 | 2020-12-22 | 深圳智药信息科技有限公司 | 自动药物设计方法、系统、计算设备及计算机可读存储介质 |
WO2021004021A1 (zh) * | 2019-12-20 | 2021-01-14 | 深圳晶泰科技有限公司 | 一种药物研发过程中的数据管理系统及其使用方法 |
CN112331277A (zh) * | 2020-10-28 | 2021-02-05 | 星药科技(北京)有限公司 | 一种基于强化学习的路径可控的药物分子生成方法 |
CN112487291A (zh) * | 2020-11-28 | 2021-03-12 | 重庆邮电大学 | 一种基于大数据的个性化新闻推荐方法及装置 |
CN112786108A (zh) * | 2021-01-21 | 2021-05-11 | 北京百度网讯科技有限公司 | 分子理解模型的训练方法、装置、设备和介质 |
CN113223637A (zh) * | 2021-05-07 | 2021-08-06 | 中国科学院自动化研究所 | 基于领域知识和深度强化学习的药物分子生成器训练方法 |
CN113393911A (zh) * | 2021-06-23 | 2021-09-14 | 石家庄鲜虞数字生物科技有限公司 | 一种基于深度学习的配体化合物快速预筛选模型 |
CN114049922A (zh) * | 2021-11-09 | 2022-02-15 | 四川大学 | 基于小规模数据集和生成模型的分子设计方法 |
CN114171125A (zh) * | 2021-12-02 | 2022-03-11 | 中山大学 | 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法 |
CN114220497A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院过程工程研究所 | 一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台 |
WO2023279436A1 (zh) * | 2021-07-09 | 2023-01-12 | 中国海洋大学 | 一种基于强化学习和对接的药物分子智能生成方法 |
CN117334271A (zh) * | 2023-09-25 | 2024-01-02 | 江苏运动健康研究院 | 一种基于指定属性生成分子的方法 |
WO2024124818A1 (zh) * | 2022-12-15 | 2024-06-20 | 腾讯科技(深圳)有限公司 | 分子生成模型的训练方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106777986A (zh) * | 2016-12-19 | 2017-05-31 | 南京邮电大学 | 药物筛选中基于深度哈希的配体分子指纹生成方法 |
WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
CN109741798A (zh) * | 2018-12-25 | 2019-05-10 | 深圳晶泰科技有限公司 | 有机分子的立体异构全集自动化生成方法 |
-
2019
- 2019-09-26 CN CN201910818097.XA patent/CN110534164A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106777986A (zh) * | 2016-12-19 | 2017-05-31 | 南京邮电大学 | 药物筛选中基于深度哈希的配体分子指纹生成方法 |
WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
CN109741798A (zh) * | 2018-12-25 | 2019-05-10 | 深圳晶泰科技有限公司 | 有机分子的立体异构全集自动化生成方法 |
Non-Patent Citations (2)
Title |
---|
SEGLER MHS: "Generating focused molecule libraries for drug discovery with recurrent neural networks", ACS CENT SCI, vol. 4, pages 120 - 131, XP055637179, DOI: 10.1021/acscentsci.7b00512 * |
王正国;饶含兵;李泽荣;: "机器学习方法用于选择性环氧化酶-2抑制剂活性预测模型的建立", 化学研究与应用, no. 11 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110970099A (zh) * | 2019-12-10 | 2020-04-07 | 北京大学 | 一种基于正则化变分自动编码器的药物分子生成方法 |
CN110970099B (zh) * | 2019-12-10 | 2023-04-28 | 北京大学 | 一种基于正则化变分自动编码器的药物分子生成方法 |
WO2021004021A1 (zh) * | 2019-12-20 | 2021-01-14 | 深圳晶泰科技有限公司 | 一种药物研发过程中的数据管理系统及其使用方法 |
CN111199779A (zh) * | 2019-12-26 | 2020-05-26 | 中科曙光国际信息产业有限公司 | 一种基于分子对接的虚拟药物筛选方法和装置 |
CN111755081A (zh) * | 2020-05-06 | 2020-10-09 | 北京化工大学 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
CN111755081B (zh) * | 2020-05-06 | 2024-09-20 | 北京化工大学 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
CN112116963A (zh) * | 2020-09-24 | 2020-12-22 | 深圳智药信息科技有限公司 | 自动药物设计方法、系统、计算设备及计算机可读存储介质 |
CN112331277A (zh) * | 2020-10-28 | 2021-02-05 | 星药科技(北京)有限公司 | 一种基于强化学习的路径可控的药物分子生成方法 |
CN112487291B (zh) * | 2020-11-28 | 2022-06-10 | 重庆邮电大学 | 一种基于大数据的个性化新闻推荐方法及装置 |
CN112487291A (zh) * | 2020-11-28 | 2021-03-12 | 重庆邮电大学 | 一种基于大数据的个性化新闻推荐方法及装置 |
CN112786108B (zh) * | 2021-01-21 | 2023-10-24 | 北京百度网讯科技有限公司 | 分子理解模型的训练方法、装置、设备和介质 |
CN112786108A (zh) * | 2021-01-21 | 2021-05-11 | 北京百度网讯科技有限公司 | 分子理解模型的训练方法、装置、设备和介质 |
CN113223637A (zh) * | 2021-05-07 | 2021-08-06 | 中国科学院自动化研究所 | 基于领域知识和深度强化学习的药物分子生成器训练方法 |
CN113393911A (zh) * | 2021-06-23 | 2021-09-14 | 石家庄鲜虞数字生物科技有限公司 | 一种基于深度学习的配体化合物快速预筛选模型 |
CN113393911B (zh) * | 2021-06-23 | 2022-08-19 | 石家庄鲜虞数字生物科技有限公司 | 一种基于深度学习的配体化合物快速预筛选方法 |
WO2023279436A1 (zh) * | 2021-07-09 | 2023-01-12 | 中国海洋大学 | 一种基于强化学习和对接的药物分子智能生成方法 |
CN114049922A (zh) * | 2021-11-09 | 2022-02-15 | 四川大学 | 基于小规模数据集和生成模型的分子设计方法 |
CN114049922B (zh) * | 2021-11-09 | 2022-06-03 | 四川大学 | 基于小规模数据集和生成模型的分子设计方法 |
CN114171125A (zh) * | 2021-12-02 | 2022-03-11 | 中山大学 | 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法 |
CN114171125B (zh) * | 2021-12-02 | 2024-04-16 | 中山大学 | 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法 |
CN114220497A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院过程工程研究所 | 一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台 |
WO2024124818A1 (zh) * | 2022-12-15 | 2024-06-20 | 腾讯科技(深圳)有限公司 | 分子生成模型的训练方法、装置、设备及存储介质 |
CN117334271A (zh) * | 2023-09-25 | 2024-01-02 | 江苏运动健康研究院 | 一种基于指定属性生成分子的方法 |
CN117334271B (zh) * | 2023-09-25 | 2024-07-12 | 江苏运动健康研究院 | 一种基于指定属性生成分子的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110534164A (zh) | 基于深度学习的药物分子生成方法 | |
Somnath et al. | Learning graph models for retrosynthesis prediction | |
CN109086805A (zh) | 一种基于深度神经网络和成对约束的聚类方法 | |
Soldan et al. | Vlg-net: Video-language graph matching network for video grounding | |
Liu et al. | Classification using association rules: weaknesses and enhancements | |
CN105893551A (zh) | 数据的处理方法及装置、知识图谱 | |
Mokbel et al. | Metric learning for sequences in relational LVQ | |
CN104484844A (zh) | 基于疾病圈数据信息的自我诊疗方法 | |
CN107315775A (zh) | 一种指数计算平台和方法 | |
CN108550381A (zh) | 一种基于FP-growth的药品推荐方法 | |
WO2022267752A1 (zh) | 基于人工智能的化合物处理方法、装置、设备、存储介质及计算机程序产品 | |
Zhang et al. | Working memory for spatial sequences: Developmental and evolutionary factors in encoding ordinal and relational structures | |
CN114913938B (zh) | 一种基于药效团模型的小分子生成方法、设备及介质 | |
CN106096327A (zh) | 基于Torch监督式深度学习的基因性状识别方法 | |
Bari et al. | Reinforcement learning modeling reveals a reward-history-dependent strategy underlying reversal learning in squirrel monkeys. | |
CN116884529A (zh) | 基于多视图神经网络变分自编码器的分子骨架跃迁方法 | |
Gonzalez et al. | Personalizing emotion recognition using incremental random forests | |
Yang et al. | Tea classification based on artificial olfaction using bionic olfactory neural network | |
CN110534153A (zh) | 基于深度学习的靶标预测系统及其方法 | |
Stoop et al. | Excess entropies suggest the physiology of neurons to be primed for higher-level computation | |
CN107247813A (zh) | 一种基于加权技术的网络构建与演化方法 | |
Chen et al. | SPTESleepNet: Automatic Sleep Staging Model Based On Strip Patch Embeddings And Transformer Encoder | |
Yan et al. | RPBP: deep retrosynthesis reaction prediction based on byproducts | |
CA3129095A1 (en) | Biological information handling | |
CN117831646B (zh) | 一种基于分子片段化学空间解构的分子定向智能生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191203 |