CN113393911A - 一种基于深度学习的配体化合物快速预筛选模型 - Google Patents
一种基于深度学习的配体化合物快速预筛选模型 Download PDFInfo
- Publication number
- CN113393911A CN113393911A CN202110697840.8A CN202110697840A CN113393911A CN 113393911 A CN113393911 A CN 113393911A CN 202110697840 A CN202110697840 A CN 202110697840A CN 113393911 A CN113393911 A CN 113393911A
- Authority
- CN
- China
- Prior art keywords
- cluster
- model
- ligand
- compound
- compounds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 150000001875 compounds Chemical class 0.000 title claims abstract description 81
- 239000003446 ligand Substances 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000012216 screening Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 21
- 102000005962 receptors Human genes 0.000 claims abstract description 14
- 108020003175 receptors Proteins 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 11
- 230000027455 binding Effects 0.000 claims abstract description 9
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- 238000000691 measurement method Methods 0.000 claims abstract description 4
- 238000003062 neural network model Methods 0.000 claims description 10
- 102000004169 proteins and genes Human genes 0.000 claims description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 8
- 239000003814 drug Substances 0.000 claims description 6
- 229940079593 drug Drugs 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000003032 molecular docking Methods 0.000 claims description 5
- 150000003384 small molecules Chemical class 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 2
- 239000011701 zinc Substances 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims 2
- 238000013527 convolutional neural network Methods 0.000 claims 1
- 238000007621 cluster analysis Methods 0.000 abstract description 2
- 238000012827 research and development Methods 0.000 description 5
- 238000007877 drug screening Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- -1 small molecule compound Chemical class 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000003041 virtual screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Library & Information Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种基于深度学习的配体化合物快速预筛选模型。包括如下步骤:S1、构建数据集,将配体化合物与受体蛋白质结合位点的氨基酸序列信息进行编码;S2、将配体与受体结构向量结合起来,输入到深度神经网络,输出亲和力评分,模型采用监督学习的方式进行训练;S3、按照亲和力评分结果进行排序,筛选出阳性化合物,剔除大量阴性化合物;S4、获取阳性化合物分子指纹(分子特征),基于相似度或距离度量方法进行聚类;S5、取每个簇中评分最高的化合物,作为潜在活性化合物。本发明实现了配体化合物的快速预筛选,通过对阳性化合物的聚类分析,可以去除冗余,保证配体化合物的结构多样性,提高预测速度和准确性。
Description
技术领域
本发明属于计算机应用技术领域,具体涉及一种基于深度学习的配体化合物快速预筛选模型,
背景技术
作为药物研发的起点,苗头化合物的发现对整个药物研发过程至关重要,虚拟筛选作为发现苗头化合物的一项重要技术,是计算机辅助药物设计的核心技术,即从大量分子数据库中快速筛选出少量的目标化合物,先进行配体化合物的预筛选可以提升科研步伐,减少进入生物化学实验阶段的化合物数量,可有效提高药物研发的成功率和效率,
配体化合物的预筛选最常用的方法是分子对接,通过分子对接可以模拟蛋白质-配体的结合模式,预测配体结合构象,并对亲和力进行打分,进而确定潜在活性化合物,然而,现有分子对接理论本身并不完善,分子对接对蛋白-小分子结合模式及亲和力预测准确率较低,加上可供选择的对接程序众多,并且性能各异,导致在实际使用中的成功率千差万别,
随着深度学习的迅猛发展,以及蛋白质晶体结构、小分子活性数据越来越多地积累和开放,将深度学习技术应用到配体化合物的预筛选方法当中,通过真实数据提取信息,可以有效提高药物筛选命中率、缩短研发周期、降低成本,有较好的发展前景,
发明内容
本发明提出一种基于深度学习的配体化合物快速预筛选模型,其主要解决的问题是建立更有效的配体化合物快速预筛选模型,提高药物筛选速度,缩短药物研发流程,降低成本,以实现更高效的药物筛选,
本发明利用深度学习算法模型从化合物库中快速筛选出潜在活性化合物,剔除大量阴性样本,为避免预筛选出的活性化合物在结构上出现冗余的类似化合物,引入聚类思想,对筛选出的阳性化合物进行聚类分析,将结构相似的化合物聚类到一簇,并从每个簇中选择少量分子,
具体包括以下步骤:
S1、基于小分子数据库以及生成模型生成的小分子数据集中获取配体小分子化合物,并将化合物分子进行编码;
S2、通过蛋白质数据库获取受体蛋白质结构,提取受体结合位点(口袋)部分氨基酸序列信息,并将其进行编码;
S3、设定对接空间范围,将配体与受体结构向量通过某种方法结合起来,作为神经网络模型的输入;
S4、模型为深度神经网络模型,将样本数据分成独立的训练集、验证集和测试集;
S5、基于二进制交叉熵损失构建目标函数,目标函数形式为:
E(W,b)=L(W,b)+λΩ(W)
其中,L(W,b)为二进制交叉熵损失,Ω(W)为正则项;
S7、通过验证集对模型超参数进行优化,测试集用来评价模型的泛化能力;
S9、按照S8中得到的亲和力评分结果进行排序,筛选出亲和力得分大于设定阈值或者排名前K的阳性化合物,剔除大量阴性化合物;
S10、通过一定的方法获取S9中得到的阳性化合物的分子指纹(分子特征);
S11、基于分子指纹利用相似度(或距离)度量方法对筛选出的阳性化合物进行聚类,采用可增量更新的聚类方法,设定阈值,将相似度不小于(或距离不大于)设定阈值的化合物归为一类,即一个簇;
S12、模型每次读取一个样本,计算该样本与当前所有簇中心点的相似度(或距离),将其加入到相似度最高(或距离最小)的簇中,更新簇和簇中心点;
S13、若样本与现有簇中心点的相似度都低于(或距离都高于)设定阈值,该样本不属于任何一簇,将其作为一个新簇中心点;
S14、迭代步骤S12、S13,直至所有样本都聚类完成,更新簇和簇中心点;
S15、将S14中已经聚类完成的簇中心点基于相似度(或距离)再次进行比较,对于相似度较高(或距离较小)的簇,取簇中所有样本,重复步骤S12-S14,更新簇和簇中心点;
S16、迭代步骤S15,直到聚类簇基本稳定,聚类完成后使同一簇内的分子结构具有高相似性,不同簇间的分子结构具有低相似性;
S17、分别对不同簇中的小分子化合物按照亲和力评分进行排序;
S18、取每个簇中评分最高的化合物,作为潜在活性化合物,实现配体化合物的快速预筛选;
本发明有益效果体现在:
1.首先使用深度神经网络模型从海量化合物库中快速剔除大量阴性化合物,有效提高预筛选速度;
2.对筛选出的阳性化合物进行聚类分析,有效去除结构相似的冗余化合物,保证配体化合物结构的多样性,提高预测速度及准确性;
3.采用可增量更新的聚类方法,每次模型只读取一个样本,基于相似度(或距离)的计算仅在少量簇中心点之间进行比较,不仅可以有效处理动态增量数据集,提高相似度(或距离)的计算速度,提高聚类效率和资源的利用率,同时,通过将数据集分割,逐步动态聚类,能实现对大型数据库的聚类分析,
附图说明
图1:本发明基于深度学习的配体化合物快速预筛选模型的框架结构示意图
具体实施方法
以下将结合附图1,对本发明的技术方案进行清楚、完整的描述,
具体地,本发明提供一种基于深度学习的配体化合物快速预筛选模型,如图1所示,其包括以下步骤:
S1、通过DrugSpaceX数据库或ZINC数据库以及生成模型生成的小分子数据集中获取配体小分子化合物,通过RCSB PDB数据库和PDBbind数据库获取受体蛋白质结构;
S2、利用RDKit生成化合物分子的SMILES字符串,应用word2vec或类似算法将化合物分子进行编码;
S3、提取受体蛋白质结合位点(口袋)部分的氨基酸序列信息,应用word2vec或类似算法将其进行编码;
S4、设定对接空间范围,将配体与受体结构向量通过某种方法结合起来,作为神经网络模型输入;
S5、模型为深度神经网络模型,将样本数据分成独立的训练集、验证集和测试集,
S6、基于二进制交叉熵损失构建目标函数:
E(W,b)=L(W,b)+λΩ(W)
其中,L(W,b)为二进制交叉熵损失,Ω(W)为正则项;
S8、通过验证集对模型超参数进行优化,通过测试集评价模型的泛化能力,本发明所述的方法中,使用了多个评估指标来评价模型的性能,包括准确率(Accuracy)、精度(Precision)、召回率(Recall)、特异度(Specificity)、AUC等;
S9、其中:
S11、按照S10中得到的亲和力得分结果进行排序,筛选出亲和力排名前K(如前五十万个)的阳性化合物,剔除大量阴性化合物;
S12、通过一定的方法获取S11中得到的阳性化合物的分子指纹(分子特征);
S13、基于分子指纹利用相似度(或距离)度量方法对筛选出的阳性化合物进行聚类,设定阈值,将相似度不小于(或距离不大于)设定阈值的化合物归为一类,即一个簇,无需预先设定类的个数;
S14、采用可增量更新的聚类方法,模型每次读取一个样本,首先将第1个样本作为第1个簇中心点;
S15、输入第i(i>=2)个样本时,将其与之前所有簇中心点进行比较,计算相似度(或距离),将其加入到相似度最高(或距离最小)的簇中,若样本与现有簇中心点的相似度都低于(或距离都高于)设定阈值,该样本不属于任何一簇,将其作为一个新簇中心点,更新簇和簇中心点,直至所有样本都完成聚类;
S16、将S15中已经聚类完成的簇的中心点基于相似度(或距离)再次进行比较;
S17、对于相似度较高(或距离较小)的簇,取出簇中所有样本,重复步骤S14、S15,更新簇和簇中心点;
S18、迭代S17,直到聚类簇基本稳定,聚类完成后使同一簇内的分子结构具有高相似性,不同簇间的分子结构具有低相似性;
S19、分别对不同簇中的小分子化合物按照亲和力评分进行排序;
S20、取每个簇中评分最高的化合物,作为潜在活性化合物,实现配体化合物的快速预筛选,
以上所描述的具体实施例仅仅是对本发明精神作举例说明,本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (6)
1.一种基于深度学习的配体化合物快速预筛选模型,其特征在于,包括如下步骤:
S1、通过生成方法生成或已有的小分子库获取配体小分子化合物,通过蛋白质数据库获取受体蛋白质结构,提取受体结合位点(口袋)部分氨基酸序列信息,将配体-受体结构进行编码;
S2、设定对接空间范围,将配体与受体结构向量通过某种方法结合起来,输入到神经网络模型,采用监督学习的方式对模型进行训练,输出小分子化合物与蛋白质亲和力评分;
S3、按照亲和力评分结果进行排序,筛选出亲和力评分大于设定阈值或者排名前K的阳性化合物,剔除大量阴性化合物;
S4、通过一定的方法获取阳性化合物的分子指纹(分子特征);
S5、基于分子指纹利用相似度(或距离)度量方法对筛选出的阳性化合物进行聚类,采用可增量更新的聚类方法,设定阈值,将相似度不小于(或距离不大于)设定阈值的化合物归为一类,即一个簇;
S6、将已经聚类完成的簇再进行比较,更新簇和簇中心点,直至聚类簇基本稳定,聚类完成后使同一簇内的分子结构具有高相似性,不同簇间的分子结构具有低相似性;
S7、分别对不同簇中的小分子化合物按照亲和力评分进行排序,取每个簇中评分最高的化合物,作为潜在活性化合物,实现配体化合物的快速预筛选。
2.如权力要求1所述的基于深度学习的配体化合物快速预筛选模型,其特征在于:S1中所述小分子数据库包括DrugSpaceX数据库、ZINC数据库以及生成模型生成的小分子库,蛋白质数据库包括RCSB PDB数据库及PDBbind数据库,利用Mol2vec或类似算法将配体-受体复合物结构进行编码。
3.如权力要求1所述的基于深度学习的配体化合物快速预筛选模型,其特征在于:S2中所述神经网络模型采用深度全连接神经网络和深度卷积神经网络,将样本数据分成独立的训练集、验证集和测试集,构建目标函数E,基于二进制交叉熵损失L,如下式所示:
E(W,b)=L(W,b)+λΩ(W)
其中,yi表示样本i的标签,pi表示样本i预测为阳性的概率,Ω(W)为正则项,
基于训练样本集对神经网络模型进行监督式训练,通过梯度下降法迭代更新,得到模型参数:验证集用来对模型超参数进行优化;测试集用来评价模型的泛化能力,将待筛选的配体和受体结合向量进行归一化处理,作为模型输入,经过多层神经网络进行特征提取,最后基于Sigmoid层,输出小分子化合物与蛋白质亲和力评分,Sigmoid函数如下:
4.如权力要求1所述的基于深度学习的配体化合物快速预筛选模型,其特征在于:S5中所述可增量更新的聚类方法,具体包括:模型每次读取一个样本,计算该样本与当前所有簇中心点的相似度(或距离),将其加入到相似度最高(或距离最小)的簇中,更新簇和簇中心点,若样本与现有簇中心点相似度都低于(或距离都高于)设定阈值,该样本不属于任何一簇,将其作为一个新簇中心点,直至所有样本都聚类完成,更新簇和簇中心点。
5.如权力要求1所述的基于深度学习的配体化合物快速预筛选模型,其特征在于:S6中所述簇之间的比较是基于相似度(或距离)对不同簇中心点进行比较,对于相似度较高(或距离较小)的簇,取出簇中所有样本,对其进行权力要求5中所述聚类方法聚类。
6.如权力要求1所述的基于深度学习的配体化合物快速预筛选模型,其特征在于:S8中所述小分子化合物排序是簇内进行排序,取每个簇中评分最高的化合物,作为潜在活性化合物,有效去除冗余,保证配体化合物结构的多样性,提高预测速度及准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110697840.8A CN113393911B (zh) | 2021-06-23 | 2021-06-23 | 一种基于深度学习的配体化合物快速预筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110697840.8A CN113393911B (zh) | 2021-06-23 | 2021-06-23 | 一种基于深度学习的配体化合物快速预筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113393911A true CN113393911A (zh) | 2021-09-14 |
CN113393911B CN113393911B (zh) | 2022-08-19 |
Family
ID=77623524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110697840.8A Active CN113393911B (zh) | 2021-06-23 | 2021-06-23 | 一种基于深度学习的配体化合物快速预筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113393911B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114093436A (zh) * | 2021-11-22 | 2022-02-25 | 北京深势科技有限公司 | 迭代式结合亲和力评估模型的构建方法和系统 |
CN114702450A (zh) * | 2022-04-15 | 2022-07-05 | 大连理工大学 | 一类作用于abl1酪氨酸激酶的化合物及其应用 |
CN115631784A (zh) * | 2022-10-26 | 2023-01-20 | 苏州立妙达药物科技有限公司 | 一种基于多尺度判别的无梯度柔性分子对接方法 |
CN116453587A (zh) * | 2023-06-15 | 2023-07-18 | 之江实验室 | 一种任务执行方法、装置、存储介质及电子设备 |
CN117373564A (zh) * | 2023-12-08 | 2024-01-09 | 北京百奥纳芯生物科技有限公司 | 一种蛋白靶标的结合配体的生成方法、装置及电子设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107862173A (zh) * | 2017-11-15 | 2018-03-30 | 南京邮电大学 | 一种先导化合物虚拟筛选方法和装置 |
CN110459274A (zh) * | 2019-08-01 | 2019-11-15 | 南京邮电大学 | 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用 |
CN110534164A (zh) * | 2019-09-26 | 2019-12-03 | 广州费米子科技有限责任公司 | 基于深度学习的药物分子生成方法 |
CN110910951A (zh) * | 2019-11-19 | 2020-03-24 | 江苏理工学院 | 一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法 |
CN111435608A (zh) * | 2019-09-05 | 2020-07-21 | 中国海洋大学 | 一种基于深度学习的蛋白质药物结合位点预测方法 |
CN111462833A (zh) * | 2019-01-20 | 2020-07-28 | 深圳智药信息科技有限公司 | 一种虚拟药物筛选方法、装置、计算设备及存储介质 |
CN112164428A (zh) * | 2020-09-23 | 2021-01-01 | 常州微亿智造科技有限公司 | 基于深度学习的药物小分子性质预测方法和装置 |
CN112164427A (zh) * | 2020-09-23 | 2021-01-01 | 常州微亿智造科技有限公司 | 基于深度学习的药物小分子靶点活性预测方法和装置 |
CN112201313A (zh) * | 2020-09-15 | 2021-01-08 | 北京晶派科技有限公司 | 一种自动化的小分子药物筛选方法和计算设备 |
CN112489722A (zh) * | 2020-11-27 | 2021-03-12 | 江苏理工学院 | 药物靶点结合能预测方法及装置 |
US20210109954A1 (en) * | 2019-10-11 | 2021-04-15 | S&P Global | Deep learning-based two-phase clustering algorithm |
CN112966702A (zh) * | 2019-12-12 | 2021-06-15 | 深圳先进技术研究院 | 蛋白质-配体复合物的分类方法及分类装置 |
-
2021
- 2021-06-23 CN CN202110697840.8A patent/CN113393911B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107862173A (zh) * | 2017-11-15 | 2018-03-30 | 南京邮电大学 | 一种先导化合物虚拟筛选方法和装置 |
CN111462833A (zh) * | 2019-01-20 | 2020-07-28 | 深圳智药信息科技有限公司 | 一种虚拟药物筛选方法、装置、计算设备及存储介质 |
CN110459274A (zh) * | 2019-08-01 | 2019-11-15 | 南京邮电大学 | 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用 |
CN111435608A (zh) * | 2019-09-05 | 2020-07-21 | 中国海洋大学 | 一种基于深度学习的蛋白质药物结合位点预测方法 |
CN110534164A (zh) * | 2019-09-26 | 2019-12-03 | 广州费米子科技有限责任公司 | 基于深度学习的药物分子生成方法 |
US20210109954A1 (en) * | 2019-10-11 | 2021-04-15 | S&P Global | Deep learning-based two-phase clustering algorithm |
CN110910951A (zh) * | 2019-11-19 | 2020-03-24 | 江苏理工学院 | 一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法 |
CN112966702A (zh) * | 2019-12-12 | 2021-06-15 | 深圳先进技术研究院 | 蛋白质-配体复合物的分类方法及分类装置 |
CN112201313A (zh) * | 2020-09-15 | 2021-01-08 | 北京晶派科技有限公司 | 一种自动化的小分子药物筛选方法和计算设备 |
CN112164428A (zh) * | 2020-09-23 | 2021-01-01 | 常州微亿智造科技有限公司 | 基于深度学习的药物小分子性质预测方法和装置 |
CN112164427A (zh) * | 2020-09-23 | 2021-01-01 | 常州微亿智造科技有限公司 | 基于深度学习的药物小分子靶点活性预测方法和装置 |
CN112489722A (zh) * | 2020-11-27 | 2021-03-12 | 江苏理工学院 | 药物靶点结合能预测方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114093436A (zh) * | 2021-11-22 | 2022-02-25 | 北京深势科技有限公司 | 迭代式结合亲和力评估模型的构建方法和系统 |
CN114093436B (zh) * | 2021-11-22 | 2023-03-31 | 北京深势科技有限公司 | 迭代式结合亲和力评估模型的构建方法和系统 |
CN114702450A (zh) * | 2022-04-15 | 2022-07-05 | 大连理工大学 | 一类作用于abl1酪氨酸激酶的化合物及其应用 |
CN115631784A (zh) * | 2022-10-26 | 2023-01-20 | 苏州立妙达药物科技有限公司 | 一种基于多尺度判别的无梯度柔性分子对接方法 |
CN115631784B (zh) * | 2022-10-26 | 2024-04-23 | 苏州立妙达药物科技有限公司 | 一种基于多尺度判别的无梯度柔性分子对接方法 |
CN116453587A (zh) * | 2023-06-15 | 2023-07-18 | 之江实验室 | 一种任务执行方法、装置、存储介质及电子设备 |
CN116453587B (zh) * | 2023-06-15 | 2023-08-29 | 之江实验室 | 一种基于分子动力学模型预测配体亲和力的任务执行方法 |
CN117373564A (zh) * | 2023-12-08 | 2024-01-09 | 北京百奥纳芯生物科技有限公司 | 一种蛋白靶标的结合配体的生成方法、装置及电子设备 |
CN117373564B (zh) * | 2023-12-08 | 2024-03-01 | 北京百奥纳芯生物科技有限公司 | 一种蛋白靶标的结合配体的生成方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113393911B (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113393911B (zh) | 一种基于深度学习的配体化合物快速预筛选方法 | |
CN113707235B (zh) | 基于自监督学习的药物小分子性质预测方法、装置及设备 | |
Li et al. | Protein contact map prediction based on ResNet and DenseNet | |
CN111370073B (zh) | 一种基于深度学习的药物互作规则预测方法 | |
CN112102899A (zh) | 一种分子预测模型的构建方法和计算设备 | |
CN113571125A (zh) | 基于多层网络与图编码的药物靶点相互作用预测方法 | |
CN114724623A (zh) | 一种蛋白质多源特征融合的药物-靶点亲和力预测的方法 | |
CN109727637B (zh) | 基于混合蛙跳算法识别关键蛋白质的方法 | |
CN111667880A (zh) | 一种基于深度残差神经网络的蛋白质残基接触图预测方法 | |
CN111627494A (zh) | 基于多维特征的蛋白质性质预测方法、装置和计算设备 | |
CN112151127A (zh) | 基于分子语义向量的无监督学习药物虚拟筛选方法和系统 | |
Qiu et al. | BOW-GBDT: a GBDT classifier combining with artificial neural network for identifying GPCR–drug interaction based on wordbook learning from sequences | |
CN112420126A (zh) | 一种基于多源数据融合和网络结构扰动的药物靶标预测方法 | |
CN116206688A (zh) | 一种用于dta预测的多模态信息融合模型及方法 | |
CN116580848A (zh) | 一种基于多头注意力机制的分析癌症多组学数据方法 | |
CN113764034B (zh) | 基因组序列中潜在bgc的预测方法、装置、设备及介质 | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN114999566B (zh) | 基于词向量表征和注意力机制的药物重定位方法及系统 | |
CN116978464A (zh) | 数据处理方法、装置、设备以及介质 | |
CN113539364B (zh) | 一种深度神经网络框架预测蛋白质磷酸化的方法 | |
CN114420201A (zh) | 一种多源数据高效融合的药物靶标相互作用的预测方法 | |
Medina-Ortiz Sr et al. | RUDEUS, a machine learning classification system to study DNA-Binding proteins | |
Zeng et al. | Improved protein secondary structure prediction using bidirectional long short-term memory neural network and bootstrap aggregating | |
Pavlov et al. | Recognition of DNA secondary structures as nucleosome barriers with deep learning methods | |
US20230162813A1 (en) | Apparatus and method for diagnosing cancer using liquid biopsy data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |