CN116312855B - 先导化合物活性优化方法 - Google Patents
先导化合物活性优化方法 Download PDFInfo
- Publication number
- CN116312855B CN116312855B CN202310208564.3A CN202310208564A CN116312855B CN 116312855 B CN116312855 B CN 116312855B CN 202310208564 A CN202310208564 A CN 202310208564A CN 116312855 B CN116312855 B CN 116312855B
- Authority
- CN
- China
- Prior art keywords
- group
- activity
- goup
- scaffold
- fake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000000694 effects Effects 0.000 title claims abstract description 29
- 150000002611 lead compounds Chemical class 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 30
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 21
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 21
- 239000013598 vector Substances 0.000 claims description 55
- 239000003446 ligand Substances 0.000 claims description 28
- 150000003384 small molecules Chemical class 0.000 claims description 18
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 230000005496 eutectics Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 4
- 101000741396 Chlamydia muridarum (strain MoPn / Nigg) Probable oxidoreductase TC_0900 Proteins 0.000 description 2
- 101000741399 Chlamydia pneumoniae Probable oxidoreductase CPn_0761/CP_1111/CPj0761/CpB0789 Proteins 0.000 description 2
- 101000741400 Chlamydia trachomatis (strain D/UW-3/Cx) Probable oxidoreductase CT_610 Proteins 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一种先导化合物活性优化方法,包含:通过PDB数据库建立(scaffold,fake_R_group,true_R_goup)MMP训练集;通过MMP训练集对Transformer模型进行训练。最终通过训练好的Transformer模型实现后续的R基团预测。本发明的先导化合物活性优化方法,通过构造MMP数据集,获得R基团优化目标的监督训练数据,避免了R基团和母核分子组装过程中容易出现自然界不存在的分子结构的问题,同时将蛋白质口袋信息编码输入到Transformer模型,提升了R基团替换时的先导分子活性。
Description
技术领域
本发明涉及一种先导化合物活性优化方法。
背景技术
计算机辅助先导化合物活性优化技术是指利用计算机算法提高靶点和先导化合物结合亲和力的方法。通常,药物化学家会根据他们的直觉对初始分子进行分子优化。一种广泛使用的策略是采用匹配分子对(Matched Molecular Pair,以下简称MMP)的概念,即药化专家会对保持初始分子母核部分(scaffold)不变,同时替换另一部分结构基团(R基团),以获得所需的活性。
传统计算机辅助药物设计(以下简称CADD)方法是通过R基团和scaffold的构效关系(以下简称SAR)实现先导优化过程。一般而言,SAR算法中的R基团替换是基于专家经验知识实现。然而,R基团替换的专家知识库非常庞大,受到人脑经验和后期维护成本的限制,先导优化技术有待发展。
越来越多的研究表明,新一代的人工智能(Artificial Intelligence,以下简称AI)技术能够提升先导优化性能指标。然而,现有AI方法主要通过片段组合生成(FragmentBased Drug Discovery)实现先导优化。
传统SAR算法采用浅层机器学习算法作为知识库补充方法,活性提升性能一般,难以达到专家知识水平。目前AI主流的基于深度学习的分子生成算法,由于缺乏优化目标的监督训练数据,R基团和母核分子组装过程中容易出现自然界不存在的分子结构。
本发明能兼顾CADD和AI的优势,并且能有效解决上述出现的问题。
发明内容
本发明提供了一种先导化合物活性优化方法解决上述提到的技术问题,具体采用如下的技术方案:
一种先导化合物活性优化方法,包含以下步骤:
获取PDB数据库,抽取蛋白质靶标target和小分子配体ligand的共晶结构,从BindingDB数据库中找到对应的活性值pAC50,按活性值pAC50制作三元组(target,ligand,pAC50)格式的数据集;
从三元组中选择pAC50值大于预设值的小分子配体ligand,用docking软件逐个完成target和ligand的打分,即ppAC50值,形成(target_FASTA,ligand,pAC50,ppAC50)四元组,target_FASTA是指蛋白质靶标target的完整氨基酸序列;
逐个为四元组中的小分子配体ligand断裂出初始分子母核scaffold和R基团true_R_goup,生成新的R基团fake_R_goup拼接到初始分子母核scaffold的断裂处;
将新的R基团fake_R_goup和初始分子母核scaffold进行拼接产生新的小分子配体ligand,用docking软件进行打分,即pppAC50,如果pppAC50小于ppAC50,则将这些新数据构造出(target_FASTA,ligand,pAC50,ppAC50,pppAC50,scaffold,fake_R_goup,true_R_group)八元组;
从八元组中提取出初始分子母核scaffold和新的R基团fake_R_goup作为训练数据,对应的R基团true_R_goup则作为训练集中的标签数据,获得(scaffold,fake_R_group,true_R_goup)MMP训练集;
通过MMP训练集对Transformer模型进行训练。
进一步地,通过MMP训练集对Transformer模型进行训练的具体方法为:
获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H;
将获取到的隐空间向量H输入Transformer模型的编码模块进行编码得到隐向量L;
获取PDB数据库中的蛋白质序列的特征向量P;
将隐向量L和特征向量P进行注意力加权操作得到隐向量C;
将隐向量C输入Transformer模型的解码模块进行解码生成预测的R基团R_group;
通过预测的R基团R_group和R基团true_R_goup计算LOSS,直至迭代完成。
进一步地,所述获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H的具体方法为:
通过消息传递神经网络MPNN编码对初始分子母核scaffold和新的R基团fake_R_group的2D分子图进行编码得到隐向量H1;
通过SMILES序列编码对初始分子母核scaffold和新的R基团fake_R_goup拼接成的SMILES进行编码得到隐向量H2;
拼接隐向量H1和隐向量H2得到隐空间向量H。
进一步地,所述获取PDB数据库中的蛋白质序列的特征向量P的具体方法为:
将PDB数据库中的蛋白质序列输入到训练好的模型TAPE生成特征向量P。
进一步地,Transformer模型的编码模块包含multi-head self-attention子模块和第一FFN子模块。
进一步地,Transformer模型的解码模块包含masked self-attention子模块、encoder-decoder attention子模块和第二FFN子模块。
进一步地,通过预测的R基团R_group和R基团true_R_goup计算LOSS的具体方法是采用下述公式计算误差:
其中,Spred表示模型预测出的R基团R_group的SMILES,Strue表示R基团true_R_goup的SMILES。
进一步地,从三元组中选择pAC50值大于7的小分子配体ligand。
进一步地,docking软件为VINA。
进一步地,通过R-group replacement resource规则库产生新的R基团fake_R_group。
本发明的有益之处在于所提供的先导化合物活性优化方法,通过构造MMP数据集,获得R基团优化目标的监督训练数据,避免了R基团和母核分子组装过程中容易出现自然界不存在的分子结构的问题,同时将蛋白质口袋信息编码输入到Transformer模型,提升了R基团替换时的先导分子活性。
附图说明
图1是本发明的一种先导化合物活性优化方法的示意图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
本申请公开一种先导化合物活性优化方法,具体包含以下步骤:
S1:获取PDB数据库,抽取蛋白质靶标target和小分子配体ligand的共晶结构,从BindingDB数据库中找到对应的活性值pAC50(即pIC50、pKi、pKd三种活性值),按活性值pAC50制作三元组(target,ligand,pAC50)格式的数据集。PDB数据库可以从互联网中下载获取。
S2:从三元组中选择pAC50值大于预设值的小分子配体ligand,用docking软件逐个完成target和ligand的打分,即ppAC50值,形成(target_FASTA,ligand,pAC50,ppAC50)四元组,target_FASTA是指蛋白质靶标target的完整氨基酸序列。在本申请中,从三元组中选择pAC50值大于7的小分子配体ligand。而docking软件为VINA。
S3:逐个为四元组中的小分子配体ligand断裂出初始分子母核scaffold和R基团true_R_goup,生成新的R基团fake_R_goup拼接到初始分子母核scaffold的断裂处。在本申请中,通过R-group replacement resource规则库产生新的R基团fake_R_group。
S4:将新的R基团fake_R_goup和初始分子母核scaffold进行拼接产生新的小分子配体ligand,用docking软件进行打分,即pppAC50,如果pppAC50小于ppAC50,则将这些新数据构造出(target_FASTA,ligand,pAC50,ppAC50,pppAC50,scaffold,fake_R_goup,true_R_group)八元组。
S5:从八元组中提取出初始分子母核scaffold和新的R基团fake_R_goup作为训练数据,对应的R基团true_R_goup则作为训练集中的标签数据,获得(scaffold,fake_R_group,true_R_goup)MMP训练集。八元组中的初始分子母核scaffold和新的R基团fake_R_goup作为模型输入的重要信息来源,需要通过"简化分子线性输入规范"来表征分子结构,即SMILES。
S6:通过MMP训练集对Transformer模型进行训练。训练完成后的Transformer模型具有预测功能,能够针对性的生成预测的R基团。
在本申请的实施方式中,如图1所示,通过MMP训练集对Transformer模型进行训练的具体方法为:
S61:获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H。
具体地,获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H的具体方法为:
通过消息传递神经网络MPNN编码对初始分子母核scaffold和新的R基团fake_R_group的2D分子图进行编码得到隐向量H1∈Rm×d1。具体输入G=(V,E),V代表组成分子的每个原子,即V={v1,v2,…vn},vi∈{1<=i<=n},包含了RDKit开源工具包计算的scaffold、fake_R_group中的每个重原子的2D化学属性。代表两个原子i,j之间的键,H1∈Rm×d1。
通过SMILES序列编码对初始分子母核scaffold和新的R基团fake_R_group拼接成的SMILES进行编码得到隐向量H2∈Rm×d2。
拼接隐向量H1和隐向量H2得到隐空间向量H∈Rm×(d1+d2)。其中,m代表小分子SMILE的长度,d1+d2为隐变量维度。
S62:将获取到的隐空间向量H输入Transformer模型的编码模块进行编码得到隐向量L。
具体地,Transformer模型的编码模块包含multi-head self-attention(多头自编码)子模块和第一FFN(position-wise feed-forward network,前馈神经网络)子模块。隐空间向量H通过Transformer模型的编码模块进行编码后得到隐向量L∈Rm×f,f表示隐藏层维度。
S63:获取PDB数据库中的蛋白质序列的特征向量P。
具体而言,获取PDB数据库中的蛋白质序列的特征向量P的具体方法为:
通过PDB数据库中的蛋白质序列对开源模型TAPE进行训练。训练好后,再将PDB数据库中的蛋白质序列输入到训练好的模型TAPE生成包含了蛋白质丰富信息的k维特征向量P∈Rk。
S64:将隐向量L和特征向量P进行注意力加权操作得到隐向量C;
具体地,根据公示epi=att(P,Li),计算初始分子母核scaffold和新的R基团fake_R_goup拼接成的中的每一个token与蛋白质序列的相关性,获得向量epmol=(att(P,L1),..att(P,Lm)),其中att表示加权点乘,Li表示SMILES中的第i token。然后使用公式apmol=softmax(epmol))将epmol标准化得到attention的分布后根据公式 获得隐向量hpmol∈Rf。最后利用Cotent=φ(L,hpmol),获得向量Cotent∈Rm×f,φ表示加权点乘。拼接Cotent和蛋白质向量,获得隐向量C∈Rm×(f+k)。
S65:将隐向量C输入Transformer模型的解码模块进行解码生成预测的R基团R_group。
具体而言,Transformer模型的解码模块包含masked self-attention子模块、encoder-decoder attention子模块和第二FFN子模块。
通过masked self-attention掩盖住t+1时刻以后的tokens。通过encoder-decoder attention层帮助解码器关注SMILES序列中的重要部分。
解码器迭代生成小分子R基团的SMILES序列S=(s1,s2,…sl),直到结束符“EOS”出现或者小分子R基团的SMILES长度达到设定最大长度l结束小分子R基团生长。
使用规则拼接scaffold和生成的小分子R基团的S序列后获得小分子的SMILES序列M=(m1,m2,…mm),m>l。
S66:通过预测的R基团R_group和R基团true_R_goup计算LOSS,直至迭代完成。
作为一种优选的实施方式,通过预测的R基团R_group和R基团true_R_goup计算LOSS的具体方法是采用下述公式计算误差:
其中,l表示R基团的SMILES长度。Spred表示模型预测出的R基团R_group的SMILES,Strue表示R基团true_R_goup的SMILES,/>
定义生成模型的迭代次数,定义小分子的R基团的最大生长长度l,按照定义的参数进行迭代,直至完成。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种先导化合物活性优化方法,其特征在于,包含以下步骤:
获取PDB数据库,抽取蛋白质靶标target和小分子配体ligand的共晶结构,从BindingDB数据库中找到对应的活性值pAC50,按活性值pAC50制作三元组(target,ligand,pAC50)格式的数据集;
从三元组中选择pAC50值大于预设值的小分子配体ligand,用docking软件逐个完成target和ligand的打分,即ppAC50值,形成(target_FASTA,ligand,pAC50,ppAC50)四元组,target_FASTA是指蛋白质靶标target的完整氨基酸序列;
逐个为四元组中的小分子配体ligand断裂出初始分子母核scaffold和R基团true_R_goup,生成新的R基团fake_R_goup拼接到初始分子母核scaffold的断裂处;
将新的R基团fake_R_goup和初始分子母核scaffold进行拼接产生新的小分子配体ligand,用docking软件进行打分,即pppAC50,如果pppAC50小于ppAC50,则将这些新数据构造出(target_FASTA,ligand,pAC50,ppAC50,pppAC50,scaffold,fake_R_goup,true_R_group)八元组;
从八元组中提取出初始分子母核scaffold和新的R基团fake_R_goup作为训练数据,对应的R基团true_R_goup则作为训练集中的标签数据,获得(scaffold,fake_R_group,true_R_goup)MMP训练集;
通过MMP训练集对Transformer模型进行训练。
2.根据权利要求1所述的先导化合物活性优化方法,其特征在于,
通过MMP训练集对Transformer模型进行训练的具体方法为:
获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H;
将获取到的隐空间向量H输入Transformer模型的编码模块进行编码得到隐向量L;
获取PDB数据库中的蛋白质序列的特征向量P;
将隐向量L和特征向量P进行注意力加权操作得到隐向量C;
将隐向量C输入Transformer模型的解码模块进行解码生成预测的R基团R_group;
通过预测的R基团R_group和R基团true_R_goup计算LOSS,直至迭代完成。
3.根据权利要求2所述的先导化合物活性优化方法,其特征在于,
所述获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H的具体方法为:
通过消息传递神经网络MPNN编码对初始分子母核scaffold和新的R基团fake_R_group的2D分子图进行编码得到隐向量H1;
通过SMILES序列编码对初始分子母核scaffold和新的R基团fake_R_goup拼接成的SMILES进行编码得到隐向量H2;
拼接隐向量H1和隐向量H2得到隐空间向量H。
4.根据权利要求3所述的先导化合物活性优化方法,其特征在于,
所述获取PDB数据库中的蛋白质序列的特征向量P的具体方法为:
将PDB数据库中的蛋白质序列输入到训练好的模型TAPE生成特征向量P。
5.根据权利要求4所述的先导化合物活性优化方法,其特征在于,
Transformer模型的编码模块包含multi-head self-attention子模块和第一FFN子模块。
6.根据权利要求5所述的先导化合物活性优化方法,其特征在于,
Transformer模型的解码模块包含masked self-attention子模块、encoder-decoderattention子模块和第二FFN子模块。
7.根据权利要求6所述的先导化合物活性优化方法,其特征在于,
通过预测的R基团R_group和R基团true_R_goup计算LOSS的具体方法是采用下述公式计算误差:
其中,Spred表示模型预测出的R基团R_group的SMILES,Strue表示R基团true_R_goup的SMILES。
8.根据权利要求1所述的先导化合物活性优化方法,其特征在于,
从三元组中选择pAC50值大于7的小分子配体ligand。
9.根据权利要求1所述的先导化合物活性优化方法,其特征在于,
docking软件为VINA。
10.根据权利要求1所述的先导化合物活性优化方法,其特征在于,
通过R-group replacement resource规则库产生新的R基团fake_R_group。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310208564.3A CN116312855B (zh) | 2023-02-28 | 2023-02-28 | 先导化合物活性优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310208564.3A CN116312855B (zh) | 2023-02-28 | 2023-02-28 | 先导化合物活性优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116312855A CN116312855A (zh) | 2023-06-23 |
CN116312855B true CN116312855B (zh) | 2023-09-08 |
Family
ID=86795547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310208564.3A Active CN116312855B (zh) | 2023-02-28 | 2023-02-28 | 先导化合物活性优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116312855B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1130009A1 (en) * | 2000-03-01 | 2001-09-05 | Therascope AG | Generation and screening of a dynamic combinatorial library |
CN113192572A (zh) * | 2021-04-29 | 2021-07-30 | 南京邮电大学 | 一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置 |
CN113590843A (zh) * | 2021-08-06 | 2021-11-02 | 中国海洋大学 | 一种融合分子结构特征的知识表示学习方法 |
CN114171125A (zh) * | 2021-12-02 | 2022-03-11 | 中山大学 | 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法 |
CN114420197A (zh) * | 2022-01-04 | 2022-04-29 | 北京航空航天大学 | 基于自编码器的蛋白质降解靶向嵌合体的连接体设计方法 |
CN114913938A (zh) * | 2022-05-27 | 2022-08-16 | 中南大学 | 一种基于药效团模型的小分子生成方法、设备及介质 |
CN115240788A (zh) * | 2022-09-19 | 2022-10-25 | 杭州生奥信息技术有限公司 | 基于分子砌块合成规划技术的小分子从头设计方法 |
CN115274007A (zh) * | 2022-08-02 | 2022-11-01 | 殷越铭 | 一种用于发现和优化药物先导化合物的可泛化、可解释的深度图学习方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020172967A1 (en) * | 2001-02-13 | 2002-11-21 | Gadek Thomas R. | Identification of non-covalent complexes by mass spectrometry |
-
2023
- 2023-02-28 CN CN202310208564.3A patent/CN116312855B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1130009A1 (en) * | 2000-03-01 | 2001-09-05 | Therascope AG | Generation and screening of a dynamic combinatorial library |
CN113192572A (zh) * | 2021-04-29 | 2021-07-30 | 南京邮电大学 | 一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置 |
CN113590843A (zh) * | 2021-08-06 | 2021-11-02 | 中国海洋大学 | 一种融合分子结构特征的知识表示学习方法 |
CN114171125A (zh) * | 2021-12-02 | 2022-03-11 | 中山大学 | 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法 |
CN114420197A (zh) * | 2022-01-04 | 2022-04-29 | 北京航空航天大学 | 基于自编码器的蛋白质降解靶向嵌合体的连接体设计方法 |
CN114913938A (zh) * | 2022-05-27 | 2022-08-16 | 中南大学 | 一种基于药效团模型的小分子生成方法、设备及介质 |
CN115274007A (zh) * | 2022-08-02 | 2022-11-01 | 殷越铭 | 一种用于发现和优化药物先导化合物的可泛化、可解释的深度图学习方法 |
CN115240788A (zh) * | 2022-09-19 | 2022-10-25 | 杭州生奥信息技术有限公司 | 基于分子砌块合成规划技术的小分子从头设计方法 |
Non-Patent Citations (1)
Title |
---|
通过分子对接确定并优化先导化合物;刘景陶;《科技创新与应用》;论文全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116312855A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lan et al. | What is semantic communication? A view on conveying meaning in the era of machine intelligence | |
US20210295955A1 (en) | Artificial intelligence engine architecture for generating candidate drugs | |
JP2019502988A5 (zh) | ||
US11256995B1 (en) | System and method for prediction of protein-ligand bioactivity using point-cloud machine learning | |
US20230325687A1 (en) | System and method for de novo drug discovery | |
Melvin et al. | SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition | |
US20220036182A1 (en) | Method and apparatus for synthesizing target products by using neural networks | |
US11967400B2 (en) | Generating enhanced graphical user interfaces for presentation of anti-infective design spaces for selecting drug candidates | |
CN112447300B (zh) | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 | |
CN114093527A (zh) | 一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统 | |
CN112397155B (zh) | 一种单步逆向合成方法及系统 | |
Silva et al. | Novel approaches using evolutionary computation for sparse least square support vector machines | |
Rigoni et al. | Conditional constrained graph variational autoencoders for molecule design | |
CN116711016A (zh) | 用于使用实验验证和肽药物优化生成候选药物的人工智能引擎 | |
CN116312855B (zh) | 先导化合物活性优化方法 | |
Chen et al. | Predicting drug-target interaction via self-supervised learning | |
CN117153294A (zh) | 一种单一体系的分子生成方法 | |
Lin et al. | Disentangled face editing via individual walk in personalized facial semantic field | |
KR20220014798A (ko) | 뉴럴 네트워크를 이용하여 표적 생성물을 합성하는 장치 및 방법 | |
Frolov et al. | Tensor-based sequential learning via hankel matrix representation for next item recommendations | |
Lin et al. | A new genomic evolutionary model for rearrangements, duplications, and losses that applies across eukaryotes and prokaryotes | |
US20050112577A1 (en) | Rna sequence analyzer, and rna sequence analysis method, program and recording medium | |
CN115836350A (zh) | 用于确定新抗原的呈递可能性的方法、系统和计算机程序产品 | |
Mondal et al. | scRAE: deterministic regularized autoencoders with flexible priors for clustering single-cell gene expression data | |
US20220327425A1 (en) | Peptide mutation policies for targeted immunotherapy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |