CN112085247A - 一种基于深度学习的蛋白质残基接触预测方法 - Google Patents
一种基于深度学习的蛋白质残基接触预测方法 Download PDFInfo
- Publication number
- CN112085247A CN112085247A CN202010709538.5A CN202010709538A CN112085247A CN 112085247 A CN112085247 A CN 112085247A CN 202010709538 A CN202010709538 A CN 202010709538A CN 112085247 A CN112085247 A CN 112085247A
- Authority
- CN
- China
- Prior art keywords
- sequence
- protein
- residue
- convolution
- contact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 61
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 238000002864 sequence alignment Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 150000001413 amino acids Chemical class 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims abstract description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 229910052739 hydrogen Inorganic materials 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 4
- 238000009827 uniform distribution Methods 0.000 claims description 4
- 230000012846 protein folding Effects 0.000 description 3
- 238000000455 protein structure prediction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 101000983515 Homo sapiens Inactive caspase-12 Proteins 0.000 description 1
- 102100026556 Inactive caspase-12 Human genes 0.000 description 1
- 101800001072 Protein 1A Proteins 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001225 nuclear magnetic resonance method Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Abstract
一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:首先从PDB库中下载蛋白质氨基酸的序列和结构信息,构建残基对接触矩阵;使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;其次,对每个蛋白质序列通过多序列比对提取序列特征;再次,将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练。本发明提供了一种预测效率与准确性较高的基于深度学习的蛋白质残基接触预测方法。
Description
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于深度学习的蛋白质残基接触预测方法。
背景技术
DNN模型在基于图像和语言的问题上表现出色。最近,这种优良的性能已经扩展到蛋白质结构预测领域,残基与残基间的接触是DNN模型在蛋白质结构预测中产生重大影响的一个应用领域,在全球蛋白质结构预测大赛CASP12和13中,其准确性得到了显著提高。
残基与残基间接触在维持蛋白质的天然结构和引导蛋白质折叠中起着关键作用,这些接触的残基对通常具有较大的分离,但在三维结构中显示出非常接近的关系。长期以来,人们观察到,只要有足够的蛋白质残基-残基接触的正确信息,就有可能阐明蛋白质的折叠。蛋白质接触预测将为一系列工作带来好处,包括折叠识别、从头开始的蛋白质折叠、蛋白质三维模型质量评估和从头设计蛋白质。
蛋白质的三维结构可以通过生物实验进行测定,但是过程复杂,成本昂贵。例如,通过x射线晶体衍射测定蛋白质结构的精度很高,但是它需要一个纯净的蛋白质样品来形成相对无瑕疵的晶体。核磁共振方法则局限于小的可溶性蛋白。因此,根据氨基酸序列预测蛋白质三维结构是实现高通量蛋白质结构获取的关键,而基于深度学习的蛋白质残基接触预测是其中的关键一环。
发明内容
针对以上技术问题。本发明提出了一种基于深度学习的蛋白质残基接触预测方法,不仅降低了测算成本,而且提高了计算效率。
本发明解决其技术问题所采用的技术方案是:
一种基于深度学习的蛋白质残基接触预测方法,所述方法包括以下步骤:
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0,表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
本发明的有益效果主要表现在:利用深度学习技术强大的学习能力提高了蛋白质残基间接触预测的效率与准确性,充分利用序列间残基相互关系,提高了预测的可靠性。
附图说明
图1是基于深度学习的蛋白质残基接触预测方法网络架构图。
图2是基于深度学习的蛋白质残基接触预测方法对蛋白1A6M预测得到的接触图。
图3是基于深度学习的蛋白质残基接触预测方法对蛋白1A6M进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3,一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0,表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
以序列长度为151的蛋白质1A6M为实施例,一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0,表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)提取蛋白质1A6M的序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质1A6M中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,而且在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
Claims (1)
1.一种基于深度学习的蛋白质残基接触预测方法,其特征在于,所述方法包括以下步骤:
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},表示为序列m的第i号残基是否为A型,是则为1,反之为0,表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010709538.5A CN112085247A (zh) | 2020-07-22 | 2020-07-22 | 一种基于深度学习的蛋白质残基接触预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010709538.5A CN112085247A (zh) | 2020-07-22 | 2020-07-22 | 一种基于深度学习的蛋白质残基接触预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112085247A true CN112085247A (zh) | 2020-12-15 |
Family
ID=73735130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010709538.5A Pending CN112085247A (zh) | 2020-07-22 | 2020-07-22 | 一种基于深度学习的蛋白质残基接触预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112085247A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112837740A (zh) * | 2021-01-21 | 2021-05-25 | 浙江工业大学 | 一种基于结构特征的dna绑定残基预测方法 |
CN113160886A (zh) * | 2021-04-02 | 2021-07-23 | 山东大学 | 基于单细胞Hi-C数据的细胞类型预测系统 |
CN113223608A (zh) * | 2021-06-04 | 2021-08-06 | 上海天壤智能科技有限公司 | 双层互强化的蛋白质三维结构预测方法及系统 |
CN113571126A (zh) * | 2021-07-06 | 2021-10-29 | 浙江工业大学 | 一种基于多损失训练的蛋白质残基接触预测方法 |
CN115527605A (zh) * | 2022-11-04 | 2022-12-27 | 南京理工大学 | 基于深度图模型的抗体结构预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109637580A (zh) * | 2018-12-06 | 2019-04-16 | 上海交通大学 | 一种蛋白质氨基酸关联矩阵预测方法 |
CN110689920A (zh) * | 2019-09-18 | 2020-01-14 | 上海交通大学 | 一种基于深度学习的蛋白质-配体结合位点预测算法 |
KR20200017653A (ko) * | 2018-08-09 | 2020-02-19 | 광주과학기술원 | 약물-표적 상호 작용 예측을 위한 방법 |
CN110832596A (zh) * | 2017-10-16 | 2020-02-21 | 因美纳有限公司 | 基于深度学习的深度卷积神经网络训练方法 |
CN111063389A (zh) * | 2019-12-04 | 2020-04-24 | 浙江工业大学 | 一种基于深度卷积神经网络的配体绑定残基预测方法 |
-
2020
- 2020-07-22 CN CN202010709538.5A patent/CN112085247A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110832596A (zh) * | 2017-10-16 | 2020-02-21 | 因美纳有限公司 | 基于深度学习的深度卷积神经网络训练方法 |
KR20200017653A (ko) * | 2018-08-09 | 2020-02-19 | 광주과학기술원 | 약물-표적 상호 작용 예측을 위한 방법 |
CN109637580A (zh) * | 2018-12-06 | 2019-04-16 | 上海交通大学 | 一种蛋白质氨基酸关联矩阵预测方法 |
CN110689920A (zh) * | 2019-09-18 | 2020-01-14 | 上海交通大学 | 一种基于深度学习的蛋白质-配体结合位点预测算法 |
CN111063389A (zh) * | 2019-12-04 | 2020-04-24 | 浙江工业大学 | 一种基于深度卷积神经网络的配体绑定残基预测方法 |
Non-Patent Citations (1)
Title |
---|
张海仓;高玉娟;邓明华;郑伟谋;卜东波;: "蛋白质中残基远程相互作用预测算法研究综述", 计算机研究与发展, no. 01, 31 December 2017 (2017-12-31) * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112837740A (zh) * | 2021-01-21 | 2021-05-25 | 浙江工业大学 | 一种基于结构特征的dna绑定残基预测方法 |
CN112837740B (zh) * | 2021-01-21 | 2024-03-26 | 浙江工业大学 | 一种基于结构特征的dna绑定残基预测方法 |
CN113160886A (zh) * | 2021-04-02 | 2021-07-23 | 山东大学 | 基于单细胞Hi-C数据的细胞类型预测系统 |
CN113223608A (zh) * | 2021-06-04 | 2021-08-06 | 上海天壤智能科技有限公司 | 双层互强化的蛋白质三维结构预测方法及系统 |
CN113571126A (zh) * | 2021-07-06 | 2021-10-29 | 浙江工业大学 | 一种基于多损失训练的蛋白质残基接触预测方法 |
CN113571126B (zh) * | 2021-07-06 | 2024-03-22 | 浙江工业大学 | 一种基于多损失训练的蛋白质残基接触预测方法 |
CN115527605A (zh) * | 2022-11-04 | 2022-12-27 | 南京理工大学 | 基于深度图模型的抗体结构预测方法 |
CN115527605B (zh) * | 2022-11-04 | 2023-12-12 | 南京理工大学 | 基于深度图模型的抗体结构预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112085247A (zh) | 一种基于深度学习的蛋白质残基接触预测方法 | |
Zhang et al. | Generalized semi-supervised and structured subspace learning for cross-modal retrieval | |
Wang et al. | SBSM-Pro: support bio-sequence machine for proteins | |
Mei et al. | Learning a mahalanobis distance-based dynamic time warping measure for multivariate time series classification | |
You et al. | Detecting protein-protein interactions with a novel matrix-based protein sequence representation and support vector machines | |
CN110289050A (zh) | 一种基于图卷积和词向量的药物-靶标相互作用预测方法 | |
CN109785901B (zh) | 一种蛋白质功能预测方法及装置 | |
Lyons et al. | Protein fold recognition by alignment of amino acid residues using kernelized dynamic time warping | |
Durairaj et al. | Geometricus represents protein structures as shape-mers derived from moment invariants | |
Sun et al. | Multi-structure KELM with attention fusion strategy for hyperspectral image classification | |
CN111798935A (zh) | 基于神经网络的普适性化合物结构-性质相关性预测方法 | |
Yu et al. | The applications of deep learning algorithms on in silico druggable proteins identification | |
CN114708903A (zh) | 一种基于自注意力机制的蛋白质残基间距离预测方法 | |
CN116417093A (zh) | 一种结合Transformer和图神经网络的药物靶标相互作用预测方法 | |
Ibrahim et al. | Extracting features from protein sequences to improve deep extreme learning machine for protein fold recognition | |
Tavanaei et al. | Towards recognition of protein function based on its structure using deep convolutional networks | |
Wang et al. | Neural Koopman pooling: Control-inspired temporal dynamics encoding for skeleton-based action recognition | |
CN113257357B (zh) | 蛋白质残基接触图预测方法 | |
CN112085245A (zh) | 一种基于深度残差神经网络的蛋白质残基接触预测方法 | |
Li et al. | ExamPle: explainable deep learning framework for the prediction of plant small secreted peptides | |
CN112270950A (zh) | 一种基于网络增强和图正则的融合网络药物靶标关系预测方法 | |
Nguyen et al. | Multimodal Pretraining for Unsupervised Protein Representation Learning | |
Khan et al. | Classification of Macromolecules Based on Amino Acid Sequences Using Deep Learning | |
CN106056133A (zh) | 一种图像识别方法及装置 | |
Wang et al. | The prediction of membrane protein types with NPE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |