CN112085247A - 一种基于深度学习的蛋白质残基接触预测方法 - Google Patents

一种基于深度学习的蛋白质残基接触预测方法 Download PDF

Info

Publication number
CN112085247A
CN112085247A CN202010709538.5A CN202010709538A CN112085247A CN 112085247 A CN112085247 A CN 112085247A CN 202010709538 A CN202010709538 A CN 202010709538A CN 112085247 A CN112085247 A CN 112085247A
Authority
CN
China
Prior art keywords
sequence
protein
residue
convolution
contact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010709538.5A
Other languages
English (en)
Inventor
张贵军
熊章宗
卢升荣
陈芳
李亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010709538.5A priority Critical patent/CN112085247A/zh
Publication of CN112085247A publication Critical patent/CN112085247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Abstract

一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:首先从PDB库中下载蛋白质氨基酸的序列和结构信息,构建残基对接触矩阵;使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;其次,对每个蛋白质序列通过多序列比对提取序列特征;再次,将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练。本发明提供了一种预测效率与准确性较高的基于深度学习的蛋白质残基接触预测方法。

Description

一种基于深度学习的蛋白质残基接触预测方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于深度学习的蛋白质残基接触预测方法。
背景技术
DNN模型在基于图像和语言的问题上表现出色。最近,这种优良的性能已经扩展到蛋白质结构预测领域,残基与残基间的接触是DNN模型在蛋白质结构预测中产生重大影响的一个应用领域,在全球蛋白质结构预测大赛CASP12和13中,其准确性得到了显著提高。
残基与残基间接触在维持蛋白质的天然结构和引导蛋白质折叠中起着关键作用,这些接触的残基对通常具有较大的分离,但在三维结构中显示出非常接近的关系。长期以来,人们观察到,只要有足够的蛋白质残基-残基接触的正确信息,就有可能阐明蛋白质的折叠。蛋白质接触预测将为一系列工作带来好处,包括折叠识别、从头开始的蛋白质折叠、蛋白质三维模型质量评估和从头设计蛋白质。
蛋白质的三维结构可以通过生物实验进行测定,但是过程复杂,成本昂贵。例如,通过x射线晶体衍射测定蛋白质结构的精度很高,但是它需要一个纯净的蛋白质样品来形成相对无瑕疵的晶体。核磁共振方法则局限于小的可溶性蛋白。因此,根据氨基酸序列预测蛋白质三维结构是实现高通量蛋白质结构获取的关键,而基于深度学习的蛋白质残基接触预测是其中的关键一环。
发明内容
针对以上技术问题。本发明提出了一种基于深度学习的蛋白质残基接触预测方法,不仅降低了测算成本,而且提高了计算效率。
本发明解决其技术问题所采用的技术方案是:
一种基于深度学习的蛋白质残基接触预测方法,所述方法包括以下步骤:
1)首先从PDB库中下载蛋白质的序列和结构信息,然后根据蛋白质结构各残基的三维空间坐标计算出每个残基对之间的欧式距离,如果距离小于
Figure BDA0002596037460000011
则表示为1,反之为0,并构建残基对接触矩阵;
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
Figure BDA0002596037460000021
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000027
表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
Figure BDA0002596037460000022
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000023
表示为序列m的第i号残基是否为A型,是则为1,反之为0,
Figure BDA0002596037460000024
表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000025
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000026
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
本发明的有益效果主要表现在:利用深度学习技术强大的学习能力提高了蛋白质残基间接触预测的效率与准确性,充分利用序列间残基相互关系,提高了预测的可靠性。
附图说明
图1是基于深度学习的蛋白质残基接触预测方法网络架构图。
图2是基于深度学习的蛋白质残基接触预测方法对蛋白1A6M预测得到的接触图。
图3是基于深度学习的蛋白质残基接触预测方法对蛋白1A6M进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3,一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:
1)首先从PDB库中下载蛋白质的序列和结构信息,然后根据蛋白质结构各残基的三维空间坐标计算出每个残基对之间的欧式距离,如果距离小于
Figure BDA0002596037460000031
则表示为1,反之为0,并构建残基对接触矩阵;
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
Figure BDA0002596037460000041
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000042
表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
Figure BDA0002596037460000043
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000044
表示为序列m的第i号残基是否为A型,是则为1,反之为0,
Figure BDA0002596037460000045
表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000046
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000047
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
以序列长度为151的蛋白质1A6M为实施例,一种基于深度学习的蛋白质残基接触预测方法,包括以下步骤:
1)首先从PDB库中下载蛋白质的序列和结构信息,然后根据蛋白质结构各残基的三维空间坐标计算出每个残基对之间的欧式距离,如果距离小于
Figure BDA0002596037460000055
则表示为1,反之为0,并构建残基对接触矩阵;
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
Figure BDA0002596037460000051
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000052
表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
Figure BDA0002596037460000053
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure BDA0002596037460000054
表示为序列m的第i号残基是否为A型,是则为1,反之为0,
Figure BDA0002596037460000061
表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000062
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
Figure BDA0002596037460000063
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)提取蛋白质1A6M的序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质1A6M中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
以序列长度为151的蛋白质1A6M为实施例,运用以上方法得到了该蛋白质残基间的接触情况,并用于蛋白质三维结构预测,预测的蛋白质的均方根偏差为
Figure BDA0002596037460000064
预测结果如图2和图3所示。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,而且在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (1)

1.一种基于深度学习的蛋白质残基接触预测方法,其特征在于,所述方法包括以下步骤:
1)首先从PDB库中下载蛋白质的序列和结构信息,然后根据蛋白质结构各残基的三维空间坐标计算出每个残基对之间的欧式距离,如果距离小于
Figure FDA0002596037450000017
则表示为1,反之为0,并构建残基对接触矩阵;
2)每个蛋白质序列使用HHblits对UniClust30数据库进行搜索,生成多序列比对文件;
3)对每个蛋白质序列通过其MSA提取序列特征,过程如下:
3.1)计算A型氨基酸在第i列的出现频率fi(A):
Figure FDA0002596037450000011
其中M为多序列比对中的序列个数,L为序列长度,i∈{1,2,...,L},A∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure FDA0002596037450000012
表示为序列m的第i号残基是否为A型,是则为1,反之为0;
3.2)计算残基对i和j的类型分别为A和B的频率fij(A,B):
Figure FDA0002596037450000013
其中M为多序列比对中的序列个数,L为序列长度,i,j∈{1,2,...,L},A,B∈{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y,-},
Figure FDA0002596037450000014
表示为序列m的第i号残基是否为A型,是则为1,反之为0,
Figure FDA0002596037450000015
表示为序列m的第i号残基是否为B型,是则为1,反之为0;
3.3)计算第i列和j列的互信息MI,生成一个L*L大小的特征图,L为序列长度:
Figure FDA0002596037450000016
3.4)计算协方差,生成一个441维L*L大小的特征图,L为序列长度:
Figure FDA0002596037450000021
4)将序列特征互信息与协方差合并为一个442维L*L大小的输入特征,构建全卷积残差网络,并在所述输入特征和标签接触矩阵上进行训练,全卷积残差网络构建过程如下:
4.1)全卷积残差网络由1个卷积层和10个残差块以及输出层组成,输出层由1个1×1滤波器的二维卷积层和一个sigmoid非线性函数组成,卷积层可以表示为Conv(X,W,H,D),其中X为输入特征,W和H分别为卷积核的宽度和高度,D为卷积核的数量,该卷积层表示为Conv(X,1,1,64),该层将输入维数从442降至64,残差块由两个卷积层堆叠而成,残差块表示为Res(X)=σ(Conv(σ(Conv(X,3,3,64)),5,5,64)+X),其中σ为ReLU激活函数;
4.2)网络权重使用Xavier均匀分布初始化,使用SGD方法对网络权值进行优化,初始学习率为0.01,使用二元交叉熵作为损失函数;
5)对于待预测的蛋白质,首先提取其序列特征,然后将序列特征输入到残差网络中,输出结果即为蛋白质中每个残基对的接触预测得分;
6)使用k-means聚类方法对输出结果进行聚类,将输出结果分为接触和不接触两类。
CN202010709538.5A 2020-07-22 2020-07-22 一种基于深度学习的蛋白质残基接触预测方法 Pending CN112085247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010709538.5A CN112085247A (zh) 2020-07-22 2020-07-22 一种基于深度学习的蛋白质残基接触预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010709538.5A CN112085247A (zh) 2020-07-22 2020-07-22 一种基于深度学习的蛋白质残基接触预测方法

Publications (1)

Publication Number Publication Date
CN112085247A true CN112085247A (zh) 2020-12-15

Family

ID=73735130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010709538.5A Pending CN112085247A (zh) 2020-07-22 2020-07-22 一种基于深度学习的蛋白质残基接触预测方法

Country Status (1)

Country Link
CN (1) CN112085247A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112837740A (zh) * 2021-01-21 2021-05-25 浙江工业大学 一种基于结构特征的dna绑定残基预测方法
CN113160886A (zh) * 2021-04-02 2021-07-23 山东大学 基于单细胞Hi-C数据的细胞类型预测系统
CN113223608A (zh) * 2021-06-04 2021-08-06 上海天壤智能科技有限公司 双层互强化的蛋白质三维结构预测方法及系统
CN113571126A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于多损失训练的蛋白质残基接触预测方法
CN115527605A (zh) * 2022-11-04 2022-12-27 南京理工大学 基于深度图模型的抗体结构预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109637580A (zh) * 2018-12-06 2019-04-16 上海交通大学 一种蛋白质氨基酸关联矩阵预测方法
CN110689920A (zh) * 2019-09-18 2020-01-14 上海交通大学 一种基于深度学习的蛋白质-配体结合位点预测算法
KR20200017653A (ko) * 2018-08-09 2020-02-19 광주과학기술원 약물-표적 상호 작용 예측을 위한 방법
CN110832596A (zh) * 2017-10-16 2020-02-21 因美纳有限公司 基于深度学习的深度卷积神经网络训练方法
CN111063389A (zh) * 2019-12-04 2020-04-24 浙江工业大学 一种基于深度卷积神经网络的配体绑定残基预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110832596A (zh) * 2017-10-16 2020-02-21 因美纳有限公司 基于深度学习的深度卷积神经网络训练方法
KR20200017653A (ko) * 2018-08-09 2020-02-19 광주과학기술원 약물-표적 상호 작용 예측을 위한 방법
CN109637580A (zh) * 2018-12-06 2019-04-16 上海交通大学 一种蛋白质氨基酸关联矩阵预测方法
CN110689920A (zh) * 2019-09-18 2020-01-14 上海交通大学 一种基于深度学习的蛋白质-配体结合位点预测算法
CN111063389A (zh) * 2019-12-04 2020-04-24 浙江工业大学 一种基于深度卷积神经网络的配体绑定残基预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张海仓;高玉娟;邓明华;郑伟谋;卜东波;: "蛋白质中残基远程相互作用预测算法研究综述", 计算机研究与发展, no. 01, 31 December 2017 (2017-12-31) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112837740A (zh) * 2021-01-21 2021-05-25 浙江工业大学 一种基于结构特征的dna绑定残基预测方法
CN112837740B (zh) * 2021-01-21 2024-03-26 浙江工业大学 一种基于结构特征的dna绑定残基预测方法
CN113160886A (zh) * 2021-04-02 2021-07-23 山东大学 基于单细胞Hi-C数据的细胞类型预测系统
CN113223608A (zh) * 2021-06-04 2021-08-06 上海天壤智能科技有限公司 双层互强化的蛋白质三维结构预测方法及系统
CN113571126A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于多损失训练的蛋白质残基接触预测方法
CN113571126B (zh) * 2021-07-06 2024-03-22 浙江工业大学 一种基于多损失训练的蛋白质残基接触预测方法
CN115527605A (zh) * 2022-11-04 2022-12-27 南京理工大学 基于深度图模型的抗体结构预测方法
CN115527605B (zh) * 2022-11-04 2023-12-12 南京理工大学 基于深度图模型的抗体结构预测方法

Similar Documents

Publication Publication Date Title
CN112085247A (zh) 一种基于深度学习的蛋白质残基接触预测方法
Zhang et al. Generalized semi-supervised and structured subspace learning for cross-modal retrieval
Wang et al. SBSM-Pro: support bio-sequence machine for proteins
Mei et al. Learning a mahalanobis distance-based dynamic time warping measure for multivariate time series classification
You et al. Detecting protein-protein interactions with a novel matrix-based protein sequence representation and support vector machines
CN110289050A (zh) 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN109785901B (zh) 一种蛋白质功能预测方法及装置
Lyons et al. Protein fold recognition by alignment of amino acid residues using kernelized dynamic time warping
Durairaj et al. Geometricus represents protein structures as shape-mers derived from moment invariants
Sun et al. Multi-structure KELM with attention fusion strategy for hyperspectral image classification
CN111798935A (zh) 基于神经网络的普适性化合物结构-性质相关性预测方法
Yu et al. The applications of deep learning algorithms on in silico druggable proteins identification
CN114708903A (zh) 一种基于自注意力机制的蛋白质残基间距离预测方法
CN116417093A (zh) 一种结合Transformer和图神经网络的药物靶标相互作用预测方法
Ibrahim et al. Extracting features from protein sequences to improve deep extreme learning machine for protein fold recognition
Tavanaei et al. Towards recognition of protein function based on its structure using deep convolutional networks
Wang et al. Neural Koopman pooling: Control-inspired temporal dynamics encoding for skeleton-based action recognition
CN113257357B (zh) 蛋白质残基接触图预测方法
CN112085245A (zh) 一种基于深度残差神经网络的蛋白质残基接触预测方法
Li et al. ExamPle: explainable deep learning framework for the prediction of plant small secreted peptides
CN112270950A (zh) 一种基于网络增强和图正则的融合网络药物靶标关系预测方法
Nguyen et al. Multimodal Pretraining for Unsupervised Protein Representation Learning
Khan et al. Classification of Macromolecules Based on Amino Acid Sequences Using Deep Learning
CN106056133A (zh) 一种图像识别方法及装置
Wang et al. The prediction of membrane protein types with NPE

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination