CN116844646A - 一种基于深度对比学习的酶功能预测方法 - Google Patents
一种基于深度对比学习的酶功能预测方法 Download PDFInfo
- Publication number
- CN116844646A CN116844646A CN202311131004.9A CN202311131004A CN116844646A CN 116844646 A CN116844646 A CN 116844646A CN 202311131004 A CN202311131004 A CN 202311131004A CN 116844646 A CN116844646 A CN 116844646A
- Authority
- CN
- China
- Prior art keywords
- sample
- training
- neural network
- distance
- enzyme function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000009088 enzymatic function Effects 0.000 title claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 29
- 102000004190 Enzymes Human genes 0.000 claims abstract description 27
- 108090000790 Enzymes Proteins 0.000 claims abstract description 27
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 13
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 108091005804 Peptidases Proteins 0.000 claims description 32
- 239000004365 Protease Substances 0.000 claims description 32
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Abstract
本发明属于生物信息学领域,涉及一种基于深度对比学习的酶功能预测方法,其中包括深度学习、对比学习、卷积神经网络等技术。首先,使用蛋白质语言预训练模型ESM‑2对蛋白质序列进行预处理,并计算预处理后各类酶的聚类中心之间的欧氏距离,存储为成对距离矩阵;其次,将预处理后的样本作为输入,训练基于对比学习构建的并行卷积神经网络,并在训练过程中更新成对距离矩阵,保存训练好的模型;最后,对需要预测的蛋白质序列进行预处理,将其输入训练好的模型得到预测向量,计算预测向量与各类酶的聚类中心的距离,选取距离较近的类的标签作为预测结果。本发明提出的方法有效提高了酶功能预测的正确率。
Description
技术领域
本发明属于生物信息学领域,涉及一种基于深度对比学习的酶功能预测方法,其中包括深度学习、对比学习、卷积神经网络等技术。
背景技术
蛋白酶是参与人体生化反应的重要催化剂。除此之外,酶还广泛应用于食品工业、皮革工业、药品制造等领域。酶的种类丰富多样,目前人类已经发现了4000多种酶,但这只是一小部分。因此,认识酶并对酶进行标注分类对于酶的研究与使用非常重要。传统的酶鉴定实验成本比较高,而且费时费力。所以,利用人工智能来预测酶的功能已经成为生物信息学领域的一个重要课题。
为了方便研究,酶学委员会为酶创建了EC编号,用于表示酶的功能和所属的类别。酶所属的大类是根据酶所催化的化学反应标注的。由于多数酶可参与的化学反应不止一种,所以一种酶可能属于多个EC编号。而且EC编号种类也有许多,每个类别包含的酶的数量差别较大。因此,酶功能预测是一个复杂的多分类问题,比较具有挑战性,目前的酶功能预测工具尚未达到理想的水平。
本发明提出了一种并行卷积对比学习方法用于酶功能预测。该方法的创新之处主要体现在蛋白酶序列特征提取和模型构建两个方面。在预处理阶段利用蛋白质语言模型ESM-2初次提取蛋白酶的序列特征,在模型训练阶段利用对比学习与并行卷积神经网络进一步提取序列特征,提高模型预测酶功能的性能。
发明内容
酶的种类丰富多样,广泛应用于工业、医药等领域。所以,酶功能预测非常重要。因此,本发明提出了一种基于深度对比学习的酶功能预测方法,该方法有效提高了酶功能预测的正确率。
一种基于深度对比学习的酶功能预测方法,包括蛋白酶序列的预处理、计算成对距离矩阵、三元组采样、基于对比学习的并行卷积神经网络的训练和预测五个过程,其具体步骤如下:
步骤1、将蛋白酶序列输入蛋白质语言模型ESM-2进行预处理,得到特征提取后的酶序列信息,并保存;
步骤2、计算步骤1中预处理后各类酶的聚类中心之间的欧氏距离,并存储为成对距离矩阵;
步骤3、基于步骤2中的成对距离矩阵为神经网络的训练选取三元组,即随机选取一个样本,称为锚,选取一个同类别的样本,称为正样本,选取一个不同类别的样本,称为负样本;
步骤4、把按步骤3中的策略选取的三元组输入基于对比学习的并行卷积神经网络,训练并保存酶功能预测模型;
步骤5、将需要预测的蛋白酶序列经过步骤1处理后输入步骤4中保存好的模型,以预测其类别。
一种基于深度对比学习的酶功能预测方法,步骤1的实现过程如下:
将蛋白酶序列输入蛋白质语言模型ESM-2,提取蛋白酶序列的特征信息;最终每个样本被转换为一个1280维的向量;保存每个预处理后的样本向量。
一种基于深度对比学习的酶功能预测方法,步骤2的实现过程如下:
计算步骤1中预处理后各类酶的聚类中心之间的欧氏距离,并存储为成对距离矩阵;首先计算各个类的聚类中心,即为该类中所有样本的平均向量;其次计算各类平均向量相互之间的欧氏距离,并将它们存储为成对距离矩阵;成对距离矩阵的行数与列数均为类别总数量,矩阵中的每个数字表示其列数和行数所代表的两类之间的欧氏距离。
一种基于深度对比学习的酶功能预测方法,步骤3的实现过程如下:
基于步骤2中的成对距离矩阵为神经网络的训练选取三元组,包括三个样本;首先随机选取一个样本,称为锚;其次从该类剩余样本中随机抽取一个样本,称为正样本;最后,在选择负样本时,根据其他类的聚类中心与锚所属类的聚类中心之间的欧氏距离,搜索成对距离矩阵,选择距离最近的类,在该类中随机抽取一个样本作为负样本;锚、正样本与负样本组成一个三元组。
一种基于深度对比学习的酶功能预测方法,步骤4的实现过程如下:
把按步骤3中的策略选取的三元组输入基于对比学习的并行卷积神经网络,训练并保存酶功能预测模型;神经网络主要由三个并行的卷积神经网络、两个隐藏层和一个全连接层组成;其中每个卷积神经网络包括一维卷积层、批量归一化层和最大池化层,使用的卷积核大小为3,并在批量归一化操作后使用非线性激活函数ReLU,最大池化层的池化窗口大小和步长都为3,三个卷积神经网络的通道数分别为2、4、4;三个卷积神经网络并行排列,在每个卷积神经网络后面设置一个隐藏层,使卷积神经网络输出的多维张量转化为一维张量;第二个隐藏层将前面三个隐藏层输出的一维张量进行拼接,并且对拼接后的输出进行随机丢弃Dropout操作,概率设置为0.15;最后一个全连接层的节点数为128;训练时使用的优化器为Adam,初始学习率为5×10-4;使用的损失函数为三重对比损失函数L,其定义为公式 (1) :
⑴
其中表示锚和正样本之间的欧氏距离,/>表示锚和负样本之间的欧氏距离,/>是一个常量,设置为1,max含义为L的值取和0的最大值;对比神经网络的训练目标是最小化损失函数L,使得网络模型映射后的同类样本向量之间的距离最小化,不同类样本向量之间的距离最大化;训练迭代次数为15000,每迭代100次重新计算步骤2中的成对距离矩阵,此时每个样本不仅经过预处理,还要经过网络模型的映射,每个样本由128维的向量表示,使用128维的样本向量重复步骤2即可得到新的成对距离矩阵;最终保存训练好的网络模型。
一种基于深度对比学习的酶功能预测方法,步骤5的实现过程如下:
将需要预测的蛋白酶序列经过步骤1处理后输入步骤4中保存好的模型,得到一个128维的向量;计算该向量与各类酶的聚类中心之间的欧式距离,选择距离小于1×10-4的类作为预测结果。
附图说明
图1为酶功能预测网络模型训练步骤示意图。
图2为并行卷积神经网络总体架构图。
图3为图2中卷积神经网络局部架构图。
具体实施方式
以下结合附图和实例对本发明进行详细说明。
本发明的目的是提出一种基于深度对比学习的酶功能预测方法,包括蛋白酶序列的预处理、计算成对距离矩阵、三元组采样、基于对比学习的并行卷积神经网络的训练和预测五个过程,其具体过程的实现步骤如下所示:
步骤1、将蛋白酶序列输入蛋白质语言模型ESM-2进行预处理,得到特征提取后的酶序列信息,并保存:
本发明使用的训练集来自通用蛋白质知识库Uniport,共包含227362个蛋白酶序列;将训练集的蛋白酶序列输入蛋白质语言模型ESM-2,进行特征提取;每个蛋白酶序列被处理成一个1280维的向量,保存所有预处理后的样本向量。
步骤2、计算步骤1中预处理后各类酶的聚类中心之间的欧氏距离,并存储为成对距离矩阵:
首先计算各个类的聚类中心,即为类中所有样本的平均向量;其次计算各类平均向量相互之间的欧氏距离,并将它们存储为成对距离矩阵;成对距离矩阵的行数与列数均为类别总数量,为5242,矩阵中的每个数字表示其列数和行数所代表的两类之间的欧氏距离,该成对距离矩阵用于网络模型训练时三元组的选取。
步骤3、基于步骤2中的成对距离矩阵为神经网络的训练选取三元组:
首先随机选取一个样本,称为锚;其次从该类剩余样本中随机抽取一个样本,称为正样本;在选择负样本时,根据其他类的聚类中心与锚所属类之间的欧氏距离,搜索成对距离矩阵,选择距离最近的类,在该类中随机抽取一个样本作为负样本;锚、正样本与负样本组成一个三元组。
步骤4、把按步骤3中的策略选取的三元组输入基于对比学习的并行卷积神经网络,训练并保存酶功能预测模型:
酶功能预测网络模型训练步骤如图1所示;蛋白酶序列经过步骤1的预处理后,根据步骤2
得到的成对距离矩阵选取三元组,即为步骤3,接下来将三元组作为并行卷积神经网络的输入,训练酶功能预测模型;并行卷积神经网络总体架构图如图2所示,其中卷积神经网络局部架构如图3所示;网络的输入为1280维的向量,将其分别作为三个并行的卷积神经网络的输入,经过了一维卷积、批量归一化、非线性激活函数ReLU和最大池化操作,其中卷积核的大小都为3,最大池化的池化窗口大小和步长都为3,1280维的向量经过这些操作后变换为426维的向量;第一个卷积神经网络的通道数为2,它的输出大小为2×426,第二个和第三个卷积神经网络的通道数为4,它们的输出大小为4×426;三个并行的卷积神经网络输出的多维张量分别经过隐藏层的一维化操作转化为一维张量,第一个输出的张量大小为1×852,第二个和第三个输出的张量大小为1×1704;接下来的隐藏层将三个一维张量进行拼接,输出大小为1×4260;为了防止网络模型训练过程中的过拟合,对拼接后的输出进行随机丢弃Dropout操作,概率设置为0.15;接下来经过全连接层的映射,得到模型输出,大小为1×128;训练时使用的优化器为Adam,初始学习率设置为5×10-4;训练迭代次数为15000,每迭代100次重新计算步骤2中的成对距离矩阵,此时每个样本不仅经过预处理,还要经过网络模型的映射,每个样本由128维的向量表示,使用该数据重复步骤2即可得到新的成对距离矩阵;最终保存训练好的网络模型。
步骤5、将需要预测的蛋白酶序列经过步骤1处理后输入步骤4中保存好的模型,即可预测其所属类别,测试模型性能:
本发明测试了来自通用蛋白质知识库Uniport的两个小型蛋白酶数据集,名为NEW-392和PRICE-149,分别包含392和149个样本;将两个数据集的样本经过步骤1的预处理后,分别输入步骤4中保存好的模型;每个样本可以得到一个128维的向量,计算该向量与各类酶的聚类中心之间的欧式距离,选择距离小于1×10-4的类作为预测结果;基于本发明提出预测方法训练好的模型在测试集NEW-392上的精确率Precision、召回率Recall分别为0.6313、0.501,与目前性能最好的酶功能预测模型CLEAN相比,分别提高了3.48%、1.99%;在测试集PRICE-149上的精确率Precision、召回率Recall分别为0.596、0.5197,与目前性能最好的酶功能预测模型CLEAN相比,分别提高了1.16%、5.26%;该测试结果证明本发明提出的方法可以有效提高酶功能预测模型的性能。
以上实例的详细描述是进一步对本发明作出的详细说明,但并不能认定本发明仅局限于以上实例所述范围。在本发明的构思范围内,本领域的普通技术人员还可以针对其他实例做出若干相关的简单推演或替换,都视为本发明的保护范围之内。
Claims (6)
1.一种基于深度对比学习的酶功能预测方法,包括蛋白酶序列的预处理、计算成对距离矩阵、三元组采样、基于对比学习的并行卷积神经网络的训练和预测五个过程,其具体步骤如下:
步骤1、将蛋白酶序列输入蛋白质语言模型ESM-2进行预处理,得到特征提取后的酶序列信息,并保存;
步骤2、计算步骤1中预处理后各类酶的聚类中心之间的欧氏距离,并存储为成对距离矩阵;
步骤3、基于步骤2中的成对距离矩阵为神经网络的训练选取三元组,即随机选取一个样本,称为锚,选取一个同类别的样本,称为正样本,选取一个不同类别的样本,称为负样本;
步骤4、把按步骤3中的策略选取的三元组输入基于对比学习的并行卷积神经网络,训练并保存酶功能预测模型;
步骤5、将需要预测的蛋白酶序列经过步骤1处理后输入步骤4中保存好的模型,以预测其类别。
2.根据权利要求1所述的一种基于深度对比学习的酶功能预测方法,步骤1的实现过程如下:
将蛋白酶序列输入蛋白质语言模型ESM-2,提取蛋白酶序列的特征信息;最终每个样本被转换为一个1280维的向量;保存每个预处理后的样本向量。
3.根据权利要求1所述的一种基于深度对比学习的酶功能预测方法,步骤2的实现过程如下:
计算步骤1中预处理后各类酶的聚类中心之间的欧氏距离,并存储为成对距离矩阵;首先计算各个类的聚类中心,即为该类中所有样本的平均向量;其次计算各类平均向量相互之间的欧氏距离,并将它们存储为成对距离矩阵;成对距离矩阵的行数与列数均为类别总数量,矩阵中的每个数字表示其列数和行数所代表的两类之间的欧氏距离。
4.根据权利要求1所述的一种基于深度对比学习的酶功能预测方法,步骤3的实现过程如下:
基于步骤2中的成对距离矩阵为神经网络的训练选取三元组,包括三个样本;首先随机选取一个样本,称为锚;其次从该类剩余样本中随机抽取一个样本,称为正样本;最后,在选择负样本时,根据其他类的聚类中心与锚所属类的聚类中心之间的欧氏距离,搜索成对距离矩阵,选择距离最近的类,在该类中随机抽取一个样本作为负样本;锚、正样本与负样本组成一个三元组。
5.根据权利要求1所述的一种基于深度对比学习的酶功能预测方法,步骤4的实现过程如下:
把按步骤3中的策略选取的三元组输入基于对比学习的并行卷积神经网络,训练并保存酶功能预测模型;神经网络主要由三个并行的卷积神经网络、两个隐藏层和一个全连接层组成;其中每个卷积神经网络包括一维卷积层、批量归一化层和最大池化层,使用的卷积核大小为3,并在批量归一化操作后使用非线性激活函数ReLU,最大池化层的池化窗口大小和步长都为3,三个卷积神经网络的通道数分别为2、4、4;三个卷积神经网络并行排列,在每个卷积神经网络后面设置一个隐藏层,使卷积神经网络输出的多维张量转化为一维张量;第二个隐藏层将前面三个隐藏层输出的一维张量进行拼接,并且对拼接后的输出进行随机丢弃Dropout操作,概率设置为0.15;最后一个全连接层的节点数为128;训练时使用的优化器为Adam,初始学习率为5×10-4;使用的损失函数为三重对比损失函数L,其定义为公式(1) :
⑴
其中表示锚和正样本之间的欧氏距离,/>表示锚和负样本之间的欧氏距离,/>是一个常量,设置为1,max含义为L的值取和0的最大值;对比神经网络的训练目标是最小化损失函数L,使得网络模型映射后的同类样本向量之间的距离最小化,不同类样本向量之间的距离最大化;训练迭代次数为15000,每迭代100次重新计算步骤2中的成对距离矩阵,此时每个样本不仅经过预处理,还要经过网络模型的映射,每个样本由128维的向量表示,使用128维的样本向量重复步骤2即可得到新的成对距离矩阵;最终保存训练好的网络模型。
6.根据权利要求1所述的一种基于深度对比学习的酶功能预测方法,步骤5的实现过程如下:
将需要预测的蛋白酶序列经过步骤1处理后输入步骤4中保存好的模型,得到一个128维的向量;计算该向量与各类酶的聚类中心之间的欧式距离,选择距离小于1×10-4的类作为预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311131004.9A CN116844646B (zh) | 2023-09-04 | 2023-09-04 | 一种基于深度对比学习的酶功能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311131004.9A CN116844646B (zh) | 2023-09-04 | 2023-09-04 | 一种基于深度对比学习的酶功能预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116844646A true CN116844646A (zh) | 2023-10-03 |
CN116844646B CN116844646B (zh) | 2023-11-24 |
Family
ID=88172935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311131004.9A Active CN116844646B (zh) | 2023-09-04 | 2023-09-04 | 一种基于深度对比学习的酶功能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116844646B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117095825A (zh) * | 2023-10-20 | 2023-11-21 | 鲁东大学 | 一种基于多实例学习的人体免疫状态预测方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170161606A1 (en) * | 2015-12-06 | 2017-06-08 | Beijing University Of Technology | Clustering method based on iterations of neural networks |
WO2018137358A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京大学 | 基于深度度量学习的目标精确检索方法 |
CN109389030A (zh) * | 2018-08-23 | 2019-02-26 | 平安科技(深圳)有限公司 | 人脸特征点检测方法、装置、计算机设备及存储介质 |
CN110689920A (zh) * | 2019-09-18 | 2020-01-14 | 上海交通大学 | 一种基于深度学习的蛋白质-配体结合位点预测算法 |
US20200285896A1 (en) * | 2019-03-09 | 2020-09-10 | Tongji University | Method for person re-identification based on deep model with multi-loss fusion training strategy |
CN112632996A (zh) * | 2020-12-08 | 2021-04-09 | 浙江大学 | 一种基于对比学习的实体关系三元组抽取方法 |
CN113362899A (zh) * | 2021-04-20 | 2021-09-07 | 厦门大学 | 一种基于深度学习的蛋白质质谱数据的分析方法及系统 |
CN113889266A (zh) * | 2021-10-22 | 2022-01-04 | 中国人民解放军战略支援部队信息工程大学 | 一种基于三元组网络的肝脏肿瘤mvi预测方法 |
CN113936738A (zh) * | 2021-12-14 | 2022-01-14 | 鲁东大学 | 一种基于深度卷积神经网络的rna-蛋白质结合位点预测方法 |
CN114882945A (zh) * | 2022-07-11 | 2022-08-09 | 鲁东大学 | 一种基于集成学习的rna-蛋白质结合位点预测方法 |
US20220253714A1 (en) * | 2021-01-25 | 2022-08-11 | International Business Machines Corporation | Generating unsupervised adversarial examples for machine learning |
CN116092579A (zh) * | 2023-02-06 | 2023-05-09 | 东北大学 | 一种基于向量相似性检索的蛋白质功能预测方法 |
-
2023
- 2023-09-04 CN CN202311131004.9A patent/CN116844646B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170161606A1 (en) * | 2015-12-06 | 2017-06-08 | Beijing University Of Technology | Clustering method based on iterations of neural networks |
WO2018137358A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京大学 | 基于深度度量学习的目标精确检索方法 |
CN109389030A (zh) * | 2018-08-23 | 2019-02-26 | 平安科技(深圳)有限公司 | 人脸特征点检测方法、装置、计算机设备及存储介质 |
US20200285896A1 (en) * | 2019-03-09 | 2020-09-10 | Tongji University | Method for person re-identification based on deep model with multi-loss fusion training strategy |
CN110689920A (zh) * | 2019-09-18 | 2020-01-14 | 上海交通大学 | 一种基于深度学习的蛋白质-配体结合位点预测算法 |
CN112632996A (zh) * | 2020-12-08 | 2021-04-09 | 浙江大学 | 一种基于对比学习的实体关系三元组抽取方法 |
US20220253714A1 (en) * | 2021-01-25 | 2022-08-11 | International Business Machines Corporation | Generating unsupervised adversarial examples for machine learning |
CN113362899A (zh) * | 2021-04-20 | 2021-09-07 | 厦门大学 | 一种基于深度学习的蛋白质质谱数据的分析方法及系统 |
CN113889266A (zh) * | 2021-10-22 | 2022-01-04 | 中国人民解放军战略支援部队信息工程大学 | 一种基于三元组网络的肝脏肿瘤mvi预测方法 |
CN113936738A (zh) * | 2021-12-14 | 2022-01-14 | 鲁东大学 | 一种基于深度卷积神经网络的rna-蛋白质结合位点预测方法 |
CN114882945A (zh) * | 2022-07-11 | 2022-08-09 | 鲁东大学 | 一种基于集成学习的rna-蛋白质结合位点预测方法 |
CN116092579A (zh) * | 2023-02-06 | 2023-05-09 | 东北大学 | 一种基于向量相似性检索的蛋白质功能预测方法 |
Non-Patent Citations (3)
Title |
---|
ZHENGSEN PAN 等: "WVDL: Weighted Voting Deep Learning Model for Predicting RNA-Protein Binding Sites", 《IEEE/ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS ( VOLUME: 20, ISSUE: 5, 01 SEPT.-OCT. 2023)》 * |
刘阳;孟艾;: "基于卷积神经网络的多聚脯氨酸二型二级结构预测", 计算机与现代化, no. 02 * |
王娇;罗四维;王立;: "一种针对多关系数据的半监督协同训练算法", 计算机科学, no. 1 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117095825A (zh) * | 2023-10-20 | 2023-11-21 | 鲁东大学 | 一种基于多实例学习的人体免疫状态预测方法 |
CN117095825B (zh) * | 2023-10-20 | 2024-01-05 | 鲁东大学 | 一种基于多实例学习的人体免疫状态预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116844646B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Markov blanket-embedded genetic algorithm for gene selection | |
Sun et al. | Local-learning-based feature selection for high-dimensional data analysis | |
CN116844646B (zh) | 一种基于深度对比学习的酶功能预测方法 | |
Yan et al. | Unsupervised and semi‐supervised learning: The next frontier in machine learning for plant systems biology | |
CN106021990A (zh) | 一种将生物基因以特定的性状进行分类与自我识别的方法 | |
US20230207054A1 (en) | Deep learning network for evolutionary conservation | |
Fonseca et al. | Phylogeographic model selection using convolutional neural networks | |
CN111325264A (zh) | 一种基于熵的多标签数据分类方法 | |
CN114743600A (zh) | 基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法 | |
Morovvat et al. | An ensemble of filters and wrappers for microarray data classification | |
Huang et al. | Harnessing deep learning for population genetic inference | |
CN112085245A (zh) | 一种基于深度残差神经网络的蛋白质残基接触预测方法 | |
CN111753995A (zh) | 一种基于梯度提升树的局部可解释方法 | |
CN116680594A (zh) | 一种利用深度特征选择算法提高多组学数据的甲状腺癌的分类精度方法 | |
CN116153396A (zh) | 一种基于迁移学习的非编码变异预测方法 | |
AL-Bermany et al. | Microarray gene expression data for detection alzheimer’s disease using k-means and deep learning | |
Sun et al. | Deep generative autoencoder for low-dimensional embeding extraction from single-cell RNAseq data | |
CN112488188A (zh) | 一种基于深度强化学习的特征选择方法 | |
Soheili et al. | Feature selection in multi-label classification through MLQPFS | |
CN108182347B (zh) | 一种大规模跨平台基因表达数据分类方法 | |
CN112926640A (zh) | 一种基于两阶段深度特征选择的癌症基因分类方法、设备及存储介质 | |
CN113469244B (zh) | 小众app分类系统 | |
CN116821665A (zh) | 一种基于分级分解特征提取方法 | |
CN117828436A (zh) | 一种多元时间序列分类方法及系统 | |
Asfaw | Deep learning hyperparameter’s impact on potato disease detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |