CN110797084A - 基于深层神经网络的脑脊液蛋白质的预测方法 - Google Patents

基于深层神经网络的脑脊液蛋白质的预测方法 Download PDF

Info

Publication number
CN110797084A
CN110797084A CN201911073760.4A CN201911073760A CN110797084A CN 110797084 A CN110797084 A CN 110797084A CN 201911073760 A CN201911073760 A CN 201911073760A CN 110797084 A CN110797084 A CN 110797084A
Authority
CN
China
Prior art keywords
protein
neural network
cerebrospinal fluid
deep neural
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911073760.4A
Other languages
English (en)
Other versions
CN110797084B (zh
Inventor
邵丹
王岩
黄岚
何凯
崔薛腾
张双全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201911073760.4A priority Critical patent/CN110797084B/zh
Publication of CN110797084A publication Critical patent/CN110797084A/zh
Application granted granted Critical
Publication of CN110797084B publication Critical patent/CN110797084B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于深度神经网络的脑脊液蛋白质的预测方法属于人工智能与大数据技术领域。本发明将现有文献和数据库的脑脊液中已经被生物实验验证的蛋白质列表作为模型训练的正样本;在Pfam蛋白质家族信息数据库中删除正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本。将正样本和负样本数据分成训练集、验证集和测试集。对蛋白质特征进行特征选择,搭建模型,用训练集训练模型,验证集进行调参,测试集进行性能评价。输入为蛋白特征,输出为预测结果。提高了脑脊液预测的准确率,最终实现脑脊液蛋白的预测。

Description

基于深层神经网络的脑脊液蛋白质的预测方法
技术领域
本发明属于大数据、人工智能技术领域,特别是涉及到一种基于深层神经网络的脑脊液蛋白质的预测方法。
背景技术
脑脊液是由脑室内脉络丛产生的一种无色透明的液体,它循环流动于脑和脊髓表面,经脑内静脉系统与体循环相关联。主要功能是①保护大脑和脊髓免受外界震荡损伤;②调节颅内压力变化;③供给大脑、脊髓营养物质并运走代谢产物;④调节神经系统碱储量,维持正常PH值等。
当脑组织或脊髓发生病变和外伤时,脑脊液也会发生各种改变。通过对脑脊液中的蛋白预测,找到疾病相关蛋白进行病理分析,能够促进疾病的早期诊断,如神经退行性疾病,多发性硬化症和创伤性脑损伤等。但是目前,公知的关于可计算的方法预测脑脊液蛋白质仍为空白。
因此现有技术当中亟需要一种新型的技术方案来解决这一问题。
发明内容
本发明所要解决的技术问题是:提供一种基于深层神经网络的脑脊液蛋白质的预测方法用于解决目前公知的关于可计算的方法预测脑脊液蛋白质仍为空白的技术问题。
基于深层神经网络的脑脊液蛋白质的预测方法,包括以下步骤,并且以下面步骤顺次进行,
步骤一、将脑脊液中已经被生物实验验证的蛋白质作为模型训练的正样本并存储正样本的蛋白质信息数据;
步骤二、在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本并存储负样本的蛋白质信息数据;
步骤三、将正样本和负样本信息数据均按照80%训练集、10%验证集、10%测试集进行分割;
步骤四、将蛋白质特征进行分类,初步获得蛋白质特征向量;
步骤五、用t检验方法过滤步骤四中初步获得的蛋白质特征向量,过滤后的蛋白质特征向量用支持向量机联合特征去除算法(SVM-RFE)进行特征选择,获得模型拟合训练用的蛋白质特征向量;
步骤六、通过深层神经网络建立分类器模型,所述分类器模型的输入为步骤五中获得的特征向量,分类器模型的输出为是入脑脊髓蛋白质或非入脑脊髓蛋白质;
步骤七、用训练集采用线性整流函数ReLU激活函数和交叉熵的损失函数拟合分类器模型,获得训练后的分类器模型;
步骤八、对分类器模型进行评估
将验证集中正样本和负样本的蛋白质信息以及步骤五中获得的特征向量输入步骤七训练后的分类器模型进行验证,输出的验证结果使用敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthewscorrelation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve),作为评价模型验证效果的评估指标,
获得的AUC小于90%,重复步骤七重新拟合训练分类器模型直至AUC达到90%以上;
步骤九、用测试集对步骤八中验证后的分类器模型进行分类准确性验证,分类准确性小于90%,重复步骤七和步骤八直至分类准确性达到90%以上,分类器模型建立完成;
步骤十、向步骤九中建立完成的分类器模型中输入预测蛋白质的特征向量,通过输出的预测结果实现基于深层神经网络的脑脊液蛋白质的预测。
所述步骤四中蛋白质特征按照4个大类进行分类,分别为:1)序列性质,2)结构性质,3)域和基序性质,4)物理化学性质。
所述步骤五中t检验方法中采用显著水平阈值p-value<=0.005。
所述步骤五中支持向量机联合特征去除算法(SVM-RFE)的选择判断函数DJ(i)定义如下:
Figure BDA0002261750080000031
yi是样本xi的标签,yj是样本xj的标签,K(xi,xj)是测试xi和xj相似度的核函数,α是通过SVM训练后得到的值,T代表矩阵的转置,H代表矩阵。
所述步骤六中深层神经网络定义如下:
Y=W·X+b
其中Y表示隐含层的输出,X表示隐含层的输入值,W表示隐含层和上一层输出之间的连接权重,b表示全连接层的偏置项。
所述步骤六中的深度神经网络的结构包括输入层、隐含层和输出层;所述隐含层共有4层,隐含层的神经元数量均为500个,隐含层使用的激活函数为ReLU;所述输出层的神经元数量为1,输出层使用的激活函数为Sigmoid。
所述激活函数ReLU和Sigmoid的定义分别如下:
ReLU(z)=max(0,z)
Figure BDA0002261750080000032
其中z为神经元的权重和,max为最大值函数,e为自然常数。
所述深度神经网络的结构定义如下:
Output=Out(Hidden(Hidden(Hidden(Hidden(X)))))
其中Hidden表示隐含层,Out表示输出层。
所述交叉熵的损失函数为二分类交叉熵(binary cross entropy),其定义如下:
其中yi表示第i个样本的真实类别,
Figure BDA0002261750080000041
表示第i个样本的预测类别,log为对数函数,m为样本的个数。
所述步骤八中敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthews correlation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve)公式分别为:
Figure BDA0002261750080000042
Figure BDA0002261750080000043
Figure BDA0002261750080000044
Figure BDA0002261750080000045
其中TP表示真阳性样本数量,TN表示真阴性样本数量,FP表示假阳性样本数量,FN表示假阴性样本数量,N表示所有训练样本数量。
通过上述设计方案,本发明可以带来如下有益效果:
本发明将现有文献和数据库的脑脊液中已经被生物实验验证的蛋白质列表作为模型训练的正样本;在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本。利用t检验和SVM-RFE的方法对蛋白质特征进行特征选择,去掉噪音和无关的特征。搭建基于深层神经网络的模型,输入为蛋白特征,输出为预测结果,训练集训练模型,验证集进行调参,测试集进行性能评价,提高了脑脊液预测的准确率,最终通过可计算的方法实现脑脊液中的蛋白质预测。
具体实施方式
基于深层神经网络的脑脊液蛋白质的预测方法,包括以下步骤:
1.数据集的建立
(1)正样本数据集收集
通过查找生物学相关文献和现有数据库获取将脑脊液中已经被生物实验验证的蛋白质信息作为模型训练的正样本录入计算机。
(2)负样本数据集收集
在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本。
(3)模型训练数据集分割
将所有正样本和负样本的样本数据均按照80%训练集、10%验证集、10%测试集进行分割。
2.蛋白质特征选择
(1)特征收集
将蛋白质特征按照4个大类进行分类,可以得到接近3000个特征向量。如表1:
表1蛋白特征分类
Figure BDA0002261750080000051
Figure BDA0002261750080000061
Figure BDA0002261750080000071
(2)特征选择
首先用t检验方法过滤这些特征元素,去掉无关特征,采用显著水平阈值p-value<=0.005;然后用支持向量机联合特征去除算法(SVM-RFE)进行特征选择,得到模型训练用的特征向量。判断函数DJ(i)定义如下:
Figure BDA0002261750080000072
其中,yi是样本xi的标签,yj是样本xj的标签,K(xi,xj)是测试xi和xj相似度的核函数,α是通过SVM训练后得到的值,T代表矩阵的转置,H代表矩阵。
3.基于深层神经网络分类器的训练
(1)神经网络模型拟合训练
通过深层神经网络建立分类器模型,用训练集训练模型,验证集进行调参,测试集进行性能评价。
所述深层神经网络由输入层、隐含层和输出层组成,其中输入层仅仅表示对数据的输出,隐含层的定义如下:
Y=W·X+b
其中Y表示隐含层的输出,X表示隐含层的输入值,W表示隐含层和上一层输出之间的连接权重,b表示全连接层的偏置项。
隐含层共有4层,隐含层的神经元数量均为500个,激活函数为ReLU;输出层的神经元数量为1,激活函数为Sigmoid。
激活函数ReLU和Sigmoid的定义分别如下
ReLU(z)=max(0,z)
Figure BDA0002261750080000073
其中z为神经元的权重和,max为最大值函数,e为自然常数。
训练深度神经网络所采用的损失函数为二分类交叉熵(binary cross entropy),定义如下:
Figure BDA0002261750080000081
其中yi表示第i个样本的真实类别,
Figure BDA0002261750080000083
表示第i个样本的预测类别,log为对数函数,m为样本的个数。
深度神经网络的结构定义如下:
Output=Out(Hidden(Hidden(Hidden(Hidden(X)))))
其中Hidden表示隐含层,Out表示输出层。
4.模型性能评估
将验证集中正样本和负样本的蛋白质信息以及上述步骤中获得的模型训练用的特征向量输入训练后的分类器模型进行验证,输出的验证结果使用敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthews correlation coefficient)及ROC曲线下面的面积AUC(Area Under RocCurve),作为评价模型验证效果的指标,获得的AUC小于90%,重新拟合训练分类器模型直至AUC达到90%以上。
其中,敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthews correlation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve)公式分别为:
Figure BDA0002261750080000084
Figure BDA0002261750080000086
Figure BDA0002261750080000091
Figure BDA0002261750080000092
其中,TP表示真阳性样本数量,TN标识真阴性样本数量,FP表示假阳性样本数量,FN表示假阴性样本数量,N表示所有训练样本数量。
最后,用测试集对验证后的分类器模型进行分类准确性验证,分类准确性小于90%,重新进行分类器拟合训练和模型验证,直至分类准确性达到90%以上,基于深层神经网络的脑脊液蛋白质的预测模型建立完成。
模型输入为蛋白特征向量,输出为预测结果。提高了脑脊液预测的准确率,最终实现脑脊液蛋白的预测。通过可计算的方法实现脑脊液中的蛋白质预测,并通过预测的蛋白质,找到与疾病相关的蛋白。

Claims (10)

1.基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:包括以下步骤,并且以下面步骤顺次进行,
步骤一、将脑脊液中已经被生物实验验证的蛋白质作为模型训练的正样本并存储正样本的蛋白质信息数据;
步骤二、在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本并存储负样本的蛋白质信息数据;
步骤三、将正样本和负样本信息数据均按照80%训练集、10%验证集、10%测试集进行分割;
步骤四、将蛋白质特征进行分类,初步获得蛋白质特征向量;
步骤五、用t检验方法过滤步骤四中初步获得的蛋白质特征向量,过滤后的蛋白质特征向量用支持向量机联合特征去除算法(SVM-RFE)进行特征选择,获得模型拟合训练用的蛋白质特征向量;
步骤六、通过深层神经网络建立分类器模型,所述分类器模型的输入为步骤五中获得的特征向量,分类器模型的输出为是入脑脊髓蛋白质或非入脑脊髓蛋白质;
步骤七、用训练集采用线性整流函数ReLU激活函数和交叉熵的损失函数拟合分类器模型,获得训练后的分类器模型;
步骤八、对分类器模型进行评估
将验证集中正样本和负样本的蛋白质信息以及步骤五中获得的特征向量输入步骤七训练后的分类器模型进行验证,输出的验证结果使用敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthewscorrelation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve),作为评价模型验证效果的评估指标,
获得的AUC小于90%,重复步骤七重新拟合训练分类器模型直至AUC达到90%以上;
步骤九、用测试集对步骤八中验证后的分类器模型进行分类准确性验证,分类准确性小于90%,重复步骤七和步骤八直至分类准确性达到90%以上,分类器模型建立完成;
步骤十、向步骤九中建立完成的分类器模型中输入预测蛋白质的特征向量,通过输出的预测结果实现基于深层神经网络的脑脊液蛋白质的预测。
2.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤四中蛋白质特征按照4个大类进行分类,分别为:1)序列性质,2)结构性质,3)域和基序性质,4)物理化学性质。
3.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤五中t检验方法中采用显著水平阈值p-value<=0.005。
4.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤五中支持向量机联合特征去除算法(SVM-RFE)的选择判断函数DJ(i)定义如下:
Figure FDA0002261750070000021
yi是样本xi的标签,yj是样本xj的标签,K(xi,xj)是测试xi和xj相似度的核函数,α是通过SVM训练后得到的值,T代表矩阵的转置,H代表矩阵。
5.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤六中深层神经网络定义如下:
Y=W·X+b
其中Y表示隐含层的输出,X表示隐含层的输入值,W表示隐含层和上一层输出之间的连接权重,b表示全连接层的偏置项。
6.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤六中的深度神经网络的结构包括输入层、隐含层和输出层;所述隐含层共有4层,隐含层的神经元数量均为500个,隐含层使用的激活函数为ReLU;所述输出层的神经元数量为1,输出层使用的激活函数为Sigmoid。
7.根据权利要求6所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述激活函数ReLU和Sigmoid的定义分别如下:
ReLU(z)=max(0,z)
其中z为神经元的权重和,max为最大值函数,e为自然常数。
8.根据权利要求6所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述深度神经网络的结构定义如下:
Figure FDA0002261750070000032
其中Hidden表示隐含层,Out表示输出层。
9.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述交叉熵的损失函数为二分类交叉熵(binary cross entropy),其定义如下:
其中yi表示第i个样本的真实类别,表示第i个样本的预测类别,log为对数函数,m为样本的个数。
10.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤八中敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthews correlation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve)公式分别为:
Figure FDA0002261750070000036
Figure FDA0002261750070000038
Figure FDA0002261750070000039
其中TP表示真阳性样本数量,TN表示真阴性样本数量,FP表示假阳性样本数量,FN表示假阴性样本数量,N表示所有训练样本数量。
CN201911073760.4A 2019-11-06 2019-11-06 基于深层神经网络的脑脊液蛋白质的预测方法 Expired - Fee Related CN110797084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911073760.4A CN110797084B (zh) 2019-11-06 2019-11-06 基于深层神经网络的脑脊液蛋白质的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911073760.4A CN110797084B (zh) 2019-11-06 2019-11-06 基于深层神经网络的脑脊液蛋白质的预测方法

Publications (2)

Publication Number Publication Date
CN110797084A true CN110797084A (zh) 2020-02-14
CN110797084B CN110797084B (zh) 2021-05-25

Family

ID=69442859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911073760.4A Expired - Fee Related CN110797084B (zh) 2019-11-06 2019-11-06 基于深层神经网络的脑脊液蛋白质的预测方法

Country Status (1)

Country Link
CN (1) CN110797084B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554348A (zh) * 2020-04-26 2020-08-18 长春大学 一种分泌入支气管肺泡灌洗液蛋白质预测方法
CN112309497A (zh) * 2020-12-28 2021-02-02 武汉金开瑞生物工程有限公司 一种基于Cycle-GAN的蛋白质结构预测方法及装置
CN112906755A (zh) * 2021-01-27 2021-06-04 深圳职业技术学院 一种植物抗性蛋白识别方法、装置、设备和存储介质
CN113066528A (zh) * 2021-04-12 2021-07-02 山西大学 基于主动半监督图神经网络的蛋白质分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388768A (zh) * 2018-02-08 2018-08-10 南京恺尔生物科技有限公司 利用生物知识搭建的神经网络模型的生物特性预测方法
CN109273054A (zh) * 2018-08-31 2019-01-25 南京农业大学 基于关系图谱的蛋白质亚细胞区间预测方法
WO2019028106A1 (en) * 2017-08-01 2019-02-07 Cove Bio Llc BIOMARKERS ASSOCIATED WITH PARKINSON'S DISEASE

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019028106A1 (en) * 2017-08-01 2019-02-07 Cove Bio Llc BIOMARKERS ASSOCIATED WITH PARKINSON'S DISEASE
CN108388768A (zh) * 2018-02-08 2018-08-10 南京恺尔生物科技有限公司 利用生物知识搭建的神经网络模型的生物特性预测方法
CN109273054A (zh) * 2018-08-31 2019-01-25 南京农业大学 基于关系图谱的蛋白质亚细胞区间预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HENNER KOCH 等: "In vitro neuronal network activity as a new functional diagnostic system to detect effects of Cerebrospinal fluid from autoimmune encephalitis patients", 《SCIENTIFIC REPORTS》 *
YAN WANG 等: "Measurement of Conditional Relatedness Between Genes Using Fully Convolutional Neural Network", 《TECHNOLOGY AND CODE》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554348A (zh) * 2020-04-26 2020-08-18 长春大学 一种分泌入支气管肺泡灌洗液蛋白质预测方法
CN112309497A (zh) * 2020-12-28 2021-02-02 武汉金开瑞生物工程有限公司 一种基于Cycle-GAN的蛋白质结构预测方法及装置
CN112309497B (zh) * 2020-12-28 2021-04-02 武汉金开瑞生物工程有限公司 一种基于Cycle-GAN的蛋白质结构预测方法及装置
CN112906755A (zh) * 2021-01-27 2021-06-04 深圳职业技术学院 一种植物抗性蛋白识别方法、装置、设备和存储介质
CN113066528A (zh) * 2021-04-12 2021-07-02 山西大学 基于主动半监督图神经网络的蛋白质分类方法
CN113066528B (zh) * 2021-04-12 2022-07-19 山西大学 基于主动半监督图神经网络的蛋白质分类方法

Also Published As

Publication number Publication date
CN110797084B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN110797084B (zh) 基于深层神经网络的脑脊液蛋白质的预测方法
CN112766379B (zh) 一种基于深度学习多权重损失函数的数据均衡方法
CN110827923B (zh) 基于卷积神经网络的精液蛋白质的预测方法
CN110188047B (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN110827922B (zh) 基于循环神经网络的羊水蛋白质的预测方法
CN105930663B (zh) 一种基于演化模糊规则的手部震颤信号及音频信号分类方法
CN111767952B (zh) 一种可解释的肺结节良恶性分类方法
CN110097096B (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
CN108877947B (zh) 基于迭代均值聚类的深度样本学习方法
CN113674862A (zh) 一种基于机器学习的急性肾功能损伤发病预测方法
CN114469120A (zh) 一种基于相似度阈值迁移的多尺度Dtw-BiLstm-Gan心电信号生成方法
CN110010204B (zh) 基于融合网络和多打分策略的预后生物标志物识别方法
Fan et al. Modeling voice pathology detection using imbalanced learning
CN110032973A (zh) 一种基于人工智能的无监督寄生虫分类方法及系统
CN112233742B (zh) 一种基于聚类的病历文档分类系统、设备、存储介质
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
CN116956138A (zh) 一种基于多模态学习的影像基因融合分类方法
CN111582370A (zh) 一种基于粗糙集优化的脑转移瘤预后指标约简及分类方法
Choudhary et al. Glaucoma detection using cross validation algorithm
CN115512721A (zh) 基于pdan的跨库语音情感识别方法及装置
CN113222001B (zh) 神经影像标记物形态学融合分类指数的构建方法及应用
Benjumea et al. Genetic clustering algorithm for extractive text summarization
CN113361653A (zh) 基于数据样本增强的深度学习模型去偏方法和装置
CN113918786A (zh) 一种细胞亚型智能判定方法
CN113627522A (zh) 基于关系网络的图像分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210525

Termination date: 20211106