CN104615911A - 基于稀疏编码及链学习预测膜蛋白beta-barrel跨膜区域的方法 - Google Patents

基于稀疏编码及链学习预测膜蛋白beta-barrel跨膜区域的方法 Download PDF

Info

Publication number
CN104615911A
CN104615911A CN201510012812.2A CN201510012812A CN104615911A CN 104615911 A CN104615911 A CN 104615911A CN 201510012812 A CN201510012812 A CN 201510012812A CN 104615911 A CN104615911 A CN 104615911A
Authority
CN
China
Prior art keywords
amino acid
feature
protein
sparse
barrel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510012812.2A
Other languages
English (en)
Other versions
CN104615911B (zh
Inventor
沈红斌
殷曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510012812.2A priority Critical patent/CN104615911B/zh
Publication of CN104615911A publication Critical patent/CN104615911A/zh
Application granted granted Critical
Publication of CN104615911B publication Critical patent/CN104615911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法。本发明涉及到稀疏编码技术、链学习算法、支持向量机,利用计算的方法对膜蛋白beta-barrel跨膜区域进行结构预测,为研究蛋白质结构和功能提供重要信息。本发明创新性的引入数字图像处理的思想,对蛋白质特征矩阵进行稀疏编码,解决了特征降维和去除噪声的问题。从蛋白质数据库PDB中组织膜蛋白beta-barrel数据集,分别提取代表氨基酸进化信息的位置特异性打分矩阵和代表氨基酸残基位置信息的Z score为特征,用滑动窗口提取特征向量,实现多特征融合,提出基于SVM分类器的链学习算法训练模型,显著提高了预测效果,经Jakenife交叉验证精度可以达到92.5%。

Description

基于稀疏编码及链学习预测膜蛋白beta-barrel跨膜区域的方法
技术领域
本发明涉及的是一种膜蛋白结构预测及计算智能领域的技术,具体是一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法。
背景技术
目前,随着蛋白质组数据库的快速发展,已知结构的蛋白质数量不断增长,这对研究蛋白质的功能起到重要的推动作用。膜蛋白镶嵌在生物膜中贯穿于磷脂双分子层,具有较强的疏水性及不宜结晶的特点,实验的方法解决蛋白质结构不仅成本昂贵而且耗费时间,因此,利用计算的方法预测蛋白质结构是一种行之有效的途径,预测精度也在不断提升,但传统机器学习方法在研究蛋白质预测领域还存在一些亟待解决的问题,比如特征选择和提取,降维去噪等方面。
在PDB(protein data bank,蛋白质数据库)中,跨膜蛋白中的Beta‐barrel(β‐筒狀蛋白)作为两种膜蛋白之一,由若干条beta‐strand(β折叠股)按照反相平行的方式围成中空的桶状结构,具有鲜明的结构特点。beta‐barrel占膜蛋白总数的30%,在生物膜运输通道、分子交换、免疫保护等功能中起着至关重要的作用。当前近70%的药物靶点作用在膜蛋白上,因此解决跨膜蛋白Beta‐barrel的结构对研究蛋白质功能提供重要信息,因为结构相似的蛋白质往往功能也相似。
由于膜蛋白Beta‐barrel结构复杂,有较强的疏水性,难以结晶,由生物实验获取蛋白质已知结构的Beta‐barrel数据样本较少。随着机器学习算法的日渐成熟,利用计算的方法获取蛋白质结构迅速发展,而且有着速度快,效率高,成本低的优势。目前,获取蛋白质结构的方法有基于统计信息和基于膜蛋白物理化学特性的方法Freeman,T.and Wimley,W.(2010)A highly accurate statistical approach for the prediction of transmembrane beta‐barrels.Bioinformatics,此类基于统计信息和基于膜蛋白物理化学特性的方法,仅局限适用于少量结构简单的蛋白质类型,如beta‐strand数目较少的膜蛋白结构,随着机器学习的方法迅速发展,如基于隐马尔可夫模型的方法Singh,N.et al.(2011)Tmbhmm:a frequency profile based HMM for predicting the topology of transmembrane beta barrel proteins and the exposure status of transmembrane residues.Biochim.Biophys.Acta BBA Proteins Proteomics,1814,664–670,预测精度有所提高,但是对于特殊长度如较短的strands片段,存在假阳性率过高的现象,而且在提取特征过程中包含系统噪声的影响以及诸多降低预测精度的因素有待解决。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法,实现稀疏编码技术和链学习方法在蛋白质结构预测中的应用。这种运用机器学习的方法实现蛋白质结构预测只需在计算机上运行,具有时间短,成本低,精度高,可靠性强等优点,与此同时,相对于实验解决蛋白质结构的方法,如X射线,核磁共振等方法,这种计算的方法操作更加方便,数据提取更加便捷,可以提供可视化预测结果,同时对分析蛋白质功能提供重要数据信息。此外,本方法还可以随着蛋白质数据库的发展不断进行软件升级,扩大数据集,增加预测蛋白质超家族覆盖范围,使之具备更强的预测鲁棒性和稳定性。
本发明是通过以下技术方案实现的:
本发明从已知结构的膜蛋白Beta‐barrel组织数据集中选择出包含进化信息的位置特异性打分矩阵以及代表氨基酸距离信息的Z坐标值作为特征,以归一化处理和滑动窗口的方式从中提取出特征向量并转换为数字图像,经特征空间维数降低和噪声干扰去除后用于机器学习方法训练模型,最后将训练好的预测模型采用链学习的方式对目标蛋白质中的每个氨基酸位置进行预测,得到此序列中每个氨基酸相对与膜的位置。
所述的已知结构的膜蛋白Beta‐barrel组织数据集来自最新版本蛋白质数据库(Protein Data Bank,PDB),为去除同源性氨基酸序列的影响,将蛋白质去冗余至30%,得到最终用来训练模型的去除冗余性的数据集。
所述的位置特异性打分矩阵由PSI‐BLAST多序列比对工具获得,该矩阵是一个N行20列的矩阵,其中:每个位置表示第i个氨基酸在进化过程中被20种氨基酸中的第j个代替的分数值,N表示蛋白质序列长度。
所述的Z坐标值是指:通过Z‐pred氨基酸位置计算软件获得的每个氨基酸碳原子距离膜中心位置的欧式距离。
所述的数字图像中:每个特征值的大小表示图像的像素值。
所述的特征空间维数降低和噪声干扰去除是指:运用稀疏编码算法计算稀疏系数和基向量表示原数值,以降低特征空间维数和去除噪声干扰。
技术效果
与现有技术相比,本发明的技术效果包括:
1、对于蛋白质组中疏水性较强的膜蛋白Beta‐barrl,本方法可以进一步提高预测跨膜区域的精度,可以最终达到92.5%的精确度,较之其他方法有更高的预测能力。
2、特征选取上,分别用多序列比对工具PSI‐BLAST和氨基酸距离计算软件Z‐pred获取进化信息和距离信息,这两种特征适用于所研究对象,能够有效提高预测效果,而且提取方式 耗时短,效率高,使得在蛋白质特征提取上更具普遍适用性的特点。
3、对所研究问题创新性的将稀疏编码技术用在特征降维和去噪上,取得显著效果,相比其他方法,本发明的应用更加适用于数据的特征空间解决特定问题,更具针对性。
4、基于机器学习的链学习方法,将邻域信息加入训练模型,不仅考虑了蛋白质序列中相邻氨基酸直接的相关性,而且降低了预测结果的错误率和突变率,提高了预测精度,也使得预测结果的概率曲线更加平滑,减少了毛刺,有效避免错误判决。
附图说明
图1为本发明流程示意图。
图2为数字图像示意图。
图3为氨基酸长度与概率关系图。
图中:蛋白质数据集1,特征选择2,特征提取3,稀疏编码4,支持向量机SVM5,链学习5和预测结果6。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
如图1所示,本实施例包括以下步骤:
1)在获得包含进化信息的位置特异性打分矩阵以及代表氨基酸距离信息的Z坐标值作为特征后,将经过PSI‐BALST序列比对工具产生的位置特异性打分矩阵(position specific scoring matrix,PSSM)和由Z‐pred软件计算的残基距离信息Z‐score分别进行归一化处理,其中:PSSM矩阵代表氨基酸序列进化信息,反应氨基酸的保守性,已被证明为有效的蛋白质特征;而Z‐socre代表氨基酸距离信息计算出每个残基相对于膜中心的距离,针对所研究跨膜结构也作为有效的蛋白质特。
对于特征向量的归一化公式为: f ( x ) = 1 1 + exp ( - x ) - - - ( 1 )
其中:x表示特征矩阵中每个特征值的大小,计算后矩阵中每个元素的值在[0,1]区间内。
2)对于提取PSSM和Z‐score两种特征归一化处理后,用滑动窗口的方法提取特征向量实现多特征融合,其中:滑动窗口的大小选取为13,根据基于MCC最大化的原则选取最优值。利用滑动窗口提取特征向量能够包含序列中氨基酸之间的邻域特性,这样每个氨基酸作为样本的特征维数就是21*13维。
3)根据数字图像处理的思想,将代表每个残基的特征矩阵转换为数字图像,矩阵中的特 征值的大小代表图像中的像素值,如图2所示。
在图2中,第一行的两幅图像由跨膜区域的残基样本转换生成,第二行的两幅图像由膜外区域的残基样本生成,通过观察可以发现,代表进化信息保守性更强跨膜残基明显出现大片颜色较暗的区域,因为像素值表示图像的亮度,所以保守性越强,在PSSM矩阵中残基在进化过程中被其他氨基酸替代的概率越小,相对于膜外的残基在转换为数字图像进行对比后颜色显得更暗。
4)由于在用PSI‐BLAST等软件提取特征过程中,难以避免样本中会参杂噪声影响,而稀疏编码算法在特征降维和去除噪声方面有明显的效果,因此,本实施例提出将稀疏编码算法应用在氨基酸数字图像方面以提高最终的结构预测效果,具体如下:
对于稀疏编码算法的特征空间的训练向量,用来表示,其中:N表示样本个数,s=(s1,s2,...,sm)∈Rm×1(n=340)。稀疏表达的目的是计算出一组包含m个的基向量其中bi∈Rn×1,训练集中的每个样本都可以用基向量和稀疏系数来表示:
x i ≈ Σ j = 1 m b j · s j - - - ( 2 )
其中:稀疏系数为s=(s1,s2,...,sm)∈Rm×1,基向量通过此公式进行优化:
min imize { b j } , { s j } Σ i = 1 N 1 2 σ 2 | | x i - Σ j = 1 m b j s ij | | 2 + β · Σ i = 1 N Σ j = 1 m φ ( · ) - - - ( 3 )
subject to | | b j | | 2 ≤ c , ∀ j = 1 , . . . m . - - - ( 4 )
公式(3)里σ表示标准重构误差,β表示稀疏系数,φ(·)代表惩罚函数,在这里选取L1范数如下表示:φ(s)=||s||1              (5) 
计算出基向量计算之后,一组系数字典D可以构建如下:
D=[b1|b2|...|bm]n×m           (6) 
对于一个样本x,其稀疏相关向量y可以根据此公式计算:
y=DT·x          (7)
其中稀疏相关向量y是对于样本x的稀疏表示,在这里选取基向量的个数为128,因此每个残基进化图像将由128‐D进行稀疏表示。
5)将特征向量通过机器学习方法训练模型,在分类方法的选择上,SVM(Support Vector Machine,支持向量机)经过试验及与其他机器学习方法的比对后被证明为对本研究数据非常有效的方法。对于影响SVM分类效果的两个重要参数c和g数值选择上,本发明运用网格搜索的方法,通过预设定的距离空间和步长进行循环遍历,选择使得结果最优的一组参数c和g。
采用链学习的方式进行预测,即对于每个蛋白质序列中的相邻氨基酸之间的相关性信息,作为邻域特征加入训练模型,实施方法是按照氨基酸序列为N的顺序,将通过SVM训练好的预测模型对目标蛋白质中的第i个氨基酸位置进行预测(i<N),选择相邻氨基酸预测结果作为特征的个数为3个,也就是将每个氨基酸之前相邻三个氨基酸的预测结果作为特征加入训练模型,这样对于前面已被预测的氨基酸(i‐1,i‐2,i‐3)的结果作为第i个氨基酸的新特征进行提取,加入特征矩阵与PSSM和Z‐score特征进行融合,然后按照这种方式预测下一个氨基酸,如此往复从N端开始至C端最后一个氨基酸结束。经过统计实验,这种动态加入预测结果训练模型的方法既考虑了氨基酸之间的邻域信息,又降低了预测结果的异常突变概率。以此类推,将目标蛋白质序列进行预测,最终得到此序列中每个氨基酸相对与膜的位置。
本实施例PDBID为2mprC的膜蛋白beta‐barrel氨基酸序列如Seq ID No.1所示,基于稀疏编码及链学习方法对膜蛋白2mprC的预测概率曲线:
利用动态阈值分割后,序列跨膜区域为:
1(3‐13),2(39‐48),3(59‐68),4(75‐88),5(99‐104),6(125‐132),7(138‐146),8(170‐179),9(186‐194),10(212‐221),11(227‐235),12(279‐288),13(294‐303),14(315‐324),15(330‐339),16(353‐362),17(371‐380),18(417‐426)
预测得到Beta‐strand条数为:18条。
实施例2
本实施例包括以下步骤:
[1]蛋白质数据集:从蛋白质数据库选取数据集,分别划分训练集和测试集;
[2]特征选择:分别选择是代表蛋白质进化信息的位置特异性打分矩阵PSSM和代表氨基酸相对于膜的距离信息Z‐score;
[3]特征提取:通过归一化处理和滑动窗口的方法提取特征向量;
[4]稀疏编码:将提取的特征用稀疏编码的方法进行计算,用计算得到的稀疏系数和基向量表示原数据,进过实验统计基向量和迭代次数分别选取128和1000次;
支持向量机SVM[5]通过5重交叉验证并用网格搜索的方法确定最优参数c和g,选取径向基核函数,然后将得到的特征向量用支持向量机SVM训练模型;
[6]链学习;
[7]预测结果:按照蛋白质序列顺序,将该残基之前相邻3个氨基酸的预测结果作为邻域特征与其他特征合并并提取,加入训练模型,利用Jacknife交叉验证的方法,将数据集中的每个蛋白质作为一次测试集验证模型,其他的作为训练集训练模型,以此方式遍历数据集中所有蛋白质,最终得到每个氨基酸属于跨膜区域的概率为预测结果。
本发明的有益效果包括:1、进一步提高预测跨膜区域的精度,可以最终达到92.5%的精确度,较之其他方法有更高的预测能力。2、特征选取上,分别用多序列比对工具PSI‐BLAST和氨基酸距离计算软件Z‐pred获取进化信息和距离信息,这两种特征适用于所研究对象,能够有效提高预测效果,而且提取方式耗时短,效率高,使得在蛋白质特征提取上更具普遍适用性的特点。3、对所研究问题创新性的将稀疏编码技术用在特征降维和去噪上,取得显著效果,相比其他方法,本发明的应用更加适用于数据的特征空间解决特定问题,更具针对性。4、提出基于机器学习的链学习方法,将邻域信息加入训练模型,不仅考虑了蛋白质序列中相邻氨基酸直接的相关性,而且降低了预测结果的错误率和突变率,提高了预测精度,也使得预测结果的概率曲线更加平滑,减少了毛刺,有效避免错误判决。

Claims (10)

1.一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法,其特征在于,从已知结构的膜蛋白Beta‐barrel组织数据集中选择出包含进化信息的位置特异性打分矩阵以及代表氨基酸距离信息的Z坐标值作为特征,以归一化处理和滑动窗口的方式从中提取出特征向量并转换为数字图像,经特征空间维数降低和噪声干扰去除后用于机器学习方法训练模型,最后将训练好的预测模型采用链学习的方式对目标蛋白质中的每个氨基酸位置进行预测,得到此序列中每个氨基酸相对与膜的位置。
2.根据权利要求1所述的方法,其特征是,所述的已知结构的膜蛋白Beta‐barrel组织数据集来自最新版本蛋白质数据库,且其中的蛋白质去冗余至30%,得到最终用来训练模型的去除冗余性的数据集。
3.根据权利要求1所述的方法,其特征是,所述的位置特异性打分矩阵由PSI‐BLAST多序列比对工具获得,该矩阵是一个N行20列的矩阵,其中:N表示蛋白质序列长度,由N个氨基酸组成,每个位置表示第i个氨基酸在进化过程中被20种氨基酸中的第j个代替的分数值。
4.根据权利要求1所述的方法,其特征是,所述的Z坐标值是指:通过Z‐pred氨基酸位置计算软件获得的每个氨基酸碳原子距离膜中心位置的欧式距离。
5.根据权利要求1所述的方法,其特征是,所述的数字图像中:每个特征值的大小表示图像的像素值。
6.根据权利要求1所述的方法,其特征是,所述的特征空间维数降低和噪声干扰去除是指:运用稀疏编码算法计算稀疏系数和基向量表示原数值,以降低特征空间维数和去除噪声干扰。
7.根据权利要求1所述的方法,其特征是,所述的归一化处理是指:其中:x表示特征矩阵中每个特征值的大小,计算后矩阵中每个元素的值在[0,1]区间内。
8.根据权利要求1所述的方法,其特征是,所述的滑动窗口的大小选取为13,每个氨基 酸作为样本的特征维数为21*13维。
9.根据权利要求6所述的方法,其特征是,所述的稀疏编码算法计算稀疏系数和基向量表示原数值是指:
表示训练向量,其中:N表示样本个数,s=(s1,s2,...,sm)∈Rm×1,稀疏表达的目的是计算出一组包含m个的基向量其中bi∈Rn×1,训练集中的每个样本都可以用基向量和稀疏系数来表示:其中:稀疏系数为s=(s1,s2,...,sm)∈Rm×1,基向量通过此公式进行优化:
其中:σ表示标准重构误差,β表示稀疏系数,φ(·)代表惩罚函数,L1范数为:φ(s)=||s||1计算出基向量计算后,构建得到系数字典D为:D=[b1|b2|...|bm]n×m
对于一个样本x,其稀疏相关向量y为y=DT·x,其中:稀疏相关向量y是对于样本x的稀疏表示,基向量的个数为128,因此每个残基进化图像将由128‐D进行稀疏表示。
10.根据权利要求1所述的方法,其特征是,所述的链学习是指:即已被预测的氨基酸的结果作为其后相邻氨基酸的特征进行提取,与PSSM和Z‐score特征融合进行训练,预测下一个氨基酸,经过统计实验选择相邻氨基酸的个数为3个,按照这种方式,将每个氨基酸之前相邻三个氨基酸的预测结果作为特征加入训练模型,这种动态加入预测结果训练模型的方法既考虑了氨基酸之间的邻域信息,又降低了预测结果的异常突变概率,以此类推将目标蛋白质序列进行预测,最终得到此序列中每个氨基酸相对与膜的位置。
CN201510012812.2A 2015-01-12 2015-01-12 基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法 Active CN104615911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510012812.2A CN104615911B (zh) 2015-01-12 2015-01-12 基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510012812.2A CN104615911B (zh) 2015-01-12 2015-01-12 基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法

Publications (2)

Publication Number Publication Date
CN104615911A true CN104615911A (zh) 2015-05-13
CN104615911B CN104615911B (zh) 2017-07-18

Family

ID=53150352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510012812.2A Active CN104615911B (zh) 2015-01-12 2015-01-12 基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法

Country Status (1)

Country Link
CN (1) CN104615911B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899477A (zh) * 2015-06-18 2015-09-09 江南大学 一种使用词袋模型的蛋白质亚细胞区间预测方法
CN107451428A (zh) * 2017-08-02 2017-12-08 广东国盛医学科技有限公司 下一代测序中末端短串联序列的优化处理方法
CN109346125A (zh) * 2018-09-04 2019-02-15 浙江工业大学 一种快速精确的蛋白质绑定口袋结构对齐方法
CN109801675A (zh) * 2018-12-26 2019-05-24 东软集团股份有限公司 一种确定蛋白质脂质功能的方法、装置和设备
CN110390995A (zh) * 2019-07-01 2019-10-29 上海交通大学 α螺旋跨膜蛋白质拓扑结构预测方法及装置
CN110706738A (zh) * 2019-10-30 2020-01-17 腾讯科技(深圳)有限公司 蛋白质的结构信息预测方法、装置、设备及存储介质
CN112466468A (zh) * 2020-11-27 2021-03-09 深圳市锦欣医疗科技创新中心有限公司 一种基于稀疏编码的免疫水平预测系统、装置和存储介质
CN113228006A (zh) * 2018-12-17 2021-08-06 华为技术有限公司 检测连续事件中的异常的装置和方法及其计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2083265A1 (en) * 2006-10-31 2009-07-29 Keio University Method of classifying protein/compound pairs
CN102760209A (zh) * 2012-05-17 2012-10-31 南京理工大学常熟研究院有限公司 一种非参数膜蛋白跨膜螺旋预测方法
CN102831332A (zh) * 2012-04-16 2012-12-19 南京理工大学常熟研究院有限公司 一种可解释性的膜蛋白跨膜螺旋预测方法
CN103324933A (zh) * 2013-06-08 2013-09-25 南京理工大学常熟研究院有限公司 基于复空间多视角特征融合的膜蛋白亚细胞位置定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2083265A1 (en) * 2006-10-31 2009-07-29 Keio University Method of classifying protein/compound pairs
CN102831332A (zh) * 2012-04-16 2012-12-19 南京理工大学常熟研究院有限公司 一种可解释性的膜蛋白跨膜螺旋预测方法
CN102760209A (zh) * 2012-05-17 2012-10-31 南京理工大学常熟研究院有限公司 一种非参数膜蛋白跨膜螺旋预测方法
CN103324933A (zh) * 2013-06-08 2013-09-25 南京理工大学常熟研究院有限公司 基于复空间多视角特征融合的膜蛋白亚细胞位置定位方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DONG-JUN YU 等: "TargetATPsite: A Template-free Method for ATP-Binding Sites Prediction with Residue Evolution Image Sparse Representation and Classifier Ensemble", 《JOURNAL OF COMPUTATIONAL CHEMISTRY》 *
HAMMAD NAVEED 等: "Predicting Three-Dimensional Structures of Transmembrane Domains of β-Barrel Membrane Proteins", 《JOURNAL OF THE AMERICAN CHEMICAL SOCIETY》 *
HONGBIN SHEN 等: "MemBrain: Improving the Accuracy of Predicting Transmembrane Helices", 《PLOS ONE》 *
IRENE JACOBONI 等: "Prediction of the transmembrane regions of beta-barrel membrane proteins with a neural network-based predictor", 《PROTEIN SCIENCE A PUBLICATION OF THE PROTEIN SOCIETY》 *
JAFER ALMUALLIM: "Classifier Chains for Multi-Label Classification with Incomplete Labels", 《A PROJECT REPORT SUBMITTED TO OREGON STATE UNIVERSITY》 *
SIKANDER HAYAT 等: "Ranking models of transmembrane β-barrel proteins using Z-coordinate predictions", 《BIOINFORMATICS》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899477B (zh) * 2015-06-18 2018-01-26 江南大学 一种使用词袋模型的蛋白质亚细胞区间预测方法
CN104899477A (zh) * 2015-06-18 2015-09-09 江南大学 一种使用词袋模型的蛋白质亚细胞区间预测方法
CN107451428B (zh) * 2017-08-02 2020-05-22 广东国盛医学科技有限公司 下一代测序中末端短串联序列的优化处理方法
CN107451428A (zh) * 2017-08-02 2017-12-08 广东国盛医学科技有限公司 下一代测序中末端短串联序列的优化处理方法
CN109346125B (zh) * 2018-09-04 2021-08-03 浙江工业大学 一种快速精确的蛋白质绑定口袋结构对齐方法
CN109346125A (zh) * 2018-09-04 2019-02-15 浙江工业大学 一种快速精确的蛋白质绑定口袋结构对齐方法
CN113228006A (zh) * 2018-12-17 2021-08-06 华为技术有限公司 检测连续事件中的异常的装置和方法及其计算机程序产品
CN109801675A (zh) * 2018-12-26 2019-05-24 东软集团股份有限公司 一种确定蛋白质脂质功能的方法、装置和设备
CN110390995A (zh) * 2019-07-01 2019-10-29 上海交通大学 α螺旋跨膜蛋白质拓扑结构预测方法及装置
CN110390995B (zh) * 2019-07-01 2022-03-11 上海交通大学 α螺旋跨膜蛋白质拓扑结构预测方法及装置
CN110706738A (zh) * 2019-10-30 2020-01-17 腾讯科技(深圳)有限公司 蛋白质的结构信息预测方法、装置、设备及存储介质
CN112466468A (zh) * 2020-11-27 2021-03-09 深圳市锦欣医疗科技创新中心有限公司 一种基于稀疏编码的免疫水平预测系统、装置和存储介质
CN112466468B (zh) * 2020-11-27 2024-04-23 深圳市锦欣医疗科技创新中心有限公司 一种基于稀疏编码的免疫水平预测系统、装置和存储介质

Also Published As

Publication number Publication date
CN104615911B (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
CN104615911A (zh) 基于稀疏编码及链学习预测膜蛋白beta-barrel跨膜区域的方法
Zhang et al. Auto-msfnet: Search multi-scale fusion network for salient object detection
CN110443818B (zh) 一种基于涂鸦的弱监督语义分割方法与系统
CN111696094B (zh) 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备
CN103559724A (zh) 一种高粘连度细胞环境下的多细胞同步跟踪方法
Dong et al. Extending recurrent neural aligner for streaming end-to-end speech recognition in mandarin
CN115908908A (zh) 基于图注意力网络的遥感图像聚集型目标识别方法及装置
CN116363750A (zh) 人体姿态预测方法、装置、设备及可读存储介质
CN116258978A (zh) 一种自然保护区遥感影像弱标注的目标检测方法
CN114972882A (zh) 基于多注意力机制的磨损表面损伤深度估计方法及系统
Zhang et al. Residual memory inference network for regression tracking with weighted gradient harmonized loss
CN116230075A (zh) 一种基于混合网络模型的蛋白质结构域边界预测方法
CN109670364A (zh) 一种模板识别信息校对方法
Sun et al. PRN: Panoptic Refinement Network
CN111291820B (zh) 一种结合定位信息和分类信息的目标检测方法
CN114445419A (zh) 一种基于支气管拓扑结构的肺段分割方法、装置及系统
CN115393388A (zh) 一种基于位置不确定性估计的单目标跟踪方法
CN117671072B (zh) 基于条件扩散模型的细胞荧光图像生成方法、模型及应用
CN117710663B (zh) 基于特征增强与级联融合注意力的目标跟踪方法与系统
CN117421386B (zh) 基于gis的空间数据处理方法及系统
CN114463187B (zh) 基于聚合边缘特征的图像语义分割方法及系统
Hu et al. AnoDODE: Anomaly Detection with Diffusion ODE
US20240020948A1 (en) Efficientformer vision transformer
Wang et al. Super-Resolution Based Patch-Free 3D Image Segmentation with High-Frequency Guidance
Sahu et al. Estimation methods for microarray data with missing values: a review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant