CN109872773A - 基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 - Google Patents
基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 Download PDFInfo
- Publication number
- CN109872773A CN109872773A CN201910141438.4A CN201910141438A CN109872773A CN 109872773 A CN109872773 A CN 109872773A CN 201910141438 A CN201910141438 A CN 201910141438A CN 109872773 A CN109872773 A CN 109872773A
- Authority
- CN
- China
- Prior art keywords
- classifier
- feature
- sequence
- recognition methods
- mirna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 19
- 239000002243 precursor Substances 0.000 title claims abstract description 10
- 230000004927 fusion Effects 0.000 title claims abstract description 8
- 239000002679 microRNA Substances 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims abstract description 4
- 239000000284 extract Substances 0.000 claims abstract description 3
- 108091070501 miRNA Proteins 0.000 claims description 17
- 125000003729 nucleotide group Chemical group 0.000 claims description 7
- 239000002773 nucleotide Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 108091034117 Oligonucleotide Proteins 0.000 claims description 3
- 239000003446 ligand Substances 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 29
- 241000952730 Brada Species 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000002790 cross-validation Methods 0.000 description 5
- 241000700605 Viruses Species 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108091007426 microRNA precursor Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于Adaboost、BP神经网络和随机森林融合的mirco‑RNA前体识别方法,属于mirco‑RNA前体识别方法技术领域。本发明从pre‑miRNA序列中提取N个特征;通过提取特征及其相应的标签建立N/2个BP分类器和N/2个RF分类器;在训练和建立分类器时,计算每个分类器获得的相应权重;通过组合弱权重分布的分类器获得强分类器。本发明可以避免传统BP神经网络和RF算法分类器过度拟合和不稳定的缺点,整合了多个弱分类器并将权重分配给它们;最后,获得了具有高精度和稳定性的强分类器,可以获得高预测准确度。
Description
技术领域
本发明涉及一种基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法,属于mirco-RNA前体识别方法技术领域。
背景技术
微小RNA(miRNA)是一组非编码的短(约21nt)RNA,其作为细胞生物过程中的调节剂起重要作用。pre-miRNA的识别和发现有助于理解调节过程,miRNA和其他基因的功能,以及更多的生物进化。大多数miRNA的生物发生机制被认为是相似的:miRNA来自pre-miRNA,其包括不完美的发夹结构,然后在cy-toplasm中,成熟形式通过Dicer核酸内切酶的作用产生。由于miRNA的重要性,miRNA的准确鉴定是重新研究miRNA功能和转录后遗传过程的首要任务。
有两种识别miRNA的方法,传统的实验方法(耗费时间和金钱)和计算方法。因此,近年来越来越重视计算方法的发展。计算方法的重点是使用机器学习技术来区分真正的pre-miRNA和伪pre-miRNA(具有类似发夹状的第二结构)。
在神经网络分类器中,BP神经网络因其强大的自学习能力而成为一种广泛使用的算法,特别适用于解决内部机制问题。另一方面,随机森林(RF)算法也是用于pre-miRNA识别的强大分类算法。与其他分类器相比,RF算法在解决所提出的高维特征集方面具有优越的优势。然而,这两种算法倾向于过度拟合并且输出不稳定。因此,提出了一种新的算法,将多个BP神经网络分类器和多个RF算法分类器与一个名为BRAda算法(为本发明基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法的缩写)的新型Adaboost框架相结合,通过Adaboost框架分配分类器权重,可以获得高精度和可靠性。基于所提出的特征集和新算法的用于pre-miRNA识别的分类器。
发明内容
本发明的目的是为了解决上述现有技术存在的问题,进而提供一种基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法。
本发明的目的是通过以下技术方案实现的:
步骤1:从pre-miRNA序列中提取N个特征,N取98,则提取98维特征;
步骤2:通过提取特征及其相应的标签建立N/2个BP分类器和N/2个RF分类器;
步骤3:在训练和建立分类器时,计算每个分类器获得的相应权重;
步骤4:组合弱权重分布的分类器获得强分类器。
所述步骤1中从pre-miRNA序列中提取N个特征包括一级序列特征和二级序列特征;
所述一级序列特征为N-Gram频率,选择N值为3,在指定序列的三核苷酸组中存在64个组合,获得总共64维频率特征作为N-Gram频率特征;
所述二级序列特征包括三重结构序列、碱基对含量特征和MFE功能;其中,所述三重结构序列为对于任何三个核苷酸单元,有8个可能的组合,考虑三个字符组的第一个核苷酸,有32个不同的组合;所述碱基对含量特征为miRNA序列中的核苷酸配对G-C配对的频率;MFE功能为最小自由能。
所述步骤2中相应标签为0表示阴性样本,1表示阳性样本。
所述步骤2中建立N/2个BP分类器和N/2个RF分类器的方法为:
对于给定的多个分类训练数组,输入数据T={(x1,y1),…,(xN,yN)},具有任意整数标签,其中,T代表输入数据,x代表特征,y代表分类标签;
首先,初始化训练集权重,设置每个样品的初始重量为1/N;则权重表示如下:
然后,通过RF和BP获得分类器Gm(x),Gm(x)则代表集成分类器中的弱分类器,共由N个弱分类器集成,其中BP和RF各N/2个。
所述步骤3的具体步骤为:
计算Gm(x)的误差:
得到弱分类器的权重,如下:
更新样本权重:
计算标准化因子:
重复上面的过程,m为弱分类器的标号,m取值为1到M,M取N,可以得到多个分类器和相应的权重。
所述步骤4的具体步骤为:计算得到最终的强分类器,如下:
本发明的有益效果为:
本发明可以避免传统BP神经网络和RF算法分类器过度拟合和不稳定的缺点,提出了一种基于这两种分类器的新算法BRAda,整合了多个弱分类器(BP神经网络和RF clas-sifiers)并将权重分配给它们;最后,获得了具有高精度和稳定性的强分类器。
本发明可以获得高预测准确度,并且通过试验数据验证了本方法的预测准确性非常高,明显优于其他方法。
附图说明
图1为BRAda算法框架结构示意图。
具体实施方式
下面将结合附图对本发明做进一步的详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式,但本发明的保护范围不限于下述实施例。
如图1所示,本实施例所涉及的一种基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法,包括特征提取和方法流程;
特征提取
N-Gram频率:近年来的一些研究表明,局部一级序列对pre-miRNA序列具有决定性作用。因此,N-Gram频率是选择的一级序列特征中最常用的特征。然而,调整N的值是一个很大的挑战,通常通过比较N-Gram频率与不同N值的效果来选择N。在本实施例中,选择N为3。因此,在指定序列的三核苷酸组中存在64(43)种组合。获得了总共64维频率特征作为N-Gram频率特征。
三重结构序列:二级结构也是miRNA鉴定的重要特征,可采用软件RNAfold计算二级结构。作为二级结构预测的结果,序列的核苷酸存在两种状态,匹配(由括号'('或')'表示)或不匹配(由点。表示)。因此,每三个核苷酸单元有8(23)种可能的组合,包括'(((','((。','(。(','(。。','。((','。(。','。。。'。A,T,C,U可以是每三个核苷酸组的第一个字符,然后该组的第一个核苷酸和三个字符构成32(4×23)个组合,包括'A((”,'A((。',...,'U..('和'U...'。因此,计算32维特征向量。
碱基对含量特征:二级结构的碱基对含量也是区分真实和伪前miRNA的重要特征。广泛已知的碱基配对是Watson-Crick核苷酸配对(A-U配对和G-C配对),将G-C配对的频率计为其中一项特征。
MFE功能:作为二级结构的另一个方面,一些研究已经证明最小自由能(MFE)表明二级结构的稳定性。从研究中可以看出,真正的pre-miRNA序列的最小自由能低于随机生成的pre-miRNA序列(称之为伪pre-miRNA序列)。因此,二级结构的MFE被认为是鉴定真实和伪前miRNA序列的另一个特征。在本实施例中,采用RNAfold来计算MFE值。
总之,计算一个98维特征向量作为分类器的输入,包括64维N-Gram频率,32维三重结构序列特征,一维MFE特征和一维基础-配对内容功能。
方法流程
分类器选择:由于BP神经网络和RF算法分类器的缺点(过度拟合和不稳定性),因此提出了一种基于这两种分类器的新算法BRAda。通过整合了多个弱分类器(BP神经网络和RF clas-sifiers)并将权重分配给它们。最后,获得了具有高精度和稳定性的强分类器。
随机森林分类器:随机森林(RF)分类器由树结构分类器的集合组成。它包括两种机器学习技术:bagging和随机特征选择。在bagging中,训练数据的随机样本用于训练每棵树并通过多数树的投票进行预测。在特征选择中,RF随机选择特征的子集,而不是使用每个节点处的所有特征来构建树。RF应用交叉验证方法并同时使用袋外样本训练分类器以评估算法的预测性能。在训练过程中,一些序列将从样本中移除,而其他序列仍将在样本中重复。然后袋外样品由去除的序列组成。由于袋外序列不用于构造树,因此可以用它来估计预测性能的能力。
BRAda算法框架:首先,建立了N/2个BP神经网络和N/2个RF分类器,提出了所提出的特征和相应的标签(0表示阴性样本,1表示阳性样本)。在训练和构建分类器时,每个分类器将获得相应的权重。结果,通过组合这些弱权重分布的分类器获得了强大的分类,该方法的框架如图1所示。BRAda方法过程如下:
输入:T={(x1,y1),…,(xN,yN)}
输出:强分类器G(x)
步骤一:初始化训练集权重
步骤二:获得M个弱分类器
1)通过RF和BP获得分类器:Gm(x),Gm(x)则代表集成分类器中的弱分类器,共由N个弱分类器集成,其中BP和RF各N/2个;
2)计算误差率Gm(x)
3)得到弱分类器权重
4)更新样本权重
5)计算标准化因子
循环步骤二,m取值从1到M;
步骤三:获得强分类器
实施例1
在研究中,V-fold交叉验证用于评估BRAda分类算法以及上述训练集和特征。V的值非常重要,因为V可以确定计算的复杂性。在本实施例中,选择V值为10。首先,将训练集随机分成10组,其中一组作为测试集,其余组作为训练集,共计10次训练。对于每个训练时间,使用5个BP神经网络分类器和5个RF算法分类器作为弱分类器。
经过10次训练后,对最终的统计结果进行平均,得到最终的强分类器。
训练集
训练集由人类真实和pseu-do pre-miRNA序列组成。为了避免训练集问题的不平衡,在正训练集中总共包含1155个真正的人类pre-miRNA,并且在负训练集中包含1155个伪人类pre-miRNA。
测试集
为了评估分类器的性能,分别构建了由人和非人pre-miRNA组成的两个测试集。非人类测试装置(NHTS)包括3292个pre-miRNA(包括2407个动物pre-miRNA,860个植物pre-miRNA和25个病毒pre-miRNA)。人体测试装置(HTS)由69个新发现的人类pre-miRNA组成。本实施例中强调所有测试集都是由真正的pre-miRNA(包括人类和非人类)构建的。
分类器评估
本实施例中采用的机器学习方法用于双向分类问题;因此,可以获得四种预测结果,它们是真阳性(TP),表示正确分类的正序列的数量;假阳性(FP),表示错误分类的阳性序列的数量;真阴性(TN),表示正确分类的阴性序列的数量;和假阴性(FN),表示错误分类的阴性序列的数量。
为了评估分类器的预测,使用四个度量,包括准确度(ACC),灵敏度(SE,Sensitivity),特异性(SP,Specificity)和几何平均值(GM)。精度通常用作平衡数据集中的度量,而几何平均值广泛用于不平衡数据集。因此,应用四个度量来评估分类器的性能。计算公式如下,
BRAda算法的性能
在本实施例中,使用10倍交叉验证来评估算法和其他众所周知的分类器的性能。所有分类器都基于上面提到的特征集,标签为0(对应于负集)和1(对应于正集)。结果如表1所示。
该表显示本方法的分类器在所有这些评估中都优于其他算法。特别是,BRAda算法达到了最高的几何平均值和准确度为99%。这表明新算法以更高的准确度更有效地区分了真实和伪前miRNA。从表中可以看出,BP-Adaboost和随机森林分类也达到了很高的精度,这也是组装BP神经网络和射频分类器以获得高精度和稳定强分类器的原因。
表1
具有不同特征集的BRAda的性能
表2列出了基于不同特征集的算法的预测性能。应用十倍交叉验证,并且通过相同的训练集训练分类器。如表中所示,集合A是MFE特征和基础对内容特征,集合B是32D序列结构特征,集合C是64D基于序列的主要特征。这表明64D和32D功能对高精度性能有很大贡献。但是,当将要素组合到一个要素集中时,与任何单个子集相比,性能会更好。
表2
BRAda在独立测试集上的性能
上述实验基于与训练集的10倍交叉验证,其包含1155个真实pre-miRNA和1155个伪pre-miRNA。从结果发现新算法取得了令人满意的性能。之后,还应用了两个独立的测试集(HTS和NHTS)来测试分类器在识别人类和非人类pre-miRNA方面的表现。相比之下,使用了另外两种分类方法(CSHMM和Mirident),结果如下。
表3中列出了CSHMM,Mirident,miRNApre和在人体测试装置(HTS)上的新算法的预测。从表中可以看出BRAda算法准确度达到了98.6%的最高准确度,显著高于CSHMM和Mirident,略高于miRNApre。这表明新算法是一种更有前途的高精度分类器。
表3
此外,为了评估分类器在预测非人类pre-miRNAs中的表现,还比较了上述分类器在测试集NHTS上的表现,其中包括2407种动物(非人类)pre-miRNA,860种植物pre-miRNA和25种病毒pre-miRNA,总共3292种pre-miRNA。结果列于表4中。该表表明新方法BRAda不仅在人类pre-miRNA鉴定中而且在其他物种中达到高预测准确度(非人类动物98.2%,植物95.6%,病毒100%,总计97.4%)。由于病毒样本的数量不够,预测的准确性非常高,但仍然可以看出新方法明显优于上述其他方法。
表4
以上所述,仅为本发明较佳的具体实施方式,这些具体实施方式都是基于本发明整体构思下的不同实现方式,而且本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (6)
1.一种基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法,其特征在于,包括以下步骤:
步骤1:从pre-miRNA序列中提取N个特征;
步骤2:通过提取特征及其相应的标签建立N/2个BP分类器和N/2个RF分类器;
步骤3:在训练和建立分类器时,计算每个分类器获得的相应权重;
步骤4:组合弱权重分布的分类器获得强分类器。
2.根据权利要求1所述识别方法,其特征在于,所述步骤1中从pre-miRNA序列中提取N个特征包括一级序列特征和二级序列特征;
所述一级序列特征为N-Gram频率,选择N值为3,在指定序列的三核苷酸组中存在64个组合,获得总共64维频率特征作为N-Gram频率特征;
所述二级序列特征包括三重结构序列、碱基对含量特征和MFE功能;其中,所述三重结构序列为对于任何三个核苷酸单元,有8个可能的组合,考虑三个字符组的第一个核苷酸,有32个不同的组合;所述碱基对含量特征为miRNA序列中的核苷酸配对G-C配对的频率;MFE功能为最小自由能。
3.根据权利要求1所述的识别方法,其特征在于,所述步骤2中相应标签为0表示阴性样本,1表示阳性样本。
4.根据权利要求1所述的识别方法,其特征在于,所述步骤2中建立N/2个BP分类器和N/2个RF分类器的方法为:
对于给定的多个分类训练数组,输入数据T={(x1,y1),…,(xN,yN)},具有任意整数标签,其中,T代表输入数据,x代表特征,y代表分类标签;
首先,初始化训练集权重,设置每个样品的初始重量为1/N;则权重表示如下:
然后,通过RF和BP获得分类器Gm(x),Gm(x)则代表集成分类器中的弱分类器,共由N个弱分类器集成,其中BP和RF各N/2个。
5.根据权利要求1所述的识别方法,其特征在于,所述步骤3的具体步骤为:
计算Gm(x)的误差:
得到弱分类器的权重,如下:
更新样本权重:
计算标准化因子:
重复上面的过程,m为弱分类器的标号,m取值为1到M,M取N,可以得到多个分类器和相应的权重。
6.根据权利要求1所述的识别方法,其特征在于,所述步骤4的具体步骤为:计算得到最终的强分类器,如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910141438.4A CN109872773A (zh) | 2019-02-26 | 2019-02-26 | 基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910141438.4A CN109872773A (zh) | 2019-02-26 | 2019-02-26 | 基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109872773A true CN109872773A (zh) | 2019-06-11 |
Family
ID=66919209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910141438.4A Pending CN109872773A (zh) | 2019-02-26 | 2019-02-26 | 基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109872773A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN110688983A (zh) * | 2019-08-22 | 2020-01-14 | 中国矿业大学 | 基于多模态优化和集成学习的微震信号识别方法 |
CN112329895A (zh) * | 2021-01-05 | 2021-02-05 | 国网江西综合能源服务有限公司 | 一种具有窃电嫌疑的用户的识别方法及装置 |
CN113837293A (zh) * | 2021-09-27 | 2021-12-24 | 电子科技大学长三角研究院(衢州) | mRNA亚细胞定位模型训练方法、定位方法及可读存储介质 |
CN116070157A (zh) * | 2023-01-13 | 2023-05-05 | 东北林业大学 | 基于级联森林和双流结构的circRNA识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070218479A1 (en) * | 2005-12-30 | 2007-09-20 | Yu-Ching Chang | MicroRNA Precursors |
US20170016076A1 (en) * | 2014-05-13 | 2017-01-19 | Rosetta Genomics, Ltd. | Mirna expression signature in the classification of thyroid tumors |
CN106960217A (zh) * | 2017-02-27 | 2017-07-18 | 浙江工业大学 | 基于采用深度Adaboost算法的BP人工神经元网络的喷射器性能的预测方法 |
WO2018006152A1 (en) * | 2016-07-04 | 2018-01-11 | Deep Genomics Incorporated | Systems and methods for generating and training convolutional neural networks using biological sequences and relevance scores derived from structural, biochemical, population and evolutionary data |
US20180107927A1 (en) * | 2016-06-15 | 2018-04-19 | Deep Genomics Incorporated | Architectures for training neural networks using biological sequences, conservation, and molecular phenotypes |
-
2019
- 2019-02-26 CN CN201910141438.4A patent/CN109872773A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070218479A1 (en) * | 2005-12-30 | 2007-09-20 | Yu-Ching Chang | MicroRNA Precursors |
US20170016076A1 (en) * | 2014-05-13 | 2017-01-19 | Rosetta Genomics, Ltd. | Mirna expression signature in the classification of thyroid tumors |
US20180107927A1 (en) * | 2016-06-15 | 2018-04-19 | Deep Genomics Incorporated | Architectures for training neural networks using biological sequences, conservation, and molecular phenotypes |
WO2018006152A1 (en) * | 2016-07-04 | 2018-01-11 | Deep Genomics Incorporated | Systems and methods for generating and training convolutional neural networks using biological sequences and relevance scores derived from structural, biochemical, population and evolutionary data |
CN106960217A (zh) * | 2017-02-27 | 2017-07-18 | 浙江工业大学 | 基于采用深度Adaboost算法的BP人工神经元网络的喷射器性能的预测方法 |
Non-Patent Citations (2)
Title |
---|
NINGYI ZHANG等: "Brada: A robust method for identification of pre-micrornas by combining adaboost framework with bp and rf", 《LETTERS IN ORGANIC CHEMISTRY》 * |
江丽敏等: "细胞因子和miRNA识别研究", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN110364223B (zh) * | 2019-06-24 | 2021-04-06 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN110688983A (zh) * | 2019-08-22 | 2020-01-14 | 中国矿业大学 | 基于多模态优化和集成学习的微震信号识别方法 |
CN112329895A (zh) * | 2021-01-05 | 2021-02-05 | 国网江西综合能源服务有限公司 | 一种具有窃电嫌疑的用户的识别方法及装置 |
CN113837293A (zh) * | 2021-09-27 | 2021-12-24 | 电子科技大学长三角研究院(衢州) | mRNA亚细胞定位模型训练方法、定位方法及可读存储介质 |
CN113837293B (zh) * | 2021-09-27 | 2024-08-27 | 电子科技大学长三角研究院(衢州) | mRNA亚细胞定位模型训练方法、定位方法及可读存储介质 |
CN116070157A (zh) * | 2023-01-13 | 2023-05-05 | 东北林业大学 | 基于级联森林和双流结构的circRNA识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109872773A (zh) | 基于Adaboost、BP神经网络和随机森林融合的mirco-RNA前体识别方法 | |
CN105224695B (zh) | 一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置 | |
CN104330721B (zh) | 集成电路硬件木马检测方法和系统 | |
CN110135167A (zh) | 一种随机森林的边缘计算终端安全等级评估方法 | |
CN105487526B (zh) | 一种Fast RVM污水处理故障诊断方法 | |
CN109299741A (zh) | 一种基于多层检测的网络攻击类型识别方法 | |
CN104008165A (zh) | 一种基于网络拓扑结构和节点属性的社团检测方法 | |
CN105319071B (zh) | 基于最小二乘支持向量机的柴油机燃油系统故障诊断方法 | |
CN107766883A (zh) | 一种基于加权决策树的优化随机森林分类方法及系统 | |
CN107545038B (zh) | 一种文本分类方法与设备 | |
CN102200981B (zh) | 面向多层文本分类的特征选择方法和装置 | |
CN105550715A (zh) | 一种基于近邻传播聚类的集成分类器构建方法 | |
CN106649456A (zh) | 基于多智能体进化的聚类和离群点检测方法 | |
CN109559781A (zh) | 一种预测dna-蛋白质结合的双向lstm和cnn模型 | |
CN101763466A (zh) | 基于动态样本选择集成的生物信息识别方法 | |
CN105243296A (zh) | 联合mRNA和microRNA表达谱芯片的肿瘤特征基因选择方法 | |
CN108446616A (zh) | 基于全卷积神经网络集成学习的道路提取方法 | |
CN104966106B (zh) | 一种基于支持向量机的生物年龄分步预测方法 | |
CN111370073A (zh) | 一种基于深度学习的药物互作规则预测方法 | |
CN106570537A (zh) | 一种基于混淆矩阵的随机森林模型选择方法 | |
CN107194207A (zh) | 基于粒度支持向量机集成的蛋白质配体绑定位点预测方法 | |
CN115277159B (zh) | 一种基于改进随机森林的工业互联网安全态势评估方法 | |
CN104318515A (zh) | 基于nnia进化算法的高光谱图像波段降维方法 | |
CN116072302A (zh) | 基于有偏随机森林模型的医疗不平衡数据分类方法 | |
CN106951728B (zh) | 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190611 |