CN108537005B - 一种基于BPSO-KNN模型的关键lncRNA预测方法 - Google Patents

一种基于BPSO-KNN模型的关键lncRNA预测方法 Download PDF

Info

Publication number
CN108537005B
CN108537005B CN201810288364.2A CN201810288364A CN108537005B CN 108537005 B CN108537005 B CN 108537005B CN 201810288364 A CN201810288364 A CN 201810288364A CN 108537005 B CN108537005 B CN 108537005B
Authority
CN
China
Prior art keywords
lncrna
particle
bpso
knn
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810288364.2A
Other languages
English (en)
Other versions
CN108537005A (zh
Inventor
郑相涵
欧阳毅
叶少珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201810288364.2A priority Critical patent/CN108537005B/zh
Publication of CN108537005A publication Critical patent/CN108537005A/zh
Application granted granted Critical
Publication of CN108537005B publication Critical patent/CN108537005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基于BPSO‑KNN模型的关键lncRNA预测方法,首先对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;接着对LncRNA表达谱数据进行降维去燥、以及标准化处理;其次构建ML‑KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;最后采用迭代法选择最终的LncRNA。本发明能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。

Description

一种基于BPSO-KNN模型的关键lncRNA预测方法
技术领域
本发明涉及生物治疗领域,特别是一种基于BPSO-KNN模型的关键lncRNA预测方法。
背景技术
长链非编码RNA(long non-coding RNA,lncRNA)是一类转录本长度超过200nt、不编码蛋白的RNA。lncRNA起初被认为是基因组转录的“噪音”,不具有生物学功能。然而,近年来的研究表明LncRNA能在表观遗传、转录及转录后水平上调控基因表达,参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,与人类疾病的发生、发展和防治都有着密切联系,尤其在恶性肿瘤的发生发展过程中扮演着重要角色。随着基因芯片技术与高通量技术的飞速发展,LncRNA的研究作为RNA研究的新领域,已经成为一个新的研究热点。
癌症是一种复杂疾病,与多个基因的突变相关,包括表观遗传变异、染色体易位、基因缺失和拷贝数变异。非编码RNA(non-coding RNA,ncRNA)是一种具有基因组的编码域但大部分都没有翻译成蛋白质的新兴转录本,在各种细胞的生理功能中,ncRNAs扮演关键角色,特别是长非编码RNA(long non-coding RNA,lncRNA),在染色质动力学、基因表达、细胞生长和分化调节中,lncRNA起着关键作用。肿瘤样本的全基因组关联研究已经确定了,大量lncRNAs与多种癌症有关,lncRNA表达量的改变及其突变促进肿瘤发生和转移,lncRNAs可能表现出肿瘤抑制和促进(致癌)的功能。由于它们的组织特异性表达特点,lncRNAs可以被作为新型生物标志物和治疗癌症的目标。
发明内容
有鉴于此,本发明的目的是提出一种基于BPSO-KNN模型的关键lncRNA预测方法,能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。
本发明采用以下方案实现:一种基于BPSO-KNN模型的关键lncRNA预测方法,包括以下步骤:
步骤S1:对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;
步骤S2:对LncRNA表达谱数据进行降维去噪、以及标准化处理;
步骤S3:构建ML-KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;
本发明采用ML-KNN分类器来评价LncRNA粒子,评估值将作为DPSO的适应度函数,来指导DPSO中微粒的最优解。BPSO的自适应能力是无需对大量组合进行检索便可以找到最佳的lncRNA组合,极大地提高了搜索的效率。邻近算法(KNN)是一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。本发明中最终选择LncRNA的效果评判,同样由ML-KNN评估模型进行。
步骤S4:采用迭代法选择最终的LncRNA。
本发明采取的Wrapper方式由搜索算法(BPSO)和邻近算法(ML-KNN)两部分组成,搜索结果LncRNA集合将作为BPSO模型的搜索空间,第一次迭代中,首先初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子。同时赋予每个微粒和整个粒子群记忆能力,来记忆迭代过程中的个体最优解和群体最优解。依照ML-KNN分类返回来的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解。
进一步地,所述步骤S2具体包括以下步骤:
步骤S21:将LncRNA表达谱数据的原始数据按照50%、30%、20%的比例分成训练集、测试集与验证集;对LncRNA表达谱数据的原始数据进行特征提取得到初始LncRNA集合;
其中,训练集是学习样本数据集,训练一些参数来构造一个分类器。验证集是对学习出来的模型,适当调整分类器的参数,如在神经网络中选择隐藏单元数。验证集还用来指导网络结构的参数。测试集是测试训练好的模型的泛化能力。所述分类器采用ML-KNN分类器。
步骤S22:采用信息增益率对初始LncRNA集合中的每个基因特征度量值进行评价,用以评判每个基因特征为系统带来的信息量大小;设定一阈值,评分低于该阈值的基因作为冗余基因去除,评分高于该阈值的基因子集则被保留用于分析或者二次过滤。
其中,信息增益是特征选择的一个重要指标。本发明采用信息增益率对每个特征度量值进行评价,评判每个特征为系统带来信息量的多少,依赖于与基因表达数据集本身有关的度量标准。评分低的基因将作为冗余基因被去除;而评分高的基因子集则被保留用于分析或者二次过滤。作用是能排除很大数量的非关键性的噪声,优化特征子集搜索范围,作为预处理步骤。信息增益率的计算公式如下:
Gain-ratio=Gain(A)/I;
其中,Gain(A)按如下规则进行计算:
Gain(S,A)=E(S)-E(S,A);
其中,Gain表示信息增益,ratio表示信息增益率,Gain(A)表示A的信息增益,I表示信息函数,Gain(S,A)表示属性A对于样集S进行划分所获得的信息增益,E(S)表示S的信息熵,E(S,A)表示属性A对于样集S的信息熵,pi表示发生概率,S表示一个样本数据集,Sv表示S样本集中特征A等于V的样本子集,E(Sv)表示Sv的信息熵。
进一步地,步骤S4具体包括以下步骤:
步骤S41:采用Wrapper的方式对步骤S22中评分高于阈值的基因子集进行搜索,并将搜索结果LncRNA集合作为BPSO模型的搜索空间;
步骤S42:初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子;
步骤S43:赋予每个微粒和整个粒子群记忆能力,用以记忆迭代过程中的个体最优解和群体最优解;
步骤S44:依照步骤S2中ML-KNN预测结果评估模型返回的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解
进一步地,步骤S44中,所述BPSO在更新微粒的速度与位置时采用以下公式:
vid(t+1)=w·vid(t)+c1r1[pid(t)-xid(t)]+c2r2[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
其中,vid(t+1)为下一时刻的微粒速度,vid(t)为当前时刻的微粒速度,xid(t+1)为下一时刻的微粒位置,xid(t)为当前时刻的微粒位置。c1为自身加速学习因子,c2为全局加速学习因子,r1、r2表示的是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置。
进一步地,所述步骤S44中还包括采用下式将微粒的速度与位置转化为二进制粒子:
较佳的,所述步骤S4具体的算法可以描述如下:
Step1:利用BPSO结合ML-KNN的Wrapper方法分析系统性能。筛选后将作为BPSO的搜索空间。随机初始化微粒群体的速度与位置,找到候选lncRNA子集。
Step2:根据ML-KNN分类器评价各个微粒,也就是各个LncRNA子集的适应度,根据微粒自身的个体最优解与群体最优解不断调节微粒的位置与速度,产生新一代粒子群。
Step3:到达预定次数,或者分类器达到某一精度,则得到最终的关键LncRNA子集并测试其准确率。否则回到Step2。
与现有技术相比,本发明有以下有益效果:本发明能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。同时,本发明将机器学习融入到lncRNA领域,具有准确度高、运行速度快、以及具有较好的鲁棒性等特点。
附图说明
图1为本发明实施例的原理框架示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1所示,本实施例提供了一种基于BPSO-KNN模型的关键lncRNA预测方法,包括以下步骤:
步骤S1:对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;
步骤S2:对LncRNA表达谱数据进行降维去噪、以及标准化处理;
步骤S3:构建ML-KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;
本实施例采用ML-KNN分类器来评价LncRNA粒子,评估值将作为DPSO的适应度函数,来指导DPSO中微粒的最优解。BPSO的自适应能力是无需对大量组合进行检索便可以找到最佳的lncRNA组合,极大地提高了搜索的效率。邻近算法(KNN)是一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。本发明中最终选择LncRNA的效果评判,同样由ML-KNN评估模型进行。
步骤S4:采用迭代法选择最终的LncRNA。
本实施例采取的Wrapper方式由搜索算法(BPSO)和邻近算法(ML-KNN)两部分组成,搜索结果LncRNA集合将作为BPSO模型的搜索空间,第一次迭代中,首先初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子。同时赋予每个微粒和整个粒子群记忆能力,来记忆迭代过程中的个体最优解和群体最优解。依照ML-KNN分类返回来的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解。
在本实施例中,所述步骤S2具体包括以下步骤:
步骤S21:将LncRNA表达谱数据的原始数据按照50%、30%、20%的比例分成训练集、测试集与验证集;对LncRNA表达谱数据的原始数据进行特征提取得到初始LncRNA集合;
其中,训练集是学习样本数据集,训练一些参数来构造一个分类器。验证集是对学习出来的模型,适当调整分类器的参数,如在神经网络中选择隐藏单元数。验证集还用来指导网络结构的参数。测试集是测试训练好的模型的泛化能力。所述分类器采用ML-KNN分类器。
步骤S22:采用信息增益率对初始LncRNA集合中的每个基因特征度量值进行评价,用以评判每个基因特征为系统带来的信息量大小;设定一阈值,评分低于该阈值的基因作为冗余基因去除,评分高于该阈值的基因子集则被保留用于分析或者二次过滤。
其中,信息增益是特征选择的一个重要指标。本发明采用信息增益率对每个特征度量值进行评价,评判每个特征为系统带来信息量的多少,依赖于与基因表达数据集本身有关的度量标准。评分低的基因将作为冗余基因被去除;而评分高的基因子集则被保留用于分析或者二次过滤。作用是能排除很大数量的非关键性的噪声,优化特征子集搜索范围,作为预处理步骤。信息增益率的计算公式如下:
Gain-ratio=Gain(A)/I;
其中,Gain(A)按如下规则进行计算:
Gain(S,A)=E(S)-E(S,A);
其中,Gain表示信息增益,ratio表示信息增益率,Gain(A)表示A的信息增益,I表示信息函数,Gain(S,A)表示属性A对于样集S进行划分所获得的信息增益,E(S)表示S的信息熵,E(S,A)表示属性A对于样集S的信息熵,pi表示发生概率,S表示一个样本数据集,Sv表示S样本集中特征A等于V的样本子集,E(Sv)表示Sv的信息熵。
在本实施例中,步骤S4具体包括以下步骤:
步骤S41:采用Wrapper的方式对步骤S22中评分高于阈值的基因子集进行搜索,并将搜索结果LncRNA集合作为BPSO模型的搜索空间;
步骤S42:初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子;
步骤S43:赋予每个微粒和整个粒子群记忆能力,用以记忆迭代过程中的个体最优解和群体最优解;
步骤S44:依照步骤S2中ML-KNN预测结果评估模型返回的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解
在本实施例中,步骤S44中,所述BPSO在更新微粒的速度与位置时采用以下公式:
vid(t+1)=w·vid(t)+c1r1[pid(t)-xid(t)]+c2r2[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
其中,vid(t+1)为下一时刻的微粒速度,vid(t)为当前时刻的微粒速度,xid(t+1)为下一时刻的微粒位置,xid(t)为当前时刻的微粒位置。c1为自身加速学习因子,c2为全局加速学习因子,r1、r2表示的是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置。
在本实施例中,所述步骤S44中还包括采用下式将微粒的速度与位置转化为二进制粒子:
较佳的,在本实施例中,所述步骤S4具体的算法可以描述如下:
Step1:利用BPSO结合ML-KNN的Wrapper方法分析系统性能。筛选后将作为BPSO的搜索空间。随机初始化微粒群体的速度与位置,找到候选lncRNA子集。
Step2:根据ML-KNN分类器评价各个微粒,也就是各个LncRNA子集的适应度,根据微粒自身的个体最优解与群体最优解不断调节微粒的位置与速度,产生新一代粒子群。
Step3:到达预定次数,或者分类器达到某一精度,则得到最终的关键LncRNA子集并测试其准确率。否则回到Step2。
本实施例能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。同时,本实施例将机器学习融入到lncRNA领域,具有准确度高、运行速度快、以及具有较好的鲁棒性等特点
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (3)

1.一种基于BPSO-KNN模型的关键lncRNA预测方法,其特征在于:包括以下步骤:
步骤S1:对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;
步骤S2:对LncRNA表达谱数据进行降维去噪、以及标准化处理;
步骤S3:构建ML-KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;
步骤S4:采用迭代法选择最终的LncRNA;
其中,所述步骤S2具体包括以下步骤:
步骤S21:将LncRNA表达谱数据的原始数据按照50%、30%、20%的比例分成训练集、测试集与验证集;对LncRNA表达谱数据的原始数据进行特征提取得到初始LncRNA集合;
步骤S22:采用信息增益率对初始LncRNA集合中的每个基因特征度量值进行评价,用以评判每个基因特征为系统带来的信息量大小;设定一阈值,评分低于该阈值的基因作为冗余基因去除,评分高于该阈值的基因子集则被保留用于分析或者二次过滤;
其中,步骤S4具体包括以下步骤:
步骤S41:采用Wrapper的方式对步骤S22中评分高于阈值的基因子集进行搜索,并将搜索结果LncRNA集合作为BPSO模型的搜索空间;
步骤S42:初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子;
步骤S43:赋予每个微粒和整个粒子群记忆能力,用以记忆迭代过程中的个体最优解和群体最优解;
步骤S44:依照步骤S2中ML-KNN预测结果评估模型返回的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解。
2.根据权利要求1所述的一种基于BPSO-KNN模型的关键lncRNA预测方法,其特征在于:步骤S44中,所述BPSO在更新微粒的速度与位置时采用以下公式:
vid(t+1)=w·vid(t)+c1r1[pid(t)-xid(t)]+c2r2[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
其中,vid(t+1)为下一时刻的微粒速度,vid(t)为当前时刻的微粒速度,xid(t+1)为下一时刻的微粒位置,xid(t)为当前时刻的微粒位置,c1为自身加速学习因子,c2为全局加速学习因子,r1、r2表示的是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置。
3.根据权利要求2所述的一种基于BPSO-KNN模型的关键lncRNA预测方法,其特征在于:所述步骤S44中还包括采用下式将微粒的速度与位置转化为二进制粒子:
CN201810288364.2A 2018-04-03 2018-04-03 一种基于BPSO-KNN模型的关键lncRNA预测方法 Active CN108537005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810288364.2A CN108537005B (zh) 2018-04-03 2018-04-03 一种基于BPSO-KNN模型的关键lncRNA预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810288364.2A CN108537005B (zh) 2018-04-03 2018-04-03 一种基于BPSO-KNN模型的关键lncRNA预测方法

Publications (2)

Publication Number Publication Date
CN108537005A CN108537005A (zh) 2018-09-14
CN108537005B true CN108537005B (zh) 2019-04-02

Family

ID=63482412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810288364.2A Active CN108537005B (zh) 2018-04-03 2018-04-03 一种基于BPSO-KNN模型的关键lncRNA预测方法

Country Status (1)

Country Link
CN (1) CN108537005B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993113B (zh) * 2019-11-21 2023-04-07 广西大学 基于MF-SDAE的lncRNA-疾病关系预测方法及系统
CN111078891B (zh) * 2019-11-21 2024-05-07 北京爱医生智慧医疗科技有限公司 一种基于粒子群算法的医学特征识别方法及装置
CN111354415B (zh) * 2020-02-17 2023-09-26 江苏大学 基因增强的骨架粒子群优化特征选择算法的小鼠唐氏综合征关键蛋白质筛选方法
CN111392538A (zh) * 2020-03-17 2020-07-10 浙江新再灵科技股份有限公司 一种基于多维物联网图谱大数据的电梯综合故障预警方法
CN115547407B (zh) * 2022-10-20 2023-04-18 东北林业大学 基于深度自动编码器的lncRNA-蛋白质相互作用预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2875710C (en) * 2012-06-22 2021-06-29 John Wayne Cancer Institute Molecular malignancy in melanocytic lesions
US9322022B2 (en) * 2013-10-21 2016-04-26 California Institute Of Technology Inhibition of DNA2 in fanconi anemia
CN104156635B (zh) * 2014-07-08 2017-07-07 华南师范大学 基于公共子序列的基因芯片表达数据的opsm挖掘方法
CN105930688B (zh) * 2016-04-18 2017-06-06 福州大学 基于改进pso算法的蛋白质功能模块检测方法
CN106202992A (zh) * 2016-07-11 2016-12-07 东南大学 一种长链非编码rna的高通量芯片处理及分析流程控制方法
CN106446603A (zh) * 2016-09-29 2017-02-22 福州大学 基于改进pso算法的基因表达数据聚类方法

Also Published As

Publication number Publication date
CN108537005A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN108537005B (zh) 一种基于BPSO-KNN模型的关键lncRNA预测方法
CN111798921B (zh) 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置
CN108595913B (zh) 鉴别mRNA和lncRNA的有监督学习方法
CN110853756B (zh) 基于som神经网络和svm的食管癌风险预测方法
JP2024516768A (ja) 植物における機械学習駆動型遺伝子発見及び遺伝子編集
Kianmehr et al. Fuzzy clustering-based discretization for gene expression classification
CN108877947B (zh) 基于迭代均值聚类的深度样本学习方法
CN111462820A (zh) 基于特征筛选和集成算法的非编码rna预测方法
CN106548041A (zh) 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法
CN106951728B (zh) 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
Whitehouse et al. Timesweeper: accurately identifying selective sweeps using population genomic time series
Zhang et al. A comparative study of ensemble learning approaches in the classification of breast cancer metastasis
CN110942808A (zh) 一种基于基因大数据的预后预测方法及预测系统
CN107908927A (zh) 基于改进PSO和ELM的疾病‑lncRNA关系预测方法
CN110796198A (zh) 基于混合蚁群优化算法的高维特征筛选方法
Yu et al. Simple rule-based ensemble classifiers for cancer DNA microarray data classification
CN114694746A (zh) 基于改进的MRMD算法和DF模型的植物pri-miRNA编码肽预测方法
CN115064207A (zh) 蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法
CN114639444A (zh) 一种基于深度学习提高单细胞蛋白质组鉴定覆盖率的方法
CN113971984A (zh) 分类模型构建方法及装置、电子设备、存储介质
CN110782950A (zh) 基于偏好网格和莱维飞行的多目标粒子群算法的肿瘤关键基因识别方法
Alzubaidi et al. A new hybrid global optimization approach for selecting clinical and biological features that are relevant to the effective diagnosis of ovarian cancer
CN111370068B (zh) 一种蛋白质异构体对相互作用预测方法及装置
Korayem et al. A hybrid genetic algorithm and artificial immune system for informative gene selection
Cai et al. Application and research progress of machine learning in Bioinformatics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant