CN107908927A - 基于改进PSO和ELM的疾病‑lncRNA关系预测方法 - Google Patents

基于改进PSO和ELM的疾病‑lncRNA关系预测方法 Download PDF

Info

Publication number
CN107908927A
CN107908927A CN201711025609.4A CN201711025609A CN107908927A CN 107908927 A CN107908927 A CN 107908927A CN 201711025609 A CN201711025609 A CN 201711025609A CN 107908927 A CN107908927 A CN 107908927A
Authority
CN
China
Prior art keywords
mrow
lncrna
msub
disease
elm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711025609.4A
Other languages
English (en)
Inventor
郑相涵
刘煜
郭文忠
叶少珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201711025609.4A priority Critical patent/CN107908927A/zh
Publication of CN107908927A publication Critical patent/CN107908927A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种基于改进PSO和ELM的疾病‑lncRNA关系预测方法,其包括以下步骤:对lncRNA表达谱进行分析挖掘,根据不同疾病样本表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病发生与发展的影响;建立一种符合lncRNA表达谱的基因选择方法;采用信息增益率作为过滤法进行第一次过滤;用二进制粒子群算法作为搜索算法,ML‑ELM作为分类学习算法构建LncRNA缠绕法筛选模型;多次迭代后获取与疾病发生与发展联系密切的lncRNA,将研究成果与实际医学相联系,验证实验结果的实际医学价值,为未来的医疗做出指导。本发明具有精确度高、运行速度快、具有较好的可扩展性与健壮性等优点。

Description

基于改进PSO和ELM的疾病-lncRNA关系预测方法
技术领域
本发明基因芯片数据分析领域,具体涉及一种基于改进PSO和ELM的疾病-lncRNA关系 预测方法。
背景技术
长链非编码RNA(long non-coding RNA,lncRNA)是一类转录本长度超过200nt、不编码 蛋白的RNA。lncRNA起初被认为是基因组转录的“噪音”,不具有生物学功能。然而,近年 来的研究表明LncRNA能在表观遗传、转录及转录后水平上调控基因表达,参与了X染色体沉 默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,与 人类疾病的发生、发展和防治都有着密切联系,尤其在恶性肿瘤的发生发展过程中扮演着重要角 色。随着基因芯片技术与高通量技术的飞速发展,LncRNA的研究作为RNA研究的新领域,已 经成为一个新的研究热点。
已有的研究表明,在已发现的海量lncRNA中,部分lncRNA特异性的表达与多种疾病的发 生发展有密切关系。失调的lncRNA可能通过多种途径调节DNA甲基化、组蛋白修饰、染色质 重塑和作为miRNA前体等方式,在多个层面对疾病进行调控。
越来越多的证据进一步表明,一些lncRNA与各种复杂的人类疾病发展有重大的影响,如 前列腺癌,阿尔茨海默病(AD),心血管疾病,白血病,糖尿病、艾滋病、神经退行性疾病等。 这些lncRNA可以被作为潜在的疾病复发生物标志物。在海量lncRNA中精确定位疾病关键 lncRNA,不仅能加深人类对生命系统复杂和网络的理解和认识,也为疾病研究和治疗提供新的 视角。因此,与疾病密切相关的lncRNA的智能发现,已经成为当前生物信息学领域的重要方 向;从海量基因表达数据准确预测疾病关键lncRNA,对现代生命科学具有重大的意义。
发明内容
本发明的目的在于,提出一种基于改进PSO和ELM的疾病-lncRNA关系预测方法,能根 据基因表达数据,精确高效地预测出与疾病发生与发展密切相关的LncRNA。
为实现上述目的,本发明采用以下技术方案:一种基于改进PSO和ELM的疾病-lncRNA 关系预测方法,其包括以下步骤:步骤S1:对lncRNA表达谱进行分析挖掘,根据不同癌疾病 样本表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病发生与发展的影响;步骤 S2:建立一种符合lncRNA表达谱的基因选择方法;采用信息增益率作为过滤法进行第一次过 滤;用二进制粒子群算法作为搜索算法,ML-ELM作为分类学习算法构建LncRNA缠绕法筛选 模型;步骤S3:多次迭代后获取与疾病发生与发展联系密切的lncRNA,将研究成果与实际医 学相联系,验证实验结果的实际医学价值,为未来的医疗做出指导。
在本发明一实施例中,步骤S1包括以下步骤:LncRNA表达谱数据预对LncRNA表达谱数 据进行去杂去噪,以及标准化处理;按照给定的比例分成训练集、测试集和验证集;其中训练 集是学习样本数据集,建立一个分类器,并建立一种分类的方式,用来训练模型;验证集用于 调整分类器的参数及确定网络结构或者控制模型复杂程度的参数;测试集用于测试训练好的模 型的分辨能力。
在本发明一实施例中,按照50%,25%,25%的比例分成训练集、测试集和验证集。
在本发明一实施例中,步骤S2包括以下步骤:信息增益率的计算公式如下: Gain-ratio=Gain(A)/I;其中Gain(A)按如下规则进行计
算:Gain(S,A)=E(S)-E(S,A)
其中A代表一个指定特征,S代表一个样本数据集,Sv代表S样本集中特征A等于V的样本子集;采用信息增益率对每个特征度量值打分;评分越低的基因与类别区分关联度越低, 将评分低于一定阈值的基因作为冗余基因被去除;其他的基因子集则被保留用于下一步的分析 或者二次过滤。
在本发明一实施例中,步骤S3包括以下步骤:步骤S31:过滤后的LncRNA集合组成了 BPSO模型的搜索空间,这个LncRNA子集寻找的空间里,随机初始化微粒群体的速度与位置, 找到待选基因子集;步骤S32:依照ML-ELM分类装置返回的精度点评各个微粒,即各个LncRNA 子集的适应值,根据微粒自身的个体最优解与群体最优解不断调节微粒的位置与速度,产生新一 代粒子群;步骤S33:到达预定迭代次数,或者分类器达到指定精度,则得到最终的关键LncRNA 子集并测试其准确率,否则回到步骤S32。
在本发明一实施例中,步骤S3包括以下步骤:BPSO的计算公式如下更新速度与位置:
vid(t+1)=w.vid(t)+c1.r1.[pid(t)-xid(t)]+c2.r2.[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
并通过如下公式将转化二进制粒子:
其中V表示粒子的速度,X表示粒子的位置,t表示 某一时刻,w表示惯性权重值,C1为自身加速学习因子,C2为全局加速学习因子,r1,r2表示 的是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置,Sig(Vid)表示Vid取1的 概率。
在本发明一实施例中,步骤S3包括以下步骤:构建ML-ELM预测结果评估模型:
Xi=[xi1,xi2,...,xin]T∈Rn;ti=[ti1,ti2,...,tim]T∈Rm
假设有个N任意的样本(Xi,ti),其中 Xi=[xi1,xi2…,xin]T∈Rn,ti=[ti1,ti2…,xtin]T∈Rm,L表示隐层节点,βi表示输出权重, g(x)表示激励函数,wi表示输入权重,bi表示第i个隐层单位的偏置。
与现有技术相比,本发明基于BPSO与ML-ELM的疾病关键LncRNA预测方法,将机器学 习与特征选择方法结合生物基因本体知识,应用到基因芯片数据分析领域中,从而对不同种类 疾病发生发展有显著影响的LncRNA进行预测。本发明具有精确度高、运行速度快、具有较好 的可扩展性与健壮性等优点。
附图说明
图1为本发明整体框架示意图。
图2为本发明一实施例ML-ELM模型构建过程1。
具体实施方式
下面结合附图和具体实施例对本发明做进一步解释说明。
本发明提出一种基于改进PSO和ELM的疾病-lncRNA关系预测方法,能根据基因表达数 据,精确高效地预测出与疾病发生与发展密切相关的LncRNA。本发明将机器学习融入最新的 lncRNA领域,精确度高、运行速度快、具有较好的可扩展性与健壮性;整体框架图参见图1。
本发明主要包括以下步骤:
步骤S1:对lncRNA表达谱进行分析挖掘,根据不同疾病样本表达谱中lncRNA的表达比,分 析相应lncRNA对不同类型疾病发生与发展的影响。
步骤S2:建立一种符合lncRNA表达谱的精确高效的基因选择方法;采用信息增益率作为过滤法 进行第一次过滤;用二进制粒子群算法作为搜索算法,ML-ELM作为分类学习算法构建LncRNA 缠绕法筛选模型。
步骤S3:多次迭代后获取与疾病发生与发展联系密切的lncRNA,将研究成果与实际医学 相联系,(通过生物实验或者现实医疗大数据验证)实验结果的实际医学价值,为未来的精准医 疗做出指导。
在本发明一实施例中,步骤S1:对LncRNA表达谱数据预处理,包括以下步骤:
对LncRNA表达谱数据进行去杂去噪,以及标准化处理(平均值为0,方差为1)。按照一 定的比例分成训练集、测试集和验证集。较佳的,可以按照50%,25%,25%的比例分成训练集、 测试集和验证集。训练集是学习样本数据集,通过匹配一些参数来建立一个分类器。建立一种 分类的方式,主要是用来训练模型的。验证集是对学习出来的模型,调整分类器的参数,如在 神经网络中选择隐藏单元数。验证集还用来确定网络结构或者控制模型复杂程度的参数。测试 集是主要是测试训练好的模型的分辨能力(识别率等)。
在本发明一实施例中,步骤S2:信息增益率进行初步过滤,包括以下步骤:
本发明采用信息增益率对每个特征度量值打分,只依赖于与基因表达数据集本身有关的度 量标准,通过信息增益率来评估每个基因对类别的区分能力。评分越低的基因与类别区分关联 度越低,将评分低于一定阈值的基因作为冗余基因被去除;其他的基因子集则被保留用于下一 步的分析或者二次过滤。因此本发明具有效率高、计算简单、鲁棒性强等特点,从而适合处理 高维数据集,能很快地排除很大数量的非关键性的噪声特征,缩小优化特征子集搜索范围,作 为学习算法的预处理步骤。信息增益率的计算公式如下:
Gain-ratio=Gain(A)/I
其中Gain(A)按如下规则进行计算:
Gain(S,A)=E(S)-E(S,A)
其中A代表一个指定特征,S代表一个样本数据集,Sv代表S样本集中特征A等于V的样本子集。在进行信息增益率初步过滤后,多数无用的冗余LncRNA被筛选,大大降低了LncRNA 表达谱矩阵维度,提高了机器学习的效率。
本发明采用ML-ELM分类器来评估所选择的LncRNA子集,同时评估值将作为DPSO的适 应度函数,来指导DPSO中微粒最优解的存储。传统的神经网络学习算法(如BP算法)需要人为设置大量的网络训练参数,并且很容易产生局部最优解。极限学习机(ELM)只需要设置网 络的隐层节点个数,在算法执行过程中不需要调整网络的输入权值以及隐元的偏置,并且产生 唯一的最优解,因此具有学习速度快且泛化性能好的优点,而ML-ELM则是ELM的一个多层 模型,具有更高的精度。本发明中最终选择LncRNA的效果评判,同样由ML-ELM评估模型进 行。
其中ML-ELM模型构建过程如图2所示。
ML-ELM的关键计算公式如下:
Xi=[xi1,xi2,...,xin]T∈Rnti=[ti1,ti2,...,tim]T∈Rm
假设有个N任意的样本(Xi,ti),其中 Xi=[xi1,xi2…,xin]T∈Rn,ti=[ti1,ti2…,xtin]T∈Rm,L表示隐层节点,βi表示输出权重, g(x)表示激励函数,wi表示输入权重,bi表示第i个隐层单位的偏置。
Wrapper方式由搜索算法(BPSO)和多层极限学习机(ML-ELM)两部分组成。过滤后的 LncRNA集合组成了BPSO模型的搜索空间,第一次迭代中初始微粒群体的速度与位置,每个 微粒表示一个LncRNA子集。同时赋予每个微粒和整个粒子群记忆能力,来记忆迭代过程中的 个体最优解和群体最优解。依照ML-ELM分类返回来的验证集合的准确率点评各个微粒,并借 助不断更新BPSO模型里微粒的速度与位置寻找全局的优化解。
BPSO的计算公式如下更新速度与位置:
vid(t+1)=w.vid(t)+c1.r1.[pid(t)-xid(t)]+c2.r2.[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
并通过如下公式将转化二进制粒子:
其中V表示粒子的速度,X表示粒子的位置,t表示某 一时刻,w表示惯性权重值,C1为自身加速学习因子,C2为全局加速学习因子,r1,r2表示的 是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置,Sig(Vid)表示Vid取1的概 率。
在本发明一实施例中,步骤S3包括以下步骤:构建ML-ELM预测结果评估模型:
具体算法步骤:
步骤S31:利用BPSO结合ML-ELM的Wrapper方法分析分类性能。筛选后的基因构成BPSO 的搜索空间。这个LncRNA子集寻找的空间里,随机初始化微粒群体的速度与位置,找到待选 基因子集。
步骤S32:依照ML-ELM分类装置返回的精度点评各个微粒,也就是各个LncRNA子集的 适应值,根据微粒自身的个体最优解与群体最优解不断调节微粒的位置与速度(LncRNA子集), 产生新一代粒子群。
步骤S33:到达预定迭代次数,或者分类器达到指定精度,则得到最终的关键LncRNA子 集并测试其准确率。否则回到步骤S32。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出 本发明技术方案的范围时,均属于本发明的保护范围。

Claims (7)

1.一种基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:包括以下步骤:
步骤S1:对lncRNA表达谱进行分析挖掘,根据不同疾病样本表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病发生与发展的影响;
步骤S2:建立一种符合lncRNA表达谱的基因选择方法;采用信息增益率作为过滤法进行第一次过滤;用二进制粒子群算法作为搜索算法,ML-ELM作为分类学习算法构建LncRNA缠绕法筛选模型;
步骤S3:多次迭代后获取与疾病发生与发展联系密切的lncRNA,将研究成果与实际医学相联系,验证实验结果的实际医学价值,为未来的医疗做出指导。
2.根据权利要求1所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:步骤S1包括以下步骤:
对lncRNA表达谱数据进行去杂去噪,以及标准化处理;按照给定的比例分成训练集、测试集和验证集;其中训练集是学习样本数据集,建立一个分类器,并建立一种分类的方式,用来训练模型;验证集用于调整分类器的参数及确定网络结构或者控制模型复杂程度的参数;测试集用于测试训练好的模型的分辨能力。
3.根据权利要求2所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:按照50%,25%,25%的比例分成训练集、测试集和验证集。
4.根据权利要求1所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:步骤S2包括以下步骤:
信息增益率的计算公式如下:
Gain-ratio=Gain(A)/I
其中Gain(A)按如下规则进行计算:
Gain(S,A)=E(S)-E(S,A)
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msub> <mi>p</mi> <mi>i</mi> </msub> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>,</mo> <mi>A</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>v</mi> <mo>&amp;Element;</mo> <mi>V</mi> <mi>a</mi> <mi>l</mi> <mi>u</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>)</mo> </mrow> </mrow> </munder> <mfrac> <mrow> <mo>|</mo> <msub> <mi>S</mi> <mi>v</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>S</mi> <mo>|</mo> </mrow> </mfrac> <mi>E</mi> <mrow> <mo>(</mo> <msub> <mi>S</mi> <mi>v</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
其中A代表一个指定特征,S代表一个样本数据集,Sv代表S样本集中特征A等于V的样本子集;采用信息增益率对每个特征度量值打分;评分越低的基因与类别区分关联度越低,将评分低于一定阈值的基因作为冗余基因被去除;其他的基因子集则被保留用于下一步的分析或者二次过滤。
5.根据权利要求1所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:步骤S3包括以下步骤:
步骤S31:过滤后的lncRNA集合组成了BPSO模型的搜索空间,在这个lncRNA子集寻找的空间里,随机初始化微粒群体的速度与位置,找到待选基因子集;
步骤S32:依照ML-ELM分类装置返回的精度点评各个微粒,即各个LncRNA子集的适应值,根据微粒自身的个体最优解与群体最优解不断调节微粒的位置与速度,产生新一代粒子群;
步骤S33:到达预定迭代次数,或者分类器达到指定精度,则得到最终的关键LncRNA子集并测试其准确率,否则回到步骤S32。
6.根据权利要求5所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:步骤S3包括以下步骤:
BPSO的计算公式如下更新速度与位置:
vid(t+1)=w.vid(t)+c1.r1.[pid(t)-xid(t)]+c2.r2.[pgd-xid(t)];
xid(t+1)=xid(t)+vid(t+1);
并通过如下公式将转化二进制粒子:
<mrow> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> </mrow> </msup> </mrow> </mfrac> <mo>;</mo> </mrow>
<mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>r</mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mrow> <mo>(</mo> <mo>)</mo> </mrow> <mo>&lt;</mo> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> <mo>(</mo> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>e</mi> <mi>l</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
其中V表示粒子的速度,X表示粒子的位置,t表示某一时刻,w表示惯性权重值,C1为自身加速学习因子,C2为全局加速学习因子,r1,r2表示的是概率参数,pid表示的是个体最优位置,pgd表示的是群体最优位置,Sig(Vid)表示Vid取1的概率。
7.根据权利要求5所述的基于改进PSO和ELM的疾病-lncRNA关系预测方法,其特征在于:步骤S3包括以下步骤:
构建ML-ELM预测结果评估模型:
Xi=[xi1,xi2,...,xin]T∈Rn; ti=[ti1,ti2,...,tim]T∈Rm
<mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>&amp;beta;</mi> <mi>i</mi> </msub> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>o</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>N</mi> <mo>;</mo> </mrow>
假设有个N任意的样本(Xi,ti),其中Xi=[xi1,xi2…,xin]T∈Rn,ti=[ti1,ti2…,xtin]T∈Rm,L表示隐层节点,βi表示输出权重,g(x)表示激励函数,wi表示输入权重,bi表示第i个隐层单位的偏置。
CN201711025609.4A 2017-10-27 2017-10-27 基于改进PSO和ELM的疾病‑lncRNA关系预测方法 Pending CN107908927A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711025609.4A CN107908927A (zh) 2017-10-27 2017-10-27 基于改进PSO和ELM的疾病‑lncRNA关系预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711025609.4A CN107908927A (zh) 2017-10-27 2017-10-27 基于改进PSO和ELM的疾病‑lncRNA关系预测方法

Publications (1)

Publication Number Publication Date
CN107908927A true CN107908927A (zh) 2018-04-13

Family

ID=61841820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711025609.4A Pending CN107908927A (zh) 2017-10-27 2017-10-27 基于改进PSO和ELM的疾病‑lncRNA关系预测方法

Country Status (1)

Country Link
CN (1) CN107908927A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549709A (zh) * 2018-04-20 2018-09-18 福州大学 区块链内外多源异构数据基于广度学习算法的融合方法
CN108959854A (zh) * 2018-06-20 2018-12-07 湘潭大学 一种基于点割集的LncRNA与疾病关联关系的预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473598A (zh) * 2013-09-17 2013-12-25 山东大学 基于变长度粒子群优化算法的极限学习机
CN104463251A (zh) * 2014-12-15 2015-03-25 江苏科技大学 基于集成极端学习机的肿瘤基因表达谱数据识别方法
CN106096788A (zh) * 2016-06-21 2016-11-09 重庆科技学院 基于pso_elm神经网络的转炉炼钢工艺成本控制方法及系统
CN106548041A (zh) * 2016-12-08 2017-03-29 江苏大学 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法
CN106651012A (zh) * 2016-12-02 2017-05-10 东华大学 一种基于改进极限学习机的作物蒸腾量预测方法
CN106650920A (zh) * 2017-02-19 2017-05-10 郑州大学 一种基于优化极限学习机的预测模型
CN106951728A (zh) * 2017-03-03 2017-07-14 江苏大学 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473598A (zh) * 2013-09-17 2013-12-25 山东大学 基于变长度粒子群优化算法的极限学习机
CN104463251A (zh) * 2014-12-15 2015-03-25 江苏科技大学 基于集成极端学习机的肿瘤基因表达谱数据识别方法
CN106096788A (zh) * 2016-06-21 2016-11-09 重庆科技学院 基于pso_elm神经网络的转炉炼钢工艺成本控制方法及系统
CN106651012A (zh) * 2016-12-02 2017-05-10 东华大学 一种基于改进极限学习机的作物蒸腾量预测方法
CN106548041A (zh) * 2016-12-08 2017-03-29 江苏大学 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法
CN106650920A (zh) * 2017-02-19 2017-05-10 郑州大学 一种基于优化极限学习机的预测模型
CN106951728A (zh) * 2017-03-03 2017-07-14 江苏大学 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
FEI HAN等: "A Gene Selection Method for Microarray Data Based on Binary PSO Encoding Gene-to-Class Sensitivity Information", 《IEEE TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS》 *
FEI HAN等: "An improved evolutionary extreme learning machine based on particle swarm optimization", 《NEUROCOMPUTING》 *
MATLAB中文论坛 编著: "《MATLAB神经网络30个案例分析》", 30 April 2010, 北京航空航天大学出版社 *
刘金勇等: "基于聚类和微粒群优化的基因选择方法", 《数据采集与处理》 *
孙伟等: "基于基因灵敏度信息和二进制微粒群优化的基因选择方法", 《计算机应用研究》 *
左伋等主编: "《遗传医学进展》", 31 May 2014, 复旦大学出版社 *
柳炳洋等 主编: "《智能优化方法及应用》", 31 August 2017, 江苏凤凰美术出版社 *
蔡丽艳 著: "《数据挖掘算法及其应用研究》", 28 February 2013, 电子科技大学出版社 *
郝丽娜等: "基于多层超限学习机的滚动轴承故障诊断方法", 《科学技术与工程》 *
陈万涛主编: "《口腔颌面-头颈部肿瘤生物学》", 31 May 2015, 上海交通大学出版社 *
陈晓青等: "自适应混沌粒子群算法对极限学习机参数的优化", 《计算机应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549709A (zh) * 2018-04-20 2018-09-18 福州大学 区块链内外多源异构数据基于广度学习算法的融合方法
CN108959854A (zh) * 2018-06-20 2018-12-07 湘潭大学 一种基于点割集的LncRNA与疾病关联关系的预测方法
CN108959854B (zh) * 2018-06-20 2021-08-03 湘潭大学 一种基于点割集的LncRNA与疾病关联关系的预测方法

Similar Documents

Publication Publication Date Title
Caliskan et al. Diagnosis of the parkinson disease by using deep neural network classifier
CN103729678B (zh) 一种基于改进dbn模型的水军检测方法及系统
CN108537005B (zh) 一种基于BPSO-KNN模型的关键lncRNA预测方法
CN108399201A (zh) 一种基于循环神经网络的Web用户访问路径预测方法
CN106980877A (zh) 一种基于粒子群算法优化支持向量机的爆破振动预测方法
CN101145171A (zh) 一种基于独立分量集成学习的基因微阵列数据预测方法
KR101091834B1 (ko) 문제 선택 및 성취도 평가 방법 및 장치
CN113033610B (zh) 一种多模态融合敏感信息分类检测方法
CN104966106B (zh) 一种基于支持向量机的生物年龄分步预测方法
CN104598774A (zh) 基于logistic与相关信息熵的特征基因选择方法
CN105609116A (zh) 一种语音情感维度区域的自动识别方法
CN109325125A (zh) 一种基于cnn优化的社交网络谣言方法
Albornoz et al. Automatic classification of Furnariidae species from the Paranaense Littoral region using speech-related features and machine learning
CN107908927A (zh) 基于改进PSO和ELM的疾病‑lncRNA关系预测方法
CN106951728B (zh) 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
Elkarami et al. Cost-sensitive classification on class-balanced ensembles for imbalanced non-coding RNA data
CN116524960A (zh) 一种基于混合熵下采样和集成分类器的语音情感识别系统
CN105046106B (zh) 一种用最近邻检索实现的蛋白质亚细胞定位预测方法
CN114999566B (zh) 基于词向量表征和注意力机制的药物重定位方法及系统
CN105160208A (zh) 用于疾病亚型问题的基于网络的聚类方法
CN115295079A (zh) 基于元图学习的长链非编码rna亚细胞定位预测方法
KR102376212B1 (ko) 신경망 기반의 유전자 선택 알고리즘을 이용한 유전자 발현 마커 선별 방법
Hasan et al. E-DARTS: Enhanced differentiable architecture search for acoustic scene classification
Hassan et al. COMPARATIVE ANALYSIS OF CLASSIFICATION BASED ON CELLULAR LOCALIZATION DATA USING MACHINE LEARNING
Dentamaro et al. A benchmarking study of deep learning techniques applied for breath analysis.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180413

RJ01 Rejection of invention patent application after publication