CN108920900A - 基因表达谱数据的无监督极限学习机特征提取系统及方法 - Google Patents

基因表达谱数据的无监督极限学习机特征提取系统及方法 Download PDF

Info

Publication number
CN108920900A
CN108920900A CN201810643270.2A CN201810643270A CN108920900A CN 108920900 A CN108920900 A CN 108920900A CN 201810643270 A CN201810643270 A CN 201810643270A CN 108920900 A CN108920900 A CN 108920900A
Authority
CN
China
Prior art keywords
data
sample
module
gene expression
expression profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810643270.2A
Other languages
English (en)
Inventor
陈晓云
廖梦真
康叶媛
张萌
王彬福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201810643270.2A priority Critical patent/CN108920900A/zh
Publication of CN108920900A publication Critical patent/CN108920900A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基因表达谱数据的无监督极限学习机特征提取系统及方法。该方法利用近邻表示来自适应学习近邻样本的相似性,将相似度学习与特征提取融合在一起,提出基于相似度学习进行特征提取的极限学习机。本发明可以自适应根据不同的样本数据选择合适的近邻矩阵学习最优的表示系数,进而提高模型对不同数据的执行效果,同时对高维数据的计算有效的降低时间复杂度。

Description

基因表达谱数据的无监督极限学习机特征提取系统及方法
技术领域
本发明涉及一种基因表达谱数据的无监督极限学习机特征提取系统及方法
背景技术
DNA微阵列技术为生物信息学的研究注入了新的活力,基于基因表达谱数据的生物信息学研究得到了广泛的认可。聚类方法是研究基因表达谱数据模式识别的一种重要手段,但是基因表达谱数据规模庞大且复杂,经典的统计学习算法和数据挖掘方法已经不能很好地满足基因表达谱数据的模式识别研究需要。基因表达数据的小样本、高位数、高冗余、样本不平衡和非线性等特点,使得从基因表达数据获取有用的信息成为研究的难点,基因表达数据的聚类问题研究常用策略是先通过特征提取或特征选择进行降维,接着对降维后的特征进行聚类。
目前已经提出了很多基因表达数据的特征提取方法,包括主成分分析、近邻保持嵌入、局部保持投影等。主成分分析算法想保持全局结构,前提假设是各主特征分布在正交方向上,但如果在非正交方向上存在几个方差较大的方向,该算法效果变得不理想;并且,若数据高阶相关,则此方法无法使用。近邻保持嵌入和局部保持投影方法都是基于流形正则化的思想,这些方法都是用高斯函数描述样本间的相似性,难以避免的出现高维空间中的“集中现象”,即样本点间的高斯相似性度量的类区分性随维数升高而减弱,并且这两种方法都对非线性变化敏感。
基于无监督极限学习机的特征提取方法的相关研究已取得一定的成果,该方法具有结构简单、学习速度快等优点,但仍存在与上述传统的特征提取方法中存在的问题:用高斯函数描述样本间的相似性,难以避免的出现高维空间中的“集中现象”,即样本的相似性度量的类区分性随维数升高而减弱。针对上述问题,我们提出了一种基于自适应相似度学习的基因表达谱数据的特征提取与聚类分析系统,采用样本数据来学习相似度矩阵,而不是通过特定的距离公式直接计算,更好地刻画了样本间相似性,并且提高了基因表达谱数据聚类精确度。
发明内容
本发明的目的在于提供一种基因表达谱数据的无监督极限学习机特征提取系统及方法
为实现上述目的,本发明的技术方案是:一种基因表达谱数据的无监督极限学习机特征提取系统,包括数据转换模块、非线性变换模块、特征提取模块、数据可视化模块、聚类分析模块;
所述数据转换模块对原始高维基因表达谱数据进行规范化处理,而后传输给非线性变换模块;
所述非线性变换模块利用随机特征映射对数据进行非线性变换,而后传输给特征提取模块;
所述特征提取模块学习一个变换矩阵,该变换矩阵将高维基因表达谱数据投影到低维子空间;
所述数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
所述聚类分析模块在低维子空间对基因表达谱数据进行识别归类。
在本发明一实施例中,所述数据转换模块采用二范数进行标准化处理,将原始高维基因表达谱数据转换到同一个量纲范围。
在本发明一实施例中,所述非线性变换模块计算隐藏层输出矩阵,其方法为:随机产生输入层与隐藏层的连接权值及隐藏层神经元阈值,选择S型函数作为激励函数,对每一个输入样本得到一个隐藏层输出向量。
在本发明一实施例中,所述特征提取模块学习变换矩阵的方法为:结合数据自适应相似度学习和流形学习思想构造目标函数,通过求解获得变换矩阵。
在本发明一实施例中,所述聚类分析模块,将投影到低维子空间的基因表达谱数据用k-means进行聚类,利用聚类准确率衡量特征提取的效果。
本发明还提供了一种基于上述所述系统的无监督极限学习机特征提取方法,包括如下步骤,
步骤S1、通过数据转换模块对原始高维基因表达谱数据进行规范化处理,该过程采用二范数对每个样本进行规范化处理,使得数据转换到同一个量纲范围;
步骤S2、通过非线性变换模块对经数据转换模块规范化处理后的数据进行非线性变换;
步骤S3、通过特征提取模块将经非线性变换模块变换后的数据投影到低维子空间;
步骤S4、通过数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
步骤S5、通过聚类分析模块在低维特征空间对基因表达谱数据进行识别归类。
在本发明一实施例中,所述步骤S2的具体实现过程如下:
步骤S21、随机产生输入权向量w和隐节点偏差b;
步骤S22、选择S型函数作为激励函数
步骤S23、计算每一个输入样本数据的隐藏层输出矩阵H:
其中,h(xi)=(g(w1,b1,xi),…,g(wL,bL,xi))为隐藏层关于第i个m维样本xi的输出向量,对数据进行非线性变换,期望得到的H矩阵与输出层具有线性关系;L为隐藏层节点个数,g(·)是S型函数,wi(i=1,2,...,n),bi(i=1,2,...,n)分别是第i个隐节点的输入权和偏差。
在本发明一实施例中,所述步骤S3的具体实现过程如下:
步骤S31、基于自适应的样本近邻表示,自适应学习样本间相似性,模型如下:
其中,Z为表达系数矩阵,Zij表示样本xi与xj的相似程度;Nk(xi)是样本xi的k个近邻样本集合,如果Zij=0;
步骤S32、利用流形正则思想,即投影后的数据在新空间中仍保持与原空间中相同的近邻关系,公式如下:
||H(xi)β-H(xj)β||2Zij (3)
其中,H(xi),H(xj)分别是隐藏层关于第i个m维样本xi(i=1,2,...,n)的输出向量,β∈RL×d是极限学习机输出层输出权重,若d<m,则Hβ可将数据投影到低维子空间;Zij表示原始样本xi与xj的相似程度;
步骤S33、结合公式(2)和(3)得到特征提取模型,通过交替迭代方向乘子法,求得输出权重β∈RL×d,β即为投影矩阵,当d<m时,可以用H(X)β对原始高维基因表达谱数据X∈Rn ×m进行降维,得到d维的投影样本。
相较于现有技术,本发明具有以下有益效果:本发明弥补了传统特征提取方法中用高斯距离函数刻画样本间相似性的不足;本发明在基因表达谱数据研究应用上意义深远,可以自适应处理不同类型的高维基因表达数据,有更广的适用性;本发明弥补了高维数据采用高斯函数度量距离的不合理性以及不能处理非线性样本数据的不足;本发明在基因表达谱数据研究应用上意义深远,其聚类效果和运算效率有显著提升,为分析复杂的基因表达数据提供了一个更加精确有效的方法。
附图说明
图1为本发明实施例的系统模块示意图。
图2是本发明实施例的工作流程图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提供了一种基因表达谱数据的无监督极限学习机特征提取系统,包括数据转换模块、非线性变换模块、特征提取模块、数据可视化模块、聚类分析模块;
所述数据转换模块对原始高维基因表达谱数据进行规范化处理,而后传输给非线性变换模块;
所述非线性变换模块利用随机特征映射对数据进行非线性变换,而后传输给特征提取模块;
所述特征提取模块学习一个变换矩阵,该变换矩阵将高维基因表达谱数据投影到低维子空间;
所述数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
所述聚类分析模块在低维子空间对基因表达谱数据进行识别归类。
所述数据转换模块采用二范数进行标准化处理,将原始高维基因表达谱数据转换到同一个量纲范围。所述非线性变换模块计算隐藏层输出矩阵,其方法为:随机产生输入层与隐藏层的连接权值及隐藏层神经元阈值,选择S型函数作为激励函数,对每一个输入样本得到一个隐藏层输出向量。所述特征提取模块学习变换矩阵的方法为:结合数据自适应相似度学习和流形学习思想构造目标函数,通过求解获得变换矩阵。所述聚类分析模块,将投影到低维子空间的基因表达谱数据用k-means进行聚类,利用聚类准确率衡量特征提取的效果。
本发明还提供了一种基于上述所述系统的无监督极限学习机特征提取方法,包括如下步骤,
步骤S1、通过数据转换模块对原始高维基因表达谱数据进行规范化处理,该过程采用二范数对每个样本进行规范化处理,使得数据转换到同一个量纲范围;
步骤S2、通过非线性变换模块对经数据转换模块规范化处理后的数据进行非线性变换;
步骤S3、通过特征提取模块将经非线性变换模块变换后的数据投影到低维子空间;
步骤S4、通过数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
步骤S5、通过聚类分析模块在低维特征空间对基因表达谱数据进行识别归类。
在本发明一实施例中,所述步骤S2的具体实现过程如下:
步骤S21、随机产生输入权向量w和隐节点偏差b;
步骤S22、选择S型函数作为激励函数
步骤S23、计算每一个输入样本数据的隐藏层输出矩阵H:
其中,h(xi)=(g(w1,b1,xi),…,g(wL,bL,xi))为隐藏层关于第i个m维样本xi的输出向量,对数据进行非线性变换,期望得到的H矩阵与输出层具有线性关系;L为隐藏层节点个数,g(·)是S型函数,wi(i=1,2,...,n),bi(i=1,2,...,n)分别是第i个隐节点的输入权和偏差。
在本发明一实施例中,所述步骤S3的具体实现过程如下:
步骤S31、基于自适应的样本近邻表示,自适应学习样本间相似性,模型如下:
其中,Z为表达系数矩阵,Zij表示样本xi与xj的相似程度;Nk(xi)是样本xi的k个近邻样本集合,如果Zij=0;
步骤S32、利用流形正则思想,即投影后的数据在新空间中仍保持与原空间中相同的近邻关系,公式如下:
||H(xi)β-H(xj)β||2Zij (3)
其中,H(xi),H(xj)分别是隐藏层关于第i个m维样本xi(i=1,2,...,n)的输出向量,β∈RL×d是极限学习机输出层输出权重,若d<m,则Hβ可将数据投影到低维子空间;Zij表示原始样本xi与xj的相似程度;
步骤S33、结合公式(2)和(3)得到特征提取模型,通过交替迭代方向乘子法,求得输出权重β∈RL×d,β即为投影矩阵,当d<m时,可以用H(X)β对原始高维基因表达谱数据X∈Rn ×m进行降维,得到d维的投影样本。
以下为本发明的具体实现过程。
本发明的一种基于基因表达谱数据的无监督极限学习机特征提取和聚类方法,如图1所示,所述设有数据转换模块、非线性变换模块、特征提取模块、数据可视化模块、聚类分析模块;
步骤一所述数据转换模块对数据进行规范化处理,我们采用二范数对每个样本进行规范化处理,使得数据转换到同一个量纲范围。
步骤二所述非线性变换模块利用随机特征映射将数据变换为线性可分的,其过程如下:
1.随机产生输入权向量wj和隐节点偏差bj,其取值范围通常为[-1,1]。隐节点个数的选择直接影响非线性变换的质量,对于基因表达谱数据隐节点个数一般设置为1000。
2.选择隐节点激励函数,这里我们选择S型函数作为激励函数
3.计算经过特征映射后的隐藏层输出矩阵H:
这里的h(xi)=(g(w1,b1,xi),…,g(wL,bL,xi))为隐藏层关于第i个样本xi的输出向量,期望得到的H矩阵与输出层具有线性关系。L为隐节点的个数,g(·)是S型函数,wi(i=1,2,...,n),bi(i=1,2,...,n)分别是第i个隐节点的输入权和偏差。
步骤三所述特征提取模块学习一个变换矩阵,该变换矩阵可将高维基因表达谱数据投影到低维子空间,过程如下:
1.基于自适应的样本近邻表示,自适应学习样本间相似性,模型如下:
这里的Z为表达系数矩阵,Zij表示样本xi与xj的相似程度。Nk(xi)是样本xi的k个近邻样本集合,如果Zij=0。
2.利用流形正则思想,即投影后的样本在新空间中仍保持与原空间中相同的近邻关系,公式如下:
||H(xi)β-H(xj)β||2Zij (3)
这里的H(xi),H(xj)分别是隐藏层关于第i个样本xi(i=1,2,...,n)的输出向量,β∈RL×d是极限学习机输出层输出权重,若d<m,则Hβ可将数据投影到低维子空间。Zij表示原始样本xi与xj的相似程度。
结合公式(2)和(3)得到基于自适应相似度学习的特征提取模型,通过交替迭代方向乘子算法,求得极限学习机输出层输出权重β,β即为投影矩阵,可以用其对原始高维基因表达谱数据进行降维。
步骤四所述数据可视化模块利用前述特征子空间中的数据进行一维和二维数据可视化;
步骤五所述聚类模块在低维特征空间对基因表达谱数据进行识别归类。过程为:利用输出权重矩阵将基因表达数据投影到特征空间,再利用k-means聚类得到类标签。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (8)

1.一种基因表达谱数据的无监督极限学习机特征提取系统,其特征在于,包括数据转换模块、非线性变换模块、特征提取模块、数据可视化模块、聚类分析模块;
所述数据转换模块对原始高维基因表达谱数据进行规范化处理,而后传输给非线性变换模块;
所述非线性变换模块利用随机特征映射对数据进行非线性变换,而后传输给特征提取模块;
所述特征提取模块学习一个变换矩阵,该变换矩阵将高维基因表达谱数据投影到低维子空间;
所述数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
所述聚类分析模块在低维子空间对基因表达谱数据进行识别归类。
2.根据权利要求1所述系统,其特征在于,所述数据转换模块采用二范数进行标准化处理,将原始高维基因表达谱数据转换到同一个量纲范围。
3.根据权利要求1所述系统,其特征在于,所述非线性变换模块计算隐藏层输出矩阵,其方法为:随机产生输入层与隐藏层的连接权值及隐藏层神经元阈值,选择S型函数作为激励函数,对每一个输入样本得到一个隐藏层输出向量。
4.根据权利要求1所述系统,其特征在于,所述特征提取模块学习变换矩阵的方法为:结合数据自适应相似度学习和流形学习思想构造目标函数,通过求解获得变换矩阵。
5.根据权利要求1所述系统,其特征在于,所述聚类分析模块,将投影到低维子空间的基因表达谱数据用k-means进行聚类,利用聚类准确率衡量特征提取的效果。
6.一种基于权利要求1至5任一所述系统的无监督极限学习机特征提取方法,其特征在于,包括如下步骤,
步骤S1、通过数据转换模块对原始高维基因表达谱数据进行规范化处理,该过程采用二范数对每个样本进行规范化处理,使得数据转换到同一个量纲范围;
步骤S2、通过非线性变换模块对经数据转换模块规范化处理后的数据进行非线性变换;
步骤S3、通过特征提取模块将经非线性变换模块变换后的数据投影到低维子空间;
步骤S4、通过数据可视化模块利用所述低维子空间中的数据进行一维和二维数据可视化;
步骤S5、通过聚类分析模块在低维特征空间对基因表达谱数据进行识别归类。
7.根据权利要求6所述的方法,其特征在于,所述步骤S2的具体实现过程如下:
步骤S21、随机产生输入权向量w和隐节点偏差b;
步骤S22、选择S型函数作为激励函数
步骤S23、计算每一个输入样本数据的隐藏层输出矩阵H:
其中,h(xi)=(g(w1,b1,xi),…,g(wL,bL,xi))为隐藏层关于第i个m维样本xi的输出向量,对数据进行非线性变换,期望得到的H矩阵与输出层具有线性关系;L为隐藏层节点个数,g(·)是S型函数,wi(i=1,2,...,n),bi(i=1,2,...,n)分别是第i个隐节点的输入权和偏差。
8.根据权利要求6所述的方法,其特征在于,所述步骤S3的具体实现过程如下:
步骤S31、基于自适应的样本近邻表示,自适应学习样本间相似性,模型如下:
其中,Z为表达系数矩阵,Zij表示样本xi与xj的相似程度;Nk(xi)是样本xi的k个近邻样本集合,如果Zij=0;
步骤S32、利用流形正则思想,即投影后的数据在新空间中仍保持与原空间中相同的近邻关系,公式如下:
||H(xi)β-H(xj)β||2Zij (3)
其中,H(xi),H(xj)分别是隐藏层关于第i个m维样本xi(i=1,2,...,n)的输出向量,β∈RL×d是极限学习机输出层输出权重,若d<m,则Hβ可将数据投影到低维子空间;Zij表示原始样本xi与xj的相似程度;
步骤S33、结合公式(2)和(3)得到特征提取模型,通过交替迭代方向乘子法,求得输出权重β∈RL×d,β即为投影矩阵,当d<m时,可以用H(X)β对原始高维基因表达谱数据X∈Rn×m进行降维,得到d维的投影样本。
CN201810643270.2A 2018-06-21 2018-06-21 基因表达谱数据的无监督极限学习机特征提取系统及方法 Pending CN108920900A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810643270.2A CN108920900A (zh) 2018-06-21 2018-06-21 基因表达谱数据的无监督极限学习机特征提取系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810643270.2A CN108920900A (zh) 2018-06-21 2018-06-21 基因表达谱数据的无监督极限学习机特征提取系统及方法

Publications (1)

Publication Number Publication Date
CN108920900A true CN108920900A (zh) 2018-11-30

Family

ID=64420391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810643270.2A Pending CN108920900A (zh) 2018-06-21 2018-06-21 基因表达谱数据的无监督极限学习机特征提取系统及方法

Country Status (1)

Country Link
CN (1) CN108920900A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033041A (zh) * 2019-04-13 2019-07-19 湖南大学 一种基于深度学习的基因表达谱距离度量方法
CN110648723A (zh) * 2019-09-29 2020-01-03 江苏医健大数据保护与开发有限公司 一种基于云架构平台的基因数据分析方法
CN110718269A (zh) * 2019-09-22 2020-01-21 南京信易达计算技术有限公司 一种生命科学计算容器包系统及方法
CN117349785A (zh) * 2023-08-24 2024-01-05 长江水上交通监测与应急处置中心 一种航运政务信息资源多源数据融合方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463251A (zh) * 2014-12-15 2015-03-25 江苏科技大学 基于集成极端学习机的肿瘤基因表达谱数据识别方法
CN106202969A (zh) * 2016-08-01 2016-12-07 东北大学 一种肿瘤分子分型预测系统
CN107341499A (zh) * 2017-05-26 2017-11-10 昆明理工大学 一种基于无监督分割和elm的织物缺陷检测和分类方法
CN107368707A (zh) * 2017-07-20 2017-11-21 东北大学 基于us‑elm的基因芯片表达数据分析系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463251A (zh) * 2014-12-15 2015-03-25 江苏科技大学 基于集成极端学习机的肿瘤基因表达谱数据识别方法
CN106202969A (zh) * 2016-08-01 2016-12-07 东北大学 一种肿瘤分子分型预测系统
CN107341499A (zh) * 2017-05-26 2017-11-10 昆明理工大学 一种基于无监督分割和elm的织物缺陷检测和分类方法
CN107368707A (zh) * 2017-07-20 2017-11-21 东北大学 基于us‑elm的基因芯片表达数据分析系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
范自柱: "《新型特征抽取算法研究》", 31 December 2016 *
陈晓云等: "基于稀疏和近邻保持的极限学习机降维", 《自动化学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033041A (zh) * 2019-04-13 2019-07-19 湖南大学 一种基于深度学习的基因表达谱距离度量方法
CN110033041B (zh) * 2019-04-13 2022-05-03 湖南大学 一种基于深度学习的基因表达谱距离度量方法
CN110718269A (zh) * 2019-09-22 2020-01-21 南京信易达计算技术有限公司 一种生命科学计算容器包系统及方法
CN110648723A (zh) * 2019-09-29 2020-01-03 江苏医健大数据保护与开发有限公司 一种基于云架构平台的基因数据分析方法
CN117349785A (zh) * 2023-08-24 2024-01-05 长江水上交通监测与应急处置中心 一种航运政务信息资源多源数据融合方法及系统
CN117349785B (zh) * 2023-08-24 2024-04-05 长江水上交通监测与应急处置中心 一种航运政务信息资源多源数据融合方法及系统

Similar Documents

Publication Publication Date Title
CN111191732B (zh) 一种基于全自动学习的目标检测方法
CN108920900A (zh) 基因表达谱数据的无监督极限学习机特征提取系统及方法
CN112232413B (zh) 基于图神经网络与谱聚类的高维数据特征选择方法
CN112132014B (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN113259331A (zh) 一种基于增量学习的未知异常流量在线检测方法及系统
CN116842354A (zh) 基于量子人工水母搜索机制的特征选择方法
CN109493916A (zh) 一种基于稀疏性因子分析的基因-基因交互作用识别方法
CN112926251B (zh) 一种基于机器学习的滑坡位移高精度预测方法
CN109378039A (zh) 基于离散约束和封顶范数的肿瘤基因表达谱数据聚类方法
CN104462817B (zh) 基于蒙特卡洛和非负矩阵因子分解的基因选择和癌症分类方法
KR100895261B1 (ko) 평형기반 서포트 벡터를 이용한 귀납적이고 계층적인군집화 방법
CN109598283A (zh) 一种基于半监督极限学习机的铝电解过热度识别方法
KR20230170680A (ko) 심층 콘볼루션 신경망들을 사용하여 변이체 병원성을 예측하기 위한 다중 채널 단백질 복셀화
CN114595884A (zh) 一种遗传智能优化的神经网络风力发电设备温度预测方法
Saha et al. Unsupervised and supervised learning approaches together for microarray analysis
CN111383710A (zh) 基于粒子群优化双子支持向量机的基因剪接位点识别模型构建方法
CN111814896A (zh) 一种面向多视图特征融合与聚类的联合优化方法
CN113837394B (zh) 多特征视图数据标签预测方法、系统与可读存储介质
TW202024959A (zh) 資料補值與分類方法以及資料補值與分類系統
CN111178391B (zh) 一种使用增量奇异值分解法进行产品行业平行数据集构建的方法
CN116450830B (zh) 一种基于大数据的智慧校园推送方法及系统
CN116844649B (zh) 一种可解释的基于基因选择的细胞数据分析方法
CN114881429B (zh) 基于数据驱动的台区线损量化方法及系统
CN114596913B (zh) 基于深度中心点模型的蛋白质折叠识别方法及系统
CN117171565A (zh) 基于Squared-chord距离的生物信息标签分布学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130

RJ01 Rejection of invention patent application after publication