CN103838974A - 一种基于elm与图正则化的数据表示方法 - Google Patents

一种基于elm与图正则化的数据表示方法 Download PDF

Info

Publication number
CN103838974A
CN103838974A CN201410099958.0A CN201410099958A CN103838974A CN 103838974 A CN103838974 A CN 103838974A CN 201410099958 A CN201410099958 A CN 201410099958A CN 103838974 A CN103838974 A CN 103838974A
Authority
CN
China
Prior art keywords
elm
data set
raw data
regularization
gnmf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410099958.0A
Other languages
English (en)
Inventor
蒋云良
刘勇
曾智勇
张雄涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN201410099958.0A priority Critical patent/CN103838974A/zh
Publication of CN103838974A publication Critical patent/CN103838974A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种基于ELM与图正则化的数据表示方法,包括计算原始数据集的最近邻图,用ELM特征投影将D维原始数据集转换成L维原始数据集,生成初始化非负矩阵,对于每个i,j进行迭代更新,直到收敛即err<ε,或者,或达到最大迭代次数Max。本发明中的GNMF通过植入一个几何正则化矩阵,可以发掘数据空间中的固有几何性质和识别数据空间中的结构,它比原始NMF方法更强大,同时将ELM特征映射和GNMF相结合的方法能在获得效率的同时,保持泛化性能,在处理高维数据时,EFM GNMF的效率比直接使用NMF或GNMF更高。与EFM NMF效率没有保持泛化性能不同,EFM GNMF可以达到类似GNMF的结果。

Description

一种基于ELM与图正则化的数据表示方法
【技术领域】
本发明涉及数据表示方法的技术领域,特别是基于ELM与图正则化的数据表示方法的技术领域。
【背景技术】
非负矩阵分解(NMF)是一个功能强大的数据表示方法,已应用于许多应用程序集群等。然而这一过程NMF需要巨大的计算成本,特别是当数据的维度大。因此一个以ELM特征映射为基础的NMF被提出,NMF与极限学习机(ELM)特征映射结合,可以减少NMF的计算。然而,基于随机参数生成的ELM特征映射是非线性映射,这将降低无约束NMF所生成的子空间的数据能力表示。为了解决这个问题问题,我们提出一个新方法EFM GNMF结合榆树特性与图映射正规化的非负矩阵分解(GNMF)。
【发明内容】
本发明的目的就是解决现有技术中的问题,提出一种基于ELM与图正则化的数据表示方法,可以发掘数据空间中的固有几何性质和识别数据空间中的结构,它比原始NMF方法更强大,同时将ELM特征映射和GNMF相结合的方法能在获得效率的同时,保持泛化性能。
为实现上述目的,本发明提出了一种基于ELM与图正则化的数据表示方法,依次包括以下步骤:
a)计算原始数据集的最近邻图,即权重矩阵W;
b)用ELM特征投影h(x)=[h1(x),…,hi(x),…,hL(x)]T将原始数据集投影到ELM特征空间,将D维原始数据集转换成L维原始数据集,
Figure BDA0000478337230000021
X表示D维原始数据集,H表示L维原始数据集,M表示数据集中样本的个数;
c)生成初始化非负矩阵
Figure BDA0000478337230000022
Figure BDA0000478337230000023
d)用G作为ELM特征空间数据的最近邻图权重矩阵,P是一个对角矩阵,它的元素是G行向量的和,即Pjj=ΣlGjl
e)对于每个i,j进行迭代更新,直到收敛即err<ε,或者,或达到最大迭代次数Max:
e1 U ij t + 1 ← U ij t ( HV T ) ij ( U t VV T ) ij ;
e2) V ij t + 1 ← V ij t ( H T U + λGV T ) ij ( ( U T UV t ) T + λPV T ) ij ;
e3) err ← max { | | U t + 1 - U t | | LK , | | v t + 1 - v t | | KM } ;
所述λ表示正则化参数,λ≥0,K表示数据集矩阵分解后的维数,ε表示阀值,ε>0。
作为优选,步骤a)中的原始数据集假设有M个样本(xi,ti),xi=[xi1,xi2,...xid]T∈Rd,ti=[ti1,ti2,...,tiK]T∈RK,标准SLFNs拥有L个隐藏节点,h(x)为激活函数,则原始数据集的数学模型可以表示为: Σ i = 1 L β i h i ( x j ) = Σ i = 1 L β i h i ( w i · x j + b i ) , 其中j=1,2……M,wi=[wi1,wi2,...,wid]T,是第i个隐藏节点和输入节点间的权重向量,βi=[βi1,...,βiK]T是输出节点域第i个隐藏节点间的权重向量,bi是第i个隐藏节点的阈值。
作为优选,所述步骤b)中ELM特征映射可以描述为:h(xi)=[h1(xi),…,hi(xi),…,hL(xi)]T
=[G(a1,b1,xi),…G(ai,bi,xi),…,G(aL,bL,xi)]T,其中G(ai,bi,xi)是第i个隐藏节点的输出。
作为优选,所述参数
Figure BDA0000478337230000028
可以用任意连续分布概率随机生成,并且不需要进行修剪。
作为优选,所述原始数据集中的隐藏层节点数小于原始数据集的样本数量。
本发明的有益效果:本发明中的GNMF通过植入一个几何正则化矩阵,可以发掘数据空间中的固有几何性质和识别数据空间中的结构,它比原始NMF方法更强大,同时将ELM特征映射和GNMF相结合的方法能在获得效率的同时,保持泛化性能,在处理高维数据时,EFM GNMF的效率比直接使用NMF或GNMF更高。与EFM NMF效率没有保持泛化性能不同,EFM GNMF可以达到类似GNMF的结果。此外,ELM特征映射可以近似保持隐藏在原始数据中的几何结构。
【具体实施方式】
本发明一种基于ELM与图正则化的数据表示方法,依次包括以下步骤:
a)计算原始数据集的最近邻图,即权重矩阵W;
b)用ELM特征投影h(x)=[h1(x),…,hi(x),…,hL(x)]T将原始数据集投影到ELM特征空间,将D维原始数据集转换成L维原始数据集,X表示D维原始数据集,H表示L维原始数据集,M表示数据集中样本的个数;
c)生成初始化非负矩阵
Figure BDA0000478337230000032
Figure BDA0000478337230000033
d)用G作为ELM特征空间数据的最近邻图权重矩阵,P是一个对角矩阵,它的元素是G行向量的和,即Pjj=ΣlGjl
e)对于每个i,j进行迭代更新,直到收敛即err<ε,或者,或达到最大迭代次数Max:
e1) U ij t + 1 ← U ij t ( HV T ) ij ( U t VV T ) ij ;
e2) V ij t + 1 ← V ij t ( H T U + λGV T ) ij ( ( U T UV t ) T + λPV T ) ij ;
e3) err ← max { | | U t + 1 - U t | | LK , | | v t + 1 - v t | | KM } ;
所述λ表示正则化参数,λ≥0,K表示数据集矩阵分解后的维数,ε表示阀值,ε>0,所述步骤a)中的原始数据集假设有M个样本(xi,ti),xi=[xi1,xi2,...xid]T∈Rd,ti=[ti1,ti2,...,tiK]T∈RK,标准SLFNs拥有L个隐藏节点,h(x)为激活函数,则原始数据集的数学模型可以表示为: Σ i = 1 L β i h i ( x j ) = Σ i = 1 L β i h i ( w i · x j + b i ) , 其中j=1,2……M,wi=[wi1,wi2,...,wid]T,是第i个隐藏节点和输入节点间的权重向量,βi=[βi1,...,βiK]T是输出节点域第i个隐藏节点间的权重向量,bi是第i个隐藏节点的阈值,所述步骤b)中ELM特征映射可以描述为:h(xi)=[h1(xi),...,hi(xi),...,hL(xi)]T
=[G(a1,a1,b1,xi),…G(ai,bi,xi),…,G(aLbL,xi)]T,其中G(ai,bi,xi)是第i个隐藏节点的输出,所述参数
Figure BDA0000478337230000042
可以用任意连续分布概率随机生成,并且不需要进行修剪,所述原始数据集中的隐藏层节点数小于原始数据集的样本数量。
本发明中的GNMF通过植入一个几何正则化矩阵,可以发掘数据空间中的固有几何性质和识别数据空间中的结构,它比原始NMF方法更强大,同时将ELM特征映射和GNMF相结合的方法能在获得效率的同时,保持泛化性能,在处理高维数据时,EFM GNMF的效率比直接使用NMF或GNMF更高。与EFMNMF效率没有保持泛化性能不同,EFM GNMF可以达到类似GNMF的结果。此外,ELM特征映射可以近似保持隐藏在原始数据中的几何结构。
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。

Claims (5)

1.一种基于ELM与图正则化的数据表示方法,其特征在于:依次包括以下步骤:
a)计算原始数据集的最近邻图,即权重矩阵W;
b)用ELM特征投影h(x)=[h1(x),…,hi(x),…,hL(x)]T将原始数据集投影到ELM特征空间,将D维原始数据集转换成L维原始数据集,
Figure FDA0000478337220000011
X表示D维原始数据集,H表示L维原始数据集,M表示数据集中样本的个数;
c)生成初始化非负矩阵
Figure FDA0000478337220000012
Figure FDA0000478337220000013
d)用G作为ELM特征空间数据的最近邻图权重矩阵,P是一个对角矩阵,P的元素是G行向量的和,即Pjj=ΣlGjl
e)对于每个i,j进行迭代更新,直到收敛即err<ε,或达到最大迭代次数Max:
e1) U ij t + 1 ← U ij t ( HV T ) ij ( U t VV T ) ij ;
e2) V ij t + 1 ← V ij t ( H T U + λGV T ) ij ( ( U T UV t ) T + λPV T ) ij ;
e3) err ← max { | | U t + 1 - U t | | LK , | | v t + 1 - v t | | KM } ;
所述λ表示正则化参数,λ≥0,K表示数据集矩阵分解后的维数,ε表示阀值,ε>0。
2.如权利要求1所述的一种基于ELM与图正则化的数据表示方法,其特征在于:所述步骤a)中的原始数据集假设有M个样本(xi,ti),xi=[xi1,xi2,...,xid]T∈Rd,ti=[ti1,ti2,...,tiK]T∈RK,标准SLFNs拥有L个隐藏节点,h(x)为激活函数,则原始数据集的数学模型可以表示为: Σ i = 1 L β i h i ( x j ) = Σ i = 1 L β i h i ( w i · x j + b i ) , 其中j=1,2……M,wi=[wi1,wi2,...,wid]T,是第i个隐藏节点和输入节点间的权重向量,βi=[βi1,...,βiK]T是输出节点域第i个隐藏节点间的权重向量,bi是第i个隐藏节点的阈值。
3.如权利要求1所述的一种基于ELM与图正则化的数据表示方法,其特征在于:所述步骤b)中ELM特征映射可以描述为:h(xi)=[h1(xi),…,hi(xi),…,hL(xi)]T
=[G(a1,b1,xi),…G(ai,bi,xi),…,G(aL,bL,xi)]T,其中G(ai,bi,xi)是第i个隐藏节点的输出。
4.如权利要求3所述的一种基于ELM与图正则化的数据表示方法,其特征在于:所述参数可以用任意连续分布概率随机生成,并且不需要进行修剪。
5.如权利要求1至4中任一项所述的一种基于ELM与图正则化的数据表示方法,其特征在于:所述原始数据集中的隐藏层节点数小于原始数据集的样本数量。
CN201410099958.0A 2014-03-18 2014-03-18 一种基于elm与图正则化的数据表示方法 Pending CN103838974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410099958.0A CN103838974A (zh) 2014-03-18 2014-03-18 一种基于elm与图正则化的数据表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410099958.0A CN103838974A (zh) 2014-03-18 2014-03-18 一种基于elm与图正则化的数据表示方法

Publications (1)

Publication Number Publication Date
CN103838974A true CN103838974A (zh) 2014-06-04

Family

ID=50802462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410099958.0A Pending CN103838974A (zh) 2014-03-18 2014-03-18 一种基于elm与图正则化的数据表示方法

Country Status (1)

Country Link
CN (1) CN103838974A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020017A (zh) * 2012-12-05 2013-04-03 湖州师范学院 一种流行正则和鉴别信息最大化的非负矩阵分解方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020017A (zh) * 2012-12-05 2013-04-03 湖州师范学院 一种流行正则和鉴别信息最大化的非负矩阵分解方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DENG CAI ET AL.: "Graph regularized nonnegative matrix factorization for data representation", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
GUANG-BIN HUANG ET AL.: "Extreme learning machine:Theory and applications", 《NEUROCOMPUTING》 *
ZHIYONG ZENG ET AL.: "Efficient data representation combining with ELM and GNMF", 《EXTREME LEARNING MACHINES 2013:ALGORITHMS AND APPLICATIONS》 *
杜世强等: "基于图正则化的半监督非负矩阵分解", 《计算机工程与应用》 *

Similar Documents

Publication Publication Date Title
CN110059878B (zh) 基于cnn lstm光伏发电功率预测模型及其构建方法
Prasad et al. Designing a multi-stage multivariate empirical mode decomposition coupled with ant colony optimization and random forest model to forecast monthly solar radiation
CN108805188B (zh) 一种基于特征重标定生成对抗网络的图像分类方法
Maatallah et al. Recursive wind speed forecasting based on Hammerstein Auto-Regressive model
EP3161527B1 (en) Solar power forecasting using mixture of probabilistic principal component analyzers
Vergari et al. Simplifying, regularizing and strengthening sum-product network structure learning
CN108614992B (zh) 一种高光谱遥感图像的分类方法、设备及存储设备
Zhao et al. A self-organizing forecast of day-ahead wind speed: Selective ensemble strategy based on numerical weather predictions
US20130336540A1 (en) Decomposition apparatus and method for refining composition of mixed pixels in remote sensing images
CN109412161B (zh) 一种电力系统概率潮流计算方法及系统
CN110765582B (zh) 基于马尔可夫链的自组织中心K-means微电网场景划分方法
CN104462196A (zh) 多特征联合哈希信息检索方法
CN114091615B (zh) 一种基于生成对抗网络的电能计量数据补全方法和系统
Dong et al. Short-term wind speed time series forecasting based on a hybrid method with multiple objective optimization for non-convex target
CN116307212B (zh) 一种空气质量预测方法及系统
Park et al. Bayesian manifold learning: the locally linear latent variable model (LL-LVM)
Zhang et al. A novel ensemble method for residential electricity demand forecasting based on a novel sample simulation strategy
CN116565863A (zh) 一种基于时空相关性的短期光伏出力预测方法
Chidean et al. Spatio-temporal analysis of wind resource in the Iberian Peninsula with data-coupled clustering
CN105551005A (zh) 耦合了梯度保真项的总变差模型快速图像复原方法
CN103279672A (zh) 基于噪声模型支持向量回归技术的短期风速预报方法
CN111798037A (zh) 一种基于堆叠式极限学习机框架的数据驱动最优潮流计算方法
Peng et al. Robust sparse nonnegative matrix factorization based on maximum correntropy criterion
CN111062888B (zh) 一种基于多目标低秩稀疏及空谱全变分的高光谱影像去噪方法
CN108460501B (zh) 一种基于组合模型的风力电站输出功率预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604