CN106529680B - 一种基于经验模态分解的多尺度极限学习机集成建模方法 - Google Patents

一种基于经验模态分解的多尺度极限学习机集成建模方法 Download PDF

Info

Publication number
CN106529680B
CN106529680B CN201610922755.6A CN201610922755A CN106529680B CN 106529680 B CN106529680 B CN 106529680B CN 201610922755 A CN201610922755 A CN 201610922755A CN 106529680 B CN106529680 B CN 106529680B
Authority
CN
China
Prior art keywords
learning machine
extreme learning
mode decomposition
imf
empirical mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610922755.6A
Other languages
English (en)
Other versions
CN106529680A (zh
Inventor
卞希慧
第五鹏瑶
张彩霞
郭玉高
谭小耀
庞和亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan sfitek Scientific Instrument Co.,Ltd.
Original Assignee
Tianjin Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Polytechnic University filed Critical Tianjin Polytechnic University
Priority to CN201610922755.6A priority Critical patent/CN106529680B/zh
Publication of CN106529680A publication Critical patent/CN106529680A/zh
Application granted granted Critical
Publication of CN106529680B publication Critical patent/CN106529680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于分析化学领域的化学计量学建模技术,涉及一种基于经验模态分解的多尺度极限学习机集成建模方法。首先,采用KS分组法将样品分为训练集合预测集,其次,将训练集的光谱信号通过经验模态分解被分解为一系列本征模态函数分量IMF和一个剩余项r,然后,对每个IMF及r建立极限学习机子模型;对预测集光谱经过同样的经验模态分解,将得到的子序列代入到子模型中,得到每个子模型的预测结果,将所有预测结果加权平均得到最终预测结果。本发明充分利用了信号的局部信息,可以得到更准确的预测结果。本发明适用于农业、食品、医药、石油以及环境等领域的复杂样品定量分析。

Description

一种基于经验模态分解的多尺度极限学习机集成建模方法
技术领域
本发明属于分析化学领域的化学计量学建模技术,具体涉及一种基于经验模态分解的多尺度极限学习机集成建模方法。
背景技术
光谱分析技术因其快速、无损等优势已广泛地应用于农业、食品、医药、化工、石油以及环境分析等各个领域。然而,由于复杂样品光谱吸收峰重叠严重,存在背景、噪声等干扰信息,因此,需要借助化学计量学才能进行定性定量分析。采用化学计量学对未知样品进行预测时,预测结果的好坏主要依靠于模型的质量,因此,高质量模型的建立一直是化学计量学的重要研究内容。
传统建模方法主要分为线性和非线性两类,其中线性建模方法主要有主成分回归(PCR)、偏最小二乘回归(PLS)等,非线性建模方法主要有支持向量回归(SVR)、人工神经网络(ANN)等。线性建模方法具有参数少、计算速度快等优势,但是对于非线性干扰严重的信号进行建模时性能会下降。非线性建模方法虽然在处理非线性问题时具有其独特优势,但是这类方法也存在需要优化的参数多,建模时间长,容易陷入局部最优等缺陷。极限学习机(ELM)作为一种新兴的建模方法,它结合了线性建模方法和非线性建模方法的优势(Xi-HuiBian,Shu-Juan Li,Meng-Ran Fan,Yu-Gao Guo,Na Chang,Jiang-Jiang Wang,Spectralquantitative analysis of complex samples based on the extreme learningmachine,Analytical Methods,2016,8,4674-4679),在算法执行过程中不需要迭代调整网络的输入权值以及隐含层神经元的偏置,只需要选择激励函数和隐含层节点数,并且能产生唯一的最优解,因此具有学习速度快且泛化性能好的优点。
另一方面,传统建模方法只利用了时间领域的信息建立一个单一的模型,并没有用到频率领域的信息,其预测准确性和泛化性能并不能得到保证。经验模态分解(EMD)方法被认为是2000年来以傅立叶变换为基础的线性和稳态频谱分析的一个重大突破,该方法依据信号自身特征来进行分解,无须预先设定任何基函数。这一点与建立在先验性的谐波基函数和小波基函数上的傅立叶分解方法与小波分解方法具有本质性的差别。由于这些特点,经验模态分解在理论上可以应用于任何类型的信号的分解,因而在处理非平稳及非线性数据上,具有明显优势。所以,经验模态分解一经提出就在不同的工程领域得到了迅速有效的应用,例如在海洋、大气、天体观测资料与地震记录分析、机械故障诊断及大型土木工程结构的模态参数识别等方面。
因此,本发明结合极限学习机及经验模态分解的优势,提出了一种基于经验模态分解的多尺度极限学习机集成建模的方法,充分利用信号的局部特征信息,将原始信号分解为不同频率的信号,对不同频率的信号分别建立极限学习机模型,再将这些模型的结果集成得到最终预测结果。本发明方法既充分利用了信号的局部信息,又提高了模型的预测精度。
发明内容
本发明的目的是针对上述传统建模方法存在的问题,提供一种基于经验模态分解的多尺度极限学习机集成建模方法,具体过程如图1所示。
为实现本发明所提供的技术方案包括以下步骤:
1)收集一定数目的样品,测量其光谱及目标分析物含量。采用KS分组方法,将数据集划分为训练集和预测集。
2)对训练集的光谱信号进行经验模态分解,得到一系列本征模态函数分量IMF1,IMF2,...,IMFt-1及剩余项rt
3)分别对各个IMF及r子系列建立极限学习机子模型。其中极限学习机模型的最佳激励函数和隐含层节点数通过MSR随着激励函数以及隐含层节点数的变化确定,MSR为相关系数均值与标准偏差的比值,MSR值越大说明预测结果越准确。
4)对预测集的光谱信号进行同样的经验模态分解,将得到的子序列分别代入到相应的极限学习机子模型中,得到各个子模型的预测结果。
5)对各个子模型的预测结果进行加权平均得到最终预测值,其中权重为每个极限学习机子模型交叉验证均方根误差8次方的倒数。
对原始信号进行经验模态分解得到一系列本征模态函数和剩余项的具体过程为:首先寻找原始信号所有的极值点,再通过插值获得信号包络线及其均值,计算最初数据和均值的差,分解得到一层信号,若该信号满足本征模态函数的两个条件,即a)在整个信号,极值点个数与过零点个数须相等或最多相差一个,b)在任一点上、下包络线的均值为零,则为最初本征模态函数,否则将其视为最初信号。重复该过程,直到将原始信号分解为有限个本征模态函数分量和剩余项。
附图说明
图1是经验模态分解-极限学习机(EMD-ELM)的原理图。
图2是玉米数据训练集的近红外光谱图。
图3是训练集样品1通过经验模态分解得到的IMF图。
图4是极限学习机的MSR随着激励函数以及隐含层节点数的变化图。
具体实施方式
为更好理解本发明,下面结合实施例对本发明做进一步地详细说明,但是本发明要求保护的范围并不局限于实施例所表示的范围。
实施例:
本实施例是应用于近红外光谱数据分析,对玉米样品中所含蛋白质的含量进行测定。具体的步骤如下:
1)收集玉米样品的红外光谱数据。该数据由三种光谱仪(M5、MP5、MP6)测定的近红外光谱和相应的水分、油、蛋白质及淀粉的含量组成,下载自http://software.eigenvector.com/Data/Corn/corn.mat。本发明采用MP6仪器的光谱,且只对蛋白质含量进行考察。近红外光谱波长范围为1100-2498nm,采样间隔为2nm,共700个波长点。采用KS分组方法,53个样品用作训练集,剩余27个样品用作预测集。其中训练集的近红外光谱如图2所示。
2)对训练集的光谱信号进行经验模态分解,得到2个本征模态函数分量IMF和1个剩余项r,共3个子序列。样品1得到的IMF及r如图3所示,其它样品分解结果类似。
3)分别对上述3个子序列建立极限学习机子模型。其中极限学习机模型的激励函数和最佳隐含层节点数通过MSR随着激励函数以及隐含层节点数的变化确定,MSR为相关系数均值与标准偏差的比值,MSR值越大说明预测结果越精准确。
图4显示了MSR随着激励函数及隐含层节点数的变化,其中MSR最大值对应的激励函数和隐含层节点数分别为sig和19,确定为最佳激励函数和隐含层节点数。
4)对预测集的光谱信号进行同样的经验模态分解,将得到的3个子序列分别代入到相应的极限学习机子模型中,得到各个子模型的预测结果。
5)对各个子模型的预测结果进行加权平均得到最终预测值,其中权重为每个极限学习机子模型交叉验证均方根误差8次方的倒数。
为了验证基于经验模态分解的多尺度极限学习机回归建模方法(EMD-ELM)的优越性,将其与ELM在预测均方根误差(RMSEP)及相关系数(R)等方面进行比较。其中,EMD-ELM的RMSEP及R为0.2825和0.9141,而单独使用ELM的RMSEP和R分别为0.4806和0.7925。因此,EMD-ELM可以明显提高ELM的预测能力。

Claims (3)

1.一种基于经验模态分解的多尺度极限学习机集成建模方法,其特征在于:收集一定数目的样品,测量其光谱及目标分析物含量;采用KS分组方法,将数据集划分为训练集和预测集;对训练集的光谱信号进行经验模态分解得到一系列本征模态函数分量IMF及剩余项r;分别对各个IMF及r建立极限学习机子模型;对预测集的光谱信号进行同样的经验模态分解,将得到的IMF及r分别代入到相应的极限学习机子模型中,得到各个子模型的预测结果;对各个子模型的预测结果进行加权平均得到最终预测值;极限学习机模型的最佳激励函数和隐含层节点数通过MSR随着激励函数以及隐含层节点数的变化确定,MSR为相关系数均值与标准偏差的比值,MSR值越大说明预测结果越准确;MSR最大值对应的激励函数以及隐含层节点数为最佳参数。
2.根据权利要求1所述的一种基于经验模态分解的多尺度极限学习机集成建模方法,其特征在于:加权平均预测的权重为每个极限学习机子模型交叉验证均方根误差8次方的倒数。
3.根据权利要求1所述的一种基于经验模态分解的多尺度极限学习机集成建模方法,其特征在于:对原始信号进行经验模态分解得到一系列IMF和r的具体过程为,首先选择原始信号所有的极值点,再通过插值获得信号包络及其均值,计算原始信号和均值的差,分解得到一层信号,若该信号满足IMF条件,则为最初IMF,否则将其视为原始信号;重复该过程,直到将原始信号分解为有限个IMF和r。
CN201610922755.6A 2016-10-27 2016-10-27 一种基于经验模态分解的多尺度极限学习机集成建模方法 Active CN106529680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610922755.6A CN106529680B (zh) 2016-10-27 2016-10-27 一种基于经验模态分解的多尺度极限学习机集成建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610922755.6A CN106529680B (zh) 2016-10-27 2016-10-27 一种基于经验模态分解的多尺度极限学习机集成建模方法

Publications (2)

Publication Number Publication Date
CN106529680A CN106529680A (zh) 2017-03-22
CN106529680B true CN106529680B (zh) 2019-01-29

Family

ID=58292654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610922755.6A Active CN106529680B (zh) 2016-10-27 2016-10-27 一种基于经验模态分解的多尺度极限学习机集成建模方法

Country Status (1)

Country Link
CN (1) CN106529680B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107271389B (zh) * 2017-06-24 2019-10-11 桂林理工大学 一种基于指标极值的光谱特征变量快速匹配方法
CN108759871B (zh) * 2018-07-03 2021-01-05 哈尔滨工业大学 一种基于改进emd预处理算法的捷联惯性导航系统粗对准方法
CN109743103B (zh) * 2019-02-01 2021-07-27 福州大学 基于elm的fbg传感网络节点故障修复方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400210A (zh) * 2013-08-13 2013-11-20 广西电网公司电力科学研究院 一种短期风速组合预测方法
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
CN104573248A (zh) * 2015-01-16 2015-04-29 东南大学 基于emd的光纤陀螺温度漂移多尺度极限学习机训练方法
CN105117525A (zh) * 2015-07-31 2015-12-02 天津工业大学 Bagging极限学习机集成建模方法
CN105136682A (zh) * 2015-07-06 2015-12-09 天津工业大学 一种燃油中芳烃含量快速、准确测定的新方法
CN105158200A (zh) * 2015-07-16 2015-12-16 天津工业大学 一种提高近红外光谱定性分析准确度的建模方法
CN105205495A (zh) * 2015-09-02 2015-12-30 上海大学 基于emd-elm的非平稳脉动风速预测方法
CN105404939A (zh) * 2015-12-04 2016-03-16 河南许继仪表有限公司 一种短期电力负荷预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160086087A1 (en) * 2014-09-19 2016-03-24 King Fahd University Of Petroleum And Minerals Method for fast prediction of gas composition

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400210A (zh) * 2013-08-13 2013-11-20 广西电网公司电力科学研究院 一种短期风速组合预测方法
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
CN104573248A (zh) * 2015-01-16 2015-04-29 东南大学 基于emd的光纤陀螺温度漂移多尺度极限学习机训练方法
CN105136682A (zh) * 2015-07-06 2015-12-09 天津工业大学 一种燃油中芳烃含量快速、准确测定的新方法
CN105158200A (zh) * 2015-07-16 2015-12-16 天津工业大学 一种提高近红外光谱定性分析准确度的建模方法
CN105117525A (zh) * 2015-07-31 2015-12-02 天津工业大学 Bagging极限学习机集成建模方法
CN105205495A (zh) * 2015-09-02 2015-12-30 上海大学 基于emd-elm的非平稳脉动风速预测方法
CN105404939A (zh) * 2015-12-04 2016-03-16 河南许继仪表有限公司 一种短期电力负荷预测方法

Also Published As

Publication number Publication date
CN106529680A (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
CN108152235B (zh) 一种联合土壤室内外光谱的重金属含量反演方法
He et al. Online updating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy
CN105158200B (zh) 一种提高近红外光谱定性分析准确度的建模方法
CN106529680B (zh) 一种基于经验模态分解的多尺度极限学习机集成建模方法
WO2007129648A1 (ja) 植物葉の水分ストレスを推定する方法、植物葉の水分ストレスを推定するための装置及び植物葉の水分ストレスを推定するためのプログラム
CN110726694A (zh) 光谱变量梯度集成遗传算法的特征波长选择方法和系统
CN113281229B (zh) 一种基于小样本下多模型自适应大气pm2.5浓度预测方法
CN117217419A (zh) 工业生产全生命周期碳排放监测方法及系统
CN105092519A (zh) 基于增量偏最小二乘法的样品成份测定方法
Wang et al. Simultaneous detection of different properties of diesel fuel by near infrared spectroscopy and chemometrics
CN108693139A (zh) 电子烟油理化指标的近红外光谱预测模型建立方法及应用
CN108519347A (zh) 一种基于二进制蜻蜓算法的红外光谱波长选择方法
CN110070004B (zh) 一种应用于深度学习的近地高光谱数据扩展方法
CN106126879B (zh) 一种基于稀疏表示技术的土壤近红外光谱分析预测方法
CN112651173B (zh) 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统
CN114112978A (zh) 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法
Kaneko et al. Discussion on time difference models and intervals of time difference for application of soft sensors
CN105466885A (zh) 基于无测点温度补偿机制的近红外在线测量方法
CN110763830B (zh) 一种水泥熟料游离氧化钙含量预测方法
CN117092059A (zh) 一种基于红外光谱技术的羊绒羊毛成分含量识别方法
CN113295674B (zh) 一种基于s变换的激光诱导击穿光谱特征非线性处理方法
CN108827905A (zh) 一种基于局部加权Lasso的近红外模型在线更新方法
CN114878508A (zh) 一种基于高光谱成像土遗址文物表面含水量检测方法
CN110632024B (zh) 一种基于红外光谱的定量分析方法、装置、设备以及存储介质
CN106872397A (zh) 一种基于已有校正模型快速检测农产品化学组分的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Bian Xihui

Inventor after: Fifth Pengyao

Inventor after: Zhang Caixia

Inventor after: Guo Yugao

Inventor after: Tan Xiaoyao

Inventor after: Pang Heliang

Inventor before: Bian Xihui

Inventor before: Zhang Caixia

Inventor before: Pang Heliang

Inventor before: Guo Yugao

Inventor before: Tan Xiaoyao

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210826

Address after: 621000 Room 301, Mianyang export processing zone, No. 261, east section of Feiyun Avenue, Mianyang high tech Zone, Mianyang City, Sichuan Province

Patentee after: Sichuan sfitek Scientific Instrument Co.,Ltd.

Address before: 300387 No. 399, Binshui West Road, Xiqing District, Tianjin

Patentee before: TIANJIN POLYTECHNIC University