CN103729650A - 近红外光谱建模样本的选择方法 - Google Patents
近红外光谱建模样本的选择方法 Download PDFInfo
- Publication number
- CN103729650A CN103729650A CN201410021094.0A CN201410021094A CN103729650A CN 103729650 A CN103729650 A CN 103729650A CN 201410021094 A CN201410021094 A CN 201410021094A CN 103729650 A CN103729650 A CN 103729650A
- Authority
- CN
- China
- Prior art keywords
- near infrared
- sample
- infrared spectrum
- gasoline
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明涉及一种近红外光谱建模样本的选择方法,在调和过程中,当新的汽油样本的近红外光谱获取后,利用相似距离从已有汽油样本光谱库中选择若干相似样本建立初始训练集;利用主成分分析法对上述训练集降维并确定最佳主成分数,然后利用T2统计的方法剔除奇异点,最后确立训练样本集。训练样本集确定之后,就可以采用适当的建模方法建立近红外模型对汽油样本进行定量分析。由于该发明将Hotelling T2统计量引入了训练样本集的选择中,有效地减少了单纯由相似距离选择样本带来的奇异点,提高了近红外模型的精度与鲁棒性。此外,由于该发明可以实时选择样本建立训练集,给在线建模提供了依据,有利于改变汽油调和过程中近红外模型难以实时更新的现状。
Description
技术领域
本发明涉及在利用近红外光谱在线测定汽油属性过程中,近红外光谱建模样本的选择方法。具体地说,是一种利用统计学方法实时地从样本库中选择样本建立训练集的方法。
背景技术
汽车工业的发展以及节能和环境保护的紧迫性,推动着汽油产品更新换代。为满足新的汽油油品规格,提高产品质量并且减少能耗;各大炼厂广泛采用油品在线调和技术对传统的罐式调和进行升级改造。
汽油辛烷值是度量汽油性质的重要指标,其大小直接影响着车用汽油的品质。在汽油调和过程中以经济合理的方法增加汽油辛烷值将产生巨大的经济效益,人们从原料、催化剂、工艺等方面不断进行探索研究,试图找到提高汽油辛烷值的最佳途径。因此,研究汽油辛烷值的测量方法对汽油的生产和使用都将具有重要意义。
目前,辛烷值标准测定方法ASTM D采用ASTM-CFR辛烷值机台架测定方法,但是ASTM-CFR辛烷值机台架测定方法测试速度慢,不利于现场分析使用;操作和维护费用高,设备费用高,使用过程中需要不断维护;环保性差,测试的样品消耗大,约需500ml汽油样品,测量过程中存在着挥发损失与严重污染。
近红外光谱分析方法具有速度快,精密度高和费用低等优点,已广泛用于测定汽油的辛烷值,并由此产生了很好的社会效益和经济效益。由于近红外分析仪是二次测量仪表,不能够直接测量物质的属性,而是通过对已知样本的光谱与组成或性质的关联,用化学计量学中的多元校正方法建立校正模型,然后根据模型和待测样本的光谱预测待测样本的组成和性质。但是在建立近红外光谱模型的时候需要大量的采样化验,模型的维护成本很高;而且在模型的实际使用过程中由于工况的变化会使模型的性能变差从而需要大量的人力物力来维护模型。在汽油在线调和过程中,如果能够根据工况建立实时模型,就可以提高模型的维护周期,减少维护费用。由于实时模型的建立依赖于实时训练集的确定,如何根据工况实时地从样本库中选择样本组成训练集显得尤为重要。
发明内容
为了解决上述技术问题,本发明提供了一种近红外光谱建模样本的选择方法,该方法根据工业现场的采样光谱数据,利用相似距离从样本库中选择恰当的样本建立初始样本集,并利用采用主成分分析结合T2统计的方法剔除奇异点,确定最终的训练样本集,用以建立近红外模型预测待测汽油样本的属性。
本发明方法提供的近红外光谱建模样本的选择方法包括以下步骤:
步骤一:获取汽油样本的近红外光谱,采用一阶导数对光谱数据进行预处理。利用所获取的汽油样本建立样本库。其中,样本库用于训练样本集的选择。
步骤二:计算待测样本与样本库中所有光谱样本的相似距离(如,欧式距离),根据预设的相似性距离阈值从样本库中选择合适的样本建立初始训练集。
步骤三:采用主成分分析结合Hotelling T2统计的方法剔除步骤二中所得初始训练集中的奇异点,确定训练集。
本发明所述的方法,获取的汽油近红外光谱范围为1000-1600nm。
本发明所述的方法,可以采用在线或离线的方式从样本库中选择样本,组成训练集。
本发明所述的方法的有益效果在于:在汽油在线调和过程中,可以根据工况实时的选择训练集。在调和过程中,当新的汽油近红外光谱获取后,利用相似距离(如,欧式距离)从样本库中选择若干相似样本建立初始训练集;利用主成分分析法对上述训练集降维并确定最佳主成份数,然后利用T2统计的方法剔除奇异点,最后确立训练集样本。训练集样本确定之后,就可以采用适当的建模方法建立近红外模型对汽油样品进行定量分析。由于该发明将Hotelling T2统计量引入了近红外建模样本的选择中,有效的减少了单纯由相似距离选择样本带来的奇异点,提高了模型的精度与鲁棒性。此外,由于该发明可以实时的选择样本建立训练集,给实时建模提供了依据,有利于改变汽油调和过程中近红外模型难以实时更新的现状。
附图说明
图1-1、图1-2是预处理前后汽油近红外光谱谱图。
图2为所选出样本集的T2统计分布图。
图3近红外建模样本的选择方法流程图
具体实施方式
下面结合附图和实施例对本发明做进一步说明。
请参阅图3,为近红外建模样本的选择方法流程图,包括以下步骤:
根据比尔定律(A=εbC,A为吸光度,ε为待测组分的摩尔吸光系数,C为待测组分的浓度)对于确定的ε(对一定波长的光与物质)可以得到C-A的确定线性关系,因此可以建立汽油辛烷值光谱模型
Ron=a1x1+a2x2+...+anxn(xi为每个波长对应的吸光度,ai为回归系数,Ron为研究法辛烷值)
步骤一,本实施例的近红外光谱采用在线近红外分析仪获取,仪器的扫描范围为1000-1600nm,为了减少扫描范围首尾部分仪器不稳定对光谱造成的影响,本实施例使用的光谱范围为1100-1300nm。汽油研究法辛烷值(RON)属性采用ASTM-CFR辛烷值机测定;采用Savitzky-Golay一阶导数对光谱进行预处理。
步骤二,利用步骤一中的方法收集汽油样本,建立样本库。本实施例中样本库中共172组样本。
步骤三,计算待测样本的光谱与样本库中所有样本光谱的欧式距离。
disn:待测样本与样本库中第n个样本的欧式距离
x:为样本库样本的近红外光谱
xq:为待测样本的近红外光谱
m:为变量个数
步骤四,根据设定的阈值,从样本库中选取汽油样本建立初始训练集。本实施例的相似距离设置为1.003。
步骤五,对步骤四中的初始训练集用主成分分析技术提取主成分,对数据降维,并计算所有样本的T2统计量。按照预设的T2阈值剔除奇异点,本实施例的T2阈值为0.35。
步骤六,剔除阈值范围之外的样本点确定训练集样本。
请参阅图1-1,图1-2为是汽油近红外光谱预处理前后的谱图,图1-1为原始近红外谱图,图1-2为一阶微分谱图。原始谱图的基线有着明显的漂移,经过一阶微分处理后谱图的基线漂移完全消除,可见,一阶微分可以较好的对汽油近红外光谱进行基线校正。请参阅图2,为近红外建模样本选择过程中,由相似距离选出的样本点T2统计分布图,由图可见:大部分样本在阈值范围之内,只有少数样本(圆圈标示)的T2统计量超过阈值,可见通过相似距离选择的样本仍然存在奇异点,采用本发明方法,能够有效弥补相似距离法的不足。
本实施例以分析汽油研究法辛烷值(RON)属性为例,但也可以用于汽油其他属性的分析,如:马达法辛烷值,抗爆指数,雷德蒸汽压,硫含量,密度,烯烃含量,芳烃含量,或/和苯含量。
综上所述仅为发明的较佳实施例而已,并非用来限定本发明的实施范围。即凡依本发明申请专利范围的内容所作的等效变化与修饰,都应为本发明的技术范畴。
Claims (5)
1.一种近红外光谱建模样本的选择方法,其特征在于,包括以下步骤:
步骤一:获取汽油样品的近红外光谱,建立样本库;
步骤二:计算待测样本的近红外光谱与样本库中所有光谱样本的相似距离,根据预设的相似性距离阈值从样本库中选择样本建立初始训练集;
步骤三:采用主成分分析结合Hotelling T2统计的方法,计算初始训练集中每个样本的T2统计量,根据预设的T2统计量阈值,剔除步骤二中所得初始训练集中的奇异点,确定训练集。
2.根据权利要求1所述的选择方法,其特征在于,步骤一中的所述近红外光谱波长范围为1000-1600nm。
3.根据权利要求1所述的选择方法,其特征在于,步骤一中的所述近红外光谱采用Savitzky-Golay一阶导数对光谱进行预处理。
4.根据权利要求2所述的选择方法,其特征在于,步骤二中的所述相似距离为欧式距离。
5.根据权利要求1所述的选择方法,其特征在于,步骤三中所述的奇异点剔除方法采用主成分分析结合Hotelling T2统计的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410021094.0A CN103729650A (zh) | 2014-01-17 | 2014-01-17 | 近红外光谱建模样本的选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410021094.0A CN103729650A (zh) | 2014-01-17 | 2014-01-17 | 近红外光谱建模样本的选择方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103729650A true CN103729650A (zh) | 2014-04-16 |
Family
ID=50453714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410021094.0A Pending CN103729650A (zh) | 2014-01-17 | 2014-01-17 | 近红外光谱建模样本的选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103729650A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104155245A (zh) * | 2014-07-31 | 2014-11-19 | 中国科学院自动化研究所 | 一种基于模式识别与谱图映射的油品多类性质的检测方法 |
CN104359556A (zh) * | 2014-11-14 | 2015-02-18 | 武汉大学 | 一种用于宽带光谱成像系统的最优化训练样本选择方法 |
CN104677498A (zh) * | 2015-03-13 | 2015-06-03 | 哈尔滨工程大学 | 一种近红外光谱模型的鲁棒性改善方法 |
CN106248621A (zh) * | 2016-08-31 | 2016-12-21 | 上海创和亿电子科技发展有限公司 | 一种评价方法与系统 |
CN104215601B (zh) * | 2014-07-08 | 2017-01-11 | 南京富岛信息工程有限公司 | 一种基于自动添加虚拟光谱点的油品性质建模方法 |
WO2017045296A1 (zh) * | 2015-09-14 | 2017-03-23 | 上海创和亿电子科技发展有限公司 | 在线近红外样本量确定方法 |
CN107357805A (zh) * | 2017-05-25 | 2017-11-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法、设备及介质 |
CN107703097A (zh) * | 2017-10-20 | 2018-02-16 | 华东理工大学 | 利用衰减全反射探头与近红外光谱仪构建快速预测原油性质的模型的方法及其应用 |
CN107748146A (zh) * | 2017-10-20 | 2018-03-02 | 华东理工大学 | 一种基于近红外光谱检测的原油属性快速预测方法 |
CN108267422A (zh) * | 2017-12-29 | 2018-07-10 | 广州讯动网络科技有限公司 | 基于近红外光谱分析的异常样本剔除法 |
CN111912823A (zh) * | 2020-06-30 | 2020-11-10 | 淮阴工学院 | 一种多成分农药残留荧光检测分析方法 |
CN112560930A (zh) * | 2020-12-09 | 2021-03-26 | 上海海事大学 | 基于生产数据的汽油辛烷值预测方法 |
CN114935548A (zh) * | 2022-07-20 | 2022-08-23 | 联桥网云信息科技(长沙)有限公司 | 一种检测油样多类型指标的一次性操作检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008070036A1 (en) * | 2006-12-01 | 2008-06-12 | Pac, Lp | A method and system for measuring ron and mon values for light distillates |
CN101501479A (zh) * | 2006-08-17 | 2009-08-05 | 宝洁公司 | 唾液分析 |
CN101542509A (zh) * | 2005-10-18 | 2009-09-23 | 霍尼韦尔国际公司 | 用于早期事件检测的系统、方法和计算机程序 |
-
2014
- 2014-01-17 CN CN201410021094.0A patent/CN103729650A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542509A (zh) * | 2005-10-18 | 2009-09-23 | 霍尼韦尔国际公司 | 用于早期事件检测的系统、方法和计算机程序 |
CN101501479A (zh) * | 2006-08-17 | 2009-08-05 | 宝洁公司 | 唾液分析 |
WO2008070036A1 (en) * | 2006-12-01 | 2008-06-12 | Pac, Lp | A method and system for measuring ron and mon values for light distillates |
Non-Patent Citations (1)
Title |
---|
张其可: "基于近红外光谱的汽油牌号识别与辛烷值测定", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104215601B (zh) * | 2014-07-08 | 2017-01-11 | 南京富岛信息工程有限公司 | 一种基于自动添加虚拟光谱点的油品性质建模方法 |
CN104155245B (zh) * | 2014-07-31 | 2016-06-29 | 中国科学院自动化研究所 | 一种基于模式识别与谱图映射的油品多类性质的检测方法 |
CN104155245A (zh) * | 2014-07-31 | 2014-11-19 | 中国科学院自动化研究所 | 一种基于模式识别与谱图映射的油品多类性质的检测方法 |
CN104359556A (zh) * | 2014-11-14 | 2015-02-18 | 武汉大学 | 一种用于宽带光谱成像系统的最优化训练样本选择方法 |
CN104359556B (zh) * | 2014-11-14 | 2016-03-16 | 武汉大学 | 一种用于宽带光谱成像系统的最优化训练样本选择方法 |
CN104677498A (zh) * | 2015-03-13 | 2015-06-03 | 哈尔滨工程大学 | 一种近红外光谱模型的鲁棒性改善方法 |
WO2017045296A1 (zh) * | 2015-09-14 | 2017-03-23 | 上海创和亿电子科技发展有限公司 | 在线近红外样本量确定方法 |
CN106248621B (zh) * | 2016-08-31 | 2019-04-02 | 上海创和亿电子科技发展有限公司 | 一种评价方法与系统 |
CN106248621A (zh) * | 2016-08-31 | 2016-12-21 | 上海创和亿电子科技发展有限公司 | 一种评价方法与系统 |
CN107357805A (zh) * | 2017-05-25 | 2017-11-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法、设备及介质 |
CN107357805B (zh) * | 2017-05-25 | 2020-07-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法及装置 |
CN107748146A (zh) * | 2017-10-20 | 2018-03-02 | 华东理工大学 | 一种基于近红外光谱检测的原油属性快速预测方法 |
CN107703097A (zh) * | 2017-10-20 | 2018-02-16 | 华东理工大学 | 利用衰减全反射探头与近红外光谱仪构建快速预测原油性质的模型的方法及其应用 |
CN107703097B (zh) * | 2017-10-20 | 2020-09-04 | 华东理工大学 | 利用近红外光谱仪构建快速预测原油性质的模型的方法 |
CN108267422A (zh) * | 2017-12-29 | 2018-07-10 | 广州讯动网络科技有限公司 | 基于近红外光谱分析的异常样本剔除法 |
CN108267422B (zh) * | 2017-12-29 | 2021-01-12 | 广州讯动网络科技有限公司 | 基于近红外光谱分析的异常样本剔除法 |
CN111912823A (zh) * | 2020-06-30 | 2020-11-10 | 淮阴工学院 | 一种多成分农药残留荧光检测分析方法 |
CN112560930A (zh) * | 2020-12-09 | 2021-03-26 | 上海海事大学 | 基于生产数据的汽油辛烷值预测方法 |
CN112560930B (zh) * | 2020-12-09 | 2024-01-19 | 上海海事大学 | 基于生产数据的汽油辛烷值预测方法 |
CN114935548A (zh) * | 2022-07-20 | 2022-08-23 | 联桥网云信息科技(长沙)有限公司 | 一种检测油样多类型指标的一次性操作检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103729650A (zh) | 近红外光谱建模样本的选择方法 | |
CN104990894B (zh) | 一种基于加权吸光度及相似样本的汽油性质检测方法 | |
CN102778442B (zh) | 一种快速鉴别烟用香液料液种类的方法 | |
CN106932378A (zh) | 一种基于拉曼光谱的炼厂酸性气成分的在线检测系统和方法 | |
WO2020133944A1 (zh) | 水质指标预测模型构建方法及水质指标监测方法 | |
MX2007003004A (es) | Metodo para hacer un ensayo a una corriente de alimentacion que contiene hidrocarburos. | |
CN101929951A (zh) | 一种牛奶中掺羊奶的近红外光谱判别方法 | |
CN107817223A (zh) | 快速无损实时预测原油性质模型的构建方法及其应用 | |
CN105334184A (zh) | 一种在线近红外光谱分析仪 | |
CN101339150B (zh) | 基于介电谱技术测定汽油辛烷值的方法 | |
CN107703097A (zh) | 利用衰减全反射探头与近红外光谱仪构建快速预测原油性质的模型的方法及其应用 | |
CN108760789A (zh) | 一种原油快评方法 | |
CN104777149A (zh) | 一种基于拉曼光谱的苯中微量甲苯含量的快速测定方法 | |
CN107860743A (zh) | 利用反射式近红外光纤探头构建快速预测原油性质的模型的方法及其应用 | |
CN105044025A (zh) | 一种近红外快速识别芝麻油及芝麻油中掺杂大豆油的方法 | |
CN102306236B (zh) | 基于角度度量的多变量分析方法 | |
CN105548027A (zh) | 基于近红外光谱测定调和油中茶油含量的分析模型及方法 | |
Wang et al. | Simultaneous detection of different properties of diesel fuel by near infrared spectroscopy and chemometrics | |
CN103115889A (zh) | 由透射红外光谱预测原油硫含量的方法 | |
CN102338743B (zh) | 一种识别发动机燃料种类和牌号中红外光谱方法 | |
CN106525755A (zh) | 基于近红外光谱技术的油砂pH值测试方法 | |
CN107462524A (zh) | 沥青多种性质快速分析仪 | |
CN109001182B (zh) | 封闭容器中酒精含量的拉曼光谱无损测定方法 | |
CN102954946A (zh) | 由红外光谱测定原油硫含量的方法 | |
CN105319179A (zh) | 一种利用中红外光谱预测脱硫胺液中硫化氢含量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140416 |