CN113791062A - 一种基于拉曼光谱判断固定物质类别的方法 - Google Patents
一种基于拉曼光谱判断固定物质类别的方法 Download PDFInfo
- Publication number
- CN113791062A CN113791062A CN202111119042.3A CN202111119042A CN113791062A CN 113791062 A CN113791062 A CN 113791062A CN 202111119042 A CN202111119042 A CN 202111119042A CN 113791062 A CN113791062 A CN 113791062A
- Authority
- CN
- China
- Prior art keywords
- data
- fixed
- substance
- fixed substance
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Abstract
一种基于拉曼光谱判断固定物质类别的方法,其具体步骤如下:S1.样品光谱的采集:在暗室中,采用激光输出功率为200mW,积分时间为15S的手持拉曼光谱仪对待检测固定物质任意选取3个位置进行测量,每个位置重复测量8次;S2:数据的预处理:采集后的数据进行基线校正,并对数据进行归一化处理,获得待检测固定物质的归一化拉曼光谱;S3:对获得的归一化拉曼光谱原始数据进行用主成分分析,以主成分分析的得分来代替光谱数据进行计算,得到样品的特征矩阵,先建立马氏距离判别模型,然后对马氏距离判别模型进行分析,采取最小分类判别进行固定物质的类别区分;S4:在分类过程中以固定物质的拉曼光谱数据作为样品库,建立训练集与判别函数,判别其属于哪一类。
Description
技术领域
本发明涉及拉曼光谱应用领域,具体涉及一种基于拉曼光谱判断固定物质类别的方法。
背景技术
近年来,现代检测技术开始被应用于固定物质类别的研究中,固定物质的光谱特性也引起了研究人员的关注。伏修锋等利用质子激发X射线荧光技术、X射线衍射、扫描电子显微镜等对不同类别的固定物质进行检测,分析了它们的成分和微观结构;罗泽敏等通过激光剥蚀电感耦合等离子体光谱技术对不同类别的固定物质中的微量元素含量进行检测,发现微量元素含量具有一定差异;有的利用激光诱导击穿光谱技术分别对不同类别的白玉和固定物质进行光谱测量,并结合模式识别方法进行鉴别。但上述对测量方法都属于有损或微损测量。
发明内容
为了解决上述问题,本发明提供了一种基于拉曼光谱判断固定物质类别的方法:
一种基于拉曼光谱判断固定物质类别的方法,其具体步骤如下:
S1.样品光谱的采集:在暗室中,采用激光输出功率为200mW,积分时间为15S的手持拉曼光谱仪对待检测固定物质任意选取3个位置进行测量,每个位置重复测量8次;样品光谱在暗室中采集可以有效避免散光对结果产生影响,以保证测量结果的准确性。
S2:数据的预处理:采集后的数据采用改进的5阶多项式拟合方法进行基线校正,采用Savitzky-Golay卷积平滑法对信号进行滤波,窗口宽度选为7,并对数据进行归一化处理,获得待检测固定物质的归一化拉曼光谱;
S3:对获得的归一化拉曼光谱原始数据进行用主成分分析,以主成分分析的得分来代替光谱数据进行计算,得到待检测固定物质的特征矩阵,先建立马氏距离判别模型,然后对马氏距离判别模型进行分析,以马氏距离最接近为依据,采取最小分类判别进行固定物质的类别区分;
S4:在分类过程中以原有固定物质的拉曼光谱数据作为样品库,建立训练集与判别函数,通过机器学习过程分析固定物质的拉曼光谱的数据特征,判别待检测固定物质其属于哪一类
优选的,所述马氏距离判别模型的分析步骤为:将不同类别的固定物质训练集数据设定为3组,计算其均值中心化的光谱矩阵;再将预测集数据代入MATLAB模型,计算样品数据与3类的马氏距离,以最小距离作为判据,判定预测集的种类归属,将多组预测集数据代入模型进行判定。
优选的,S4中对训练集数据中的每种固定物质设定一个类别,并赋予其特征值,以随机的方法建立决策树进行训练,建立决策树个数与错误率之间的关系。
优选的,S4中设定第一类固定物质的特征值为0,第二类固定物质的特征值为1,第三类固定物质的特征值为-1。
优选的,当决策树个数为600时,错误率较低,且保持稳定,因此本申请选取600个决策树建立模型将24组预测集数据代入MATLAB模型进行判断,模型输出判断数据所属的特征值。将预测集数据代入随机森林判别模型进行鉴别。
有益效果:本申请可以利用便携式拉曼光谱仪,采集样品的拉曼光谱特征,并对其光谱差异进行解析;基于马氏距离判别方法和随机森林双重叠加判别方法实现了不同类别固定物质的无损鉴别,并且本申请的鉴别准确率可达到95.83%。
附图说明
图1为马氏距离模型的验证结果。
图2为决策树个数与错误率的关系。
图3为随机森林模型的验证结果。
具体实施方式
下面结合附图1-3与实施例对本发明进行进一步说明。
实施例:一种基于拉曼光谱判断固定物质类别的方法,其具体步骤如下:
S1.样品光谱的采集:在暗室中,采用激光输出功率为200mW,积分时间为15S的手持拉曼光谱仪对待检测固定物质任意选取3个位置进行测量,每个位置重复测量8次;样品光谱在暗室中采集可以有效避免散光对结果产生影响,以保证测量结果的准确性。所述手持拉曼光谱仪为深圳网联光仪科技有限公司生产的PSR7855手持拉曼光谱仪。
S2:数据的预处理:采集后的数据采用改进的5阶多项式拟合方法进行基线校正,采用Savitzky-Golay卷积平滑法对信号进行滤波,窗口宽度选为7,并对数据进行归一化处理,获得待检测固定物质的归一化拉曼光谱。
S3:对获得的归一化拉曼光谱原始数据进行用主成分分析,以主成分分析的得分来代替光谱数据进行计算,得到待检测固定物质的特征矩阵,先建立马氏距离判别模型,然后对马氏距离判别模型进行分析,以马氏距离最接近为依据,采取最小分类判别进行固定物质的类别区分;所述马氏距离判别模型的分析步骤为:将不同类别的固定物质训练集数据设定为3组,计算其均值中心化的光谱矩阵;再将预测集数据代入MATLAB模型,计算样品数据与3类的马氏距离,以最小距离作为判据,判定预测集的种类归属,将多组预测集数据代入模型进行判定。
S4:在分类过程中以原有固定物质的拉曼光谱数据作为样品库,建立训练集与判别函数,通过机器学习过程分析固定物质的拉曼光谱的数据特征,判别待检测固定物质其属于哪一类。对训练集数据中的每种固定物质设定一个类别,并赋予其特征值,设定第一类固定物质的特征值为0,第二类固定物质的特征值为1,第三类固定物质的特征值为-1。以随机的方法建立决策树进行训练,建立决策树个数与错误率之间的关系。当决策树个数为600时,错误率较低,且保持稳定,因此本申请选取600个决策树建立模型将24组预测集数据代入MATLAB模型进行判断,模型输出判断数据所属的特征值。将预测集数据代入随机森林判别模型进行鉴别。
本申请可以利用便携式拉曼光谱仪,采集样品的拉曼光谱特征,并对其光谱差异进行解析;基于马氏距离判别方法和随机森林判别方法实现了不同类别固定物质的无损鉴别,并且本申请的鉴别准确率可达到95.83%。
由图1可知,马氏距离判别模型的分析鉴别准确率为87.5%,其中第一类固定物质样品的预测准确率为80%,第二类固定物质的预测准确率为100%,第三类固定物质的预测准确率为85.7%。
由图2-3分析可知,将预测集数据代入随机森林判别模型进行鉴别鉴别准确率可达到95.83%,其中第一类固定物质样品的预测准确率为100%,第二类固定物质的预测准确率为100%,第三类固定物质的预测准确率为92.9%。
以上实施例中,第一类为甘肃玉石;第二类固定物质为青海玉石;第三类固定物质为新疆玉石。
显然,本发明的上述实施例仅仅是为了说明本发明所作的举例,而并非对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷例。而这些属于本发明的实质精神所引申出的显而易见的变化或变动仍属于本发明的保护范围。
Claims (5)
1.一种基于拉曼光谱判断固定物质类别的方法,其具体步骤如下:
S1.样品光谱的采集:在暗室中,采用激光输出功率为200mW,积分时间为15S的手持拉曼光谱仪对待检测固定物质任意选取3个位置进行测量,每个位置重复测量8次;
S2:数据的预处理:采集后的数据采用改进的5阶多项式拟合方法进行基线校正,采用Savitzky-Golay卷积平滑法对信号进行滤波,窗口宽度选为7,并对数据进行归一化处理,获得待检测固定物质的归一化拉曼光谱;
S3:对获得的归一化拉曼光谱原始数据进行用主成分分析,以主成分分析的得分来代替光谱数据进行计算,得到待检测固定物质的特征矩阵,先建立马氏距离判别模型,然后对马氏距离判别模型进行分析,以马氏距离最接近为依据,采取最小分类判别进行固定物质的类别区分;
S4:在分类过程中以原有固定物质的拉曼光谱数据作为样品库,建立训练集与判别函数,通过机器学习过程分析固定物质的拉曼光谱的数据特征,判别待检测固定物质其属于哪一类。
2.根据权利要求1所述的一种基于拉曼光谱判断固定物质类别的方法,其特征在于:所述马氏距离判别模型的分析步骤为:将不同类别的固定物质训练集数据设定为3组,计算其均值中心化的光谱矩阵;再将预测集数据代入MATLAB模型,计算样品数据与3类的马氏距离,以最小距离作为判据,判定预测集的种类归属,将多组预测集数据代入模型进行判定。
3.根据权利要求1所述的一种基于拉曼光谱判断固定物质类别的方法,其特征在于:S4中对训练集数据中的每种固定物质设定一个类别,并赋予其特征值,以随机的方法建立决策树进行训练,建立决策树个数与错误率之间的关系。
4.根据权利要求3所述的一种基于拉曼光谱判断固定物质类别的方法,其特征在于:其特征值设定为第一类固定物质的特征值为0,第二类固定物质的特征值为1,第三类固定物质的特征值为-1。
5.根据权利要求4所述的一种基于拉曼光谱判断固定物质类别的方法,其特征在于:当决策树个数为600时,本申请选取600个决策树建立模型将24组预测集数据代入MATLAB模型进行判断,模型输出判断数据所属的特征值,将预测集数据代入随机森林判别模型进行鉴别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111119042.3A CN113791062A (zh) | 2021-09-17 | 2021-09-17 | 一种基于拉曼光谱判断固定物质类别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111119042.3A CN113791062A (zh) | 2021-09-17 | 2021-09-17 | 一种基于拉曼光谱判断固定物质类别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113791062A true CN113791062A (zh) | 2021-12-14 |
Family
ID=78879319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111119042.3A Pending CN113791062A (zh) | 2021-09-17 | 2021-09-17 | 一种基于拉曼光谱判断固定物质类别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113791062A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114951047A (zh) * | 2022-05-26 | 2022-08-30 | 河海大学 | 基于光纤传感器的振动送料中通用型智能分选方法 |
-
2021
- 2021-09-17 CN CN202111119042.3A patent/CN113791062A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114951047A (zh) * | 2022-05-26 | 2022-08-30 | 河海大学 | 基于光纤传感器的振动送料中通用型智能分选方法 |
CN114951047B (zh) * | 2022-05-26 | 2023-08-22 | 河海大学 | 基于光纤传感器的振动送料中通用型智能分选方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108844941B (zh) | 一种基于拉曼光谱和pca-hca的不同品位磷矿的鉴别和分类方法 | |
US10718713B2 (en) | Unknown sample determining method, unknown sample determining instrument, and unknown sample determining program | |
CN103487411A (zh) | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 | |
CN108240978B (zh) | 基于拉曼光谱的自学习式定性分析方法 | |
CN112466399B (zh) | 一种通过机器学习算法预测化学品致突变性的方法 | |
CN116030310A (zh) | 一种基于激光诱导击穿光谱技术的样品分类方法及系统 | |
CN113008865A (zh) | 珠宝玉石鉴定方法、装置、介质及设备 | |
CN113791062A (zh) | 一种基于拉曼光谱判断固定物质类别的方法 | |
CN111259929A (zh) | 基于随机森林的食源性致病菌的分类模型训练方法 | |
CN105223140A (zh) | 同源物质的快速识别方法 | |
TWI493168B (zh) | 分析質譜的方法、電腦程式及系統 | |
US6289287B1 (en) | Identification of sample component using a mass sensor system | |
CN111426657B (zh) | 一种溶解性有机物三维荧光谱图的识别比对方法 | |
CN116858822A (zh) | 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法 | |
CN116026808A (zh) | 一种拉曼光谱判别方法和系统 | |
CN115455407A (zh) | 一种基于机器学习的GitHub敏感信息泄露监控方法 | |
CN115078327A (zh) | 一种基于神经网络架构搜索的危险化学品快速检测方法 | |
CN112782151B (zh) | 一种提高激光诱导击穿光谱分类准确性的数据处理方法 | |
Zhou et al. | Detection of knot defects on coniferous wood surface using near infrared spectroscopy and chemometrics | |
JP2015512522A (ja) | 分光システムの性能を測定するための方法 | |
CN111912823A (zh) | 一种多成分农药残留荧光检测分析方法 | |
CN110647915A (zh) | 一种用于高维数据一致性分析的动态模式判断方法 | |
CN117288701B (zh) | 基于多光谱的sf6电气设备评估方法及系统 | |
CN108802001B (zh) | 弱主药信号药品的快速检测方法 | |
CN113740293B (zh) | 基于近红外建模的尿素检测分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |