CN110084227A - 基于近红外光谱技术的模式识别方法 - Google Patents
基于近红外光谱技术的模式识别方法 Download PDFInfo
- Publication number
- CN110084227A CN110084227A CN201910432600.8A CN201910432600A CN110084227A CN 110084227 A CN110084227 A CN 110084227A CN 201910432600 A CN201910432600 A CN 201910432600A CN 110084227 A CN110084227 A CN 110084227A
- Authority
- CN
- China
- Prior art keywords
- sample
- spectrum
- model
- infrared
- identification method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 34
- 238000004445 quantitative analysis Methods 0.000 claims abstract description 18
- 230000003595 spectral effect Effects 0.000 claims abstract description 16
- 238000004451 qualitative analysis Methods 0.000 claims abstract description 14
- 238000005516 engineering process Methods 0.000 claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims description 80
- 238000009499 grossing Methods 0.000 claims description 15
- 238000007689 inspection Methods 0.000 claims description 10
- 238000003825 pressing Methods 0.000 claims description 7
- 238000004611 spectroscopical analysis Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 9
- 238000012360 testing method Methods 0.000 abstract description 9
- 238000003909 pattern recognition Methods 0.000 abstract description 8
- 240000004922 Vigna radiata Species 0.000 description 49
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 49
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 49
- 230000000694 effects Effects 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000010521 absorption reaction Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 229910000530 Gallium indium arsenide Inorganic materials 0.000 description 1
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 238000004566 IR spectroscopy Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 210000000554 iris Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000013558 reference substance Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种近红外光谱技术的模式识别方法,采用傅里叶近红外漫反射光谱技术进行检测样品进行建模数据采集,对采集的建模数据运用因子化建模结合一阶导数+5点平滑的预处理建立定性分析模型,采用Ward’s algorithm聚类算法结合二阶导数+SNV+5点平滑预处理建立聚类分析模型;采用PLS法建立定量分析模型,通过定向分析模型、聚类分析模型和定量分析模型进行模式识别实现分类判断。
Description
技术领域
本发明涉及模式识别技术领域,更具体的说是涉及一种基于近红外光谱技术的模式识别方法。
背景技术
目前,采用近红外光谱进行物质组分分析、检验和分类的方向研究不断加深,近红外光指波数在12000~4000cm-1范围内的一种电磁波,可以对检测样品中的-CH,-OH,-NH,C=C,C=O等化学键振动(伸缩振动,弯曲振动,摇摆振动,剪刀振动等)及光谱叠加吸收,形成稳定而复杂的吸收光谱,光谱的特性与样品的组分存在特定关系,同时,可以实现全光谱或者多个子光谱的定性分析、定量分析及在线分析等。
但是,由于对于多组分的复杂样品,其近红外光谱不是各组分单独光谱的简单叠加,需要利用“化学计量学”技术从复杂的光谱中提取出有效信息,此种方法常被用于营养成分检验及分类,对于目前日常生活中经常出现的造假和掺假的行为,消费者希望出现一种简便鉴别技术,能够快速对产物成分进行分析,对产物产地进行溯源,保证购买质量。
因此,如何采用近红外光谱技术结合模型算法进行物质组分分析,实现物质产地溯源是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于近红外光谱技术的模式识别方法,采用近红外光谱技术进行鉴别样品的采样,利用采集的参考物的光谱数据建立定性分析模型或聚类分析模型或定量分析模型,实现对产物不同状态下的建模,通过待鉴别样品的光谱数据输入模型,从而获得鉴别结果,判断出待鉴别样品的真实产地与标志产地是否一致。
为了实现上述目的,本发明采用如下技术方案:
一种基于近红外光谱技术的模式识别方法,具体识别方法过程如下:
步骤1:采用傅里叶近红外漫反射光谱技术进行采样,获取样品原始光谱;
步骤2:对所述原始光谱进行预处理,得到建模光谱;
步骤3:对所述建模光谱进行特征提取,建立识别模型;
步骤4:将待识别光谱数据输入识别模型,获得判别结果。
优选的,所述步骤1中,利用TENSOR II型傅里叶变换近红外光谱仪进行所述样品的所述原始光谱的采集;利用OPUS 7.5软件对所述样品进行扫描,进行检查信号、保存峰位、扫描背景单通道光谱、测量样品单通道光谱操作来消除外接信息的干扰,提高采集数据的精度;还设置有压样器,通过所述压样器将所述样品表面处理平整和压实来提升近红外光纤的漫反射次数,更多的提取有效信息,测量样品单通道采集样品光谱,再利用所述近红外光谱进行所述原始光谱的采集。
优选的,所述步骤2中的预处理方式为矢量归一化、一阶导数+平滑法、一阶导数+SNV+平滑、二阶导数+平滑法或二阶导数+SNV+平滑法。
优选的,所述步骤2中采用二阶导数+SNV+5点平滑法进行所述原始光谱的预处理,所述步骤3中采用Ward’s algorithm聚类算法建立聚类分析模型。
优选的,所述步骤2中采用一阶导数+5点平滑法进行所述原始光谱的预处理,所述步骤3中采用因子化法建立定性分析模型。
优选的,所述步骤3中采用偏最小二乘法,建立的定量分析模型。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种采用傅里叶近红外漫反射光谱技术结合建模算法建立识别模型,实现产物产地溯源,针对产物的不同状态选用不同的建模算法,实现快速精准的模式识别,对于呈粉末状态的产物样品,运用因子化法建模结合对建模原始光谱采用一阶导数+5点平滑法进行预处理,建立的定性分析模型;或运用Ward’s algorithm聚类算法建模结合对建模原始光谱采用二阶导数+SNV+5点平滑法进行预处理,建立聚类分析模型,提高了检测精度和识别的准确性。对于呈籽粒状的产物样品,采用PLS法并对建模原始光谱进行预处理,获得定量分析模型,能够得到对籽粒状产物的较高识别率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的基于近红外光谱技术的模式识别方法流程示意图;
图2附图为本发明提供的距离S值示意图;
图3附图为本发明提供的不同地区绿豆的聚类树形图;
图4附图为本发明提供的绿豆粉末样品原始光谱图;
图5附图为本发明提供的绿豆籽粒样品原始光谱图;
图6附图为本发明提供的一阶导数处理(波数12000~4000cm-1)结果图;
图7附图为本发明提供的一阶导数处理(波数9000~4000cm-1)结果图;
图8附图为本发明提供的校正集绿豆样品预测值与参考值相关图;
图9附图为本发明提供的校正集RMSECV与维数的关系图;
图10附图为本发明提供的检验集绿豆样品预测值与参考值相关图;
图11附图为本发明提供的检验集RMSEP与维数的关系图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于近红外光谱技术的模式识别方法,具体识别方法过程如下:
S1:采用傅里叶近红外漫反射光谱技术进行采样,获取样品原始光谱;
S2:对原始光谱进行预处理,得到建模光谱;
S3:对建模光谱进行特征提取,建立识别模型;
S4:将待识别光谱数据输入识别模型,获得判别结果。
为了进一步优化上述技术方案,S1中,利用TENSOR II型傅里叶变换近红外光谱仪进行样品的原始光谱的采集;利用OPUS 7.5软件对样品进行扫描,进行检查信号、保存峰位、扫描背景单通道光谱、测量样品单通道光谱操作来消除外接信息的干扰,提高采集数据的精度;还设置有压样器,通过压样器将样品表面处理平整和压实来提升近红外光纤的漫反射次数,更多的提取有效信息,测量样品单通道采集样品光谱,再利用近红外光谱进行原始光谱的采集。
为了进一步优化上述技术方案,S2中的预处理方式为矢量归一化、一阶导数+平滑法、一阶导数+SNV+平滑、二阶导数+平滑法或二阶导数+SNV+平滑法。
为了进一步优化上述技术方案,S2中采用二阶导数+SNV+5点平滑法进行原始光谱的预处理,步骤3中采用Ward’s algorithm聚类算法建立聚类分析模型。
为了进一步优化上述技术方案,S2中采用一阶导数+5点平滑法进行原始光谱的预处理,S3中采用因子化法建立定性分析模型。
为了进一步优化上述技术方案,S3中采用偏最小二乘法,建立的定量分析模型。
实施例
本发明以绿豆产地溯源为例说明采样、建模和鉴别过程,鉴别是否是“泰来绿豆”,其中取样若干份泰来绿豆和非泰来绿豆。分别对绿豆籽粒样品及粉末样品进行建模研究,进而筛选出最优的光谱计算法,并对最适合建模的样品状态进行进一步研究。
1、选取材料材料与试剂,采集样本信息。
试验于2018年收获期内采用3点田间随机采样方式进行样品收集,每份样品收集2kg,进行编号,其中泰来绿豆样品78份、非泰来地区样品175份,共计253份,样品信息表如表1所示。
表1随机采样样品信息
选用仪器为:天津泰斯特仪器有限公司的FW100高速万能粉碎机和德国布鲁克(北京)科技有限公司的TENSOR II型傅里叶变换近红外光谱仪。
2、进行采样建模。
2.1首先对样品进行前处理,将采集的样品进行统一晾晒、脱壳、精选,并进行超微粉碎,过100目筛,备用。
2.2采集绿豆原始光谱
将TENSOR II型傅里叶变换近红外光谱仪预热30min,利用OPUS 7.5软件对绿豆样品进行扫描,通过检查信号、保存峰位,扫描背景单通道光谱(每间隔1h扫描一次),测量样品单通道光谱等操作,来消除外界信息的干扰提高采集数据的精度。
依次将绿豆籽粒样品和粉末样品倒入玻璃杯中,用压样器将样品表面处理平整、压实,来提升近红外光线的漫反射次数,更多的提取有效信息,测量样品单通道采集样品光谱。仪器参数为漫反射镀金积分球,InGaAs检测器,试验所处的环境温度为(25±1)℃,相对湿度为20%~30%,光谱波数范围12000~4000cm-1,分辨率8cm-1,扫描64次。
其中,选取样品时分别选取两地区样品量的2/3作为建模样品集用于模型的建立,1/3作为预测样品集用于模型的验证。各地区用于建模和预测的样品数见表2。
表2建模与预测样品
地区 | 建模样品个数 | 预测样品个数 | 总计 |
泰来绿豆 | 52 | 26 | 78 |
非泰来绿豆 | 105 | 70 | 175 |
2.3对采集的原始光谱进行处理
为防止出现过拟合现象,故采用Origin10.5对原始光谱进行一阶导数(derivative 1st)处理,通过去除受噪声、光的色散等因素干扰的波段,得到最优波数范围,进行模型研究。
2.4建立判别模型
建立定性分析模型,定性分析分为有监督的模式识别(如距离判别法)和无监督的模式识别(如聚类方法)两种模式识别技术。有监督的模式识别基本算法计算光谱距离可分为标准算法和因子化法,二者都是将测试谱图同模型中参考谱图进行比较,计算所得距离即是匹配值,两张越匹配,则距离越短,否则反之。
2.4.1有监督模式识别
标准算法在计算时是以模型中某一类物质的平均光谱作为参考光谱,与未知样品的测试光谱进行比较的。标准算法计算光谱距离(D)公式(1)如下:
式中:As(λi)为测试光谱在波数点λi处吸光度值;Ar(λi)为模型的平均光谱在波数点λi处吸光度值;i为波数
因子化法光谱距离(D)按公式(2)进行计算:
式中:a为原始光谱;b为重建光谱;Tia为第i张原始光谱图的得分值;Tib为第i张重建光谱图的得分值。
需要将所处理的谱图先表示为因子谱(载荷)的线性组合,如公式(3):
a=T1a×f1+T2a×f2+T3a×f3+…+Tna×fn (3)
式中:a为原始光谱;f为各种因子谱;T为重建原始光谱a时每张因子谱的得分值,该值越大表明该因子谱对原始光谱的贡献越大。
采用样品之间的距离S值来衡量定性模型的建模效果,如图2所示,当S<1时,表示两类样品之间存在相交关系,模型的鉴别效果极差;当S=1时,表示两类样品之间时相切的关系,模型的鉴别效果一般;当S>1时,表示两类样品是相离的关系,数值越大,模型的鉴别效果越好。
采用如下公式(4)计算距离S:
式中:D表示两类样品的平均光谱距离;DT1表示一类样品的光谱模型半径;DT2表示另一类样品的光谱模型半径。
近红外光谱技术(NIR)通过漫反射能有效提取绿豆样品中的信息,但不能进行结构分析,主要因为其谱峰重叠、谱带较宽并且信号较弱,因此近红外光谱技术的定性分析可用于绿豆的产地判别。当S值大于1表示泰来绿豆和非泰来绿豆被均一鉴别,且数值越大表示样品差异越大。对采集的粉末状态和籽粒状态的原始光谱分别通过标准算法和因子化算法进行光谱距离计算,并结合不同的光谱预处理方式进行识别模型建立,通过距离S值分别或的不同状态、不同算法和不同预处理方式对建模的影响,结果如表3所示。
表3不同计量学及预处理方式对定性分析模型效果的影响
由表3可知,对于两种状态的绿豆而言,粉末状态的建模效果要优于籽粒状态的建模效果,主要是因为绿豆个体的粒径越小,它们之间所存在的空隙越小,紧密度越高,使近红外光线在样品中能更全面的进行信息提取,避免光线的损耗。采用因子化法进行光谱距离的计算所建立的模型要优于采用标准算法,因标准算法是衡量泰来绿豆样品和非泰来绿豆样品平均光谱差异程度的一个尺度,不能体现特征变化的情况。因子化法是通过对原始光谱进行主成分分解,选取特征值较大的几个主成分得分特征变量参与模式识别,起到特征信息提取的作用。故粉末状态的绿豆运用近红外光谱技术结合因子化法及一阶导数+5点平滑的预处理方式所建立的模型进行定性分析为最佳识别模型,其模型的S值为1.3479。
2.4.2无监督模式识别
无监督的模式识别(聚类分析)是用光谱的距离表明了谱图的相似度,两种谱图的光谱距离为零则表明它们是一样的。两种光谱的距离随谱图差别的增加而增大。计算方法主要有最短距离法(Single linkage)、最长距离法(Complete linkage)、平均距离法(Average linkage)、加权平均距离法(Weighted average)、中间距离法(Medianalgorithm)、重心法(Centroid algorithm)、Ward氏算法(Ward’s algorithm)。
首先需要对原始光谱进行预处理,预处理方式为矢量归一化(Standard NormalVariate,,SNV)、一阶导数+平滑(5、9、13、17、21、25点,下同)、一阶导数+SNV+平滑、二阶导数(derivative 2st)+平滑、二阶导数+SNV+平滑方式对建模原始光谱进行预处理,来消除样品不均匀,光的散射,光程不恒定等因素的干扰,提高模型的检测精度[11,13]。
聚类分析不需要输入任何信息,仅运用数学方法将绿豆样品之间的亲疏关系进行划分,并根据亲疏关系的程度进行按组聚类,这一点是与定性分析不同的。采用不同的计算方法结合不同的预处理方式进行识别模型建模,通过不同样品光谱距离表示不同识别模型的效果如下表4所示。
表4不同聚类算法及预处理方式对聚类分析模型效果的影响
其中,“-”表示泰来绿豆和非泰来绿豆未被准确鉴别,数值表示两类绿豆的距离。
由表4可知,运用Ward’s algorithm聚类算法对泰来绿豆和非泰来绿豆的聚类效果要优于Average linkage等。主要是因为Ward’s algorithm聚类算法不同于其他算法仅是根据光谱距离将相似样品聚合在一起,而是根据寻找的同类绿豆的中变化最小的异质因子进行归类。故采用Ward’s algorithm聚类算法结合二阶导数+SNV+5点平滑的预处理方式建立的聚类分析模型为最佳识别模型,其两类绿豆的距离值为6.409。如图3所示为不同地区绿豆的聚类树形图,为利用近红外漫反射光谱技术对来自不同产地的45份绿豆进行聚类鉴别分析结果,其正确鉴别率高达100%,其中曲线圈出区域为泰来绿豆。
4.2.3定量分析模型的建立
定量分析使用偏最小二乘法(partial least squares,PLS)进行拟合,来建立近红外光谱与样品组分值相关联系。采用留一交叉检验的方式进行建模,检验集检验的方式进行模型验证。PLS法的原理是通过预测变量组X与独立变量Y二者之间的关系所构成的线性模型来表达的,如公式(5):
Y=b0+b1X1+b2X2+…+bpXp (5)
式中:b0为截距;b1~bp为回归系数;Y为绿豆样品组分值真值;X为样品组分预测值
将泰来绿豆的组分值赋值为1,非泰来绿豆的组分值赋值为-1,以0作为衡量值进行判别,其中通过模型的计算出的预测值大于0的被认定为泰来绿豆,小于0的为非泰来绿豆。同时,用精度较高的样品状态模型去验证另一种状态的样品,研究模型的实用性。
对于定量分析而言,校正集均方根误差(root mean square error ofcalibration,RMSEC)及其决定系数(R2)、预测集均方根误差(root mean square error ofprediction,RMSEP)及其决定系数(R2)、范围误差比(ratio of performance to standarddeviate,RPD)作为衡量模型精度的指标,其中RMSEC、RMSEP数值越小R2数值越大证明模型的精度越高,同时RPD>3时模型的稳定性及检测精度最佳。在进行定量分析建模之前先进行光谱数据预处理,对于定量分析而言光谱的预处理方式有消除常数偏移量、减去一条直线、SNV、最小-最大归一化、多元散射矫正(multiplicative scatter correction,MSC)、内部标准、一阶导数+平滑、二阶导数+平滑、一阶导数+减去一条直线+平滑、一阶导数+SNV+平滑、一阶导数+MSC+平滑。
经过预处理后获得样品的原始光谱图,再用于建模,图4为绿豆粉末样品原始光谱图,图5为绿豆籽粒样品原始光谱图,由图中可以看出,因是同一物种,故两种状态绿豆的近红外光谱图较为相似,吸收率总体上呈上升趋势,在8696~8000cm-1范围内是-CH键二级倍频吸收带,8333cm-1处的吸收峰与之有关。在7000~6500cm-1处的吸收峰是由-NH2的不对称振动所引起的。在5500~5000cm-1处的吸收峰主要是糖类及蛋白等大分子中-NH键、-CH键、-OH键及C=O键的合频吸收区间,其中5166cm-1处的吸收峰与之有关。
在进行预处理时,图6为一阶导数处理(波数12000~4000cm-1)结果图,图7为一阶导数处理(波数9000~4000cm-1)结果图,由图6可知,原始光谱经过一阶导数处理后,在波数为12000~9000cm-1范围内的光谱存在较为强烈的噪声等因素干扰,因此选取4000~9000cm-1进行建模研究,尽可能的运用近红外所提取的全部样品信息。
定量分析是通过运用PLS对绿豆赋予的组分值建立多元校正模型,并用于预测未知样品的组分值,进而来判定种属关系。PLS是化学计量学中最有效的分析方法之一,能将主成分分析(Principal Component Analysis,PCA)、典型相关分析(CanonicalCorrelation Analysis,CCA)及多元线性回归分析(Multiple Linear Regression,MLR)相结合来去除样品自变量中可能存在的复共线关系,达到回归建模和数据结构的简化的效果,也适用于非线性关系建模,其具有准确度高、稳定性强的特点,不同的预处理方式建立识别模型的效果如下表5所示。
表5不同预处理方式对定量分析模型效果的影响
由表5可知,当预处理方式为SNV时,所建立的模型RMSECV为0.129,R2为98.06,RPD为7.18,维数为7。如图8为校正集绿豆样品预测值与参考值相关图,图9为RMSECV与维数的关系图,由图中可以看出RMSECV随着维数的增加而减小,达到最低点后几乎保持稳定不变,故选用SNV预处理方式结合PLS算法建立的定量分析模型为最佳。利用该模型对预测样品集采用检验集检验的方式对模型进行验证,结果如图10为检验集绿豆样品预测值与参考值相关图,图11为RMSEP与维数的关系图,从图中可以看出RMSEP为0.123,R2为98.01,|预测相对误差|=0.6%,研究表明当预测误差<5%时,证明所建模型的检测精度极高,因此也就验证了该模型的准确性。
2.5模型的验证
因上述模型均采用粉末状态的绿豆进行建模,为考量模型的精度与实用度,试验将建立好的定性分析模型和聚类分析模型用于两种状态的绿豆样品进行产地判别,将定量分析模型用于籽粒样品判别,结果分别如表6和表6所示。
表6绿豆粉末验证结果
表7绿豆籽粒验证结果
以上表格数据说明建立的模型能很好的用于对于粉末状态的泰来绿豆进行鉴别,其正确识别率达到92.30%以上,对于籽粒状态的泰来绿豆样品而言,定量分析模型相比较其他的模型具有较高的识别率,证明采用NIR结合PLS建立的定量分析模型,其实用性较高,但其检测精度有待进一步提升。尽管籽粒样品比粉末样品的检测情况要差很多,但这是合乎逻辑的,因为籽粒绿豆是一个更为复杂的基质,尽管结果是可以接受的,但对其均匀的碾磨将在很大程度上改善结果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种基于近红外光谱技术的模式识别方法,其特征在于,包括:具体识别方法过程如下:
步骤1:采用傅里叶近红外漫反射光谱技术进行采样,获取样品原始光谱;
步骤2:对所述原始光谱进行预处理,得到建模光谱;
步骤3:对所述建模光谱进行特征提取,建立识别模型;
步骤4:将待识别光谱数据输入识别模型,获得判别结果。
2.根据权利要求1所述的基于近红外光谱技术的模式识别方法,其特征在于,所述步骤1中,利用TENSOR II型傅里叶变换近红外光谱仪进行所述样品的所述原始光谱的采集;利用OPUS 7.5软件对所述样品进行扫描,进行检查信号、保存峰位、扫描背景单通道光谱、测量样品单通道光谱操作;还设置有压样器,通过所述压样器将所述样品表面处理平整和压实,再利用所述近红外光谱进行所述原始光谱的采集。
3.根据权利要求1所述的基于近红外光谱技术的模式识别方法,其特征在于,所述步骤2中的预处理方式为矢量归一化、一阶导数+平滑法、一阶导数+SNV+平滑、二阶导数+平滑法或二阶导数+SNV+平滑法。
4.根据权利要求1所述的基于近红外光谱技术的模式识别方法,其特征在于,所述步骤2中采用二阶导数+SNV+5点平滑法进行所述原始光谱的预处理,所述步骤3中采用Ward’salgorithm聚类算法建立聚类分析模型。
5.根据权利要求1所述的基于近红外光谱技术的模式识别方法,其特征在于,所述步骤2中采用一阶导数+5点平滑法进行所述原始光谱的预处理,所述步骤3中采用因子化法建立定性分析模型。
6.根据权利要求1所述的基于近红外光谱技术的模式识别方法,其特征在于,所述步骤3中采用偏最小二乘法,建立的定量分析模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910432600.8A CN110084227A (zh) | 2019-05-22 | 2019-05-22 | 基于近红外光谱技术的模式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910432600.8A CN110084227A (zh) | 2019-05-22 | 2019-05-22 | 基于近红外光谱技术的模式识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110084227A true CN110084227A (zh) | 2019-08-02 |
Family
ID=67421432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910432600.8A Pending CN110084227A (zh) | 2019-05-22 | 2019-05-22 | 基于近红外光谱技术的模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110084227A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112782115A (zh) * | 2020-12-25 | 2021-05-11 | 河南中烟工业有限责任公司 | 一种基于近红外光谱检验卷烟感官特征一致性的方法 |
CN113703500A (zh) * | 2020-10-27 | 2021-11-26 | 深圳职业技术学院 | 一种基于多基色光谱叠加过程的环境光照模拟方法 |
CN115561198A (zh) * | 2022-09-22 | 2023-01-03 | 广西医科大学 | 基于atr-ftir同时检测牡蛎产地及糖原含量的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957316A (zh) * | 2010-01-18 | 2011-01-26 | 河北大学 | 一种用近红外光谱技术鉴别响水大米的方法 |
WO2016150130A1 (zh) * | 2015-03-25 | 2016-09-29 | 山东翰能高科科技有限公司 | 一种基于近红外光谱的杂交种纯度鉴别方法 |
-
2019
- 2019-05-22 CN CN201910432600.8A patent/CN110084227A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957316A (zh) * | 2010-01-18 | 2011-01-26 | 河北大学 | 一种用近红外光谱技术鉴别响水大米的方法 |
WO2016150130A1 (zh) * | 2015-03-25 | 2016-09-29 | 山东翰能高科科技有限公司 | 一种基于近红外光谱的杂交种纯度鉴别方法 |
Non-Patent Citations (1)
Title |
---|
钱丽丽等: "近红外漫反射光谱技术对小米产地的快速检测", 《食品工业》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113703500A (zh) * | 2020-10-27 | 2021-11-26 | 深圳职业技术学院 | 一种基于多基色光谱叠加过程的环境光照模拟方法 |
CN113703500B (zh) * | 2020-10-27 | 2023-11-14 | 深圳职业技术学院 | 一种基于多基色光谱叠加过程的环境光照模拟方法和装置 |
CN112782115A (zh) * | 2020-12-25 | 2021-05-11 | 河南中烟工业有限责任公司 | 一种基于近红外光谱检验卷烟感官特征一致性的方法 |
CN112782115B (zh) * | 2020-12-25 | 2023-06-20 | 河南中烟工业有限责任公司 | 一种基于近红外光谱检验卷烟感官特征一致性的方法 |
CN115561198A (zh) * | 2022-09-22 | 2023-01-03 | 广西医科大学 | 基于atr-ftir同时检测牡蛎产地及糖原含量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084227A (zh) | 基于近红外光谱技术的模式识别方法 | |
CN104062257A (zh) | 一种基于近红外光谱测定溶液中总黄酮含量的方法 | |
CN109669023A (zh) | 一种基于多传感器融合的土壤属性预测方法 | |
CN109324013A (zh) | 一种利用高斯过程回归模型构建原油性质近红外快速分析的方法 | |
CN106680241A (zh) | 一种新型光谱多元分析分类与识别方法及其用途 | |
CN107917897A (zh) | 近红外光谱测定特医食品多组分含量的方法 | |
Zhu et al. | Wavelength selection of hyperspectral scattering image using new semi-supervised affinity propagation for prediction of firmness and soluble solid content in apples | |
Cui et al. | Identification of maize seed varieties based on near infrared reflectance spectroscopy and chemometrics | |
CN110749565A (zh) | 一种快速鉴别普洱茶存储年份的方法 | |
WO2020248961A1 (zh) | 一种无参考值的光谱波数选择方法 | |
CN108593592A (zh) | 一种基于近红外光谱技术的半夏掺伪鉴别方法 | |
CN113310936A (zh) | 四种高温灭菌商品牛奶的快速鉴定方法 | |
Nturambirwe et al. | Detecting bruise damage and level of severity in apples using a contactless nir spectrometer | |
CN108760677A (zh) | 一种基于近红外光谱技术的法半夏掺伪鉴别方法 | |
CN110186871A (zh) | 一种茶鲜叶产地的判别方法 | |
CN109540837A (zh) | 近红外快速检测苎麻叶片木质纤维素含量的方法 | |
CN109685099A (zh) | 一种光谱波段优选模糊聚类的苹果品种辨别方法 | |
CN113310929A (zh) | 高温灭菌奶中掺加豆粉及其掺加比例的光谱鉴定方法 | |
CN106872398A (zh) | 一种hmx炸药水分含量快速测量方法 | |
CN102519903B (zh) | 一种近红外光谱测定双孢蘑菇白度值的方法 | |
CN106198423A (zh) | 一种基于可见‑近红外光谱分析技术鉴别火腿肠等级的方法 | |
CN105067558B (zh) | 近红外定性鉴别特征提取方法 | |
CN107238557A (zh) | 一种利用近红外光谱法快速检测碳酸钙粒径分布的方法 | |
CN106442400A (zh) | 一种近红外光谱快速判定不同土壤类型茶鲜叶的方法 | |
CN116559106A (zh) | 一种中药材炮制工艺过程的近红外在线监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190802 |
|
RJ01 | Rejection of invention patent application after publication |