CN103235095B - 注水肉检测方法和装置 - Google Patents

注水肉检测方法和装置 Download PDF

Info

Publication number
CN103235095B
CN103235095B CN201310136236.3A CN201310136236A CN103235095B CN 103235095 B CN103235095 B CN 103235095B CN 201310136236 A CN201310136236 A CN 201310136236A CN 103235095 B CN103235095 B CN 103235095B
Authority
CN
China
Prior art keywords
meat
forecast model
near infrared
water
infrared spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310136236.3A
Other languages
English (en)
Other versions
CN103235095A (zh
Inventor
郭培源
许冠男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201310136236.3A priority Critical patent/CN103235095B/zh
Publication of CN103235095A publication Critical patent/CN103235095A/zh
Application granted granted Critical
Publication of CN103235095B publication Critical patent/CN103235095B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及一种注水肉检测方法和装置,该方法包括:根据肉品的近红外光谱采集所述肉品的水分含量数据;测量所述肉品的PH值;采集肉品的图像,并根据采集的图像获取肉品的颜色信息;将所述肉品的水分含量数据、PH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉。本发明可快速、准确地检测注水肉。

Description

注水肉检测方法和装置
技术领域
本发明涉及食品检测技术,尤其是一种注水肉检测方法和装置。
背景技术
近几年食品安全问题越来越受到人们的关注。近年来“注水肉”问题一直受到消费者的关注。如今,由于国内生活水平的不断提高,肉类食品(如猪肉、羊肉、牛肉、鸡肉等)已经成为消费者餐桌上的必需品,但一些不法商贩为了盈利贩卖注水肉、问题肉,危害消费者的健康,侵害消费者的权益。注水肉是指不法商贩以盈利为目的,人为的在牲畜屠宰前或者屠宰放血后,通过牲畜的颈动脉将清水或者生产污水、工业色素、防腐剂等注入到牲畜体内后进行贩卖的劣质肉品(常见于猪肉和牛肉)。国家标准《畜禽肉水分限量》[1]规定的畜禽肉水分限量如下:如果猪肉、牛肉、鸡肉的含水量>77%,羊肉水分含量>78%,既可判别为注水肉。
注水肉一方面侵害了消费者的合法权益,在金钱上造成一定的损失。另一方面更加危害了消费者的身体健康。由于不法商贩可能会将工业色素、防腐剂等有害物质一并注入到肉品中(如注入卤水能够使肉色鲜艳且锁住水分;注入工业色素能够保持长时间鲜亮的肉色;在注入的水中添加防腐剂能够延长肉的存放时间),这些物质破坏了肉品当中的营养成分,甚至产生致癌物质导致肉品癌变,食用这样的肉品必然会对身体造成伤害、影响身体健康。
而现阶段,注水肉检测方法主要有感官检测和理化检测两种方法。感官检测方法虽然可以对肉品进行快速判断,但是准确性差;理化检测方法虽然可以得到准确的检测结果,但是进行化学实验需要的时间过久,不利于卫生检疫部门对问题肉品进行尽快处理。在这样的现状下,迫切需要一种快速、准确、实用的检测技术对注水肉进行检测,以便判断肉品是否可以放心食用。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明提供一种注水肉检测方法和装置,能够快速、准确地检测注水肉。
一方面,本发明提供了一种注水肉检测方法,包括:
近红外光谱检测步骤,根据肉品的近红外光谱采集所述肉品的水分含量数据;
PH值测量步骤,测量所述肉品的PH值;
图像检测步骤,采集肉品的图像,并根据采集的图像获取肉品的颜色信息;
注水肉识别步骤,将所述肉品的水分含量数据、PH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉。
另一方面,本发明提供了一种注水肉检测装置,包括:
近红外光谱检测模块,用于根据肉品的近红外光谱采集所述肉品的水分含量数据;
PH值测量模块,用于测量所述肉品的PH值;
图像检测模块,用于采集肉品的图像,并根据采集的图像获取肉品的颜色信息;
注水肉识别模块,用于将所述肉品的水分含量数据、PH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉。
本发明提供的技术方案中,基于近红外光谱的肉品水分含量获取肉品水分含量数据,能够对肉品的水分含量做快速的预测,引入多传感器数据融合技术来对肉品做全面的分析。即在以肉品水分含量为依据的同时,加入计算机视觉采集到的肉品颜色值,以及pH计采集到的肉品pH值作为分析肉品是否为注水肉的依据,克服了由于近红外光谱方法的局限性和单一性造成的预测结果的误差,提高识别结果的正确性,可以较全面地对肉品进行分析,做出较为正确的识别,并且将上述三种数据作为支持向量机模型的输入,通过支持向量机进行数据融合,进一步提升检测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的注水肉检测方法的流程图;
图2为本发明采用近红外光谱定量分析肉品水分含量的流程图;
图3示出多传感器数据融合中采用多层次融合处理时的处理过程;
图4为线性SVM支持向量机中将两类样本分开的最优超平面的示意图;
图5为本发明实施例二提供的注水肉检测装置的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的注水肉检测方法的流程图。如图1所示,该方法包括:近红外光谱检测步骤S12:根据肉品的近红外光谱采集肉品的水分含量数据;PH值测量步骤S14:测量所述肉品的PH值;图像检测步骤S16:采集肉品的图像,并根据采集的图像获取肉品的颜色信息;注水肉识别步骤S18:将所述肉品的水分含量数据、PH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉。
步骤S12的主要目的是根据肉品的近红外光谱获取肉品的水分含量数据,具体分析如下:
近红外光是最早被人们发现的非可见光,早在1800年,William Herschel便发现了红外光谱区。近红外光谱(Near Infrared ReflectanceSpectroscopy),简称NIRS是指介于可见光和中红外光谱区之间的电磁波,美国材料协会(ASTM)规定,其波长范围780-2526nm。近红外光谱主要是含氢基团(如C-H,O-H,N-H等)或官能团分子振动的倍频与合频的吸收光谱,不同基团或官能团产生的光谱在吸收峰位置及强度上会有所不同,从而使近红外光谱中包含了大量对研究这些有机物有帮助的信息或数据。
采用近红外光谱技术检测分析样品,可以在不破坏样品的情况下,对样品进行快速的检测并获得样品内部的光谱信息(如苹果的酸甜度、肉类的蛋白质、水分,脂肪含量等),是一种无损、绿色、快速、高效并对检测人员或使用者身体无害的检测分析技术。但是,近红外光谱技术是一种间接分析和测量的技术,即它不是原始方法,通常需要结合化学计量学方法建立校正模型,以实现对未知样品的定性或定量分析。到目前为止,经过200多年的发展,已经应用于农业、食品工业、石油化工、医药、生命科学、环境保护等多个领域。
物质对光的选择性吸收主要是由物质的分子结构来决定。对于分子,其只吸收与它特征振动能量一致的光子并且被激发到较高的能级。只有当光子的能量(即E=hv),与分子的能级间隔相等时它才会被吸收。
分子由N个原子组成的有3N个自由度,其中包括3个平动自由度,3个分子整体转动自由度,以及3N-6个分子内原子相互作用自由度并对应3N-6个基频吸收。基频吸收是指分子吸收光子后从一个能级被激发到相邻的高一级的能级时所吸收的能量。倍频吸收是指分子吸收光子后从一个能级被激发到两个以上高一级的能级时所吸收的能量。合频吸收是指光子同时激发两个能级的吸收。因此,在近红外光谱的吸收光谱中,分子的组成结构特征会由波峰和波谷来反映。每种物质都有其特定的吸收光谱特性。利用特定官能团或含氢基团或已知某种物质的吸收光谱特性,根据吸收光谱图和对照实验就可以对其成分或含量进行分析。
表1-含氢键基团红外吸收谱带
分子能吸收近红外光谱有两种振动模式,分别是伸缩振动和弯曲振动。伸缩振动是指组成化学键的两个原子沿着化学键轴方向连续变化的振动。弯曲振动是指两个原子成键角变化的振动。近红外光谱的波段在4000cm-1以上(2500nm以下),而在此范围内产生基频振动的主要是含氢官能团,如C-H,N-H,O-H的伸缩振动。近红外光谱的吸收主要是由质量最小的氢原子(-H)引起的。氢原子(-H)一方面能够引发分子上的基频吸收,另一方面由于其还会产生非谐性振动,从而引发分子上较强的倍频吸收。氢原子(-H)的基频和倍频,以及分子中其它振动的耦合还会在整个NIR区域上产生合频吸收。所以,对于含氢基团如O-H、C-H、N-H的物质都会产生近红外光谱,当被测对象含有含氢基团时,就可以采用近红外光谱技术对样品进行光谱采集并进行分析。根据以上分析可只,可采用近红外光谱对肉品水分含量进行分析。
比尔—朗白定律(The Beer-Lambert Law)是近红外光谱分析的重要理论依据。根据比尔—朗白定律可以将样品成分的浓度值(例如,可表征水分含量数据)与通过近红外光谱技术测量到的光谱值(吸光度)之间建立函数关系,即:
A=εlc     (1)
式中:
A为通过近红外光谱技术测量到的光谱值(吸光度);
ε为吸收系数(摩尔吸收率);
l为光通过样品的距离(光程);
c为样品成分的浓度值。
在化学计量学中常使用的是比尔—朗白定律的矩阵形式,假设一种混合物是由三种组成成分组成的,这三种组成成分的纯光谱用向量分别为p1,p2,p3,若混合物中三种组成成分的相对浓度分别为c1,c2和c3,根据比尔—朗贝定律,混合物的光谱x应等于三种组成成分的纯光谱与对应浓度的乘积之和,即x=c1p1+c2p2+c3p3+e,其中e为测量仪器的测量误差。
即:
x1=c1p11+c2p12+c3p13+e1
x2=c1p21+c2p22+c3p23+e2
xn=c1pn1+c2pn2+c3pn3+en
                                               (2)
其中:
n为波长点数;
xn为混合物在波长为n处的光谱值(吸光度);
pn3表示第三种纯组分在波长为n处的光谱值(吸光度)。
将上式代入式(1)中,即可得到比尔—朗白定律的矩阵形式:
a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n . . . . . . . . . a m 1 a m 2 . . . a mn = c 11 c 12 . . . c 1 p c 21 c 22 . . . c 2 p . . . . . . . . . c m 1 c m 2 . . . c mp p 11 p 12 . . . p 1 n p 21 p 22 . . . p 2 n . . . . . . . . . p p 1 p p 2 . . . p pn + e 11 e 12 . . . e 1 n e 21 e 22 . . . e 2 n . . . . . . . . . e m 1 e m 2 . . . e mn - - - ( 3 )
式(3)表明,对于一个混合物,其多个组成成分在相同波长点的光谱值是加和的。根据比尔—朗白定律建立函数关系,对于待测量的样本浓度,只需要测量一些样品的浓度值和相应的光谱值(吸光度)就可以建立待测样本的模型,对于其他样品只需采集其光谱值(吸光度)通过模型即可预测其浓度。
可选地,本发明在步骤S12之前还包括预测模型建立步骤,建立以近红外光谱作为输入、以水分含量数据作为输出的预测模型。
可选地,近红外光谱检测步骤S12包括:
第一步骤,获取肉品的近红外光谱;
第二步骤,通过多元散射校正算法或均值中心化算法对获取的近红外光谱进行平滑处理;
第三步骤,将平滑处理后的近红外光谱作为所述预测模型的输入获取所述预测模型的输出值;
第四步骤,根据所述预测模型的输出值获取所述肉品的水分含量数据。
可选地,本实施例中,优选采用偏最小二乘算法建立所述预测模型。
可选地,本实施例中,预测模型建立之后,优选采用向后区间偏最小二乘筛选法选取能够使预测模型的拟合精度最高的光谱区间,并在选取的光谱区间上进行建模以形成所述预测模型。
下面对预测模型的建立和优化进行详细描述:
如图2所示,本发明采用近红外光谱定量分析肉品水分含量的基本流程如下:
大量采集具有代表性的待测量肉品并建立样品集,可分为校正集和验证集;
采用例如化学方法对样品集的待测成分进行测定;
采用近红外光谱技术采集样品集的近红外光谱数据;
将采集样品集的近红外光谱数据进行预处理;
通过化学计量学方法建立校正集样品待测成分的预测模型;
将验证集样本作为预测模型的输入验证所建立的预测模型的精确性,并依据模型评价指标对模型进行评价;
使用良好精确性的预测模型预测未知肉品的待测成分。
对近红外光谱定量分析预测模型的预测结果进行评价是运用和优化模型的基础,评价指标主要包括:预测值与实际值的相关系数(r)、交叉验证均方根误差(RMSEVC)、校正均方根误差(RMSEC)以及预测均方根误差(RMSEP)。
1.相关系数(r)
用于计算样本的预测值与实际值的相关程度,其值越接近于1说明样本的预测值与实际值的相关程度越好,模型的有效性高。
其计算公式如下:
r = 1 - Σ i = 1 n ( y i - y ^ i ) 2 Σ i = 1 n ( y i - y ‾ ) 2 - - - ( 4 )
式中:yi为样品集(包括校正集、验证集和交互验证集)中第i个样品的待测成分实际值;yi为样品集(包括校正集、验证集和交互验证集)中第i个样品的待测成分预测值;y为样品集所有样品待测成分实际值的平均值。
2.交叉验证均方根误差(RMSEVC)
交叉验证均方根误差是预测模型对交互验证集样品的预测均方根误差,用于评价预测模型的预测能力以及建模方法的可行性,其计算公式如下:
RMSECV = Σ c = 1 n ( y ^ c - y c ) 2 n - - - ( 5 )
式中:yc为样品的交互验证集中第c个样品的待测成分实际值;为样品的交互验证集中第c个样品的待测成分预测值;n为交互验证集样品数。
3.预测均方根误差(RMSEP)
预测均方根误差是预测模型对验证集样品的预测均方根误差,用于评价预测模型对未知样品的预测能力,其值越小则说明模型对未知样品的预测能力越好。
其计算公式如下:
RMSEP = Σ p = 1 m ( y ^ p - y p ) 2 m - - - ( 6 )
式中:yp为样品的验证集中第p个样品的待测成分实际值;为样品的验证集中第p个样品的待测成分预测值;m为验证集样品数。
4.校正均方根误差(RMSEC)
校正均方根误差是预测模型对校正集样品的预测均方根误差,用于评价预测模型的拟合精度,其值越小则说明模型的拟合精度越高。
其计算公式如下:
RMSEC = Σ t = 1 n ( y ^ t - y t ) 2 n - - - ( 7 )
式中:yt为样品的校正集中第t个样品的待测成分实际值;为样品的校正集中第t个样品的待测成分预测值;n为验证集样品数。
一般地,对于已建立的预测模型,希望其有较高的r值、较小的RMSEC、RMSEP和RMSECV值,并且RMSEC和RMSEP值越接近说明模型的稳定性越好。
根据上述近红外光谱分析定量分基本流程建立基于近红外光谱的肉品水分含量预测模型,首先建立样品集并采集肉品的待测成分(即肉品的水分含量)和对应的光谱数据。
肉品水分含量的化学方法数据采集
1.实验环境:室温25 C左右且通风良好的实验室。
2.实验材料与设备如表2所示。
3.样品预处理:将上述注水肉样品和正常肉样品放入绞肉机中绞碎,称重分为60份样品。
表2-肉品水分含量的化学方法实验材料和设备
肉品水分含量的化学方法测量步骤
1.将盛有砂(砂质量为样品质量的3-4倍)和玻璃棒的培养皿置于103℃±2℃的干燥箱中,加热30min-60min。之后,将其置于干燥器中,冷却至室温,精确称量至0.0001g,并重复干燥至前后两次连续称量结果之差小于1mg;
2.取样品置于上述恒重的培养皿中;
3.加入95%乙醇5ml-10ml,用玻璃棒混合后,将上述培养皿置于水浴上,调节水浴温度在60-80℃之间,用玻璃棒不断搅拌至蒸干乙醇;
4.将上述培养皿移入干燥箱中烘干2h,取出,置于干燥器中,冷却至室温,精确称量,再放入干燥箱烘干1h,并重复上面的操作直至前后两次的称重结果之差小于1mg。
5.根据式(8)计算样品水分含量测量结果:
X 2 = m 2 - m 3 m 2 - m 1 × 100 - - - ( 8 )
式中:X2为样品的水分含量,单位为克每百克(g/100g);m1为玻璃棒、培养皿和砂的质量,单位为克(g);m2为干燥前样品、玻璃棒、培养皿和砂的质量,单位为克(g);m3为干燥后样品、玻璃棒、培养皿和砂的质量,单位为克(g)。
当平行分析结果符合精度要求时,则取两次测量的算数平均值作为结果,精确到0.1%。
肉品水分含量的化学方法测量结果
将60份肉品样品分为校正集样品40份、验证集样品20份,以备建立模型使用。肉品水分含量测量结果统计如表3所示。
表3-肉品水分含量测量结果
测量值 最大值 最小值 均值 标准偏差
水分含量(%) 79.0 65.3 73.3 1.8
肉品水分含量的近红外光谱数据采集
实验材料和设备
1.实验环境:室温25 C左右且通风良好的实验室;
2.实验材料与设备如表4所示:
表4-肉品水分含量的化学方法实验材料和设备
样品预处理及近红外光谱采集方法
1.将上述注水肉样品和正常肉样品放入绞肉机中绞碎,称重分为60份样品;
2.打开近红外光谱分析仪并开启计算机,运行相关程序,经过设备检测和预热后,进入软件操作界面;
3.将上述样品分别装入托盘(肉泥厚度为17mm),放入近红外光谱分析仪中;
4.建立测量样品集并设置参数后,点击“开始扫描”,约40s即可采集到一份样品的光谱信息,即样品光谱图,每个样品扫描10次取平均值。
5.每次扫描完后,将托盘上的肉泥残留物清理干净,以保证每次扫描光谱的准确性。
将采集到的样品原始光谱图进行均值中心化预处理后,得,正常肉和注水肉样品的光谱图变化趋势相似,但是吸光度存在明显的差异。这种差异主要是因为水分含量的变化所引起的,所以,实验证明采用近红外光谱检测肉品水分含量可以作为除化学方法以外,检测水分含量的方法,其预测模型的检测值可以作为识别注水肉的重要指标。
近红外光谱数据预处理
近红外仪器采集到的原始光谱虽然含有大量关于样品待测成分的有用信息,但是其中也含有一些无用的干扰信息(如光的影响、样品的漫反射等)。这些干扰信息不仅对光谱信息产生干扰,而且很可能导致光谱吸收曲线的基线漂移和不重复,从而影响预测模型的有效建立和对待测样品成分的预测。所以,近红外光谱原始数据的预处理是进行近红外光谱分析的基础,是准确分析样品成分、建立精确预测模型的保证。近红外光谱原始数据的预处理方法包括平滑(Smoothing)、一阶微分、二阶微分、多元散射校正(MultiplicativeScatter Correction,MSC)、标准化(Autoscaling)和均值中心化(MeanCentering)[15]等。
平滑(Smoothing)处理方法
平滑预处理常用的算法是窗口移动平均法和Savitzky-Golay卷积平滑法,其作用是消除光谱中的噪声,从而提高光谱的信噪比。其中使用效果较好的是Savitzky-Golay卷积平滑法,基本思想是采用多项式来对移动窗口内的数据,并进行多项式最小二乘的拟合。但是,在使用平滑预处理时,对于平滑点的设置很关键,如平滑点过大光谱过于平滑将使有用信息大大减少,如平滑点过小噪声很难消除。
微分预处理方法(Derivative)
微分预处理方法包括一阶微分(1stdcrivative)和二阶微分(2ndderivative)处理。求光谱微分(导数)的方法有:直接差分法和Savitzky-Golay卷积求导法。直接差分法适用于波长采样点较多的近红外光谱,对于波长采样点稀疏的近红外光谱,该方法求得的微分(导数)会存在较大的误差,此时应采用Savitzky-Golay卷积求导法处理近红外光谱。虽然微分方法可以有效地消除基线和其它背景带来的干扰信息、分辨光谱的重叠峰以及提高分辨率和灵敏度,但这种方法也会引入噪声,从而降低了信噪比。所以,要依据吸收曲线选取适合的差分宽度。如果所设差分宽度过小,会使噪声很大,从而影响预测模型的精度;如果差分宽度过大大,会失去大量的有用信息,从而影响预测模型的精度。其计算公式为:
一阶微分:
xi,1st=(xi-xi+k)/k     (9)
二阶微分:
xi,2nd=(xi+k-2xi+xi-k)/k2     (10)
均值中心化(Mean Centering)和标准化(Autoscaling)处理方法
光谱均值中心化是将样品的近红外光谱减去校正集的平均光谱,使其校正集光谱矩阵X的列平均值为零。光谱标准化是在均值中心化的基础上再除校正集光谱矩阵X的标准差,使光谱矩阵的列平均值为零,方差为1。由于这种方法将光谱中所有波长变量赋以相同的权值,所以其适用于低浓度成分的模型建立。两种预处理方法的计算方式为:
均值中心化(Mean Centering)
(1)计算校正集样品的平均光谱
x ‾ j = Σ i = 1 n x ij n - - - ( 11 )
式中:n为校正集样品数,j=1,2,...,m。
(2)计算未知样品光谱xi(1×m)的均值中心化光谱xi,mean
x i , mean = x i - x ‾ - - - ( 12 )
标准化(Autoscaling)
(1)按式(11)计算校正集样品的平均光谱
(2)计算校正集样品的标准偏差光谱S:
S j = Σ i = 1 n ( x ij - x ‾ j ) 2 n - 1 - - - ( 13 )
式中:n为校正集样品数,j=1,2,...,m。
(3)计算未知样品光谱的标准化光谱xi,autoscaled
x i , autoscaled = x i - x ‾ S - - - ( 14 )
多元散射校正(MSC)处理方法
多元散射校正(MSC)不仅可以有效地除近红外光谱中样品颗粒分布不均匀以及颗粒大小所产生的散射影响,而且还可以对透射光谱测量过程中的光程长误差进行修正。
其主要是通过以下算法将近红外光谱中的散射信息与化学吸收信息进行分离,并且设散射系数在所有波长处都是相同的,具体计算方法如下:
计算采集到的样品光谱的平均光谱:
x ‾ = Σ i = 1 n x i n - - - ( 15 )
对上述平均光谱作回归计算:
x i = a i x ‾ + b i - - - ( 16 )
对每一条光谱作多元散射校正计算:
x i , MSN = x i - b i m i - - - ( 17 )
由上述算法可知,多元散射校正虽然有很多优点,但是由于其假设散射波长和样品的浓度变化无关,所以使其具有一定的局限性,不适用于成分变化较宽的样品。
不同近红外光谱预处理方法结果比较
实验表明,采用原始光谱数据建立的预测模型性能较差,而采用预处理方法后所建立的模型性能均有提高。其中,经过MSC处理后的模型相关系数明显提高,RMSEVC和RMSEP均有降低,这主要是因为MSC消除了样品的散射差异;经过均值中心化和标准化处理后的模型性能提高,是因为它们可以消除光谱中线性平移的影响;经过微分处理后的模型性能有所提高,是因为其可以消除由于样品厚度不一致而引起的光谱变化。分析可知,在本发明实施例中,采用MSC+均值中心化的预处理方法所建立的模型最佳,校正集和验证集的相关系数分别为0.9820、0.9731,RMSEVC和RMSEP分别为0.326、0.351,可见两种方法处理后的光谱数据去除了一些干扰信息使模型更加精确。
表5-采用不同预处理方法建立预测模型结果对比
基于近红外光谱的肉品水分含量预测模型的建立
本发明主要采用偏最小二乘法(PLS)建立预测模型。
偏最小二乘法(PLS)算法
本发明采用的偏最小二乘法(PLS)的基本思想是对光谱矩阵X进行分解,消除无用信息,同时对浓度矩阵Y作同样的处理,消除其含有的无用信息,并且在对光谱矩阵X分解的同时时也将浓度矩阵Y所产生的影响考虑在内。其算法可以归纳为:
对光谱矩阵X和浓度矩阵Y进行分解,其模型为:
X光谱=TP+E1
Y浓度=UQ+E2     (18)
式中:T代表光谱矩阵X的得分矩阵;U代表浓度矩阵Y的得分矩阵;P代表光谱矩阵X的载荷矩阵;Q代表浓度矩阵Y的载荷矩阵;E1代表光谱矩阵X的PLS拟合残差矩阵;E2代表浓度矩阵Y的PLS拟合残差矩阵。
将T和U进行线性回归,其中:
U=TB
B=(TtT)-1TtY     (19)
根据式(20)预测未知样品i的浓度值,计算方法为:
Yi=TiBQ     (20)
根据以上算法进行预测,首先根据光谱矩阵X的载荷矩阵得到未知光谱的光谱矩阵Xi对应的得分矩阵Ti,根据式即可得到浓度值的预测值。
由上述算法可知,PLS将光谱矩阵X主成分直接与浓度矩阵Y关联,从而使克服了主成分回归法只对光谱矩阵X进行分解的缺点。其优点在于,可以将多维空间数据降低为低维空间数据,从而使可以很好地处理非线性问题;通过主成分选取,可以去除光谱矩阵和浓度矩阵的干扰信息,仅选取有用主成分参与建模,从而提高模型的精确性;适用于处理变量多而样品数量少的问题。在实际应用中,建立PLS预测模型需要确定模型的最佳主因子数。
一般地,通过交互验证法(LOOCV)来确定最佳主因子数[7]:
从校正集的n个样品中随机的剔除一个样品i,其中i=1,2,...,n;
将其余的n-1个样品和h个主因子建立预测模型,其中h=1,2,...,m;
利用该预测模型预测所剔除的样品i;
对校正集中的每一个样品进行上述测试并将每次剔除的样品组成交互验证集;
按式(21)计算主因子数为h(h=1,2,...,m)时模型的预测残差平方和PRESS值:
PRESS = Σ i = 1 n ( y ^ i - y i ) 2 - - - ( 21 )
式中:yi为样品i待测成分实际值;为样品i待测成分预测值。
根据以上方式比较各主因子的预测残差平方和PRESS值,具有最小预测残差平方和PRESS值的因子就是该模型的最佳主因子数。
肉品水分含量预测模型的光谱区间的选择
向后区间偏最小二乘筛选法(BiPLS)
根据上述偏最小二乘算法,将光谱数据进行MSC+均值中心化预处理后,建立了基于近红外光谱的肉品水分含量预测模型。其模型评价指标为:校正集和验证集的相关系数分别为0.9820、0.9731,RMSEVC和RMSEP分别为0.326、0.351。但是,由于建模采用了包含850-1048nm的全波长光谱数据,使模型的计算量大、较为复杂且精确度有待提高。同时,对于一些干扰信息(如电噪声、仪器环境等)很难在预处理中全部清除,并且一些区域有用信息很弱(如缺乏与待测成分的相关关系)属于无用信息。
所以,为了优化所建立的模型,可以对光谱区域通过特定的方法进行优选。这样,一方面可以减少建立模型所需的数据量,达到简化模型的目的;另一方面可以去除光谱区间中不相关的信息或变量(如干扰)对模型的不利影响,提高模型的精确性和预测性能。本发明优选采用向后区间偏最小二乘筛选法(BiPLS)选取光谱区间,其算法可以概括为:
1.对采集到的原始近红外光谱进行预处理;
2.在全光谱范围内,建立待测成分的PLS预测模型;
3.在整个光谱区间上,划分n个等宽子区间;
4.每次只去掉一个子区间,在余下的n-1个区间上进行PLS回归,得到n个区间的回归模型;
5.以交互验证时的均方根误差RMSECV值为所建立模型的衡量标准,取精确度最高时所去掉的那个子区间为第一去掉子区间;
6.再将余下子区间逐一去除,并在新的联合区间上进行偏最小二乘回归,取精确度最高时所去掉的那个子区间为第二去掉子区间。如此进行,直至最后一个子区间模型;
7.将比较上述每个新模型的RMSECV值,将所有模型中RMSECV值最小的区间确定为优化区间,并在其上进行PLS建模。
向后区间偏最小二乘筛选法(BiPLS)结果分析
对光谱数据进行MSC+均值中心化预处理后,将实验采集到的原始光谱的850-1048nm全波长区域划分为10个子区域,采用BiPLS对光谱区间进行筛选。根据最小RMSECV值原则,选取区域2,3,5,6,7,8共6个子区域建立PLS模型,此时模型预测性能最佳。
此时PLS模型的RMSECV、RMSEP分别为0.293、0.161,交互验证集样本的预测值和实际值之间的相关性rc、预测集样本的预测值和实际值之间的相关性rp分别为0.9931、0.998。可见,优化后的模型建模所需的变量数有所减少,而且模型的预测性能和精确度相比之前的模型也有了很大的提高。
所以,采用向后区间偏最小二乘筛选法(BiPLS)选取光谱区间进行建模不但可以减少建立近红外光谱模型所需的运算时间和计算量、将包含噪声过大的光谱区域有效地消除,而且可以在最佳光谱区域上建立的模型预测性能、精确度大大提高。
近红外光谱的定量分析的误差和解决方案
近红外光谱定量分析建立的预测模型主要存在的误差有:光谱测量误差、采样误差和校正误差。其中,光谱测量误差是指由于测量仪器的原因(如仪器老化、光学元件污染、损坏等)造成的测量误差;采样误差是指由于样品处理不当(如有杂质、不均匀)所产生的误差;校正误差主要是指在建模过程中,由于校正集或样品集数量不够或者存在奇异点等等的原因,使模型存在较大误差。
由此可见,虽然利用近红外光谱可以对肉品的水分做出预测,但是这种方法存在一定误差且需要不断的进行模型维护和更新。如果只采用近红外光谱数据作为依据,那么误差就很有可能导致识别结果的错误。所以,对于上述误差,本发明可选用较高质量的测量仪器、具有一定代表性的样品集校正和验证模型,采用适合的建模方法来最小化误差,同时采用多传感器信息融合的方法,将肉品的颜色值和pH值作为辅助参量,采用SVM作为信息融合算法,建立了稳定性和实用的广泛性有所提高地注水肉识别模型。
单独采用图像、近红外光谱或者PH值识别注水肉准确性不高,实际中不能代替化学识别方法进行广泛应用,因此,步骤S18的主要目的是对经上述各种方式获取的数据进行融合处理,以准确识别注水肉,具体地,本发明采用多传感器信息融合技术对上述各数据进行融合处理,具体分析如下:
多传感器信息融合技术的结构及不同层次
多传感器信息融合具有多种结构,主要包括串行、并行和混合型三种。串行融合结构是指每个传感器在接收来自自身的输入以外,还要接收来自上一级传感器的信息,即每个传感器在接收处理信息的同时,也要融合上一级信息,最后一级传感器将综合所有信息并输出系统最终融合结果。但由于采用这种结构,上一级传感器的输出信息会对下一级传感器产生很大影响。所以,如果来自上一级的输出信息有误或者包含较多干扰信息,将会严重影响融合结果的准确性。
并行融合结构是指每个传感器的输出信息分别传输到信息融合层,各个传感器之间相互独立互不影响,信息融合层对这些信息进行综合处理分析后,输出系统最终融合结果。混合型融合结构串行融合结构和并行融合结构的结合。
由于来自多传感器的信息形式可能各不相同,所在的信息层次也不尽相同,所以多传感器信息融合技术具有不同的层次结构,如数据层融合、特征层融合和决策层融合以及多层次融合。
数据层融合是指直接对来自各个传感器的原始信息进行综合分析得出融合结果,属于数据层上的信息融合。这种层次结构的融合数据量较大且需要校准精度,同时各个传感器的数据类型以及量纲要相同,属于低层次的融合,一般用于同类别的传感器之间的信息融合。
特征层融合是指将各个传感器的原始信息分别提取特征信息后,对各个特征信息进行综合分析得出融合结果,属于特征层上的信息融合,这种层次结构的融合是对原始信息的特征提取为基础,压缩了信息量,所得出的融合结果较为准确。
决策层融合是指按照具体问题的需要,通过利用特征层融合所提供的信息进行分析处理并得出融合结果,属于高层次的融合。这种层次结构的融合信息量小,有较强的抗干扰能力,对各个传感器的依赖性较小且容错能力强。但是,所获得的信息损失较大,部分有用信息可能在前两个层次结构中丢失,对融合结果影响。
多层次融合是将数据层融合、特征层融合和决策层融合结合在一起的一种混合型层次结构。如图3所示,对4个传感器进行数据融合(其中传感器1和传感器2为同类别的传感器),可以联合运用三种融合层次对各个传感器进行融合处理,处理过程为:对于相似的两个传感器进行数据层融合,提取特征信息,之后与第3个传感器提取的特征信息结合进行特征层融合,得到分析说明结果,最后将其与第4个传感器得到的分析说明结果进行决策层融合,即可得到最终融合结果并输出。
对于层次结构的选取,主要是依据所使用的传感器类型及特性、得到数据信息的类型以及所使用的融合方法等具体情况进行选择。
多传感器信息融合技术的数据融合方法
多传感器信息融合是将来自不同传感器的数据信息进行综合和分析,并得出对被测对象的最佳估计结果。所以,信息融合的过程实质上是对不确定性分析、推理和综合结果的过程。多传感器信息融合中,数据融合方法用于处理不确定性。
可选地,本发明采用SVM(支持向量机分类)人工神经网络方法建立预测模型以对肉品的水分含量数据、PH值和颜色信息进行融合处理,并输出处理结果以判断肉品是否为注水肉。
虽然,只利用近红外光谱就可以对肉品的水分含量做出预测,但是这种方法存在一定误差且需要不断的进行模型更新和维护来保持预测结果的准确。因此,结合上述内容,将近红外光谱检测到的肉品水分含量数据、通过图像检测获得的肉品颜色信息(H、I、S、R、G、B)平均值和标准偏差以及测量到的肉品pH值作为输入特征,采用SVM算法进行多传感器信息融合,建立基于多传感器数据融合的注水肉识别模型(支持向量机分类预测模型),对肉品是否为注水肉进行快速识别。
支持向量机
支持向量机(Support vector Machine,SVM)是源于统计学理论的用于解决两类问题的学习算法,由Vapnik以及Chemielewaski于1992年提出。不同于其他机器学习算法,支持向量机在VC维(Vapnik-Cherovnenkis)基础上,以结构风险最小化(SRM)准则来构造分类超平面,从而使最大化两类样本之间的分类间隔(Margin)。
所有机器学习本质上就是建立一个未知问题的预测模型以预测这一问题的结果,并使预测结果与实际结果之间的误差即为实际风险最小。根据SLT准则,实际风险(Expectede Risk)由经验风险(Empirical Risk)和置信范围组成。其中,经验风险表示分类器与训练样本的误差;置信区间表示可以信任分类器结果的程度,其与训练样本数和学习机器的VC维有关。
结构风险最小化(Structural Risk Minimization)
在传统的机器学习中,为了保证经验风险最小,常使用同一样本集进行学习,这样做的结果是学习机器对样本的分类能力很好,及经验风险很小,但是对未知样本的分类能力就很差。这主要是因为由于重复使用同一样本,导致训练后的学习机器很复杂,VC维过高,从而导致实际风险很大。
为了解决上述问题,在VC维中定义了风险边界,其表达式如下:
R(x)≤Remp(x)+Φ(n/h)     (22)
式中:R(x)为实际风险;Remp(x)为经验风险;Φ(n/h)为VC置信值。
根据式(22)所示,为了取得最小的实际风险就要同时使经验风险和VC置信值的和最小。而SVM机器学习就是将学习目标从经验风险最小化变为寻求结构风险最小化(Structural Risk Minimization),从而得到实际风险最小的。其中,最小的结构风险就是经验风险与置信值的和的最小,结构风险最小化(SRM)准则可概括为:
构造一个嵌套的假设空间结构:
H 1 ⋐ H 2 ⋐ H 3 . . . ⋐ H n - - - ( 23 )
该嵌套的空间结构满足:
h(n)≤h(n+1)     (24)
其中:h(n)为Hn空间的VC维。
3.设计函数集中的某种结构每个子集Hn都能取得最小的经验风险;
4.选取置信范围最小的Hi
SVM支持向量机的构造
线性SVM支持向量机的构造
线性SVM支持向量机用于解决线性可分问题,如图4所示,其中黑色圆点和白色圆点分别表示两类样本,线性SVM支持向量机训练的目的是找出可以将两类样本分开的最优超平面。
在图4所示的空间中,存在点(w,b)使,其中的样本数据x1,x2...xk满足:
并假设该空间的判定函数集合为:
f(x;w,b)=sign(wTx+b)     (27)
约束条件为:
min i = 1 , . . . , , k | w T x i + b | = 1 - - - ( 28 )
下面应用结构风险最小化原则来构造规范超平面:
定义D为包围所有样品数据的最小N维球面的直径,则上述函数集合可表示为:
f(x;w,b)=sign(wTx+b)     (29)
||w||≤S
其VC维h满足的边界条件为:
h≤min([D2S2],N)+1     (30)
由此可知,一个样本数据x到(w,b)超平面的距离为:
d ( x ; w , b ) = | w T x + b | w - - - ( 31 )
将式(29)代入上式可得,规范超平面与其最近样本数据点之间的距离是以及两类样本之间的距离是其称为分类间隔(Margin)。
根据上述公式可知,||w||越小,VC维越小。即在所有规范超平面中,具有最小||w||的超平面可以满足风险边界最小,并满足约束条件|yi(wTxi+b)|≥1,i=1,2,...,k的分类面H为最优超平面,位于超平面H1和H2上的样本数据点则成为支持向量(Support Vector)。
由此,求解上述最优超平面的问题可以表示为如下约束优化问题:
min φ ( w ) = 1 2 | | w | | 2 - - - ( 32 )
yi(wTxi+b)≥1
其拉格朗日方程为:
L p = 1 2 | | w | | 2 - Σ i = 1 k c i y i ( w T x i + b ) + Σ i = 1 k c i - - - ( 33 )
其中:ci为拉格朗日正数乘子,对w和b求微分得到:
w = Σ i = 1 k c i y i x i - - - ( 34 )
Σ i = 1 k c i y i = 0 - - - ( 35 )
根据KKT结论:
[yi(wT*xi+b*)-1]ci *=0,i=1,2,...k     (36)
由于每个拉格朗日乘子所对应的样本数据点为支持向量,如图4所示,位于H1和H2为上的数据点支持向量,其他样本则分别位于所属类别的两边(H1和H2)。这些支持向量为训练样本中的关键点,其所在的平面就是最优超平面。对于每个支持向量(xi,yi),由式(36)可知其最优的b解b*
b*=yi-w*Txi     (37)
最终,由上式以及式(34)和(35)可将式(27)转化为下式:
f ( x ; w , b ) = sign ( Σ i = 1 k y i c i x T x i + b ) - - - ( 28 )
非线性SVM支持向量机的构造
非线性SVM支持向量机用于解决线性不可分问题,通常的方法是将用低维空间的非线性问题转化为高维空间的线性问题,然后在这个新空间中求解最优超平面。这种非线性转化是通过定义适当的内积核函数实现的,令G为内积核函数(inner-product kernel),将其定义为:
将其代入式(28)得新空间中的函数集合为:
f ( x ) = sign [ Σ i = 1 k y i c i * G ( x , x i ) + b * ] - - - ( 30 )
由此可知,在非线性问题中内积核函数的引入和选择非常重要,选择正确的内积核函数可以使原空间到高维空间的非线性映射计算量大大减少。常用的内积核函数有多项式内核、线性内核以及径向基函数内等。
在形式上,SVM支持向量机采的分类函数与神经网络形式相似,其输出层是若干隐层节点的线性组合,而隐层则是输入样本与支持向量的内积,所以也称之为支持向量机神经网络。
支持向量机的优点
SVM支持向量机实现了结构风险最小化准则,具有较好的学习能力以及良好的泛化性能,其优点在于:SVM可以控制学习的复杂度同时不受空间维数的影响限制;SVM求解为全局最优解,克服了其他算法如BP网络存在局部极小的问题;SVM还可以解决高维的模式问题。
支持向量机分类预测模型的建立
综上所述,将肉品颜色信息(H、I、S、R、G、B)(包括各分量的平均值和标准偏差)、肉品pH值以及肉品利用近红外光谱模型预测的肉品水分含量,共14个特征分量作为SVM支持向量机分类预测模型的输入特征,使用实验采集到的60组样品作为样品集,其中选取40组作为训练集,20组作为预测集,即共60个样本,每个样本含有14个特征分量。在Matlab中建立支持向量机分类预测模型,由于内积核函数的选择直接影响分类器的性能,所以,采用多种内积核函数进行建模,并比较其结果。
采用不同的内积核函数建立支持向量机分类预测模型,将预测集20组样本和采用交互验证方法的验证集作为输入得到的预测分类结果准确率如表6所示。可见,采用径向基函数作为核函数的预测模型精确度较高。因此,本发明采用径向基函数作为支持向量机分类预测模型的核函数,并对其两个参数惩罚参数c和核函数参数g进行选取,得到当c=1,g=2时,建立的SVM分类预测模型准确性较好,Accuracy=95%。
表6-采用不同内积核函数的结果比较
为进一步验证支持向量机分类预测模型的泛化能力,本发明使用交叉验证方法对其进一步验证,CV Accuracy=87.5%。可见,肉品颜色值(H、I、S、R、G、B)平均值和标准偏差、肉品pH值以及肉品利用近红外光谱模型预测的肉品水分含量作为特征分量时,支持向量机分类预测模型具有较好的泛化能力。
但是,由于只有两类,采用支持向量机进行分类应该获得更好的预测性能,预测模型的误差很大程度上是因为人工设定核函数参数造成的。所以,为了优化模型,寻找模型最佳惩罚参数c和核函数参数g,本研究采用PSO粒子群优化算法寻找最佳惩罚参数c和核函数参数g。
基于PSO粒子群算法的模型优化
PSO算法中的每一个“粒子”都代表空间的一个潜在的解,每个粒子都有一个与其对应的、由适应度函数决定的适应度值。每个粒子的速度决定了粒子移动的方向以及位置,并且粒子的速度随群体中的粒子移动的情况进行动态的调整,直到寻找到最优解或满足预设条件,从而实现个体在解空间中的寻优。具体寻优过程如下:
1.在解空间中初始化一群粒子(设置种群规模和迭代次数),每个粒子包括位置、速度、适应度值三个参数,其中适应度值由适应度函数计算而得,该适应度值的大小代表粒子的优劣程度;
2.在解空间中,所有粒子经初始化后开始运动,每个粒子更新个体的位置的方式是:追踪解空间中粒子的个体极值(Pbest)、群体极值(Gbest);其中,个体极值(Pbest)为个体所历经的位置中对应适应度函数的值(即适应度值)最优的位置,群体极值(Gbest)为在种群中所有粒子所寻找到的对应适应度函数的值(即适应度值)最优的位置;
更新粒子位置并计算适应度值,并且将新粒子的适应度函数的值(即适应度值)与个体极值(Pbest)和群体极值(Gbest)对应的适应度函数的值(即适应度值)比较,更新个体极值(Pbest)和群体极值(Gbest)位置;
重复步骤3直到满足终止条件,即找到最优解。
上述算法的数学模型为:
假设解空间为M维,设置n个粒子组成粒子种群X=(X1,X2,...,Xn),其中第i个粒子用向量Xi=(xi1,xi2,...,xim)T表示,第i个粒子的速度用向量Vi=(vi1,vi2,...,vim)T表示,个体极值(Pbest)用向量Pi=(pi1,pi2,...,pim)T表示,群体极值(Gbest)用向量Gi=(gi1,gi2,...,gim)T表示,适应度值由目标函数计算得到。在迭代过程中,粒子更新的计算公式如下:
V im k + 1 = wV im k + c 1 r 1 ( P im k - X gm k ) + c 2 r 2 ( P gm k - X gm k ) - - - ( 31 )
X im k + 1 = X im k + V im k + 1 - - - ( 32 )
式中:w为惯性权值;m=1,2,...M;i=1,2,...,n;k为当前迭代次数;Vim为粒子速度;c1和c2为加速度因子;r1和r2为[0,1]之间的随机数。为了防止寻找范围过大,一般限定在一定区域内,如位置限定在区间[-Xmax,Xmax],速度限定在[-Vmax,Vmax]。
为了平衡算法的全局和局部搜索能力,进一步改进了权值的计算方式,即线性递减惯性权值(LDIW),其计算方式有:
w(k)=wstart-(wstart-wend)*k/Tmax     (33)
w(k)=wstart-(wstart-wend)(k/Tmax)2     (34)
w(k)=wstart+(wstart-wend)(2k/Tmax-(k/Tmax)2)     (35)
式中:wstart为初始惯性权值;wend为迭代至最大次数的惯性权值;k为当前迭代数;Tmax为最大迭代数。
一般地,设置wstart=0.9,wend=0.4,以便随着迭代次数的进行,惯性权值由0.9减小到0.4,从而使在迭代初期有较大权值进行全局搜索、后期有较小的权值进行更加精确的局部搜索。
5.3.2基于PSO粒子群算法的优化模型
利用PSO粒子群算法对已建立的支持向量机分类预测模型进行优化,即寻找支持向量机分类预测模型的最佳惩罚参数c和核函数参数g,并利用最佳惩罚参数c和核函数参数g来优化支持向量机分类预测模型,提高其精确性。其中,设置初始惩罚参数c和核函数参数g分别为1、粒子数为30、迭代次数为1000、wstart=0.9、将交互验证集的准确率(Accurancy)作为PSO粒子群算法的适应度函数,寻找已建立模型的惩罚参数c和核函数参数g的最优解。
将上述算法在Matlab中实现,经过PSO粒子群算法优化后的支持向量机分类预测模型的Accuracy=100%,CV Accuracy=92.5%,即模型对预测集样本的预测结果均正确,并且交互验证的准确率有所提高,得到最佳惩罚参数c和核函数参数g分别为36.5007和0.01。
经对比,经过优化后的支持向量机分类预测模型Accuracy(精确性)从95%提高到100%,即对预测集20个样品的分类预测结果与实际分类一致,同时确定了最佳惩罚参数c和核函数参数g分别为36.5007和0.01,即这两个参数选取上述值可以使支持向量机分类预测模型具有最佳的预测性能和泛化能力。所以,采用PSO粒子群优化算法寻找最佳惩罚参数c和核函数参数g,不但可以解决人工选取惩罚参数c和核函数参数g没有相关的理论依据、只能通过人工反复试验选取的问题,而且,还可以优化已建立的支持向量机分类预测模型、提高模型的精确度和泛化能力。
参考图5,本发明还提供了一种注水肉检测装置,可用于实现上述注水肉检测方法。如图5所示,该注水肉检测装置包括:
近红外光谱检测模块52,用于根据肉品的近红外光谱采集所述肉品的水分含量数据;
PH值测量模块54,用于测量所述肉品的PH值;
图像检测模块56,用于采集肉品的图像,并根据采集的图像获取肉品的颜色信息;
注水肉识别模块58,用于将所述肉品的水分含量数据、PH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉。
可选地,图像检测模块56获取的颜色信息包括图像中各像素的红色分量、蓝色分量、绿色分量、色调分量、饱和度分量和/或亮度分量。
可选地,还包括优化模块,用于通过粒子群优化算法对所述支持向量机分类预测模型进行优化。
可选地,还包括预测模型建立模块,用于建立以近红外光谱作为输入、以水分含量数据作为输出的预测模型。
近红外光谱检测模块52具体用于:
获取肉品的近红外光谱;
通过多元散射校正算法或均值中心化算法对获取的近红外光谱进行平滑处理;
将平滑处理后的近红外光谱作为所述预测模型的输入获取所述预测模型的输出值;
根据所述预测模型的输出值获取所述肉品的水分含量数据。
本发明的注水肉检测装置的工作原理与上述对注水肉检测方法的相关描述相同,不再赘述。
综上所述,本发明的目的是对注水肉进行快速、准确的识别。经过实验分析,确定使用肉品水分含量、肉品pH值和肉品颜色值为识别肉品是否为注水肉的特征参量,并将其作为SVM支持向量机分类预测模型的输入分量,并以PSO粒子群优化算法对模型进行优化,最终实现了对肉品是否为注水肉的快速、准确识别,至此基于多传感器数据融合的注水肉识别模型构建完成。
本发明的实施例中,建立基于近红外光谱的肉品水分含量预测模型的目的是为了解决肉品水分含量检测复杂、耗时的问题。使用近红外光谱可以对肉品的水分含量做快速的预测,但是由于近红外光谱方法的局限性和单一性,使其的预测结果存在误差,为了最小化误差,提高识别结果的正确性,引入多传感器数据融合技术来对肉品做全面的分析。即在以肉品水分含量为依据的同时,加入计算机视觉采集到的肉品颜色值,以及pH计采集到的肉品pH值作为分析肉品是否为注水肉的依据,可以较全面地对肉品进行分析,做出较为正确的识别。本发明选用SVM支持向量机进行数据融合的主要原因是其善于解决分类问题,经过优化后的SVM支持向量机分类预测模型对预测集的识别结果较为准确,可以在实际应用中使用,存在一定的现实意义。
如下表所示,将本发明采用的方法和常用的其它两种方法相比较可知,这种基于多传感器信息融合的注水肉快速检测方法可以在较短的时间内对肉品是否为注水肉做出快速且较为准确的识别,具有一定的可行性。
表7-三种检测方法的比较结果
在本发明上述各实施例中,实施例的序号仅仅便于描述,不代表实施例的优劣。对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的装置和方法等实施例中,显然,各部件或各步骤是可以分解、组合和/或分解后重新组合的。这些分解和/或重新组合应视为本发明的等效方案。同时,在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
最后应说明的是:虽然以上已经详细说明了本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此所述的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。

Claims (8)

1.一种注水肉检测方法,其特征在于,包括:
近红外光谱检测步骤:根据肉品的近红外光谱采集所述肉品的水分含量数据;
pH值测量步骤:测量所述肉品的pH值;
图像检测步骤:采集肉品的图像,并根据采集的图像获取肉品的颜色信息;
注水肉识别步骤:将所述肉品的水分含量数据、pH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉;
所述注水肉识别步骤之前包括:
通过粒子群优化算法对所述支持向量机分类预测模型进行优化。
2.根据权利要求1所述的注水肉检测方法,其特征在于,所述图像检测步骤获取的颜色信息包括图像中各像素的红色分量、蓝色分量、绿色分量、色调分量、饱和度分量和/或亮度分量。
3.根据权利要求1所述的注水肉检测方法,其特征在于,所述图像检测步骤包括:通过邻域平均算法、中值滤波算法、高斯滤波算法、灰度最小方差的均值滤波算法或者高斯模板平滑算法对采集的图像进行平滑处理,并根据平滑处理后的图像获取肉品的颜色信息。
4.根据权利要求1所述的注水肉检测方法,其特征在于,所述近红外光谱检测步骤之前包括:预测模型建立步骤,建立以近红外光谱作为输入、以水分含量数据作为输出的预测模型;
所述近红外光谱检测步骤包括:
获取肉品的近红外光谱;
通过多元散射校正算法或均值中心化算法对获取的近红外光谱进行平滑处理;
将平滑处理后的近红外光谱作为所述预测模型的输入获取所述预测模型的输出值;
根据所述预测模型的输出值获取所述肉品的水分含量数据。
5.根据权利要求4所述的注水肉检测方法,其特征在于,所述预测模型建立步骤通过偏最小二乘算法建立所述预测模型。
6.根据权利要求5所述的注水肉检测方法,其特征在于,所述预测模型建立步骤还包括:通过向后区间偏最小二乘筛选法选取能够使预测模型的拟合精度最高的光谱区间,并在选取的光谱区间上进行建模以形成所述预测模型。
7.一种注水肉检测装置,其特征在于,包括:
近红外光谱检测模块,用于根据肉品的近红外光谱采集所述肉品的水分含量数据;
pH值测量模块,用于测量所述肉品的pH值;
图像检测模块,用于采集肉品的图像,并根据采集的图像获取肉品的颜色信息;
注水肉识别模块,用于将所述肉品的水分含量数据、pH值和颜色信息作为支持向量机分类预测模型的输入特征获取所述支持向量机分类预测模型的输出值,并根据所述支持向量机分类预测模型的输出值判断所述肉品是否为注水肉;
还包括优化模块,用于通过粒子群优化算法对所述支持向量机分类预测模型进行优化。
8.根据权利要求7所述的注水肉检测装置,其特征在于,还包括预测模型建立模块,用于建立以近红外光谱作为输入、以水分含量数据作为输出的预测模型;所述近红外光谱检测模块具体用于:
获取肉品的近红外光谱;
通过多元散射校正算法或均值中心化算法对获取的近红外光谱进行平滑处理;
将平滑处理后的近红外光谱作为所述预测模型的输入获取所述预测模型的输出值;
根据所述预测模型的输出值获取所述肉品的水分含量数据。
CN201310136236.3A 2013-04-18 2013-04-18 注水肉检测方法和装置 Expired - Fee Related CN103235095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310136236.3A CN103235095B (zh) 2013-04-18 2013-04-18 注水肉检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310136236.3A CN103235095B (zh) 2013-04-18 2013-04-18 注水肉检测方法和装置

Publications (2)

Publication Number Publication Date
CN103235095A CN103235095A (zh) 2013-08-07
CN103235095B true CN103235095B (zh) 2015-08-12

Family

ID=48883146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310136236.3A Expired - Fee Related CN103235095B (zh) 2013-04-18 2013-04-18 注水肉检测方法和装置

Country Status (1)

Country Link
CN (1) CN103235095B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103558177B (zh) * 2013-11-22 2016-04-06 中国农业大学 生肉组织水分近红外检测装置及检测方法
CN103645307B (zh) * 2013-12-09 2015-02-18 商务部流通产业促进中心 一种注水生猪的鉴别方法
CN104359855B (zh) * 2014-11-03 2017-06-06 中国农业大学 一种基于近红外光谱的注水肉检测方法
CN105866063A (zh) * 2016-04-08 2016-08-17 北京工商大学 香肠品质等级检测方法
CN108152243B (zh) * 2017-12-12 2020-06-30 福建省测试技术研究所(福建省分析测试中心) 一种复配体系非离子表面活性剂定性测定方法
CN108226408B (zh) * 2017-12-28 2020-10-20 青岛三统万福食品科技股份有限公司 一种肉类品质检测装置
CN108318433B (zh) * 2018-01-24 2021-02-23 大连工业大学 利用高光谱图像技术检测三文鱼中注水量的方法
CN108535258A (zh) * 2018-03-16 2018-09-14 上海交通大学 一种快速无损判别区分软玉产地的方法
CN108982406A (zh) * 2018-07-06 2018-12-11 浙江大学 一种基于算法融合的土壤氮素近红外光谱特征波段选取方法
CN109668859A (zh) * 2019-03-03 2019-04-23 西南大学 基于svm算法的花椒产地和品种的近红外光谱识别方法
CN112986159A (zh) * 2019-12-13 2021-06-18 南京酷派软件技术有限公司 检测肉类的方法、装置、电子设备及介质
CN112414526B (zh) * 2020-11-13 2022-07-01 迪比(重庆)智能科技研究院有限公司 散袋小包装中药的快速称量方法
CN112634274B (zh) * 2021-03-10 2021-06-04 广东省农业科学院动物科学研究所 一种基于机器视觉的肥育猪肉肉质评价方法及系统
CN113449792A (zh) * 2021-06-28 2021-09-28 四创电子股份有限公司 一种无损快速检测食品质量的方法
CN113922500A (zh) * 2021-09-17 2022-01-11 国网山西省电力公司输电检修分公司 一种输电线路状态多源监测数据接入方法及装置
CN114636618B (zh) * 2022-05-13 2022-09-27 河南银金达新材料股份有限公司 一种性能稳定的pet膜稳定性检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
光谱和成像融合技术检测猪肉中挥发性盐基氮;赵杰文等;《激光与光电子学进展》;20120505;第063003-1页至第063003-6页 *
快速测定肉的新鲜度、病死肉及注水肉的方法;吕自治;《肉类工业》;19941231(第10期);第32页 *

Also Published As

Publication number Publication date
CN103235095A (zh) 2013-08-07

Similar Documents

Publication Publication Date Title
CN103235095B (zh) 注水肉检测方法和装置
CN101915744B (zh) 物质成分含量的近红外光谱无损检测方法及装置
Shi et al. Soil organic carbon content estimation with laboratory-based visible–near-infrared reflectance spectroscopy: Feature selection
CN104374738B (zh) 一种基于近红外提高鉴别结果的定性分析方法
CN105115938B (zh) 一种饲料原料中三聚氰胺掺假定量检测方法
Song et al. Chlorophyll content estimation based on cascade spectral optimizations of interval and wavelength characteristics
Liu et al. A comparative study for least angle regression on NIR spectra analysis to determine internal qualities of navel oranges
Wang et al. Rapid detection of protein content in rice based on Raman and near-infrared spectroscopy fusion strategy combined with characteristic wavelength selection
CN105486655A (zh) 基于红外光谱智能鉴定模型的土壤有机质快速检测方法
CN105784628A (zh) 一种利用中红外光谱检测土壤有机质化学组成的方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
JP6760663B2 (ja) 試料解析装置および試料解析用プログラム
CN105758819A (zh) 一种利用近红外光谱检测土壤的有机组分的方法
Xu et al. A comparison of machine learning algorithms for mapping soil iron parameters indicative of pedogenic processes by hyperspectral imaging of intact soil profiles
Pan et al. Sparse reconstruction using block sparse Bayesian learning with fast marginalized likelihood maximization for near-infrared spectroscopy
CN102854151B (zh) 一种光谱分析中样品集划分的化学计量学方法
CN108827909B (zh) 基于可见近红外光谱与多目标融合的土壤快速分类方法
CN105866043A (zh) 一种利用高光谱技术检测苹果酸味的方法
Zheng et al. Improving the identification accuracy of sugar orange suffering from granulation through diameter correction and stepwise variable selection
Qi et al. Rapid and non-destructive determination of soluble solid content of crown pear by visible/near-infrared spectroscopy with deep learning regression
CN113030011A (zh) 水果糖度快速无损检测方法及检测系统
Lan et al. Machine learning and hyperspectral imaging-aided forecast for the share of biogenic and fossil carbon in solid waste
Cheng et al. Exploration of compressive sensing in the classification of frozen fish based on two-dimensional correlation spectrum
Hu et al. Research on rice seed fullness detection method based on terahertz imaging technology and feature extraction method
CN113049526A (zh) 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150812

Termination date: 20200418

CF01 Termination of patent right due to non-payment of annual fee