CN113607676A - 基于异形比色皿和近红外图像的牛奶成分快速检测方法 - Google Patents

基于异形比色皿和近红外图像的牛奶成分快速检测方法 Download PDF

Info

Publication number
CN113607676A
CN113607676A CN202110891356.9A CN202110891356A CN113607676A CN 113607676 A CN113607676 A CN 113607676A CN 202110891356 A CN202110891356 A CN 202110891356A CN 113607676 A CN113607676 A CN 113607676A
Authority
CN
China
Prior art keywords
image
milk
idf
special
infrared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110891356.9A
Other languages
English (en)
Other versions
CN113607676B (zh
Inventor
刘升
朱远洋
朱怀军
许海杰
盛涛
陈得宝
施圣哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaibei Normal University
Original Assignee
Huaibei Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaibei Normal University filed Critical Huaibei Normal University
Priority to CN202110891356.9A priority Critical patent/CN113607676B/zh
Publication of CN113607676A publication Critical patent/CN113607676A/zh
Application granted granted Critical
Publication of CN113607676B publication Critical patent/CN113607676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • G01N21/03Cuvette constructions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • G01N21/03Cuvette constructions
    • G01N2021/0378Shapes

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于异形比色皿和近红外图像的牛奶成分快速检测方法,通过异形比色皿将短波近红外光进行色散,并使用摄像头采集散射和色散后的光谱图像。图像的垂直像素代表了不同波长光的光强,通过图像边缘检测提取图像垂直条纹特征作为对应的光谱信息。使用梯度提升决策树算法为每个特征分配决策权重。依据牛奶中的各成分对光的吸收波长不同,通过多个波长的光谱信息来确定各营养成分含量。本发明提出的方法保证了测量的高准确性和高稳定性,同时大大缩短了测量时间,降低了成本,减少了产品的体积和重量,使用的检测样品极少且不污染样品。

Description

基于异形比色皿和近红外图像的牛奶成分快速检测方法
技术领域
本发明涉及牛奶成分检测领域,特别是一种基于异形比色皿和近红外图像的牛奶成分快速检测方法。
背景技术
目前,牛奶产品的质量主要依靠生产企业自主检测,并且产品质量的监管难度大。快速便携的牛奶分析方法有助于随时随地对生鲜乳进行检测,不仅帮助养殖户对奶牛个体的健康和饮食进行管理,也为牛奶收购商和质检人员提供了快速抽检工具。
蛋白质和脂肪是乳制品中最重要的营养物质,也是决定乳制品质量的核心指标,直接反映乳制品的质量,这两个成分的检测是乳制品质量检验中首要的工作。凯氏定氮法是通过测定乳制品中氮含量来计算蛋白质含量的方法,是蛋白质检测的常用方法,也是最标准和建立其他检测方法的参照方法。盖勃法是脂肪测定的常用方法,而分析脂肪的参考方法是重量法。这些常用的、传统检测方法需要耗费大量时间,检测一份牛奶样品中的蛋白质和脂肪含量就需要三四个小时甚至几天的时间,不能满足在线、快速和现场等测量的需要。
在牛奶分析方法的研究中,光谱分析技术一直是科研人员的重点研究方向。现有技术中,包括:利用近红外(NIR)光谱和奶粉物理与功能特性,建立了使用偏最小二乘法(PLS)回归的预测模型,来预测各种奶粉样品的细粒径分数、分散性和体积密度;结合牛奶红外(IR)光谱和奶牛基因型预测乳脂组成;使用中红外(MIR)光谱对八种蛋白质进行了定性表征为产品提供质量保证。以及使用MIR检测奶粉掺假问题,识别奶粉中的少量三聚氰胺,和预测牛乳的详细矿物成分,具体包括:利用荧光光谱和它的寿命来区分羊奶粉与牛奶粉的欺诈行为,分析奶粉及其成分;基于荧光技术研究牛奶随时间的降解,准确地预测牛奶的pH值。还有很多研究致力于激光诱导光谱,电分析方法,以及其他新方法和新传感器。
一般来说,牛奶分析方法大多基于化学计量学和光谱测量,使用大型仪器,涉及复杂的操作;通常,这些仪器用于实验室分析,不适合快速现场测量。此外,复杂的仪器结构很昂贵,而且某些仪器需要大剂量的样品,增加了样品的损失。因此,这类仪器将牛奶分析限制在实验室中,其使用不利于牛奶质量的监督。而计算机视觉系统可以作为一种低成本、高效率的食品认证和质量评价方法。摄像机在光电测量中的应用,减少了传统仪器中光学系统、信号放大处理电路、光电检测电路、模数转换电路等的设计,并且只需要一个简单的LED光源驱动电路即可完成检测任务。利用计算机视觉测量蛋白质和脂肪含量的研究很少,而且只执行了分类任务或测量误差较大,与传统的测量方法相差甚远,要具体实现视觉测量系统还有很长的路要走。
发明内容
本发明的目的是提供一种基于异形比色皿和近红外图像的牛奶成分快速检测方法,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了如下方案:
本发明提供一种基于异形比色皿和近红外图像的牛奶成分快速检测方法,包括以下步骤:
采集光谱图像,使用一个异形比色皿进行色散获得短波近红外光谱,使用数字摄像头采集红外光透过异形比色皿中的待测牛奶后的光谱图像;
划分数据集,对所述光谱图像进行预处理,并将预处理后的所述光谱图像划分为训练集和测试集;
提取特征,基于图像边缘特征和梯度提升决策树构建IDF-GBDT模型,基于图像边缘检测对所述训练集进行卷积,检测垂直边缘,获得垂直条纹,取条纹像素平均值后获得垂直特征;
训练模型,将所述训练集中的所述垂直特征作为梯度提升决策树的输入,将牛奶的蛋白质含量和脂肪测量值作为输出,使用重复验证和留一交叉验证法对所述IDF-GBDT模型进行训练;
预测成分,通过所述IDF-GBDT模型对所述测试集中的所述蛋白质含量和所述脂肪含量进行预测,使用均方根误差、平均绝对误差、平均绝对百分比误差和决定系数作为评估指标对所述IDF-GBDT模型进行评估,多次评估后选择指标最好的一次参数作为最终参数,基于所述最终参数获得训练完成的所述IDF-GBDT模型,并使用训练完成后的所述IDF-GBDT模型进行牛奶成分的检测。
进一步地,采集所述光谱图像的过程中,所述红外光通过所述待测牛奶和所述异形比色皿后发生散射和色散,所述数字摄像头采集的光谱图像为发生散射和色散后的光谱图像。
进一步地,所述红外光为短波红外光,所述异形比色皿的形状为三棱柱,所述数字摄像头为宽带近红外数字摄像头。
进一步地,所述预处理包括:对所述光谱图像进行固定位置的裁剪,将无效像素进行裁剪,保留全部有效像素,所述有效像素为所述光谱图像中完整的明亮区域。
进一步地,所述提取特征的方法具体为:采用Scharr水平滤波器的正向和负向的内核对所述光谱图像进行卷积,检测垂直边缘;
卷积完成后分别使用ReLU函数和Max-Pooling函数对所述光谱图像进行激活和采样;
激活和采样完成后经过全连接层提取所述光谱图像的垂直方向像素的平均值,获得所述垂直特征。
进一步地,使用所述梯度提升决策树算法对所述IDF-GBDT模型进行训练的过程中,用均方差损失函数的负梯度来拟合本轮损失的近似值,基于本轮损失的所述近似值拟合一个分类与回归树,基于所述分类与回归树优化所述IDF-GBDT模型的参数。
进一步地,在所述IDF-GBDT模型的训练过程中,采用随机抽样的方式进行验证,取所述训练集的20%的比例作为验证集,每次训练时,验证数据都进行随机抽取,然后网格化搜索调整所述IDF-GBDT模型的参数,在多次试验后选择最佳参数建立所述IDF-GBDT模型。
进一步地,所述短波近红外光通过宽度红外LED结合恒流电路发出,所述宽度红外LED的型号为欧司朗SFH4737,所述恒流电路提供310mA的稳定工作电流。
本发明公开了以下技术效果:
本发明使用数字摄像头获取经过异形比色皿散射和分散后的短波近红外光谱图像,并通过图像边缘检测结合梯度提升决策树GBDT算法对图像进行学习和训练,其中异形比色皿使光发生色散,当摄像头应用于光电测量时,不再需要像传统仪器那样设计光学系统、信号放大和处理电路、光电检测电路、以及模数转换电路等,只需一个简单的LED光源驱动电路就可以完成检测任务。本发明提出的方法保证了测量的高准确性和高稳定性,同时大大缩短了测量时间,降低了成本,减少了产品的体积和重量,使用的样品极少且不污染样品。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的系统流程图
图2为本申请实施例中的光学透射原理和成像特点示意图;
图3为本申请实施例中的IDF-GBDT算法结构示意图;
图4为本申请实施例中的牛奶分析系统结构示意图;
图5为本申请实施例中的量装置俯瞰设计图(左)和异形比色皿(右)示意图;
图6为本申请实施例中的SW-NIR光源图(左)及其驱动电路(右)示意图;
图7为本申请实施例中模型重复训练100次的结果示意图,其中(a)为脂肪模型的训练结果示意图,(b)为蛋白质模型的训练结果示意图;
图8为本申请实施例中模型的LOOCV结果示意图,其中(a)为脂肪模型的LOOCV结果示意图,(b)为蛋白质模型的LOOCV结果示意图;
图9为本申请实施例中的IDF-GBDT模型对已学习样本的陌生图像的泛化能力测试示意图;
图10为本申请实施例中的IDF-GBDT模型对未学习样本的泛化能力测试示意图,(a)为脂肪含量的预测结果示意图,(b)为蛋白质含量的预测结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
在本发明中,基于计算机视觉技术结合异形比色皿的光学原理和机器学习方法提出了一种快速、准确、简单的牛奶成分定量分析方法,如图1所示,并在此基础上设计一种低成本、便携、环保的测量系统。
选用类似于三棱镜的特殊比色皿将短波NIR(SW-NIR)出射光进行色散,并使用摄像头采集散射和色散后的光谱图像。图像的垂直像素代表了不同波长光的光强,通过垂直边缘检测提取图像垂直边缘特征作为对应的光谱信息。依据牛奶中的各成分对光的吸收波长不同,通过多个波长的光谱信息来确定各营养成分含量。但并不是每一个垂直特征都与某一牛奶成分的含量有关。通过梯度提升决策树GBDT算法为每个特征提供决策权重,最终构建预测模型。对市场上的70种纯牛奶进行了分析和实验,并验证了牛奶中蛋白质和脂肪的含量。实验结果表明,该牛奶成分分析系统具有可靠的稳定性和准确性,而且大大降低了仪器成本和测量时间,为牛奶分析和质量管理提供了小型化的利于现场分析的便携仪器。
通过近红外光采集牛奶的光谱图像:
牛奶与光的相互作用可以用Lorenz-Mie理论来描述,大多数散射光都是朝正方向传播的,牛奶的散射光中包含有关蛋白质和脂肪等颗粒的信息,用来确定牛奶的质量。Lambert-Beer定律是光吸收的基本规律,是光电检测技术的基础。牛奶中蛋白质和脂肪对光的吸收和散射同样符合Lambert-Beer定律。当平行的单色光束穿过含有均匀吸光物质的比色皿时,部分光被溶液或气体、固体吸收,部分光通过溶液。如果固定入射光强I0不变,若吸光物质越多,则透射光强It越小,即溶液吸收的光越多,透射光强度越弱。所以前向散射的透射光强度可以表示为:
It=I0×eKbc (1)
其中K为摩尔吸收系数,c为物质的浓度,b为液体中的光路长度。根据Lambert-Beer定律的加和性,当介质中含有多种吸光组分时,只要各组分间不存在着相互作用,则在某一波长下介质的总吸光度是各组分在该波长下吸光度的加和。所以,可以使用同一波段光同时测定牛奶溶液中的蛋白质和脂肪含量。在透射测量时的光学原理和成像采集特点如图2所示。
在计算机视觉方法中,图2中虚线框中组件被摄像头代替。图像传感器表面含有数十万到数百万个光电二极管,每个光电二极管就是一个像素点Pixel,所以一个Pixel相当于一个传统光电检测的接收器。如果采用单波长光源或者检测器将难以应对牛奶中各成分的复杂变化。虽然牛奶各组分在短波NIR(SW-NIR)处吸收的不同,可在摄像头成像后仅能在图像中以亮度或灰度进行单通道呈现。多种波长的SW-NIR光被交杂在一起,即使使用图像处理算法也难以分离。考虑到近红外光同样存在折射现象,本研究使用类似于三棱镜的比色皿对SW-NIR光进行色散形成光谱,然后用宽带近红外摄像头采集光谱信息,有效分离形成SW-NIR光谱图像。
基于图像的测量方法中,最重要的是图像处理这一步骤。获得SW-NIR光谱图像后,为了更好的利用色散光谱,采用图像垂直边缘检测来提取图像垂直条纹。在这些条纹中,存在不同波长的SW-NIR光对应的光强。固定摄像头后,蛋白质与脂肪含量不同的牛奶所对应的垂直条纹在位置上有所偏移。值得关注的是,在实验中发现,图像整体亮度主要根据脂肪的改变而变化,较高的脂肪含量使得图像变暗,脂肪含量越低图像越明亮。
使用数字摄像头直接获取像素大小为640×480px的原始图像,因为图像中包含大量无效像素,即灰度值为0的像素点,需要对图像进行固定位置的裁剪,减少无效像素的同时保证裁剪后的各样品图像包含全部有效像素,有效像素即完整的明亮区域。根据经验,裁剪位置的剪切框(左,上,右,下)依次为(246,150,374,390)px,剪裁后的图像大小为128×240px。
图像裁剪之后用于图像卷积。Sobel算子是一个离散微分算子,计算图像灰度函数的近似梯度,用于图像边缘检测。在图像的像素点上,Sobel算子产生一个法矢量或相应的梯度向量。但是,Sobel算子对噪音高度敏感、对边缘检测不是很准确、对粗边的检测不能给出适当的结果。Scharr滤波器可以实现完美的旋转对称性,它并不是一个算子,主要是用于Sobel算子的改进和运算的滤波器。两者计算量和计算速度是一样的,但是Scharr滤波器准确度更高,在梯度检测时用的也更多。本实施例使用的是Scharr水平滤波器,其内核为:
Figure BDA0003196210810000091
使用正向和负向的Gx内核对图像进行卷积检测垂直边缘,卷积后分别使用ReLU函数和Max-Pooling函数对图像进行激活和采样。然后经过全连接层提取图像垂直方向像素的平均值,再与GBDT连接。GBDT是一种机器学习算法,属于集成学习的一种,可用于分类和回归问题。GBDT用损失函数的负梯度来拟合本轮损失的近似值,进而拟合一个分类与回归树CART。第t轮的第i个样本(xi,yi)的损失函数L的负梯度表示为:
Figure BDA0003196210810000092
经过负梯度拟合得到残差(yi-f(xi))。当GBDT用于回归时,有三种常用的损失函数,分别是least squares regression(ls)、least absolute deviation(lad)和huber损失。‘ls’采用残差的平方,‘lad’使用残差的绝对值,‘huber’是前两者的结合,对于远离中心的异常点,采用‘lad’,而中心点附近采用‘ls’。
假设输入的训练集样本为I={(x,y1),(x,y2),...,(x,ym)},最大迭代次数为T,损失函数为L,最终输出强学习器f(x)。
回归算法过程如下:
(1)初始化弱学习器,c的均值可设置为样本y的均值:
Figure BDA0003196210810000101
(2)对迭代次数t=1,2,3,…,T有:
a.对样本i=1,2,…,m,计算负梯度:见公式(6)。
b.利用(xi,rti)(i=1,2,…,m),拟合一颗CART,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2,...,J。其中J为叶子节点的个数。
c.对叶子区域j=1,2,…,J,计算最佳拟合值。针对每一个叶子节点里的样本,求得使L最小,也就是拟合叶子节点最好的输出值ctj
Figure BDA0003196210810000102
d.更新强学习器:
Figure BDA0003196210810000103
这样就得到了本轮的决策树拟合函数,如下:
Figure BDA0003196210810000104
(3)得到强学习器f(x)表达式:
Figure BDA0003196210810000105
GBDT能够灵活处理各种类型的数据,需要调整的参数较少,预测精度高,泛化能力强。与图像边缘检测结合后,能够依据垂直条纹的亮度更加准确的预测牛奶中蛋白质和脂肪含量。IDF-GBDT算法结构如图3所示。
实施例2
牛奶分析系统:
牛奶分析系统分为计算机软件和硬件装置,其中硬件装置由光源单元、采集单元组成,计算机软件可视为控制和处理单元。图4所示是基于异形比色皿的牛奶分析系统的结构示意图,硬件装置的长宽高分别为170mm、110mm和90mm。该系统的所有部件被置于暗箱中,以防止其他光源,例如太阳光等的干扰。光源单元由一个7.2V的直流电源供电,通过恒流驱动电路为固定在导热板上的宽带近红外LED提供稳定的工作电流,并且能够快速散热。采集单元是一个宽带近红外相机,通过USB与电脑连接并供电,由设计的牛奶分析软件控制和采集图像。光源与摄像头之间固定有放置比色皿的样品室,装置内还有起到分隔和固定作用的不透光PVC板。
光的传播路径如图5中SW-NIR光束所示,光束在穿过狭缝后继续沿直线传播,但经过异形比色皿后偏离原传播路线,所以作为接收器的数字摄像头与原光束之间有角度。在异形比色皿中,SW-NIR会受到牛奶溶液的影响,一部分被吸收,一部分被散射,大部分的SW-NIR光穿过比色皿,在异形比色皿的斜边上产生折射现象。其中被散射的光束部分经过一次或多次散射后依旧被数字摄像头接收。由于光束包含多种波长的光,其折射率不同,光束会发生色散。感光范围在SW-NIR的数字摄像头用来接收色散和散射光,其放置角度由图5中虚线b来确定。虚线a为狭缝至异形比色皿的外侧锐角的延长直线,虚线c为光源至狭缝的直线延长线,虚线b使得其与虚线a、虚线c的夹角相等,即∠α和∠β相等。数字摄像头的中心线与虚线b重合,能够保证的所有光束被全部接收。异形比色皿的俯瞰为直角等腰三角形,其实际样式如图5(右)所示。这个三角形比色皿的容量为1.75ml,透光范围为200~2500nm,在节省样品的同时具有较强的适用性。
光源单元:
测量装置中使用的SW-NIR光源为如图6(左)所示的欧司朗光电半导体SFH4737红外宽带发射器,该IR发射器可提供650nm至1050nm的发射光谱范围。光源驱动电路使用恒流驱动方式,可为SFH4737提供稳定电流,通过调节电位器W1可以改变SFH4737(LED D1)的两端电流。由于人眼无法看到近红外光,因此LED在其工作期间发出的是450纳米的蓝色工作警告光。SFH4737的额定电压为2.9V,额定电流350mA,在600nm至1050nm的总辐射通量为74mW,实际测量时工作电流设定为310mA。
采集单元:
采集单元使用的数字摄像头为镁光AR0230的CMOS图像传感器。该摄像头的感应范围为700~1100nm,镜头焦距为2.6mm,能够在130度的大范围内无失真地采集光线。通过USB与电脑连接,工作电压为5V,功率小于2W。摄像头能够完整接收光源发出的SW-NIR光,并滤除蓝色工作警示光。
分析软件:
建立模型时的图像采集和系统集成后的测量都使用Python语言编写的分析软件。当测量装置通过USB连接计算机后,可在软件的“Select Camera”中选择实验所需的数字摄像头。在牛奶成分分析实验中,使用的分辨率为640×480px。通过“Settings”控制相机参数,本实验取消数字摄像头的自动白平衡、自动曝光和自动亮度等,参数使用相机默认的固定参数。通过“Measure”按钮获取当前牛奶样品的蛋白质含量和脂肪含量,并可通过“Save”按钮保存此次测量信息,包括图像和测量值。
在IDF-GBDT模型的训练和建立过程中,采用随机抽样的方式进行验证,取训练数据集的20%的比例作为验证数据集。每次训练时,验证数据都是随机抽取的。然后网格化搜索调整神经网络参数,在充分试验后选择最佳参数建立模型。需要调整的参数主要集中在GBDT网络,包括主要的集成框架参数和弱学习器参数,最终的模型参数见表1。
表1
Figure BDA0003196210810000131
训练样本:
实验中使用的牛奶样品均在当地市场采购,包括国产牛奶和进口的常温、低温液态纯牛奶,共70种。牛奶样品中蛋白质含量在2.4–4.0g/100mL,脂肪含量在0–4.6g/100mL的范围,基本涵盖了市场上纯牛奶的相应成分。根据国际标准ISO 8968-1:2004(E)和IDF 20-1:2014(E)牛奶中凯氏原理和粗蛋白的计算,使用凯氏定氮法测量各奶样的蛋白质含量。根据国际标准ISO 2446:2008(E)和IDF 226:2008(E)牛奶中脂肪含量的测定,使用盖勃法测量各奶样中的脂肪含量。同时,使用测量装置获取牛奶样品的图像,测量时低温奶样品在室温(22℃)放置至常温。对每份样品收集15张光谱图像,每张图像的采集间隔约5秒。使用化学法得到的蛋白质和脂肪含量数据作为牛奶样品光谱图像的标签,用于建立检测模型和测试。
最终组成70×15张牛奶光谱图像的数据集。在70份样品中随机选取2份样品作为测试集1,共30张图像;在剩余68份样品中,每份随机选取5张图像,作为测试集2共340张图像。剩余的68×10张图像作为训练集。其中测试集1中的样品为IDF-GBDT模型未学习过的数据,数据集2为曾经参与过IDF-GBDT建模的样品但未学习过的数据。两个测试集都可以用作检测模型的泛化能力,但不同的是,测试集1模拟了在检测模型测量范围内,未出现过的新的奶样。
脂肪和蛋白质检测模型:
1.模型训练与重复验证
实际上,在使用IDF-GBDT算法之前,也使用了其他方法进行牛奶分析,但是效果没有达到预期,甚至很差。比如,直接使用光谱图像的每个像素值进行牛奶分析,它的计算量过大,程序运行时间过长,并且误差也较大。也使用了传统的卷积神经网络CNN进行模型训练,决定系数R2较小,无法用于回归任务,有不错的脱脂、低脂和全脂牛奶的分类效果。
在确定IDF-GBDT脂肪和蛋白质检测模型的参数后,参数如表1所示,使用随机抽样的验证集和训练集重复训练100次,以记录模型使用不同训练数据和验证数据的效果。训练结果如图7所示。在脂肪模型的训练中,以综合情况来看,最好的是第82次训练。此次训练的校正均方根误差RMSEC为0.0147g/100mL,预测值和实测值之间的决定系数R2-C为0.9998,平均绝对误差MAE-C为0.0074g/100mL,平均绝对百分比误差MAPE-C为0.3344%,其中平均绝对百分比误差也就是平均相对误差。由于验证数据的随机选择和训练神经网络的随机性,重复验证的指标在不断变化,但最大的指标都在可接受的范围内。蛋白质模型最好的一次训练是第62次,RMSEC为0.0314g/100g,MAE-C为0.0238g/100g,R2-C是0.9751,MAPE-C为0.7433%。蛋白质模型的指标没有脂肪模型的好,但依然属于优秀的检测模型。对100次训练的统计结果如表2所示。
表2
Figure BDA0003196210810000151
2.留一交叉验证LOOCV
在以上验证中,虽然模型的评价指标不断变化,但始终处于优秀的位置。为了进一步测试模型和训练集的优劣,对训练集进行留一交叉验证LOOCV,预测结果的回归分析如图8所示。LOOCV对样本的利用率最高,不仅可以用来判断模型的好坏,也能鉴别样本的好坏。图中的红线为实测值和预测值之间的回归线,红色阴影部分为模型的预测带,黑色直线为函数y(Predicted)=x(Measured),同时黑色直线为理想回归线,圆点为包含在预测带中回归点,而“×”点远离预测带,被视为异常点Outlier。
脂肪模型的回归线和理想线基本重合,并且预测带宽度较窄,说明IDF-GBDT脂肪检测模型的预测误差小而且精度还很高。脂肪模型在交叉验证下的均方根误差RMSECV为0.0245g/100mL,平均绝对误差MAE-CV为0.0099g/100mL,平均绝对百分比误差MAPE-CV为0.6166%,决定系数R2-CV为0.9996,Outlier有8个。蛋白质模型的误差较脂肪模型大,回归线与理想线之间有一定角度,并且预测带也较宽,有30个Outlier。蛋白质模型的RMSECV为0.0491g/100g,MAE-CV为0.0290g/100g,MAPE-CV为0.9129%,R2-CV为0.9506。脂肪和蛋白质模型的交叉验证下的指标在多次重复验证指标的波动范围之内,与多次验证指标的AVG相当,从而进一步证明了模型和训练集的有效性和可靠性。
3.模型测试
提出的IDF-GBDT脂肪和蛋白质模型在随机重复验证和LOOCV中都具有较高的预测准确度。在去除Outlier后,再次对模型进行训练,并进行泛化能力测试。首先使用测试集2测试模型对已学习样本的陌生图像的推广性,结果如图9所示。脂肪模型测试的均方根误差(RMSEP)为0.0214g/100mL,平均绝对误差(MAE-P)为0.0104g/100mL,平均绝对百分比误差(MAPE-P)为0.6370%,决定系数(R2-P)为0.9997,与LOOCV的指标相差无几。在图9(a)中可看出,所有样本的测量均值都在±0.05g/100mL的范围内,最大误差为0.1487g/100mL。并且误差集中于0附近,有大约90%的样本的误差在0.025g/100mL之内,表明了IDF-GBDT脂肪检测模型对已学习样本的陌生图像有很强的泛化能力。
蛋白质模型的RMSEP为0.0549g/100g,MAE-P为0.0309g/100g,MAPE-P为0.9795%,R2-P为0.9382。与LOOCV进行比较,尽管在数值上变大了,但是属于正常范围。在图9(b)中,有个别样本的整体误差较大,如样本11、20和33,这可能是由于在测量真实值时引入的误差。还有一些样本存在个别误差,如26、57、58等,可能是在光谱图像采集时引入误差。但是,从预测结果和指标来看,在允许的误差范围内,IDF-GBDT蛋白质模型对所学样本的陌生图像有很强的泛化能力。
然后,使用测试集1对陌生样本进行预测,测试模型对未学习样本的泛化能力。这一测试具有实际意义,因为在用于实际任务时,模型不可能对所有的牛奶样本进行学习。由于需要更多样本用于训练,只选出两个样本作为测试集1。但它也是现实的,因为在实际生产中,只有极少数的新样本会存在没有经过训练的情况。对测试集1的预测如图10所示。
两个未学习样本分别是No.69和No.70,对它们的脂肪含量的预测如图10(a)所示。15次预测的No.69脂肪平均值为3.6063g/100mL,它的真实值为3.61g/100mL。对No.69预测结果的MAE-P为0.0247g/100mL,RMSEP为0.0276g/100mL。样本No.70的真实脂肪值为1.45g/100mL,15次预测的平均值为1.4454g/100ml,MAE-P为0.0172g/100mL,RMSEP为0.0209g/100mL。两个样品的脂肪含量预测误差都很小,说明IDF-GBDT脂肪模型在预测未学过的样品时也有很高的准确性。
图10(b)是对样本No.69和No.70的蛋白质含量的预测结果。样本No.69的15次预测结果的波动比较大,它的蛋白质含量真实值为3.151g/100g。预测的平均值为3.1493g/100g,MAE-P为0.0355g/100g,RMSEP为0.0382g/100g。样本No.70的蛋白质含量真实值为3.228g/100g,预测平均值为3.2427g/100g,MAE-P为0.0225g/100g,RMSEP为0.0271g/100g。No.70蛋白质预测结果的波动范围比No.69要小,但比脂肪的预测大得多。尽管如此,对蛋白质的预测结果仍然可以接受,所以IDF-GBDT蛋白质检测模型对未学习样本也有较强的预测能力。
综上,模型对全部测试集,即对测试集1和测试集2的测试指标统计结果如表3。IDF-GBDT模型对测试集1和测试集2都有较好的预测能力,证明了模型具有较强的泛化能力。并且,在验证和测试环节中对脂肪和蛋白质含量的预测误差都较小,模型拥有较高的准确度。虽然在训练和验证时需要花费大量时间,但是在测试时只需要较短时间,实现了“一键测量”。
表3
Figure BDA0003196210810000181
Figure BDA0003196210810000191
在验证和测试中均发现了在标签制作和图像采集环节存在误差。虽然凯氏定氮法和盖勃法对蛋白质和脂肪的测量较为精准,但其复杂的专业性操作,难免会引入误差。分析了图像采集过程中的操作,因为样品图像采集的间隔使牛奶在此期间沉淀,牛奶中不同含量的非脂肪乳固体也可能干扰测量。另外,温度也会对牛奶中物质的测量造成影响。测量装置的光源距离比色皿约1.5cm,长时间放置会引起比色皿中牛奶溶液温度上升。但从测试和验证结果来看,多次测量的平均值与真实值相差非常小,可以将偶然误差降到最小。
本发明提出了一种基于多波长SW-NIR图像结合边缘检测和GBDT算法的牛奶成分快速分析方法。通过基于异形比色皿的测量装置和牛奶成分分析软件采集牛奶的SW-NIR光谱图像和实现对牛奶中脂肪和蛋白质含量的测定。测量装置使用IR宽带LED作为光源,发出650~1050nm的光束,经过狭缝后可接近于平行光束,光束通过置于样品室中异形比色皿时被散射和色散,光谱被宽带数字摄像头接收。通过USB将图像传输到牛奶分析软件中,使用预先学习生成的IDE-GBDT模型对当前牛奶样品的光谱图像进行回归分析,预测牛奶的蛋白质含量和脂肪含量。
针对光学原理和成像特点特别提出了IDF-GBDT算法,并分别构建了脂肪检测模型和蛋白质检测模型。对模型的验证和测试结果表明,脂肪模型均具有较高的准确度和稳定性,预测结果与真实值相差很小,表明IDF-GBDT脂肪检测模型可用于脂肪含量的精确测量。蛋白质模型虽然在准确度和稳定性上不如脂肪模型,但蛋白质模型的测量误差是可接受的,测量结果同样具有的代表性,因此IDF-GBDT蛋白质检测模型可以用于牛奶中蛋白质含量的测量。模型对已学习样品和未学习样品都有很强的泛化能力,预测误差都较小,从而证明了本申请所提出方法进行牛奶成分分析的稳定性与可靠性。本发明的方法不仅有较高的准确度,而且大大降低了仪器成本和测量时间,为牛奶成分分析领域提供了一种新的方法和优秀的仪器。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (8)

1.一种基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:包括以下步骤:
采集光谱图像,使用一个异形比色皿进行色散获得短波近红外光谱,使用数字摄像头采集红外光透过异形比色皿中的待测牛奶后的光谱图像;
划分数据集,对所述光谱图像进行预处理,并将预处理后的所述光谱图像划分为训练集和测试集;
提取特征,基于图像边缘特征和梯度提升决策树构建IDF-GBDT模型,基于图像边缘检测对所述训练集进行卷积,检测垂直边缘,获得垂直条纹,取条纹像素平均值后获得垂直特征;
训练模型,将所述训练集中的所述垂直特征作为梯度提升决策树的输入,将牛奶的蛋白质含量和脂肪测量值作为输出,使用重复验证和留一交叉验证法对所述IDF-GBDT模型进行训练;
预测成分,通过所述IDF-GBDT模型对所述测试集中的所述蛋白质含量和所述脂肪含量进行预测,使用均方根误差、平均绝对误差、平均绝对百分比误差和决定系数作为评估指标对所述IDF-GBDT模型进行评估,多次评估后选择指标最好的一次参数作为最终参数,基于所述最终参数获得训练完成的所述IDF-GBDT模型,并使用训练完成后的所述IDF-GBDT模型进行牛奶成分的检测。
2.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:采集所述光谱图像的过程中,所述红外光通过所述待测牛奶和所述异形比色皿后发生散射和色散,所述数字摄像头采集的光谱图像为发生散射和色散后的光谱图像。
3.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:所述红外光为短波红外光,所述异形比色皿的形状为三棱柱,所述数字摄像头为宽带近红外数字摄像头。
4.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:所述预处理包括:对所述光谱图像进行固定位置的裁剪,将无效像素进行裁剪,保留全部有效像素,所述有效像素为所述光谱图像中完整的明亮区域。
5.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:所述提取特征的方法具体为:采用Scharr水平滤波器的正向和负向的内核对所述光谱图像进行卷积,检测垂直边缘;
卷积完成后分别使用ReLU函数和Max-Pooling函数对所述光谱图像进行激活和采样;
激活和采样完成后经过全连接层提取所述光谱图像的垂直方向像素的平均值,获得所述垂直特征。
6.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:使用所述梯度提升决策树算法对所述IDF-GBDT模型进行训练的过程中,用均方差损失函数的负梯度来拟合本轮损失的近似值,基于本轮损失的所述近似值拟合一个分类与回归树,基于所述分类与回归树优化所述IDF-GBDT模型的参数。
7.根据权利要求1所述的基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:在所述IDF-GBDT模型的训练过程中,采用随机抽样的方式进行验证,取所述训练集的20%的比例作为验证集,每次训练时,验证数据都进行随机抽取,然后网格化搜索调整所述IDF-GBDT模型的参数,在多次试验后选择最佳参数建立所述IDF-GBDT模型。
8.根据权利要求1所述的一种基于异形比色皿和近红外图像的牛奶成分快速检测方法,其特征在于:所述短波近红外光通过宽度红外LED结合恒流电路发出,所述宽度红外LED的型号为欧司朗SFH4737,所述恒流电路提供310mA的稳定工作电流。
CN202110891356.9A 2021-08-04 2021-08-04 基于异形比色皿和近红外图像的牛奶成分快速检测方法 Active CN113607676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110891356.9A CN113607676B (zh) 2021-08-04 2021-08-04 基于异形比色皿和近红外图像的牛奶成分快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110891356.9A CN113607676B (zh) 2021-08-04 2021-08-04 基于异形比色皿和近红外图像的牛奶成分快速检测方法

Publications (2)

Publication Number Publication Date
CN113607676A true CN113607676A (zh) 2021-11-05
CN113607676B CN113607676B (zh) 2022-04-05

Family

ID=78339462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110891356.9A Active CN113607676B (zh) 2021-08-04 2021-08-04 基于异形比色皿和近红外图像的牛奶成分快速检测方法

Country Status (1)

Country Link
CN (1) CN113607676B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114414521A (zh) * 2022-01-20 2022-04-29 淮北师范大学 基于红外多光谱传感器的牛奶主要成分测量方法
CN114916913A (zh) * 2022-05-09 2022-08-19 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法
CN117470804A (zh) * 2023-11-03 2024-01-30 北京翼新数智科技有限公司 一种基于ai算法的糖类产品近红外检测方法及系统
CN117470801A (zh) * 2023-11-02 2024-01-30 上海贝高医疗科技有限公司 基于多光谱同时检测的母乳成分快速分析装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5017785A (en) * 1989-02-16 1991-05-21 Oy Dailab Inc. IR-spectrometric analyzing procedure and means
US20040135088A1 (en) * 2001-03-16 2004-07-15 Lars-Ove Sjaunja Mid infra red analysis
CN101893561A (zh) * 2010-07-13 2010-11-24 中国人民解放军总后勤部油料研究所 一种润滑油新油质量近红外光谱快速测定方法
CN102341694A (zh) * 2009-01-08 2012-02-01 It-Is国际有限公司 用于化学反应和/或生化反应的光学系统
CN102435580A (zh) * 2011-12-23 2012-05-02 吉林大学 近红外牛奶成分快速测量装置与方法
CN103185703A (zh) * 2011-12-31 2013-07-03 中国农业机械化科学研究院 一种检测谷物营养成分的光谱分析系统及方法
US20150329892A1 (en) * 2014-05-13 2015-11-19 Asl Analytical, Inc. Apparatus and Method for Optical Sampling in Miniature Bioprocessing Vessels
CN108169174A (zh) * 2017-12-28 2018-06-15 中国科学院长春光学精密机械与物理研究所 一种基于最小偏向角法的液体折射率测试装置及测试方法
CN110208192A (zh) * 2019-06-28 2019-09-06 中国计量大学 一种盛放肉类产品的样品皿及在产地溯源中的应用

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5017785A (en) * 1989-02-16 1991-05-21 Oy Dailab Inc. IR-spectrometric analyzing procedure and means
US20040135088A1 (en) * 2001-03-16 2004-07-15 Lars-Ove Sjaunja Mid infra red analysis
CN102341694A (zh) * 2009-01-08 2012-02-01 It-Is国际有限公司 用于化学反应和/或生化反应的光学系统
CN101893561A (zh) * 2010-07-13 2010-11-24 中国人民解放军总后勤部油料研究所 一种润滑油新油质量近红外光谱快速测定方法
CN102435580A (zh) * 2011-12-23 2012-05-02 吉林大学 近红外牛奶成分快速测量装置与方法
CN103185703A (zh) * 2011-12-31 2013-07-03 中国农业机械化科学研究院 一种检测谷物营养成分的光谱分析系统及方法
US20150329892A1 (en) * 2014-05-13 2015-11-19 Asl Analytical, Inc. Apparatus and Method for Optical Sampling in Miniature Bioprocessing Vessels
CN108169174A (zh) * 2017-12-28 2018-06-15 中国科学院长春光学精密机械与物理研究所 一种基于最小偏向角法的液体折射率测试装置及测试方法
CN110208192A (zh) * 2019-06-28 2019-09-06 中国计量大学 一种盛放肉类产品的样品皿及在产地溯源中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A.DANKOWSKA: "5-advances in fluorescence emission spectroscopy for food authenticity testing", 《ADVANCES IN FOOD AUTHENTICITY TESTING》 *
ANDREY BOGOMOLOV: "Developing Multisensory Approach to the Optical Spectral Analysis", 《SENSORS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114414521A (zh) * 2022-01-20 2022-04-29 淮北师范大学 基于红外多光谱传感器的牛奶主要成分测量方法
CN114916913A (zh) * 2022-05-09 2022-08-19 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法
CN114916913B (zh) * 2022-05-09 2023-01-13 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法
CN117470801A (zh) * 2023-11-02 2024-01-30 上海贝高医疗科技有限公司 基于多光谱同时检测的母乳成分快速分析装置
CN117470801B (zh) * 2023-11-02 2024-04-12 上海贝高医疗科技有限公司 基于多光谱同时检测的母乳成分快速分析装置
CN117470804A (zh) * 2023-11-03 2024-01-30 北京翼新数智科技有限公司 一种基于ai算法的糖类产品近红外检测方法及系统

Also Published As

Publication number Publication date
CN113607676B (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
CN113607676B (zh) 基于异形比色皿和近红外图像的牛奶成分快速检测方法
Lu et al. Hyperspectral imaging for safety inspection of food and agricultural products
Iqbal et al. Classification of selected citrus fruits based on color using machine vision system
US20020011567A1 (en) Apparatus and method and techniques for measuring and correlating characteristics of fruit with visible/near infra-red spectrum
CN106841103A (zh) 近红外光谱检测水果内部品质方法及专用检测系统
AU2001245710A1 (en) Apparatus and method for measuring and correlating characteristics of fruit with visible/near infra-red spectrum
EP1285244A1 (en) Apparatus and method for measuring and correlating characteristics of fruit with visible/near infra-red spectrum
Wang et al. Smartphone imaging spectrometer for egg/meat freshness monitoring
CN101832941A (zh) 一种基于多光谱图像的水果品质评价装置
CN1613007A (zh) 光谱流体分析器
US11221320B2 (en) Method and apparatus for measuring leaf nitrogen content
CN109115708B (zh) 一种苹果内部多品质一体化无损检测系统及方法
EP3999822A1 (en) Spectrometer device
Wang et al. Grading detection of “Red Fuji” apple in Luochuan based on machine vision and near-infrared spectroscopy
Jang et al. Field Application of a Vis/NIR hyperspectral imaging system for nondestructive evaluation of physicochemical properties in ‘Madoka’peaches
Mu et al. Non‐destructive detection of blueberry skin pigments and intrinsic fruit qualities based on deep learning
Xia et al. Principles, developments, and applications of spatially resolved spectroscopy in agriculture: a review
Srivastava et al. Handheld, smartphone based spectrometer for rapid and nondestructive testing of citrus cultivars
Portalés et al. An image-based system to preliminary assess the quality of grape harvest batches on arrival at the winery
Padilla et al. SoilMac. pH: Arduino-Based Automated Soil Macronutrients and pH Level Analyzer Using Visible-Near Infrared Spectrometer
Itoh et al. Measurement of nitrate concentration distribution in vegetables by near-infrared hyperspectral imaging
CN112945902A (zh) 一种应用近红外高光谱成像技术检测面粉中偶氮甲酰胺
CN209802978U (zh) 一种远程实时在线水果品质监测系统
JP7535031B2 (ja) 近赤外光を用いた植物葉撮像装置、植物葉特定成分比率推定システム、植物葉特定成分推定方法及びプログラム
Bakiya et al. Identification of Nutrient Content of Psidium Guajava and Syzygium Cumini Leaves Using Hyperspectral Imaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant