CN114693636A - 一种混合高粱中支链与直链淀粉含量的检测方法 - Google Patents

一种混合高粱中支链与直链淀粉含量的检测方法 Download PDF

Info

Publication number
CN114693636A
CN114693636A CN202210322694.5A CN202210322694A CN114693636A CN 114693636 A CN114693636 A CN 114693636A CN 202210322694 A CN202210322694 A CN 202210322694A CN 114693636 A CN114693636 A CN 114693636A
Authority
CN
China
Prior art keywords
sorghum
mixed
data
content
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210322694.5A
Other languages
English (en)
Inventor
田建平
补友华
姜鑫娜
黄浩平
胡新军
黄丹
罗惠波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University of Science and Engineering
Original Assignee
Sichuan University of Science and Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University of Science and Engineering filed Critical Sichuan University of Science and Engineering
Priority to CN202210322694.5A priority Critical patent/CN114693636A/zh
Publication of CN114693636A publication Critical patent/CN114693636A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20152Watershed segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种混合高粱中支链与直链淀粉含量的检测方法。所述方法包括:使用可见光和近红外高光谱成像系统分别采集混合高粱样本的高光谱图像,同时采用化学分析方法测定样本中的淀粉含量;对样本的高光谱图像的高粱籽粒进行了分割、光谱数据提取、特征波长或光谱特征提取;使用特征融合的数据建立了模型,用于预测混合高粱的淀粉含量。本发明对混合高粱的淀粉含量实现了快速无损、准确评估,有效的检测了不同配比的混合高粱样本的淀粉含量,为混合高粱的支链淀粉与直链淀粉含量的在线检测提供了一种方法。

Description

一种混合高粱中支链与直链淀粉含量的检测方法
技术领域
本发明为一种混合高粱中支链与直链淀粉含量的检测方法,属于固态酿造原料检测技术领域,特别涉及了一种基于高光谱成像技术的混合高粱中支链与直链淀粉含量的检测方法。
背景技术
固态发酵技术在我国有着悠久的历史,也是我国特有的酿造工艺。在白酒酿造行业中,由于高粱中的淀粉含量高,大约占高粱成分的65~70%,蛋白质、单宁、脂肪等含量也适当;因此高粱常作为酿酒较为理想的原料,用于酱香型白酒的单一原料和浓香型白酒的主要原料。
高粱中的淀粉由直链淀粉和支链淀粉组成,它们不仅是生成酒精的主要成分,同样也是酿酒微生物生长繁殖的主要能量来源。支链淀粉越高的高粱品种,高粱糊化也就越容易,其更利于酿酒微生物的生长繁殖以及新陈代谢,同时也会生成更多香味物质,使白酒的风味更为丰满。直链淀粉越高的高粱品种,高粱糊化也就越难,但可以提高白酒的产量。对于不同品种的高粱,其直链淀粉和支链淀粉含量也不相同,酒厂常使用多种混合品种的高粱作为酿造原料。由于不同高粱品种混合后的直链淀粉和支链淀粉含量是难以精确估测的,为了保证白酒的品质和产量,因此检测不同比例配比的混合高粱的直链淀粉和支链淀粉含量尤为重要。
目前,高粱淀粉含量的检测主要采用化学分析方法和无损检测方法。化学方法中常使用碘亲和力滴定法和双波长分光光度法对淀粉含量进行测定,但是此类方法耗时长,且属于破坏性检测;无损检测中常用近红外光谱技术对淀粉含量进行非破坏性测定,但只能实现单点检测且检测精度不高;因此需要一种快速无损的方法获取混合高粱中支链与直链淀粉含量。
现有专利CN110609011A,发明名称为单籽粒玉米种子淀粉含量近红外高光谱检测方法及系统,该发明记载:通过获取待检测单籽粒玉米种子的双表面(胚面、非胚面)光谱曲线;将所述待检测单籽粒玉米种子的双表面光谱曲线输入预先构建的单籽粒玉米种子淀粉含量预测模型,获得待检测单籽粒玉米种子的淀粉含量理化值。通过结合胚面和非胚面的高光谱信息,在单籽粒水平上实现玉米种子淀粉含量的快速无损检测,为单籽粒玉米种子品质快速分级筛选提供新的技术手段。但是该专利所述的单籽粒玉米种子淀粉含量检测方法不具有效率性、准确性。若在实际的单粒玉米种子品质快速分级晒选中,使用近红外高光谱系统采集了单粒玉米种子胚面的光谱数据,然后翻转单粒玉米种子至非胚面,再采集非胚面的光谱数据,此过程较浪费时间,不利于单粒玉米种子品质快速分级;另外,同一粒玉米种子胚面和非胚面的光谱数据需要准确对应,若未准确对应,将不能建立一个高精度的单粒玉米种子的淀粉含量预测模型。此外,该专利也未提及所使用的单粒玉米种子淀粉含量预测模型是哪种数学模型,也未提及该方法检测单粒玉米种子淀粉含量的精度如何。
CN103163128A,发明名称为:一种高粱中支链淀粉和直链淀粉含量的测定方法,该发明记载方法包括三个步骤,首先制备高粱支链淀粉回归方程和直链淀粉回归方程,然后计算支链淀粉的吸收比α和直链淀粉的吸收比β,最后样品测定,在该步骤中,通过给定公式计算支链淀粉和直链淀粉在测定波长的吸光度,然后再将相应的将吸收比和吸光度带入相应的回归方程中即得支链淀粉和直链淀粉的浓度。但该专利所述高粱中支链淀粉和直链淀粉含量的测定方法属于破坏性检测,样本检测过后不能再进行使用,如果样本量较大的话就会造成资源的浪费。另外专利所述的检测方法周期较长,无法实现高粱中支链淀粉和直链淀粉的快速检测。此外该专利方法只能得到支链淀粉和直链淀粉的浓度,没有实现其具体含量的检测。
发明内容
本发明的目的是针对现有技术中存在的技术问题,提供一种混合高粱中支链与直链淀粉含量的检测方法。该检测方法能对混合高粱的淀粉含量实现了快速无损、准确评估,能有效的检测不同配比的混合高粱样本的淀粉含量,为混合高粱的支链淀粉与直链淀粉含量的在线检测提供了一种方法。
为了实现以上发明目的,本发明的具体技术方案为:
一种混合高粱中支链与直链淀粉含量的检测方法,包括以下步骤:
(1)分别采集混合高粱样本的在可见光和近红外光谱范围内的高光谱图像,获取混合高粱的原始高光谱图像数据,然后对原始高光谱图像数据进行黑白校正;
(2)测定混合的高粱样本的支链与直连淀粉含量;
(3)针对步骤(1)的原始高光谱图像,基于扩展极大值变换改进后的分水岭算法对图像进行高粱粘连籽粒区域分割,从图像中分割出高粱籽粒部分,去除背景部分,得到每个高粱籽粒内像素点坐标;
(4)对步骤(3)单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值并进行黑白校正,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
(5)对单个样本中所有的高粱籽粒的平均光谱向量值(光谱数据1)取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
(6)对步骤(5)中的光谱数据2进行黑白校正,然后进行对其进行多元散射校正结合S-G平滑滤波器预处理,得到光谱数据3;
(7)对步骤(6)光谱数据3使用Pearson相关系数法提取特征波长,得到光谱数据4;对光谱数据3使用偏最小二乘法回归(PLSR)提取潜在变量对应的得分矩阵,即光谱特征1;
(8)对步骤(7)的可见光范围的光谱数据4和近红外光谱范围的光谱数据4进行数据融合,得到光谱数据5;对步骤(7)的可见光范围的光谱特征1和近红外光谱范围的光谱特征1进行数据融合,得到光谱特征2;
(9)将步骤(8)的光谱数据5和步骤(2)对应的直链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
(10)将步骤(8)的光谱特征2和步骤(2)对应的支链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
(11)采集待测混合高粱的高光谱图像,利用步骤(9)和(10)的预测模型进行混合高粱的直链和支链淀粉检测,得到混合高粱的淀粉含量的预测值。
进一步地,步骤(1)中,所述可见光和近红外光谱范围分别为397-1000nm,940-1730nm。
进一步地,步骤(1)中,所述黑白校正的公式如下:
Figure BDA0003572333760000051
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
进一步地,步骤(2)中,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
进一步地,步骤(4)中,所述光谱数据1的公式如下:
Figure BDA0003572333760000052
其中:
Figure BDA0003572333760000053
为某颗高粱籽粒内所有像素点在某个波段下的平均光谱值;m为磨课所选高粱籽粒内部的像素点个数;Ii,j为第j个像素点在第i个波段下的反射率。
进一步地,步骤(5)中,所述光谱数据2的公式如下:
Figure BDA0003572333760000054
其中:
Figure BDA0003572333760000055
为混合高粱样本所有高粱籽粒在某个波段下的平均反射率;k为混合高粱样本所有高粱籽粒个数;
Figure BDA0003572333760000056
为第k个高粱在第i个波段下的平均反射率。
进一步地,步骤(7)中,所述Pearson相关系数法提取特征波长具体步骤如下:
(A)根据Pearson相关系数法公式计算光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
Figure BDA0003572333760000061
其中:r代表Pearson相关系数;xi为第i个样本光谱数据3中某个波段的反射率,
Figure BDA0003572333760000062
为光谱数据3中某个波段的平均反射率;yi为第i个样本的直链淀粉含量;
Figure BDA0003572333760000063
为所有样本的平均直链淀粉含量;
(B)选取Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01的波长作为特征波长。
进一步地,步骤(7)中,所述对光谱数据3使用PLSR提取潜在变量对应的得分矩阵,其具体步骤如下:
(i)将光谱数据3的数据标准化,即要将数据中心化,方法是光谱数据3的每个样本都做如下操作:减去一个维度(列)变量的均值除以该维度(列)的标准差;
(ii)求(i)自变量组(标准化后的数据)与因变量组(直链淀粉含量)的相关系数矩阵;
(i ii)分别提出自变量组与因变量组的成分,当前k个成分解释自变量的比率达到90%时,取前k个成分的矩阵作为得分矩阵。
进一步地,步骤(8)中,所述的数据融合是指将数据块串行拼接,如下:
数据块1:
Figure BDA0003572333760000064
数据块2:
Figure BDA0003572333760000065
拼接后:
Figure BDA0003572333760000066
进一步地,步骤(9)(10)中,所述的遗传算法的种群规模设置为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05。
进一步地,步骤(9)(10)中,所述的BP神经网络模型由一个输入层1个隐藏层和1个输出层组成。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的参数设计:确定trainlm为神经网络的训练函数,隐含层设置为1层并带有15个点神经元,确定tansig为隐含层节点的传递函数,purelin为输出层节点传递函数,网络学习函数为BP学习规则learngdm,学习率为0.001,迭代次数为1000,训练目标为4.43e-7。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的输入为光谱数据5或光谱特征2。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的输出为每个混合高粱样本所对应的直链或支链淀粉含量。
在该检测方法中,通过可见光、近红外高光谱成像系统采集混合高粱的高光谱样本,对高光谱样本进行淀粉含量的测定。本发明与其他现有的高光谱检测淀粉含量不同,本发明扩大了采集设备的光谱范围,得到了宽光谱范围的样本高光谱数据。通过高光谱成像技术实现了混合高粱的快速、无损采集。
通过将混合高粱样本的可见光、近红外光谱数据进行特征融合,并建立混合高粱的淀粉含量的数学模型。为了提高混合高粱的淀粉含量预测的精度,本发明提出了一种新的数据融合方式来融合可见光、近红外光谱数据,实现了混合高粱的高精度检测。
与现有技术相比,本发明具有以下有益效果:
(一)、高粱籽粒的准确分割。混合高粱样本的高光谱图像包含了大量无关的背景信息和高粱籽粒的信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,以及解决高粱籽粒的过分割和欠分割现象。本专利提出了基于扩展极大值变换改进后的分水岭算法实现了混合高粱的RGB图像中高粱籽粒的分割。在使用分水岭算法之前,对高粱的RGB图像进行了扩展极大值变换,得到了高粱籽粒轮廓清晰的图像,将图像用于分水岭算法中,得到准确分割后的高粱籽粒图像,并准确提取了单颗高粱籽粒的光谱数据,有利于后续建立精度高的淀粉含量预测模型。
(二)采用了特征融合方法对2个光谱范围(Vis、NIR)的混合高粱的高光谱数据进行了特征融合。本申请采用2种方法分别提取Vis和NIR的光谱数据的光谱特征或特征波长。
1)使用自变量(Vis和NIR的光谱数据)和因变量(混合高粱的淀粉含量)建立的偏最小二乘法回归(PLSR)模型;然后建立的PLSR模型根据累计贡献率选择潜在变量对应的得分矩阵作为光谱特征。将上述方法在Vis和NIR的光谱数据提取的光谱特征分别串行拼接在一起,用于后续混合高粱的支链淀粉含量预测模型建模。
2)使用Pearson相关系数提取与高粱淀粉含量相关性高的特征波长。根据Pearson相关系数绝对值和显著性水平系数选择了Vis和NIR下的特征波长。将上述方法在Vis和NIR的光谱数据提取的特征波长分别串行拼接在一起,用于后续混合高粱的直链淀粉含量预测模型建模。
(三)开发了一种遗传算法优化BP神经网络(GA-BPNN)的淀粉含量预测模型。本专利将GA算法和BP神经网络结合起来,对神经网络的初始的权值和阈值进行整体优化。经过测试,发现按如下设定GA-BPNN的网络结构和参数的模型效果最佳:GA算法的种群规模设为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05;BPNN的隐含层设为1层并带有15个神经元,隐含层和输出层的激活函数分别选择tansig函数、purelin函数,网络学习率和迭代次数分别设为0.001、1000。
(四)目前,未有对混合高粱的淀粉含量进行测定的方法。本申请提出了一种混合高粱的淀粉含量的快速准确检测方法,为白酒酿造过程中工艺参数的及时调整具有指导意义,同时也为其他粮食的成分检测提供了一种方法。
附图说明
图1为本发明方法的流程图;
图2为本发明实施例1中第四步的图像分割过程图;
图3为本发明实施例1中第五步光谱数据3的曲线图;
图4为本发明实施例1中第六步Pearson相关系数提取的特征波长位置。
具体实施方式
以下通过具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,为使本发明实施例的目的、技术方案和优点更加清楚,下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
因此,以下对本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中所用原料、设备,方法,若无特殊说明,均为本领域的常用原料、设备或方法。
实施例1:
一种混合高粱中支链与直链淀粉含量的检测方法,具体步骤如下:
第一步,混合高粱样本制备
本实施例选用贵州某高粱育种中心的红缨子(HYZ)作为被混合的高粱品种,选择四川、山东某高粱育种中心的美国高粱(MG)及铁杆(TG)两个品种作为混合的高粱品种。将3个高粱品种进行两两组合得到3组混合样本(MG+HYZ、TG+HYZ、TG+MG),表1说明了不同混合比例配比的高粱样本具体信息。
表1不同混合比例的高粱样本制备
Figure BDA0003572333760000101
Figure BDA0003572333760000111
注:TG+HYZ、TG+MG组合方式与上表一致。
第二步,混合高粱样本的高光谱图像采集及校正
1)设备配置:高光谱成像系统由高光谱相机(芬兰FX17/FX10系列)、卤素灯(OSRAM,German)、电控移动平台、数据采集软件(LUMO-scanner)、计算机及校正白板等组成。高光谱相机分别使用了近红外相机(NIR:940-1730nm)和可见光相机(Vis:397-1000nm)。NIR相机的波段间隔为3.5nm,将光谱分为了224个波段。Vis相机的波段间隔为2.1nm,将光谱分为了448个波段;
2)设备参数设置:在使用NIR相机时,将白板标定峰值调整为3616,曝光频率和曝光时间分别设置为50Hz和4.02ms,移动平台扫描速度设置为16.57mm/s。同样使用Vis相机采集数据时,白板标定峰值和相机的曝光频率与NIR的参数一致,曝光时间设置为8.0ms,移动平台扫描速度设置为10.84mm/s。采集参数设置完成后,将高粱样本平铺在直径为150mm的培养皿中,然后放在电控移动平台进行数据采集;若不按照上述参数设置,采集到的混合高粱的高光谱图像将不清晰,不利于后续的高粱籽粒分割和建立准确的高粱淀粉含量预测模型。
3)黑白校正:使用黑色校正板的高光谱图像数据和白色校正板的高光谱图像数据对原始高光谱图像数据进行校正,得到样本的光谱反射率。
所述黑白校正的公式如下:
Figure BDA0003572333760000112
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
第三步,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
第四步,高粱籽粒图像分割
混合高粱的图像数据包含了高粱籽粒信息的同时,也包含了无关的背景信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,需要采用图像适用的图像处理和分割算法,其具体步骤如下:
1)将高粱样本的RGB图像灰度化,得到高粱样本的灰度图像;
2)将高粱样本的RGB图像二值化,使用大津阈值分割法将图像进行二值化,得到高粱样本的黑白图像;
3)高粱样本的灰度图像进行扩展极大值变换,得到扩展极大值变换后的灰度图像;
4)灰度图像的距离变换,对变换后的黑白图像进行欧几里德距离变换,得到变换后的图像;
5)分割图像,使用分水岭算法分割距离变换后的图像,得到分水岭脊线图像;
6)将分水岭脊线图像与2)中的黑白图像相减,得到分割高粱籽粒后的二值图像。
第五步,光谱数据提取及预处理
1)从第四步分割后的二值图像中得到每个高粱籽粒内像素点坐标;
2)根据单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
光谱数据1的公式如下:
Figure BDA0003572333760000131
其中:
Figure BDA0003572333760000132
为某颗高粱籽粒内所有像素点在某个波段下的平均光谱值;m为磨课所选高粱籽粒内部的像素点个数;Ii,j为第j个像素点在第i个波段下的反射率。
3)对每个样本中所有的高粱籽粒的平均光谱向量值取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
光谱数据2的公式如下:
Figure BDA0003572333760000133
其中:
Figure BDA0003572333760000134
为混合高粱样本所有高粱籽粒在某个波段下的平均反射率;k为混合高粱样本所有高粱籽粒个数;
Figure BDA0003572333760000135
为第k个高粱在第i个波段下的平均反射率。
4)采用多元散射校正结合S-G平滑滤波器(MSC-SG)对光谱数据2进行预处理,得到光谱数据3;
光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
Figure BDA0003572333760000136
其中:r代表Pearson相关系数;xi为第i个样本光谱数据3中某个波段的反射率,
Figure BDA0003572333760000137
为光谱数据3中某个波段的平均反射率;yi为第i个样本的直链淀粉含量;
Figure BDA0003572333760000138
为所有样本的平均直链淀粉含量。
在可见光范围内的光谱数据3是一个300×448的矩阵,在近红外范围内的光谱数据3是一个300×224的矩阵,其中300代表混合高粱样本数,224和448代表波段数。
第六步,特征提取
1)根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,在可见光范围内选取了47个波长(300×47)。在近红外范围内选取了32个波长(300×32),即光谱数据4。若不根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,将会导致后续建立的淀粉含量预测模型的性能
2)根据PLSR算法提取光谱数据3的光谱特征,在可见光和近红外范围内前5个潜在变量的累计贡献率分别达到了89.23%、85.95%,因此选择可见光范围内和近红外范围内前5个潜在变量对应的得分矩阵(300×5)作为的光谱特征,即光谱特征1。
第七步,特征数据融合
将可见光和近红外范围内使用Pearson提取的特征波长(光谱数据4)、PLSR提取的光谱特征1分别进行串行拼接,分别得到光谱数据5(300×79),光谱特征2(300×10)。
数据融合是指将数据块串行拼接,如下:
数据块1:
Figure BDA0003572333760000141
数据块2:
Figure BDA0003572333760000142
拼接后:
Figure BDA0003572333760000143
第八步,GA-BPNN的模型训练
1)将第七步的光谱数据5的和第4步对应的直链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
2)将第七步的光谱特征1的和第4步对应的支链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
3)模型评估,以决定系数R2、均方根误差RMSE作为评价指标来判定模型的效果,效果如表2所示。
表2模型效果
Figure BDA0003572333760000151
第九步,待测样本的淀粉含量预测
采集待测混合高粱样本的高光谱图像,从第二步遍历至第八步,即可得到待测样本的直链和支链淀粉含量的预测值,如表3所示。
表3淀粉测量值与预测值结果对比
Figure BDA0003572333760000152
Figure BDA0003572333760000161
实施例2:
一种混合高粱中支链与直链淀粉含量的检测方法,具体步骤如下:
第一步,混合高粱样本制备
本实施例选用贵州某高粱育种中心的红缨子(HYZ)作为被混合的高粱品种,选择四川、山东某高粱育种中心的红矛高粱(HM)及睿糯高粱(RN)两个品种作为混合的高粱品种。将3个高粱品种进行两两组合得到3组混合样本(HM+HYZ、RN+HYZ、HM+RN),表4说明了不同混合比例配比的高粱样本具体信息。
表4不同混合比例的高粱样本制备
Figure BDA0003572333760000162
注:RN+HYZ、HM+RN组合方式与上表一致。
第二步,混合高粱样本的高光谱图像采集及校正
1)设备配置:高光谱成像系统由高光谱相机(芬兰FX17/FX10系列)、卤素灯(OSRAM,German)、电控移动平台、数据采集软件(LUMO-scanner)、计算机及校正白板等组成。高光谱相机分别使用了近红外相机(NIR:940-1730nm)和可见光相机(Vis:397-1000nm)。NIR相机的波段间隔为3.5nm,将光谱分为了224个波段。Vis相机的波段间隔为2.1nm,将光谱分为了448个波段;
2)设备参数设置:在使用NIR相机时,将白板标定峰值调整为3616,曝光频率和曝光时间分别设置为50Hz和4.02ms,移动平台扫描速度设置为16.57mm/s。同样使用Vis相机采集数据时,白板标定峰值和相机的曝光频率与NIR的参数一致,曝光时间设置为8.0ms,移动平台扫描速度设置为10.84mm/s。采集参数设置完成后,将高粱样本平铺在直径为150mm的培养皿中,然后放在电控移动平台进行数据采集;若不按照上述参数设置,采集到的混合高粱的高光谱图像将不清晰,不利于后续的高粱籽粒分割和建立准确的高粱淀粉含量预测模型;
3)黑白校正:使用黑色校正板的高光谱图像数据和白色校正板的高光谱图像数据对原始高光谱图像数据进行校正,得到样本的光谱反射率。
所述黑白校正的公式如下:
Figure BDA0003572333760000171
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
第三步,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
第四步,高粱籽粒图像分割
混合高粱的图像数据包含了高粱籽粒信息的同时,也包含了无关的背景信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,需要采用图像适用的图像处理和分割算法,其具体步骤如下:
1)将高粱样本的RGB图像灰度化,得到高粱样本的灰度图像;
2)将高粱样本的RGB图像二值化,使用大津阈值分割法将图像进行二值化,得到高粱样本的黑白图像;
3)高粱样本的灰度图像进行扩展极大值变换,得到扩展极大值变换后的灰度图像;
4)灰度图像的距离变换,对变换后的黑白图像进行欧几里德距离变换,得到变换后的图像;
5)分割图像,使用分水岭算法分割距离变换后的图像,得到分水岭脊线图像;
6)将分水岭脊线图像与2)中的黑白图像相减,得到分割高粱籽粒后的二值图像。
第五步,光谱数据提取及预处理
1)从第四步分割后的二值图像中得到每个高粱籽粒内像素点坐标;
2)根据单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
光谱数据1的公式如下:
Figure BDA0003572333760000181
其中:
Figure BDA0003572333760000182
为某颗高粱籽粒内所有像素点在某个波段下的平均光谱值;m为磨课所选高粱籽粒内部的像素点个数;Ii,j为第j个像素点在第i个波段下的反射率。
3)对每个样本中所有的高粱籽粒的平均光谱向量值取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
光谱数据2的公式如下:
Figure BDA0003572333760000191
其中:
Figure BDA0003572333760000192
为混合高粱样本所有高粱籽粒在某个波段下的平均反射率;k为混合高粱样本所有高粱籽粒个数;
Figure BDA0003572333760000193
为第k个高粱在第i个波段下的平均反射率。
4)采用多元散射校正结合S-G平滑滤波器(MSC-SG)对光谱数据2进行预处理,得到光谱数据3;
光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
Figure BDA0003572333760000194
其中:r代表Pearson相关系数;xi为第i个样本光谱数据3中某个波段的反射率,
Figure BDA0003572333760000195
为光谱数据3中某个波段的平均反射率;yi为第i个样本的直链淀粉含量;
Figure BDA0003572333760000196
为所有样本的平均直链淀粉含量。
在可见光范围内的光谱数据3是一个300×448的矩阵,在近红外范围内的光谱数据3是一个300×224的矩阵,其中300代表混合高粱样本数,224和448代表波段数。
第六步,特征提取
1)根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,在可见光范围内选取了42个波长(300×42)。在近红外范围内选取了28个波长(300×28),即光谱数据4。若不根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,将会导致后续建立的淀粉含量预测模型的性能
2)根据PLSR算法提取光谱数据3的光谱特征,在可见光和近红外范围内前5个潜在变量的累计贡献率分别达到了90.45%、92.63%,因此选择可见光范围内和近红外范围内前5个潜在变量对应的得分矩阵(300×5)作为的光谱特征,即光谱特征1。
第七步,特征数据融合
将可见光和近红外范围内使用Pearson提取的特征波长(光谱数据4)、PLSR提取的光谱特征1分别进行串行拼接,分别得到光谱数据5(300×70),光谱特征2(300×10)。
数据融合是指将数据块串行拼接,如下:
数据块1:
Figure BDA0003572333760000201
数据块2:
Figure BDA0003572333760000202
拼接后:
Figure BDA0003572333760000203
第八步,GA-BPNN的模型训练
1)将第七步的光谱数据5的和第4步对应的直链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
2)将第七步的光谱特征1的和第4步对应的支链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
3)模型评估,以决定系数R2、均方根误差RMSE作为评价指标来判定模型的效果,效果如表5所示。
表5模型效果
Figure BDA0003572333760000211
第九步,待测样本的淀粉含量预测
采集待测混合高粱样本的高光谱图像,从第二步遍历至第八步,即可得到待测样本的直链和支链淀粉含量的预测值,如表5所示。
表5淀粉测量值与检测值结果对比
Figure BDA0003572333760000212
本发明实施例提供了一种基于高光谱成像技术的混合高粱中支链与直链淀粉含量的检测方法,通过基于扩展极大值变换改进后的分水岭算法实现了混合高粱的RGB图像中高粱籽粒的分割;使用特征融合方法融合了混合高粱在可见光与近红外光谱范围的光谱特征或特征波长;所建立的最优检测模型能够同时快速、无损准确的检测混合高粱中支链和直链淀粉含量;对白酒酿造过程中的酿造原料(混合高粱)的支链和直链淀粉含量进行在线实时检测提供了一种新的方法。
以上所述仅为本发明的典型实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种混合高粱中支链与直链淀粉含量的检测方法,其特征在于包括以下步骤:
(1)分别采集混合高粱样本的在可见光和近红外光谱范围内的高光谱图像,获取混合高粱的原始高光谱图像数据,然后对原始高光谱图像数据进行黑白校正;
(2)测定混合的高粱样本中的支链与直连淀粉含量;
(3)针对步骤(1)的原始高光谱图像,基于扩展极大值变换改进后的分水岭算法对图像进行高粱粘连籽粒区域分割,从图像中分割出高粱籽粒部分,去除背景部分,得到每个高粱籽粒内像素点坐标;
(4)对步骤(3)单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值并进行黑白校正,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
(5)对单个样本中所有的高粱籽粒的平均光谱向量值(光谱数据1)取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
(6)对步骤(5)中的光谱数据2进行黑白校正,然后进行对其进行多元散射校正结合S-G平滑滤波器预处理,得到光谱数据3;
(7)对步骤(6)光谱数据3使用Pearson相关系数法提取特征波长,得到光谱数据4;对光谱数据3使用偏最小二乘法回归(PLSR)提取潜在变量对应的得分矩阵,即光谱特征1;
(8)对步骤(7)的可见光范围的光谱数据4和近红外光谱范围的光谱数据4进行数据融合,得到光谱数据5;对步骤(7)的可见光范围的光谱特征1和近红外光谱范围的光谱特征1进行数据融合,得到光谱特征2;
(9)将步骤(8)的光谱数据5和步骤(2)对应的直链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
(10)将步骤(8)的光谱特征2和步骤(2)对应的支链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
(11)采集待测混合高粱的高光谱图像,利用步骤(9)和(10)的预测模型进行混合高粱的直链和支链淀粉检测,得到混合高粱的淀粉含量的预测值。
2.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(1)中,所述可见光和近红外光谱范围分别为397-1000nm,940-1730nm。
进一步地,步骤(1)中,所述黑白校正的公式如下:
Figure FDA0003572333750000021
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
3.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(2)中,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
4.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(4)中,所述光谱数据1的公式如下:
Figure FDA0003572333750000022
其中:
Figure FDA0003572333750000023
为某颗高粱籽粒内所有像素点在某个波段下的平均光谱值;m为磨课所选高粱籽粒内部的像素点个数;Ii,j为第j个像素点在第i个波段下的反射率。
5.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(5)中,所述光谱数据2的公式如下:
Figure FDA0003572333750000024
其中:
Figure FDA0003572333750000025
为混合高粱样本所有高粱籽粒在某个波段下的平均反射率;k为混合高粱样本所有高粱籽粒个数;
Figure FDA0003572333750000031
为第k个高粱在第i个波段下的平均反射率。
6.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(7)中,所述Pearson相关系数法提取特征波长具体步骤如下:
(A)根据Pearson相关系数法公式计算光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
Figure FDA0003572333750000032
其中:r代表Pearson相关系数;xi为第i个样本光谱数据3中某个波段的反射率,
Figure FDA0003572333750000033
为光谱数据3中某个波段的平均反射率;yi为第i个样本的直链淀粉含量;
Figure FDA0003572333750000034
为所有样本的平均直链淀粉含量;
(B)选取Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01的波长作为特征波长。
进一步地,步骤(7)中,所述对光谱数据3使用PLSR提取潜在变量对应的得分矩阵,其具体步骤如下:
(i)将光谱数据3的数据标准化,即要将数据中心化,方法是光谱数据3的每个样本都做如下操作:减去一个维度(列)变量的均值除以该维度(列)的标准差;
(ii)求(i)自变量组(标准化后的数据)与因变量组(直链淀粉含量)的相关系数矩阵;
(iii)分别提出自变量组与因变量组的成分,当前k个成分解释自变量的比率达到90%时,取前k个成分的矩阵作为得分矩阵。
7.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(8)中,所述的数据融合是指将数据块串行拼接,如下:
数据块1:
Figure FDA0003572333750000041
数据块2:
Figure FDA0003572333750000042
拼接后:
Figure FDA0003572333750000043
8.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(9)(10)中,所述的遗传算法的种群规模设置为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05。
9.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(9)(10)中,所述的BP神经网络模型由一个输入层1个隐藏层和1个输出层组成;所述的BP神经网络模型的参数设计:确定trainlm为神经网络的训练函数,隐含层设置为1层并带有15个点神经元,确定tansig为隐含层节点的传递函数,purelin为输出层节点传递函数,网络学习函数为BP学习规则learngdm,学习率为0.001,迭代次数为1000,训练目标为4.43e-7;所述的BP神经网络模型的输入为光谱数据5或光谱特征2;所述的BP神经网络模型的输出为每个混合高粱样本所对应的直链或支链淀粉含量。
10.如权利要求1-9中任一所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,该方法用于对混合高粱的淀粉含量进行测定。
CN202210322694.5A 2022-03-30 2022-03-30 一种混合高粱中支链与直链淀粉含量的检测方法 Pending CN114693636A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210322694.5A CN114693636A (zh) 2022-03-30 2022-03-30 一种混合高粱中支链与直链淀粉含量的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210322694.5A CN114693636A (zh) 2022-03-30 2022-03-30 一种混合高粱中支链与直链淀粉含量的检测方法

Publications (1)

Publication Number Publication Date
CN114693636A true CN114693636A (zh) 2022-07-01

Family

ID=82141139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210322694.5A Pending CN114693636A (zh) 2022-03-30 2022-03-30 一种混合高粱中支链与直链淀粉含量的检测方法

Country Status (1)

Country Link
CN (1) CN114693636A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116642841A (zh) * 2023-07-18 2023-08-25 中国农业大学 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116642841A (zh) * 2023-07-18 2023-08-25 中国农业大学 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法
CN116642841B (zh) * 2023-07-18 2023-10-31 中国农业大学 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法

Similar Documents

Publication Publication Date Title
CN108663339B (zh) 基于光谱和图像信息融合的霉变玉米在线检测方法
CN108345911B (zh) 基于卷积神经网络多级特征的钢板表面缺陷检测方法
US11454594B2 (en) Method for identifying frostbite condition of grain seeds using spectral feature wavebands of seed embryo hyperspectral images
CN109269951B (zh) 基于图像的浮选尾煤灰分、浓度、粗颗粒含量检测方法
CN102495005B (zh) 高光谱图像技术诊断作物水分亏缺的方法
Guidetti et al. Evaluation of grape quality parameters by a simple Vis/NIR system
CN110070008B (zh) 一种采用无人机图像的桥梁病害识别方法
CN108169165B (zh) 基于太赫兹光谱和图像信息融合的麦芽糖混合物定量分析方法
CN110441249B (zh) 基于高光谱图像技术的窖泥总酸预测模型建立的方法
CN111855590A (zh) 水稻叶片淀粉积累量遥感反演模型和方法
CN114693636A (zh) 一种混合高粱中支链与直链淀粉含量的检测方法
Bailleres et al. Improving returns from southern pine plantations through innovative resource characterisation
CN111855593A (zh) 水稻叶片淀粉含量遥感反演模型和方法
CN116559111A (zh) 一种基于高光谱成像技术的高粱品种识别方法
CN116665057A (zh) 一种基于图像处理的河道水质监测方法及系统
Wu et al. Variety identification of Chinese cabbage seeds using visible and near-infrared spectroscopy
Rathna Priya et al. Characterising corn grain using infrared imaging and spectroscopic techniques: a review
CN104749126A (zh) 基于近红外高光谱图像分析的小麦硬度预测方法
CN110609011A (zh) 单籽粒玉米种子淀粉含量近红外高光谱检测方法及系统
CN109164069B (zh) 一种果树叶面病害级别的鉴定方法
CN115661813A (zh) 基于高光谱成像技术的多粮混杂碎颗粒快速分类检测方法
CN116297236A (zh) 一种基于高光谱的单粒玉米种子活力鉴别方法及装置
CN116026795A (zh) 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法
CN114170427B (zh) 基于雨胞的无线微波雨衰减模型ssim图像相似度评价方法
Amaral et al. Application of image analysis to the prediction of EBC barley kernel weight distribution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination