CN114693636A - 一种混合高粱中支链与直链淀粉含量的检测方法 - Google Patents
一种混合高粱中支链与直链淀粉含量的检测方法 Download PDFInfo
- Publication number
- CN114693636A CN114693636A CN202210322694.5A CN202210322694A CN114693636A CN 114693636 A CN114693636 A CN 114693636A CN 202210322694 A CN202210322694 A CN 202210322694A CN 114693636 A CN114693636 A CN 114693636A
- Authority
- CN
- China
- Prior art keywords
- sorghum
- mixed
- data
- content
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 240000006394 Sorghum bicolor Species 0.000 title claims abstract description 221
- 235000011684 Sorghum saccharatum Nutrition 0.000 title claims abstract description 221
- 229920000856 Amylose Polymers 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 63
- 229920000945 Amylopectin Polymers 0.000 title claims abstract description 54
- 230000003595 spectral effect Effects 0.000 claims abstract description 142
- 235000013339 cereals Nutrition 0.000 claims abstract description 57
- 229920002472 Starch Polymers 0.000 claims abstract description 40
- 235000019698 starch Nutrition 0.000 claims abstract description 40
- 239000008107 starch Substances 0.000 claims abstract description 40
- 238000012937 correction Methods 0.000 claims description 26
- 238000002310 reflectometry Methods 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000003062 neural network model Methods 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 13
- 238000010238 partial least squares regression Methods 0.000 claims description 13
- 238000002329 infrared spectrum Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000000227 grinding Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000010561 standard procedure Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 14
- 238000000701 chemical imaging Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 6
- 238000009614 chemical analysis method Methods 0.000 abstract description 2
- 240000008042 Zea mays Species 0.000 description 15
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 15
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 15
- 235000005822 corn Nutrition 0.000 description 15
- 238000012360 testing method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 239000002994 raw material Substances 0.000 description 8
- 210000001161 mammalian embryo Anatomy 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000001488 breeding effect Effects 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 238000009659 non-destructive testing Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013124 brewing process Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 235000018553 tannin Nutrition 0.000 description 1
- 229920001864 tannin Polymers 0.000 description 1
- 239000001648 tannin Substances 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000011514 vinification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/155—Segmentation; Edge detection involving morphological operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20152—Watershed segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种混合高粱中支链与直链淀粉含量的检测方法。所述方法包括:使用可见光和近红外高光谱成像系统分别采集混合高粱样本的高光谱图像,同时采用化学分析方法测定样本中的淀粉含量;对样本的高光谱图像的高粱籽粒进行了分割、光谱数据提取、特征波长或光谱特征提取;使用特征融合的数据建立了模型,用于预测混合高粱的淀粉含量。本发明对混合高粱的淀粉含量实现了快速无损、准确评估,有效的检测了不同配比的混合高粱样本的淀粉含量,为混合高粱的支链淀粉与直链淀粉含量的在线检测提供了一种方法。
Description
技术领域
本发明为一种混合高粱中支链与直链淀粉含量的检测方法,属于固态酿造原料检测技术领域,特别涉及了一种基于高光谱成像技术的混合高粱中支链与直链淀粉含量的检测方法。
背景技术
固态发酵技术在我国有着悠久的历史,也是我国特有的酿造工艺。在白酒酿造行业中,由于高粱中的淀粉含量高,大约占高粱成分的65~70%,蛋白质、单宁、脂肪等含量也适当;因此高粱常作为酿酒较为理想的原料,用于酱香型白酒的单一原料和浓香型白酒的主要原料。
高粱中的淀粉由直链淀粉和支链淀粉组成,它们不仅是生成酒精的主要成分,同样也是酿酒微生物生长繁殖的主要能量来源。支链淀粉越高的高粱品种,高粱糊化也就越容易,其更利于酿酒微生物的生长繁殖以及新陈代谢,同时也会生成更多香味物质,使白酒的风味更为丰满。直链淀粉越高的高粱品种,高粱糊化也就越难,但可以提高白酒的产量。对于不同品种的高粱,其直链淀粉和支链淀粉含量也不相同,酒厂常使用多种混合品种的高粱作为酿造原料。由于不同高粱品种混合后的直链淀粉和支链淀粉含量是难以精确估测的,为了保证白酒的品质和产量,因此检测不同比例配比的混合高粱的直链淀粉和支链淀粉含量尤为重要。
目前,高粱淀粉含量的检测主要采用化学分析方法和无损检测方法。化学方法中常使用碘亲和力滴定法和双波长分光光度法对淀粉含量进行测定,但是此类方法耗时长,且属于破坏性检测;无损检测中常用近红外光谱技术对淀粉含量进行非破坏性测定,但只能实现单点检测且检测精度不高;因此需要一种快速无损的方法获取混合高粱中支链与直链淀粉含量。
现有专利CN110609011A,发明名称为单籽粒玉米种子淀粉含量近红外高光谱检测方法及系统,该发明记载:通过获取待检测单籽粒玉米种子的双表面(胚面、非胚面)光谱曲线;将所述待检测单籽粒玉米种子的双表面光谱曲线输入预先构建的单籽粒玉米种子淀粉含量预测模型,获得待检测单籽粒玉米种子的淀粉含量理化值。通过结合胚面和非胚面的高光谱信息,在单籽粒水平上实现玉米种子淀粉含量的快速无损检测,为单籽粒玉米种子品质快速分级筛选提供新的技术手段。但是该专利所述的单籽粒玉米种子淀粉含量检测方法不具有效率性、准确性。若在实际的单粒玉米种子品质快速分级晒选中,使用近红外高光谱系统采集了单粒玉米种子胚面的光谱数据,然后翻转单粒玉米种子至非胚面,再采集非胚面的光谱数据,此过程较浪费时间,不利于单粒玉米种子品质快速分级;另外,同一粒玉米种子胚面和非胚面的光谱数据需要准确对应,若未准确对应,将不能建立一个高精度的单粒玉米种子的淀粉含量预测模型。此外,该专利也未提及所使用的单粒玉米种子淀粉含量预测模型是哪种数学模型,也未提及该方法检测单粒玉米种子淀粉含量的精度如何。
CN103163128A,发明名称为:一种高粱中支链淀粉和直链淀粉含量的测定方法,该发明记载方法包括三个步骤,首先制备高粱支链淀粉回归方程和直链淀粉回归方程,然后计算支链淀粉的吸收比α和直链淀粉的吸收比β,最后样品测定,在该步骤中,通过给定公式计算支链淀粉和直链淀粉在测定波长的吸光度,然后再将相应的将吸收比和吸光度带入相应的回归方程中即得支链淀粉和直链淀粉的浓度。但该专利所述高粱中支链淀粉和直链淀粉含量的测定方法属于破坏性检测,样本检测过后不能再进行使用,如果样本量较大的话就会造成资源的浪费。另外专利所述的检测方法周期较长,无法实现高粱中支链淀粉和直链淀粉的快速检测。此外该专利方法只能得到支链淀粉和直链淀粉的浓度,没有实现其具体含量的检测。
发明内容
本发明的目的是针对现有技术中存在的技术问题,提供一种混合高粱中支链与直链淀粉含量的检测方法。该检测方法能对混合高粱的淀粉含量实现了快速无损、准确评估,能有效的检测不同配比的混合高粱样本的淀粉含量,为混合高粱的支链淀粉与直链淀粉含量的在线检测提供了一种方法。
为了实现以上发明目的,本发明的具体技术方案为:
一种混合高粱中支链与直链淀粉含量的检测方法,包括以下步骤:
(1)分别采集混合高粱样本的在可见光和近红外光谱范围内的高光谱图像,获取混合高粱的原始高光谱图像数据,然后对原始高光谱图像数据进行黑白校正;
(2)测定混合的高粱样本的支链与直连淀粉含量;
(3)针对步骤(1)的原始高光谱图像,基于扩展极大值变换改进后的分水岭算法对图像进行高粱粘连籽粒区域分割,从图像中分割出高粱籽粒部分,去除背景部分,得到每个高粱籽粒内像素点坐标;
(4)对步骤(3)单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值并进行黑白校正,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
(5)对单个样本中所有的高粱籽粒的平均光谱向量值(光谱数据1)取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
(6)对步骤(5)中的光谱数据2进行黑白校正,然后进行对其进行多元散射校正结合S-G平滑滤波器预处理,得到光谱数据3;
(7)对步骤(6)光谱数据3使用Pearson相关系数法提取特征波长,得到光谱数据4;对光谱数据3使用偏最小二乘法回归(PLSR)提取潜在变量对应的得分矩阵,即光谱特征1;
(8)对步骤(7)的可见光范围的光谱数据4和近红外光谱范围的光谱数据4进行数据融合,得到光谱数据5;对步骤(7)的可见光范围的光谱特征1和近红外光谱范围的光谱特征1进行数据融合,得到光谱特征2;
(9)将步骤(8)的光谱数据5和步骤(2)对应的直链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
(10)将步骤(8)的光谱特征2和步骤(2)对应的支链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
(11)采集待测混合高粱的高光谱图像,利用步骤(9)和(10)的预测模型进行混合高粱的直链和支链淀粉检测,得到混合高粱的淀粉含量的预测值。
进一步地,步骤(1)中,所述可见光和近红外光谱范围分别为397-1000nm,940-1730nm。
进一步地,步骤(1)中,所述黑白校正的公式如下:
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
进一步地,步骤(2)中,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
进一步地,步骤(4)中,所述光谱数据1的公式如下:
进一步地,步骤(5)中,所述光谱数据2的公式如下:
进一步地,步骤(7)中,所述Pearson相关系数法提取特征波长具体步骤如下:
(A)根据Pearson相关系数法公式计算光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
(B)选取Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01的波长作为特征波长。
进一步地,步骤(7)中,所述对光谱数据3使用PLSR提取潜在变量对应的得分矩阵,其具体步骤如下:
(i)将光谱数据3的数据标准化,即要将数据中心化,方法是光谱数据3的每个样本都做如下操作:减去一个维度(列)变量的均值除以该维度(列)的标准差;
(ii)求(i)自变量组(标准化后的数据)与因变量组(直链淀粉含量)的相关系数矩阵;
(i ii)分别提出自变量组与因变量组的成分,当前k个成分解释自变量的比率达到90%时,取前k个成分的矩阵作为得分矩阵。
进一步地,步骤(8)中,所述的数据融合是指将数据块串行拼接,如下:
进一步地,步骤(9)(10)中,所述的遗传算法的种群规模设置为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05。
进一步地,步骤(9)(10)中,所述的BP神经网络模型由一个输入层1个隐藏层和1个输出层组成。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的参数设计:确定trainlm为神经网络的训练函数,隐含层设置为1层并带有15个点神经元,确定tansig为隐含层节点的传递函数,purelin为输出层节点传递函数,网络学习函数为BP学习规则learngdm,学习率为0.001,迭代次数为1000,训练目标为4.43e-7。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的输入为光谱数据5或光谱特征2。
进一步地,步骤(9)(10)中,所述的BP神经网络模型的输出为每个混合高粱样本所对应的直链或支链淀粉含量。
在该检测方法中,通过可见光、近红外高光谱成像系统采集混合高粱的高光谱样本,对高光谱样本进行淀粉含量的测定。本发明与其他现有的高光谱检测淀粉含量不同,本发明扩大了采集设备的光谱范围,得到了宽光谱范围的样本高光谱数据。通过高光谱成像技术实现了混合高粱的快速、无损采集。
通过将混合高粱样本的可见光、近红外光谱数据进行特征融合,并建立混合高粱的淀粉含量的数学模型。为了提高混合高粱的淀粉含量预测的精度,本发明提出了一种新的数据融合方式来融合可见光、近红外光谱数据,实现了混合高粱的高精度检测。
与现有技术相比,本发明具有以下有益效果:
(一)、高粱籽粒的准确分割。混合高粱样本的高光谱图像包含了大量无关的背景信息和高粱籽粒的信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,以及解决高粱籽粒的过分割和欠分割现象。本专利提出了基于扩展极大值变换改进后的分水岭算法实现了混合高粱的RGB图像中高粱籽粒的分割。在使用分水岭算法之前,对高粱的RGB图像进行了扩展极大值变换,得到了高粱籽粒轮廓清晰的图像,将图像用于分水岭算法中,得到准确分割后的高粱籽粒图像,并准确提取了单颗高粱籽粒的光谱数据,有利于后续建立精度高的淀粉含量预测模型。
(二)采用了特征融合方法对2个光谱范围(Vis、NIR)的混合高粱的高光谱数据进行了特征融合。本申请采用2种方法分别提取Vis和NIR的光谱数据的光谱特征或特征波长。
1)使用自变量(Vis和NIR的光谱数据)和因变量(混合高粱的淀粉含量)建立的偏最小二乘法回归(PLSR)模型;然后建立的PLSR模型根据累计贡献率选择潜在变量对应的得分矩阵作为光谱特征。将上述方法在Vis和NIR的光谱数据提取的光谱特征分别串行拼接在一起,用于后续混合高粱的支链淀粉含量预测模型建模。
2)使用Pearson相关系数提取与高粱淀粉含量相关性高的特征波长。根据Pearson相关系数绝对值和显著性水平系数选择了Vis和NIR下的特征波长。将上述方法在Vis和NIR的光谱数据提取的特征波长分别串行拼接在一起,用于后续混合高粱的直链淀粉含量预测模型建模。
(三)开发了一种遗传算法优化BP神经网络(GA-BPNN)的淀粉含量预测模型。本专利将GA算法和BP神经网络结合起来,对神经网络的初始的权值和阈值进行整体优化。经过测试,发现按如下设定GA-BPNN的网络结构和参数的模型效果最佳:GA算法的种群规模设为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05;BPNN的隐含层设为1层并带有15个神经元,隐含层和输出层的激活函数分别选择tansig函数、purelin函数,网络学习率和迭代次数分别设为0.001、1000。
(四)目前,未有对混合高粱的淀粉含量进行测定的方法。本申请提出了一种混合高粱的淀粉含量的快速准确检测方法,为白酒酿造过程中工艺参数的及时调整具有指导意义,同时也为其他粮食的成分检测提供了一种方法。
附图说明
图1为本发明方法的流程图;
图2为本发明实施例1中第四步的图像分割过程图;
图3为本发明实施例1中第五步光谱数据3的曲线图;
图4为本发明实施例1中第六步Pearson相关系数提取的特征波长位置。
具体实施方式
以下通过具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,为使本发明实施例的目的、技术方案和优点更加清楚,下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
因此,以下对本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中所用原料、设备,方法,若无特殊说明,均为本领域的常用原料、设备或方法。
实施例1:
一种混合高粱中支链与直链淀粉含量的检测方法,具体步骤如下:
第一步,混合高粱样本制备
本实施例选用贵州某高粱育种中心的红缨子(HYZ)作为被混合的高粱品种,选择四川、山东某高粱育种中心的美国高粱(MG)及铁杆(TG)两个品种作为混合的高粱品种。将3个高粱品种进行两两组合得到3组混合样本(MG+HYZ、TG+HYZ、TG+MG),表1说明了不同混合比例配比的高粱样本具体信息。
表1不同混合比例的高粱样本制备
注:TG+HYZ、TG+MG组合方式与上表一致。
第二步,混合高粱样本的高光谱图像采集及校正
1)设备配置:高光谱成像系统由高光谱相机(芬兰FX17/FX10系列)、卤素灯(OSRAM,German)、电控移动平台、数据采集软件(LUMO-scanner)、计算机及校正白板等组成。高光谱相机分别使用了近红外相机(NIR:940-1730nm)和可见光相机(Vis:397-1000nm)。NIR相机的波段间隔为3.5nm,将光谱分为了224个波段。Vis相机的波段间隔为2.1nm,将光谱分为了448个波段;
2)设备参数设置:在使用NIR相机时,将白板标定峰值调整为3616,曝光频率和曝光时间分别设置为50Hz和4.02ms,移动平台扫描速度设置为16.57mm/s。同样使用Vis相机采集数据时,白板标定峰值和相机的曝光频率与NIR的参数一致,曝光时间设置为8.0ms,移动平台扫描速度设置为10.84mm/s。采集参数设置完成后,将高粱样本平铺在直径为150mm的培养皿中,然后放在电控移动平台进行数据采集;若不按照上述参数设置,采集到的混合高粱的高光谱图像将不清晰,不利于后续的高粱籽粒分割和建立准确的高粱淀粉含量预测模型。
3)黑白校正:使用黑色校正板的高光谱图像数据和白色校正板的高光谱图像数据对原始高光谱图像数据进行校正,得到样本的光谱反射率。
所述黑白校正的公式如下:
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
第三步,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
第四步,高粱籽粒图像分割
混合高粱的图像数据包含了高粱籽粒信息的同时,也包含了无关的背景信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,需要采用图像适用的图像处理和分割算法,其具体步骤如下:
1)将高粱样本的RGB图像灰度化,得到高粱样本的灰度图像;
2)将高粱样本的RGB图像二值化,使用大津阈值分割法将图像进行二值化,得到高粱样本的黑白图像;
3)高粱样本的灰度图像进行扩展极大值变换,得到扩展极大值变换后的灰度图像;
4)灰度图像的距离变换,对变换后的黑白图像进行欧几里德距离变换,得到变换后的图像;
5)分割图像,使用分水岭算法分割距离变换后的图像,得到分水岭脊线图像;
6)将分水岭脊线图像与2)中的黑白图像相减,得到分割高粱籽粒后的二值图像。
第五步,光谱数据提取及预处理
1)从第四步分割后的二值图像中得到每个高粱籽粒内像素点坐标;
2)根据单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
光谱数据1的公式如下:
3)对每个样本中所有的高粱籽粒的平均光谱向量值取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
光谱数据2的公式如下:
4)采用多元散射校正结合S-G平滑滤波器(MSC-SG)对光谱数据2进行预处理,得到光谱数据3;
光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
在可见光范围内的光谱数据3是一个300×448的矩阵,在近红外范围内的光谱数据3是一个300×224的矩阵,其中300代表混合高粱样本数,224和448代表波段数。
第六步,特征提取
1)根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,在可见光范围内选取了47个波长(300×47)。在近红外范围内选取了32个波长(300×32),即光谱数据4。若不根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,将会导致后续建立的淀粉含量预测模型的性能
2)根据PLSR算法提取光谱数据3的光谱特征,在可见光和近红外范围内前5个潜在变量的累计贡献率分别达到了89.23%、85.95%,因此选择可见光范围内和近红外范围内前5个潜在变量对应的得分矩阵(300×5)作为的光谱特征,即光谱特征1。
第七步,特征数据融合
将可见光和近红外范围内使用Pearson提取的特征波长(光谱数据4)、PLSR提取的光谱特征1分别进行串行拼接,分别得到光谱数据5(300×79),光谱特征2(300×10)。
数据融合是指将数据块串行拼接,如下:
第八步,GA-BPNN的模型训练
1)将第七步的光谱数据5的和第4步对应的直链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
2)将第七步的光谱特征1的和第4步对应的支链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
3)模型评估,以决定系数R2、均方根误差RMSE作为评价指标来判定模型的效果,效果如表2所示。
表2模型效果
第九步,待测样本的淀粉含量预测
采集待测混合高粱样本的高光谱图像,从第二步遍历至第八步,即可得到待测样本的直链和支链淀粉含量的预测值,如表3所示。
表3淀粉测量值与预测值结果对比
实施例2:
一种混合高粱中支链与直链淀粉含量的检测方法,具体步骤如下:
第一步,混合高粱样本制备
本实施例选用贵州某高粱育种中心的红缨子(HYZ)作为被混合的高粱品种,选择四川、山东某高粱育种中心的红矛高粱(HM)及睿糯高粱(RN)两个品种作为混合的高粱品种。将3个高粱品种进行两两组合得到3组混合样本(HM+HYZ、RN+HYZ、HM+RN),表4说明了不同混合比例配比的高粱样本具体信息。
表4不同混合比例的高粱样本制备
注:RN+HYZ、HM+RN组合方式与上表一致。
第二步,混合高粱样本的高光谱图像采集及校正
1)设备配置:高光谱成像系统由高光谱相机(芬兰FX17/FX10系列)、卤素灯(OSRAM,German)、电控移动平台、数据采集软件(LUMO-scanner)、计算机及校正白板等组成。高光谱相机分别使用了近红外相机(NIR:940-1730nm)和可见光相机(Vis:397-1000nm)。NIR相机的波段间隔为3.5nm,将光谱分为了224个波段。Vis相机的波段间隔为2.1nm,将光谱分为了448个波段;
2)设备参数设置:在使用NIR相机时,将白板标定峰值调整为3616,曝光频率和曝光时间分别设置为50Hz和4.02ms,移动平台扫描速度设置为16.57mm/s。同样使用Vis相机采集数据时,白板标定峰值和相机的曝光频率与NIR的参数一致,曝光时间设置为8.0ms,移动平台扫描速度设置为10.84mm/s。采集参数设置完成后,将高粱样本平铺在直径为150mm的培养皿中,然后放在电控移动平台进行数据采集;若不按照上述参数设置,采集到的混合高粱的高光谱图像将不清晰,不利于后续的高粱籽粒分割和建立准确的高粱淀粉含量预测模型;
3)黑白校正:使用黑色校正板的高光谱图像数据和白色校正板的高光谱图像数据对原始高光谱图像数据进行校正,得到样本的光谱反射率。
所述黑白校正的公式如下:
其中:R是混合高粱样本校正后的反射率图像;I是混合高粱样本的原始高光谱图像;W是标准白板图像;D是标准黑板图像。
第三步,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
第四步,高粱籽粒图像分割
混合高粱的图像数据包含了高粱籽粒信息的同时,也包含了无关的背景信息,并且高粱籽粒之间存在粘结现象。为了剔除无关的背景信息和分割存在粘结现象的高粱籽粒,需要采用图像适用的图像处理和分割算法,其具体步骤如下:
1)将高粱样本的RGB图像灰度化,得到高粱样本的灰度图像;
2)将高粱样本的RGB图像二值化,使用大津阈值分割法将图像进行二值化,得到高粱样本的黑白图像;
3)高粱样本的灰度图像进行扩展极大值变换,得到扩展极大值变换后的灰度图像;
4)灰度图像的距离变换,对变换后的黑白图像进行欧几里德距离变换,得到变换后的图像;
5)分割图像,使用分水岭算法分割距离变换后的图像,得到分水岭脊线图像;
6)将分水岭脊线图像与2)中的黑白图像相减,得到分割高粱籽粒后的二值图像。
第五步,光谱数据提取及预处理
1)从第四步分割后的二值图像中得到每个高粱籽粒内像素点坐标;
2)根据单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
光谱数据1的公式如下:
3)对每个样本中所有的高粱籽粒的平均光谱向量值取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
光谱数据2的公式如下:
4)采用多元散射校正结合S-G平滑滤波器(MSC-SG)对光谱数据2进行预处理,得到光谱数据3;
光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
在可见光范围内的光谱数据3是一个300×448的矩阵,在近红外范围内的光谱数据3是一个300×224的矩阵,其中300代表混合高粱样本数,224和448代表波段数。
第六步,特征提取
1)根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,在可见光范围内选取了42个波长(300×42)。在近红外范围内选取了28个波长(300×28),即光谱数据4。若不根据Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01提取光谱数据3的特征波长,将会导致后续建立的淀粉含量预测模型的性能
2)根据PLSR算法提取光谱数据3的光谱特征,在可见光和近红外范围内前5个潜在变量的累计贡献率分别达到了90.45%、92.63%,因此选择可见光范围内和近红外范围内前5个潜在变量对应的得分矩阵(300×5)作为的光谱特征,即光谱特征1。
第七步,特征数据融合
将可见光和近红外范围内使用Pearson提取的特征波长(光谱数据4)、PLSR提取的光谱特征1分别进行串行拼接,分别得到光谱数据5(300×70),光谱特征2(300×10)。
数据融合是指将数据块串行拼接,如下:
第八步,GA-BPNN的模型训练
1)将第七步的光谱数据5的和第4步对应的直链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
2)将第七步的光谱特征1的和第4步对应的支链淀粉含量数据作为训练集(260个样本)和测试集(40),构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
3)模型评估,以决定系数R2、均方根误差RMSE作为评价指标来判定模型的效果,效果如表5所示。
表5模型效果
第九步,待测样本的淀粉含量预测
采集待测混合高粱样本的高光谱图像,从第二步遍历至第八步,即可得到待测样本的直链和支链淀粉含量的预测值,如表5所示。
表5淀粉测量值与检测值结果对比
本发明实施例提供了一种基于高光谱成像技术的混合高粱中支链与直链淀粉含量的检测方法,通过基于扩展极大值变换改进后的分水岭算法实现了混合高粱的RGB图像中高粱籽粒的分割;使用特征融合方法融合了混合高粱在可见光与近红外光谱范围的光谱特征或特征波长;所建立的最优检测模型能够同时快速、无损准确的检测混合高粱中支链和直链淀粉含量;对白酒酿造过程中的酿造原料(混合高粱)的支链和直链淀粉含量进行在线实时检测提供了一种新的方法。
以上所述仅为本发明的典型实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种混合高粱中支链与直链淀粉含量的检测方法,其特征在于包括以下步骤:
(1)分别采集混合高粱样本的在可见光和近红外光谱范围内的高光谱图像,获取混合高粱的原始高光谱图像数据,然后对原始高光谱图像数据进行黑白校正;
(2)测定混合的高粱样本中的支链与直连淀粉含量;
(3)针对步骤(1)的原始高光谱图像,基于扩展极大值变换改进后的分水岭算法对图像进行高粱粘连籽粒区域分割,从图像中分割出高粱籽粒部分,去除背景部分,得到每个高粱籽粒内像素点坐标;
(4)对步骤(3)单个高粱籽粒内像素点坐标,提取其像素坐标下的光谱向量值并进行黑白校正,然后对单个高粱籽粒内所有像素点在同一波段下的光谱值取平均处理,得到单个高粱籽粒的平均光谱向量值,即光谱数据1;
(5)对单个样本中所有的高粱籽粒的平均光谱向量值(光谱数据1)取平均处理,得到高粱样本的平均光谱向量值,即光谱数据2;
(6)对步骤(5)中的光谱数据2进行黑白校正,然后进行对其进行多元散射校正结合S-G平滑滤波器预处理,得到光谱数据3;
(7)对步骤(6)光谱数据3使用Pearson相关系数法提取特征波长,得到光谱数据4;对光谱数据3使用偏最小二乘法回归(PLSR)提取潜在变量对应的得分矩阵,即光谱特征1;
(8)对步骤(7)的可见光范围的光谱数据4和近红外光谱范围的光谱数据4进行数据融合,得到光谱数据5;对步骤(7)的可见光范围的光谱特征1和近红外光谱范围的光谱特征1进行数据融合,得到光谱特征2;
(9)将步骤(8)的光谱数据5和步骤(2)对应的直链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的直链淀粉的预测模型;
(10)将步骤(8)的光谱特征2和步骤(2)对应的支链淀粉含量数据作为训练集,构建遗传算法结合BP神经网络模型,得到混合高粱的支链淀粉的预测模型;
(11)采集待测混合高粱的高光谱图像,利用步骤(9)和(10)的预测模型进行混合高粱的直链和支链淀粉检测,得到混合高粱的淀粉含量的预测值。
3.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(2)中,使用GB7648-87国标方法测定每个混合高粱样本的直链、直链淀粉含量。
6.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(7)中,所述Pearson相关系数法提取特征波长具体步骤如下:
(A)根据Pearson相关系数法公式计算光谱数据3和直链淀粉含量数据的相关程度统计量,公式如下:
(B)选取Pearson相关系数绝对值≥0.9(极强相关)且显著性水平系数绝对值≤0.01的波长作为特征波长。
进一步地,步骤(7)中,所述对光谱数据3使用PLSR提取潜在变量对应的得分矩阵,其具体步骤如下:
(i)将光谱数据3的数据标准化,即要将数据中心化,方法是光谱数据3的每个样本都做如下操作:减去一个维度(列)变量的均值除以该维度(列)的标准差;
(ii)求(i)自变量组(标准化后的数据)与因变量组(直链淀粉含量)的相关系数矩阵;
(iii)分别提出自变量组与因变量组的成分,当前k个成分解释自变量的比率达到90%时,取前k个成分的矩阵作为得分矩阵。
8.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(9)(10)中,所述的遗传算法的种群规模设置为100,遗传迭代次数为50,交叉概率为0.6,变异概率为0.05。
9.如权利要求1所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,步骤(9)(10)中,所述的BP神经网络模型由一个输入层1个隐藏层和1个输出层组成;所述的BP神经网络模型的参数设计:确定trainlm为神经网络的训练函数,隐含层设置为1层并带有15个点神经元,确定tansig为隐含层节点的传递函数,purelin为输出层节点传递函数,网络学习函数为BP学习规则learngdm,学习率为0.001,迭代次数为1000,训练目标为4.43e-7;所述的BP神经网络模型的输入为光谱数据5或光谱特征2;所述的BP神经网络模型的输出为每个混合高粱样本所对应的直链或支链淀粉含量。
10.如权利要求1-9中任一所述混合高粱中支链与直链淀粉含量的检测方法,其特征在于,该方法用于对混合高粱的淀粉含量进行测定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210322694.5A CN114693636A (zh) | 2022-03-30 | 2022-03-30 | 一种混合高粱中支链与直链淀粉含量的检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210322694.5A CN114693636A (zh) | 2022-03-30 | 2022-03-30 | 一种混合高粱中支链与直链淀粉含量的检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114693636A true CN114693636A (zh) | 2022-07-01 |
Family
ID=82141139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210322694.5A Pending CN114693636A (zh) | 2022-03-30 | 2022-03-30 | 一种混合高粱中支链与直链淀粉含量的检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114693636A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116642841A (zh) * | 2023-07-18 | 2023-08-25 | 中国农业大学 | 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法 |
-
2022
- 2022-03-30 CN CN202210322694.5A patent/CN114693636A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116642841A (zh) * | 2023-07-18 | 2023-08-25 | 中国农业大学 | 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法 |
CN116642841B (zh) * | 2023-07-18 | 2023-10-31 | 中国农业大学 | 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108663339B (zh) | 基于光谱和图像信息融合的霉变玉米在线检测方法 | |
CN109269951B (zh) | 基于图像的浮选尾煤灰分、浓度、粗颗粒含量检测方法 | |
CN102495005B (zh) | 高光谱图像技术诊断作物水分亏缺的方法 | |
CN110276386A (zh) | 一种基于机器视觉的苹果分级方法及系统 | |
CN110070008A (zh) | 一种采用无人机图像的桥梁病害识别方法 | |
CN108169165B (zh) | 基于太赫兹光谱和图像信息融合的麦芽糖混合物定量分析方法 | |
CN113049530A (zh) | 一种基于近红外高光谱的单粒玉米种子水分含量检测方法 | |
CN110441249B (zh) | 基于高光谱图像技术的窖泥总酸预测模型建立的方法 | |
CN111855590A (zh) | 水稻叶片淀粉积累量遥感反演模型和方法 | |
CN110398473A (zh) | 一种农产品产地检测方法及系统 | |
CN115661813A (zh) | 基于高光谱成像技术的多粮混杂碎颗粒快速分类检测方法 | |
CN116559111A (zh) | 一种基于高光谱成像技术的高粱品种识别方法 | |
CN114693636A (zh) | 一种混合高粱中支链与直链淀粉含量的检测方法 | |
CN111855593A (zh) | 水稻叶片淀粉含量遥感反演模型和方法 | |
CN116665057A (zh) | 一种基于图像处理的河道水质监测方法及系统 | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
CN116297236A (zh) | 一种基于高光谱的单粒玉米种子活力鉴别方法及装置 | |
CN118067639A (zh) | 一种评价纺织品老化程度的高光谱图像采集和分析方法 | |
CN109164069B (zh) | 一种果树叶面病害级别的鉴定方法 | |
CN104990891A (zh) | 一种种子近红外光谱和光谱图像定性分析模型建立方法 | |
CN116337781A (zh) | 一种基于光谱图像重建的高粱品种识别方法 | |
CN114813593A (zh) | 基于高光谱成像技术的糟醅总酸含量的检测方法 | |
CN114170427A (zh) | 基于雨胞的无线微波雨衰减模型ssim图像相似度评价方法 | |
Amaral et al. | Application of image analysis to the prediction of EBC barley kernel weight distribution | |
CN108955560B (zh) | 一种槭属种子形态测定及分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |