CN114066887A - 大米垩白区域检测方法、装置、设备及存储介质 - Google Patents
大米垩白区域检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114066887A CN114066887A CN202210025286.3A CN202210025286A CN114066887A CN 114066887 A CN114066887 A CN 114066887A CN 202210025286 A CN202210025286 A CN 202210025286A CN 114066887 A CN114066887 A CN 114066887A
- Authority
- CN
- China
- Prior art keywords
- chalky
- area
- rice
- image
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000007164 Oryza sativa Nutrition 0.000 title claims abstract description 201
- 235000009566 rice Nutrition 0.000 title claims abstract description 201
- 238000001514 detection method Methods 0.000 title claims abstract description 24
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 240000007594 Oryza sativa Species 0.000 title 1
- 241000209094 Oryza Species 0.000 claims abstract description 200
- 230000011218 segmentation Effects 0.000 claims abstract description 89
- 238000012549 training Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 56
- 238000012360 testing method Methods 0.000 claims abstract description 37
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 44
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 16
- 230000002776 aggregation Effects 0.000 claims description 15
- 238000004220 aggregation Methods 0.000 claims description 15
- 238000013135 deep learning Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 7
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 239000011796 hollow space material Substances 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 5
- 239000011800 void material Substances 0.000 description 21
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30181—Earth observation
- G06T2207/30188—Vegetation; Agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种大米垩白区域检测方法、装置、设备及存储介质,所述方法包括:对大米图像数据集中的各大米图像进行正常区域和垩白区域标注;对大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本;利用训练样本和测试样本训练和测试垩白分割模型;获取待检测大米图像,并将待检测大米图像输入至训练好的垩白分割模型,输出待检测大米图像中的大米垩白区域。本发明能够快速准确地对大米进行垩白区域检测,且具有抗干扰能力强,稳定性好,模型参数量小等优点。
Description
技术领域
本发明涉及检测技术领域,尤其涉及一种大米垩白区域检测方法、装置、设备及存储介质。
背景技术
大米的外观是大米品质一项非常重要的指标,正常大米呈白色透明状,垩白区域是因稻谷生长过程中由于气候、养分等因素影响淀粉颗粒排列不够密致导致透光率变化而引起,垩白区域呈白色不透明状,边界不清晰,通常位于大米的腹部。大米的质量安全关系着人们的生命健康,垩白米相比正常稻米透明度低,加工易断裂,食味品质差,同时垩白米缺少有助于人体代谢的成份,营养价值低,这些因素直接影响稻米的价格,因此垩白信息成为了决定稻米质量优劣的重要评价指标。
对大米垩白区域进行检测的相关技术包括:
(1)基于阈值和边缘检测的方法:垩白区域由于其白色不透明特性,在图像上相比稻米其他部分要呈现出高亮度的特征。基于阈值和边缘检测分割算法,其原理主要是通过图像灰度值来区分稻谷中的垩白区域和非垩白区域。问题在于:此类方法对图像质量要求高,对不同类别的大米适应性差,尤其是大米籽粒上存在划痕、破碎以及大米胚芽等也会在灰度图像上也表现出高亮度特征,此时该方法会经常出现误识别。同时不同稻谷的透明度也不相同,该方法为了适应不同的稻谷样本需要不断去调节相应阈值参数。
(2)深度学习方法:是基于卷积神经网络的语义分割方法,过程为:对采集到的大米图像中的垩白区域及非垩白区域进行标注,制作大米分割数据集;将标注的数据送到语义分割网络进行训练,最后直接对预处理后的大米图像进行分割。问题在于:此类方法数据标准由人工标注,但人工标注存在标准不统一,标注有偏差等情况,尤其是在垩白区域与正常区域的连接处存在边界模糊等问题。此外,现有的面向大米垩白区域语义分割的方法未实现标准可调功能。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种可提高大米垩白区域识别准确度的大米垩白区域检测方法、装置、设备及存储介质。
为此,本发明实施例提供了一种大米垩白区域检测方法,所述方法包括:
获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注;
对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本;
利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型;
获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
进一步地,对标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,包括:
提取所述标注垩白区域的大米图像中的垩白区域图像;
计算所述垩白区域图像的质心,并采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域;
以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
进一步地,所述采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域,包括:
根据重度垩白和轻度垩白之间的方差g=w1×w2×(µ1-µ2)2,得到阈值T,其中,w1、w2分别为轻度垩白像素占比、重度垩白像素占比,µ1、µ2分别为轻度垩白区域的灰度均值、重度垩白区域的灰度均值,w1=N1/S、w2=N2/S,N1为轻度垩白的像素数,N2为重度垩白的像素数,S=N1+N2,T为方差g取值最大时所述垩白区域图像的灰度值;
将所述垩白区域图像中灰度值大于T的像素点记为重度垩白像素点,灰度值大于0且小于等于T的像素点记为轻度垩白像素点,得到所述垩白区域图像的轻度垩白区域和重度垩白区域。
进一步地,以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签,包括:
对所述轻度垩白区域中的像素点赋予权重值w(i,j),其中,w(i,j)=e-(d/2R),(i,j)表示所述轻度垩白区域中任一像素点的坐标,d表示图像上坐标为(i,j)的像素点到所述质心的距离,R表示所述轻度垩白区域的半径;
将所述轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到所述软标签。
进一步地,所述基于编码-解码结构的深度学习网络模型包括依次连接的编码网络结构、空洞空间金字塔结构和解码网络结构;
所述编码网络结构包括两个依次连接的第一卷积层、第一BN层、第一ReLU层,以及四个依次连接的下采样层、残差空洞深度可分离卷积层,其中,所述编码网络结构用以提取抽象的语义特征信息;
所述空洞空间金字塔结构包括并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层以及与所述全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层连接的第三卷积层,其中,所述并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层用以提高网络的感受野,获取多尺度特征信息;
所述解码网络结构包括四个依次连接的特征聚合层、残差深度可分离卷积层,以及两个并行的特征对齐处理器和与两个所述并行的特征对齐处理器连接的累加层,其中,所述特征聚合层包括上采样层、第二Concat层、第四卷积层、第二BN层、第二ReLU层、第五卷积层,所述解码网络结构的输入包括多种分辨率特征图。
进一步地,所述利用所述训练样本和所述测试样本训练和测试垩白分割模型包括:
将所述训练样本输入至垩白分割模型,使用损失函数Loss=α×Lc+(1-α)×Lm优化垩白分割模型的参数,直至迭代次数达到预设次数阈值,得到最终训练模型;其中,α为预设权重,Lc为交叉熵损失函数,Lm为MSE损失函数;
利用所述测试样本对所述最终训练模型进行分割精度评测;
在评测结果满足预设条件时,将所述最终训练模型作为所述训练好的垩白分割模型;
在评测结果不满足所述预设条件时,根据所述测评结果继续更新垩白分割模型的参数。
进一步地,在输出所述待检测大米图像中的大米垩白区域之后,所述方法还包括:
对所述待检测大米图像中大米垩白区域的范围进行调节。
此外,为实现上述目的,本发明还提供了一种大米垩白区域检测装置,所述装置包括:
获取模块,用于获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注;
预处理模块,用于对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本;
训练模块,用于利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型;
检测模块,用于获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
此外,为实现上述目的,本发明还提供了一种大米垩白区域检测设备,所述设备包括存储器、处理器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上所述的方法。
此外,为实现上述目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的方法。
根据本发明实施例的大米垩白区域检测方法、装置、设备及存储介质,通过对大米图像数据集中的各大米图像进行正常区域和垩白区域标注,对标注的垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,将处理好的大米图像数据集划分为训练样本和测试样本,用于对垩白分割模型进行训练,利用训练好的垩白分割模型对待检测大米图像进行处理,输出待检测大米图像的垩白区域。通过将人工标注的大米垩白区域与正常区域的邻接区域的硬标签转换为软标签,使垩白分割模型在学习的过程中对此区域的置信度相比于不邻接正常区域的垩白区域置信度较低,同时垩白分割模型是基于语义分割技术的大米分割模型,能够快速准确地对大米进行垩白区域检测,且具有抗干扰能力强,稳定性好,模型参数量小等优点。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是本发明第一实施例中大米垩白区域检测方法的流程图;
图2是本发明中标注数据预处理流程图;
图3是本发明中标注数据预处理过程中的相关图像示意图;
图4是本发明中垩白分割模型的网络结构图;
图5是本发明中空洞空间金字塔结构示意图;
图6是本发明中特征对齐处理器的结构示意图;
图7是本发明第二实施例中大米垩白区域检测方法的流程图;
图8是本发明第三实施例中大米垩白区域检测装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图1描述本发明第一实施例的一种大米垩白区域检测方法,所述方法包括如下步骤:
S10、获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注。
S20、对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本。
需要说明的是,通过将人工标注的大米垩白区域与正常区域的邻接区域的硬标签转换为软标签,使垩白分割模型在学习的过程中对此区域的置信度相比于不邻接正常区域的垩白区域置信度较低,提高垩白分割模型学习结果的准确性。
S30、利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型。
需要说明的是,本实施例中垩白分割模型为基于语义分割技术的大米分割模型,能够快速准确地对大米进行垩白区域检测,具有抗干扰能力强,稳定性好,模型参数量小等优点。
S40、获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
需要说明的是,本实施例通过采用大量大米图像,对大米图像中正常区域以及垩白区域两个区域进行标注,并对标注出的垩白区域的大米图像的标签进行预处理,将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,利用处理好的大米图像数据集对垩白分割模型进行训练和测试,在实际检测过程中,将待检测的大米图像输入至训练好的垩白分割模型中,即可输出待检测大米图像中的大米垩白区域。
在一些实施例中,如图2至图3所示,所述步骤S20,包括如下步骤:
S201、提取所述标注垩白区域的大米图像中的垩白区域图像。
需要说明的是,本实施例可通过标注的垩白区域掩码提取原大米图像中的垩白区域图像。
S202、计算所述垩白区域图像的质心,并采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域。
其中,垩白区域图像中每一个像素的灰度值可以理解为此像素点处的重量,对于二维图像的质心坐标,在x轴上和y轴上分别独立地找出质心。记图像中每个像素点在x轴方向上的坐标为xi,对应的灰度值为pi,在x轴方向上的质心坐标为x0,计算公式为:
在y轴方向上的质心坐标y0的计算公式为:
使用质心计算方法可以获得垩白区域的质心坐标为(x0,y0),此质心点对应的像素灰度值最大。
S203、以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
在一些实施例中,所述步骤S202中,采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域,具体包括如下步骤:
S2021、根据重度垩白和轻度垩白之间的像素值方差g=w1×w2×(µ1-µ2)2,得到阈值T,其中,w1、w2分别为轻度垩白像素占比、重度垩白像素占比,µ1、µ2分别为轻度垩白区域的灰度均值、重度垩白区域的灰度均值,w1=N1/S、w2=N2/S,N1为轻度垩白的像素数,N2为重度垩白的像素数,S=N1+N2,T为方差g取值最大时所述垩白区域图像的灰度值。
S2022、将所述垩白区域图像中灰度值大于T的像素点记为重度垩白像素点,灰度值大于0且小于等于T的像素点记为轻度垩白像素点,得到所述垩白区域图像的轻度垩白区域和重度垩白区域。
需要说明的是,本实施例使用最大类间方差法确定最佳分割阈值,将整个数据分成两个类,两类之间的像素值方差最大,那么这个阈值就是最佳的阈值。对于提取的垩白图像有三类,分别为背景区域、轻度垩白区域及重度垩白区域。其中背景区域的灰度值为0,去除背景区域,将图像由三类区域转换为只有轻度垩白区域及重度垩白区域二类,求取轻度垩白区域与重度垩白区域分割的最佳阈值,只计算1-256的灰度级。
在一些实施例中,所述步骤S203,包括如下步骤:
S2031、对所述轻度垩白区域中的像素点赋予权重值w(i,j),其中,w(i,j)=e-(d/2R),(i,j)表示所述轻度垩白区域中任一像素点的坐标,d表示图像上坐标为(i,j)的像素点到所述质心的距离,R表示所述轻度垩白区域的半径。
需要说明的是,对于轻度垩白区域的每个灰度像素值通过权重值进行缩放,以质心点为中心点,从中心点到边缘的灰度像素值逐渐减弱,也就是每个像素点对应的权重越靠近边缘的值越小,越靠近中心点的像素的权重值越大,则权重的分布符合高斯分布,可以利用近似高斯函数的指数函数来求取图像中每个像素点对应的权重值。
S2032、将所述轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到所述软标签。
其中,将轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到符合高斯分布的像素灰度值,对像素灰度值进行归一化,得到处于(0.5,1)范围内的概率值,实现轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
在一实施例中,如图4所示,所述基于编码-解码结构的深度学习网络模型包括依次连接的编码网络结构、空洞空间金字塔结构和解码网络结构:
(1)编码网络结构:
编码网络结构包括两个依次连接的第一卷积层、第一BN层、第一ReLU层,以及四个依次连接的下采样层、残差深度可分离卷积层,其中,所述编码网络结构用以提取抽象的语义特征信息。
需要说明的是,利用编码网络结构实现编码过程为:先采用步长为1连续双层的卷积核大小为3×3的第一卷积层进行大米图像特征提取,第一卷积层后面紧接第一BN层和第一ReLU层。然后利用残差空洞深度可分离卷积层进一步提取输入图像的抽象语义特征,即卷积核大小为3×3,空洞系数为2的深度可分离卷积,再利用卷积核大小为1×1的卷积做通道调整并引入残差连接避免梯度消失或爆炸。将输入图像为192×192的米粒图像送入编码网络,得到尺度为16×16的特征图,目的是提取抽象的语义特征信息,再将编码阶段最后一层的特征送入到空洞空间金字塔结构,提高网络的感受野,并引入了多尺度信息。
(2)空洞空间金字塔结构:
如图5所示,空洞空间金字塔结构包括并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层以及与所述全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层连接的第三卷积层,其中,所述并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层用以提高网络的感受野,获取多尺度特征信息。
其中,带有空洞卷积的空间金字塔池化结构,主要是为了提高网络的感受野,提取多尺度信息。此网络结构可以在不改变特征图大小的同时控制感受野,有利于提取多尺度信息。其工作过程为:采用一个全局平均池化层得到图像级特征,并进行1×1卷积,使用双线性插值将特征图恢复到原始大小;一个卷积核大小为1×1的第二卷积层,以及三个卷积核大小为3×3的空洞卷积输出不同尺度特征信息,最后将5个不同尺度的特征在通道维度上连接在一起,再送入卷积核大小为1×1的第三卷积层进行融合输出。
(3)解码网络结构:
如图6所示,解码网络结构包括四个依次连接的特征聚合层、残差深度可分离卷积层,以及两个并行的特征对齐处理器和与两个所述并行的特征对齐处理器连接的累加层,其中,所述特征聚合层包括上采样层、第二Concat层、第四卷积层、第二BN层、第二ReLU层、第五卷积层,所述解码网络结构的输入包括多种分辨率特征图。
需要说明的是,解码网络结构将空洞空间金字塔结构输出的低分辨率的高级特征经过上采样与编码网络结构输出的高分辨低级特征图进行特征聚合,使用特征对齐处理器进行特征融合,能够精准对齐高分辨率和低分辨率特征映射,将低级和高级特征信息进行聚合。
需要说明的是,本实施例构建的垩白分割模型使用残差深度空洞分组卷积来保持大米数据的高分辨率特征,利用空洞金字塔结构来获取多尺度特征信息;在解码阶段使用特征对齐处理器来聚合多分辨率特征,能有效解决低分辨率和高分辨率特征图的特征错位问题。
进一步地,特征对齐处理器用于针对两个尺度的特征融合,首先对低分辨率特征进行上采样,再与高分辨率特征进行连接,经过卷积核大小为1×1的第四卷积层和卷积核大小为3×3的第五卷积层传递级联特征可以预测两个位置偏移特征图,分别对应两个尺度特征图的预测偏置,每个偏置特征图有2个通道,表示特征图宽和高的两个偏置,最后对两个尺度的特征分别对齐后进行相加操作,具体表示公式如下:
A=µ(upsample(F
l
),Δ
F
)+µ(A
h
,Δ
A
)
其中,F l 表示低分辨率特征图,A h 表示高分辨率特征图,Δ F 和Δ A 分别代表着两个尺度特征图的位置偏移特征图,µ是对齐函数,对齐函数的公式如下:
其中,µ hw 表示特征图F在(h+Δ 1hw ,w+Δ 2hw )位置上使用双线性插值得到的特征,Δ 1hw 和Δ 2hw 表示学习的对于位置(h,w)的2维变换偏移量,F h’w’ 为待对齐的特征图F上每个空间位置对应的特征,h’、w’为待对齐的特征图F上每个位置的空间坐标,为{(1,1),(1, 2),...,(H,W)}。
需要说明的是,特征对齐处理器使用可学习的对齐方法来对齐聚合期间的多分辨率特征,能有效解决特征错位问题。
需要说明的是,利用预处理后的大米训练数据对构建好的垩白分割模型进行训练,得到大米分割模型,在模型的训练期间,将多分类的语义分割任务转换为多个二分类模型的组合。进一步来说,对于大米分割任务,包括背景,正常区域,垩白区域三类。背景,正常区域的像素点标签都是one-hot形式,而垩白区域包含重度垩白区域和轻度垩白区域,垩白区域像素点的标签值被转化为概率形式,标签值范围处于[0,1]。网络模型的输出特征的通道数量为3,分别代表背景,正常区域,垩白区域的概率预测图。为了使网络模型的预测值与真实标签的误差很小,将背景区域和正常区域转换为二分类任务,垩白区域转换为回归任务。
在一实施例中,所述步骤S30,包括如下步骤:
S301、将所述训练样本输入至垩白分割模型,使用损失函数Loss=α×Lc+(1-α)×Lm优化垩白分割模型的参数,直至迭代次数达到预设次数阈值,得到最终训练模型,其中,α为预设权重,Lc为交叉熵损失函数,Lm为MSE损失函数。
其中,α为两个损失函数的权重,在训练阶段设置为0.4。
需要说明的是,交叉熵损失函数经常用于分类任务中;MSE损失函数经常用于回归任务中。对于标签以one-hot形式的背景和正常区域,取背景和正常区域的网络模型预测的概率输出与真实类别的one-hot形式进行交叉熵损失函数的计算。交叉熵损失函数为:
其中,yi表示样本i的标签,正类为1,负类为0;pi表示样本i预测为正类的概率。
对于垩白区域的标签值是以概率值的形式,处于[0,1]范围内,不是one-hot形式,使用交叉熵损失函数不能精确的计算误差损失,于是取垩白区域的网络模型预测的概率值与真实的标签值进行MSE损失函数计算,计算每个像素点的预测概率值与真实概率值的误差。MSE损失函数为:
其中,yi表示样本i的标签概率值,pi表示样本i预测的概率值。
需要说明的是,在垩白分割模型的训练过程中采用Adam优化器,网络的损失函数选择交叉熵和MSE损失函数。初始学习率设置为5×10-4,根据训练迭代次数的增大而逐步减小,训练的迭代次数设置为100次,当迭代次数达到时,网络终止训练,得到大米垩白分割模型。
S302、利用所述测试样本对所述最终训练模型进行分割精度评测。
S303、在评测结果满足预设条件时,将所述最终训练模型作为所述训练好的垩白分割模型。
S304、在评测结果不满足所述预设条件时,根据所述测评结果继续更新垩白分割模型的参数。
需要说明的是,本实施例通过结合交叉熵和MSE损失函数,能够加快网络模型的训练,网络模型对大米的预测分割概率值,背景和正常区域的预测概率值是逼近于1的,垩白区域中的重度垩白的预测输出概率值逼近于1,处于轻度垩白的预测概率值低于重度区域的概率值,通过垩白区域预测的概率值可以对垩白区域进行调节。
进一步地,本实施例在利用测试样本数据对模型进行测试之前,先对测试样本数据进行预处理,并输入到垩白分割模型中,得到初步的分割图像,然后对分割图像进行后处理。利用垩白模型对大米数据进行分割,由于背景的噪声会干扰大米的分割效果,有些像素会被分类错误,通过计算连通域面积的方式去除分割结果中的噪声,提高垩白分割模型测试的准确度。
在一实施例中,参照图7,基于第一实施例提出本发明大米垩白区域检测方法第二实施例,所述方法还包括:对所述待检测大米图像中大米垩白区域的范围进行调节。
需要说明的是,用垩白分割模型预测得到的垩白区域掩码来提取待检测大米图像中的垩白区域图像,并使用最大类间方差法求取最佳阈值T2,将垩白区域分割为重度垩白区域和轻度垩白区域。以阈值T2为设定的最大调节阈值,设置的调节阈值为0时,则网络分割得到的恶白区域不变,当设定的阈值逐渐增大至T2,则恶白区域逐渐减少。通过此方法可以对分割的恶白区域进行调节。
本实施例中,将待检测大米图像送入到学习好的垩白分割模型中,得出大米的垩白分割图像,并送入到垩白区域调节模快,通过垩白区域调节模块中设置的阈值参数,可以调节垩白区域的范围。
此外,参照图8,本发明第三实施例提供一种大米垩白区域检测装置,所述装置包括:
获取模块10,用于获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注。
预处理模块20,用于对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本。
需要说明的是,通过将人工标注的大米垩白区域与正常区域的邻接区域的硬标签转换为软标签,使垩白分割模型在学习的过程中对此区域的置信度相比于不邻接正常区域的垩白区域置信度较低,提高垩白分割模型学习结果的准确性。
训练模块30,用于利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型。
需要说明的是,本实施例中垩白分割模型为基于语义分割技术的大米分割模型,能够快速准确地对大米进行垩白区域检测,具有抗干扰能力强,稳定性好,模型参数量小等优点。
检测模块40,用于获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
需要说明的是,本实施例通过采用大量大米图像,对大米图像中正常区域以及垩白区域两个区域进行标注,并对标注出的垩白区域的大米图像的标签进行预处理,将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,利用处理好的大米图像数据集对垩白分割模型进行训练和测试,在实际检测过程中,将待检测的大米图像输入至训练好的垩白分割模型中,即可输出待检测大米图像中的大米垩白区域。
在一实施例中,所述预处理模块20,包括:
提取单元,用于提取所述标注垩白区域的大米图像中的垩白区域图像。
需要说明的是,本实施例可通过标注的垩白区域掩码提取原大米图像中的垩白区域图像。
划分单元,用于计算所述垩白区域图像的质心,并采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域。
其中,垩白区域图像中每一个像素的灰度值可以理解为此像素点处的重量,对于二维图像的质心坐标,在x轴上和y轴上分别独立地找出质心。记图像中每个像素点在x轴方向上的坐标为xi,对应的灰度值为pi,在x轴方向上的质心坐标为x0,计算公式为:
在y轴方向上的质心坐标y0的计算公式为:
使用质心计算方法可以获得垩白区域的质心坐标为(x0,y0),此质心点对应的像素灰度值最大。
转换单元,用于以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
在一实施例中,所述划分单元,具体用于:
根据重度垩白和轻度垩白之间的像素值方差g=w1×w2×(µ1-µ2)2,得到阈值T,其中,w1、w2分别为轻度垩白像素占比、重度垩白像素占比,µ1、µ2分别为轻度垩白区域的灰度均值、重度垩白区域的灰度均值,w1=N1/S、w2=N2/S,N1为轻度垩白的像素数,N2为重度垩白的像素数,S=N1+N2,T为方差g取值最大时所述垩白区域图像的灰度值。
将所述垩白区域图像中灰度值大于T的像素点记为重度垩白像素点,灰度值大于0且小于等于T的像素点记为轻度垩白像素点,得到所述垩白区域图像的轻度垩白区域和重度垩白区域。
需要说明的是,本实施例使用最大类间方差法确定最佳分割阈值,将整个数据分成两个类,两类之间的像素值方差最大,那么这个阈值就是最佳的阈值。对于提取的垩白图像有三类,分别为背景区域、轻度垩白区域及重度垩白区域。其中背景区域的灰度值为0,去除背景区域,将图像由三类区域转换为只有轻度垩白区域及重度垩白区域二类,求取轻度垩白区域与重度垩白区域分割的最佳阈值,只计算1-256的灰度级。
在一实施例中,所述转换单元,具体用于:
对所述轻度垩白区域中的像素点赋予权重值w(i,j),其中,w(i,j)=e-(d/2R),(i,j)表示所述轻度垩白区域中任一像素点的坐标,d表示图像上坐标为(i,j)的像素点到所述质心的距离,R表示所述轻度垩白区域的半径。
需要说明的是,对于轻度垩白区域的每个灰度像素值通过权重值进行缩放,以质心点为中心点,从中心点到边缘的灰度像素值逐渐减弱,也就是每个像素点对应的权重越靠近边缘的值越小,越靠近中心点的像素的权重值越大,则权重的分布符合高斯分布,可以利用近似高斯函数的指数函数来求取图像中每个像素点对应的权重值。
将所述轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到所述软标签。
其中,将轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到符合高斯分布的像素灰度值,对像素灰度值进行归一化,得到处于(0.5,1)范围内的概率值,实现轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
在一实施例中,所述基于编码-解码结构的深度学习网络模型包括依次连接的编码网络结构、空洞空间金字塔结构和解码网络结构:
(1)编码网络结构:
编码网络结构包括两个依次连接的第一卷积层、第一BN层、第一ReLU层,以及四个依次连接的下采样层、残差深度可分离卷积层,其中,所述编码网络结构用以提取抽象的语义特征信息。
需要说明的是,利用编码网络结构实现编码过程为:先采用步长为1连续双层的卷积核大小为3×3的第一卷积层进行大米图像特征提取,第一卷积层后面紧接第一BN层和第一ReLU层。然后利用残差空洞深度可分离卷积层进一步提取输入图像的抽象语义特征,即卷积核大小为3×3,空洞系数为2的深度可分离卷积,再利用卷积核大小为1×1的卷积做通道调整并引入残差连接避免梯度消失或爆炸。将网络的输入图像为192×192的米粒图像送入编码网络,得到尺度为16×16的特征图,目的是提取抽象的语义特征信息,再将编码阶段最后一层的特征送入到空洞空间金字塔结构,提高网络的感受野,并引入了多尺度信息。
(2)空洞空间金字塔结构:
空洞空间金字塔结构包括并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层以及与所述全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层连接的第三卷积层,其中,所述并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层用以提高网络的感受野,获取多尺度特征信息。
其中,带有空洞卷积的空间金字塔池化结构,主要是为了提高网络的感受野,提取多尺度信息。此网络结构可以在不改变特征图大小的同时控制感受野,有利于提取多尺度信息。其工作过程为:采用一个全局平均池化层得到图像级特征,并进行1×1卷积,使用双线性插值将特征图恢复到原始大小;一个卷积核大小为1×1的第二卷积层,以及三个卷积核大小为3×3的空洞卷积输出不同尺度特征信息,最后将5个不同尺度的特征在通道维度上连接在一起,再送入卷积核大小为1×1的第三卷积层进行融合输出。
(3)解码网络结构:
解码网络结构包括四个依次连接的特征聚合层、残差深度可分离卷积层,以及两个并行的特征对齐处理器和与两个所述并行的特征对齐处理器连接的累加层,其中,所述特征聚合层包括上采样层、第二Concat层、第四卷积层、第二BN层、第二ReLU层、第五卷积层,所述解码网络结构的输入包括多种分辨率特征图。
需要说明的是,解码网络结构将空洞空间金字塔结构输出的低分辨率的高级特征经过上采样与编码网络结构输出的高分辨低级特征图进行特征聚合,使用特征对齐处理器进行特征融合,能够精准对齐高分辨率和低分辨率特征映射,将低级和高级特征信息进行聚合。
需要说明的是,本实施例构建的垩白分割模型使用残差深度空洞分组卷积来保持大米数据的高分辨率特征,利用空洞金字塔结构来获取多尺度特征信息;在解码阶段使用特征对齐处理器来聚合多分辨率特征,能有效解决低分辨率和高分辨率特征图的特征错位问题。
进一步地,特征对齐处理器用于针对两个尺度的特征融合,首先对低分辨率特征进行上采样,再与高分辨率特征进行连接,经过卷积核大小为1×1的第四卷积层和卷积核大小为3×3的第五卷积层传递级联特征可以预测两个位置偏移特征图,分别对应两个尺度特征图的预测偏置,每个偏置特征图有2个通道,表示特征图宽和高的两个偏置,最后对两个尺度的特征分别对齐后进行相加操作,具体表示公式如下:
A=µ(upsample(F
l
),Δ
F
)+µ(A
h
,Δ
A
)
其中,F l 表示低分辨率特征图,A h 表示高分辨率特征图,Δ F 和Δ A 分别代表着两个尺度特征图的位置偏移特征图,µ是对齐函数,对齐函数的公式如下:
其中,µ hw 表示特征图F在(h+Δ 1hw ,w+Δ 2hw )位置上使用双线性插值得到的特征,Δ 1hw 和Δ 2hw 表示学习的对于位置(h,w)的2维变换偏移量,F h’w’ 为待对齐的特征图F上每个空间位置对应的特征,h’、w’为待对齐的特征图F上每个位置的空间坐标,为{(1,1),(1, 2),...,(H,W)}。
需要说明的是,特征对齐处理器使用可学习的对齐方法来对齐聚合期间的多分辨率特征,能有效解决特征错位问题。
在一实施例中,所述训练模块30,包括:
训练单元,用于将所述训练样本输入至垩白分割模型,使用损失函数Loss=α×Lc+(1-α)×Lm优化垩白分割模型的参数,直至迭代次数达到预设次数阈值,得到最终训练模型,其中,α为预设权重,Lc为交叉熵损失函数,Lm为MSE损失函数。
其中,α为两个损失函数的权重,在训练阶段设置为0.4。
需要说明的是,交叉熵损失函数经常用于分类任务中;MSE损失函数经常用于回归任务中。对于标签以one-hot形式的背景和正常区域,取背景和正常区域的网络模型预测的概率输出与真实类别的one-hot形式进行交叉熵损失函数的计算。交叉熵损失函数为:
其中,yi表示样本i的标签,正类为1,负类为0;pi表示样本i预测为正类的概率。
对于垩白区域的标签值是以概率值的形式,处于[0,1]范围内,不是one-hot形式,使用交叉熵损失函数不能精确的计算误差损失,于是取垩白区域的网络模型预测的概率值与真实的标签值进行MSE损失函数计算,计算每个像素点的预测概率值与真实概率值的误差。MSE损失函数为:
其中,yi表示样本i的标签概率值,pi表示样本i预测的概率值。
需要说明的是,在垩白分割模型的训练过程中采用Adam优化器,网络的损失函数选择交叉熵和MSE损失函数。初始学习率设置为5×10-4,根据训练迭代次数的增大而逐步减小,训练的迭代次数设置为100次,当迭代次数达到时,网络终止训练,得到大米垩白分割模型。
评价单元,用于利用所述测试样本对所述最终训练模型进行分割精度评测。
确定单元,用于在评价单元输出结果满足预设条件时,将所述最终训练模型作为所述训练好的垩白分割模型;
以及,用于在评价单元输出结果不满足所述预设条件时,根据所述测评结果继续更新垩白分割模型的参数。
需要说明的是,本实施例通过结合交叉熵和MSE损失函数,能够加快网络模型的训练,网络模型对大米的预测分割概率值,背景和正常区域的预测概率值是逼近于1的,垩白区域中的重度垩白的预测输出概率值逼近于1,处于轻度垩白的预测概率值低于重度区域的概率值,通过垩白区域预测的概率值可以对垩白区域进行调节。
在一实施例中,所述装置还包括:
调节模块,用于对所述待检测大米图像中大米垩白区域的范围进行调节。
需要说明的是,将检测模块40输出的大米垩白分割图像,送入到调节模块,通过调节模块中设置的阈值参数,可以调节垩白区域的范围。
其中,阈值参数以使用最大类间方差法求取最佳阈值T2作为最大调节阈值,若设定的调节阈值为0,则网络分割得到的恶白区域不变,当设定的阈值逐渐增大至T2,则恶白区域逐渐减少。通过此方法可以对分割的恶白区域进行调节。
此外,本发明第四实施例还提供了一种大米垩白区域检测设备,所述设备包括存储器、处理器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上实施例所述的方法。
此外,本发明第五实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上实施例所述的方法。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种大米垩白区域检测方法,其特征在于,所述方法包括:
获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注;
对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本;
利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型;
获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
2.如权利要求1所述的大米垩白区域检测方法,其特征在于,对标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,包括:
提取所述标注垩白区域的大米图像中的垩白区域图像;
计算所述垩白区域图像的质心,并采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域;
以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签。
3.如权利要求2所述的大米垩白区域检测方法,其特征在于,所述采用最大类间方差法进行阈值分割,将所述垩白区域图像分割为重度垩白区域和轻度垩白区域,包括:
根据重度垩白和轻度垩白之间的方差g=w1×w2×(µ1-µ2)2,得到阈值T,其中,w1、w2分别为轻度垩白像素占比、重度垩白像素占比,µ1、µ2分别为轻度垩白区域的灰度均值、重度垩白区域的灰度均值,w1=N1/S、w2=N2/S,N1为轻度垩白的像素数,N2为重度垩白的像素数,S=N1+N2,T为方差g取值最大时所述垩白区域图像的灰度值;
将所述垩白区域图像中灰度值大于T的像素点记为重度垩白像素点,灰度值大于0且小于等于T的像素点记为轻度垩白像素点,得到所述垩白区域图像的轻度垩白区域和重度垩白区域。
4.如权利要求2所述的大米垩白区域检测方法,其特征在于,以所述质心为中心点将所述轻度垩白区域的硬标签转换为从中心到边缘标签值逐渐减弱的软标签,包括:
对所述轻度垩白区域中的像素点赋予权重值w(i,j),其中,w(i,j)=e-(d/2R),(i,j)表示所述轻度垩白区域中任一像素点的坐标,d表示图像上坐标为(i,j)的像素点到所述质心的距离,R表示所述轻度垩白区域的半径;
将所述轻度垩白区域的像素值与对应的权重值w(i,j)相乘,得到所述软标签。
5.如权利要求3所述的大米垩白区域检测方法,其特征在于,所述基于编码-解码结构的深度学习网络模型包括依次连接的编码网络结构、空洞空间金字塔结构和解码网络结构;
所述编码网络结构包括两个依次连接的第一卷积层、第一BN层、第一ReLU层,以及四个依次连接的下采样层、残差空洞深度可分离卷积层,其中,所述编码网络结构用以提取抽象的语义特征信息;
所述空洞空间金字塔结构包括并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层以及与所述全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层连接的第三卷积层,其中,所述并行的全局平均池化层、第二卷积层、三个不同空洞率的空洞卷积层用以提高网络的感受野,获取多尺度特征信息;
所述解码网络结构包括四个依次连接的特征聚合层、残差深度可分离卷积层,以及两个并行的特征对齐处理器和与两个所述并行的特征对齐处理器连接的累加层,其中,所述特征聚合层包括上采样层、第二Concat层、第四卷积层、第二BN层、第二ReLU层、第五卷积层,所述解码网络结构的输入包括多种分辨率特征图。
6.如权利要求1所述的大米垩白区域检测方法,其特征在于,所述利用所述训练样本和所述测试样本训练和测试垩白分割模型包括:
将所述训练样本输入至垩白分割模型,使用损失函数Loss=α×Lc+(1-α)×Lm优化垩白分割模型的参数,直至迭代次数达到预设次数阈值,得到最终训练模型;其中,α为预设权重,Lc为交叉熵损失函数,Lm为MSE损失函数;
利用所述测试样本对所述最终训练模型进行分割精度评测;
在评测结果满足预设条件时,将所述最终训练模型作为所述训练好的垩白分割模型;
在评测结果不满足所述预设条件时,根据所述测评结果继续更新垩白分割模型的参数。
7.如权利要求1所述的大米垩白区域检测方法,其特征在于,在输出所述待检测大米图像中的大米垩白区域之后,所述方法还包括:
对所述待检测大米图像中大米垩白区域的范围进行调节。
8.一种大米垩白区域检测装置,其特征在于,所述装置包括:
获取模块,用于获取大米图像数据集,并对所述大米图像数据集中的各大米图像进行正常区域和垩白区域标注;
预处理模块,用于对所述大米图像数据集中标注垩白区域的大米图像标签进行预处理,以将标注垩白区域的大米图像中垩白区域与正常区域的邻接区域的硬标签转换为软标签,并将处理好的大米图像数据集划分为训练样本和测试样本;
训练模块,用于利用所述训练样本和所述测试样本训练和测试垩白分割模型,其中,所述垩白分割模型为基于编码-解码结构的深度学习网络模型;
检测模块,用于获取待检测大米图像,并将所述待检测大米图像输入至训练好的垩白分割模型,输出所述待检测大米图像中的大米垩白区域。
9.一种大米垩白区域检测设备,其特征在于,所述设备包括存储器、处理器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210025286.3A CN114066887B (zh) | 2022-01-11 | 2022-01-11 | 大米垩白区域检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210025286.3A CN114066887B (zh) | 2022-01-11 | 2022-01-11 | 大米垩白区域检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114066887A true CN114066887A (zh) | 2022-02-18 |
CN114066887B CN114066887B (zh) | 2022-04-22 |
Family
ID=80230753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210025286.3A Active CN114066887B (zh) | 2022-01-11 | 2022-01-11 | 大米垩白区域检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114066887B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116343199A (zh) * | 2023-05-25 | 2023-06-27 | 安徽高哲信息技术有限公司 | 小麦黑胚粒识别方法、装置、电子设备和可读存储介质 |
CN117611791A (zh) * | 2023-10-20 | 2024-02-27 | 哈尔滨工业大学 | 一种基于特征分离可变形卷积的飞行目标检测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5663484A (en) * | 1994-07-08 | 1997-09-02 | Ricetec, Inc. | Basmati rice lines and grains |
CN102279976A (zh) * | 2011-09-22 | 2011-12-14 | 河南工业大学 | 不同糙米籽粒识别的bp神经网络构建及识别方法 |
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
CN104458747A (zh) * | 2014-12-22 | 2015-03-25 | 扬州大学 | 一种水稻垩白测算方法 |
US20170374323A1 (en) * | 2015-01-11 | 2017-12-28 | A.A.A Taranis Visual Ltd | Systems and methods for agricultural monitoring |
CN111435541A (zh) * | 2019-01-14 | 2020-07-21 | 珠海格力电器股份有限公司 | 获取米粒的垩白度的方法、装置和烹饪器具 |
CN111462058A (zh) * | 2020-03-24 | 2020-07-28 | 华南农业大学 | 一种水稻有效穗快速检测方法 |
CN113240653A (zh) * | 2021-05-19 | 2021-08-10 | 中国联合网络通信集团有限公司 | 大米质量检测方法、装置、服务器及系统 |
AU2021105554A4 (en) * | 2021-08-16 | 2021-11-25 | Sivaji Bandyopadhyay | An efficient artificial fish swarm optimization based method for disease detection in oryza sativa |
-
2022
- 2022-01-11 CN CN202210025286.3A patent/CN114066887B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5663484A (en) * | 1994-07-08 | 1997-09-02 | Ricetec, Inc. | Basmati rice lines and grains |
US5663484C1 (en) * | 1994-07-08 | 2002-01-29 | Ricetec Inc | Rice lines bas 867 rt1117 and rt112 |
CN102279976A (zh) * | 2011-09-22 | 2011-12-14 | 河南工业大学 | 不同糙米籽粒识别的bp神经网络构建及识别方法 |
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
CN104458747A (zh) * | 2014-12-22 | 2015-03-25 | 扬州大学 | 一种水稻垩白测算方法 |
US20170374323A1 (en) * | 2015-01-11 | 2017-12-28 | A.A.A Taranis Visual Ltd | Systems and methods for agricultural monitoring |
CN111435541A (zh) * | 2019-01-14 | 2020-07-21 | 珠海格力电器股份有限公司 | 获取米粒的垩白度的方法、装置和烹饪器具 |
CN111462058A (zh) * | 2020-03-24 | 2020-07-28 | 华南农业大学 | 一种水稻有效穗快速检测方法 |
CN113240653A (zh) * | 2021-05-19 | 2021-08-10 | 中国联合网络通信集团有限公司 | 大米质量检测方法、装置、服务器及系统 |
AU2021105554A4 (en) * | 2021-08-16 | 2021-11-25 | Sivaji Bandyopadhyay | An efficient artificial fish swarm optimization based method for disease detection in oryza sativa |
Non-Patent Citations (2)
Title |
---|
BROOKES N B ET AL: "Detection of Zhang-Rice Singlets Using Spin-Polarized Photoemission", 《PHYSICAL REVIEW LETTERS》 * |
郑华东等: "基于计算机视觉的大米裂纹检测研究", 《农业工程学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116343199A (zh) * | 2023-05-25 | 2023-06-27 | 安徽高哲信息技术有限公司 | 小麦黑胚粒识别方法、装置、电子设备和可读存储介质 |
CN116343199B (zh) * | 2023-05-25 | 2023-09-19 | 安徽高哲信息技术有限公司 | 小麦黑胚粒识别方法、装置、电子设备和可读存储介质 |
CN117611791A (zh) * | 2023-10-20 | 2024-02-27 | 哈尔滨工业大学 | 一种基于特征分离可变形卷积的飞行目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114066887B (zh) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111626190B (zh) | 基于聚类分区进行刻度识别的水位监测方法 | |
CN114066887B (zh) | 大米垩白区域检测方法、装置、设备及存储介质 | |
CN110276285B (zh) | 一种非受控场景视频中的船舶水尺智能识别方法 | |
CN109977780A (zh) | 一种基于深度学习算法的硅藻的检测与识别方法 | |
CN111652213A (zh) | 一种基于深度学习的船舶水尺读数识别方法 | |
CN109840483B (zh) | 一种滑坡裂缝检测与识别的方法及装置 | |
CN107766874B (zh) | 一种超声容积生物学参数的测量方法及测量系统 | |
Li et al. | Automated measurement network for accurate segmentation and parameter modification in fetal head ultrasound images | |
CN112734764A (zh) | 一种基于对抗网络的无监督医学图像分割方法 | |
CN105809175A (zh) | 一种基于支持向量机算法的脑水肿分割方法及系统 | |
CN112734729B (zh) | 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质 | |
CN107729926A (zh) | 一种基于高维空间变换的数据扩增方法、机器识别系统 | |
CN113283419A (zh) | 基于注意力的卷积神经网络指针式仪表图像读数识别方法 | |
CN112215842A (zh) | 基于良性甲状腺模板的恶性结节边缘检测图像处理方法 | |
CN114359288A (zh) | 基于人工智能的医学影像脑动脉瘤检测和定位方法 | |
CN111127400A (zh) | 一种乳腺病变检测方法和装置 | |
CN112163530A (zh) | 基于特征增强和样本选择的ssd小目标检测方法 | |
CN111414930B (zh) | 深度学习模型训练方法及装置、电子设备及存储介质 | |
CN114821229A (zh) | 基于条件生成对抗网络的水下声学数据集增广方法及系统 | |
Azizah et al. | Tajweed-YOLO: Object detection method for Tajweed by applying HSV color model augmentation on Mushaf images | |
CN112258532B (zh) | 一种超声图像中胼胝体的定位及分割方法 | |
CN112396580B (zh) | 一种圆形零件缺陷检测方法 | |
CN117522891A (zh) | 一种3d医学图像分割系统及方法 | |
CN113012127A (zh) | 基于胸部医学影像的心胸比测量方法 | |
CN113657458A (zh) | 气道分类方法及其装置、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |