CN111435428B - 基于色度检测的大米识别方法和装置 - Google Patents
基于色度检测的大米识别方法和装置 Download PDFInfo
- Publication number
- CN111435428B CN111435428B CN201910033515.4A CN201910033515A CN111435428B CN 111435428 B CN111435428 B CN 111435428B CN 201910033515 A CN201910033515 A CN 201910033515A CN 111435428 B CN111435428 B CN 111435428B
- Authority
- CN
- China
- Prior art keywords
- image
- grain
- edges
- grains
- chromaticity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000007164 Oryza sativa Nutrition 0.000 title claims abstract description 46
- 235000009566 rice Nutrition 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 240000007594 Oryza sativa Species 0.000 title 1
- 235000013339 cereals Nutrition 0.000 claims abstract description 386
- 241000209094 Oryza Species 0.000 claims abstract description 45
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 40
- 239000007787 solid Substances 0.000 claims abstract description 10
- 238000010411 cooking Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 23
- 238000012935 Averaging Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 8
- 230000008521 reorganization Effects 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000005215 recombination Methods 0.000 claims description 5
- 230000006798 recombination Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Abstract
本发明公开了一种基于色度检测的大米识别方法、装置和烹饪器具。其中,该方法包括:获取待检测的谷物图像;使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。本发明解决了现有技术主要采用通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于识别过程中存在籽粒重叠等情况,导致存在识别结果不准确的技术问题。
Description
技术领域
本发明涉及智能家电领域,具体而言,涉及一种基于色度检测的大米识别方法和装置。
背景技术
随着图像处理技术的不断成熟,特别是计算机硬件水平的快速提高,使得基于图像处理技术构建大米品种识别系统成为可能。目前对大米品种进行识别的方式主要是通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于实际情况下米粒可能存在重叠的情况,因此识别的精度与实际应用的要求尚有差距。
针对现有技术主要采用通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于识别过程中存在籽粒重叠等情况,导致存在识别结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于色度检测的大米识别方法和装置,以至少解决现有技术主要采用通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于识别过程中存在籽粒重叠等情况,导致存在识别结果不准确的技术问题。
根据本发明实施例的一个方面,提供了一种基于色度检测的大米识别方法,包括:获取待检测的谷物图像;使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。
进一步地,使用卷积神经网络检测谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对不同尺度的谷物的图像边缘进行稀疏表示,得到不同尺度的谷物的图像边缘的稀疏表示模型;对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘。
进一步地,对不同尺度的图像边缘的稀疏表示模型进行内部重组;遍历所有重组特征,确定重复出现的边缘结构;将重复出现的边缘结构进行融合,得到谷物图像中的谷物边缘。
进一步地,在使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘之前,构建过完备字典,其中,过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
进一步地,获取多张样本图像,其中,样本图像为不同尺度的包含了谷物的图片;对样本图像进行重叠分块,得到至少一个分块图像;使用K—SVD算法对至少一个分块图像进行训练,得到过完备字典,其中,所有样本图像在过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
进一步地,获取固定字典;获取样本图像的分块图像在固定字典上的稀疏系数;基于样本图像的分块图像在固定字典上的稀疏系数,对固定字典进行迭代更新,得到获取过完备字典。
进一步地,通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值。
进一步地,在通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值之后,基于谷物色度值在谷物类别表中查询,得到与谷物色度值匹配的谷物的种类,其中,谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
根据本发明实施例的一个方面,提供了一种基于色度检测的大米识别装置,包括:获取模块,用于获取待检测的谷物图像;检测模块,用于使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;分割模块,用于使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;确定模块,用于基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。
进一步地,第一检测子模块,用于使用卷积神经网络检测谷物图像中不同尺度的谷物的图像边缘;表示子模块,用于使用过完备字典对不同尺度的谷物的图像边缘进行稀疏表示,得到不同尺度的谷物的图像边缘的稀疏表示模型;融合子模块,用于对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘。
进一步地,重组单元,用于对不同尺度的图像边缘的稀疏表示模型进行内部重组;遍历单元,用于遍历所有重组特征,确定重复出现的边缘结构;融合单元,用于将重复出现的边缘结构进行融合,得到谷物图像中的谷物边缘。
进一步地,构建模块,用于在使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘之前,构建过完备字典,其中,过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
进一步地,获取子模块,用于获取多张样本图像,其中,样本图像为不同尺度的包含了谷物的图片;分块子模块,用于对样本图像进行重叠分块,得到至少一个分块图像;训练子模块,用于使用K—SVD算法对至少一个分块图像进行训练,得到过完备字典,其中,所有样本图像在过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
进一步地,第一获取单元,用于获取固定字典;第二获取单元,用于获取样本图像的分块图像在固定字典上的稀疏系数;更新单元,用于基于样本图像的分块图像在固定字典上的稀疏系数,对固定字典进行迭代更新,得到获取过完备字典。
进一步地,通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值。
进一步地,装置还包括:查询模块,用于在通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值之后,基于谷物色度值在谷物类别表中查询,得到与谷物色度值匹配的谷物的种类,其中,谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
根据本发明实施例的一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的基于色度检测的大米识别方法。
根据本发明实施例的一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的基于色度检测的大米识别方法。
根据本发明实施例的一个方面,提供了一种烹饪器具,图像采集装置,用于获取待检测的谷物图像;处理器,用于使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。
进一步地,处理器还用于使用卷积神经网络检测谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对不同尺度的谷物的图像边缘进行稀疏表示,得到不同尺度的谷物的图像边缘的稀疏表示模型;对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘。
在本发明实施例中,获取待检测的谷物图像;使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。上述方案首先对谷物图像中谷物的边缘轮廓进行了检测,并利用检测到的谷物边缘对原始谷物图像进行覆盖,分割得到谷物图像的纯色度区域,再根据纯色度区域的色度确定谷物的种类,从而实现了基于色度的谷物种类的精确识别,避免了以往由于籽粒连接带来的识别难度,进而解决了现有技术主要采用通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于识别过程中存在籽粒重叠等情况,导致存在识别结果不准确的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的基于色度检测的大米识别方法的流程图;
图2是根据本发明实施例的一种卷积神经网络的示意图;
图3是根据本发明实施例的一种谷物识别的示意图;以及
图4是根据本发明实施例的基于色度检测的大米识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种基于色度检测的大米识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的基于色度检测的大米识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待检测的谷物图像。
具体的,上述待检测的谷物图像可以是用户通过智能终端(例如:智能手机、平板电脑等)拍摄的图像,也可以是由烹饪设备自带的图像采集装置拍摄的图像。上述谷物可以是大米、红豆、绿豆等谷物。
在一种可选的实施例中,以电饭煲为例,电饭锅内设置有防水的图像采集装置,当用户将谷物放置在电饭锅内时,电饭锅启动图像采集装置采集谷物图像。
步骤S104,使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘。
卷积神经网络属于有监督的学习算法,是深度神经网络中的一种特殊情况,相比于深度人工神经网络具有权值数量少、训练速度快等优点。上述谷物图像中谷物的边缘可以是单个谷物的边缘,也可是谷物图像中的谷物与背景区域的边缘。
图2是根据本发明实施例的一种卷积神经网络的示意图,结合图2所示,卷积神经网络主要由如下几个部分组成,分别是输入层(Input Layer)、卷基层(ConvolutionalLayer)、池化层(Pooling Layer)、全连接层(Fully Connected Layer)和输出层(OutputLayer)。其中,输入层和输出层只有一层,卷基层和池化层可以有多层。通过卷积神经网络的卷积层中的每个卷积核扫描谷物图像,得到谷物的特征图层;通过卷积神经网络的池化层对谷物的特征图层进行去冗余处理;通过卷积神经网络的至少一个全连接层将去冗余处理后的多个特征图层进行转换,得到每个谷物的图像特征;通过标记每个谷物的图像特征,得到谷物图像中谷物的边缘。
步骤S106,使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域。
具体的,色度用于反应颜色的色调和饱和度,上述纯色度区域用于表示色度相同的区域,或色度之差小于预设值的区域。
在上述步骤中,分割步骤用于根据检测到的边缘对谷物图像进行分割,从而将谷物图像中谷物所在的区域与背景区域进行分割,或根据每个谷物的边缘对每个谷物进行分割,进而得到纯色度区域。由于不同种类的谷物的色度具有一定差别,因此上述纯色度区域可以表示同一类谷物所在的区域。
在一定可选的实施例中,在得到谷物图像中的谷物边缘后,可以将使用检测到的谷物边缘对原始谷物图像进行覆盖,从而根据谷物图像进行分割,得到纯色度区域。
步骤S106,基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。
具体的,上述纯色度的区域的像素值即用于表示该区域的色度参数,在一种可选的实施例中,可以获取预先设置的色度和谷物类别的映射表,该映射表中记录了色度和谷物类别的对应关系,在获得至少一个纯色度区域后,根据该纯色度区域的像素值确定该纯色度区域的色度,在色度和谷物类别的映射表查找该色度,从而确定该纯色度区域对应的谷物种类。
由上可知,本申请上述实施例获取待检测的谷物图像;使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘;使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域;基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。上述方案首先对谷物图像中谷物的边缘轮廓进行了检测,并利用检测到的谷物边缘对原始谷物图像进行覆盖,分割得到谷物图像的纯色度区域,再根据纯色度区域的色度确定谷物的种类,从而实现了基于色度的谷物种类的精确识别,避免了以往由于籽粒连接带来的识别难度,进而解决了现有技术主要采用通过单籽粒、无籽粒重叠或连接的情况进行大米品种的识别,由于识别过程中存在籽粒重叠等情况,导致存在识别结果不准确的技术问题。
作为一种可选的实施例,使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘,包括:使用卷积神经网络检测谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对不同尺度的谷物的图像边缘进行稀疏表示,得到不同尺度的谷物的图像边缘的稀疏表示模型;对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘。
在上述步骤中,不仅使用卷积神经网络检测谷物的图像边缘,还可以将谷物图像进行变化,以得到多种不同尺度的谷物图像,通过卷积神经网络对不同尺度的谷物的图像边缘进行检测。
上述过完备字典可以是预先构建的作为边缘基结构的矩阵,用于对图像中的目标对象的边缘进行稀疏表示,在谷物图像中,目标对象即为谷物。稀疏表示用于将高维数据转换为低维数据,即为在预设的过完备字典的基础上用尽可能少的原子来表示图像信号,从而获得信号更为简洁的表示方式。谷物图像的边缘经过稀疏表示后,得到稀疏表示模型,从而使用最小数量的系数尽可能描述更多的信号能量。
在得到多种不同尺度的谷物的图像边缘的稀疏表示后,可以将多种稀疏表示模型进行融合,从而得到更加精确的谷物凸显的图像边缘。
需要说明的是,上述方案首先检测多种不同尺度的谷物的图像边缘,再将多种不同尺度下的谷物的图像边缘进行融合,从而得到精确谷物边缘。
作为一种可选的实施例,对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘,包括:对不同尺度的图像边缘的稀疏表示模型进行内部重组;遍历所有重组特征,确定重复出现的边缘结构;将重复出现的边缘结构进行融合,得到谷物图像中的谷物边缘。
具体的,对不同尺度的图像边缘的稀疏模型进行求解,以对稀疏表示模型进行内部重组,在一种可选的实施例中,求解的方法可以包括:基追踪、Focuss、Shrinkage等。进行内部重组后,由重组特征来表示图像边缘的特征信息,对重复出现的边缘结构进行融合,从而达到了图像去噪的效果。
作为一种可选的实施例,在使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘之前,方法还包括:构建过完备字典,其中,过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
在上述方案中,过完备字典用于作为稀疏表示的基矩阵。以公式y=Da进行说明,其中,y为真正的图像信号,D为过完备字典,而a即为y在过完备字典D上的稀疏表示,因此在实际应用中,为了获取谷物图像的稀疏表示,首先需要确定过完备字典。
作为一种可选的实施例,构建过完备字典包括:获取多张样本图像,其中,样本图像为不同尺度的包含了谷物的图片;对样本图像进行重叠分块,得到至少一个分块图像;使用K—SVD算法对至少一个分块图像进行训练,得到过完备字典,其中,所有样本图像在过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
具体的,K-SVD用于进行字典的训练,其依据误差最小原则,对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子和对应的原子稀疏,并经过不断的迭代从而得到优化的解。
在一种可选的实施例的,K-SVD方式可以通过求解如下公式对字典进行训练。以Y=DX为例,其中,Y为真正的样本图像信号,D为待训练的过完备字典,而X即为Y在待训练的过完备字典上的稀疏矩阵,在该示例中,样本Y可以是对包含了谷物的多张图片进行重叠分块后得到的样本,该稀疏矩阵A即为样本Y中的谷物的类别信息。例如:可以先对10张真实边缘图像进行16*16半重叠分块,接着对所有分块图像利用K—SVD算法进行过完备字典学习,从而得到过完备字典。
作为一种可选的实施例,使用K—SVD算法对至少一个分块图像进行训练,得到过完备字典包括:获取固定字典;获取样本图像的分块图像在固定字典上的稀疏系数;基于样本图像的分块图像在固定字典上的稀疏系数,对固定字典进行迭代更新,得到获取过完备字典。
在上述步骤中,过完备字典的训练可以包括稀疏编码和字典更新两步:稀疏编码阶段是在固定字典的基础上寻找训练样本Y在字典D上的稀疏系数X;字典更新阶段是根据之前得到的稀疏系数X对字典D中的原子进行迭代更新;通过字典原子结合稀疏系数的同步更新,使得所训练的过完备字典更加优异。
作为一种可选的实施例,通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值。
像素是指由数字序列表示的图像中的最小单位,每个像素被赋予对应的像素值,从而构成了图像。像素值可以用于表示元素的亮度信息,根据表示方法的不同具有不同的数值,例如,可以使用8位表示一个像素,这样总共具有256个值,因此像素值可以在0至255之间取值。
上述方案中,将一个纯色度区域中所有像素值的均值作为该纯色度区域的色度,从而得到了谷物图像中谷物的色度。
作为一种可选的实施例,在通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值之后,上述方法还包括:基于谷物色度值在谷物类别表中查询,得到与谷物色度值匹配的谷物的种类,其中,谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
在一种可选的实施例中,以上述谷物是大米为例进行说明,首先通过对纯色度区域中所有像素值进行求均值操作,从而得到该纯色度区域内的大米的色度值,再获取记录有色度和大米类别对应关系的谷物类别表,并在谷物类别表中查找纯色度区域的色度,将查找结果对应的大米类别作为谷物图像中大米的类别,从而达到了对谷物类别进行识别的目的。
图3是根据本发明实施例的一种谷物识别的示意图,该示例以谷物为大米为例进行说明,首先对大米进行拍照,得到大米照片,在通过CNN(Convolutional NeuralNetworks,卷积神经网络)对不同尺度下的大米图像进行边缘检测,并基于边缘基结构过完备字典对不同尺度下的大米图像的边缘检测结果(即边缘的稀疏表示)进行编码和融合,从而得到更精准的图像边缘。
然后使用图像边缘覆盖原始的大米图像,从而对原始的大米图像进行分割,得到大米图像中的纯色度区域,通过求取纯色度区域中的像素均值,得到籽粒色度值。
最后获取预设的色度-米种表,并在色度-米种表中查找籽粒色度值,从而得到大米种类。
实施例2
根据本发明实施例,提供了一种用于实施例上述基于色度检测的大米识别方法的基于色度检测的大米识别装置,图4是根据本发明实施例的基于色度检测的大米识别装置的示意图,如图4所示,该装置包括:
获取模块40,用于获取待检测的谷物图像。
检测模块42,用于使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘。
分割模块44,用于使用检测到的谷物边缘对谷物图像进行分割,得到谷物图像的至少一个纯色度区域。
确定模块46,用于基于至少一个纯色度区域的像素值,确定待检测的谷物图像中的谷物色度值。
作为一种可选的实施例,检测模块包括:第一检测子模块,用于使用卷积神经网络检测谷物图像中不同尺度的谷物的图像边缘;表示子模块,用于使用过完备字典对不同尺度的谷物的图像边缘进行稀疏表示,得到不同尺度的谷物的图像边缘的稀疏表示模型;融合子模块,用于对不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到谷物图像中的谷物边缘。
作为一种可选的实施例,融合子模块包括:重组单元,用于对不同尺度的图像边缘的稀疏表示模型进行内部重组;遍历单元,用于遍历所有重组特征,确定重复出现的边缘结构;融合单元,用于将重复出现的边缘结构进行融合,得到谷物图像中的谷物边缘。
作为一种可选的实施例,装置还包括:构建模块,用于在使用卷积神经网络模型检测谷物图像中谷物的边缘,检测得到谷物图像中的谷物边缘之前,构建过完备字典,其中,过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
作为一种可选的实施例,构建模块包括:获取子模块,用于获取多张样本图像,其中,样本图像为不同尺度的包含了谷物的图片;分块子模块,用于对样本图像进行重叠分块,得到至少一个分块图像;训练子模块,用于使用K—SVD算法对至少一个分块图像进行训练,得到过完备字典,其中,所有样本图像在过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
作为一种可选的实施例,训练子模块包括:第一获取单元,用于获取固定字典;第二获取单元,用于获取样本图像的分块图像在固定字典上的稀疏系数;更新单元,用于基于样本图像的分块图像在固定字典上的稀疏系数,对固定字典进行迭代更新,得到获取过完备字典。
作为一种可选的实施例,通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值。
作为一种可选的实施例,装置还包括:查询模块,用于在通过对至少一个纯色度区域的像素值求平均值,得到谷物色度值之后,基于谷物色度值在谷物类别表中查询,得到与谷物色度值匹配的谷物的种类,其中,谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
实施例3
根据本发明实施例,提供了一种烹饪器具,包括:
图像采集装置,用于获取待检测的谷物图像。
处理器,用于使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘;使用检测到的所述谷物边缘对所述谷物图像进行分割,得到所述谷物图像的至少一个纯色度区域;基于所述至少一个纯色度区域的像素值,确定所述待检测的谷物图像中的谷物色度值。
作为一种可选的实施例,所述处理器还用于使用所述卷积神经网络检测所述谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对所述不同尺度的谷物的图像边缘进行稀疏表示,得到所述不同尺度的谷物的图像边缘的稀疏表示模型;对所述不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到所述谷物图像中的谷物边缘。
上述处理器还可以用于执行实施例1中的其他步骤,此处不再赘述。
实施例4
根据本发明实施例,提供了一种存储介质,存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行实施例1中所述的基于色度检测的大米识别方法。
实施例5
根据本发明实施例,提供了一种处理器,处理器用于运行程序,其中,所述程序运行时执行实施例1中所述的基于色度检测的大米识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (13)
1.一种基于色度检测的大米识别方法,其特征在于,包括:
获取待检测的谷物图像;
使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘;
使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘,包括:使用所述卷积神经网络检测所述谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对所述不同尺度的谷物的图像边缘进行稀疏表示,得到所述不同尺度的谷物的图像边缘的稀疏表示模型;对所述不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到所述谷物图像中的谷物边缘;
使用检测到的所述谷物边缘对所述谷物图像进行分割,得到所述谷物图像的至少一个纯色度区域;
基于所述至少一个纯色度区域的像素值,确定所述待检测的谷物图像中的谷物色度值;通过对所述至少一个纯色度区域的像素值求平均值,得到所述谷物色度值;在通过对所述至少一个纯色度区域的像素值求平均值,得到所述谷物色度值之后,所述方法还包括:基于所述谷物色度值在谷物类别表中查询,得到与所述谷物色度值匹配的谷物的种类,其中,所述谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
2.根据权利要求1所述的方法,其特征在于,对所述不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到所述谷物图像中的谷物边缘,包括:
对所述不同尺度的图像边缘的稀疏表示模型进行内部重组;
遍历所有重组特征,确定重复出现的边缘结构;
将所述重复出现的边缘结构进行融合,得到所述谷物图像中的谷物边缘。
3.根据权利要求1所述的方法,其特征在于,在使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘之前,所述方法还包括:
构建所述过完备字典,其中,所述过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
4.根据权利要求3所述的方法,其特征在于,构建所述过完备字典包括:
获取多张样本图像,其中,所述样本图像为不同尺度的包含了谷物的图片;
对所述样本图像进行重叠分块,得到至少一个分块图像;
使用K—SVD算法对所述至少一个分块图像进行训练,得到所述过完备字典,其中,所有样本图像在所述过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
5.根据权利要求4所述的方法,其特征在于,使用K—SVD算法对所述至少一个分块图像进行训练,得到所述过完备字典包括:
获取固定字典;
获取所述样本图像的分块图像在所述固定字典上的稀疏系数;
基于所述样本图像的分块图像在所述固定字典上的稀疏系数,对所述固定字典进行迭代更新,得到获取所述过完备字典。
6.一种基于色度检测的大米识别装置,其特征在于,包括:
获取模块,用于获取待检测的谷物图像;
检测模块,用于使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘;
所述检测模块包括:
第一检测子模块,用于使用所述卷积神经网络检测所述谷物图像中不同尺度的谷物的图像边缘;
表示子模块,用于使用过完备字典对所述不同尺度的谷物的图像边缘进行稀疏表示,得到所述不同尺度的谷物的图像边缘的稀疏表示模型;
融合子模块,用于对所述不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到所述谷物图像中的谷物边缘;
分割模块,用于使用检测到的所述谷物边缘对所述谷物图像进行分割,得到所述谷物图像的至少一个纯色度区域;
确定模块,用于基于所述至少一个纯色度区域的像素值,确定所述待检测的谷物图像中的谷物色度值;通过对所述至少一个纯色度区域的像素值求平均值,得到所述谷物色度值;所述装置还包括:查询模块,用于在通过对所述至少一个纯色度区域的像素值求平均值,得到所述谷物色度值之后,基于所述谷物色度值在谷物类别表中查询,得到与所述谷物色度值匹配的谷物的种类,其中,所述谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
7.根据权利要求6所述的装置,其特征在于,所述融合子模块包括:
重组单元,用于对所述不同尺度的图像边缘的稀疏表示模型进行内部重组;
遍历单元,用于遍历所有重组特征,确定重复出现的边缘结构;
融合单元,用于将所述重复出现的边缘结构进行融合,得到所述谷物图像中的谷物边缘。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
构建模块,用于在使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘之前,构建所述过完备字典,其中,所述过完备字典为基于边缘结构的字典,通过对样本图像进行训练得到,能够对图像边缘进行稀疏编码。
9.根据权利要求8所述的装置,其特征在于,所述构建模块包括:
获取子模块,用于获取多张样本图像,其中,所述样本图像为不同尺度的包含了谷物的图片;
分块子模块,用于对所述样本图像进行重叠分块,得到至少一个分块图像;
训练子模块,用于使用K—SVD算法对所述至少一个分块图像进行训练,得到所述过完备字典,其中,所有样本图像在所述过完备字典上的表示是稀疏的,且稀疏系数包含了样本图像的类别信息。
10.根据权利要求9所述的装置,其特征在于,所述训练子模块包括:
第一获取单元,用于获取固定字典;
第二获取单元,用于获取所述样本图像的分块图像在所述固定字典上的稀疏系数;
更新单元,用于基于所述样本图像的分块图像在所述固定字典上的稀疏系数,对所述固定字典进行迭代更新,得到获取所述过完备字典。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至5中任意一项所述的基于色度检测的大米识别方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的基于色度检测的大米识别方法。
13.一种烹饪器具,其特征在于,包括:
图像采集装置,用于获取待检测的谷物图像;
处理器,用于使用卷积神经网络模型检测所述谷物图像中谷物的边缘,检测得到所述谷物图像中的谷物边缘;使用检测到的所述谷物边缘对所述谷物图像进行分割,得到所述谷物图像的至少一个纯色度区域;基于所述至少一个纯色度区域的像素值,确定所述待检测的谷物图像中的谷物色度值;所述处理器还用于使用所述卷积神经网络检测所述谷物图像中不同尺度的谷物的图像边缘;使用过完备字典对所述不同尺度的谷物的图像边缘进行稀疏表示,得到所述不同尺度的谷物的图像边缘的稀疏表示模型;对所述不同尺度的谷物的图像边缘的稀疏表示模型进行融合,得到所述谷物图像中的谷物边缘;所述处理器还用于通过对所述至少一个纯色度区域的像素值求平均值,得到所述谷物色度值;所述处理器还用于基于所述谷物色度值在谷物类别表中查询,得到与所述谷物色度值匹配的谷物的种类,其中,所述谷物类别表记录不同谷物色度值与对应的谷物种类的关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910033515.4A CN111435428B (zh) | 2019-01-14 | 2019-01-14 | 基于色度检测的大米识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910033515.4A CN111435428B (zh) | 2019-01-14 | 2019-01-14 | 基于色度检测的大米识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111435428A CN111435428A (zh) | 2020-07-21 |
CN111435428B true CN111435428B (zh) | 2023-10-31 |
Family
ID=71579978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910033515.4A Active CN111435428B (zh) | 2019-01-14 | 2019-01-14 | 基于色度检测的大米识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111435428B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271522A (zh) * | 2008-05-21 | 2008-09-24 | 中国农业大学 | 一种大米中黄粒米的自动识别方法 |
CN106971393A (zh) * | 2017-02-23 | 2017-07-21 | 北京农业信息技术研究中心 | 一种玉米籽粒的表型测量方法及系统 |
CN107590790A (zh) * | 2017-09-21 | 2018-01-16 | 长沙全度影像科技有限公司 | 一种基于对称边缘填充的简单透镜边缘区域去模糊方法 |
CN107728515A (zh) * | 2017-09-27 | 2018-02-23 | 珠海格力电器股份有限公司 | 米饭的蒸煮方法及装置 |
CN108647588A (zh) * | 2018-04-24 | 2018-10-12 | 广州绿怡信息科技有限公司 | 物品类别识别方法、装置、计算机设备和存储介质 |
CN108734719A (zh) * | 2017-04-14 | 2018-11-02 | 浙江工商大学 | 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法 |
-
2019
- 2019-01-14 CN CN201910033515.4A patent/CN111435428B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271522A (zh) * | 2008-05-21 | 2008-09-24 | 中国农业大学 | 一种大米中黄粒米的自动识别方法 |
CN106971393A (zh) * | 2017-02-23 | 2017-07-21 | 北京农业信息技术研究中心 | 一种玉米籽粒的表型测量方法及系统 |
CN108734719A (zh) * | 2017-04-14 | 2018-11-02 | 浙江工商大学 | 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法 |
CN107590790A (zh) * | 2017-09-21 | 2018-01-16 | 长沙全度影像科技有限公司 | 一种基于对称边缘填充的简单透镜边缘区域去模糊方法 |
CN107728515A (zh) * | 2017-09-27 | 2018-02-23 | 珠海格力电器股份有限公司 | 米饭的蒸煮方法及装置 |
CN108647588A (zh) * | 2018-04-24 | 2018-10-12 | 广州绿怡信息科技有限公司 | 物品类别识别方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111435428A (zh) | 2020-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dev et al. | Color-based segmentation of sky/cloud images from ground-based cameras | |
Wang et al. | Content-based image retrieval by integrating color and texture features | |
Yang et al. | A fast MPEG-7 dominant color extraction with new similarity measure for image retrieval | |
WO2016207875A1 (en) | System and method for detecting objects in an image | |
CN109698944B (zh) | 投影区域校正方法、投影设备及计算机可读存储介质 | |
CN105608230A (zh) | 一种基于图像检索的商家信息推荐系统及方法 | |
CN107256407B (zh) | 一种高光谱遥感图像分类方法及装置 | |
CN109685806B (zh) | 图像显著性检测方法及装置 | |
Mythili et al. | Color image segmentation using ERKFCM | |
WO2007051992A1 (en) | Image processing | |
CN110599554A (zh) | 人脸肤色的识别方法和装置、存储介质及电子装置 | |
CN109801138A (zh) | 商品图片的搜索方法及装置 | |
Zhang et al. | Detection of regions of interest in a high-spatial-resolution remote sensing image based on an adaptive spatial subsampling visual attention model | |
CN109509228A (zh) | 用于定位一个或多个候选数字图像的方法 | |
Lee et al. | Aifood: a large scale food images dataset for ingredient recognition | |
CN112000024A (zh) | 用于控制家电设备的方法及装置、设备 | |
US10026009B2 (en) | Methods and systems for determining a perceptual similarity between images | |
CN111435428B (zh) | 基于色度检测的大米识别方法和装置 | |
CN114187062A (zh) | 一种商品购买事件预测方法及装置 | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
Losson et al. | CFA local binary patterns for fast illuminant-invariant color texture classification | |
CN111435427A (zh) | 识别大米的方法、装置和烹饪器具 | |
Muneesawang et al. | Learning and adaptive characterization of visual contents in image retrieval systems | |
CN111611993A (zh) | 冰箱中食材体积识别的方法、装置及计算机存储介质 | |
CN115147633A (zh) | 图像聚类方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |