CN106446909A - 一种中餐食物图像特征提取方法 - Google Patents
一种中餐食物图像特征提取方法 Download PDFInfo
- Publication number
- CN106446909A CN106446909A CN201610804677.XA CN201610804677A CN106446909A CN 106446909 A CN106446909 A CN 106446909A CN 201610804677 A CN201610804677 A CN 201610804677A CN 106446909 A CN106446909 A CN 106446909A
- Authority
- CN
- China
- Prior art keywords
- image
- fritter
- symbol
- feature
- chinese meal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 title abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 13
- 235000012054 meals Nutrition 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000004064 recycling Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种中餐食物图像特征提取方法,涉及图像处理领域。所述方法包括步骤:(1)将中餐食物图像等距离截取若干图像小块;(2)对前述图像小块提取其颜色特征和纹理特征,得到每一个小块的局部描述符,记为yi;(3)将得到的训练数据集的所有图像的所有局部描述符通过利用KSVD算法学习得到一个过完备的稀疏字典D;(4)利用OMP算法根据上一步得到的稀疏字典的原子来线性表示上述步骤得到的每一个图像小块的局部描述符xi,其中yi≈Dxi;(5)得到所有图像的局部描述符后,再对每一张图的所有局部描述符统计其使用稀疏字典的每一个原子的频率,得到一个直方图,这个直方图就是图像的全局描述符,也就是图像的特征。此种提取方法可提高食物识别的准确率。
Description
技术领域
本发明涉及图像处理领域,更具体地,涉及一种中餐食物图像特征提取方法。
背景技术
现在的常用的特征提取方法主要有颜色特征提取、统计特征提取和频率域特征提取等,这些特征在模式识别中有着很好的应用性。
颜色特征提取:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。颜色直方图是最常用的表达颜色特征的方法,它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例。
统计特征提取:统计特征是基于图像的整体灰度特征的,它强调尽可能多地保留原始图像的信息,通过对大量样本的训练,获得其统计特征,其基本思想是将图像映射到特征空间,将大量图像数据降维后进行模式分类,因此提取统计特征的方法实际上就是“子空间分析法”。
频率域特征提取:由于Gabor小波核函数具有与人类大脑皮层简单细胞的二维反射区相同的特性,即能够捕捉对应于空间频率、空间位置及方向选择性的局部结构信息,因此用二维Gabor小波变换的系数幅值作为特征来匹配有着良好的视觉特性和生物学背景,在图像处理中被广泛应用。
由于图像类别不同,提取的特征以及特征的表示方式都不同,现在的常用的特征提取方法主要有几何特征提取、统计特征提取和频率域特征提取等,在食物图像识别中,要根据食物图像的特性提取图像特征,尤其是在复杂的中餐食物图像中。
发明内容
本发明是针对前述上述现有技术中的缺陷和不足,提供一种中餐食物图像特征提取的方法,其可提高中餐食物特征识别的准确率。
为解决上述技术问题,本发明的技术方案如下:
一种中餐食物图像特征提取方法,包括如下步骤:
训练阶段:
(1)获取训练数据集,并将其中的中餐食物图像等距离截取为若干图像小块;
(2)提取所述图像小块的颜色特征和纹理特征,得到每一个图像小块的局部描述符,记为yi;
(3)基于训练数据集的所有中餐食物图像的所有局部描述符,学习得到一个过完备的稀疏字典D;
(4)利用OMP算法根据上一步得到的稀疏字典的原子来线性表示;上述步骤得到的每一个图像小块的局部描述符xi,其中yi≈Dxi;
(5)得到所有中餐食物图像的局部描述符后,再对每一张中餐食物图像的所有局部描述符统计其使用稀疏字典的每一个原子的频率,得到一个直方图,这个直方图就是中餐食物图像的全局描述符,也就是图像的特征;
测试阶段:采用上述方法对测试图像提取局部特征,并利用训练图像生成的稀疏字典去表示测试图像的局部描述符,从而得到测试集图像的稀疏的局部描述符,再利用同样的方法得到全局描述符。
优选的,所述步骤(1)中,等距离截取图像小块是指在输入图像中等距离截取图像小块,小块大小为M*M像素点,间隔为N个像素点。
优选的,所述步骤(2)中,颜色特征为对图像小块分别计算归一化后的RGB三个通道的颜色直方图,每个通道的颜色直方图有M个频段,也就是得到的特征向量为M维,故得到的颜色特征为3M维;纹理特征为对图像小块运用SURF描述符描述得到8M维特征向量,把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量,也即是局部描述符。
优选的,每个通道的颜色直方图有M个频段,其中M一般取值为16。
优选的,所述步骤(3)中,通过利用KSVD算法生成稀疏字典是指将所有训练图像的局部描述符通过KSVD算法学习一个过完备的稀疏字典D,其中字典的原子个数为5000,稀疏度为3。
与现有技术相比,本发明技术方案的有益效果是:
1、本发明提出一种是专门针对中餐食物图像识别研究的特征提取方法;
2、本发明利用得到的稀疏字典的原子线性表示原来的局部特征,最后通过统计每个原子所使用的频率得到图像的全局特征,即结合现有的颜色特征和纹理特征,改进特征的表示方式,这样能够减小重建误差,从而提高了食物识别的准确率。
附图说明
图1是本发明的工作流程图;
图2是分割后的等密度取小块图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。
如图1所示,本实施例提供一种中餐食物图像特征提取的方法,包括如下步骤:
读入一张食物图像:从食物图像图库中读入一张图像;
图像分割处理:将前述读入的图像利用显著性检测算法得到一幅关于原图的显著图,显著图的黑色部分为背景,非黑色部分为目标物体,将显著图的目标部分转换为原图对应位置的彩色颜色,得到分割后的图像;
等密度取图像小块:在目标物体中等距离截取图像小块,小块大小为16*16像素点,间隔为30个像素点,结果如图所示。
提取颜色特征:对图像小块分别计算归一化后的RGB三个通道的颜色直方图,每个通道的颜色直方图有16个频段,也就是得到的特征向量为16维,故得到的颜色特征为48维。
提取纹理特征:把图像小块中的第八行第八列的像素点作为特征点,对该特征点的邻域运用SURF描述符描述得到128维特征向量。
生成局部特征描述符:把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量,也即是局部描述符。
学习一个过完备的稀疏字典:将所有训练图像的局部描述符通过利用KSVD算法学习一个过完备的稀疏字典D,其中字典的原子个数为5000,稀疏度为3;
稀疏表示特征向量:利用OMP算法根据上一步得到的稀疏字典的原子来线性表示上述步骤得到的每一个图像小块的局部描述符xi ,维度是5000*1,稀疏度为3,其中yi≈Dxi;
生成图像的全局特征向量:得到所有图像的局部描述符后,再对每一张图的所有局部描述符统计其使用稀疏字典的每一个原子的频率,得到一个直方图,这个直方图就是图像的全局描述符,也就是图像的特征;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (4)
1.一种中餐食物图像特征提取方法,其特征在于,包括如下步骤:
训练阶段:
(1)获取训练数据集,并将其中的中餐食物图像等距离截取为若干图像小块;
(2)提取所述图像小块的颜色特征和纹理特征,得到每一个图像小块的局部描述符,记为yi;
(3)基于训练数据集的所有中餐食物图像的所有局部描述符,学习得到一个过完备的稀疏字典D;
(4)利用OMP算法根据上一步得到的稀疏字典的原子来线性表示;上述步骤得到的每一个图像小块的局部描述符xi,其中yi ≈Dxi;
(5)得到所有中餐食物图像的局部描述符后,再对每一张中餐食物图像的所有局部描述符统计其使用稀疏字典的每一个原子的频率,得到一个直方图,这个直方图就是中餐食物图像的全局描述符,也就是图像的特征;
测试阶段:采用上述方法对测试图像提取局部特征,并利用训练图像生成的稀疏字典去表示测试图像的局部描述符,从而得到测试集图像的稀疏的局部描述符,再利用同样的方法得到全局描述符。
2.根据权利要求1所述中餐食物图像特征提取方法,其特征在于,所述步骤(1)中,等距离截取图像小块是指在输入图像中等距离截取图像小块,小块大小为M*M像素点,间隔为N个像素点。
3.根据权利要求1所述中餐食物图像特征提取方法,其特征在于,所述步骤(2)中,颜色特征为对图像小块分别计算归一化后的RGB三个通道的颜色直方图,每个通道的颜色直方图有M个频段,也就是得到的特征向量为M维,故得到的颜色特征为3M维;纹理特征为对图像小块运用SURF描述符描述得到8M维特征向量,把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量,也即是局部描述符。
4.根据权利要求1所述中餐食物图像特征提取方法,其特征在于,所述步骤(3)中,通过利用KSVD算法生成稀疏字典是指将所有训练图像的局部描述符通过KSVD算法学习一个过完备的稀疏字典D,其中字典的原子个数为5000,稀疏度为3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610804677.XA CN106446909A (zh) | 2016-09-06 | 2016-09-06 | 一种中餐食物图像特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610804677.XA CN106446909A (zh) | 2016-09-06 | 2016-09-06 | 一种中餐食物图像特征提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106446909A true CN106446909A (zh) | 2017-02-22 |
Family
ID=58164842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610804677.XA Pending CN106446909A (zh) | 2016-09-06 | 2016-09-06 | 一种中餐食物图像特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106446909A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280469A (zh) * | 2018-01-16 | 2018-07-13 | 佛山市顺德区中山大学研究院 | 一种基于稀疏表示的超市商品图像识别方法 |
CN110123149A (zh) * | 2019-05-10 | 2019-08-16 | 九阳股份有限公司 | 一种烹饪设备的烹饪控制方法以及烹饪设备 |
CN110234040A (zh) * | 2019-05-10 | 2019-09-13 | 九阳股份有限公司 | 一种烹饪设备的食材图像获取方法以及烹饪设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750677A (zh) * | 2012-06-12 | 2012-10-24 | 清华大学 | 基于同尺度结构自相似与压缩感知的单图像超分辨率方法 |
CN102891999A (zh) * | 2012-09-26 | 2013-01-23 | 南昌大学 | 一种基于压缩感知的联合图像压缩/加密方法 |
CN103942550A (zh) * | 2014-05-04 | 2014-07-23 | 厦门大学 | 一种基于稀疏编码特征的场景文本识别方法 |
CN104091169A (zh) * | 2013-12-12 | 2014-10-08 | 华南理工大学 | 基于多特征融合的行为识别方法 |
-
2016
- 2016-09-06 CN CN201610804677.XA patent/CN106446909A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750677A (zh) * | 2012-06-12 | 2012-10-24 | 清华大学 | 基于同尺度结构自相似与压缩感知的单图像超分辨率方法 |
CN102891999A (zh) * | 2012-09-26 | 2013-01-23 | 南昌大学 | 一种基于压缩感知的联合图像压缩/加密方法 |
CN104091169A (zh) * | 2013-12-12 | 2014-10-08 | 华南理工大学 | 基于多特征融合的行为识别方法 |
CN103942550A (zh) * | 2014-05-04 | 2014-07-23 | 厦门大学 | 一种基于稀疏编码特征的场景文本识别方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280469A (zh) * | 2018-01-16 | 2018-07-13 | 佛山市顺德区中山大学研究院 | 一种基于稀疏表示的超市商品图像识别方法 |
CN110123149A (zh) * | 2019-05-10 | 2019-08-16 | 九阳股份有限公司 | 一种烹饪设备的烹饪控制方法以及烹饪设备 |
CN110234040A (zh) * | 2019-05-10 | 2019-09-13 | 九阳股份有限公司 | 一种烹饪设备的食材图像获取方法以及烹饪设备 |
CN110123149B (zh) * | 2019-05-10 | 2021-08-03 | 九阳股份有限公司 | 一种烹饪设备的烹饪控制方法以及烹饪设备 |
CN110234040B (zh) * | 2019-05-10 | 2022-08-09 | 九阳股份有限公司 | 一种烹饪设备的食材图像获取方法以及烹饪设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107480620B (zh) | 基于异构特征融合的遥感图像自动目标识别方法 | |
CN109543595B (zh) | 基于深度可分离卷积神经网络的电线的训练方法和检测方法 | |
Mirghasemi et al. | A target-based color space for sea target detection | |
Woźniak et al. | Graphic object feature extraction system based on cuckoo search algorithm | |
CN110335233B (zh) | 基于图像处理技术的高速公路护栏板缺陷检测系统和方法 | |
WO2019204577A1 (en) | System and method for multimedia analytic processing and display | |
Dewangan | Importance & applications of digital image processing | |
Nanni et al. | Texture descriptors ensembles enable image-based classification of maturation of human stem cell-derived retinal pigmented epithelium | |
Shihavuddin et al. | Automated classification and thematic mapping of bacterial mats in the north sea | |
CN108280469A (zh) | 一种基于稀疏表示的超市商品图像识别方法 | |
Zneit et al. | Procedural analysis of RGB color image objects | |
CN106446909A (zh) | 一种中餐食物图像特征提取方法 | |
Uddin et al. | Bangla sign language interpretation using bag of features and Support Vector Machine | |
CN114821554A (zh) | 图像识别方法、电子设备及存储介质 | |
CN110070545B (zh) | 一种城镇纹理特征密度自动提取城镇建成区的方法 | |
Kartika et al. | Butterfly image classification using color quantization method on hsv color space and local binary pattern | |
Ball et al. | Level set hyperspectral image classification using best band analysis | |
CN110490210B (zh) | 一种基于紧致通道间t采样差分的彩色纹理分类方法 | |
Pedersen et al. | Shape index descriptors applied to texture-based galaxy analysis | |
Senyukova et al. | Automated atlas-based segmentation of NISSL-stained mouse brain sections using supervised learning | |
Zavrtanik et al. | A segmentation-based approach for polyp counting in the wild | |
Chen et al. | A novel multiscale edge detection approach based on nonsubsampled contourlet transform and edge tracking | |
Wu et al. | Image Edge Detection Based on Sobel with Morphology | |
Prasad et al. | Grayscale to color map transformation for efficient image analysis on low processing devices | |
CN115170956A (zh) | 基于多尺度熵率超像素的后验概率高光谱图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |