CN106446909A

CN106446909A - 一种中餐食物图像特征提取方法

Info

Publication number: CN106446909A
Application number: CN201610804677.XA
Authority: CN
Inventors: 黄敏婕; 张东
Original assignee: Sun Yat Sen University; SYSU CMU Shunde International Joint Research Institute
Current assignee: Sun Yat Sen University; SYSU CMU Shunde International Joint Research Institute
Priority date: 2016-09-06
Filing date: 2016-09-06
Publication date: 2017-02-22

Abstract

本发明公开了一种中餐食物图像特征提取方法，涉及图像处理领域。所述方法包括步骤：(1)将中餐食物图像等距离截取若干图像小块；(2)对前述图像小块提取其颜色特征和纹理特征，得到每一个小块的局部描述符，记为y_i；(3)将得到的训练数据集的所有图像的所有局部描述符通过利用KSVD算法学习得到一个过完备的稀疏字典D；(4)利用OMP算法根据上一步得到的稀疏字典的原子来线性表示上述步骤得到的每一个图像小块的局部描述符x_i，其中y_i≈Dx_i；(5)得到所有图像的局部描述符后，再对每一张图的所有局部描述符统计其使用稀疏字典的每一个原子的频率，得到一个直方图，这个直方图就是图像的全局描述符，也就是图像的特征。此种提取方法可提高食物识别的准确率。

Description

一种中餐食物图像特征提取方法

技术领域

本发明涉及图像处理领域，更具体地，涉及一种中餐食物图像特征提取方法。

背景技术

现在的常用的特征提取方法主要有颜色特征提取、统计特征提取和频率域特征提取等，这些特征在模式识别中有着很好的应用性。

颜色特征提取：颜色特征是一种全局特征，描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征，此时所有属于图像或图像区域的像素都有各自的贡献。颜色直方图是最常用的表达颜色特征的方法，它能简单描述一幅图像中颜色的全局分布，即不同色彩在整幅图像中所占的比例。

统计特征提取：统计特征是基于图像的整体灰度特征的，它强调尽可能多地保留原始图像的信息，通过对大量样本的训练，获得其统计特征，其基本思想是将图像映射到特征空间，将大量图像数据降维后进行模式分类，因此提取统计特征的方法实际上就是“子空间分析法”。

频率域特征提取：由于Gabor小波核函数具有与人类大脑皮层简单细胞的二维反射区相同的特性，即能够捕捉对应于空间频率、空间位置及方向选择性的局部结构信息，因此用二维Gabor小波变换的系数幅值作为特征来匹配有着良好的视觉特性和生物学背景，在图像处理中被广泛应用。

由于图像类别不同，提取的特征以及特征的表示方式都不同，现在的常用的特征提取方法主要有几何特征提取、统计特征提取和频率域特征提取等，在食物图像识别中，要根据食物图像的特性提取图像特征，尤其是在复杂的中餐食物图像中。

发明内容

本发明是针对前述上述现有技术中的缺陷和不足，提供一种中餐食物图像特征提取的方法，其可提高中餐食物特征识别的准确率。

为解决上述技术问题，本发明的技术方案如下：

一种中餐食物图像特征提取方法，包括如下步骤：

训练阶段：

（1）获取训练数据集，并将其中的中餐食物图像等距离截取为若干图像小块；

（2）提取所述图像小块的颜色特征和纹理特征，得到每一个图像小块的局部描述符，记为y_i；

（3）基于训练数据集的所有中餐食物图像的所有局部描述符，学习得到一个过完备的稀疏字典D；

（4）利用OMP算法根据上一步得到的稀疏字典的原子来线性表示；上述步骤得到的每一个图像小块的局部描述符x_i，其中y_i≈Dx_i；

（5）得到所有中餐食物图像的局部描述符后，再对每一张中餐食物图像的所有局部描述符统计其使用稀疏字典的每一个原子的频率，得到一个直方图，这个直方图就是中餐食物图像的全局描述符，也就是图像的特征；

测试阶段：采用上述方法对测试图像提取局部特征，并利用训练图像生成的稀疏字典去表示测试图像的局部描述符，从而得到测试集图像的稀疏的局部描述符，再利用同样的方法得到全局描述符。

优选的，所述步骤（1）中，等距离截取图像小块是指在输入图像中等距离截取图像小块，小块大小为M*M像素点，间隔为N个像素点。

优选的，所述步骤（2）中，颜色特征为对图像小块分别计算归一化后的RGB三个通道的颜色直方图，每个通道的颜色直方图有M个频段，也就是得到的特征向量为M维，故得到的颜色特征为3M维；纹理特征为对图像小块运用SURF描述符描述得到8M维特征向量，把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量，也即是局部描述符。

优选的，每个通道的颜色直方图有M个频段，其中M一般取值为16。

优选的，所述步骤（3）中，通过利用KSVD算法生成稀疏字典是指将所有训练图像的局部描述符通过KSVD算法学习一个过完备的稀疏字典D，其中字典的原子个数为5000，稀疏度为3。

与现有技术相比，本发明技术方案的有益效果是：

1、本发明提出一种是专门针对中餐食物图像识别研究的特征提取方法；

2、本发明利用得到的稀疏字典的原子线性表示原来的局部特征，最后通过统计每个原子所使用的频率得到图像的全局特征，即结合现有的颜色特征和纹理特征，改进特征的表示方式，这样能够减小重建误差，从而提高了食物识别的准确率。

附图说明

图1是本发明的工作流程图；

图2是分割后的等密度取小块图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。

如图1所示，本实施例提供一种中餐食物图像特征提取的方法，包括如下步骤：

读入一张食物图像：从食物图像图库中读入一张图像；

图像分割处理：将前述读入的图像利用显著性检测算法得到一幅关于原图的显著图，显著图的黑色部分为背景，非黑色部分为目标物体，将显著图的目标部分转换为原图对应位置的彩色颜色，得到分割后的图像；

等密度取图像小块：在目标物体中等距离截取图像小块，小块大小为16*16像素点，间隔为30个像素点，结果如图所示。

提取颜色特征：对图像小块分别计算归一化后的RGB三个通道的颜色直方图，每个通道的颜色直方图有16个频段，也就是得到的特征向量为16维，故得到的颜色特征为48维。

提取纹理特征：把图像小块中的第八行第八列的像素点作为特征点，对该特征点的邻域运用SURF描述符描述得到128维特征向量。

生成局部特征描述符：把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量，也即是局部描述符。

学习一个过完备的稀疏字典：将所有训练图像的局部描述符通过利用KSVD算法学习一个过完备的稀疏字典D，其中字典的原子个数为5000，稀疏度为3；

稀疏表示特征向量：利用OMP算法根据上一步得到的稀疏字典的原子来线性表示上述步骤得到的每一个图像小块的局部描述符x_i，维度是5000*1，稀疏度为3，其中y_i≈Dx_i；

生成图像的全局特征向量：得到所有图像的局部描述符后，再对每一张图的所有局部描述符统计其使用稀疏字典的每一个原子的频率，得到一个直方图，这个直方图就是图像的全局描述符，也就是图像的特征；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种中餐食物图像特征提取方法，其特征在于，包括如下步骤：

训练阶段：

2.根据权利要求1所述中餐食物图像特征提取方法，其特征在于，所述步骤（1）中，等距离截取图像小块是指在输入图像中等距离截取图像小块，小块大小为M*M像素点，间隔为N个像素点。

3.根据权利要求1所述中餐食物图像特征提取方法，其特征在于，所述步骤（2）中，颜色特征为对图像小块分别计算归一化后的RGB三个通道的颜色直方图，每个通道的颜色直方图有M个频段，也就是得到的特征向量为M维，故得到的颜色特征为3M维；纹理特征为对图像小块运用SURF描述符描述得到8M维特征向量，把颜色特征向量和纹理特征向量列向拼接得到该小块的局部特征向量，也即是局部描述符。

4.根据权利要求1所述中餐食物图像特征提取方法，其特征在于，所述步骤（3）中，通过利用KSVD算法生成稀疏字典是指将所有训练图像的局部描述符通过KSVD算法学习一个过完备的稀疏字典D，其中字典的原子个数为5000，稀疏度为3。