WO2017088249A1

WO2017088249A1 - 特征提取方法及装置

Info

Publication number: WO2017088249A1
Application number: PCT/CN2015/099310
Authority: WO
Inventors: 龙飞; 陈志军; 张涛
Original assignee: 小米科技有限责任公司
Priority date: 2015-11-25
Filing date: 2015-12-29
Publication date: 2017-06-01
Also published as: MX2016003738A; RU2016110721A; US10297015B2; RU2632578C2; CN105654093B; KR101754046B1; US20170148147A1; JP2018504729A; JP6378453B2; CN105654093A; KR20170074214A; EP3173976A1

Abstract

本公开揭示了一种特征提取方法及装置，属于图像处理技术领域。所述特征提取方法包括：将图像划分为若干个块，每个块包括若干个单元格；将每个单元格从空间域转化为频率域；提取图像在频率域中的方向梯度直方图HOG特征。通过在频率域提取图像的HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

Description

特征提取方法及装置

本申请基于申请号为201510827886.1、申请日为2015年11月25日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及图像处理技术领域，特别涉及一种特征提取方法及装置。

背景技术

图像检测与识别是计算机视觉中一个重要的研究领域。图像检测与识别技术中最常用的方法是通过提取图像中的某种特征从而对图像进行检测与识别。

在相关技术中，通过提取图像的HOG(Histogram of Oriented Gradient，方向梯度直方图)特征对图像进行检测与识别。HOG特征提取的方法如下：计算图像中每个像素的梯度；将图像划分成若干个单元格，每个单元格包括若干个像素，每相邻的n个单元格形成一个块；统计每个单元格中所有像素的梯度直方图，再根据每个块中的所有单元格的梯度直方图得到每个块的HOG特征；统计图像中所有块的HOG特征得到图像的HOG特征。

发明内容

为了解决相关技术中存在的问题，本公开提供一种特征提取方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种特征提取方法，该方法包括：

将图像划分为若干个块，每个块包括若干个单元格；

将每个单元格从空间域转化为频率域；

提取图像在频率域中的方向梯度直方图HOG特征。

在一个可选的实施例中，将每个单元格从空间域转化为频率域，包括：对每个单元格进行离散余弦变换DCT。

在一个可选的实施例中，将每个单元格从空间域转化为频率域，包括：对每个单元格进行离散傅里叶变换DFT。

在一个可选的实施例中，提取图像在频率域中的方向梯度直方图HOG特征，包括：

计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子；

统计频率域中每个块内的各个描述子，得到每个块的HOG特征；

统计图像在频率域中各个块的HOG特征，得到图像的HOG特征。

在一个可选的实施例中，统计图像中各个块的HOG特征，得到图像的HOG特征，包括：

将图像中各个块的HOG特征串联成一个矩阵，得到图像的HOG特征，矩阵的每一列为一个块的HOG特征。

将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N；

根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征。

在一个可选的实施例中，该方法，还包括：

将图像进行归一化处理，得到预定尺寸大小的图像。

根据本公开实施例的第二方面，提供一种特征提取装置，该装置包括：

划分模块，被配置为将图像划分为若干个块，每个块包括若干个单元格；

转化模块，被配置为将每个单元格从空间域转化为频率域；

提取模块，被配置为提取图像在频率域中的方向梯度直方图HOG特征。

在一个可选的实施例中，转化模块，被配置为对每个单元格进行离散余弦变换DCT。

在一个可选的实施例中，转化模块，被配置为对每个单元格进行离散傅里叶变换DFT。

在一个可选的实施例中，提取模块，包括：

计算子模块，被配置为计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子；

第一统计子模块，被配置为统计频率域中每个块内的各个描述子，得到每个块的HOG特征；

第二统计子模块，被配置为统计图像在频率域中各个块的HOG特征，得到图像的HOG特征。

在一个可选的实施例中，第二统计子模块，被配置为将图像中各个块的HOG特征串联成一个矩阵，得到图像的HOG特征，矩阵的每一列为一个块的HOG特征。

在一个可选的实施例中，第二统计子模块，包括：

调整子模块，被配置为将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N；

特征提取子模块，根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征。

在一个可选的实施例中，该装置，还包括：

处理模块，被配置为将图像进行归一化处理，得到预定尺寸大小的图像。

根据本公开实施例的第三方面，提供一种特征提取装置，该装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

将图像划分为若干个块，每个块包括若干个单元格；

将每个单元格从空间域转化为频率域；

提取图像在频率域中的方向梯度直方图HOG特征。

本公开的实施例提供的技术方案可以包括以下有益效果：

通过将图像划分为若干个块，每个块包括若干个单元格；将每个单元格从空间域转化为频率域；提取图像在频率域中的方向梯度直方图HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并于说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种特征提取方法的流程图；

图2A是根据另一示例性实施例示出的一种特征提取方法的流程图；

图2B是根据一示例性实施例示出的一种图像划分的示意图；

图2C是根据另一示例性实施例示出的一种图像划分的示意图；

图2D是根据一示例性实施例示出的一种统计块内HOG特征的示意图；

图3A是根据一示例性实施例示出的一种特征提取方法的流程图；

图3B是根据一示例性实施例示出的一种统计图像HOG特征的示意图；

图4是根据一示例性实施例示出的一种特征提取装置的框图；

图5是根据另一示例性实施例示出的一种特征提取装置的框图；

图6是根据一示例性实施例示出的一种特征提取装置的子模块的框图；

图7是根据另一示例性实施例示出的一种特征提取装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种特征提取方法的流程图，如图1所示，本实施例以该方法应用于模式识别的硬件中来举例说明，该方法可以包括以下步骤。

在步骤102中，将图像划分为若干个块，每个块包括若干个单元格。

在步骤104中，将每个单元格从空间域转化为频率域。

对每个单元格进行转化，将图像从空间域转化为频率域。

在步骤106中，提取图像在频率域中的HOG特征。

在频率域中提取图像的HOG特征。

综上所述，本公开实施例中提供的特征提取方法，通过将图像划分为若干个块，每个块包括若干个单元格；将每个单元格从空间域转化为频率域；提取图像在频率域中的方向梯度直方图HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

图2A是根据另一示例性实施例示出的一种特征提取方法的流程图，如图2A所示，本实施例以该方法应用于模式识别的硬件中来举例说明，该方法可以包括以下步骤：

在步骤201中，将图像进行归一化处理，得到预定尺寸大小的图像。

在模式识别中，一般会涉及到对多个图像的特征提取。

在对图像进行特征提取之前，终端先对图像进行归一化处理，将不同大小的图像处理为预定尺寸大小的图像，以便于对图像的统一处理。

在步骤202中，将图像划分为若干个块，每个块包括若干个单元格。

可选的，终端对归一化处理后的图像进行划分包括：将图像划分为若干个块，再将每个块划分为若干个单元格。

可选的，终端对归一化处理后的图像进行划分包括：将图像划分为若干个单元格，再将相连的单元格组成一个块，每个块中包含有若干个单元格，比如：将两两相邻的四个呈田字形排列的单元格组成一个块。

本实施例中，在图像划分过程中，对划分块和划分单元格的顺序不作具体限定，可以先划分块再划分单元格，也可以先划分单元格再组合成块。

本实施例中，对图像划分的块与块之间是否存在重叠区域不作具体限定，块与块之间可以存在重叠区域也可以不存在重叠区域。

比如：将128像素*128像素的图像20先划分为16像素*16像素互不重叠的块21，再将每个16像素*16像素的块21划分为8像素*8像素的单元格22，则图像中包含有8个*8个＝64个互不重叠的块21，每个块中包含有2个*2个＝4个单元格，如图2B所示。

比如：将128像素*128像素的图像20先划分为16像素*16像素存在重叠区域的块23，再将每个16像素*16像素的块23划分为8像素*8像素的单元格 24，则图像中包含有16个*16个＝256个存在重叠区域的块23，每个块中包含有2个*2个＝4个单元格，如图2C所示。

在步骤203中，对每个单元格进行DCT变换。

对于图像中的每个单元格而言，假定每个单元格的像素组成的矩阵A的大小为M像素*N像素，则矩阵A的DCT(Discrete Cosine Transform，离散余弦变换)变换系数如下公式：

其中，

B_p·q为矩阵A的DCT系数，p＝0，1，2…，M-1，m＝0，1，2…，M-1，q＝0，1，2…，N-1，n＝0，1，2…，N-1。

将图像中的每个单元格都进行DCT变换，从而将图像从空间域转换为频率域。

可选的，终端对每个单元格进行DFT变换(Discrete Fourier Transform，离散傅里叶变换)。

对于图像中的每个单元格而言，假定每个单元格的大小为M像素*N像素，像素(x，y)组成的函数为f(x，y)，则函数f(x，y)的DFT系数F(u，v)如下公式：

其中，u＝0，1，2…，M-1，v＝0，1，2…，N-1。

终端将图像中的每个单元格都进行DFT变换，从而将图像从空间域转换为频率域。

在步骤204中，计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子。

终端利用梯度算子计算经过DCT变换或DFT变换后的每个单元格中的每个像素的横向梯度和纵向梯度。示例性的，常用的梯度算子如下表一所示：

表一

本实施例中，在计算每个单元格中像素的梯度大小时可以选择表一中的任意一个梯度算子，也可以选择其他的梯度算子，本实施例中对梯度算子的选择不作具体限定。

假定像素(x，y)的横向梯度为H(x，y)，纵向梯度为V(x，y)，则每个像素的梯度方向和梯度幅值的计算分别如下公式(1)和公式(2)：

θ(x，y)＝tan^-1[V(x，y)/H(x，y)] (1)

m(x，y)＝[H(x，y)²+V(x，y)²]^1/2 (2)

其中，θ(x，y)为像素(x，y)的梯度方向，m(x，y)为像素(x，y)的梯度大小。

梯度方向θ(x，y)的取值范围为-90度到90度，将梯度方向θ(x，y)平均分成z份，对每个单元格中的所有像素按照权重m(x，y)在梯度方向划分的每一份进行统计，最后每个单元格得到一个z维的向量，也即得到每个单元格对应的描述子。

比如：将梯度方向θ(x，y)平均分成9份，每一份对应的角度为20度，对每个单元格中所有像素按照权重m(x，y)在各个20度中进行统计，最后对应每个单元格得到一个9维的向量。

本实施例中，对将梯度方向划分为多少份不作具体限定。

在步骤205中，统计频率域中每个块内的各个描述子，得到每个块的HOG特征。

终端对每个块内包含的各个单元格中计算得到的描述子进行统计，得到每个块的HOG特征。

在对各个单元格中计算得到的描述子进行统计时，终端可以将各个单元格对应的描述子进行串联，使得每个块的HOG特征是一个向量，该向量的维数是该块内包含单元格对应的描述子维数的k倍。

比如：各个单元格中的描述子为9维的向量，每个块包含有4个单元格，则将4个单元格中的9维描述子进行串联，形成一个36维的向量，将该36维的向量作为对应块的HOG特征。

在步骤206中，统计图像在频率域中各个块的HOG特征，得到图像的HOG特征。

终端统计各个块的HOG特征，得到图像的HOG特征。将图像中各个块的 HOG特征串联成一个矩阵，得到图像的HOG特征，矩阵的每一列为一个块的HOG特征。

比如：图像中包含有K个块，各个块的HOG特征为K_i，则将K_i个HOG特征串联成一个矩阵25，将K₁放在串联成的矩阵的第一列26，将K₂放在串联的矩阵的第二列27，以此类推。如图2D所示。

综上所述，本公开实施例中提供的特征提取方法，通过将图像划分为若干个块，每个块包括若干个单元格；对每个单元格进行DCT变换或DFT变换；计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子；统计频率域中每个块内的各个描述子，得到每个块的HOG特征；统计图像在频率域中各个块的HOG特征，得到图像的HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

在基于图2A所示的可选实施例中，在统计图像中各个块的HOG特征得到图像的HOG特征的过程中，可以按照在图像的对应位置的形式进行排列。步骤206可替换成为如下步骤206a和206b，如图3A所示：

在步骤206a中，将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N。

每个块的HOG特征是将各个单元格对应的描述子进行串联得到的L*1维向量，将L*1维向量调整为M*N的矩阵，也即，终端将各个块中的L*1维向量按照包含的单元格调整为对应的矩阵，该对应的矩阵的每一列为一个单元格的描述子；再将每个单元格的描述子按照对应的像素进行调整，调整后得到的矩阵的每一列为对应块中对应列的像素对应的HOG特征。

在步骤206b中，根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征。

根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像中对应像素位置的HOG特征。

比如：图像中包含有K个块，各个块的HOG特征为K_i，则将K_i个HOG特征调整为M*N的矩阵，将K₁调整后的矩阵31放在第一个块32在图像中的对应位置，将K₂调整后的矩阵33放在第二个块34在图像中的对应位置，以此类推，最后一个将矩阵MN放在最后一个块MN在图像中的对应位置。如图3B所示。

综上所述，本实施例提供的特征提取方法，通过将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N；根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征；使得提取后的图像的HOG特征与对应于图像中每个块的对应位置，可以更好地突出图像中各个块的特征。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图4是根据一示例性实施例示出的一种特征提取装置的框图，如图4所示，该特征提取装置包括但不限于：

划分模块420，被配置为将图像划分为若干个块，每个块包括若干个单元格。

转化模块440，被配置为将每个单元格从空间域转化为频率域。

转化模块440对每个单元格进行转化，将图像从空间域转化为频率域。

提取模块460，被配置为提取图像在频率域中的方向梯度直方图HOG特征。

综上所述，本公开实施例中提供的特征提取装置，通过将图像划分为若干个块，每个块包括若干个单元格；将每个单元格从空间域转化为频率域；提取图像在频率域中的方向梯度直方图HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

图5是根据另一示例性实施例示出的一种特征提取装置的框图，如图5所示，该特征提取装置包括但不限于：

处理模块410，被配置为将图像进行归一化处理，得到预定尺寸大小的图像。

在模式识别中，一般会涉及到对多个图像的特征提取。

在对图像进行特征提取之前，处理模块410对图像进行归一化处理，将不同大小的图像处理为预定尺寸大小的图像，以便于对图像的统一处理。

可选的，划分模块420对归一化处理后的图像进行划分包括：将图像划分为若干个块，再将每个块划分为若干个单元格。

可选的，划分模块420对归一化处理后的图像进行划分包括：将图像划分为若干个单元格，再将相连的单元格组成一个块，每个块中包含有若干个单元格，比如：将两两相邻的四个呈田字形排列的单元格组成一个块。

本实施例中，划分模块420在图像划分过程中，对划分块和划分单元格的顺序不作具体限定，可以先划分块再划分单元格，也可以先划分单元格再组合成块。

本实施例中，划分模块420对图像划分的块与块之间是否存在重叠区域不作具体限定，块与块之间可以存在重叠区域也可以不存在重叠区域。

转化模块440，被配置为对每个单元格进行离散余弦变换DCT。

其中，

转化模块440将图像中的每个单元格都进行DCT变换，从而将图像从空间域转换为频率域。

可选的，转化模块440，被配置为对每个单元格进行DFT变换(Discrete Fourier Transform，离散傅里叶变换)。

对于图像中的每个单元格而言，假定每个单元格的大小为M像素*N像素，组成的函数为f(x，y)，则函数f(x，y)的DFT系数F(u，v)如下公式：

其中，u＝0，1，2…，M-1，v＝0，1，2…，N-1，(x，y)为像素的位置。

转化模块440将图像中的每个单元格都进行DFT变换，从而将图像从空间域转换为频率域。

本实施例中，提取模块460可以包括如下子模块：

计算子模块461，被配置为计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子。

计算子模块461利用梯度算子计算经过DCT变换或DFT变换后的每个单元格中的每个像素的横向梯度和纵向梯度。

本实施例中对梯度算子的选择不作具体限定。

假定像素的横向梯度为H(x，y)，纵向梯度为V(x，y)，则每个像素的梯度方向和梯度幅值的计算分别如下公式(1)和公式(2)：

θ(x，y)＝tan^-1[V(x，y)/H(x，y)] (1)

m(x，y)＝[H(x，y)²+V(x，y)²]^1/2 (2)

本实施例中，对将梯度方向划分为多少份不作具体限定。

第一统计子模块462，被配置为统计频率域中每个块内的各个描述子，得到每个块的HOG特征。

第一统计子模块462对每个块内包含的各个单元格中计算得到的描述子进行统计，得到每个块的HOG特征。

在对各个单元格中计算得到的描述子进行统计时，第一统计子模块462可以将各个单元格对应的描述子进行串联，使得每个块的HOG特征是一个向量，该向量的维数是该块内包含单元格对应的描述子维数的k倍。

第二统计子模块463，被配置为统计图像在频率域中各个块的HOG特征，得到图像的HOG特征。

第二统计子模块463统计各个块的HOG特征，得到图像的HOG特征。

可选的，第二统计子模块463，被配置为将图像中各个块的HOG特征串联成一个矩阵，得到图像的HOG特征，矩阵的每一列为一个块的HOG特征。

综上所述，本公开实施例中提供的特征提取装置，通过将图像划分为若干个块，每个块包括若干个单元格；对每个单元格进行DCT变换或DFT变换；计算频率域中每个单元格的梯度大小和梯度方向，得到每个单元格的描述子；统计频率域中每个块内的各个描述子，得到每个块的HOG特征；统计图像在频率域中各个块的HOG特征，得到图像的HOG特征；解决了在HOG特征提取过程中是针对图像的空间域直接计算得到，导致在模式识别中的检测率和准确度较低的问题；达到了在频率域提取图像的HOG特征，提高了在模式识别中的检测率和准确度的效果。

在基于图5所示的可选实施例中，第二统计子模块463可以包括如下子模块，如图6所示：

调整子模块610，被配置为将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N。

每个块的HOG特征是将各个单元格对应的描述子进行串联得到的L*1维向量，调整子模块610将L*1维向量调整为M*N的矩阵，也即，将各个块中的L*1维向量按照包含的单元格调整为对应的矩阵，该对应的矩阵的每一列为一个单元格的描述子；再将每个单元格的描述子按照对应的像素进行调整，调整后得到的矩阵的每一列为对应块中对应列的像素对应的HOG特征。

特征提取子模块620，被配置为根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征。

特征提取子模块620根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像中对应像素位置的HOG特征。

综上所述，本实施例提供的特征提取装置，通过将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个块包括M*N个像素，L＝M*N；根据每个块的调整后的HOG特征和每个块在图像中的对应位置，得到图像的HOG特征；使得提取后的图像的HOG特征与对应于图像中每个块的对应位置，可以更好地突出图像中各个块的特征。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开一示例性实施例提供了一种特征提取装置，能够实现本公开提供的特征提取方法，该特征提取装置包括：处理器、用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

将图像划分为若干个块，每个块包括若干个单元格；

将每个单元格从空间域转化为频率域；

提取图像在频率域中的方向梯度直方图HOG特征。

图7是根据一示例性实施例示出的一种特征提取装置的框图。例如，装置700可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图7，装置700可以包括以下一个或多个组件：处理组件702，存储器704，电源组件706，多媒体组件708，音频组件710，输入/输出(I/O)接口712，传感器组件714，以及通信组件716。

处理组件702通常控制装置700的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器718来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件702可以包括一个或多个模块，便于处理组件702和其他组件之间的交互。例如，处理组件702可以包括多媒体模块，以方便多媒体组件708和处理组件702之间的交互。

存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统，一个或多个电源，及其他与为装置700生成、管理和分配电力相关联的组件。

多媒体组件708包括在装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件710被配置为输出和/或输入音频信号。例如，音频组件710包括一个麦克风(MIC)，当装置700处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中，音频组件710还包括一个扬声器，用于输出音频信号。

I/O接口712为处理组件702和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件714包括一个或多个传感器，用于为装置700提供各个方面的状态评估。例如，传感器组件714可以检测到装置700的打开/关闭状态，组件的相对定位，例如组件为装置700的显示器和小键盘，传感器组件714还可以检测装置700或装置700一个组件的位置改变，用户与装置700接触的存在或不存在，装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件714还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络，如Wi-Fi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件716 还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述特征提取方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器704，上述指令可由装置700的处理器718执行以完成上述特征提取方法。例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种特征提取方法，其特征在于，所述方法包括：

将图像划分为若干个块，每个所述块包括若干个单元格；

将每个所述单元格从空间域转化为频率域；

提取所述图像在所述频率域中的方向梯度直方图HOG特征。
根据权利要求1所述的方法，其特征在于，所述将每个所述单元格从空间域转化为频率域，包括：对每个所述单元格进行离散余弦变换DCT。
根据权利要求1所述的方法，其特征在于，所述将每个所述单元格从空间域转化为频率域，包括：对每个所述单元格进行离散傅里叶变换DFT。
根据权利要求2所述的方法，其特征在于，所述提取所述图像在所述频率域中的方向梯度直方图HOG特征，包括：

计算所述频率域中每个所述单元格的梯度大小和梯度方向，得到每个所述单元格的描述子；

统计所述频率域中每个所述块内的各个所述描述子，得到每个所述块的HOG特征；

统计所述图像在所述频率域中各个所述块的HOG特征，得到所述图像的HOG特征。
根据权利要求4所述的方法，其特征在于，所述统计所述图像中各个所述块的HOG特征，得到所述图像的HOG特征，包括：

将所述图像中各个所述块的HOG特征串联成一个矩阵，得到所述图像的HOG特征，所述矩阵的每一列为一个所述块的HOG特征。
根据权利要求4所述的方法，其特征在于，所述统计所述图像中各个所述块的HOG特征，得到所述图像的HOG特征，包括：

将所述图像中每个所述块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个所述块包括M*N个像素，L＝M*N；

根据每个所述块的调整后的所述HOG特征和每个所述块在所述图像中的对应位置，得到所述图像的HOG特征。
根据权利要求1至6任一所述的方法，其特征在于，所述方法，还包括：

将所述图像进行归一化处理，得到预定尺寸大小的所述图像。
一种特征提取装置，其特征在于，所述装置包括：

划分模块，被配置为将图像划分为若干个块，每个所述块包括若干个单元格；

转化模块，被配置为将每个所述单元格从空间域转化为频率域；

提取模块，被配置为提取所述图像在所述频率域中的方向梯度直方图HOG特征。
根据权利要求8所述的装置，其特征在于，所述转化模块，被配置为对每个所述单元格进行离散余弦变换DCT。
根据权利要求8所述的装置，其特征在于，所述转化模块，被配置为对每个所述单元格进行离散傅里叶变换DFT。
根据权利要求9所述的装置，其特征在于，所述提取模块，包括：

计算子模块，被配置为计算所述频率域中每个所述单元格的梯度大小和梯度方向，得到每个所述单元格的描述子；

第一统计子模块，被配置为统计所述频率域中每个所述块内的各个所述描述子，得到每个所述块的HOG特征；

第二统计子模块，被配置为统计所述图像在所述频率域中各个所述块的HOG特征，得到所述图像的HOG特征。
根据权利要求11所述的装置，其特征在于，所述第二统计子模块，被配置为将所述图像中各个所述块的HOG特征串联成一个矩阵，得到所述图像的 HOG特征，所述矩阵的每一列为一个所述块的HOG特征。
根据权利要求11所述的装置，其特征在于，所述第二统计子模块，包括：

调整子模块，被配置为将所述图像中每个所述块的HOG特征由初始的L*1维向量调整为M*N的矩阵，每个所述块包括M*N个像素，L＝M*N；

特征提取子模块，被配置为根据每个所述块的调整后的所述HOG特征和每个所述块在所述图像中的对应位置，得到所述图像的HOG特征。
根据权利要求8至13任一所述的装置，其特征在于，所述装置，还包括：

处理模块，被配置为将所述图像进行归一化处理，得到预定尺寸大小的所述图像。
一种特征提取装置，其特征在于，所述装置包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为：

将图像划分为若干个块，每个所述块包括若干个单元格；

将每个所述单元格从空间域转化为频率域；

提取所述图像在所述频率域中的方向梯度直方图HOG特征。