CN106056133A

CN106056133A - 一种图像识别方法及装置

Info

Publication number: CN106056133A
Application number: CN201610338118.4A
Authority: CN
Inventors: 高云翔; 孟蕊
Original assignee: Wireless Living (hangzhou) Mdt Infotech Ltd
Current assignee: Wireless Living (hangzhou) Mdt Infotech Ltd
Priority date: 2016-05-19
Filing date: 2016-05-19
Publication date: 2016-10-26

Abstract

本发明公开了一种图像识别方法及装置，涉及图像处理技术领域。该方法包括：获取品牌与品牌特征向量的对应关系；获取待识别图像的特征向量；将所述待识别图像的特征向量和所述品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。本发明不需要文本信息，通过图像就可以识别商品的品牌，在文本中不包含品牌的情况下，也可以识别出商品的品牌。

Description

一种图像识别方法及装置

技术领域

本发明涉及图像处理技术领域，特别涉及一种图像识别方法及装置。

背景技术

品牌识别是购物平台数据挖掘中的基础问题。传统的思路一般专注于商品描述本身，通过文本挖掘算法找到商品描述中的品牌词。然而有一些购物平台，很多卖家并未在商品描述中填写其品牌词，只有图片和很简短的文字介绍。

现有技术专注于文本领域，在一些购物平台重视图片的产品形态下，品牌识别覆盖率难以提升。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像识别方法及装置。

本发明提供一种图像识别方法，包括：

获取品牌与品牌特征向量的对应关系；

获取待识别图像的特征向量；

将所述待识别图像的特征向量和所述品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。

在一个实施例中，所述方法还可包括：

利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重；

根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。

在一个实施例中，所述根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量，可包括：

确定所述品牌中每一个商品的图像的特征向量；

将所述品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量。

在一个实施例中，将所述品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量，可包括：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中Weight(feature|brand)为品牌特征的权重，feature为特征，brand为品牌，TF(feature|brand)为所述特征的TF值，IDF(feature)为所述特征的IDF值；

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f，b)

其中，frequency_f,b表示所述特征在该品牌下出现的次数；

IDF值定义为：

I D F (f e a t u r e) = l o g \frac{N}{n_{f}}

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。

本发明还提供一种图像识别装置，包括：

第一获取模块，用于获取品牌与品牌特征向量的对应关系；

第二获取模块，用于获取待识别图像的特征向量；

输出模块，用于将所述待识别图像的特征向量和所述品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。

在一个实施例中，所述装置还可包括：

确定模块，用于利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重；

组成模块，用于根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。

在一个实施例中，所述组成模块，可包括：

确定子模块，用于确定所述品牌中每一个商品的图像的特征向量；

组成子模块，用于将所述品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量。

在一个实施例中，所述组成子模块，可包括：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f，b)

其中，frequency_f,b表示所述特征在该品牌下出现的次数；

IDF值定义为：

I D F (f e a t u r e) = l o g \frac{N}{n_{f}}

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。

本发明的实施例提供的技术方案可以包括以下有益效果：

本发明实施例的上述技术方案，通过获取品牌与品牌特征向量的对应关系；获取待识别图像的特征向量；将所述待识别图像的特征向量和所述品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。从而不需要文本信息，通过图像就可以识别商品的品牌，在文本中不包含品牌的情况下，也可以识别出商品的品牌。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种图像识别方法的流程图；

图2A为本发明实施例中另一种图像识别方法的流程图；

图2B为原始sift特征示意图；

图2C为将原始sift特征映射到128w维的示意图；

图3为本发明实施例中一种图像识别方法中步骤S15的流程图；

图4为本发明实施例中一种图像识别装置的框图；

图5为本发明实施例中另一种图像识别装置的框图；

图6为本发明实施例中一种图像识别装置中组成模块45的框图.

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

图1所示为本发明实施例中一种图像识别方法的流程图，如图1所示，包括以下步骤S11-S13：

步骤S11，获取品牌与品牌特征向量的对应关系。

步骤S12，获取待识别图像的特征向量。

步骤S13，将待识别图像的特征向量和品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。

在步骤S11之前，先获取一定的数据进行训练，这些数据可以从商品的图像以及商品的描述信息都很完备的购物平台获取。比如某一惠氏品牌的商品，商品属性页中有对应的品牌信息，品牌:Wyeth/惠氏。利用图像特征提取技术，可以将图像的特征与品牌进行对应。

利用大量的训练数据，可以知道每一个品牌所对应的图像特征以及其权重，利用这些特征可以组成特征向量，本发明利用特征聚类技术，每一个品牌均可以得到一个128w维的特征向量。利用上述步骤提取的品牌和品牌特征向量，可以对商品进行品牌预测：首先提取商品对应的图像的特征并且组成特征向量，再和品牌特征向量进行匹配，匹配度最高的品牌作为预测结果输出。

本发明利用大量的数据进行训练，然后进行品牌匹配，最后把匹配最大值作为品牌预测值输出。从而不需要文本信息，通过图像就可以识别商品的品牌，在文本中不包含品牌的情况下，也可以识别出商品的品牌。

在一个实施例中，如图2A所示，上述方法还可包括步骤S14-S15：

步骤S14，利用特征聚类算法确定图像所对应的品牌、图像的特征以及特征分别对应的权重。

步骤S15，根据图像的特征和特征分别对应的权重组成品牌特征向量。

利用特征聚类技术，可以将特征维度控制在128w维，有效地减少计算复杂度。每一个sift特征都可以找到其所属类别，从而映射到128w维中得一维上。该技术利用聚类算法在不同子空间中搜索簇群，使具有较强依赖关系(存在冗余性)的特征被划分到同一个簇群中，然后从每一个簇群中挑选具有代表性的子集共同构成特征子集，最终达到去除不相关特征和冗余特征的目的。

如图2B所示，原始的sift(Scale-invariant feature transform，即尺度不变特征变换)特征可以看作空间中的一个点，通过将相近的点合并，可以得到128w个类，每个类即为一维。sift是用于图像处理领域的一种描述。这种描述具有尺度不变性，可在图像中检测出关键点，是一种局部特征描述子。sift特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、微视角改变的容忍度也相当高。基于这些特性，它们是高度显著而且相对容易撷取，在母数庞大的特征数据库中，很容易辨识物体而且鲜有误认。使用sift特征描述对于部分物体遮蔽的侦测率也相当高，甚至只需要3个以上的sift物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下，辨识速度可接近即时运算。sift特征的信息量大，适合在海量数据库中快速准确匹配。

本发明在sift特征基础上进行二次处理，通过聚类技术和TF-IDF进行品牌特征向量化。

传统的sift特征是一个100多维的浮点数向量，平均每个图像可以提取200个左右的sift特征，但是sift向量不可相加，并不适合本发明碰到的问题。

通过聚类技术，将所有图像提取的特征进行聚类，并且设置聚类类别总数为128万。这样可以得到128w维的向量，并且这个向量是可以相加的。每一个原始sift特征都可以映射到这128w维的其中一维上，图2C所示为sift特征映射方法示意图，映射方法为找到距离最近的类。

在一个实施例中，如图3所示，步骤S15可以实施为如下步骤S151-S152：

步骤S151，确定品牌中每一个商品的图像的特征向量。

步骤S152，将品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量。

通过训练数据，可以找到一个品牌所属的商品列表，将品牌中所有商品的图像的特征向量加权相加，即可作为品牌的特征向量。加权相加是因为不同的特征会有不同的权重，加以区分会有更好的效果。本专利采用TF-IDF技术作为特征权重，即某品牌下某特征的权重等于该特征的TF值乘以该特征的IDF值。

在一个实施例中，步骤S152可实施为如下方式：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中Weight(feature|brand)为品牌特征的权重，feature为特征，brand为品牌，TF(feature|brand)为特征的TF值，IDF(feature)为特征的IDF值；

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f，b)

其中，frequency_f,b表示特征在该品牌下出现的次数；

IDF值定义为：

I D F (f e a t u r e) = l o g \frac{N}{n_{f}}

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。

本发明在计算特征向量的相似度时，采用余弦来计算两个向量的夹角，夹角越小，表示越相似。

基于同一发明构思，本发明实施例还提供了一种图像识别装置，由于该装置所解决问题的原理与前述图像识别方法相似，因此该装置的实施可以参见前述方法的实施，重复之处不再赘述。

图4所示为本发明实施例中一种图像识别装置的框图，如图4所示，该装置包括：

第一获取模块41，用于获取品牌与品牌特征向量的对应关系；

第二获取模块42，用于获取待识别图像的特征向量；

输出模块43，用于将待识别图像的特征向量和品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。

本发明实施例的上述装置，通过获取品牌与品牌特征向量的对应关系；获取待识别图像的特征向量；将所述待识别图像的特征向量和所述品牌特征向量进行匹配，将匹配度最高的品牌特征向量对应的品牌作为结果输出。从而不需要文本信息，通过图像就可以识别商品的品牌，在文本中不包含品牌的情况下，也可以识别出商品的品牌。

在一个实施例中，如图5所示，上述装置还可包括：

确定模块44，用于利用特征聚类算法确定图像所对应的品牌、图像的特征以及特征分别对应的权重；

组成模块45，用于根据图像的特征和特征分别对应的权重组成品牌特征向量。

在一个实施例中，如图6所示，组成模块45，可包括：

确定子模块451，用于确定品牌中每一个商品的图像的特征向量；

组成子模块452，用于将品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量。

在一个实施例中，组成子模块452，可包括：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f，b)

其中，frequency_f,b表示特征在该品牌下出现的次数；

IDF值定义为：

I D F (f e a t u r e) = l o g \frac{N}{n_{f}}

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种图像识别方法，其特征在于，包括：

获取品牌与品牌特征向量的对应关系；

获取待识别图像的特征向量；

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

3.如权利要求2所述的方法，其特征在于，所述根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量，包括：

确定所述品牌中每一个商品的图像的特征向量；

4.如权利要求3所述的方法，其特征在于，所述将所述品牌中所有商品的图像的特征向量加权相加，作为品牌特征向量，包括：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f,b)

其中，frequency_f,b表示所述特征在该品牌下出现的次数；

IDF值定义为：

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。

5.一种图像识别装置，其特征在于，包括：

第一获取模块，用于获取品牌与品牌特征向量的对应关系；

第二获取模块，用于获取待识别图像的特征向量；

6.如权利要求5所述的装置，其特征在于，所述装置还包括：

7.如权利要求6所述的装置，其特征在于，所述组成模块，包括：

8.如权利要求7所述的装置，其特征在于，所述组成子模块，包括：

按照下列公式确定品牌特征的权重：

Weight(feature|brand)＝TF(feature|brand)*IDF(feature)

其中，TF值为：

TF(feature|brand)＝1+log(frequency_f,b)

其中，frequency_f,b表示所述特征在该品牌下出现的次数；

IDF值定义为：

其中，N表示商品总数，n_f表示该特征在全局出现的总次数；

根据品牌特征和品牌特征的权重确定品牌特征向量。