CN106056133A - 一种图像识别方法及装置 - Google Patents

一种图像识别方法及装置 Download PDF

Info

Publication number
CN106056133A
CN106056133A CN201610338118.4A CN201610338118A CN106056133A CN 106056133 A CN106056133 A CN 106056133A CN 201610338118 A CN201610338118 A CN 201610338118A CN 106056133 A CN106056133 A CN 106056133A
Authority
CN
China
Prior art keywords
brand
feature
image
vector
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610338118.4A
Other languages
English (en)
Inventor
高云翔
孟蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wireless Living (hangzhou) Mdt Infotech Ltd
Original Assignee
Wireless Living (hangzhou) Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wireless Living (hangzhou) Mdt Infotech Ltd filed Critical Wireless Living (hangzhou) Mdt Infotech Ltd
Priority to CN201610338118.4A priority Critical patent/CN106056133A/zh
Publication of CN106056133A publication Critical patent/CN106056133A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别方法及装置,涉及图像处理技术领域。该方法包括:获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。本发明不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。

Description

一种图像识别方法及装置
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像识别方法及装置。
背景技术
品牌识别是购物平台数据挖掘中的基础问题。传统的思路一般专注于商品描述本身,通过文本挖掘算法找到商品描述中的品牌词。然而有一些购物平台,很多卖家并未在商品描述中填写其品牌词,只有图片和很简短的文字介绍。
现有技术专注于文本领域,在一些购物平台重视图片的产品形态下,品牌识别覆盖率难以提升。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像识别方法及装置。
本发明提供一种图像识别方法,包括:
获取品牌与品牌特征向量的对应关系;
获取待识别图像的特征向量;
将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
在一个实施例中,所述方法还可包括:
利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;
根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。
在一个实施例中,所述根据所述图像的特征和所述特征分别对应的权重组 成品牌特征向量,可包括:
确定所述品牌中每一个商品的图像的特征向量;
将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
在一个实施例中,将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量,可包括:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示所述特征在该品牌下出现的次数;
IDF值定义为:
I D F ( f e a t u r e ) = l o g N n f
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
本发明还提供一种图像识别装置,包括:
第一获取模块,用于获取品牌与品牌特征向量的对应关系;
第二获取模块,用于获取待识别图像的特征向量;
输出模块,用于将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
在一个实施例中,所述装置还可包括:
确定模块,用于利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;
组成模块,用于根据所述图像的特征和所述特征分别对应的权重组成品牌 特征向量。
在一个实施例中,所述组成模块,可包括:
确定子模块,用于确定所述品牌中每一个商品的图像的特征向量;
组成子模块,用于将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
在一个实施例中,所述组成子模块,可包括:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示所述特征在该品牌下出现的次数;
IDF值定义为:
I D F ( f e a t u r e ) = l o g N n f
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明实施例的上述技术方案,通过获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。从而不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可 通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种图像识别方法的流程图;
图2A为本发明实施例中另一种图像识别方法的流程图;
图2B为原始sift特征示意图;
图2C为将原始sift特征映射到128w维的示意图;
图3为本发明实施例中一种图像识别方法中步骤S15的流程图;
图4为本发明实施例中一种图像识别装置的框图;
图5为本发明实施例中另一种图像识别装置的框图;
图6为本发明实施例中一种图像识别装置中组成模块45的框图.
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1所示为本发明实施例中一种图像识别方法的流程图,如图1所示,包括以下步骤S11-S13:
步骤S11,获取品牌与品牌特征向量的对应关系。
步骤S12,获取待识别图像的特征向量。
步骤S13,将待识别图像的特征向量和品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
在步骤S11之前,先获取一定的数据进行训练,这些数据可以从商品的图 像以及商品的描述信息都很完备的购物平台获取。比如某一惠氏品牌的商品,商品属性页中有对应的品牌信息,品牌:Wyeth/惠氏。利用图像特征提取技术,可以将图像的特征与品牌进行对应。
利用大量的训练数据,可以知道每一个品牌所对应的图像特征以及其权重,利用这些特征可以组成特征向量,本发明利用特征聚类技术,每一个品牌均可以得到一个128w维的特征向量。利用上述步骤提取的品牌和品牌特征向量,可以对商品进行品牌预测:首先提取商品对应的图像的特征并且组成特征向量,再和品牌特征向量进行匹配,匹配度最高的品牌作为预测结果输出。
本发明利用大量的数据进行训练,然后进行品牌匹配,最后把匹配最大值作为品牌预测值输出。从而不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。
在一个实施例中,如图2A所示,上述方法还可包括步骤S14-S15:
步骤S14,利用特征聚类算法确定图像所对应的品牌、图像的特征以及特征分别对应的权重。
步骤S15,根据图像的特征和特征分别对应的权重组成品牌特征向量。
利用特征聚类技术,可以将特征维度控制在128w维,有效地减少计算复杂度。每一个sift特征都可以找到其所属类别,从而映射到128w维中得一维上。该技术利用聚类算法在不同子空间中搜索簇群,使具有较强依赖关系(存在冗余性)的特征被划分到同一个簇群中,然后从每一个簇群中挑选具有代表性的子集共同构成特征子集,最终达到去除不相关特征和冗余特征的目的。
如图2B所示,原始的sift(Scale-invariant feature transform,即尺度不变特征变换)特征可以看作空间中的一个点,通过将相近的点合并,可以得到128w个类,每个类即为一维。sift是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。sift特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而 且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用sift特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的sift物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。sift特征的信息量大,适合在海量数据库中快速准确匹配。
本发明在sift特征基础上进行二次处理,通过聚类技术和TF-IDF进行品牌特征向量化。
传统的sift特征是一个100多维的浮点数向量,平均每个图像可以提取200个左右的sift特征,但是sift向量不可相加,并不适合本发明碰到的问题。
通过聚类技术,将所有图像提取的特征进行聚类,并且设置聚类类别总数为128万。这样可以得到128w维的向量,并且这个向量是可以相加的。每一个原始sift特征都可以映射到这128w维的其中一维上,图2C所示为sift特征映射方法示意图,映射方法为找到距离最近的类。
在一个实施例中,如图3所示,步骤S15可以实施为如下步骤S151-S152:
步骤S151,确定品牌中每一个商品的图像的特征向量。
步骤S152,将品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
通过训练数据,可以找到一个品牌所属的商品列表,将品牌中所有商品的图像的特征向量加权相加,即可作为品牌的特征向量。加权相加是因为不同的特征会有不同的权重,加以区分会有更好的效果。本专利采用TF-IDF技术作为特征权重,即某品牌下某特征的权重等于该特征的TF值乘以该特征的IDF值。
在一个实施例中,步骤S152可实施为如下方式:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为 品牌,TF(feature|brand)为特征的TF值,IDF(feature)为特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示特征在该品牌下出现的次数;
IDF值定义为:
I D F ( f e a t u r e ) = l o g N n f
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
本发明在计算特征向量的相似度时,采用余弦来计算两个向量的夹角,夹角越小,表示越相似。
基于同一发明构思,本发明实施例还提供了一种图像识别装置,由于该装置所解决问题的原理与前述图像识别方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
图4所示为本发明实施例中一种图像识别装置的框图,如图4所示,该装置包括:
第一获取模块41,用于获取品牌与品牌特征向量的对应关系;
第二获取模块42,用于获取待识别图像的特征向量;
输出模块43,用于将待识别图像的特征向量和品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
本发明实施例的上述装置,通过获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。从而不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。
在一个实施例中,如图5所示,上述装置还可包括:
确定模块44,用于利用特征聚类算法确定图像所对应的品牌、图像的特征 以及特征分别对应的权重;
组成模块45,用于根据图像的特征和特征分别对应的权重组成品牌特征向量。
在一个实施例中,如图6所示,组成模块45,可包括:
确定子模块451,用于确定品牌中每一个商品的图像的特征向量;
组成子模块452,用于将品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
在一个实施例中,组成子模块452,可包括:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为特征的TF值,IDF(feature)为特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示特征在该品牌下出现的次数;
IDF值定义为:
I D F ( f e a t u r e ) = l o g N n f
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种图像识别方法,其特征在于,包括:
获取品牌与品牌特征向量的对应关系;
获取待识别图像的特征向量;
将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;
根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。
3.如权利要求2所述的方法,其特征在于,所述根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量,包括:
确定所述品牌中每一个商品的图像的特征向量;
将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
4.如权利要求3所述的方法,其特征在于,所述将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量,包括:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示所述特征在该品牌下出现的次数;
IDF值定义为:
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
5.一种图像识别装置,其特征在于,包括:
第一获取模块,用于获取品牌与品牌特征向量的对应关系;
第二获取模块,用于获取待识别图像的特征向量;
输出模块,用于将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
确定模块,用于利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;
组成模块,用于根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。
7.如权利要求6所述的装置,其特征在于,所述组成模块,包括:
确定子模块,用于确定所述品牌中每一个商品的图像的特征向量;
组成子模块,用于将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。
8.如权利要求7所述的装置,其特征在于,所述组成子模块,包括:
按照下列公式确定品牌特征的权重:
Weight(feature|brand)=TF(feature|brand)*IDF(feature)
其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;
其中,TF值为:
TF(feature|brand)=1+log(frequencyf,b)
其中,frequencyf,b表示所述特征在该品牌下出现的次数;
IDF值定义为:
其中,N表示商品总数,nf表示该特征在全局出现的总次数;
根据品牌特征和品牌特征的权重确定品牌特征向量。
CN201610338118.4A 2016-05-19 2016-05-19 一种图像识别方法及装置 Pending CN106056133A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610338118.4A CN106056133A (zh) 2016-05-19 2016-05-19 一种图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610338118.4A CN106056133A (zh) 2016-05-19 2016-05-19 一种图像识别方法及装置

Publications (1)

Publication Number Publication Date
CN106056133A true CN106056133A (zh) 2016-10-26

Family

ID=57176477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610338118.4A Pending CN106056133A (zh) 2016-05-19 2016-05-19 一种图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN106056133A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304871A (zh) * 2018-01-30 2018-07-20 努比亚技术有限公司 图片分类方法、终端及计算机可读存储介质
CN111199439A (zh) * 2018-11-16 2020-05-26 阿里巴巴集团控股有限公司 一种商品信息处理方法及其装置
CN112036421A (zh) * 2019-05-16 2020-12-04 搜狗(杭州)智能科技有限公司 一种图像处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440494A (zh) * 2013-07-04 2013-12-11 中国科学院自动化研究所 一种基于视觉显著性分析的恐怖图像识别方法及系统
CN104517113A (zh) * 2013-09-29 2015-04-15 浙江大华技术股份有限公司 一种图像的特征提取方法、图像的分类方法及相关装置
CN105512684A (zh) * 2015-12-09 2016-04-20 江苏大为科技股份有限公司 基于主成分分析卷积神经网络的车标自动识别方法
CN105574490A (zh) * 2015-12-10 2016-05-11 金鹏电子信息机器有限公司 基于车前灯图像特征的车辆品牌识别方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440494A (zh) * 2013-07-04 2013-12-11 中国科学院自动化研究所 一种基于视觉显著性分析的恐怖图像识别方法及系统
CN104517113A (zh) * 2013-09-29 2015-04-15 浙江大华技术股份有限公司 一种图像的特征提取方法、图像的分类方法及相关装置
CN105512684A (zh) * 2015-12-09 2016-04-20 江苏大为科技股份有限公司 基于主成分分析卷积神经网络的车标自动识别方法
CN105574490A (zh) * 2015-12-10 2016-05-11 金鹏电子信息机器有限公司 基于车前灯图像特征的车辆品牌识别方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱旭锋.: "基于图像不变量特征的自动目标识别技术研究", 《中国博士学位论文全文数据库 信息科技辑》 *
蒋健.: "文本分类中特征提取和特征加权方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304871A (zh) * 2018-01-30 2018-07-20 努比亚技术有限公司 图片分类方法、终端及计算机可读存储介质
CN111199439A (zh) * 2018-11-16 2020-05-26 阿里巴巴集团控股有限公司 一种商品信息处理方法及其装置
CN111199439B (zh) * 2018-11-16 2023-04-14 阿里巴巴集团控股有限公司 一种商品信息处理方法及其装置
CN112036421A (zh) * 2019-05-16 2020-12-04 搜狗(杭州)智能科技有限公司 一种图像处理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
US9098773B2 (en) System and method of detecting objects in scene point cloud
EP2808827B1 (en) System and method for OCR output verification
Uijlings et al. Real-time bag of words, approximately
US9158995B2 (en) Data driven localization using task-dependent representations
Grana et al. A fast approach for integrating ORB descriptors in the bag of words model
CN102324047B (zh) 基于稀疏核编码skr的高光谱图像地物识别方法
US8260062B2 (en) System and method for identifying document genres
US10373014B2 (en) Object detection method and image search system
Tabia et al. Compact vectors of locally aggregated tensors for 3D shape retrieval
CN113378710B (zh) 图像文件的版面分析方法、装置、计算机设备和存储介质
Wang et al. A deep semantic framework for multimodal representation learning
Xu et al. Near duplicate identification with spatially aligned pyramid matching
Iakovidou et al. Localizing global descriptors for content-based image retrieval
Gonzalez-Diaz et al. Neighborhood matching for image retrieval
Yan et al. Chinese text location under complex background using Gabor filter and SVM
US20150294194A1 (en) Method of classifying a multimodal object
US9870517B2 (en) Image object retrieval
CN106056133A (zh) 一种图像识别方法及装置
Yörük et al. An efficient Hough transform for multi-instance object recognition and pose estimation
Úbeda et al. Improving pattern spotting in historical documents using feature pyramid networks
En et al. Pattern localization in historical document images via template matching
Chatzilari et al. A comparative study on mobile visual recognition
CN108229498B (zh) 一种拉链片识别方法、装置及设备
Amelio Approximate matching in ACSM dissimilarity measure
Anvaripour et al. Accurate object detection using local shape descriptors

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161026