CN107895021B - 图像识别方法及装置、计算机装置和计算机可读存储介质 - Google Patents

图像识别方法及装置、计算机装置和计算机可读存储介质 Download PDF

Info

Publication number
CN107895021B
CN107895021B CN201711133055.XA CN201711133055A CN107895021B CN 107895021 B CN107895021 B CN 107895021B CN 201711133055 A CN201711133055 A CN 201711133055A CN 107895021 B CN107895021 B CN 107895021B
Authority
CN
China
Prior art keywords
image
region
database
query image
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711133055.XA
Other languages
English (en)
Other versions
CN107895021A (zh
Inventor
杨茜
牟永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN201711133055.XA priority Critical patent/CN107895021B/zh
Publication of CN107895021A publication Critical patent/CN107895021A/zh
Priority to PCT/CN2018/112760 priority patent/WO2019095998A1/zh
Application granted granted Critical
Publication of CN107895021B publication Critical patent/CN107895021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种图像识别方法,所述方法包括:对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;根据所述相似系数确定查询图像与数据库图像是否匹配。本发明还提供一种图像识别装置、计算机装置及可读存储介质。本发明可以实现高速高准确率高鲁棒性的图像识别。

Description

图像识别方法及装置、计算机装置和计算机可读存储介质
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种图像识别方法及装置、计算机装置和计算机可读存储介质。
背景技术
图像的特征包括颜色特征、纹理特征和形状特征等。其中颜色特征是最具分辨力的特征。Gray and Tao使用AdaBoost方法从颜色特征和纹理特征中验证得到,颜色特征所占的权重超过整体的75%。通常使用的颜色特征并不包含图像的空间位置信息,尽管颜色特征的识别性最佳,但是丢失空间位置信息会造成一定的识别误判,从而影响识别的准确性。而包含空间位置信息的颜色特征常常会有维数过高,计算复杂度较高且准确率和鲁棒性易受到影响等问题。常用的表征图像空间位置信息的是形状上下文特征,然而,现有的形状上下文特征需要使用对应部分的所有点作为基准,运算量大且易受杂散点影响。
发明内容
鉴于以上内容,有必要提出一种图像识别方法及装置、计算机装置和计算机可读存储介质,其可以实现高速高准确率高鲁棒性的图像识别。
本申请的第一方面提供一种图像识别方法,所述方法包括:
对查询图像与数据库图像进行区域划分;
计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;
根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;
对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;
根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;
根据所述相似系数确定查询图像与数据库图像是否匹配。
另一种可能的实现方式中,所述查询图像与数据库图像是人物图像,所述对查询图像与数据库图像进行区域划分包括:
按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。
另一种可能的实现方式中,所述对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征包括:
对于查询图像,以查询图像的每个区域的聚类中心为参考点,以查询图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图;对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,以数据库图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。
另一种可能的实现方式中,所述根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数包括:
计算查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征的直方图相交值,以所述直方图相交值作为查询图像与数据库图像的相似系数
另一种可能的实现方式中,所述根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数还包括:
将使用二维直方图相交法计算得到的查询图像与数据库图像的相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。
本申请的第二方面提供一种图像识别装置,所述装置包括:
区域划分单元,用于对查询图像与数据库图像进行区域划分;
坐标计算单元,用于计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;
聚类单元,用于根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;
特征计算单元,用于对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;
相似系数计算单元,用于根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;
匹配单元,用于根据所述相似系数确定查询图像与数据库图像是否匹配。
另一种可能的实现方式中,所述查询图像与数据库图像包括人物图像,所述区域划分单元具体用于:
按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。
另一种可能的实现方式中,所述特征计算单元具体用于:
使用对数相对RGB坐标差对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征。
本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述图像识别方法。
本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述图像识别方法。
本发明对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;根据所述相似系数确定查询图像与数据库图像是否匹配。本发明利用对数相对RGB坐标进行图像识别,不同姿态和拍摄角度得到的对数相对RGB坐标分布非常相似,因而对姿态和角度的鲁棒性较好,从而增加了图像识别的鲁棒性。本发明利用形状上下文特征(即部分形状上下文特征)进行图像识别,增加了图像的空间信息,克服了丢失空间信息造成识别误判的缺陷,提高了图像识别的准确率。此外,本发明根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数,减小了数据运算量,降低运算复杂度。因此,本发明可以实现高速高准确率高鲁棒性的图像识别。
附图说明
图1是本发明实施例一提供的图像识别方法的流程图。
图2是图像的对数相对RGB坐标分布图。
图3是对图像计算以每个聚类中心为参考点的部分形状上下文特征的示意图。
图4是本发明实施例二提供的图像识别装置的结构图。
图5是本发明实施例三提供的计算机装置的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
优选地,本发明的图像识别方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一
图1是本发明实施例一提供的图像识别方法的流程图。所述图像识别方法应用于计算机装置。
如图1所示,所述图像识别方法具体包括以下步骤:
101:对查询图像与数据库图像进行区域划分。
查询图像是需要识别或匹配的图像,数据库图像是预先建立的图像库中的图像。所述图像识别方法是将查询图像与数据库图像进行比较,确定查询图像与数据库图像是否匹配,以确认查询图像中的内容与数据库图像中的内容是否一致。例如,当进行行人识别时,道路上摄像头拍摄到的行人图像为查询图像,交管系统的人像库图像为数据库图像,根据行人图像与人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。
数据库图像通常与特定信息(例如个人身份信息)相关联。根据匹配结果,可以获得查询图像的相关信息(例如个人身份信息)。例如,当进行行人识别时,若行人图像与人像库图像匹配,则将人像库图像对应的个人身份信息作为行人图像中人物的个人身份信息。
所述图像识别方法可以应用于各个领域,如视频监控、产品检测、医学诊断等。例如,在交通监控中,可以利用本发明进行行人识别、司机识别、车辆识别等。
对查询图像与数据库图像进行区域划分时,采用相同的划分方法。例如,将查询图像和数据库图像各自划分为上下两个区域或者左右两个区域。
在本实施例中,所述图像识别方法用于人物识别(例如行人识别),查询图像与数据库图像是人物图像,可以将查询图像与数据库图像按照图像中的人物形体各自划分为上下两个区域。上区域对应人物的上半身,下区域对应人物的下半身。例如,将查询图像划分为上区域R1和下区域R2,将数据库图像划分为上区域R1′和下区域R2′。当图像中的人物为直立人物时,由于直立人物的比例大致类似但姿态和动作不同,根据图像中人物的形体进行上下区域的划分会有更高的鲁棒性。同时,最具颜色特征的人物服装通常为上衣下衣,因此将人物图像划分为上下两个区域。
在对人物图像进行两个区域的划分时,可以根据经验值确定划分的位置,例如按照人体上下身的黄金比例进行划分。或者,可以识别人物图像中人物的上装与下装的分界处,从该分界处进行划分。
可以理解,可以以其他方式对查询图像与数据库图像进行区域划分。例如,可以采用金字塔模型对查询图像与数据库图像进行区域划分。
可以将查询图像与数据库图像各自划分为两个区域,也可以将查询图像与数据库图像各自划分为多于两个区域,例如各自划分为三个区域或四个区域。
102:计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标。
在本实施例中,红色分量为Ri、绿色分量为Gi、蓝色分量为Bi的像素点i的对数相对RGB坐标为(xi,yi),其中可以取以e为底的对数,即或者,可以取以其他值为底的对数,例如取以10为底的对数。
为横轴,为纵轴,可以得到查询图像与数据库图像的对数相对RGB坐标分布图。当本发明图像识别方法用于人物识别时,若人物图像中人物上下身服装颜色差异较大,则人物图像的上区域(对应人物的上半身)的像素点对应的对数相对RGB坐标与人物图像的下区域(对应人物的下半身)的对数相对RGB坐标往往分布在两个不同区域,因而通常会得到两个中心的坐标簇。
图2是图像的对数相对RGB坐标分布图。图2中,图像划分为R1与R2两个区域(例如查询图像划分为上区域R1和下区域R2),其中,20是区域R1的像素点的对数相对RGB坐标分布,21是区域R2的像素点的对数相对RGB坐标分布。
利用对数相对RGB坐标进行图像识别,不同姿态和拍摄角度得到的对数相对RGB坐标分布非常相似,因而对姿态和角度的鲁棒性较好,从而增加了图像识别的鲁棒性。
103:根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心。
例如,对查询图像的上区域R1和下区域R2的像素点进行聚类,得到查询图像的上区域R1的聚类中心(x1,y1)和下区域R2的聚类中心(x2,y2);对数据库图像的上区域R1′和下区域R2′的像素点进行聚类,得到查询图像的上区域R1′的聚类中心(x1′,y1′)和下区域R2′的聚类中心(x2′,y2′)。
参阅图2所示,根据区域R1的每个像素点的对数相对RGB坐标对区域R1的像素点进行聚类,得到区域R1的聚类中心22;根据区域R2的每个像素点的对数相对RGB坐标对区域R2的像素点进行聚类,得到区域R2的聚类中心23。
可以使用GMM(Gaussian Mixture Model,高斯混合模型)或K-Means算法对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像和数据库图像的每个区域的聚类中心。例如,使用聚类中心数为2的高斯混合模型GMM或K-Means算法得到查询图像的上区域R1的聚类中心(x1,y1)和下区域R2的聚类中心(x2,y2),得到数据库图像的上区域R1′的聚类中心(x1′,y1′)和下区域R2′的聚类中心(x2′,y2′)。
还可以使用其他的聚类算法对查询图像与数据库图像的每个区域内的像素点进行聚类。例如,使用DBSCAN(Density-Based Spatial Clustering of Applications withNoise,具有噪声的基于密度的聚类方法)算法对查询图像与数据库图像的每个区域内的像素点进行聚类。
104:对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征。
在本实施例中,所述部分形状上下文特征可以是对数角度二维分布直方图。具体地,对于查询图像,以查询图像的每个区域的聚类中心为参考点,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图。对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。
例如,对于划分为上区域R1和下区域R2的查询图像,以上区域R1的聚类中心(x1,y1)为参考点,求取上区域R1的聚类中心(x1,y1)与下区域R2的像素点构成的对数角度二维分布直方图HQ1(r,θ);以下区域R2的聚类中心(x2,y2)为参考点,求取下区域R2的聚类中心(x2,y2)与上区域R1的像素点构成的对数角度二维分布直方图HQ2(r,θ)。对于划分为上区域R1′和下区域R2′的数据库图像,以上区域R1′的聚类中心(x1′,y1′)为参考点,求取上区域R1′的聚类中心(x1′,y1′)与下区域R2′的像素点构成的对数角度二维分布直方图HD1(r,θ);以下区域R2′的聚类中心(x2′,y2′)为参考点,求取下区域R2′的聚类中心(x2′,y2′)上区域R1′的像素点构成的对数角度二维分布直方图HD2(r,θ)。
又如,对于划分为三个区域(包括第一区域、第二区域与第三区域)的查询图像/数据库图像,以第一区域的聚类中心为参考点,求取第一区域的聚类中心与第二区域的像素点构成的对数角度二维分布直方图以及与第三区域的像素点构成的对数角度二维分布直方图;以第二区域的聚类中心为参考点,求取第二区域的聚类中心与第一区域的像素点构成的对数角度二维分布直方图以及与第三区域的像素点构成的对数角度二维分布直方图;以第三区域的聚类中心为参考点,求取第三区域的聚类中心与第一区域的像素点构成的对数角度二维分布直方图以及与第二区域的像素点构成的对数角度二维分布直方图。
图3是对图像计算以每个聚类中心为参考点的部分形状上下文特征的示意图。其中,30是以区域R1的聚类中心为参考点(即中心)得到的点分布图,31是以区域R2的聚类中心为参考点(即中心)得到的点分布图,32是区域R1的聚类中心与区域R2的像素点构成的对数角度二维分布直方图,33是区域R2的聚类中心与区域R1的像素点构成的对数角度二维分布直方图。
在本实施例中,为了提高识别准确率,在对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征时,使用对数相对RGB坐标差进行计算。使用对数相对RGB坐标差计算的部分形状上下文特征不受光照强度影响,不同光照强度计算得到的形状上下文特征相同,从而提高识别准确率。具体说明如下:
基于光照强度的对角线模型:
其中表示光照强度为c时像素点对应的R、G、B值,表示光照强度为o时像素点对应的R、G、B值,表示系数。
不同光照强度条件下的对数相对RGB坐标可以表示为:
因此,为了使得最终提取的部分形状上下文特征不受光照强度影响,采用具有光照强度不变性的对数相对RGB坐标差进行部分形状上下文特征的计算。因为,根据对角线模型,同一图像两点之间的对数相对RGB坐标差在不同光照强度下依然相同:
其中表示不同光照强度条件下的对数相对RGB坐标差为常数项,具有光照不变性。
具体地,对于查询图像,以查询图像的每个区域的聚类中心为参考点,以查询图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图。对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,以数据库图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。使用对数相对RGB坐标差计算的对数角度二维分布直方图不受光照强度影响,不同光照强度计算得到的对数角度二维分布直方图相同,从而提高识别准确率。
105:根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数。
在本实施例中,可以使用二维直方图相交法计算查询图像与数据库图像的相似系数。即计算查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征的直方图相交值,以所述直方图相交值作为查询图像与数据库图像的相似系数。
例如,对于划分为上区域R1和下区域R2的查询图像和划分为上区域R1′和下区域R2′的数据库图像,使用如下公式计算查询图像与数据库图像的相似系数:
在其他的实施例中,可以使用其他方法计算查询图像与数据库图像的相似系数。例如,可以通过计算直方图距离(例如欧氏距离)获得查询图像与数据库图像的相似系数。
由于不是根据查询图像与数据库图像的每个点的形状上下文特征计算查询图像与数据库图像的相似系数,而是根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数,因而减小了数据运算量,降低运算复杂度。例如,上述采用二维直方图相交法计算查询图像与数据库图像的相似系数仅需要计算一次查询图像与数据库图像的相交矩阵,无需计算规模庞大的C矩阵及其最小路径距离等。
考虑到HQi(r,θ),HDi(r,θ)仅包含了相对颜色信息,并没有绝对颜色,因此,在本实施例中,可以将得到的相似性系数P’(Q,D)除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数:
则该相似系数既包含了颜色的空间信息,也考虑了绝对坐标(即绝对颜色)的差值。不同颜色计算得到相对颜色可能相同,而绝对颜色不同,在计算相似系数时考虑绝对颜色可以进一步提高识别的准确率。
类似地,若使用其他方法计算查询图像与数据库图像的相似系数,则将计算得到的相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。例如,通过计算直方图距离(例如欧氏距离)获得查询图像与数据库图像的相似系数,将该相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。
106:根据查询图像与数据库图像的相似系数确定查询图像与数据库图像是否匹配。
例如,当进行行人识别时,根据摄像头拍摄到的行人图像与交管系统的人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。
可以判断查询图像与数据库图像的相似系数是否大于或等于预设系数,若查询图像与数据库图像的相似系数大于或等于预设系数,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的相似系数小于预设系数,则判断查询图像与数据库图像不匹配。
或者,可以判断查询图像与数据库图像的相似系数是否大于查询图像与其他数据库图像的相似系数,若查询图像与其他数据库图像的相似系数大于查询图像与其他数据库图像的相似系数,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的相似系数不大于查询图像与其他数据库图像的相似系数,则判断查询图像与数据库图像不匹配。
实施例一的图像识别方法对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;根据所述相似系数确定查询图像与数据库图像是否匹配。实施例一的图像识别方法利用对数相对RGB坐标进行图像识别,不同姿态和拍摄角度得到的对数相对RGB坐标分布非常相似,因而对姿态和角度的鲁棒性较好,从而增加了图像识别的鲁棒性。实施例一的图像识别方法利用形状上下文特征(即部分形状上下文特征)进行图像识别,增加了图像的空间信息,克服了丢失空间信息造成识别误判的缺陷,提高了图像识别的准确率。此外,实施例一的图像识别方法根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数,减小了数据运算量,降低运算复杂度。因此,实施例一的图像识别方法可以实现高速高准确率高鲁棒性的图像识别。
实施例二
图4为本发明实施例二提供的图像识别装置的结构图。如图4所示,所述图像识别装置10可以包括:区域划分单元401、坐标计算单元402、聚类单元403、特征计算单元404、相似系数计算单元405、匹配单元406。
区域划分单元401,用于对查询图像与数据库图像进行区域划分。
查询图像是需要识别或匹配的图像,数据库图像是预先建立的图像库中的图像。所述图像识别方法是将查询图像与数据库图像进行比较,确定查询图像与数据库图像是否匹配,以确认查询图像中的内容与数据库图像中的内容是否一。例如,当进行行人识别时,道路上摄像头拍摄到的行人图像为查询图像,交管系统的人像库图像为数据库图像,根据行人图像与人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。
数据库图像通常与特定信息(例如个人身份信息)相关联。根据匹配结果,可以获得查询图像的相关信息(例如个人身份信息)。例如,当进行行人识别时,若行人图像与人像库图像匹配,则将人像库图像对应的个人身份信息作为行人图像中人物的个人身份信息。
所述图像识别装置可以应用于各个领域,如视频监控、产品检测、医学诊断等。例如,在交通监控中,可以利用本发明进行行人识别、司机识别、车辆识别等。
对查询图像与数据库图像进行区域划分时,采用相同的划分方法。例如,将查询图像和数据库图像各自划分为上下两个区域或者左右两个区域。
在本实施例中,所述图像识别方法用于人物识别(例如行人识别),查询图像与数据库图像是人物图像,可以将查询图像与数据库图像按照图像中的人物形体各自划分为上下两个区域。上区域对应人物的上半身,下区域对应人物的下半身。例如,将查询图像划分为上区域R1和下区域R2,将数据库图像划分为上区域R1′和下区域R2′。当图像中的人物为直立人物时,由于直立人物的比例大致类似但姿态和动作不同,根据图像中人物的形体进行上下区域的划分会有更高的鲁棒性。同时,最具颜色特征的人物服装通常为上衣下衣,因此将人物图像划分为上下两个区域。
在对人物图像进行两个区域的划分时,可以根据经验值确定划分的位置,例如按照人体上下身的黄金比例进行划分。或者,可以识别人物图像中人物的上装与下装的分界处,从该分界处进行划分。
可以理解,可以以其他方式对查询图像与数据库图像进行区域划分。例如,可以采用金字塔模型对查询图像与数据库图像进行区域划分。
可以将查询图像与数据库图像各自划分为两个区域,也可以将查询图像与数据库图像各自划分为多于两个区域,例如各自划分为三个区域或四个区域。
坐标计算单元402,用于计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标。
在本实施例中,红色分量为Ri、绿色分量为Gi、蓝色分量为Bi的像素点i的对数相对RGB坐标为(xi,yi),其中可以取以e为底的对数,即或者,可以取以其他值为底的对数,例如取以10为底的对数。
为横轴,为纵轴,可以得到查询图像与数据库图像的对数相对RGB坐标分布图。当本发明图像识别方法用于人物识别时,若人物图像中人物上下身服装颜色差异较大,则人物图像的上区域(对应人物的上半身)的像素点对应的对数相对RGB坐标分布在一个区域,人物图像的下区域(对应人物的下半身)的对数相对RGB坐标分布在另一个区域,两个区域有明显间隔,因而通常会得到两个中心的坐标簇。
图2是图像的对数相对RGB坐标分布图。图2中,图像划分为R1与R2两个区域(例如查询图像划分为上区域R1和下区域R2),其中,20是区域R1的像素点的对数相对RGB坐标分布,21是区域R2的像素点的对数相对RGB坐标分布。
利用对数相对RGB坐标进行图像识别,不同姿态和拍摄角度得到的对数相对RGB坐标分布非常相似,因而对姿态和角度的鲁棒性较好,从而增加了图像识别的鲁棒性。
聚类单元403,用于根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心。
例如,对查询图像的上区域R1和下区域R2的像素点进行聚类,得到查询图像的上区域R1的聚类中心(x1,y1)和下区域R2的聚类中心(x2,y2);对数据库图像的上区域R1′和下区域R2′的像素点进行聚类,得到查询图像的上区域R1′的聚类中心(x1′,y1′)和下区域R2′的聚类中心(x2′,y2′)。
参阅图2所示,根据区域R1的每个像素点的对数相对RGB坐标对区域R1的像素点进行聚类,得到区域R1的聚类中心22;根据区域R2的每个像素点的对数相对RGB坐标对区域R2的像素点进行聚类,得到区域R2的聚类中心23。
可以使用GMM(Gaussian Mixture Model,高斯混合模型)或K-Means算法对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像和数据库图像的每个区域的聚类中心。例如,使用聚类中心数为2的高斯混合模型GMM或K-Means算法得到查询图像的上区域R1的聚类中心(x1,y1)和下区域R2的聚类中心(x2,y2),得到数据库图像的上区域R1′的聚类中心(x1′,y1′)和下区域R2′的聚类中心(x2′,y2′)。
还可以使用其他的聚类算法对查询图像与数据库图像的每个区域内的像素点进行聚类。例如,使用DBSCAN(Density-Based Spatial Clustering of Applications withNoise,具有噪声的基于密度的聚类方法)算法对查询图像与数据库图像的每个区域内的像素点进行聚类。
特征计算单元404,用于对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征。
在本实施例中,所述部分形状上下文特征可以是对数角度二维分布直方图。具体地,对于查询图像,以查询图像的每个区域的聚类中心为参考点,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图。对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。
例如,对于划分为上区域R1和下区域R2的查询图像,以上区域R1的聚类中心(x1,y1)为参考点,求取上区域R1的聚类中心(x1,y1)与下区域R2的像素点构成的对数角度二维分布直方图HQ1(r,θ);以下区域R2的聚类中心(x2,y2)为参考点,求取下区域R2的聚类中心(x2,y2)与上区域R1的像素点构成的对数角度二维分布直方图HQ2(r,θ)。对于划分为上区域R1′和下区域R2′的数据库图像,以上区域R1′的聚类中心(x1′,y1′)为参考点,求取上区域R1′的聚类中心(x1′,y1′)与下区域R2′的像素点构成的对数角度二维分布直方HD1(r,θ);以下区域R2′的聚类中心(x2′,y2′)为参考点,求取下区域R2′的聚类中心(x2′,y2′)上区域R1′的像素点构成的对数角度二维分布直HD2(r,θ)。图3是对划分为上区域R1和下区域R2的查询图像计算以每个聚类中心为参考点的部分形状上下文特征的示意图。
又如,对于划分为三个区域(包括第一区域、第二区域与第三区域)的查询图像/数据库图像,以第一区域的聚类中心为参考点,求取第一区域的聚类中心与第二区域的像素点构成的对数角度二维分布直方图以及与第三区域的像素点构成的对数角度二维分布直方图;以第二区域的聚类中心为参考点,求取第二区域的聚类中心与第一区域的像素点构成的对数角度二维分布直方图以及与第三区域的像素点构成的对数角度二维分布直方图;以第三区域的聚类中心为参考点,求取第三区域的聚类中心与第一区域的像素点构成的对数角度二维分布直方图以及与第二区域的像素点构成的对数角度二维分布直方图。
图3是对图像计算以每个聚类中心为参考点的部分形状上下文特征的示意图。其中,30是以区域R1的聚类中心为参考点(即中心)得到的点分布图,31是以区域R2的聚类中心为参考点(即中心)得到的点分布图,31是区域R1的聚类中心与区域R2的像素点构成的对数角度二维分布直方图,32是区域R2的聚类中心与区域R1的像素点构成的对数角度二维分布直方图。
在本实施例中,为了提高识别准确率,在对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征时,使用对数相对RGB坐标差进行计算。使用对数相对RGB坐标差计算的部分形状上下文特征不受光照强度影响,不同光照强度计算得到的形状上下文特征相同,从而提高识别准确率。具体说明如下:
基于光照强度的对角线模型:
其中表示光照强度为c时像素点对应的R、G、B值,表示光照强度为o时像素点对应的R、G、B值,表示系数。
不同光照强度条件下的对数相对RGB坐标可以表示为:
因此,为了使得最终提取的部分形状上下文特征不受光照强度影响,采用具有光照强度不变性的对数相对RGB坐标差进行部分形状上下文特征的计算。因为,根据对角线模型,同一图像两点之间的对数相对RGB坐标差在不同光照强度下依然相同:
其中表示不同光照强度条件下的对数相对RGB坐标差为常数项,具有光照不变性。
具体地,对于查询图像,以查询图像的每个区域的聚类中心为参考点,以查询图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图。对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,以数据库图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。使用对数相对RGB坐标差计算的对数角度二维分布直方图不受光照强度影响,不同光照强度计算得到的对数角度二维分布直方图相同,从而提高识别准确率。
相似系数计算单元405,用于根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数。
在本实施例中,可以使用二维直方图相交法计算查询图像与数据库图像的相似系数。即按照二维直方图相交法计算查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征的直方图相交值,以所述直方图相交值作为查询图像与数据库图像的相似系数。
例如,对于划分为上区域R1和下区域R2的查询图像和划分为上区域R1′和下区域R2′的数据库图像,使用如下公式计算查询图像与数据库图像的相似系数:
在其他的实施例中,可以使用其他方法计算查询图像与数据库图像的相似系数。例如,可以通过计算直方图距离获得查询图像与数据库图像的相似系数。
由于不是根据查询图像与数据库图像的每个点的形状上下文特征计算查询图像与数据库图像的相似系数,而是根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数,因而减小了数据运算量,降低运算复杂度。例如,上述采用二维直方图相交法计算查询图像与数据库图像的相似系数仅需要计算一次查询图像与数据库图像的相交矩阵,无需计算规模庞大的C矩阵及其最小路径距离等。
考虑到HQi(r,θ),HDi(r,θ)仅包含了相对颜色信息,并没有绝对颜色,因此,在本实施例中,可以将得到的相似性系数P’(Q,D)除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数:
则该相似系数既包含了颜色的空间信息,也考虑了绝对坐标(即绝对颜色)的差值。不同颜色计算得到相对颜色可能相同,而绝对颜色不同,在计算相似系数时考虑绝对颜色可以进一步提高识别的准确率。
类似地,若使用其他方法计算查询图像与数据库图像的相似系数,则将计算得到的相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。例如,通过计算直方图距离(例如欧氏距离)获得查询图像与数据库图像的相似系数,将该相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。
匹配单元406,根据查询图像与数据库图像的相似系数确定查询图像与数据库图像是否匹配。
例如,当进行行人识别时,根据摄像头拍摄到的行人图像与交管系统的人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。
可以判断查询图像与数据库图像的相似系数是否大于或等于预设系数,若查询图像与数据库图像的相似系数大于或等于预设系数,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的相似系数小于预设系数,则判断查询图像与数据库图像不匹配。
或者,可以判断查询图像与数据库图像的相似系数是否大于查询图像与其他数据库图像的相似系数,若查询图像与其他数据库图像的相似系数大于查询图像与其他数据库图像的相似系数,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的相似系数不大于查询图像与其他数据库图像的相似系数,则判断查询图像与数据库图像不匹配。
实施例二的图像识别装置对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;根据所述相似系数确定查询图像与数据库图像是否匹配。实施例二的图像识别装置利用对数相对RGB坐标进行图像识别,不同姿态和拍摄角度得到的对数相对RGB坐标分布非常相似,因而对姿态和角度的鲁棒性较好,从而增加了图像识别的鲁棒性。实施例二的图像识别装置利用形状上下文特征(即部分形状上下文特征)进行图像识别,增加了图像的空间信息,克服了丢失空间信息造成识别误判的缺陷,提高了图像识别的准确率。此外,实施例二的图像识别装置根据查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征计算查询图像与数据库图像的相似系数,减小了数据运算量,降低运算复杂度。因此,实施例二的图像识别装置可以实现高速高准确率高鲁棒性的图像识别。
实施例三
图5为本发明实施例三提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如图像识别程序。所述处理器30执行所述计算机程序40时实现上述图像识别方法实施例中的步骤,例如图1所示的步骤101~106。或者,所述处理器30执行所述计算机程序40时实现上述装置实施例中各模块/单元的功能,例如图4中的单元401~406。
示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图4中的区域划分单元401、坐标计算单元402、聚类单元403、特征计算单元404、相似系数计算单元405、匹配单元406,各单元具体功能参见实施例二。
所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图5仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种图像识别方法,其特征在于,所述方法包括:
对查询图像与数据库图像进行区域划分;
计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标,红色分量为Ri、绿色分量为Gi、蓝色分量为Bi的像素点i的对数相对RGB坐标为(xi,yi),其中
根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;
对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;
根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;
根据所述相似系数确定查询图像与数据库图像是否匹配。
2.如权利要求1所述的方法,其特征在于,所述查询图像与数据库图像是人物图像,所述对查询图像与数据库图像进行区域划分包括:
按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。
3.如权利要求1所述的方法,其特征在于,所述对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征包括:
对于查询图像,以查询图像的每个区域的聚类中心为参考点,以查询图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图;对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,以数据库图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数包括:
计算查询图像与数据库图像以每个聚类中心为参考点的部分形状上下文特征的直方图相交值,以所述直方图相交值作为查询图像与数据库图像的相似系数。
5.如权利要求4所述的方法,其特征在于,所述根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数还包括:
将使用二维直方图相交法计算得到的查询图像与数据库图像的相似系数除以查询图像与数据库图像对应聚类中心的距离作为所述相似系数。
6.一种图像识别装置,其特征在于,所述装置包括:
区域划分单元,用于对查询图像与数据库图像进行区域划分;
坐标计算单元,用于计算查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标,红色分量为Ri、绿色分量为Gi、蓝色分量为Bi的像素点i的对数相对RGB坐标为(xi,yi),其中
聚类单元,用于根据查询图像与数据库图像的每个区域的每个像素点的对数相对RGB坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;
特征计算单元,用于对查询图像与数据库图像分别计算以每个聚类中心为参考点的部分形状上下文特征;
相似系数计算单元,用于根据所述部分形状上下文特征计算查询图像与数据库图像的相似系数;
匹配单元,用于根据所述相似系数确定查询图像与数据库图像是否匹配。
7.如权利要求6所述的装置,其特征在于,所述查询图像与数据库图像包括人物图像,所述区域划分单元具体用于:
按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。
8.如权利要求6所述的装置,其特征在于,所述特征计算单元具体用于:
对于查询图像,以查询图像的每个区域的聚类中心为参考点,以查询图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与查询图像的其他每个区域的像素点构成的对数角度二维分布直方图;对于数据库图像,以数据库图像的每个区域的聚类中心为参考点,以数据库图像的其他每个区域的像素点与所述聚类中心的对数相对RGB坐标差作为所述像素点的坐标,求取该区域的聚类中心与数据库图像的其他每个区域的像素点构成的对数角度二维分布直方图。
9.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一项所述图像识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述图像识别方法。
CN201711133055.XA 2017-11-15 2017-11-15 图像识别方法及装置、计算机装置和计算机可读存储介质 Active CN107895021B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711133055.XA CN107895021B (zh) 2017-11-15 2017-11-15 图像识别方法及装置、计算机装置和计算机可读存储介质
PCT/CN2018/112760 WO2019095998A1 (zh) 2017-11-15 2018-10-30 图像识别方法及装置、计算机装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711133055.XA CN107895021B (zh) 2017-11-15 2017-11-15 图像识别方法及装置、计算机装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107895021A CN107895021A (zh) 2018-04-10
CN107895021B true CN107895021B (zh) 2019-12-17

Family

ID=61805531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711133055.XA Active CN107895021B (zh) 2017-11-15 2017-11-15 图像识别方法及装置、计算机装置和计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN107895021B (zh)
WO (1) WO2019095998A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107895021B (zh) * 2017-11-15 2019-12-17 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质
CN109446408B (zh) * 2018-09-19 2021-01-26 北京京东尚科信息技术有限公司 检索相似数据的方法、装置、设备及计算机可读存储介质
CN110689046A (zh) * 2019-08-26 2020-01-14 深圳壹账通智能科技有限公司 图像识别方法、装置、计算机装置及存储介质
CN111708907B (zh) * 2020-06-11 2023-07-18 中国建设银行股份有限公司 一种目标人员的查询方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6751354B2 (en) * 1999-03-11 2004-06-15 Fuji Xerox Co., Ltd Methods and apparatuses for video segmentation, classification, and retrieval using image class statistical models
CN104915673B (zh) * 2014-03-11 2018-09-11 株式会社理光 一种基于视觉词袋模型的目标分类方法和系统
CN107895021B (zh) * 2017-11-15 2019-12-17 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质
CN107871143B (zh) * 2017-11-15 2019-06-28 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于形状上下文的图像内容检索方法研究;夏荣进;《中国优秀硕士学位论文全文数据库信息科技辑》;20120731;I138-1737 *
聚类方法在图像识别中的应用;沈建平等;《计算机应用》;20031031;第23卷(第10期);第52页 *

Also Published As

Publication number Publication date
CN107895021A (zh) 2018-04-10
WO2019095998A1 (zh) 2019-05-23

Similar Documents

Publication Publication Date Title
CN108121986B (zh) 目标检测方法及装置、计算机装置和计算机可读存储介质
CN109918969B (zh) 人脸检测方法及装置、计算机装置和计算机可读存储介质
CN106682598B (zh) 一种基于级联回归的多姿态的人脸特征点检测方法
CN107895021B (zh) 图像识别方法及装置、计算机装置和计算机可读存储介质
Hu et al. Fast detection of multiple objects in traffic scenes with a common detection framework
CN104572804B (zh) 一种视频物体检索的方法及其系统
US8750573B2 (en) Hand gesture detection
US8792722B2 (en) Hand gesture detection
US10885660B2 (en) Object detection method, device, system and storage medium
Kim et al. Color–texture segmentation using unsupervised graph cuts
WO2019095997A1 (zh) 图像识别方法及装置、计算机装置和计算机可读存储介质
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN108021908B (zh) 人脸年龄段识别方法及装置、计算机装置及可读存储介质
CN112084856A (zh) 一种人脸姿态检测方法、装置、终端设备及存储介质
CN108710916B (zh) 图片分类的方法及装置
CN107633205A (zh) 嘴唇动作分析方法、装置及存储介质
Bouma et al. Re-identification of persons in multi-camera surveillance under varying viewpoints and illumination
Huang et al. Soft-margin mixture of regressions
Li et al. Multi-view vehicle detection based on fusion part model with active learning
Juang et al. Stereo-camera-based object detection using fuzzy color histograms and a fuzzy classifier with depth and shape estimations
CN112825120B (zh) 人脸光照评价方法、装置、计算机可读存储介质及设备
CN106504268A (zh) 一种基于信息融合的改进Mean‑Shift跟踪方法
Cai et al. Robust facial expression recognition using RGB-D images and multichannel features
CN116415210A (zh) 图像侵权检测方法、装置及存储介质
Wo et al. A saliency detection model using aggregation degree of color and texture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant