CN106557549A - 识别目标对象的方法和装置 - Google Patents
识别目标对象的方法和装置 Download PDFInfo
- Publication number
- CN106557549A CN106557549A CN201610933252.9A CN201610933252A CN106557549A CN 106557549 A CN106557549 A CN 106557549A CN 201610933252 A CN201610933252 A CN 201610933252A CN 106557549 A CN106557549 A CN 106557549A
- Authority
- CN
- China
- Prior art keywords
- image
- identified
- gray level
- database
- attribute data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种识别目标对象的方法和装置。其中,该方法包括:获取包含了待识别对象的图像;获取图像的至少一种属性数据;从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象;在查询成功的情况下,确定待识别对象为查询得到的与任意一种或多种属性的数据相匹配的对象。本发明解决了现有技术中通过图像识别事物时识别率低、速度慢的技术问题。
Description
技术领域
本发明涉及图像识别领域,具体而言,涉及一种识别目标对象的方法和装置。
背景技术
当今时代是互联网的时代,人们在日常生活中遇到的所有问题都可以在互联网上查询。目前,人们通过互联网进行查询时大多通过输入文字的形式进行查询。但当人们遇到不认识或者不易描述的事物时,不易对该事物进行精确的查询。虽然现有技术中也存在通过事物的照片利用互联网的大数据来识别事物,但识别率比较低,而且识别的速度也比较慢。
针对上述现有技术中通过图像识别事物时识别率低以及识别速度慢的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种识别目标对象的方法和装置,以至少解决现有技术中通过图像识别事物时识别率低、速度慢的技术问题。
根据本发明实施例的一个方面,提供了一种识别目标对象的方法,包括:获取包含了待识别对象的图像;获取图像的至少一种属性数据;从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象;在查询成功的情况下,确定待识别对象为查询得到的与任意一种或多种属性的数据相匹配的对象。
根据本发明实施例的另一方面,还提供了一种识别目标对象的装置,包括:
图像获取模块,用于获取包含了待识别对象的图像;数据获取模块,用于获取图像的至少一种属性数据;匹配模块,用于从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象;识别模块,用于在查询成功的情况下,确定待识别对象为查询得到的与任意一种或多种属性的数据相匹配的对象。
在本发明实施例中,采用图像识别目标对象的方式,通过获取待识别对象的图像以及该图像的至少一种属性数据,在数据库中存在与属性数据相匹配的对象时,该对象即为待识别对象,达到了通过图像来识别事物的目的,从而实现了快速精确识别带识别对象的技术效果,进而解决了现有技术中通过图像识别事物时识别率低、速度慢的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种识别目标对象的方法流程图;
图2是根据本发明实施例的一种可选的数据库表的结构示意图;
图3是根据本发明实施例的一种可选的根据指纹信息获取图像属性数据的方法流程图;
图4是根据本发明实施例的一种可选的二值化后的图像示意图;
图5是根据本发明实施例的一种可选的根据显示内容获取图像属性数据的方法流程图;
图6是根据本发明实施例的一种可选的阈值分割后图像示意图;
图7是根据本发明实施例的一种可选的识别目标对象的方法流程图;
图8是根据本发明实施例的一种可选的建立数据库的方法流程图;以及
图9是根据本发明实施例的一种识别目标对象的装置结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种识别目标对象的方法实施例。
图1是根据本发明实施例的识别目标对象的方法,如图1所示,该方法包括如下步骤:
步骤S102,获取包含了待识别对象的图像。
在上述步骤中,上述待识别对象的图像可以是通过手机或者相机对待识别的对象进行拍照后得到的图像,也可以是已有的待识别对象的图像,例如,在互联网网站上下载的图像。在一种可选的实施例中,上述待识别对象的图像可以为但不限于彩色图像、灰度图像以及二值图像。
需要说明的是,当得到待识别对象的图像后,用户可以将该图像输入到事物识别系统中,该系统对图像进行处理之后,将识别结果展示给用户。通过上述步骤,事物识别系统可以获取待识别对象的图像,对该待识别对象的图像进行识别处理,进而识别出该待识别对象。
步骤S104,获取图像的至少一种属性数据。
在上述步骤中,上述属性数据包括但不限于图像的指纹信息以及图像的显示内容,在一种可选的实施例中,上述属性数据用来表征图像的特征,其中,图像的特征为区别本图像与其他图像的本质特点或特性或本质特点与特性的集合,例如,图像的颜色特征、纹理特征、形状特征、边缘特征以及空间关系特征等。上述指纹信息可以用于表征图像的颜色特征,而图像的显示内容可以用于表征图像的边缘特征。
需要说明的是,上述属性数据可以用二进制数表示,也可以用一个元素只有0和1的特征矩阵表示,由此可知,可以对待识别对象的图像进行二值化处理,从而得到图像的颜色特征或边缘特征。通过上述步骤,事物识别系统可以对获取到的图像进行图像处理,从而获取该图像的属性数据,进而通过该属性数据对待识别的对象进行识别。
步骤S106,从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象。
在上述步骤中,上述数据库中可以已经存有已知事物的图像的相关信息,例如,图像的标识信息、事物的名称、图像的属性数据。其中,图像的属性数据可以包括但不限于图像的指纹数据和图像的显示内容。在一种可选的实施例中,数据库中的表可以设计成如图2所示的形式,图2中,ID代表图像的标识信息,Name代表已知事物的名称(例如,水杯),Color-attr代表图像的指纹数据,Edge-attr代表图像的显示内容。当获得待识别对象的属性数据(例如,该属性数据为指纹信息)之后,则通过该指纹信息与数据库中的Color-attr列的数据进行比对。当待识别对象的指纹信息与数据库中已知事物的指纹信息相同或相近时,则通过Color-attr列的数据对应找到已知事物的标识信息以及名称,并输出到事物识别系统。
需要说明的是,上述图像的属性数据可以以字符串的形式存储在数据库的表中,也可以以二维数组的形式存储在数据库中。除可以通过属性数据在数据库中查找相对性的对象的标识信息以及名称外,还可以在数据库中增加没有的事物的相关信息,以及删除数据库中已有的重复的事物的相关信息。
通过上述步骤,可以对数据库进行相关的查询操作,并对数据库中已知数据的属性数据与待识别对象的属性数据进行匹配,进而查询出与待识别对象相匹配的已知事物。
步骤S108,在查询成功的情况下,确定待识别对象为查询得到的与任意一种或多种属性的数据相匹配的对象。
在上述步骤中,根据待识别对象的属性数据与数据库中已有事物的属性数据进行比对,当两者属性数据的相似比达到某一阈值时,认为数据库中该已有的事物即为待识别对象,例如,待识别对象的指纹信息与数据库中“水杯”的指纹信息进行比对,当两者的相似比达到80%时,认为待识别对象为水杯。
需要说明的是,上述相似比可以通过百分比的形式表示。另外,也可以通过计算两种事物的不同的比率来得到相似比。其中,相似比可以有用户自定义设定,也可以采用系统默认的数值。当相似比达不到阈值时,系统会提醒用户该待识别对象不能识别,并提示与待识别对象相似比最大的事物是否为用户所要识别的事物。
通过上述步骤,用户可以获取查询结果,并在查询结果达不到用户的要求时,给出用户可选择的对象,这样一方面可以使用户比较直观地看到识别结果,人机操作界面友好,另一方面还可以为用户提供选择的对象,节约了用户查询的时间,操作便捷。
基于上述实施例步骤S102至步骤S108所公开的方案中,可以获知,通过获取包含待识别对象的图像以及该图像的属性数据,并在数据库中查询是否存在与待识别对象的图像相匹配的对象,当查询到数据库中存在匹配对象时,确定待识别对象为该查询到的匹配对象,容易注意到的是,由于每种事物都有自己特有的属性,同样的,事物在图像中也有其属性,因此,通过图像处理的方法获得事物在图像中的属性数据,根据事物的属性数据可以实现对待识别对象的识别,因此,在本实施例中,通过获取待识别对象的图像以及该图像的至少一种属性数据,在数据库中存在与属性数据相匹配的对象时,该对象即为待识别对象,达到了通过图像来识别事物的目的,从而实现了快速精确识别带识别对象的技术效果,进而解决了现有技术中通过图像识别事物时识别率低、速度慢的技术问题。
可选的,图像的属性数据至少包括如下之一:图像的指纹信息和图像的显示内容.图3示出了在图像的属性的数据为指纹信息的情况下,获取图像的至少一种属性数据的方法,具体包括如下步骤:
步骤S302,对待识别对象的图像进行缩小处理,得到缩小后的第一图像;
步骤S304,转换第一图像为灰度图像;
步骤S306,根据灰度图像的像素进行感知哈希计算,得到图像的指纹信息。
在上述步骤S302至步骤S306中,可以将待识别对象的图像缩小为8×8的图像,例如,使用双线性插值算法对图像进行缩小处理,对待识别对象的图像进行缩小处理后的图像只保留了64个像素。由于一般情况下,待识别对象的图像为彩色图像,所以为了简化图像,需要将彩色图像转换为灰度图像,即将64位的彩色图像转换为64级灰度图像。将彩色图像转换为灰度图像后,根据感知哈希算法将灰度图像转换为二值图像,在该二值图像中,1表示白色,0表示黑色,根据该二值图像的像素可以得到一个64位的二进制数,该二进制数的组合次序没有限定,但必须与数据库中已知事物的属性数据中的组合次序相同,该组合好的二进制数即为待识别对象的图像的指纹信息。图4为二值化后的图像,该图像的指纹信息可以为“1110011111000011100000010000000000100100011001101110011111100111”。
需要说明的是,上述感知哈希算法的处理方法可以为:计算图像中64个像素的灰度平均值,将每个像素的灰度值与平均值进行比较;当像素的灰度值大于或等于平均值,该像素记为1,否则记为0;将上述的比较结果组合在一起,就构成了一个64位的字符串,该字符串就是图像的指纹信息。此外,当待识别对象的图像为灰度图像时,可以不进行图像转换的步骤。在上述步骤中,由于对图像进行了缩小处理,并且仅提出了缩小后图像的结构、明暗等基本信息,摒弃了不同尺寸、比例带来的图像差异,因此,系统在对图像进行识别处理时,其速度比较快,识别率比较高。
可选的,图5示出了在图像的属性的数据为显示内容的情况下,获取图像的至少一种属性数据的方法,具体包括如下步骤:
步骤S502,对待识别对象的图像进行缩小处理,得到缩小后的第二图像;
步骤S504,转换第二图像为第二灰度图像;
步骤S506,根据第二灰度图像的前景像素和背景像素确定第二灰度图像的阈值;
步骤S508,根据第二灰度图像的阈值确定图像的显示内容。
在上述步骤S502至步骤S508中,除根据图像的颜色特征来获取图像的属性数据外,还可以通过图像的显示内容来获取图像的属性数据。首先,将原始图像转成一张较小的灰度图片,假定为8×8的像素。然后,根据阈值将灰度图片转成二值图像。如果两张图像很相似,则它们的黑白边缘应该是相近的。
需要说明的是,图像的前景色与背景色反差越大,图像的黑白边缘就越明显。因此,可以通过求取使得前景色和背景色各自的类内方差最小或类间方差最大的阈值来对对象进行分割,分割后的图像为一个8×8的0-1矩阵,矩阵的每个值对应原始图像的一个像素,0表示黑色,1表示白色,该矩阵为待识别对象的图像的特征矩阵,该特征矩阵在数据库中以二位数据的形式保存。图6为根据阈值对图像进行分割后的图像,其中,图6中的灰色虚线条表示根据阈值对图像进行分割的分割线,该图像的特征矩阵M可以表示为:
此外,可以通过如下的方法求最大类间方差:
对于图像I(x,y),前景和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为ω0,其平均灰度μ0,背景像素点数占整幅图像的比例为ω1,其平均灰度为μ1,图像的总平均灰度记为μ,类间方差记为g。假设图像的背景较暗,并且图像的大小为M×N,图像中像素的灰度值小于阈值T的像素个数记作N0,像素灰度大于阈值T的像素个数记作N1,则有:
N0+N1=M×N (3)
ω0+ω1=1 (4)
μ=ω0≠ω0+ω1≠μ1 (5)
g=ω0(μ0-μ)2+ω1(μ1-μ)2 (6)
将式(5)代入式(6),得到等价公式:
g=ω0ω1(μ0-μ1)2 (7)
g最大时所对应的T值即为对前景和背景分割的最佳阈值。
可选的,图7示出了从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象的方法,包括如下步骤:
步骤S702,计算数据库中的至少一种属性数据与图像的至少一种属性数据不同数据的位数之和;
步骤S704,在不同数据的位数之和小于预设阈值的情况下,数据库中存在与任意一种或多种属性数据相匹配的对象。
在上述步骤S702至步骤S704中,可以在得到图像的指纹信息以后,对比不同的指纹信息,统计64位二进制数字中不相同的位数。如果不相同的数据位数不超过5,说明两张图像匹配,待识别对象即为匹配的图像中的事物;如果大于10,说明两张图像不匹配,事物识别系统向用于展示出与待识别对象最相似的事物,并输出“对比起,不能识别该事物,您是不是在找……”。作为另一种可选的实施例,可以用异或算法来计算两个64位二进制数字或者特征矩阵中位数不相同的位数。
可选的,图8示出了数据库建立的方法,包括如下步骤:
步骤S802,建立数据库;
步骤S804,对图像进行缩小处理,得到缩小后的第三;
步骤S806,转换第三图像为灰度图像;
步骤S808,根据第三灰度图像的像素进行感知哈希计算,得到图像的指纹信息,和/或,根据第三灰度图像的前景像素和背景像素确定第三灰度图像的阈值,并确定图像的显示内容;
步骤S810,存储图像的指纹信息,和/或,图像的显示内容至数据库中。
作为一种可选的实施例,可以将包含已知事物(例如,水杯)的图像进行缩小处理,得到一个8×8的图像,再将缩小后的图像转换为灰度图像,然后根据感知哈希算法得到图像的指纹信息,或前景像素和背景像素确定阈值,根据阈值进行图像分割得到图像的显示内容,将图像的指纹信息或显示内容存入数据库中的Color-attr列或Edge-attr列中,同时,Name列中对应的存入“水杯”。
需要说明的是,还可以增添数据库中的内容,例如,当“水杯”的形状或颜色发生变化时,可以向数据库中加入新的水杯的指纹信息或显示内容。通过上述步骤,事物识别系统可以对待识别对象的图像与已知事物的图像进行匹配,进而完成对事物的识别过程。
实施例2
根据本发明实施例,提供了一种识别目标对象的装置实施例,其中,上述实施例1中的方法可以在本实施例中所提供的装置中运行。
图9是根据本发明实施例的识别目标对象的装置,如图9所示,该装置包括:图像获取模块901、数据获取模块903、匹配模块905和识别模块907。
图像获取模块901,用于获取包含了待识别对象的图像。
在图像获取模块中,上述待识别对象的图像可以是通过手机或者相机对待识别的对象进行拍照后得到的图像,也可以是已有的待识别对象的图像,例如,在互联网网站上下载的图像。在一种可选的实施例中,上述待识别对象的图像可以为但不限于彩色图像、灰度图像以及二值图像。
需要说明的是,当得到待识别对象的图像后,用户可以将该图像输入到事物识别系统中,该系统对图像进行处理之后,将识别结果展示给用户。通过上述模块,事物识别系统可以获取待识别对象的图像,对该待识别对象的图像进行识别处理,进而识别出该待识别对象。
数据获取模块903,用于获取图像的至少一种属性数据。
在数据获取模块中,上述属性数据包括但不限于图像的指纹信息以及图像的显示内容,在一种可选的实施例中,上述属性数据用来表征图像的特征,其中,图像的特征为区别本图像与其他图像的本质特点或特性或本质特点与特性的集合,例如,图像的颜色特征、纹理特征、形状特征、边缘特征以及空间关系特征等。上述指纹信息可以用于表征图像的颜色特征,而图像的显示内容可以用于表征图像的边缘特征。
需要说明的是,上述属性数据可以用二进制数表示,也可以用一个元素只有0和1的特征矩阵表示,由此可知,可以对待识别对象的图像进行二值化处理,从而得到图像的颜色特征或边缘特征。通过上述模块,事物识别系统可以对获取到的图像进行图像处理,从而获取该图像的属性数据,进而通过该属性数据对待识别的对象进行识别。
匹配模块905,用于从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象。
在匹配模块中,上述数据库中可以已经存有已知事物的图像的相关信息,例如,图像的标识信息、事物的名称、图像的属性数据。其中,图像的属性数据可以包括但不限于图像的指纹数据和图像的显示内容。在一种可选的实施例中,数据库中的表可以设计成如图2所示的形式,图2中,ID代表图像的标识信息,Name代表已知事物的名称(例如,水杯),Color-attr代表图像的指纹数据,Edge-attr代表图像的显示内容。当获得待识别对象的属性数据(例如,该属性数据为指纹信息)之后,则通过该指纹信息与数据库中的Color-attr列的数据进行比对。当待识别对象的指纹信息与数据库中已知事物的指纹信息相同或相近时,则通过Color-attr列的数据对应找到已知事物的标识信息以及名称,并输出到事物识别系统。
需要说明的是,上述图像的属性数据可以以字符串的形式存储在数据库的表中,也可以以二维数组的形式存储在数据库中。除可以通过属性数据在数据库中查找相对性的对象的标识信息以及名称外,还可以在数据库中增加没有的事物的相关信息,以及删除数据库中已有的重复的事物的相关信息。
通过上述模块,可以对数据库进行相关的查询操作,并对数据库中已知数据的属性数据与待识别对象的属性数据进行匹配,进而查询出与待识别对象相匹配的已知事物。
识别模块907,用于在查询成功的情况下,确定待识别对象为查询得到的与任意一种或多种属性的数据相匹配的对象。
在识别模块中,根据待识别对象的属性数据与数据库中已有事物的属性数据进行比对,当两者属性数据的相似比达到某一阈值时,认为数据库中该已有的事物即为待识别对象,例如,待识别对象的指纹信息与数据库中“水杯”的指纹信息进行比对,当两者的相似比达到80%时,认为待识别对象为水杯。
需要说明的是,上述相似比可以通过百分比的形式表示。另外,也可以通过计算两种事物的不同的比率来得到相似比。其中,相似比可以有用户自定义设定,也可以采用系统默认的数值。当相似比达不到阈值时,系统会提醒用户该待识别对象不能识别,并提示与待识别对象相似比最大的事物是否为用户所要识别的事物。
通过上述模块,用户可以获取查询结果,并在查询结果达不到用户的要求时,给出用户可选择的对象,这样一方面可以使用户比较直观地看到识别结果,人机操作界面友好,另一方面还可以为用户提供选择的对象,节约了用户查询的时间,操作便捷。
由上可知,通过获取包含待识别对象的图像以及该图像的属性数据,并在数据库中查询是否存在与待识别对象的图像相匹配的对象,当查询到数据库中存在匹配对象时,确定待识别对象为该查询到的匹配对象,容易注意到的是,由于每种事物都有自己特有的属性,同样的,事物在图像中也有其属性,因此,通过图像处理的方法获得事物在图像中的属性数据,根据事物的属性数据可以实现对待识别对象的识别,因此,在本实施例中,通过获取待识别对象的图像以及该图像的至少一种属性数据,在数据库中存在与属性数据相匹配的对象时,该对象即为待识别对象,达到了通过图像来识别事物的目的,从而实现了快速精确识别带识别对象的技术效果,进而解决了现有技术中通过图像识别事物时识别率低、速度慢的技术问题。
需要说明的是,上述图像获取模块、数据获取模块、匹配模块以及识别模块对应于实施例1中的步骤S102至步骤S108,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,图像的属性数据至少包括如下之一:图像的指纹信息和图像的显示内容,其中,在图像的属性的数据为指纹信息的情况下,数据获取模块包括:
第一处理模块,用于对待识别对象的图像进行缩小处理,得到缩小后的第一图像;
第一转换模块,用于转换第一图像为灰度图像;
第一计算模块,用于根据灰度图像的像素进行感知哈希计算,得到图像的指纹信息。
作为一种可选的实施例,可以将待识别对象的图像缩小为8×8的图像,例如,使用双线性插值算法对图像进行缩小处理,对待识别对象的图像进行缩小处理后的图像只保留了64个像素。由于一般情况下,待识别对象的图像为彩色图像,所以为了简化图像,需要将彩色图像转换为灰度图像,即将64位的彩色图像转换为64级灰度图像。将彩色图像转换为灰度图像后,根据感知哈希算法将灰度图像转换为二值图像,在该二值图像中,1表示白色,0表示黑色,根据该二值图像的像素可以得到一个64位的二进制数,该二进制数的组合次序没有限定,但必须与数据库中已知事物的属性数据中的组合次序相同,该组合好的二进制数即为待识别对象的图像的指纹信息。图4为二值化后的图像,该图像的指纹信息可以为“1110011111000011100000010000000000100100011001101110011111100111”。
需要说明的是,上述感知哈希算法的处理方法可以为:计算图像中64个像素的灰度平均值,将每个像素的灰度值与平均值进行比较;当像素的灰度值大于或等于平均值,该像素记为1,否则记为0;将上述的比较结果组合在一起,就构成了一个64位的字符串,该字符串就是图像的指纹信息。此外,当待识别对象的图像为灰度图像时,可以不进行图像转换的步骤。在上述步骤中,由于对图像进行了缩小处理,并且仅提出了缩小后图像的结构、明暗等基本信息,摒弃了不同尺寸、比例带来的图像差异,因此,系统在对图像进行识别处理时,其速度比较快,识别率比较高。
另外,上述第一处理模块、第一转换模块以及第一计算模块对应于实施例1中的步骤S302至步骤S306,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,在图像的属性的数据为显示内容的情况下,数据获取模块包括:
第二处理模块,用于对待识别对象的图像进行缩小处理,得到缩小后的第二图像;
第二转换模块,用于转换第二图像为第二灰度图像;
第二计算模块,用于根据第二灰度图像的前景像素和背景像素确定第二灰度图像的阈值;
第三计算模块,用于根据第二灰度图像的阈值确定图像的显示内容。
在一种可选的实施例中,除根据图像的颜色特征来获取图像的属性数据外,还可以通过图像的显示内容来获取图像的属性数据。首先,将原始图像转成一张较小的灰度图片,假定为8×8的像素。然后,根据阈值将灰度图片转成二值图像。如果两张图像很相似,则它们的黑白边缘应该是相近的。
需要说明的是,图像的前景色与背景色反差越大,图像的黑白边缘就越明显。因此,可以通过求取使得前景色和背景色各自的类内方差最小或类间方差最大的阈值来对对象进行分割,分割后的图像为一个8×8的0-1矩阵,矩阵的每个值对应原始图像的一个像素,0表示黑色,1表示白色,该矩阵为待识别对象的图像的特征矩阵,该特征矩阵在数据库中以二位数据的形式保存。图6为根据阈值对图像进行分割后的图像,其中,图6中的灰色虚线条表示根据阈值对图像进行分割的分割线,该图像的特征矩阵M可以表示为:
此外,可以通过如下的方法求最大类间方差:
对于图像I(x,y),前景和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为ω0,其平均灰度μ0,背景像素点数占整幅图像的比例为ω1,其平均灰度为μ1,图像的总平均灰度记为μ,类间方差记为g。假设图像的背景较暗,并且图像的大小为M×N,图像中像素的灰度值小于阈值T的像素个数记作N0,像素灰度大于阈值T的像素个数记作N1,则有:
N0+N1=M×N (3)
ω0+ω1=1 (4)
μ=ω0≠ω0+ω1≠μ1 (5)
g=ω0(μ0-μ)2+ω1(μ1-μ)2 (6)
将式(5)代入式(6),得到等价公式:
g=ω0ω1(μ0-μ1)2 (7)
g最大时所对应的T值即为对前景和背景分割的最佳阈值。
需要说明的是,上述第二处理模块、第二转换模块、第二计算模块以及第三计算模块对应于实施例1中的步骤S502至步骤S508,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,匹配模块包括:
计算模块,用于计算数据库中的至少一种属性数据与图像的至少一种属性数据不同数据的位数之和;
第一匹配模块,用于在不同数据的位数之和小于预设阈值的情况下,数据库中存在与任意一种或多种属性数据相匹配的对象。
在一种可选的实施例中,可以在得到图像的指纹信息以后,对比不同的指纹信息,统计64位二进制数字中不相同的位数。如果不相同的数据位数不超过5,说明两张图像匹配,待识别对象即为匹配的图像中的事物;如果大于10,说明两张图像不匹配,事物识别系统向用于展示出与待识别对象最相似的事物,并输出“对比起,不能识别该事物,您是不是在找……”。作为另一种可选的实施例,可以用异或算法来计算两个64位二进制数字或者特征矩阵中位数不相同的位数。
需要说明的是,上述计算模块以及第一匹配模块对应于实施例1中的步骤S702至步骤S704,两个个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,上述装置还包括:
建立模块,用于建立数据库;
第三处理模块,用于对图像进行缩小处理,得到缩小后的第三图像;
第三转换模块,用于转换第三图像为第三灰度图像;
指纹获取模块,用于根据第三灰度图像的像素进行感知哈希计算,得到图像的指纹信息,和/或,
内容显示模块,用于根据第三灰度图像的前景像素和背景像素确定第三灰度图像的阈值,并确定图像的显示内容;
保存模块,用于存储图像的指纹信息,和/或,图像的显示内容至数据库中。
作为一种可选的实施例,可以将包含已知事物(例如,水杯)的图像进行缩小处理,得到一个8×8的图像,再将缩小后的图像转换为灰度图像,然后根据感知哈希算法得到图像的指纹信息,或前景像素和背景像素确定阈值,根据阈值进行图像分割得到图像的显示内容,将图像的指纹信息或显示内容存入数据库中的Color-attr列或Edge-attr列中,同时,Name列中对应的存入“水杯”。
需要说明的是,还可以增添数据库中的内容,例如,当“水杯”的形状或颜色发生变化时,可以向数据库中加入新的水杯的指纹信息或显示内容。通过上述步骤,事物识别系统可以对待识别对象的图像与已知事物的图像进行匹配,进而完成对事物的识别过程。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种识别目标对象的方法,其特征在于,包括:
获取包含了待识别对象的图像;
获取所述图像的至少一种属性数据;
从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象;
在查询成功的情况下,确定所述待识别对象为查询得到的与所述任意一种或多种属性的数据相匹配的对象。
2.根据权利要求1所述的方法,其特征在于,所述图像的属性数据至少包括如下之一:所述图像的指纹信息和所述图像的显示内容,其中,在所述图像的属性的数据为所述指纹信息的情况下,获取所述图像的至少一种属性数据的步骤包括:
对所述待识别对象的图像进行缩小处理,得到缩小后的第一图像;
转换所述第一图像为灰度图像;
根据所述灰度图像的像素进行感知哈希计算,得到所述图像的指纹信息。
3.根据权利要求2所述的方法,其特征在于,在所述图像的属性的数据为所述显示内容的情况下,获取所述图像的至少一种属性数据的步骤包括:
对所述待识别对象的图像进行缩小处理,得到缩小后的第二图像;
转换所述第二图像为第二灰度图像;
根据所述第二灰度图像的前景像素和背景像素确定所述第二灰度图像的阈值;
根据所述第二灰度图像的阈值确定所述图像的显示内容。
4.根据权利要求1所述的方法,其特征在于,从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象,包括:
计算所述数据库中的至少一种属性数据与所述图像的至少一种属性数据不同数据的位数之和;
在所述不同数据的位数之和小于预设阈值的情况下,所述数据库中存在与任意一种或多种属性数据相匹配的对象。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
建立所述数据库;
对图像进行缩小处理,得到缩小后的第三图像;
转换所述第三图像为第三灰度图像;
根据所述第三灰度图像的像素进行感知哈希计算,得到所述图像的指纹信息,和/或,
根据所述第三灰度图像的前景像素和背景像素确定所述第三灰度图像的阈值,并确定所述图像的显示内容;
存储所述图像的指纹信息,和/或,所述图像的显示内容至所述数据库中。
6.一种识别目标对象的装置,其特征在于,包括:
图像获取模块,用于获取包含了待识别对象的图像;
数据获取模块,用于获取所述图像的至少一种属性数据;
匹配模块,用于从数据库中查询是否存在与任意一种或多种属性数据相匹配的对象;
识别模块,用于在查询成功的情况下,确定所述待识别对象为查询得到的与所述任意一种或多种属性的数据相匹配的对象。
7.根据权利要求6所述的装置,其特征在于,所述图像的属性数据至少包括如下之一:所述图像的指纹信息和所述图像的显示内容,其中,在所述图像的属性的数据为所述指纹信息的情况下,所述数据获取模块包括:
第一处理模块,用于对所述待识别对象的图像进行缩小处理,得到缩小后的第一图像;
第一转换模块,用于转换所述第一图像为灰度图像;
第一计算模块,用于根据所述灰度图像的像素进行感知哈希计算,得到所述图像的指纹信息。
8.根据权利要求7所述的装置,其特征在于,在所述图像的属性的数据为所述显示内容的情况下,所述数据获取模块包括:
第二处理模块,用于对所述待识别对象的图像进行缩小处理,得到缩小后的第二图像;
第二转换模块,用于转换所述第二图像为第二灰度图像;
第二计算模块,用于根据所述第二灰度图像的前景像素和背景像素确定所述第二灰度图像的阈值;
第三计算模块,用于根据所述第二灰度图像的阈值确定所述图像的显示内容。
9.根据权利要求6所述的装置,其特征在于,所述匹配模块包括:
计算模块,用于计算所述数据库中的至少一种属性数据与所述图像的至少一种属性数据不同数据的位数之和;
第一匹配模块,用于在所述不同数据的位数之和小于预设阈值的情况下,所述数据库中存在与任意一种或多种属性数据相匹配的对象。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
建立模块,用于建立所述数据库;
第三处理模块,用于对所述待识别对象的图像进行缩小处理,得到缩小后的第三图像;
第三转换模块,用于转换所述第三图像为第三灰度图像;
指纹获取模块,用于根据所述第三灰度图像的像素进行感知哈希计算,得到所述图像的指纹信息,和/或,
内容显示模块,用于根据所述第三灰度图像的前景像素和背景像素确定所述第三灰度图像的阈值,并确定所述图像的显示内容;
保存模块,用于存储所述图像的指纹信息,和/或,所述图像的显示内容至所述数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610933252.9A CN106557549A (zh) | 2016-10-24 | 2016-10-24 | 识别目标对象的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610933252.9A CN106557549A (zh) | 2016-10-24 | 2016-10-24 | 识别目标对象的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106557549A true CN106557549A (zh) | 2017-04-05 |
Family
ID=58443452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610933252.9A Pending CN106557549A (zh) | 2016-10-24 | 2016-10-24 | 识别目标对象的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106557549A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600168A (zh) * | 2018-03-19 | 2018-09-28 | 网御安全技术(深圳)有限公司 | 一种用于人工智能图像辨识攻击的安全编码方法及系统 |
CN109271936A (zh) * | 2018-09-18 | 2019-01-25 | 哈尔滨工程大学 | 基于感知哈希算法的飞机振动故障数据库构建与检索方法 |
CN109559347A (zh) * | 2018-11-28 | 2019-04-02 | 中南大学 | 对象识别方法、装置、系统及存储介质 |
CN107316318B (zh) * | 2017-05-26 | 2020-06-02 | 河北汉光重工有限责任公司 | 基于多子区域背景拟合的空中目标自动检测方法 |
CN111311772A (zh) * | 2019-08-19 | 2020-06-19 | 深圳市鸿合创新信息技术有限责任公司 | 一种考勤处理方法及装置、电子设备 |
WO2021169793A1 (zh) * | 2020-02-28 | 2021-09-02 | 北京达佳互联信息技术有限公司 | 获取目标对象的方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295022A (zh) * | 2012-02-24 | 2013-09-11 | 富泰华工业(深圳)有限公司 | 图像相似度计算系统及方法 |
CN104021207A (zh) * | 2014-06-18 | 2014-09-03 | 厦门美图之家科技有限公司 | 一种基于图像的食物信息提供方法 |
CN105512660A (zh) * | 2015-11-27 | 2016-04-20 | 浙江宇视科技有限公司 | 车牌号码识别方法及装置 |
JP2016101171A (ja) * | 2009-10-13 | 2016-06-02 | ザ・チャールズ・スターク・ドレイパ・ラボラトリー・インコーポレイテッド | エピジェネティックおよび非エピジェネティックベースの人工多能性幹細胞誘導への応用を含む細胞リプログラミング |
-
2016
- 2016-10-24 CN CN201610933252.9A patent/CN106557549A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016101171A (ja) * | 2009-10-13 | 2016-06-02 | ザ・チャールズ・スターク・ドレイパ・ラボラトリー・インコーポレイテッド | エピジェネティックおよび非エピジェネティックベースの人工多能性幹細胞誘導への応用を含む細胞リプログラミング |
CN103295022A (zh) * | 2012-02-24 | 2013-09-11 | 富泰华工业(深圳)有限公司 | 图像相似度计算系统及方法 |
CN104021207A (zh) * | 2014-06-18 | 2014-09-03 | 厦门美图之家科技有限公司 | 一种基于图像的食物信息提供方法 |
CN105512660A (zh) * | 2015-11-27 | 2016-04-20 | 浙江宇视科技有限公司 | 车牌号码识别方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316318B (zh) * | 2017-05-26 | 2020-06-02 | 河北汉光重工有限责任公司 | 基于多子区域背景拟合的空中目标自动检测方法 |
CN108600168A (zh) * | 2018-03-19 | 2018-09-28 | 网御安全技术(深圳)有限公司 | 一种用于人工智能图像辨识攻击的安全编码方法及系统 |
CN109271936A (zh) * | 2018-09-18 | 2019-01-25 | 哈尔滨工程大学 | 基于感知哈希算法的飞机振动故障数据库构建与检索方法 |
CN109271936B (zh) * | 2018-09-18 | 2021-09-24 | 哈尔滨工程大学 | 基于感知哈希算法的飞机振动故障数据库构建与检索方法 |
CN109559347A (zh) * | 2018-11-28 | 2019-04-02 | 中南大学 | 对象识别方法、装置、系统及存储介质 |
CN111311772A (zh) * | 2019-08-19 | 2020-06-19 | 深圳市鸿合创新信息技术有限责任公司 | 一种考勤处理方法及装置、电子设备 |
WO2021169793A1 (zh) * | 2020-02-28 | 2021-09-02 | 北京达佳互联信息技术有限公司 | 获取目标对象的方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106557549A (zh) | 识别目标对象的方法和装置 | |
Raja et al. | Color object detection based image retrieval using ROI segmentation with multi-feature method | |
Chen et al. | DISC: Deep image saliency computing via progressive representation learning | |
CN107393356A (zh) | 控制方法、控制装置和早教机 | |
CN103455542B (zh) | 多类识别器以及多类识别方法 | |
CN110009556A (zh) | 图像背景虚化方法、装置、存储介质及电子设备 | |
CN108765278A (zh) | 一种图像处理方法、移动终端及计算机可读存储介质 | |
CN108255555B (zh) | 一种系统语言切换方法及终端设备 | |
CN105069042A (zh) | 基于内容的无人机侦察图像数据检索方法 | |
CN109086753B (zh) | 基于双通道卷积神经网络的交通标志识别方法、装置 | |
Lee et al. | Tag refinement in an image folksonomy using visual similarity and tag co-occurrence statistics | |
CN110097616B (zh) | 一种联合绘画方法、装置、终端设备及可读存储介质 | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
CN113689324A (zh) | 一种基于二分类标签的人像物件的自动增删方法及装置 | |
CN108304839A (zh) | 一种图像数据处理方法以及装置 | |
EP3044733A1 (en) | Image processing | |
CN111695453A (zh) | 绘本识别方法、装置及机器人 | |
CN108805838A (zh) | 一种图像处理方法、移动终端及计算机可读存储介质 | |
CN115687670A (zh) | 图像搜索方法、装置、计算机可读存储介质及电子设备 | |
Memon et al. | IMRBS: image matching for location determination through a region-based similarity technique for CBIR | |
CN109784275A (zh) | 多点位人脸识别智能化辨识方法 | |
CN111177450B (zh) | 一种图像检索云识别方法、系统及计算机可读存储介质 | |
CN107798070A (zh) | 一种网页数据获取方法及终端设备 | |
Nathiya et al. | Optical Character Recognition for scene text detection, mining and recognition | |
CN112288045B (zh) | 一种印章真伪判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170405 |
|
RJ01 | Rejection of invention patent application after publication |