CN104318259B - 一种识别目标图片的设备、方法以及计算设备 - Google Patents
一种识别目标图片的设备、方法以及计算设备 Download PDFInfo
- Publication number
- CN104318259B CN104318259B CN201410559532.9A CN201410559532A CN104318259B CN 104318259 B CN104318259 B CN 104318259B CN 201410559532 A CN201410559532 A CN 201410559532A CN 104318259 B CN104318259 B CN 104318259B
- Authority
- CN
- China
- Prior art keywords
- target photo
- picture
- identified
- similarity
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013500 data storage Methods 0.000 claims abstract description 6
- 210000000352 storage cell Anatomy 0.000 claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 32
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 14
- 238000011524 similarity measure Methods 0.000 claims description 12
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 238000004891 communication Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101000746134 Homo sapiens DNA endonuclease RBBP8 Proteins 0.000 description 1
- 101000969031 Homo sapiens Nuclear protein 1 Proteins 0.000 description 1
- 102100021133 Nuclear protein 1 Human genes 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/195—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references using a resistor matrix
Abstract
本发明公开了一种识别目标图片的设备,该设备包括:数据存储单元,适于存储目标图片集合;相似度计算单元,适于计算待识别图片与目标图片集合中目标图片的相似度;目标图片识别单元,适于当待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,确定待识别图片为第一类型目标图片;当待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于第二门限时,确定待识别图片为第二类型目标图片;数据更新单元,适于将确定为第二类型目标图片的待识别图片添加到目标图片集合中。本发明还公开了对应的识别目标图片的方法以及包括该识别目标图片的设备的计算设备。
Description
技术领域
本发明涉及图片检测技术领域,具体涉及一种识别目标图片的设备、方法以及计算设备。
背景技术
在网络中很多类型的资源站点上,都会出现一些广告图片,这些广告图片的种类非常丰富,其包括各类商品的广告和实体商店的广告,以及一些其他类型的广告。这些广告图片不但会出现在商家的站点上,也会出现在其他资源站点的页面上。例如,在允许用户上传图片的社区(论坛、图片站等),会有一些用户上传广告图片。大量广告图片的存在,往往对用户造成干扰,甚至用户进行图片搜索时,也会出现与用户需求无关的广告图片。因此,需要一种能够识别图片是否属于广告图片的技术,并对识别出的广告图片进行针对性的处理,从而提高网站浏览内容的质量。
在进行广告图片识别时,通常会预先设置一个广告图片库,然后将待识别图片与广告图片库中的图片进行匹配,根据匹配结果来确定待识别图片与广告图片的相似度 ,进而确定待识别图片是否为广告图片。
而对于广告图片库的处理,现有技术提供了两种方式。在一种实现方式中,广告图片库的规模是固定的,新识别出的广告图片不会更新到广告图片库中,广告图片库得不到及时的更新,这有可能会导致后续对广告图片的漏检。在另外一种实现方式中,将新识别出的所有广告图片都更新到广告图片库中,这会使得广告图片库中存在冗余的图片,并会使得广告图片库的规模越来越大,导致后续进行匹配时计算量太大。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别目标图片的设备、方法以及计算设备。
根据本发明的一个方面,提供了一种识别目标图片的设备,驻留在计算设备中,该识别目标图片的设备包括:数据存储单元,适于存储目标图片集合,所述目标图片集合中包括一个或多个目标图片;相似度计算单元,适于计算待识别图片与目标图片集合中目标图片的相似度;目标图片识别单元,适于当相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片;当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片;数据更新单元,适于将确定为第二类型目标图片的待识别图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的设备中,所述目标图片识别单元还适于,当相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,通知相似度计算单元停止进行相似度计算。
可选地,在根据本发明的识别目标图片的设备中,所述目标图片识别单元还适于,当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图片;所述数据更新单元还适于,获取人工对一个或多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的设备中,所述数据更新单元将该未知图片添加到目标图片集合之前,通知相似度计算单元计算该未知图片与目标图片集合中目标图片的相似度,当相似度计算单元计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的设备中,所述目标图片集合中包括的目标图片为该目标图片的特征值集;所述相似度计算单元进一步适于,计算待识别图片的特征值集,根据待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
可选地,在根据本发明的识别目标图片的设备中,图片的特征值集是通过仿射尺度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置信息、尺度信息、方向信息和特征向量信息。
根据本发明的另一方面,提供了一种计算设备,该计算设备包括根据本发明的识别目标图片的设备。
根据本发明的又一方面,提供了一种识别目标图片的方法,由计算设备执行,该识别目标图片的方法包括:计算待识别图片与目标图片集合中目标图片的相似度,其中所述目标图片集合中包括一个或多个目标图片;当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片;当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片;将确定为第二类型目标图片的待识别图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的方法中,当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,停止进行相似度计算。
可选地,在根据本发明的识别目标图片的方法中,还包括:当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图片;获取人工对一个或多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的方法中,在将该未知图片添加到目标图片集合之前,计算该未知图片与目标图片集合中目标图片的相似度,当计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
可选地,在根据本发明的识别目标图片的方法中,所述目标图片集合中包括的目标图片为该目标图片的特征值集;所述计算待识别图片与目标图片集合中目标图片的相似度包括:计算待识别图片的特征值集,根据待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
可选地,在根据本发明的识别目标图片的方法中,图片的特征值集是通过仿射尺度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置信息、尺度信息、方向信息和特征向量信息。
根据本发明的识别目标图片的方案,预先设置两个门限,当待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片,不将该待识别图片添加到目标图片集合中;当待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片,并将该待识别图片添加到目标图片集合中。这样,目标图片集合既能够得到有效更新,又不至于存在重复的项目,从而保证目标图片集合是完备且不冗余的,一方面提高了目标图片识别的准确度,另一方面降低了目标图片识别的计算量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的识别目标图片的设备的结构图;
图2示出了根据本发明一个实施例的识别目标图片的方法的流程图;以及
图3示出了布置为实现根据本发明的识别目标图片的方法的示例计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的识别目标图片的设备100的结构图。识别目标图片的设备100驻留在计算设备中。参照图1,识别目标图片的设备100包括数据存储单元110、相似度计算单元120、目标图片识别单元130和数据更新单元140。
数据存储单元110适于存储目标图片集合。该目标图片集合中包括一个或多个目标图片。根据识别对象的不同,目标图片集合中的目标图片可以是广告图片、不良图片(例如色情图片)或者其他需要识别的任何图片类型。
初始化时,可以将已有(或者已知)的目标图片加入到目标图片集合中,并由数据存储单元110进行存储。后续,根据设备100对待识别图片的识别结果,由数据更新单元140对目标图片集合进行更新。
根据本发明的一个实施方式,在进行两张图片的相似判断时,可以先利用预定的图片识别算法获取这两张图片各自的特征值集,然后进行特征值匹配,并根据特征值匹配的结果来判断二者的相似度。因此,在一种实现方式中,数据存储单元110可以不存储原图片,而是存储该图片的特征值集,即目标图片集合中包括的目标图片为该目标图片的特征值集。
当前已有许多比较成熟的相似图片识别算法,例如颜色分布算法、内容分布算法、平均哈希算法(average hash,ahash)、感知哈希算法(perceptual hash,phash)、尺度不变特征变换算法(Scale-invariant feature transform,sift)、仿射尺度不变特征变换算法(Affine Scale-invariant feature transform,asift)等等。
基于颜色分布法和内容分布法的图片识别算法,主要是用矩阵来表示颜色分布或内容分布的特征值,然后对特征矩阵进行相似度计算。基于颜色分布法和内容分布法的图片识别算法可以用于发现原图的缩放图。
平均哈希算法主要通过缩小图片、简化色彩、计算像素的灰度平均值并量化像素的灰度来生成哈希值,然后通过计算哈希值的汉明距离来判断图片的相似度 。感知哈希算法主要是通过离散余弦变换求得图片的哈希值,然后通过计算哈希值的汉明距离来判断图片的相似度 。平均哈希算法适用于识别亮度、对比度或颜色发生变化的图片相似识别场景。感知哈希算法也能实现平均哈希算法的功能,同时还能应用于经过伽马矫正和颜色直方图处理的相似图片识别。
sift和asift算法主要是通过提取图片的特征值集并进行比对,然后根据特征值匹配对数量判定图片相似与否。asift算法不仅能完成图片缩放、亮度变化、对比度变化、伽马矫正、颜色直方图处理的图片相似识别,还适用于经过旋转或倾斜等非常规处理的变种图片和原图的相似识别。
当采用sift或者asift算法时,图片的特征值集中的每个特征值包括特征点的位置信息(横坐标x、纵坐标y)、尺度信息(scale)、方向信息(orientation)和特征向量信息(vec[128],是一个用于描述特征点的临近范围梯度方向直方图数组)。例如从图片中提取了一个特征点,其特征值为{x=13.5,y=25.4,scale=12.7,angle=36.5,vec[128]={11,230,32,……}}。另外,在asift算法中,还会生成原图片的多张仿射图片。在本发明实施例中,可以将目标图片的原图及其多个仿射图的所有特征值作为该目标图片的特征值集进行存储,即一个目标图片的特征值集中即包括原图的所有特征值,又包括每个仿射图的所有特征值。
需要说明的是,本发明实施例对具体的图片识别算法不做限制,本领域技术人员可以根据需要进行合理选择。
相似度计算单元120适于计算待识别图片与目标图片集合中目标图片的相似度。当目标图片集合中包括的目标图片为该目标图片的特征值集时,相似度计算单元120可以先计算待识别图片的特征值集,然后将待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。当然,如果目标图片集合中包括的目标图片是该目标图片自身,也可以采用预定图片识别算法来计算待识别图片与目标图片的相似度。
由于目标图片集合中通常会存在多张目标图片,则相似度计算单元120可以按照预定顺序从目标图片集合中取出目标图片,并采用预定图片识别算法对待识别图片与取出的目标图片进行相似度计算。并且,可以根据目标图片识别单元130的识别结果来确定何时停止相似度计算。
以采用asift算法为例,图片的特征值集中的每个特征值包括特征点的位置信息、尺度信息、方向信息和特征向量信息。在一种实现方式中,可以根据待识别图片中各特征点与目标图片中各特征点的特征向量信息,分别计算位于两张图片中的两个特征点的特征向量距离,如果所述的特征向量距离满足预设值则判断上述两个特征点相匹配,为一个特征值匹配对;在所有特征点的特征向量距离计算和判断完成后,得到两张图片的特征值匹配对数量。在另外一种实现方式中,还可以先根据特征点的位置信息、尺度信息和/或方向信息进行初步计算,在初步计算结果满足预设条件后,再进行上述的特征向量距离计算和判断。通过上述计算得到待识别图片与目标图片的特征值匹配对数量之后,可以将该特征值匹配对数量作为待识别图片与目标图片的相似度;也可以对该特征值匹配对数量进行归一化处理(例如将特征值匹配对数量除以一预设值),将归一化处理结果作为待识别图片与目标图片的相似度。
目标图片识别单元130根据相似度计算单元120计算出的待识别图片与目标图片集合中各目标图片的相似度,来确定待识别图片是否为目标图片。当相似度计算单元120计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定待识别图片为第一类型目标图片(深度相似图片);当相似度计算单元120计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定待识别图片为第二类型目标图片(轻度相似图片)。
其中,第一门限和第二门限可以根据经验或者实验确定。在一个具体实验中,实验的数据源是从企业网站随机下载的1000张图片,以及一个由100张广告图片组成的广告图片库。由设备100进行广告图片识别,并经过人工验证后,得到的统计结果如下表所示:
表中,X为特征值匹配对数量。由上表可知,第一门限取500,第二门限取50时,图片匹配和识别的综合效果较佳。
在目标图片识别单元130对待识别图片的识别完成后,数据更新单元140可以根据目标图片识别单元130的识别结果,对目标图片集合进行更新。具体地,当待识别图片被识别为第一类型目标图片(深度相似图片)时,不对目标图片集合进行更新;当待识别图片被识别为第二类型目标图片(轻度相似图片)时,将该待识别图片添加到目标图片集合中。这样,目标图片集合既能够得到有效更新,又不至于存在重复的项目,从而保证目标图片集合是完备且不冗余的。这一方面提高了目标图片识别的准确度,另一方面降低了目标图片识别的计算量。需要说明的是,在目标图片集合中包括的目标图片为该目标图片的特征集的情况下,数据更新单元140对目标图片集合进行更新是指,将待识别图片的特征值集添加到目标图片集合中。
根据本发明的一个实施例,当相似度计算单元120计算出的待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,目标图片识别单元130将该待识别图片识别为目标图片,并且是深度相似的目标图片,由于已经得到了图片识别结果,且不需要对目标图片集合进行更新,因此,通知相似度计算单元120停止进行相似度计算,从而能够避免不必要的计算开销。
根据本发明的一个实施例,当相似度计算单元120计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,目标图片识别单元130将该待识别图片标识为未知图片,以便由人工对该未知图片进行识别。相应地,数据更新单元140还适于获取人工对一个或多个未知图片的识别结果,当识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中。同样,将该未知图片添加到目标图片集合中可以是,将该未知图片的特征值集添加到目标图片集合中。
一般而言,人工会批量对多个未知图片进行识别,而这些未知图片之间是没有进行过相似度计算的,因此,如果将人工识别出的所有目标图片直接添加到目标图片集合中,仍然有可能存在冗余的情况。因此,根据本发明的一个实施例,数据更新单元140将未知图片添加到目标图片集合之前,通知相似度计算单元120计算该未知图片与目标图片集合中目标图片的相似度,当相似度计算单元计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
图2示出了根据本发明一个实施例的识别目标图片的方法的流程图,该识别目标图片的方法由计算设备执行。参照图2,该识别目标图片的方法包始于步骤S202,在步骤S202中,计算待识别图片与目标图片集合中目标图片的相似度,其中所述目标图片集合中包括一个或多个目标图片。根据识别对象的不同,目标图片集合中的所述目标图片可以是广告图片、不良图片(例如色情图片)或者其他需要识别的任何图片类型。
初始化时,可以将已有(或者已知)的目标图片加入到目标图片集合,后续,根据对待识别图片的识别结果,对所述目标图片集合进行更新。根据本发明的一个实施方式,在进行两张图片的相似判断时,先利用预定的图片识别算法获取这两张图片各自的特征值集,然后进行特征值匹配,并根据特征值匹配的结果来判断二者的相似度。因此,在一种实现方式中,目标图片集合中包括的目标图片为该目标图片的特征值集。
当目标图片集合中包括的目标图片为该目标图片的特征值集时,可以先计算待识别图片的特征值集,然后对待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
在本发明实施例中,采用的相似图片识别算法可以是颜色分布算法、内容分布算法、平均哈希算法(average hash,ahash)、感知哈希算法(perceptual hash,phash)、尺度不变特征变换算法(Scale-invariant feature transform,sift)、仿射尺度不变特征变换算法(Affine Scale-invariant feature transform,asift)等等。
当采用sift或者asift算法时,图片的特征值集中的每个特征值包括特征点的位置信息(横坐标x、纵坐标y)、尺度信息(scale)、方向信息(orientation)和特征向量信息(vec[128],是一个用于描述特征点的临近范围梯度方向直方图数组)。例如从图片中提取了一个特征点,其特征值为{x=13.5,y=25.4,scale=12.7,angle=36.5,vec[128]={11,230,32,……}}。另外,在asift算法中,还会生成原图片的多张仿射图片。在本发明实施例中,可以将目标图片的原图及其多个仿射图的所有特征值作为该目标图片的特征值集进行存储,即一个目标图片的特征值集中即包括原图的所有特征值,又包括每个仿射图的所有特征值。
需要说明的是,本发明实施例对具体的图片识别算法不做限制,本领域技术人员可以根据需要进行合理选择。
在计算出待识别图片与目标图片集合中目标图片的相似度之后,方法进入步骤S204。在步骤S204中,当计算出的待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定待识别图片为第一类型目标图片(深度相似目标图片);当计算出的待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定待识别图片为第二类型目标图片(轻度相似目标图片)。其中,第一门限和第二门限可以根据经验或者实验确定。
在确定待识别图片为第二类型目标图片之后,方法进入步骤S206。在步骤S206中,将确定为第二类型目标图片的待识别图片添加到目标图片集合中。这样,目标图片集合既能够得到有效更新,又不至于存在重复的项目,从而保证目标图片集合是完备且不冗余的,一方面提高了目标图片识别的准确度,另一方面降低了目标图片识别的计算量。
根据本发明的一个实施例,当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,停止进行相似度计算,从而能够避免不必要的计算开销。
根据本发明的一个实施例,当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图片,以便由人工对该未知图片进行识别。在进行人工识别后,还获取人工对一个或多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中。
一般而言,人工会批量对多个未知图片进行识别,而这些未知图片之间是没有进行过相似度计算的,因此,如果将人工识别出的所有目标图片直接添加到目标图片集合中,仍然有可能存在冗余的情况。因此,根据本发明的一个实施例,在将该未知图片添加到目标图片集合之前,计算该未知图片与目标图片集合中目标图片的相似度,当计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
图3示出了布置为实现根据本发明的识别目标图片的方法的示例计算设备900的框图。在基本的配置902中,计算设备900典型地包括系统存储器906和一个或者多个处理器904。存储器总线908可以用于在处理器904和系统存储器906之间的通信。
取决于期望的配置,处理器904可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器904可以包括诸如一级高速缓存910和二级高速缓存912之类的一个或者多个级别的高速缓存、处理器核心914和寄存器916。示例的处理器核心914可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器918可以与处理器904一起使用,或者在一些实现中,存储器控制器918可以是处理器904的一个内部部分。
取决于期望的配置,系统存储器906可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器906可以包括操作系统920、一个或者多个应用922以及程序数据924。应用922可以包括被配置为实现识别目标图片的方法的识别目标图片的设备926。程序数据924可以包括可用于如此处所述的目标图片集合928。在一些实施方式中,应用922可以布置为在操作系统上利用程序数据924进行操作。
计算设备900还可以包括有助于从各种接口设备(例如,输出设备942、外围接口944和通信设备946)到基本配置902经由总线/接口控制器930的通信的接口总线940。示例的输出设备942包括图形处理单元948和音频处理单元950。它们可以被配置为有助于经由一个或者多个A/V端口952与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外围接口944可以包括串行接口控制器954和并行接口控制器956,它们可以被配置为有助于经由一个或者多个I/O端口958和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备946可以包括网络控制器960,其可以被布置为便于经由一个或者多个通信端口964与一个或者多个其他计算设备962通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备900可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备900还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的识别目标图片的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (9)
1.一种识别目标图片的设备,驻留在计算设备中,该识别目标图片的设备包括:
数据存储单元,适于存储目标图片集合,所述目标图片集合中包括一个或多个目标图片;
相似度计算单元,适于计算待识别图片与目标图片集合中目标图片的相似度;
目标图片识别单元,适于当相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片;当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片;以及
数据更新单元,适于将确定为第二类型目标图片的待识别图片添加到目标图片集合中;
其中,所述目标图片识别单元还适于,当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图片;所述数据更新单元还适于,获取人工对多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中;
其中,所述数据更新单元将该未知图片添加到目标图片集合之前,通知相似度计算单元计算该未知图片与目标图片集合中目标图片的相似度,当相似度计算单元计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
2.如权利要求1所述的识别目标图片的设备,其中,所述目标图片识别单元还适于,当相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,通知相似度计算单元停止进行相似度计算。
3.如权利要求1所述的识别目标图片的设备,其中,所述目标图片集合中包括的目标图片为该目标图片的特征值集;
所述相似度计算单元进一步适于,计算待识别图片的特征值集,根据待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
4.如权利要求3所述的识别目标图片的设备,其中,图片的特征值集是通过仿射尺度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置信息、尺度信息、方向信息和特征向量信息。
5.一种计算设备,包括如权利要求1至4中任一项所述的识别目标图片的设备。
6.一种识别目标图片的方法,由计算设备执行,该识别目标图片的方法包括:
计算待识别图片与目标图片集合中目标图片的相似度,其中所述目标图片集合中包括一个或多个目标图片;
当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片;当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片;以及
将确定为第二类型目标图片的待识别图片添加到目标图片集合中;
当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图片;以及获取人工对多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中;
其中,在将该未知图片添加到目标图片集合之前,计算该未知图片与目标图片集合中目标图片的相似度,当计算出未知图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
7.如权利要求6所述的识别目标图片的方法,其中,当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,停止进行相似度计算。
8.如权利要求6所述的识别目标图片的方法,其中,所述目标图片集合中包括的目标图片为该目标图片的特征值集;
所述计算待识别图片与目标图片集合中目标图片的相似度包括:计算待识别图片的特征值集,根据待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
9.如权利要求8所述的识别目标图片的方法,其中,图片的特征值集是通过仿射尺度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置信息、尺度信息、方向信息和特征向量信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410559532.9A CN104318259B (zh) | 2014-10-20 | 2014-10-20 | 一种识别目标图片的设备、方法以及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410559532.9A CN104318259B (zh) | 2014-10-20 | 2014-10-20 | 一种识别目标图片的设备、方法以及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104318259A CN104318259A (zh) | 2015-01-28 |
CN104318259B true CN104318259B (zh) | 2017-08-25 |
Family
ID=52373488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410559532.9A Active CN104318259B (zh) | 2014-10-20 | 2014-10-20 | 一种识别目标图片的设备、方法以及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104318259B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105518709B (zh) * | 2015-03-26 | 2019-08-09 | 北京旷视科技有限公司 | 用于识别人脸的方法、系统和计算机程序产品 |
CN106815588B (zh) * | 2015-12-01 | 2020-09-29 | 阿里巴巴集团控股有限公司 | 垃圾图片过滤方法及装置 |
CN106126574A (zh) * | 2016-06-16 | 2016-11-16 | 深圳市矽伟智科技有限公司 | 图片的识别方法、系统及物联网摄像设备 |
CN106327457B (zh) * | 2016-08-23 | 2020-02-18 | 北京金山安全软件有限公司 | 一种图片处理方法、装置及设备 |
CN107203990B (zh) * | 2017-04-02 | 2020-12-18 | 南京汇川图像视觉技术有限公司 | 一种基于模板匹配与图像质量评估的标贴破损检测方法 |
CN107133221A (zh) * | 2017-06-09 | 2017-09-05 | 北京京东尚科信息技术有限公司 | 信息审核方法、装置、计算机可读介质和电子设备 |
CN109145926B (zh) * | 2017-06-13 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 相似图片识别方法及计算机设备 |
CN109947965B (zh) * | 2017-09-04 | 2023-09-05 | 阿里巴巴集团控股有限公司 | 对象识别、数据集合的更新、数据处理方法与装置 |
CN107958272B (zh) * | 2017-12-12 | 2020-11-24 | 北京旷视科技有限公司 | 图片数据集更新方法、装置、系统及计算机存储介质 |
CN109408362A (zh) * | 2018-08-21 | 2019-03-01 | 中国平安人寿保险股份有限公司 | 应用程序兼容性测试方法、装置、系统及存储介质 |
CN109598726A (zh) * | 2018-10-26 | 2019-04-09 | 哈尔滨理工大学 | 一种基于slic的自适应图像目标区域分割方法 |
CN109447154B (zh) * | 2018-10-29 | 2021-06-04 | 网易(杭州)网络有限公司 | 图片相似度检测方法、装置、介质及电子设备 |
CN110807110B (zh) * | 2019-09-30 | 2023-02-28 | 奇安信科技集团股份有限公司 | 结合局部和全局特征的图片搜索方法、装置及电子设备 |
CN113128923A (zh) * | 2020-01-15 | 2021-07-16 | 北京京东乾石科技有限公司 | 一种储位推荐方法和装置 |
CN111368128B (zh) * | 2020-03-12 | 2023-09-29 | 京东科技信息技术有限公司 | 目标图片的识别方法、装置和计算机可读存储介质 |
CN113191661A (zh) * | 2021-05-17 | 2021-07-30 | 广州市珑玺信息科技有限公司 | 广告监播的方法、装置、存储介质及处理器 |
CN113343920A (zh) * | 2021-07-01 | 2021-09-03 | 中诚信征信有限公司 | 人脸识别照片的分类方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101216884A (zh) * | 2007-12-29 | 2008-07-09 | 北京中星微电子有限公司 | 一种人脸认证的方法及系统 |
CN102722709A (zh) * | 2012-05-23 | 2012-10-10 | 杭州朗和科技有限公司 | 一种垃圾图片识别方法和装置 |
CN103942239A (zh) * | 2013-01-23 | 2014-07-23 | 富士施乐株式会社 | 信息处理装置和信息处理方法 |
CN103970754A (zh) * | 2013-01-28 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 文章的自动选取方法及装置 |
-
2014
- 2014-10-20 CN CN201410559532.9A patent/CN104318259B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101216884A (zh) * | 2007-12-29 | 2008-07-09 | 北京中星微电子有限公司 | 一种人脸认证的方法及系统 |
CN102722709A (zh) * | 2012-05-23 | 2012-10-10 | 杭州朗和科技有限公司 | 一种垃圾图片识别方法和装置 |
CN103942239A (zh) * | 2013-01-23 | 2014-07-23 | 富士施乐株式会社 | 信息处理装置和信息处理方法 |
CN103970754A (zh) * | 2013-01-28 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 文章的自动选取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104318259A (zh) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104318259B (zh) | 一种识别目标图片的设备、方法以及计算设备 | |
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
US10762387B2 (en) | Method and apparatus for processing image | |
US20210182333A1 (en) | Correlating image annotations with foreground features | |
US9697233B2 (en) | Image processing and matching | |
US20190050641A1 (en) | Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers | |
CN108229296B (zh) | 人脸皮肤属性识别方法和装置、电子设备、存储介质 | |
US9349076B1 (en) | Template-based target object detection in an image | |
CN107977665A (zh) | 一种发票中关键信息的识别方法及计算设备 | |
TW201832138A (zh) | 圖像識別方法及裝置 | |
US11250292B2 (en) | Method and apparatus for generating information | |
CN109829453A (zh) | 一种卡证中文字的识别方法、装置以及计算设备 | |
CN113435583B (zh) | 基于联邦学习的对抗生成网络模型训练方法及其相关设备 | |
CN107808147A (zh) | 一种基于实时人脸点跟踪的人脸置信度判别方法 | |
JP6997369B2 (ja) | プログラム、測距方法、及び測距装置 | |
CN108734520B (zh) | 一种基于机器学习的玉石价格评估方法及装置 | |
CN110647931A (zh) | 物体检测方法、电子设备、系统及介质 | |
CN113704184A (zh) | 一种文件分类方法、装置、介质及设备 | |
CN112990376A (zh) | 一种文本图像相似度评估方法、装置及计算设备 | |
CN110210314B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN108446737B (zh) | 用于识别对象的方法和装置 | |
CN110956131A (zh) | 单目标追踪方法、装置及系统 | |
Parker | Robust processing of diffusion weighted image data | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN109685015A (zh) | 图像的处理方法、装置、电子设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |