CN106294577A - 图片检测方法及装置 - Google Patents
图片检测方法及装置 Download PDFInfo
- Publication number
- CN106294577A CN106294577A CN201610605205.1A CN201610605205A CN106294577A CN 106294577 A CN106294577 A CN 106294577A CN 201610605205 A CN201610605205 A CN 201610605205A CN 106294577 A CN106294577 A CN 106294577A
- Authority
- CN
- China
- Prior art keywords
- picture
- candidate
- inquiry
- feature
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开是关于一种图片检测方法及装置,属于图像处理技术领域。所述方法包括:根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;提取所述查询图片的第一尺度不变特征变换SIFT特征点;提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。由于直方图特征算法的计算时间快,而SIFT算法的计算精度高,因此将二者结合进行相似图片的检测,可同时兼顾精度与速度的双重要求,所以可大大提升工作效率,缩短图片检测所耗时间。
Description
技术领域
本公开涉及图像处理技术领域,特别涉及一种图片检测方法及装置。
背景技术
在日常工作生活中,我们常常会遇到下述几种令人较为头疼的情况:场景一、用户在浏览网页或微博等社交平台时看到一件自己特别喜欢的衣服,但是当前页面仅示出了这款衣服的外形,不包括任何其他细节信息。用户若想获知这款衣服的材质、价钱或者尺码等信息,则或者需要询问他人或者根据衣服的款式或颜色等在购物类应用或搜索引擎中进行模糊搜索,这样得到的搜索结果往往针对性很差。场景二、用户在移动终端上存储了大量的图片,如果用户想要将相似的图片归类聚合到一起,则还需手动逐一在海量图片中进行挑选,再将相似的图片聚合到同一个文件夹中。
针对上述每一种场景来说工作效率都非常低,会浪费用户大量的时间。如果此时可以提供一种自动检测相似图片的方法,比如购物类应用或搜索引擎在接收到用户上传的一张衣服图片后,通过进行相似图片检测,自动给出相似衣服的图片,则可大大提升工作效率,缩短所耗时间。
发明内容
为克服相关技术中存在的问题,本公开提供一种图片检测方法及装置。
根据本公开实施例的第一方面,提供一种图片检测方法,所述方法包括:
根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;
提取所述查询图片的第一SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)特征点;
提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;
根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
在另一个实施例中,所述根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片,包括:
计算所述第一SIFT特征点的第一描述子;
计算每一张候选图片的第二SIFT特征点的第二描述子;
分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;
根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
在另一个实施例中,所述根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片,包括:
对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;
在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
在另一个实施例中,所述方法还包括:
计算图片集中每一张样本图片的直方图特征;
对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
在另一个实施例中,所述根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从图片索引库中获取与所述查询图片相似的至少一张候选图片,包括:
计算所述查询图片的直方图特征;
对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;
根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
根据本公开实施例的第二方面,提供一种图片检测装置,所述装置包括:
获取模块,被配置为根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;
提取模块,被配置为提取所述查询图片的第一SIFT特征点;
所述提取模块,还被配置为提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;
确定模块,被配置为根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
在另一个实施例中,所述确定模块,被配置为计算所述第一SIFT特征点的第一描述子;计算每一张候选图片的第二SIFT特征点的第二描述子;分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
在另一个实施例中,所述确定模块,被配置为对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
在另一个实施例中,所述装置还包括:
计算模块,被配置为计算图片集中每一张样本图片的直方图特征;
归一化模块,被配置为对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
建立模块,被配置为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
在另一个实施例中,所述获取模块,被配置为计算所述查询图片的直方图特征;对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
根据本公开实施例的第三方面,提供一种图片检测装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;提取所述查询图片的第一SIFT特征点;提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
本公开的实施例提供的技术方案可以包括以下有益效果:
在获取到一张查询图片后,首先基于直方图特征在图片索引库中初步筛选出一部分候选图片,之后在基于查询图片和筛选出的候选图片的SIFT特征,在这些候选图片中进一步筛选出与查询图片相似的目标图片,由于直方图特征算法的计算时间快,而SIFT算法的计算精度高,因此将二者结合进行相似图片的检测,可同时兼顾精度与速度的双重要求,所以可大大提升工作效率,缩短图片检测所耗时间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种图片检测方法的流程图。
图2是根据一示例性实施例示出的一种图片检测方法的流程图。
图3是根据一示例性实施例示出的一种图片检测装置的框图。
图4是根据一示例性实施例示出的一种图片检测装置的框图。
图5是根据一示例性实施例示出的一种图片检测装置的框图。
图6是根据一示例性实施例示出的一种图片检测装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图片检测方法的流程图,如图1所示,该方法用于终端或服务器中,包括以下步骤。
在步骤101中,根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从图片索引库中获取与该查询图片相似的至少一张候选图片。
在步骤102中,提取该查询图片的第一SIFT特征点。
在步骤103中,提取至少一张候选图片中每一张候选图片的第二SIFT特征点。
在步骤104中,根据第一SIFT特征点和每一张候选图片的第二SIFT特征点,从至少一张候选图片中确定与该查询图片相似的目标图片。
本公开实施例提供的方法,在获取到一张查询图片后,首先基于直方图特征在图片集中初步筛选出一部分候选图片,之后在基于查询图片和筛选出的候选图片的SIFT特征,在这些候选图片中进一步筛选出与查询图片相似的目标图片,由于直方图特征算法的计算时间快,而SIFT算法的计算精度高,因此将二者结合进行相似图片的检测,可同时兼顾精度与速度的双重要求,所以可大大提升工作效率,缩短图片检测所耗时间。
在另一个实施例中,所述根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片,包括:
计算所述第一SIFT特征点的第一描述子;
计算每一张候选图片的第二SIFT特征点的第二描述子;
分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;
根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
在另一个实施例中,所述根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片,包括:
对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;
在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
在另一个实施例中,该方法还包括:
计算图片集中每一张样本图片的直方图特征;
对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
在另一个实施例中,所述根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从图片索引库中获取与所述查询图片相似的至少一张候选图片,包括:
计算所述查询图片的直方图特征;
对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;
根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种图片检测方法的流程图。本实施例以直方图特征为灰度直方图为例进行说明,如图2所示,该方法用于终端或服务器中,包括以下步骤。
在步骤201中,计算图片集中每一张样本图片的灰度直方图。
在本公开实施例中,图片集是一个图片的集合,包括成千上万张样本图片。对于一个新获取到的查询图片,从这个图片集中检索出与该查询图片相似的至少一张图片。其中,灰度直方图是关于灰度等级分布的函数,是对图像中灰度等级分布的统计。灰度直方图将图像中的所有像素点,按照不同的灰度等级统计其出现的频率(次数)。
在计算灰度直方图时,如果图片集中存在彩色图片,则还需将所有彩色图片形式的样本图片先转化为灰度图片。之后,对于每一张样本图片可以初始化一个灰度直方图数组H=[h(x1),h(x2),h(x3),...,h(xn)],然后采用matlab等程序逐个像素点完成灰度等级的频率分布统计,得到灰度直方图。其中,n的取值为正整数,h(x1),h(x2),h(x3),...,h(xn)表示各个灰度等级的出现频率(次数)。由于目前多采用由黑到白的256灰度色阶,因此n的取值通常为256。
在步骤202中,对图片集中每一张样本图片的灰度直方图进行归一化处理,得到归一化灰度直方图,并为每一张样本图片的归一化灰度直方图建立基于K-D随机森林算法的索引,得到一个图片索引库。
在本公开实施例中,在得到每一样本图片的灰度直方图后,还会对该灰度直方图进行归一化处理。在进行归一化处理时,得到的灰度直方图数组为H'=[h'(x1),h'(x2),h'(x3),...,h'(xn)]。其中,i、j的取值均为正整数,0﹤i﹤n。h(xi)表示某一个灰度等级的出现频率,样本图片中的像素点总数。需要说明的是,本公开实施例会对这些样本图片的归一化灰度直方图建立基于K-D随机森林算法的索引。
其中,K-D随机森林算法是基于K-D树的随机森林算法。K-D树是一种对K维空间中的实例点进行存储以方便对齐进行快速检索的树形数据结构,K-D树可以用于多维空间关键数据的搜索,例如范围搜索和最近邻搜索。在本公开实施例中实例点即为各个样本图片的归一化灰度直方图。建立图片索引库时:首先构造根节点,使根节点对应于K维空间中包含所有实例点的超矩形区域;通过递归方法,不断地对K维空间进行划分,生成子节点。在超矩形区域上选择一个坐标轴和在此坐标轴上的一个切分点,确定一个超平面,这个超平面通过选定的切分点并垂直于选定的坐标轴,将当前超矩形区域切分为左右两个子区域;这时,实例点被分到两个子区域。这个过程直到子区域内没有实例点时终止,终止时的结点即为叶子结点。在此过程中,将实例点保存到相应的结点上,完成图片索引库即K-D树的建立。
在步骤203中,在获取到查询图片后,计算该查询图片的灰度直方图,并对该查询图片的灰度直方图进行归一化处理,得到该查询图片的归一化灰度直方图。
本公开实施例提及的图片检测方法可用于多种场景下,以“以图搜图”这种场景为例,用户终端会通过搜索引擎或者购物类应用的搜索框上传查询图片,以在服务器中查询与该图片相似的图片。而服务器在接收到用户终端上传的查询图片后,采取与上述步骤201一样的方式计算该查询图片的灰度直方图,并对该灰度直方图进行归一化处理。
在步骤204中,根据该查询图片的归一化灰度直方图和图片索引库中各图片的灰度直方图,从图片索引库中获取与该查询图片相似的至少一张候选图片。
在本公开实施例中,由于建立了基于K-D随机森林算法的图片索引库,所以依据最近邻搜索方式,在图片索引库中找到一部分归一化灰度直方图,使其距离该查询图片的归一化灰度直方图的距离是最近的。利用K-D树无需对全部图片的归一化灰度直方图进行检索,从而减少检索的计算量。其中,在从图片索引库中获取与该查询图片相似的至少一张候选图片时,可采取下述方式实现:在给定一个目标实例点(即查询图片的归一化灰度直方图)后,搜索其最近邻,首先通过二分搜索,顺着搜索路径找到最近邻的近似实例点,也即与目标实例点处于同一个子空间的叶子结点;然后从该叶子结点回溯,并判断搜索路径上的结点的其他子结点空间中是否可能有距离当前查询点更近的实例点,如果有,则跳到其他子结点空间中去搜索,并将其他子结点加入到搜索路径。重复这个过程直到搜索路径为空。
需要说明的是,包含目标实例点的叶节点对应包含目标实例点的最小超矩形区域。以此叶节点的实例点作为当前最近点。目标实例点的最近邻一定在以目标实施例点为中心并通过当前最临近点的超球体的内部,然后返回当前结点的父节点,如果父节点的另一子节点的超矩形区域与超球体相交,那么在相交的区域内寻找与目标实例点更近的实例点。如果存在这样的实例点,将此实例点作为新的当前最近点。转到更上一级的父节点,继续上述过程。如果父节点的另一子节点的超矩形区域与超球体不相交,或不存在比当前最近点更近的实施例点,则停止搜索。在得到搜索后的归一化灰度直方图后,将图片索引库中这些归一化灰度直方图指示的图片作为上述至少一张候选图片。
在步骤205中,提取该查询图片的第一SIFT特征点,并提取至少一张候选图片中每一张候选图片的第二SIFT特征点。
对于上述基于灰度直方图的图片筛选方式来讲,其计算速度很快,但是精度不是很高,所以本公开实施例利用灰度直方图特征来作第一步的快速筛选。接下来为了提高相似图片的检索精度,使得检索到的图片与查询图片的吻合度尽可能高,本公开实施例还提出了提取查询图片和每一张候选图片的SIFT特征点的方式,基于这些特征点的描述子再进一步地在这些候选图片中进行相似图片筛选。其中,SIFT特征点是用于图像处理领域的一种描述。这种描述具有尺度不变性,是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。在一张图片中提取SIFT特征点时,可采取下述方式实现:
首先,构建尺度空间。这是一个初始化操作,尺度空间理论目的是模拟图像数据的多尺度特征。通常来讲,要精确表示的物体都是通过一定的尺度来反映的。现实世界的物体也总是通过不同尺度的观察而得到不同的变化。比如说,对同一物体拍照,我们拍摄了一副近景和一副远景,虽然两幅图片中都有这个物体,但这个物体确是处于两个不同的尺度。SIFT特征具有尺度不变性,也就是说即使同一物体处于两个不同的尺度的图像中,我们仍可以通过提取图像的SIFT特征匹配成功。图像的尺度有多种表示方法(金字塔、八叉树等),在SIFT中采用了尺度空间理论。其主要思想是通过对原始图像进行尺度变换,获得图像多尺度下的尺度空间表示序列,并检测这个序列中的关键点。这样图片便被映射为多个尺度上的关键点信息。
其次,LoG(Laplacian of Gaussian,高斯拉普拉斯)近似DoG(Difference ofGaussian,高斯差分)找到SIFT特征点。为了寻找尺度空间的极值点,每一个采样点要和它所有的相邻点比较,判断其是否比它的图像域和尺度域的相邻点大或者小。中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。一个点如果在DOG尺度空间本层以及上下两层的26个领域中是最大或最小值时,便认为该点是图像在该尺度下的一个SIFT特征点。
再者,去除一些不稳定的SIFT特征点,比如边界和低亮度区域的特征点,除去它们以使得算法有效和鲁棒,比如使用近似Harris Corner检测器来完成SIFT特征点的去除。需要说明的是,在本公开实施例中,为了区分查询图片的SIFT特征点和候选图片的SIFT特征点,分别以第一SIFT特征点和第二SIFT特征点对查询图片和每一张候选图片的SIFT特征点进行区分。
在步骤206中,根据该查询图片的第一SIFT特征点和每一张候选图片的第二SIFT特征点,从至少一张候选图片中确定与该查询图片相似的目标图片。
在本公开实施例中,在根据SIFT特征点在这些候选图片中进行相似图片的筛选时,通常采取下述方式实现:
第一步、分别计算第一SIFT特征点的第一描述子和每一张候选图片的第二SIFT特征点的第二描述子。
描述子(descriptor)实质上是每个SIFT特征点的唯一用于对其进行标识的指纹。为了得到这样的描述子,可以将SIFT特征点周围的16*16窗口分解为16个4*4的子窗口。在每个4*4的子窗口中,计算出梯度的大小和方向,并用一个8个bin的直方图来统计子窗口的平均方向。其中,梯度方向在0-44度范围的像素点被放到第一个bin中,45-89度范围的像素点被放到下一个bin中,依此类推。同样加入到bin中的量依赖于该像素点梯度的大小。与之前不同的是,加入的量不仅与像素点的梯度大小相关,而且还依赖离SIFT特征点的距离,这样远离SIFT特征点的像素点会加入较少的量到直方图中。这通过一个高斯加权函数来实现,这个高斯加权函数函数生成一个加权值,用它乘以16*16窗口中每个像素点的梯度大小,得到加权后的梯度大小,距离SIFT特征点越远,要加入直方图的像素点的梯度大小越小。
这样每个4*4的子窗口都对应一个8bin的直方图,且直方图中加入的量是像素的用高斯加权后的梯度大小,而SIFT特征点周围16*16窗口中包含16个4*4的子窗口,共有16*8=128个数,然后将这128个数组成的向量进行单位化,单位化后的128维向量就是SIFT特征点的描述子。特征点描述子的维数可以不同,此处仅以128维为例进行举例说明。
第二步、分别将第一描述子、第二SIFT特征点的第二描述子映射为相同长度的第一特征向量和第二特征向量。
由于在每张图片中提取到的SIFT特征点的数量比较多,直接用来做特征点匹配速度会比较慢,且每张图片中的特征点数量不同,匹配结果的好坏不好量化。为此,本公开实施例使用BOF(Bag of Feature,特征袋)方法,将每张图片的SIFT特征点的描述子映射为一个相同长度的特征向量。
第三步、对于每一张候选图片,分别计算第一特征向量和该候选图片的第二特征向量之间的余弦距离;在上述余弦距离中的第一余弦距离大于预设阈值时,将与第一余弦距离对应的候选图片确定为与该查询图片相似的目标图片。
在本公开实施例中,分别计算查询图片的第一特征向量、与每一张候选图片的第二特征向量之间的余弦距离,且在得到的余弦距离中选取大于预设阈值的第一余弦距离,将第一余弦距离指示的候选图片确定为目标图片。也即,如果查询图片的第一特征向量与某一个候选图片的第二特征向量之间的余弦距离大于预设阈值,则证明该候选图片与查询图片的相似度较高,将其保留;如果查询图片的第一特征向量与某一个候选图片的第二特征向量之间的余弦距离小于预设阈值,则证明该候选图片与查询图片的相似度较差,将其滤除。在将每一张候选图片的第二特征向量分别与查询图片的第一特征向量进行计算后,除去过滤掉的候选图片,剩余的候选图片便为与该查询图片相似的目标图片。其中,目标图片的张数可为一张也可为多张,本公开实施例对此不进行具体限定。
本公开实施例提供的方法,在获取到一张查询图片后,首先基于直方图特征在图片集中初步筛选出一部分候选图片,之后在基于查询图片和筛选出的候选图片的SIFT特征,在这些候选图片中进一步筛选出与查询图片相似的目标图片,由于直方图特征算法的计算时间快,而SIFT算法的计算精度高,因此将二者结合进行相似图片的检测,可同时兼顾精度与速度的双重要求,所以可大大提升工作效率,缩短图片检测所耗时间。
图3是根据一示例性实施例示出的一种图片检测装置的框图。参照图3,该装置包括获取模块301,提取模块302和确定模块303。
获取模块301,被配置为根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;
提取模块302,被配置为提取所述查询图片的第一SIFT特征点;
所述提取模块302,还被配置为提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;
确定模块303,被配置为根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
在另一个实施例中,所述确定模块303,被配置为计算所述第一SIFT特征点的第一描述子;计算每一张候选图片的第二SIFT特征点的第二描述子;分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
在另一个实施例中,所述确定模块303,被配置为对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
在另一个实施例中,参见图4,该装置还包括:
计算模块304,被配置为计算图片集中每一张样本图片的直方图特征;
归一化模块305,被配置为对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
建立模块306,被配置为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
在另一个实施例中,所述获取模块301,被配置为计算所述查询图片的直方图特征;对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
本公开实施例提供的装置,在获取到一张查询图片后,首先基于直方图特征在图片集中初步筛选出一部分候选图片,之后在基于查询图片和筛选出的候选图片的SIFT特征,在这些候选图片中进一步筛选出与查询图片相似的目标图片,由于直方图特征算法的计算时间快,而SIFT算法的计算精度高,因此将二者结合进行相似图片的检测,可同时兼顾精度与速度的双重要求,所以可大大提升工作效率,缩短图片检测所耗时间。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种图片检测装置500的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,I/O(Input/Output,输入/输出)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如SRAM(Static Random Access Memory,静态随机存取存储器),EEPROM(Electrically-Erasable Programmable Read-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read Only Memory,可擦除可编程只读存储器),PROM(Programmable Read-Only Memory,可编程只读存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括LCD(Liquid Crystal Display,液晶显示器)和TP(TouchPanel,触摸面板)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个MIC(Microphone,麦克风),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS(Complementary Metal OxideSemiconductor,互补金属氧化物)或CCD(Charge-coupled Device,电荷耦合元件)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括NFC(Near Field Communication,近场通信)模块,以促进短程通信。例如,在NFC模块可基于RFID(Radio FrequencyIdentification,射频识别)技术,IrDA(Infra-red Data Association,红外数据协会)技术,UWB(Ultra Wideband,超宽带)技术,BT(Bluetooth,蓝牙)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个ASIC(Application SpecificIntegrated Circuit,应用专用集成电路)、DSP(Digital signal Processor,数字信号处理器)、DSPD(Digital signal Processor Device,数字信号处理设备)、PLD(ProgrammableLogic Device,可编程逻辑器件)、FPGA)(Field Programmable Gate Array,现场可编程门阵列)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图片检测方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器)、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述图片检测方法。
图6是根据一示例性实施例示出的一种图片检测装置600的框图。例如,装置600可以被提供为一服务器。参照图6,装置600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述图片检测方法。
装置600还可以包括一个电源组件626被配置为执行装置600的电源管理,一个有线或无线网络接口650被配置为将装置600连接到网络,和一个输入输出(I/O)接口658。装置600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (11)
1.一种图片检测方法,其特征在于,所述方法包括:
根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;
提取所述查询图片的第一尺度不变特征变换SIFT特征点;
提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;
根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片,包括:
计算所述第一SIFT特征点的第一描述子;
计算每一张候选图片的第二SIFT特征点的第二描述子;
分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;
根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片,包括:
对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;
在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
计算图片集中每一张样本图片的直方图特征;
对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
5.根据权利要求4所述的方法,其特征在于,所述根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从图片索引库中获取与所述查询图片相似的至少一张候选图片,包括:
计算所述查询图片的直方图特征;
对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;
根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
6.一种图片检测装置,其特征在于,所述装置包括:
获取模块,被配置为根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;
提取模块,被配置为提取所述查询图片的第一尺度不变特征变换SIFT特征点;
所述提取模块,还被配置为提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;
确定模块,被配置为根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,被配置为计算所述第一SIFT特征点的第一描述子;计算每一张候选图片的第二SIFT特征点的第二描述子;分别将所述第一描述子、第二描述子映射为长度相同的第一特征向量和第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述至少一张候选图片中与所述查询图片相似的目标图片。
8.根据权利要求7所述的装置,其特征在于,所述确定模块,被配置为对于每一张候选图片,分别计算所述第一特征向量和所述第二特征向量之间的余弦距离;在所述余弦距离中的第一余弦距离大于预设阈值时,将与所述第一余弦距离对应的候选图片确定为与所述查询图片相似的目标图片。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
计算模块,被配置为计算图片集中每一张样本图片的直方图特征;
归一化模块,被配置为对每一张样本图片的直方图特征进行归一化处理,得到归一化直方图特征;
建立模块,被配置为所述每一张样本图片的归一化直方图特征建立基于K-D随机森林算法的索引,得到所述图片索引库。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,被配置为计算所述查询图片的直方图特征;对所述查询图片的直方图特征进行归一化处理,得到所述查询图片的归一化直方图特征;根据所述查询图片的归一化直方图特征和所述图片索引库中各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片。
11.一种图片检测装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:根据查询图片的直方图特征和图片索引库中的各图片的直方图特征,从所述图片索引库中获取与所述查询图片相似的至少一张候选图片;提取所述查询图片的第一尺度不变特征变换SIFT特征点;提取所述至少一张候选图片中每一张候选图片的第二SIFT特征点;根据所述第一SIFT特征点和每一张候选图片的第二SIFT特征点,从所述至少一张候选图片中确定与所述查询图片相似的目标图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610605205.1A CN106294577A (zh) | 2016-07-27 | 2016-07-27 | 图片检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610605205.1A CN106294577A (zh) | 2016-07-27 | 2016-07-27 | 图片检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106294577A true CN106294577A (zh) | 2017-01-04 |
Family
ID=57662540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610605205.1A Pending CN106294577A (zh) | 2016-07-27 | 2016-07-27 | 图片检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106294577A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688824A (zh) * | 2017-07-27 | 2018-02-13 | 平安科技(深圳)有限公司 | 图片匹配方法及终端设备 |
CN108765532A (zh) * | 2018-05-04 | 2018-11-06 | 北京物灵智能科技有限公司 | 儿童绘本模型建立方法、阅读机器人及存储设备 |
CN110321858A (zh) * | 2019-07-08 | 2019-10-11 | 北京字节跳动网络技术有限公司 | 视频相似度确定方法、装置、电子设备及存储介质 |
CN110532413A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 基于图片匹配的信息检索方法、装置、计算机设备 |
CN110929764A (zh) * | 2019-10-31 | 2020-03-27 | 北京三快在线科技有限公司 | 图片审核方法和装置,电子设备及存储介质 |
CN111309955A (zh) * | 2017-02-13 | 2020-06-19 | 哈尔滨理工大学 | 一种面向图像检索的融合方法 |
WO2020181793A1 (en) * | 2019-03-11 | 2020-09-17 | Boe Technology Group Co., Ltd. | Reverse image search method, apparatus and application system |
CN112581516A (zh) * | 2020-11-30 | 2021-03-30 | 北京迈格威科技有限公司 | 图像匹配方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150010231A1 (en) * | 2009-05-19 | 2015-01-08 | Digimarc Corporation | Histogram methods and systems for object recognition |
CN105512175A (zh) * | 2015-11-23 | 2016-04-20 | 东莞市凡豆信息科技有限公司 | 一种基于颜色特征和纹理特征的快速图像检索方法 |
CN105550381A (zh) * | 2016-03-17 | 2016-05-04 | 北京工业大学 | 一种基于改进sift特征的高效图像检索方法 |
-
2016
- 2016-07-27 CN CN201610605205.1A patent/CN106294577A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150010231A1 (en) * | 2009-05-19 | 2015-01-08 | Digimarc Corporation | Histogram methods and systems for object recognition |
CN105512175A (zh) * | 2015-11-23 | 2016-04-20 | 东莞市凡豆信息科技有限公司 | 一种基于颜色特征和纹理特征的快速图像检索方法 |
CN105550381A (zh) * | 2016-03-17 | 2016-05-04 | 北京工业大学 | 一种基于改进sift特征的高效图像检索方法 |
Non-Patent Citations (2)
Title |
---|
牛又奇,王晋: "《多媒体技术及应用》", 31 July 2005, 中国农业出版社 * |
王佩军,徐亚明: "《摄影测量学》", 30 September 2005, 武汉大学出版社 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309955B (zh) * | 2017-02-13 | 2022-06-24 | 哈尔滨理工大学 | 一种面向图像检索的融合方法 |
CN111309955A (zh) * | 2017-02-13 | 2020-06-19 | 哈尔滨理工大学 | 一种面向图像检索的融合方法 |
CN111309956A (zh) * | 2017-02-13 | 2020-06-19 | 哈尔滨理工大学 | 一种面向图像检索的提取方法 |
CN111309956B (zh) * | 2017-02-13 | 2022-06-24 | 哈尔滨理工大学 | 一种面向图像检索的提取方法 |
CN107688824A (zh) * | 2017-07-27 | 2018-02-13 | 平安科技(深圳)有限公司 | 图片匹配方法及终端设备 |
CN108765532A (zh) * | 2018-05-04 | 2018-11-06 | 北京物灵智能科技有限公司 | 儿童绘本模型建立方法、阅读机器人及存储设备 |
CN108765532B (zh) * | 2018-05-04 | 2023-08-22 | 卢卡(北京)智能科技有限公司 | 儿童绘本模型建立方法、阅读机器人及存储设备 |
US11481432B2 (en) | 2019-03-11 | 2022-10-25 | Beijing Boe Technology Development Co., Ltd. | Reverse image search method, apparatus and application system |
WO2020181793A1 (en) * | 2019-03-11 | 2020-09-17 | Boe Technology Group Co., Ltd. | Reverse image search method, apparatus and application system |
CN110321858B (zh) * | 2019-07-08 | 2022-06-14 | 北京字节跳动网络技术有限公司 | 视频相似度确定方法、装置、电子设备及存储介质 |
CN110321858A (zh) * | 2019-07-08 | 2019-10-11 | 北京字节跳动网络技术有限公司 | 视频相似度确定方法、装置、电子设备及存储介质 |
CN110532413A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 基于图片匹配的信息检索方法、装置、计算机设备 |
CN110532413B (zh) * | 2019-07-22 | 2023-08-08 | 平安科技(深圳)有限公司 | 基于图片匹配的信息检索方法、装置、计算机设备 |
CN110929764A (zh) * | 2019-10-31 | 2020-03-27 | 北京三快在线科技有限公司 | 图片审核方法和装置,电子设备及存储介质 |
CN112581516A (zh) * | 2020-11-30 | 2021-03-30 | 北京迈格威科技有限公司 | 图像匹配方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106294577A (zh) | 图片检测方法及装置 | |
KR101346730B1 (ko) | 화상 처리 시스템, 화상 처리 장치 및 방법, 프로그램, 및기록 매체 | |
CN105072337B (zh) | 图片处理方法及装置 | |
JP5934653B2 (ja) | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 | |
US8571358B2 (en) | Methods and apparatuses for facilitating content-based image retrieval | |
CN105472239B (zh) | 照片处理方法及装置 | |
US20150055879A1 (en) | Method, Server and System for Setting Background Image | |
CN110472091B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
KR101650994B1 (ko) | 객체 인식에서 피처 생성을 개선시키기 위한 시스템들 및 방법들 | |
KR20070079330A (ko) | 표시 제어장치 및 방법, 컴퓨터 프로그램, 및 기록 매체 | |
FR3009635A1 (fr) | Procede de recherche d'une image similaire dans une banque d'images a partir d'une image de reference | |
CN105608476B (zh) | 基于随机森林分类器的分类方法及装置 | |
CN105809174A (zh) | 识别图像的方法及装置 | |
CN109034150A (zh) | 图像处理方法及装置 | |
CN109635142A (zh) | 图像选择方法及装置、电子设备和存储介质 | |
CN105590113A (zh) | 基于执法记录仪的信息采集方法及执法记录仪 | |
CN115238787A (zh) | 异常数据检测方法、装置、设备及存储介质 | |
CN114926757A (zh) | 遗失物品的找回方法及系统、电子设备及计算机存储介质 | |
CN110019907B (zh) | 一种图像检索方法及装置 | |
US20170200062A1 (en) | Method of determination of stable zones within an image stream, and portable device for implementing the method | |
CN108174091B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN115393755A (zh) | 视觉目标跟踪方法、装置、设备以及存储介质 | |
CN110097758A (zh) | 车辆信息输出、存储方法及装置 | |
CN108647704B (zh) | 一种信息获取方法、装置、计算机设备和可读存储介质 | |
CN111694979A (zh) | 一种基于图像的档案管理方法、系统、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170104 |