CN103294676A - 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 - Google Patents

一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 Download PDF

Info

Publication number
CN103294676A
CN103294676A CN2012100428068A CN201210042806A CN103294676A CN 103294676 A CN103294676 A CN 103294676A CN 2012100428068 A CN2012100428068 A CN 2012100428068A CN 201210042806 A CN201210042806 A CN 201210042806A CN 103294676 A CN103294676 A CN 103294676A
Authority
CN
China
Prior art keywords
feature
image
sift
gist
hash table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100428068A
Other languages
English (en)
Inventor
李洋
胡楠
邹国平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING MINGRI FASHION INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING MINGRI FASHION INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING MINGRI FASHION INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING MINGRI FASHION INFORMATION TECHNOLOGY Co Ltd
Priority to CN2012100428068A priority Critical patent/CN103294676A/zh
Publication of CN103294676A publication Critical patent/CN103294676A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明是一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,包括:对图像分别提取GIST特征和SIFT特征,GIST特征用于识别图像全局不变性,SIFT特征用于识别图像局部不变性;对两种特征分别采用LSH(LocalitySensitiveHashing,位置敏感哈希)算法建立索引和匹配图像特征,进行内容重复检测。

Description

一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法
技术领域
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,属于基于内容的图片检索领域。
背景技术
随着网络技术和数字成像技术的发展,人们可以以一种简便的方式创造图片,并轻松地在互联网上分享、传播,其他人也能够不受限制地下载、拷贝并修改图片。这样,一方面图片的版权不能得到有效的保护,另一方面也将导致网络上的图片大量地存在内容上的重复。为了解决这些问题,本发明提出了一种网络图片内容重复的检测方法,其不仅可以用于图片版权的保护,还可以用于电子商务网站或图片分享社区,以减少对重复图片的存储。这种方法需要对图像提取一种具有全局和局部不变性的特征,使得能够对同源图片的复制、编辑有一定的敏感度,比如,在同源图片进行了旋转、缩放、剪切、轻度PS等情况下,可以检测到其内容的重复性。这种方法还需要对所提取特征建立索引,以便在网络中实时应用。
发明内容
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,其特征在于对图像分别提取GIST特征和SIFT特征,GIST特征用于识别图像全局不变性,SIFT特征用于识别图像局部不变性;对两种特征分别采用LSH(Locality Sensitive Hashing,位置敏感哈希)算法建立索引和匹配图像特征,进行内容重复检测。
附图说明
图1是基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法的流程示意图。
具体实施方式
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,其特征在于,一是对后台图像集提取GIST特征和SIFT特征,并采用LSH(Locality Sensitive Hashing,位置敏感哈希)算法建立索引;二是对查询图像提取GIST特征和SIFT特征;三是匹配图像特征,进行内容重复检测;四是更新索引;具体步骤如下:
一、        提取GIST特征
将输入图片归一化,对归一化的图片在每个通道上构建图像金字塔,分别是R、G、B颜色通道,图像金字塔总层数为,每一层为不同分辨率的图像;
在每一通道的图像金字塔某层图像上,利用不同方向和对应该图像分辨率的Gabor滤波器对图像进行滤波;设所在层为l,                                                
Figure DEST_PATH_IMAGE001
为在该层上使用的方向;
Figure DEST_PATH_IMAGE002
l为当前图像的所处尺度,
Figure DEST_PATH_IMAGE003
为高斯函数标准差,
Figure DEST_PATH_IMAGE004
,其中,
Figure DEST_PATH_IMAGE005
Figure 882565DEST_PATH_IMAGE001
为尺度l下的方向总数;
将滤波后的图像按4×4的网格划分为16块,统计每一块内的滤波响应在不同方向上的直方图;
最后将每个通道上,各方向、各尺度网络内得到的直方图统计值用向量表出,作为图像特征,本发明在只在灰度通道上,使用3个尺度,各尺度对应方向数为8、8、4,提取得GIST特征为一320维整型向量。
二、        提取SIFT特征
在图像灰度通道上,利用不同尺度的高斯差分核与图像卷积生成高斯差分尺度空间,即DOG图像金字塔。其中,一副二维图像的尺度空间定义为:
Figure DEST_PATH_IMAGE006
                                  
其中 是尺度可变高斯函数:  
Figure DEST_PATH_IMAGE008
          
(x,y)是空间坐标,是尺度坐标。
DOG算子定义为:
Figure DEST_PATH_IMAGE009
图像金字塔共O组,每组有S层,下一组的图像由上一组图像降采样得到。第二组的第一副图像由第一组的第一副到最后一副图像由一个因子2降采样得到。
在尺度空间上寻找极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点,并去除边缘响应较大的点,剩下的点即作为关键点。
通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点,以增强匹配稳定性、提高抗噪声能力。
利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。其过程为,以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向。至此,图像的关键点已检测完毕,每个关键点有三个信息:位置、所处尺度、方向。
最后是生成SIFT特征点描述子,其过程为,首先将坐标轴旋转为关键点的方向,以确保旋转不变性。接下来以关键点为中心取8×8的窗口。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点。每个关键点使用4×4共16个种子点来描述,每个种子点处产生一个8维的梯度方向直方图,这样对于一个关键点就可以产生16×8=128个数据,即最终形成128维的SIFT特征向量。
三、LSH建立GIST特征散列表
GIST特征是在128×128大小灰度图像上提取得的d=320维整型向量,各分量最大值为c=128×128=16384,则需要将其转化为Hamming空间的向量
Figure DEST_PATH_IMAGE012
,设定散列表数
Figure DEST_PATH_IMAGE013
及桶数
建立散列函数作用于
Figure DEST_PATH_IMAGE016
,将其重新拼接为一个新的
Figure DEST_PATH_IMAGE017
维二进制向量
建立散列函数
Figure DEST_PATH_IMAGE019
作用于
Figure DEST_PATH_IMAGE020
,使该维二进制向量映射为一整数
Figure DEST_PATH_IMAGE022
将特征存放到第
Figure 2012100428068100002DEST_PATH_IMAGE024
个散列表的第()桶中。
四、LSH建立SIFT特征散列表
每个SIFT特征点的特征向量
Figure DEST_PATH_IMAGE026
是一个d=128维整型向量,各分量最大值为c=255,则需要将其转化为Hamming空间
Figure DEST_PATH_IMAGE027
的向量,设定散列表数
Figure DEST_PATH_IMAGE029
及桶数
Figure DEST_PATH_IMAGE030
建立散列函数
Figure DEST_PATH_IMAGE031
作用于,将其重新拼接为一个新的
Figure DEST_PATH_IMAGE033
维二进制向量
Figure DEST_PATH_IMAGE034
建立散列函数
Figure DEST_PATH_IMAGE035
作用于
Figure DEST_PATH_IMAGE036
,使该
Figure DEST_PATH_IMAGE037
维二进制向量映射为一整数
将特征
Figure DEST_PATH_IMAGE039
存放到第
Figure DEST_PATH_IMAGE040
个散列表的第(
Figure DEST_PATH_IMAGE041
)桶中。
 五、散列表查询
对查询图像计算GIST特征和SIFT特征,对GIST特征,采用建立GIST特征散列表的算法得到散列表及桶的Id,如果该Id对应的图像不为空,则散列表及桶的Id对应的图像即为与查询图像存在内容重复的图像,返回结果;如果该Id对应的图像为空,即没有检测到后台图像集中与查询图像内容重复的图像,那么继续对SIFT特征,采用建立SIFT特征散列表的算法得到散列表及桶的Id,如果该Id对应的图像不为空,则散列表及桶的Id对应的图像即为与查询图像存在内容重复的图像,返回结果;如果该Id对应的图像为空,即没有检测到后台图像集中与查询图像内容重复的图像,那么更新该查询图像GIST特征和SIFT特征到各自散列表,并将查询图像更新到后台图像库。

Claims (8)

1.    本发明的目的是提供一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,通过将输入图片归一化,提取GIST特征和SIFT特征,建立特征散列表,最终达到对查询图像进行散列表查询以确定是否重复的目的。
2.本发明步骤包括:
一、将输入图片归一化,在R、G、B颜色通道上构建图像金字塔,并进行滤波,统计每一块内的滤波响应在不同方向上的直方图作为图像特征,在灰度通道上提取整型向量;二、在灰色通道上,寻找极值点和关键点,为每个关键点指定方向参数,生成局部特征点描述子和局部特征向量;三、建立全局特征散列表和局部特征散列表;四、对查询图像计算全局特征和局部特征并与散列表进行对比,以确定图像是否为重复。
3.    如权利要求1所述的在输入图片每一通道金字塔某层上,利用不同方向和对应该图像分辨率的Gabor滤波器对图像进行滤波。
4.    如权利要求2所述的在输入图片的灰度通道上,使用3个尺度,各尺度对应方向数为8、8、4,提取得GIST特征为一320维整型向量。
5.    如权利要求3所述的在灰色通道上利用高斯差分核与图像卷积生成高斯差分尺度空间,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数(位置、所处尺度、方向),使算子具备旋转不变性。
6.    如权利要求4所述的以关键点为中心取8×8的窗口,在每4×4的小块上计算8个方向的梯度方向直方图,形成一个种子点,每个关键点产生16×8=128个数据,即最终形成128维的SIFT特征向量。
7.    如权利要求5所述的将GIST特征和每个SIFT特征点的特征向量转化为Hamming空间的向量,设定散列表数及桶数。
8.    如权利要求6所述的对查询图像计算GIST特征和SIFT特征,根据GIST特征散列表及桶Id是否为空,判断图像是否重复,对非重复的图像继续进行SIFT特征比对,判断图像是否为局部重复,更新该查询图像GIST特征和SIFT特征到各自散列表。
CN2012100428068A 2012-02-24 2012-02-24 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 Pending CN103294676A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100428068A CN103294676A (zh) 2012-02-24 2012-02-24 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100428068A CN103294676A (zh) 2012-02-24 2012-02-24 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法

Publications (1)

Publication Number Publication Date
CN103294676A true CN103294676A (zh) 2013-09-11

Family

ID=49095570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100428068A Pending CN103294676A (zh) 2012-02-24 2012-02-24 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法

Country Status (1)

Country Link
CN (1) CN103294676A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090882A (zh) * 2013-11-14 2014-10-08 深圳市腾讯计算机系统有限公司 一种广告订单的快速聚类方法及系统、服务器
CN104166685A (zh) * 2014-07-24 2014-11-26 北京捷成世纪科技股份有限公司 一种检测视频片段的方法和装置
CN105138867A (zh) * 2014-06-09 2015-12-09 北大方正集团有限公司 图片版权保护的方法和设备
GB2535190A (en) * 2015-02-12 2016-08-17 Nokia Technologies Oy A method, a system, an apparatus and a computer program product for image-based retrieval
CN106951551A (zh) * 2017-03-28 2017-07-14 西安理工大学 联合gist特征的多重索引图像检索方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
KR101797207B1 (ko) 2017-01-24 2017-11-13 (주)터보소프트 Udf 기반 이동객체 궤적 데이터 처리방법
CN108090356A (zh) * 2017-12-08 2018-05-29 湖南大学 一种基于图像纹理和bp神经网络的恶意文件检测方法
CN108205657A (zh) * 2017-11-24 2018-06-26 中国电子科技集团公司电子科学研究院 视频镜头分割的方法、存储介质和移动终端
CN112906696A (zh) * 2021-05-06 2021-06-04 北京惠朗时代科技有限公司 一种英文图像区域识别方法及装置
CN113239356A (zh) * 2021-07-12 2021-08-10 中国人民解放军国防科技大学 一种基于混合纹理特征的恶意代码分类方法及装置
CN113282775A (zh) * 2021-05-27 2021-08-20 上海垚亨电子商务有限公司 一种基于局部敏感哈希算法的相似人群的扩展算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697232A (zh) * 2009-09-18 2010-04-21 浙江大学 面向近重复图像匹配的sift特征裁减方法
CN101853486A (zh) * 2010-06-08 2010-10-06 华中科技大学 一种基于局部数字指纹的图像拷贝检测方法
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法
US20110085728A1 (en) * 2009-10-08 2011-04-14 Yuli Gao Detecting near duplicate images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697232A (zh) * 2009-09-18 2010-04-21 浙江大学 面向近重复图像匹配的sift特征裁减方法
US20110085728A1 (en) * 2009-10-08 2011-04-14 Yuli Gao Detecting near duplicate images
CN101853486A (zh) * 2010-06-08 2010-10-06 华中科技大学 一种基于局部数字指纹的图像拷贝检测方法
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HILL M L等: "IBM Research TRECVID-2010 Video Copy Detection and Multimedia Event Detection System", 《PROCEEDINGS OF TRECVID 2010 WORKSHOP》, 31 December 2010 (2010-12-31), pages 1 - 9 *
KERUI MIN 等: "Compact Projection: Simple and Efficient Near Neighbor Search with Practical", 《2010 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 18 June 2010 (2010-06-18), pages 3477 - 3484, XP031725802 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090882A (zh) * 2013-11-14 2014-10-08 深圳市腾讯计算机系统有限公司 一种广告订单的快速聚类方法及系统、服务器
US10650274B2 (en) 2013-11-14 2020-05-12 Tencent Technology (Shenzhen) Company Limited Image clustering method, image clustering system, and image clustering server
US9977995B2 (en) 2013-11-14 2018-05-22 Tencent Technology (Shenzhen) Company Limited Image clustering method, image clustering system, and image clustering server
CN105138867A (zh) * 2014-06-09 2015-12-09 北大方正集团有限公司 图片版权保护的方法和设备
CN104166685B (zh) * 2014-07-24 2017-07-11 北京捷成世纪科技股份有限公司 一种检测视频片段的方法和装置
CN104166685A (zh) * 2014-07-24 2014-11-26 北京捷成世纪科技股份有限公司 一种检测视频片段的方法和装置
US9898486B2 (en) 2015-02-12 2018-02-20 Nokia Technologies Oy Method, a system, an apparatus and a computer program product for image-based retrieval
GB2535190A (en) * 2015-02-12 2016-08-17 Nokia Technologies Oy A method, a system, an apparatus and a computer program product for image-based retrieval
KR101797207B1 (ko) 2017-01-24 2017-11-13 (주)터보소프트 Udf 기반 이동객체 궤적 데이터 처리방법
CN106951551A (zh) * 2017-03-28 2017-07-14 西安理工大学 联合gist特征的多重索引图像检索方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN108205657A (zh) * 2017-11-24 2018-06-26 中国电子科技集团公司电子科学研究院 视频镜头分割的方法、存储介质和移动终端
CN108090356A (zh) * 2017-12-08 2018-05-29 湖南大学 一种基于图像纹理和bp神经网络的恶意文件检测方法
CN112906696A (zh) * 2021-05-06 2021-06-04 北京惠朗时代科技有限公司 一种英文图像区域识别方法及装置
CN113282775A (zh) * 2021-05-27 2021-08-20 上海垚亨电子商务有限公司 一种基于局部敏感哈希算法的相似人群的扩展算法
CN113282775B (zh) * 2021-05-27 2023-10-03 上海焱祺华伟信息系统技术有限公司 一种基于局部敏感哈希算法的相似人群的扩展方法
CN113239356A (zh) * 2021-07-12 2021-08-10 中国人民解放军国防科技大学 一种基于混合纹理特征的恶意代码分类方法及装置

Similar Documents

Publication Publication Date Title
CN103294676A (zh) 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法
Chen et al. DASNet: Dual attentive fully convolutional Siamese networks for change detection in high-resolution satellite images
Ye et al. Robust optical-to-SAR image matching based on shape properties
Davarzani et al. Copy-move forgery detection using multiresolution local binary patterns
Brilakis et al. Shape-based retrieval of construction site photographs
Cheng et al. Automatic landslide detection from remote-sensing imagery using a scene classification method based on BoVW and pLSA
Sirmacek et al. Urban-area and building detection using SIFT keypoints and graph theory
CN101853486B (zh) 一种基于局部数字指纹的图像拷贝检测方法
Ehrlich et al. Extracting building stock information from optical satellite imagery for mapping earthquake exposure and its vulnerability
Sun et al. Nonoverlapping blocks based copy‐move forgery detection
CN104182973A (zh) 基于圆形描述算子csift的图像复制粘贴检测方法
Bozkir et al. Layout-based computation of web page similarity ranks
Soni et al. Keypoints based enhanced multiple copy‐move forgeries detection system using density‐based spatial clustering of application with noise clustering algorithm
Xuesong et al. Aphid identification and counting based on smartphone and machine vision
Liu et al. S-AKAZE: An effective point-based method for image matching
Pang et al. Exploiting local linear geometric structure for identifying correct matches
CN113360789A (zh) 兴趣点数据处理方法、装置、电子设备及存储介质
Huang et al. RBRIEF: a robust descriptor based on random binary comparisons
Budig et al. Polygon consensus: smart crowdsourcing for extracting building footprints from historical maps
Xiao et al. Multiresolution-Based Rough Fuzzy Possibilistic C-Means Clustering Method for Land Cover Change Detection
Xue et al. JPEG image tampering localization based on normalized gray level co-occurrence matrix
Yang et al. Robust copy-move forgery detection based on multi-granularity superpixels matching
Hu et al. Coherent phrase model for efficient image near-duplicate retrieval
Jin et al. Registration of UAV images using improved structural shape similarity based on mathematical morphology and phase congruency
Martins et al. On the completeness of feature-driven maximally stable extremal regions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130911