CN103294676A - 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 - Google Patents
一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 Download PDFInfo
- Publication number
- CN103294676A CN103294676A CN2012100428068A CN201210042806A CN103294676A CN 103294676 A CN103294676 A CN 103294676A CN 2012100428068 A CN2012100428068 A CN 2012100428068A CN 201210042806 A CN201210042806 A CN 201210042806A CN 103294676 A CN103294676 A CN 103294676A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- sift
- gist
- hash table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明是一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,包括:对图像分别提取GIST特征和SIFT特征,GIST特征用于识别图像全局不变性,SIFT特征用于识别图像局部不变性;对两种特征分别采用LSH(LocalitySensitiveHashing,位置敏感哈希)算法建立索引和匹配图像特征,进行内容重复检测。
Description
技术领域
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,属于基于内容的图片检索领域。
背景技术
随着网络技术和数字成像技术的发展,人们可以以一种简便的方式创造图片,并轻松地在互联网上分享、传播,其他人也能够不受限制地下载、拷贝并修改图片。这样,一方面图片的版权不能得到有效的保护,另一方面也将导致网络上的图片大量地存在内容上的重复。为了解决这些问题,本发明提出了一种网络图片内容重复的检测方法,其不仅可以用于图片版权的保护,还可以用于电子商务网站或图片分享社区,以减少对重复图片的存储。这种方法需要对图像提取一种具有全局和局部不变性的特征,使得能够对同源图片的复制、编辑有一定的敏感度,比如,在同源图片进行了旋转、缩放、剪切、轻度PS等情况下,可以检测到其内容的重复性。这种方法还需要对所提取特征建立索引,以便在网络中实时应用。
发明内容
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,其特征在于对图像分别提取GIST特征和SIFT特征,GIST特征用于识别图像全局不变性,SIFT特征用于识别图像局部不变性;对两种特征分别采用LSH(Locality Sensitive Hashing,位置敏感哈希)算法建立索引和匹配图像特征,进行内容重复检测。
附图说明
图1是基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法的流程示意图。
具体实施方式
本发明涉及一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,其特征在于,一是对后台图像集提取GIST特征和SIFT特征,并采用LSH(Locality Sensitive Hashing,位置敏感哈希)算法建立索引;二是对查询图像提取GIST特征和SIFT特征;三是匹配图像特征,进行内容重复检测;四是更新索引;具体步骤如下:
一、 提取GIST特征
将输入图片归一化,对归一化的图片在每个通道上构建图像金字塔,分别是R、G、B颜色通道,图像金字塔总层数为,每一层为不同分辨率的图像;
将滤波后的图像按4×4的网格划分为16块,统计每一块内的滤波响应在不同方向上的直方图;
最后将每个通道上,各方向、各尺度网络内得到的直方图统计值用向量表出,作为图像特征,本发明在只在灰度通道上,使用3个尺度,各尺度对应方向数为8、8、4,提取得GIST特征为一320维整型向量。
二、 提取SIFT特征
(x,y)是空间坐标,是尺度坐标。
DOG算子定义为:
图像金字塔共O组,每组有S层,下一组的图像由上一组图像降采样得到。第二组的第一副图像由第一组的第一副到最后一副图像由一个因子2降采样得到。
在尺度空间上寻找极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点,并去除边缘响应较大的点,剩下的点即作为关键点。
通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点,以增强匹配稳定性、提高抗噪声能力。
利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。其过程为,以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向。至此,图像的关键点已检测完毕,每个关键点有三个信息:位置、所处尺度、方向。
最后是生成SIFT特征点描述子,其过程为,首先将坐标轴旋转为关键点的方向,以确保旋转不变性。接下来以关键点为中心取8×8的窗口。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点。每个关键点使用4×4共16个种子点来描述,每个种子点处产生一个8维的梯度方向直方图,这样对于一个关键点就可以产生16×8=128个数据,即最终形成128维的SIFT特征向量。
三、LSH建立GIST特征散列表
四、LSH建立SIFT特征散列表
五、散列表查询
对查询图像计算GIST特征和SIFT特征,对GIST特征,采用建立GIST特征散列表的算法得到散列表及桶的Id,如果该Id对应的图像不为空,则散列表及桶的Id对应的图像即为与查询图像存在内容重复的图像,返回结果;如果该Id对应的图像为空,即没有检测到后台图像集中与查询图像内容重复的图像,那么继续对SIFT特征,采用建立SIFT特征散列表的算法得到散列表及桶的Id,如果该Id对应的图像不为空,则散列表及桶的Id对应的图像即为与查询图像存在内容重复的图像,返回结果;如果该Id对应的图像为空,即没有检测到后台图像集中与查询图像内容重复的图像,那么更新该查询图像GIST特征和SIFT特征到各自散列表,并将查询图像更新到后台图像库。
Claims (8)
1. 本发明的目的是提供一种基于GIST全局特征和SIFT局部特征的网络图片内容重复检测方法,通过将输入图片归一化,提取GIST特征和SIFT特征,建立特征散列表,最终达到对查询图像进行散列表查询以确定是否重复的目的。
2.本发明步骤包括:
一、将输入图片归一化,在R、G、B颜色通道上构建图像金字塔,并进行滤波,统计每一块内的滤波响应在不同方向上的直方图作为图像特征,在灰度通道上提取整型向量;二、在灰色通道上,寻找极值点和关键点,为每个关键点指定方向参数,生成局部特征点描述子和局部特征向量;三、建立全局特征散列表和局部特征散列表;四、对查询图像计算全局特征和局部特征并与散列表进行对比,以确定图像是否为重复。
3. 如权利要求1所述的在输入图片每一通道金字塔某层上,利用不同方向和对应该图像分辨率的Gabor滤波器对图像进行滤波。
4. 如权利要求2所述的在输入图片的灰度通道上,使用3个尺度,各尺度对应方向数为8、8、4,提取得GIST特征为一320维整型向量。
5. 如权利要求3所述的在灰色通道上利用高斯差分核与图像卷积生成高斯差分尺度空间,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数(位置、所处尺度、方向),使算子具备旋转不变性。
6. 如权利要求4所述的以关键点为中心取8×8的窗口,在每4×4的小块上计算8个方向的梯度方向直方图,形成一个种子点,每个关键点产生16×8=128个数据,即最终形成128维的SIFT特征向量。
7. 如权利要求5所述的将GIST特征和每个SIFT特征点的特征向量转化为Hamming空间的向量,设定散列表数及桶数。
8. 如权利要求6所述的对查询图像计算GIST特征和SIFT特征,根据GIST特征散列表及桶Id是否为空,判断图像是否重复,对非重复的图像继续进行SIFT特征比对,判断图像是否为局部重复,更新该查询图像GIST特征和SIFT特征到各自散列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100428068A CN103294676A (zh) | 2012-02-24 | 2012-02-24 | 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100428068A CN103294676A (zh) | 2012-02-24 | 2012-02-24 | 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103294676A true CN103294676A (zh) | 2013-09-11 |
Family
ID=49095570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100428068A Pending CN103294676A (zh) | 2012-02-24 | 2012-02-24 | 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103294676A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090882A (zh) * | 2013-11-14 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种广告订单的快速聚类方法及系统、服务器 |
CN104166685A (zh) * | 2014-07-24 | 2014-11-26 | 北京捷成世纪科技股份有限公司 | 一种检测视频片段的方法和装置 |
CN105138867A (zh) * | 2014-06-09 | 2015-12-09 | 北大方正集团有限公司 | 图片版权保护的方法和设备 |
GB2535190A (en) * | 2015-02-12 | 2016-08-17 | Nokia Technologies Oy | A method, a system, an apparatus and a computer program product for image-based retrieval |
CN106951551A (zh) * | 2017-03-28 | 2017-07-14 | 西安理工大学 | 联合gist特征的多重索引图像检索方法 |
CN107316066A (zh) * | 2017-07-28 | 2017-11-03 | 北京工商大学 | 基于多通路卷积神经网络的图像分类方法及系统 |
KR101797207B1 (ko) | 2017-01-24 | 2017-11-13 | (주)터보소프트 | Udf 기반 이동객체 궤적 데이터 처리방법 |
CN108090356A (zh) * | 2017-12-08 | 2018-05-29 | 湖南大学 | 一种基于图像纹理和bp神经网络的恶意文件检测方法 |
CN108205657A (zh) * | 2017-11-24 | 2018-06-26 | 中国电子科技集团公司电子科学研究院 | 视频镜头分割的方法、存储介质和移动终端 |
CN112906696A (zh) * | 2021-05-06 | 2021-06-04 | 北京惠朗时代科技有限公司 | 一种英文图像区域识别方法及装置 |
CN113239356A (zh) * | 2021-07-12 | 2021-08-10 | 中国人民解放军国防科技大学 | 一种基于混合纹理特征的恶意代码分类方法及装置 |
CN113282775A (zh) * | 2021-05-27 | 2021-08-20 | 上海垚亨电子商务有限公司 | 一种基于局部敏感哈希算法的相似人群的扩展算法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101697232A (zh) * | 2009-09-18 | 2010-04-21 | 浙江大学 | 面向近重复图像匹配的sift特征裁减方法 |
CN101853486A (zh) * | 2010-06-08 | 2010-10-06 | 华中科技大学 | 一种基于局部数字指纹的图像拷贝检测方法 |
CN101894130A (zh) * | 2010-06-08 | 2010-11-24 | 浙江大学 | 基于稀疏降维的谱哈希索引方法 |
US20110085728A1 (en) * | 2009-10-08 | 2011-04-14 | Yuli Gao | Detecting near duplicate images |
-
2012
- 2012-02-24 CN CN2012100428068A patent/CN103294676A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101697232A (zh) * | 2009-09-18 | 2010-04-21 | 浙江大学 | 面向近重复图像匹配的sift特征裁减方法 |
US20110085728A1 (en) * | 2009-10-08 | 2011-04-14 | Yuli Gao | Detecting near duplicate images |
CN101853486A (zh) * | 2010-06-08 | 2010-10-06 | 华中科技大学 | 一种基于局部数字指纹的图像拷贝检测方法 |
CN101894130A (zh) * | 2010-06-08 | 2010-11-24 | 浙江大学 | 基于稀疏降维的谱哈希索引方法 |
Non-Patent Citations (2)
Title |
---|
HILL M L等: "IBM Research TRECVID-2010 Video Copy Detection and Multimedia Event Detection System", 《PROCEEDINGS OF TRECVID 2010 WORKSHOP》, 31 December 2010 (2010-12-31), pages 1 - 9 * |
KERUI MIN 等: "Compact Projection: Simple and Efficient Near Neighbor Search with Practical", 《2010 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 18 June 2010 (2010-06-18), pages 3477 - 3484, XP031725802 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090882A (zh) * | 2013-11-14 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种广告订单的快速聚类方法及系统、服务器 |
US10650274B2 (en) | 2013-11-14 | 2020-05-12 | Tencent Technology (Shenzhen) Company Limited | Image clustering method, image clustering system, and image clustering server |
US9977995B2 (en) | 2013-11-14 | 2018-05-22 | Tencent Technology (Shenzhen) Company Limited | Image clustering method, image clustering system, and image clustering server |
CN105138867A (zh) * | 2014-06-09 | 2015-12-09 | 北大方正集团有限公司 | 图片版权保护的方法和设备 |
CN104166685B (zh) * | 2014-07-24 | 2017-07-11 | 北京捷成世纪科技股份有限公司 | 一种检测视频片段的方法和装置 |
CN104166685A (zh) * | 2014-07-24 | 2014-11-26 | 北京捷成世纪科技股份有限公司 | 一种检测视频片段的方法和装置 |
US9898486B2 (en) | 2015-02-12 | 2018-02-20 | Nokia Technologies Oy | Method, a system, an apparatus and a computer program product for image-based retrieval |
GB2535190A (en) * | 2015-02-12 | 2016-08-17 | Nokia Technologies Oy | A method, a system, an apparatus and a computer program product for image-based retrieval |
KR101797207B1 (ko) | 2017-01-24 | 2017-11-13 | (주)터보소프트 | Udf 기반 이동객체 궤적 데이터 처리방법 |
CN106951551A (zh) * | 2017-03-28 | 2017-07-14 | 西安理工大学 | 联合gist特征的多重索引图像检索方法 |
CN107316066A (zh) * | 2017-07-28 | 2017-11-03 | 北京工商大学 | 基于多通路卷积神经网络的图像分类方法及系统 |
CN108205657A (zh) * | 2017-11-24 | 2018-06-26 | 中国电子科技集团公司电子科学研究院 | 视频镜头分割的方法、存储介质和移动终端 |
CN108090356A (zh) * | 2017-12-08 | 2018-05-29 | 湖南大学 | 一种基于图像纹理和bp神经网络的恶意文件检测方法 |
CN112906696A (zh) * | 2021-05-06 | 2021-06-04 | 北京惠朗时代科技有限公司 | 一种英文图像区域识别方法及装置 |
CN113282775A (zh) * | 2021-05-27 | 2021-08-20 | 上海垚亨电子商务有限公司 | 一种基于局部敏感哈希算法的相似人群的扩展算法 |
CN113282775B (zh) * | 2021-05-27 | 2023-10-03 | 上海焱祺华伟信息系统技术有限公司 | 一种基于局部敏感哈希算法的相似人群的扩展方法 |
CN113239356A (zh) * | 2021-07-12 | 2021-08-10 | 中国人民解放军国防科技大学 | 一种基于混合纹理特征的恶意代码分类方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103294676A (zh) | 一种基于gist全局特征和sift局部特征的网络图片内容重复检测方法 | |
Chen et al. | DASNet: Dual attentive fully convolutional Siamese networks for change detection in high-resolution satellite images | |
Ye et al. | Robust optical-to-SAR image matching based on shape properties | |
Davarzani et al. | Copy-move forgery detection using multiresolution local binary patterns | |
Brilakis et al. | Shape-based retrieval of construction site photographs | |
Cheng et al. | Automatic landslide detection from remote-sensing imagery using a scene classification method based on BoVW and pLSA | |
Sirmacek et al. | Urban-area and building detection using SIFT keypoints and graph theory | |
CN101853486B (zh) | 一种基于局部数字指纹的图像拷贝检测方法 | |
Ehrlich et al. | Extracting building stock information from optical satellite imagery for mapping earthquake exposure and its vulnerability | |
Sun et al. | Nonoverlapping blocks based copy‐move forgery detection | |
CN104182973A (zh) | 基于圆形描述算子csift的图像复制粘贴检测方法 | |
Bozkir et al. | Layout-based computation of web page similarity ranks | |
Soni et al. | Keypoints based enhanced multiple copy‐move forgeries detection system using density‐based spatial clustering of application with noise clustering algorithm | |
Xuesong et al. | Aphid identification and counting based on smartphone and machine vision | |
Liu et al. | S-AKAZE: An effective point-based method for image matching | |
Pang et al. | Exploiting local linear geometric structure for identifying correct matches | |
CN113360789A (zh) | 兴趣点数据处理方法、装置、电子设备及存储介质 | |
Huang et al. | RBRIEF: a robust descriptor based on random binary comparisons | |
Budig et al. | Polygon consensus: smart crowdsourcing for extracting building footprints from historical maps | |
Xiao et al. | Multiresolution-Based Rough Fuzzy Possibilistic C-Means Clustering Method for Land Cover Change Detection | |
Xue et al. | JPEG image tampering localization based on normalized gray level co-occurrence matrix | |
Yang et al. | Robust copy-move forgery detection based on multi-granularity superpixels matching | |
Hu et al. | Coherent phrase model for efficient image near-duplicate retrieval | |
Jin et al. | Registration of UAV images using improved structural shape similarity based on mathematical morphology and phase congruency | |
Martins et al. | On the completeness of feature-driven maximally stable extremal regions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130911 |