CN103699691B - 生成图像指纹及基于此进行相似图像检索的方法 - Google Patents

生成图像指纹及基于此进行相似图像检索的方法 Download PDF

Info

Publication number
CN103699691B
CN103699691B CN201410012144.9A CN201410012144A CN103699691B CN 103699691 B CN103699691 B CN 103699691B CN 201410012144 A CN201410012144 A CN 201410012144A CN 103699691 B CN103699691 B CN 103699691B
Authority
CN
China
Prior art keywords
fingerprint
pixel
image
fragment
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410012144.9A
Other languages
English (en)
Other versions
CN103699691A (zh
Inventor
王永康
张美琦
张爱华
何松
张月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 58 Information Technology Co Ltd
Original Assignee
Beijing 58 Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing 58 Information Technology Co Ltd filed Critical Beijing 58 Information Technology Co Ltd
Priority to CN201410012144.9A priority Critical patent/CN103699691B/zh
Publication of CN103699691A publication Critical patent/CN103699691A/zh
Application granted granted Critical
Publication of CN103699691B publication Critical patent/CN103699691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本发明提供了一种生成图像指纹及基于该方法进行相似图像检索以用于图像盗用识别的方法,所述图像具有M行N列像素,包括如下步骤:a)对所述图像中的每个像素点Xij,其中i=2,3,……M,j=2,3,……N,比较所述像素点与其左像素及上像素的灰度值大小,其中,左像素表示在所述一个像素的相邻的方位上下左右的四个像素中左边的像素,上像素表示在所述一个像素的相邻的方位上下左右的四个像素中上边的像素;b)根据不同的比较结果为所述像素点Xij赋予指纹值Zij;c)将所述每个像素点的指纹值Zij组合为序列得到长度为(M‑1)*(N‑1)的所述图像的指纹。利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像,防止图像盗用行为。

Description

生成图像指纹及基于此进行相似图像检索的方法
技术领域
本发明涉及计算机图像检索领域,特别是一种图像盗用识别方法。
背景技术
随着数码拍摄设备的普及,数字图像已经成为重要的信息存储和传递的媒介,同时数字图像也越来越多地被发布到互联网上。在海量网络图像数据的检索过程中,如何在返回的检索结果集中去除复制的或者相似的图像来提高检索的有效性具有重要的实际意义。例如在网络商品交易平台中,用户通过自己发帖来进行物品的交换或买卖,在这种自由的环境中,很多用户在发帖时使用的图像并不是符合自己物品的真实图像,而是盗用别人的图像,这样就会对想买这个东西的人形成一定的欺骗。另外,在很多实际应用中制作的图像具有商业用途,并受版权保护,该类图像是被禁止随意拷贝和发布的。
现有的一种用于图像盗用识别的技术是采用数字签名方法。数字签名方法是从图像中提取不变特征,然后生成摘要,并将摘要与图像捆绑在一起。最为常用数字签名方法是根据图像内容生成Md5值,并将Md5值作为图像的签名。然而,该类方法不能应对图像变换的影响,只要对原图稍作修改,例如在图像中添加水印等,重新生成的图像就会有截然不同的Md5值。所以该方法不能有效地检测相似图像。
现有的另外一种用于图像盗用识别的技术方法是采用基于内容的图像复制检测方法,能够较准确地检索盗用的图像。该类方法根据图像的内容生成一个指纹来检测待测图像是否为原图像的盗用。然而,若图像库中指纹过多时,对相似图像的检索需要耗费大量时间,使得盗用图像的检索效率较低。
因此,需要一种精准又高效的图像盗用识别方法。
发明内容
本发明的目的是提供一种生成图像指纹的方法,所述图像具有M行N列像素,包括如下步骤:a)对所述图像中的每个像素点Xij,其中i=2,3,……M,j=2,3,……N,比较所述像素点与其左像素及上像素的灰度值大小,其中,左像素表示在所述一个像素的相邻的方位上下左右的四个像素中左边的像素,上像素表示在所述一个像素的相邻的方位上下左右的四个像素中上边的像素;b)根据不同的比较结果为所述像素点Xij赋予指纹值Zij;c)将所述每个像素点的指纹值Zij组合为序列得到长度为(M-1)*(N-1)的所述图像的指纹。
优选地,在所述步骤b中当“X≤A且X≤B”则赋予指纹值Zij=0;若“X≤A且X>B”则赋予指纹值Zij=1;若“X>A且X≤B”则赋予指纹值Zij=2;若“X>A且X>B”则赋予指纹值Zij=3,其中X表示所述像素点的灰度值,A表示所述像素点左像素的灰度值,B表示所述像素点上像素的灰度值。
根据本发明的另一个方面,提供了一种为图像生成指纹并存储的方法,其特征在于,包括如下步骤:a)将所述图像缩放为统一大小;b)将所述图像灰度化;c)生成图像指纹,生成所述图像指纹的方法如权利要求1所述;d)对所述图像指纹进行两次分解,生成(n+1)(n+2)个指纹片段,其中n代表任意两个指纹相似的图像汉明距离的差异值阈值;e)将所述指纹片段存入信息搜索库,并建立所述指纹片段到所述图像指纹的倒排索引。
优选地,在步骤b中,计算灰度值的公式为:
灰度值=0.3R+0.58G+0.11B (1)
其中R、G、B分别为该像素的红色、绿色和蓝色像素值。
优选地,在所述步骤d中,对所述图像指纹进行两次分解的步骤包括:d1)将所述图像指纹分解为n+1个指纹片段;和d2)将所述图像指纹减去所述n+1个指纹片段中的每个指纹片段,并将与所述每个指纹片段对应的每个所述图像指纹中的剩余的部分分解为n+1个片段。
优选地,在所述步骤e中,在所述指纹片段中添加业务类别号。
根据本发明的又一方面,提供了一种相似图像检索方法,包括如下步骤:a)将所述图像缩放为统一大小;b)将所述图像灰度化;c)生成图像指纹,生成所述图像指纹的方法如权利要求1所述;d)对所述图像指纹进行两次分解,生成(n+1)(n+2)个指纹片段,其中n代表任意两个指纹相似的图像汉明距离的差异值阈值;e)通过所述指纹片段的倒排索引,查询具有相同所述指纹片段的图像指纹的结果集;和f)计算待检测图像指纹与所述结果集中的图像指纹的汉明距离,在所述结果集中,找出与所述待检测图像指纹的汉明距离小于n的图像指纹,将其作为相似图像。
优选地,在所述步骤d中,对所述图像指纹进行两次分解的步骤包括:d1)将所述图像指纹分解为n+1个指纹片段;和d2)将所述图像指纹减去所述n+1个指纹片段中的每个指纹片段,并将与所述每个指纹片段对应的每个所述图像指纹中的剩余的部分分解为n+1个片段。
优选地,在所述步骤e中,通过所述指纹片段的倒排索引,查询具有ai&&bi j组合的指纹的结果集,其中,ai(i≥1&&i≤n+1)表示步骤d1中分解得到的n+1个指纹片段中的任意一个,bi j(i≥1&&i≤n+1,j≥1&&j≤n+1)表示步骤d2中分解得到的n+1个指纹片段中的任意一个。
优选地,在所述步骤b中,计算灰度值的公式为:
灰度值=0.3R+0.58G+0.11B (1)
其中R、G、B分别为该像素的红色、绿色和蓝色像素值。
利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像,防止图像盗用行为。
附图说明
参考随附的附图,本发明更多的目的、功能和优点将通过本发明实施方式的如下描述得以阐明,其中:
图1示意性示出了本发明的为图像生成指纹并存储的方法的流程图。
图2示意性示出了本发明的相似图像检索的流程图。
具体实施方式
通过参考示范性实施例,本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。
在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
本发明的图像盗用识别方法实现精准且高效的图像盗用识别的基本方法如下:对于某图像,首先生成自定义的精准的图像指纹,然后求出指纹的指纹片段,接着检索出具有相同指纹片段的指纹的结果集,最后将该图像的图像指纹与结果集中的图像指纹进行比对来找出相似图像。
图1示意性示出了本发明的为图像生成指纹并存储的方法流程图。如图1所示:
步骤110,将图像缩放为统一大小。将所有的图像统一缩放为M*N的小图像。其中,M表示M行像素,N表示N列像素。例如将所有图像缩放为10*9的小图像。
步骤120,将图像灰度化。图像的灰度化是将图像的每个像素点的RGB值通过计算转化为一灰度值,用该灰度值来表示每个像素。优选地,采用如下公式计算得到图像的每个像素的灰度值。
灰度值=0.3R+0.58G+0.11B (1)
其中R、G、B分别表示该像素的红色、绿色和蓝色像素值。
步骤130,生成自定义的图像指纹。生成指纹的算法如下:
a)对于图像中的某个像素X,比较像素X与其左像素A的根据步骤120计算得到的灰度值大小,以及像素X与其上像素B的灰度值大小,可以得出四种不同的比较结果,即“X<A且X<B”、“X<A且X>B”、“X>A且X<B”及“X>A且X>B”。其中,左像素表示在某个像素的相邻的方位上下左右四个像素中左边的像素,上像素表示在某个像素的相邻的方位上下左右四个像素中上边的像素。
b)根据比较结果对像素X赋予指纹值Z。这里,比较结果的赋值可以是任何值,只要能够区分四种比较结果即可。例如,若“X≤A且X≤B”则赋予指纹值Z=0;若“X≤A且X>B”则赋予指纹值Z=1;若“X>A且X≤B”则赋予指纹值Z=2;若“X>A且X>B”则赋予指纹值Z=3;
c)对图像中的除了第一行和第一列以外所有的像素点执行步骤a及步骤b的操作,将每个像素的指纹值Z组合为序列得到长度为(M-1)*(N-1)的一系列的值的组合,即该图像的指纹。
步骤140,对图像指纹进行分解,生成多个指纹片段。
优选地,对图像指纹进行两次分解,生成多个指纹片段。若将两个图像的汉明距离的差异值小于等于n(n可以为用户定义的值)的两个指纹认为相似,则将指纹分解为指纹片段的算法如下所示:
a)将指纹L先分解为n+1个片段得到a1……an+1,即ai(i≥1&&i≤n+1);其中,“分解”是指把图像指纹的(M-1)*(N-1)个值按顺序划分成若干个片段。比如,对于图像的指纹{3,1,0,2,3,0,1,2,1,2,1,2},若将可以认为两个指纹相似的图像汉明距离的差异值阈值N设定为3,则将该图像指纹分解为4个片段,分别为{3,1,0},{2,3,0},{1,2,1}和{2,1,2}。
b)将总的指纹L减去每个片段ai之后剩余的部分分解为n+1片段得到bi 1……bi n+1,即bi j(i≥1&&i≤n+1,j≥1&&j≤n+1)。从而得到一个完整的指纹的(n+1)(n+2)个指纹片段。
步骤150,将指纹片段存入信息搜索库,并建立指纹片段到指纹的倒排索引。利用该倒排索引,可以直接通过某指纹片段找到包含该指纹片段的指纹的结果集。
优选地,在每个图像片段中都添加业务类别号,从而在搜索时只需在该业务类别的图像片段中进行相似性检索即可。具体地,信息搜索库中存在所有业务的图像的片段,为了与业务结合,在每个图像片段中都添加一个业务类别号,搜索时只需要在相关业务的图像片段内进行相似性检索即可,例如,在进行房产类别的图片的相似性检索时,只需对含有房产类别号的图像片段进行相似性检索即可。从而能够实现业务逻辑与技术结合。
图2示意性示出了本发明的相似图像检索的流程图。如图2所示:
步骤210,将图像缩放为统一大小。将待检索的图像统一缩放为M*N的小图像。
步骤220,将图像灰度化。优选采用0.3R+0.58G+0.11B计算得到图像灰度值。
步骤230,生成自定义的图像指纹。具体算法如步骤130所述。
步骤240,对图像指纹进行分解,生成多个指纹片段。具体算法如步骤140所述。
步骤250,查询具有相同指纹片段的指纹的结果集。通过指纹片段的倒排索引找到具有相同指纹片段的指纹的结果集。
优选地,通过指纹片段的倒排索,查询具有ai&&bi j组合的指纹的结果集,即同时具有指纹片段ai(i≥1&&i≤n+1)以及指纹片段bi j(i≥1&&i≤n+1,j≥1&&j≤n+1)的指纹的结果集。
步骤260,计算与结果集中的指纹的汉明距离,找出相似图像。若汉明距离小于可以认为两张图像相似的最大汉明距离的差异值n,则两张图像相似。例如,若可以认为是相似图像的汉明距离的差异值的最大值n为10,而图像A与结果集中的图像B的指纹的汉明距离为7,则图像A与图像B相似。
利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像,防止图像盗用行为。
结合这里披露的本发明的说明和实践,本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的,本发明的真正范围和主旨均由权利要求所限定。

Claims (4)

1.一种生成图像指纹的方法,其特征在于,所述图像具有M行N列像素,包括如下步骤:
a)对所述图像中的每个像素点Xij,其中i=2,3,……M,j=2,3,……N,比较所述像素点与其左像素点及上像素点的灰度值大小,其中,左像素点表示在所述一个像素点的相邻的方位上下左右的四个像素点中左边的像素点,上像素点表示在所述一个像素点的相邻的方位上下左右的四个像素点中上边的像素点;
b)根据不同的比较结果为所述像素点Xij赋予指纹值Zij;其中
当“X≤A且X≤B”则赋予指纹值Zij=0;若“X≤A且X>B”则赋予指纹值Zij=1;若“X>A且X≤B”则赋予指纹值Zij=2;若“X>A且X>B”则赋予指纹值Zij=3,其中X表示所述像素点的灰度值,A表示所述左像素点的灰度值,B表示所述上像素点的灰度值;
c)将所述每个像素点的指纹值Zij组合为序列得到长度为(M-1)*(N-1)的所述图像的指纹。
2.一种相似图像检索方法,其特征在于,包括如下步骤:
a)将所述图像缩放为统一大小;
b)将所述图像灰度化;
c)生成图像指纹,生成所述图像指纹的方法如权利要求1所述;
d)对所述图像指纹进行两次分解,生成(n+1)(n+2)个指纹片段,其中n代表任意两个指纹相似的图像汉明距离的差异值阈值;
所述图像指纹进行两次分解的步骤包括:
d1)将所述图像指纹分解为n+1个指纹片段;
d2)将所述图像指纹减去所述n+1个指纹片段中的每个指纹片段,并将与所述每个指纹片段对应的每个所述图像指纹中的剩余的部分分解为n+1个片段;
e)将所述指纹片段存入信息搜索库,并建立所述指纹片段到所述图像指纹的倒排索引;
f)通过所述指纹片段的倒排索引,通过查询具有ai&&bi j组合的指纹的结果集,查询具有相同所述指纹片段的图像指纹的结果集,其中,ai(i≥1&&i≤n+1)表示步骤d1中分解得到的n+1个指纹片段中的任意一个,bi j(i≥1&&i≤n+1,j≥1&&j≤n+1)表示步骤d2中分解得到的n+1个指纹片段中的任意一个;
g)计算待检测图像指纹与所述结果集中的图像指纹的汉明距离,在所述结果集中,找出与所述待检测图像指纹的汉明距离小于n的图像指纹,将其作为相似图像。
3.根据权利要求2所述的方法,其特征在于,在步骤e中,在所述指纹片段中添加业务类别号。
4.根据权利要求2所述的方法,其特征在于,在步骤b中,计算灰度值的公式为:
灰度值=0.3R+0.58G+0.11B
其中R、G、B分别为该像素的红色、绿色和蓝色像素值。
CN201410012144.9A 2014-01-10 2014-01-10 生成图像指纹及基于此进行相似图像检索的方法 Active CN103699691B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410012144.9A CN103699691B (zh) 2014-01-10 2014-01-10 生成图像指纹及基于此进行相似图像检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410012144.9A CN103699691B (zh) 2014-01-10 2014-01-10 生成图像指纹及基于此进行相似图像检索的方法

Publications (2)

Publication Number Publication Date
CN103699691A CN103699691A (zh) 2014-04-02
CN103699691B true CN103699691B (zh) 2017-09-12

Family

ID=50361219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410012144.9A Active CN103699691B (zh) 2014-01-10 2014-01-10 生成图像指纹及基于此进行相似图像检索的方法

Country Status (1)

Country Link
CN (1) CN103699691B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204301A (zh) * 2016-07-29 2016-12-07 苏州商信宝信息科技有限公司 一种针对社交网络非原创图片的管理方法
CN107256068B (zh) * 2017-05-12 2019-08-23 Oppo广东移动通信有限公司 指纹的采集方法及相关产品
CN107480582A (zh) * 2017-06-28 2017-12-15 北京五八信息技术有限公司 简历真实度的检测方法及装置
CN109344276B (zh) * 2018-08-27 2021-01-05 广州企图腾科技有限公司 一种图像指纹生成方法、图像相似度比较方法及存储介质
CN109389147B (zh) * 2018-08-28 2022-02-08 昆明理工大学 一种基于改进PHash算法的图像相似判定方法
CN110084298B (zh) * 2019-04-23 2021-09-28 北京百度网讯科技有限公司 用于检测图像相似度的方法及装置
CN110688514A (zh) * 2019-08-30 2020-01-14 中国人民财产保险股份有限公司 一种保险理赔图像数据的查重方法及装置
CN110738100A (zh) * 2019-09-04 2020-01-31 沈阳工业大学 一种基于深度学习的伪装军事目标识别方法及系统
CN111507260B (zh) * 2020-04-17 2022-08-05 重庆邮电大学 一种视频相似度快速检测方法及检测装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8156132B1 (en) * 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US8233722B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated Method and system for finding a document image in a document collection using localized two-dimensional visual fingerprints
CN101853486B (zh) * 2010-06-08 2012-06-13 华中科技大学 一种基于局部数字指纹的图像拷贝检测方法
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
我的数学之美系列二—simhash与重复信息识别;grunt1223;《http://grunt1223.iteye.com/blog/964564》;20110316;第5段-第15段 *
相似图片搜索的三种哈希算法";nash_;《http://blog.csdn.net/zmazon/article/details/8618775》;20130301;第1-3节 *

Also Published As

Publication number Publication date
CN103699691A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN103699691B (zh) 生成图像指纹及基于此进行相似图像检索的方法
CN108959478B (zh) 一种云环境下的密文图像检索方法及系统
Chen et al. Deepmarks: A digital fingerprinting framework for deep neural networks
Joshi et al. A new method of image steganography using 7th bit of a pixel as indicator by introducing the successive temporary pixel in the gray scale image
US9053386B2 (en) Method and apparatus of identifying similar images
CN109918532A (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN106651976B (zh) 一种基于聚类和混沌的图像加密方法
Imamoglu et al. A new reversible database watermarking approach with firefly optimization algorithm
US8243988B1 (en) Clustering images using an image region graph
TW201128421A (en) Content-based image search
CN107729935B (zh) 相似图片的识别方法和装置、服务器、存储介质
US11568028B2 (en) Data watermarking and fingerprinting system and method
WO2019137185A1 (zh) 一种图片筛选方法及装置、存储介质、计算机设备
US8861896B2 (en) Method and system for image-based identification
Song et al. Combining Models from Multiple Sources for RGB-D Scene Recognition.
Guo et al. Evolutionary trigger set generation for dnn black-box watermarking
JP6173754B2 (ja) 画像検索システム、画像検索装置および画像検索方法
JP4832692B2 (ja) デジタルデータのフィンガープリンティングのための方法およびシステム
JP2010191954A (ja) 画像のシーケンスを処理する方法および装置、画像データを処理する装置、ならびにコンピュータプログラム製品
Magdy et al. Privacy preserving search index for image databases based on SURF and order preserving encryption
Song et al. Learning multilevel semantic similarity for large-scale multi-label image retrieval
Matsui Challenge for manga processing: Sketch-based manga retrieval
Korsunov et al. Recognition method of near-duplicate images based on the perceptual hash and image key points using
Strong et al. Data organization and visualization using self-sorting map
JP6317715B2 (ja) 画像認識装置、方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant