CN109344276B - 一种图像指纹生成方法、图像相似度比较方法及存储介质 - Google Patents

一种图像指纹生成方法、图像相似度比较方法及存储介质 Download PDF

Info

Publication number
CN109344276B
CN109344276B CN201810981372.5A CN201810981372A CN109344276B CN 109344276 B CN109344276 B CN 109344276B CN 201810981372 A CN201810981372 A CN 201810981372A CN 109344276 B CN109344276 B CN 109344276B
Authority
CN
China
Prior art keywords
image
grid
fingerprint
spatial position
generation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810981372.5A
Other languages
English (en)
Other versions
CN109344276A (zh
Inventor
邓立邦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Qituteng Technology Co ltd
Original Assignee
Guangzhou Qituteng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Qituteng Technology Co ltd filed Critical Guangzhou Qituteng Technology Co ltd
Priority to CN201810981372.5A priority Critical patent/CN109344276B/zh
Publication of CN109344276A publication Critical patent/CN109344276A/zh
Application granted granted Critical
Publication of CN109344276B publication Critical patent/CN109344276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种图像指纹生成方法、图像相似度比较方法及计算机可读存储介质,该比较方法包括以下步骤:获取图像指纹步骤,即图像指纹生成方法步骤;建立图像指纹数据库步骤:将所有图像及其对应的图像指纹存入图像指纹数据库中;图像相似度比较步骤:根据获取图像指纹步骤来获取待比对图像的图像指纹;根据余弦相似度算法将待比对图像的图像指纹与图像指纹数据库中的图像指纹逐一进行相似度比较;将比对结果反馈给用户。本发明所提供的一种图像相似度比较方法能在海量的图像数据中快速地进行检索,并且检索结果准确性高。

Description

一种图像指纹生成方法、图像相似度比较方法及存储介质
技术领域
本发明涉及图像识别领域,尤其涉及一种图像指纹生成方法、图像相似度比较方法及存储介质。
背景技术
在生活中经常需要对图像进行识别比对,例如,在商标预申请阶段,需要对商标图像的检索,查看是否有相似商标。随着我国市场经济的快速发展,商标图像需求量不断增加,商标局每年收到的注册商标申请量高达数百万件,但最终核准的十分有限,原因在于商标近似、缺乏显著性等问题遭遇驳回。一旦申请被驳回,申请人为此商标付出的精力、金钱等都将被白白消耗。
介于上述情况,市面提供了各式各样的商标检索方法。根据调查研究,基于分类码并且以大量人力为代价的检索方法早已日益不能解决当前商标注册的矛盾,取而代之的是基于文本和内容的图像检索方法。
基于文本的图像检索方法与文本信息检索一致,通过关键词来进行检索,存在以下不足:1)检索方式需要对图像进行合理的关键词标注,而当前图像自动标注技术尚不成熟;2)用户利用若干关键词表示检索条件存在困难,而更偏向以图搜图的方式来查找相似图像。而基于内容的图像检索方法,也存在以下不足:1)检索方法没有考虑图像的语义信息;2)检索特征维数高,运算复杂度高,检索效率低;3)检索或分类只能提取局部的图像特征,检索准确性低。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种图像指纹生成方法,其能生成图像唯一指纹,利用该方法生成的图像指纹可进行图像相似度的比对,并且比对效率高,比对结果准确性高。
本发明的目的之二在于提供一种图像相似度比较方法,其能在海量的图像数据中快速地进行检索,并且检索结果准确性高。
本发明的目的之三在于提供一种计算机可读存储介质,该存储介质中的程序运行时能生成图像唯一指纹,利用该方法生成的图像指纹可进行图像相似度的比较,或者能在海量的图像数据中快速地进行检索,并且检索结果准确性高。
本发明的目的之一采用如下技术方案实现:
一种图像指纹生成方法,包括以下步骤:
将图像按等比例缩放成N*N像素比例的第一图像;
将所述第一图像分割成M*M的网格矩阵;
将所述M*M的网格矩阵中的每一网格再均分成若干小格;
根据每一小格中的图像填充程度对所有小格进行归一化处理,其中,图像填充率大于或等于0.5的小格标记为1,代表物体,图像填充率小于0.5的小格标记为0,代表背景;
根据每个网格中的标记为1的小格的个数,查询预设的编码规则,得出每个网格对应的编码字符;
将M*M的网格矩阵转换成一维矩阵,根据每个网格的编码字符得出编码字符序列;
根据各个编码字符两两之间的相对空间位置,得出空间位置序列,其中,每个编码字符具有对应的空间位置,两个编码字符A和B之间的相对空间位置=编码字符A的空间位置—编码字符B的空间位置;
根据编码字符序列和空间位置序列,得出该图像的图像指纹。
进一步地,所述将图像按等比例缩放成N*N像素比例的第一图像具体为:将图像按等比例缩放成300*300像素比例的第一图像。
进一步地,所述将所述第一图像分割成M*M的网格矩阵具体为:将所述第一图像分割成15*15的网格矩阵。
进一步地,所述将所述M*M的网格矩阵中的每一网格再均分成若干小格具体为:将所述15*15的网格矩阵中的每一网格再均分成36小格。
进一步地,所述编码规则为:数值0至36对应的编码字符为0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z、a。
进一步地,所述编码字符的空间位置为该编码字符对应的数值。
本发明的目的之二采用如下技术方案实现:
根据上述的图像指纹生成方法获取所有图像的图像指纹,并将所有图像及其对应的图像指纹存入数据库中,建立图像指纹数据库;
根据上述的图像指纹生成方法来获取待比对图像的图像指纹;
根据余弦相似度算法将待比对图像的图像指纹与图像指纹数据库中的图像指纹逐一进行相似度比较;
将比对结果反馈给用户,其中,比对结果按照相似度由高到低的顺序排列。
本发明的目的之三采用如下技术方案实现:
一种计算机可读存储介质,所述计算机可读存储介质存储有可执行计算机程序,所述计算机程序运行时可实现上述的图像指纹生成方法或图像相似度比较方法。
相比现有技术,本发明的有益效果在于:
该图像指纹生成方法能够生成图像唯一指纹,通过细分粒度的方式在字符串中保留了图片特征,可以直接通过对应的空间位置进行相似度的计算,而常规的通过哈希函数确定的图像指纹无法实现这样的功能。
该图像相似度比较方法无需对图像进行关键词标识,也无需考虑图像的语义信息,采用图像唯一指纹,实现以图搜图的模式。而图像的唯一指纹采用一维矩阵序列,降低运算复杂度,提高检索效率,节省计算机存储空间;此外,指纹是根据存放图像网格矩阵的编码字符以及编码字符之间的相对空间位置确定的,保留所有的图像特征,提高检索准确性。
附图说明
图1为本发明提供的一种图像相似度比较方法的流程示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
请参阅图1,一种图像相似度比较方法,包含了图像指纹生成方法,具体包括以下步骤:
S1、获取图像指纹步骤(即图像指纹生成方法步骤):
S11、将图像按等比例缩放成N*N像素比例的第一图像;
S12、将第一图像分割成M*M的网格矩阵;
S13、将M*M的网格矩阵中的每一网格再均分成若干小格;
S14、根据每一小格中的图像填充程度对所有小格进行归一化处理,其中,图像填充率大于或等于0.5的小格标记为1,代表物体,图像填充率小于0.5的小格标记为0,代表背景;
S15、根据每个网格中的标记为1的小格的个数,查询预设的编码规则,得出每个网格对应的编码字符;
S16、将M*M的网格矩阵转换成一维矩阵,根据每个网格的编码字符得出编码字符序列;由于当前M*M的网格矩阵是一个多维矩阵,为了降低运算复杂度,提高检索效率,节省计算机存储空间;通过索引公式,把上述M*M的多维矩阵转换成一维矩阵,得出对应一列或一行的编码字符序列;
S17、根据各个编码字符两两之间的相对空间位置,得出空间位置序列,其中,每个编码字符具有对应的空间位置,A、B两个编码字符之间的相对空间位置=编码字符A的空间位置—编码字符B的空间位置;该图像所有网格所对应的编码字符分别两两组合得出一个相对空间位置,所得到的所有相对空间位置即为该图像的空间位置序列,该空间位置序列的位数,也就是组合数,由以下公式计算得出:
Figure GDA0002633837760000051
其中,n是当前网格矩阵编码字符的总个数,m是每次取出组合的个数,这里m=2。
S18、根据编码字符序列和空间位置序列,得出该图像的图像指纹;
S2、建立图像指纹数据库步骤:
S21、将所有图像及其对应的图像指纹存入图像指纹数据库中;
S3、图像相似度比较步骤:
S31、根据获取图像指纹步骤来获取待比对图像的图像指纹;
S32、根据余弦相似度算法将待比对图像的图像指纹与图像指纹数据库中的图像指纹逐一进行相似度比较;余弦值的取值范围是[-1,1],值越趋近于1,代表两个向量的方向越接近,夹角越小;值越趋近于-1,代表两个向量的方向越相反,夹角越大;值接近于0,代表两个向量近乎于正交,夹角近乎于垂直。以下是余弦相似度算法的相关公式:
Figure GDA0002633837760000061
上述公式,代表二维空间中,向量a的坐标是(x1,y1),向量b的坐标是(x2,y2),cosθ是向量a、b的余弦值。
Figure GDA0002633837760000062
上述公式,是根据公式一扩展,代表n维空间,其中向量A=(A1,A2,...,An),向量B=(B1,B2,...,Bn),Ai代表向量A中第i个子集,Bi代表向量B中第i个子集。
根据上述公式,把待比对图像的图像指纹视为向量A,把数据库图像的图像指纹视为向量B,计算待比对图像与数据库图像余弦值的大小
S33、将比对结果反馈给用户,其中,比对结果按照相似度由高到低的顺序排列。
作为一种优选的实施方式,将图像按等比例缩放成N*N像素比例的第一图像具体为:将图像按等比例缩放成300*300像素比例的第一图像。
作为一种优选的实施方式,将第一图像分割成M*M的网格矩阵具体为:将第一图像分割成15*15的网格矩阵,每个网格是20x20像素比例,分别存放对应的图像内容。
作为一种优选的实施方式,将M*M的网格矩阵中的每一网格再均分成若干小格具体为:将15*15的网格矩阵中的每一网格再均分成36小格。即:把一个20x20像素比例的网格细分成一个6x6的网格矩阵。对于6x6的网格矩阵,结合图像内容,得知每个网格的图像填充量。以0.5作为阀值,对矩阵每个网格的图像填充量进行归一化处理;当填充量大于或等于0.5,则标识为1,代表物体;当填充量小于0.5,则标识为0,代表背景。可见,一个6x6的网格矩阵是由36个0或1组成,即:一个15x15的网格矩阵中每个网格也是由36个0或1组成。
作为一种优选的实施方式,编码规则如下表所示:
Figure GDA0002633837760000071
作为一种优选的实施方式,编码字符的空间位置为该编码字符对应的数值。
在本实施例中,根据上述15x15网格矩阵中每个网格的图像填充量以及设置的编码规则,得出该网格矩阵每个网格的编码字符。如:一个6x6的网格矩阵是由10个1和26个0组成,其对应15x15网格矩阵的网格也是由10个1和26个0组成;其中标记为1的个数是10,代表15x15网格矩阵中该对应网格的图像填充量是10,根据编码规则,其对应的编码字符是A。根据前面所述的相对空间位置公式以及组合公式,分别计算15x15网格矩阵中字符之间的相对空间位置。如:系统对编码字符3、B、N进行两两组合,其中字符的空间位置分别是:3、11、23,组合形式分别是:3B、3N、BN;那么,字符之间的相对空间位置分别是:8、20、12。依次类推,基于上述15x15网格矩阵中编码字符之间的相对空间位置,得出该网格矩阵对应的空间位置序列。
将该方法应用于商标近似度检索,操作如下:获取商标数据库中所有商标的商标图像指纹,把商标数据库中全部商标图像等比例缩放成300x300的像素图像,并分割为15x15的网格矩阵。基于上述网格矩阵,系统把每一网格再均分成36小格,根据每一小格中的图像填充程度对细分网格进行归一化处理,图像填充率大于或等于0.5的标记为1,图像填充率小于0.5的标记为0。基于上述细分网格填充量和系统设置的编码规则,系统对15x15的网格矩阵每一网格进行编码字符,得出编码字符序列。基于上述每一网格的编码字符,得出各字符当前的空间位置;通过组合方法,计算字符之间的相对空间位置,得出空间位置序列。基于上述编码字符序列和空间位置序列相结合,得出商标图像唯一指纹;然后并将所有的商标图像及其图像指纹存储在商标图像指纹数据库中;当用户上传新的商标图像进行检索时,也按上述获取图像指纹步骤,生成该商标图像的唯一指纹,也就是字符串;并基于余弦相似度方法,把用户商标图像指纹字符串与数据库已有商标图像的指纹字符串进行相似度比较,并按照余弦值由大到小排序,反馈给用户。
此外,本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有可执行计算机程序,计算机程序运行时可实现上述的图像相似度比较方法或者图像相似度比较方法中的图像指纹生成方法。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims (8)

1.一种图像指纹生成方法,其特征在于,包括以下步骤:
将图像按等比例缩放成N*N像素比例的第一图像;
将所述第一图像分割成M*M的网格矩阵;
将所述M*M的网格矩阵中的每一网格再均分成若干小格;
根据每一小格中的图像填充程度对所有小格进行归一化处理,其中,图像填充率大于或等于0.5的小格标记为1,代表物体,图像填充率小于0.5的小格标记为0,代表背景;
根据每个网格中的标记为1的小格的个数,查询预设的编码规则,得出每个网格对应的编码字符;
将M*M的网格矩阵转换成一维矩阵,根据每个网格的编码字符得出编码字符序列;
根据各个编码字符两两之间的相对空间位置,得出空间位置序列,其中,每个编码字符具有对应的空间位置,两个编码字符A和B之间的相对空间位置=编码字符A的空间位置—编码字符B的空间位置;
根据编码字符序列和空间位置序列,得出该图像的图像指纹。
2.如权利要求1所述的图像指纹生成方法,其特征在于,所述将图像按等比例缩放成N*N像素比例的第一图像具体为:将图像按等比例缩放成300*300像素比例的第一图像。
3.如权利要求2所述的图像指纹生成方法,其特征在于,所述将所述第一图像分割成M*M的网格矩阵具体为:将所述第一图像分割成15*15的网格矩阵。
4.如权利要求3所述的图像指纹生成方法,其特征在于,所述将所述M*M的网格矩阵中的每一网格再均分成若干小格具体为:将所述15*15的网格矩阵中的每一网格再均分成36小格。
5.如权利要求4所述的图像指纹生成方法,其特征在于,所述编码规则为:数值0至36对应的编码字符为0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z、a。
6.如权利要求5所述的图像指纹生成方法,其特征在于,所述编码字符的空间位置为该编码字符对应的数值。
7.一种图像相似度比较方法,其特征在于,包括以下步骤:
根据如权利要求1至5任一项所述的图像指纹生成方法获取所有图像的图像指纹,并将所有图像及其对应的图像指纹存入数据库中,建立图像指纹数据库;
根据如权利要求1至5任一项所述的图像指纹生成方法来获取待比对图像的图像指纹;
根据余弦相似度算法将待比对图像的图像指纹与图像指纹数据库中的图像指纹逐一进行相似度比较;
将比对结果反馈给用户,其中,比对结果按照相似度由高到低的顺序排列。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行计算机程序,所述计算机程序运行时可实现如权利要求1至6任一项所述的图像指纹生成方法或如权利要求7所述的图像相似度比较方法。
CN201810981372.5A 2018-08-27 2018-08-27 一种图像指纹生成方法、图像相似度比较方法及存储介质 Active CN109344276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810981372.5A CN109344276B (zh) 2018-08-27 2018-08-27 一种图像指纹生成方法、图像相似度比较方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810981372.5A CN109344276B (zh) 2018-08-27 2018-08-27 一种图像指纹生成方法、图像相似度比较方法及存储介质

Publications (2)

Publication Number Publication Date
CN109344276A CN109344276A (zh) 2019-02-15
CN109344276B true CN109344276B (zh) 2021-01-05

Family

ID=65296769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810981372.5A Active CN109344276B (zh) 2018-08-27 2018-08-27 一种图像指纹生成方法、图像相似度比较方法及存储介质

Country Status (1)

Country Link
CN (1) CN109344276B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688514A (zh) * 2019-08-30 2020-01-14 中国人民财产保险股份有限公司 一种保险理赔图像数据的查重方法及装置
CN111368122B (zh) * 2020-02-14 2022-09-30 深圳壹账通智能科技有限公司 一种图片去重的方法及装置
CN111986089A (zh) * 2020-08-28 2020-11-24 计易数据科技(上海)有限公司 特征值整数化的图像存储与比对方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794390A (zh) * 2010-02-24 2010-08-04 北京微智信业科技有限公司 图像指纹提取方法及其设备、信息过滤方法及其系统
CN102467513A (zh) * 2010-11-03 2012-05-23 腾讯科技(深圳)有限公司 图片搜索方法和系统
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
US8611617B1 (en) * 2010-08-09 2013-12-17 Google Inc. Similar image selection
CN103699691A (zh) * 2014-01-10 2014-04-02 五八同城信息技术有限公司 生成图像指纹及基于此进行相似图像检索的方法
CN104809248A (zh) * 2015-05-18 2015-07-29 成都索贝数码科技股份有限公司 视频指纹提取及检索方法
CN106599028A (zh) * 2016-11-02 2017-04-26 华南理工大学 一种基于视频图像处理的书本内容搜索匹配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102359556B1 (ko) * 2016-11-11 2022-02-08 삼성전자주식회사 지문 영상을 이용한 사용자 인증 방법 및 사용자 인증을 위한 부호화 모델 생성 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794390A (zh) * 2010-02-24 2010-08-04 北京微智信业科技有限公司 图像指纹提取方法及其设备、信息过滤方法及其系统
US8611617B1 (en) * 2010-08-09 2013-12-17 Google Inc. Similar image selection
CN102467513A (zh) * 2010-11-03 2012-05-23 腾讯科技(深圳)有限公司 图片搜索方法和系统
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
CN103699691A (zh) * 2014-01-10 2014-04-02 五八同城信息技术有限公司 生成图像指纹及基于此进行相似图像检索的方法
CN104809248A (zh) * 2015-05-18 2015-07-29 成都索贝数码科技股份有限公司 视频指纹提取及检索方法
CN106599028A (zh) * 2016-11-02 2017-04-26 华南理工大学 一种基于视频图像处理的书本内容搜索匹配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
利用php来实现图片相似度搜索的简单原理 图像指纹唯一性的原理实现方法 url:http://www.360doc.com/content/14/0616/21/552866_387282689.shtml;大芬油画;《个人图书馆》;20140616;全文 *
相似图片搜索的两种哈希算法 url:https://wenku.baidu.com/view/e31879c9767f5acfa1c7cd93.html;那些空白的梦;《百度文库》;20180630;全文 *

Also Published As

Publication number Publication date
CN109344276A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
US20220415027A1 (en) Method for re-recognizing object image based on multi-feature information capture and correlation analysis
US10769503B1 (en) Digital organization of printed documents according to extracted semantic information
Kulis et al. Fast similarity search for learned metrics
Wang et al. MARCH: Multiscale-arch-height description for mobile retrieval of leaf images
CN109344276B (zh) 一种图像指纹生成方法、图像相似度比较方法及存储介质
Wei et al. Projected residual vector quantization for ANN search
US9141853B1 (en) System and method for extracting information from documents
CN104199923B (zh) 基于最优k均值哈希算法的大规模图像库检索方法
Chen et al. Using binarization and hashing for efficient SIFT matching
Ning et al. Scalable image retrieval by sparse product quantization
Tiakas et al. MSIDX: multi-sort indexing for efficient content-based image search and retrieval
CN105022752A (zh) 图像检索方法与装置
CN110837568A (zh) 实体对齐方法及装置、电子设备、存储介质
CN112182262B (zh) 一种基于特征分类的图像查询方法
Wang et al. Statistical quantization for similarity search
CN107133348B (zh) 大规模图片集中基于语义一致性的近似搜索方法
CN113657504A (zh) 图像检索方法、装置、计算机设备和存储介质
Dong et al. Color space quantization-based clustering for image retrieval
JP2014102772A (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
CN115186138A (zh) 一种配电网数据的比对方法及终端
Asif et al. Composite description based on color vector quantization and visual primary features for CBIR tasks
Song et al. A textural feature-based image retrieval algorithm
CN107402974B (zh) 基于多种二进制HoG描述符的草图检索方法
Wang et al. Evaluation of global descriptors for large scale image retrieval
He et al. A new two-stage image retrieval algorithm with convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant