CN111428122A - 图片检索方法、装置及电子设备 - Google Patents

图片检索方法、装置及电子设备 Download PDF

Info

Publication number
CN111428122A
CN111428122A CN202010205304.7A CN202010205304A CN111428122A CN 111428122 A CN111428122 A CN 111428122A CN 202010205304 A CN202010205304 A CN 202010205304A CN 111428122 A CN111428122 A CN 111428122A
Authority
CN
China
Prior art keywords
picture
target
similarity
database
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010205304.7A
Other languages
English (en)
Other versions
CN111428122B (zh
Inventor
田红星
徐家伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhongfu Information Technology Co Ltd
Original Assignee
Nanjing Zhongfu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhongfu Information Technology Co Ltd filed Critical Nanjing Zhongfu Information Technology Co Ltd
Priority to CN202010205304.7A priority Critical patent/CN111428122B/zh
Publication of CN111428122A publication Critical patent/CN111428122A/zh
Application granted granted Critical
Publication of CN111428122B publication Critical patent/CN111428122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种图片检索方法、装置及电子设备,涉及图像处理技术领域,该方法包括:提取目标图片的目标哈希值和目标描述特征参数;基于目标哈希值计算目标图片与图片数据库中各个图片的第一相似度;其中,图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数;基于目标描述特征参数计算目标图片与图片数据库中各个图片的第二相似度;基于第一相似度和第二相似度,从图片数据库中获取目标图片的匹配图片。本发明提升图片检索的效率和准确度。

Description

图片检索方法、装置及电子设备
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种图片检索方法、装置及电子设备。
背景技术
随着互联网技术发展,信息交换与传播的方式逐渐变得丰富,而对于互联网监管部门,每天监测的信息巨大,相应的出现了如舆情监测系统、论坛审查系统等监控。目前,图片信息成为信息传播的一种重要方式,为了实现互联网的信息排查,对于互联网中图片的检索排查是必不可少的。然而,由于互联网环境复杂,导致图片种类繁杂,而现有图片检索技术无法对多种类型图片进行检索,只能针对单一类型图片进行检索。因此,现有的图片检索技术在图片数据库中的图片数量庞大时,还存在图片检索效率较低,检索准确度较低的问题。
发明内容
本发明实施例的目的在于提供一种图片检索方法、装置及电子设备,可以提升图片检索的效率和准确度。
第一方面,本发明实施例提供了一种图片检索方法,包括:提取目标图片的目标哈希值和目标描述特征参数;基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度;其中,所述图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数;基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度;基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片。
在可选的实施方式中,所述图片数据库的建立过程包括:利用互联网检测器从目标网络中采集图片;提取采集到的图片的哈希值和描述特征参数;基于采集到的图片的哈希值和描述特征参数,从采集到的图片中选择图片,并将选择的图片添加至图片数据库。
在可选的实施方式中,所述目标描述特征参数为sift特征;所述提取目标图片的目标哈希值和目标描述特征参数的步骤,包括:接收用户输入的目标图片,对所述目标图片进行图片预处理;其中所述图片预处理包括图片降噪处理和图片灰度化处理;利用离散余弦变换算法对预处理后的所述目标图片进行图像变换,得到所述目标图片的目标哈希值;利用sift特征提取算法提取所述目标图片中的各个特征点,得到所述目标图片的目标描述特征参数。
在可选的实施方式中,所述利用离散余弦变换算法对预处理后的所述目标图片进行图像变换,得到所述目标图片的目标哈希值的步骤,包括:将预处理后的所述目标图片缩放为预设尺寸的目标图片;其中,所述预设尺寸为32*32;利用离散余弦变换算法从所述目标图片的左上角提取8*8的DCT矩阵;计算所述DCT矩阵中所有数据的平均值,并确定所述DCT矩阵对应的DCT向量;将所述DCT向量中大于所述平均值的数值设置为1,将所述DCT向量中小于所述平均值的数值设置为0,得到所述目标图片的目标哈希值;其中,所述目标哈希值是长度为64位的向量。
在可选的实施方式中,所述图片数据库中各个图片对应的哈希值和所述目标图片的目标哈希值为相等长度的向量;所述基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度的步骤,包括:分别计算所述图片数据库中各个图片对应的哈希值与所述目标图片的目标哈希值之间的海明距离,得到所述目标图片与图片数据库中各个图片的第一相似度。
在可选的实施方式中,所述目标描述特征参数为sift特征;所述基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度的步骤,包括:将所述图片数据库中与所述目标图片的第一相似度大于预设相似度阈值的图片加入目标数据库;分别计算所述目标图片的目标描述特征参数与所述图片数据库中各个图片的描述特征参数之间的相似度,得到所述目标图片与所述图片数据库中各个图片的第二相似度。
在可选的实施方式中,所述基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片的步骤,包括:当所述图片数据库中各图片与所述目标图片的所述第一相似度中存在第一相似度的值为1时,将第一相似度值为1的图片作为与所述目标图片所对应的图片检索结果;当所述图片数据库中各图片与所述目标图片的所述第一相似度中不存在第一相似度的值为1时,计算所述第一相似度和所述第二相似度的加权平均值,得到所述图片数据库中各图片与所述目标图片的最终相似度;将所述图片数据库中所述最终相似度大于预设阈值的图片作为所述目标图片所对应的图片检索结果。
第二方面,本发明实施例提供了一种图片检索装置,包括:特征提取模块,用于提取目标图片的目标哈希值和目标描述特征参数;第一计算模块,用于基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度;其中,所述图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数;第二计算模块,用于基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度;图片获取模块,用于基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片。
第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如第一方面所述的方法的步骤。
第四方面,本发明实施例提供了一种计算机可读介质,其中,所述计算机可读介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使所述处理器实现如第一方面所述的方法。
本发明实施例提供了一种图片检索方法,该方法包括:首先提取目标图片的目标哈希值和目标描述特征参数;然后基于目标哈希值计算目标图片与图片数据库(图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数)中各个图片的第一相似度;再基于目标描述特征参数计算目标图片与图片数据库中各个图片的第二相似度;最后基于第一相似度和第二相似度,从图片数据库中获取目标图片的匹配图片。该方法通过分别计算目标图片与图片数据库中各个图片的第一相似度和第二相似度,并基于第一相似度和第二相似度确定图片数据库中与目标图片相匹配的图片,提升了图片检索的准确度,由于图片检索过程中计算相似度时使用的各个图片的哈希值和各个图片的描述特征参数是预先存储在图片数据库中的,提升了图片检索效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图片检索方法流程图;
图2为本发明实施例提供的一种特征提取流程图;
图3为本发明实施例提供的一种图片检索装置结构示意图;
图4为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到现有的图片检索技术在图片数据库中的图片数量庞大时,还存在图片检索效率较低,检索准确度较低的问题,本发明实施例提供了一种图片检索方法、装置及电子设备,可以应用于提升图片检索的效率和准确度。
本发明实施例提供了一种图片检索方法,参见如图1所示的图片检索方法流程图,该方法可以由电子设备诸如移动终端或计算机执行,该方法主要包括以下步骤S102~步骤S108:
步骤S102:提取目标图片的目标哈希值和目标描述特征参数。
上述目标图片可以是用户输入的待检索图片,为了检索到与上述目标图片相似的图片,需要先获取目标图片的特征,诸如计算目标图片的目标哈希值和提取目标图片的目标描述特征参数,该目标描述特征参数可以是计算机视觉对于图片的一种描述,可以是通过检测图片中的关键点,得到的图片中局部特征的描述子,该目标描述特征参数可以是诸如尺度不变特征变换(Scale-invariant feature transform,SIFT)等特征。
步骤S104:基于目标哈希值计算目标图片与图片数据库中各个图片的第一相似度;其中,图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数。
分别计算图片数据库中各个图片对应的哈希值与目标图片的目标哈希值之间的海明距离,得到目标图片与图片数据库中各个图片的第一相似度。其中,上述图片数据库中各个图片对应的哈希值和目标图片的目标哈希值为相等长度的向量。上述图片数据库中各个图片对应的哈希值的提取方式,与上述目标图片的目标哈希值的提取方式相同,且图片数据库中各个图片对应的哈希值是预先提取并存储在图片数据库中的,以便在计算相似度时直接从图片数据库中获取各图片的哈希值即可计算,缩短了计算时间。
步骤S106:基于目标描述特征参数计算目标图片与图片数据库中各个图片的第二相似度。
将图片数据库中与目标图片的第一相似度大于预设相似度阈值的图片加入目标数据库;分别计算目标图片的目标描述特征参数与图片数据库中各个图片的描述特征参数之间的相似度,得到目标图片与图片数据库中各个图片的第二相似度。上述目标描述特征参数与图片数据库中各个图片的描述特征参数属于相同类型的参数,且该参数的提取方式相同。上述图片数据库中各个图片的描述特征参数可以是预先提取好的,为了缩短第二相似度的计算时间,在计算上述第二特征参数时,可以从图片数据库中筛选出满足条件的图片,计算满足条件的图片与目标图片的第二相似度,该满足条件的图片可以是与目标图片的第一相似度大于预设相似阈值的图片,从而缩小可能与目标图片相匹配的图片的范围,提升检索效率。其中,上述预设相似阈值可以是根据实际情况人为设置的,诸如可以是0.5~1之间的任意数值。
步骤S108:基于第一相似度和第二相似度,从图片数据库中获取目标图片的匹配图片。
基于目标图片与图片数据库中各个图片的第一相似度和目标图片与图片数据库中各个图片的第二相似度,确定目标图片与图片数据库中各个图片的最终相似度,从而得到图像数据库中与目标图片相似度最高的图片,即目标图片的匹配图片。
本实施例提供的上述图片检索方法,通过分别计算目标图片与图片数据库中各个图片的第一相似度和第二相似度,并基于第一相似度和第二相似度确定图片数据库中与目标图片相匹配的图片,提升了图片检索的准确度,由于图片检索过程中计算相似度时使用的各个图片的哈希值和各个图片的描述特征参数是预先存储在图片数据库中的,提升了图片检索效率。
在一种具体的实施方式中,上述图片数据的建立过程包括:利用互联网检测器从目标网络中采集图片;提取采集到的图片的哈希值和描述特征参数;基于采集到的图片的哈希值和描述特征参数,从采集到的图片中选择图片,并将选择的图片添加至图片数据库。由于流经检测器图片质量参差不齐,需要对图片进行降噪,提取图片长宽特征对图片进行缩放,生成便于处理的图片,此过程中,如果图片过小,会对图片进行过滤。经过预处理之后的图片,经过感知哈希算法,生成64位的哈希值,将获取到的图片及生成的图片所对应的哈希值添加到图片数据库中,供将来图片检索使用;提取哈希值的目的是为了将不同质量尺寸的图片提取统一的数字特征。为提高处理速度,本发明在实际操作过程中,可以采用批处理提取哈希值的方法。对预处理后的图片进行图片灰度化,得到灰度图片,对每张图片进行提取128位sift特征描述子(描述特征参数),并将各个图片的sift特征描述子添加到图片数据库中;提取特征描述子的目的是为了将不同质量尺寸的图片提取统一的数字特征,其中,为了提高处理速度,可以采用批量处理的方法提取特征描述子。对上述图片数据库中的图片提取哈希值和描述特征参数的方法与目标图片提取目标哈希值和目标描述特征参数的方法相同。
为了提升图片检索的准确度,本实施例提供了提取目标图片的目标哈希值和目标描述特征参数的实施方式,参见如图2所示的特征提取流程图,具体可参照如下步骤S202~步骤S206执行:
步骤S202:接收用户输入的目标图片,对目标图片进行图片预处理;其中图片预处理包括图片降噪处理和图片灰度化处理。
接收用户输入的目标图片后,对目标图片进行降噪、缩放,灰度化等一系列预处理过程,为了在提取特征的时候,避免噪声点的影响,对图片进行降噪处理;由于获取的图片大都是彩色图片,为了降低提取特征的计算量,需要将彩色图片进行灰度化处理。
步骤S204:利用离散余弦变换算法对预处理后的目标图片进行图像变换,得到目标图片的目标哈希值。
将预处理后的目标图片缩放为预设尺寸的目标图片;其中,预设尺寸为32*32;利用离散余弦变换算法从目标图片的左上角提取8*8的DCT矩阵;计算DCT矩阵中所有数据的平均值,并确定DCT矩阵对应的DCT向量;将DCT向量中大于平均值的数值设置为1,将DCT向量中小于平均值的数值设置为0,得到目标图片的目标哈希值;其中,目标哈希值是长度为64位的向量。
由于从检测器获取的图片,其质量参差不齐,很大一部分图片尺寸较大,将其进行第一次缩放到适合处理的尺寸,而有些图片过小,如缩略图等,根据其大小特征,当图片太小时,无法包含有效信息,可以将过小的图片过滤,以减小数据库存储压力。去除高频和细节的最快方法是缩小图片,将图片缩小到32x32的尺寸,不要保持纵横比,这样就可以比较任意大小的图片,摒弃不同尺寸、比例带来的图片差异;同时,简化了DCT的计算量。由于缩放图片时缩放为32*32,因此计算DCT系数矩阵时也是32*32,由于图片有效信息在左上角8*8的矩阵中,因此,提取左上角8*8DCT矩阵;此缩小的DCT系数矩阵保留了图片中的最低频率。累加DCT矩阵中的数值,并除以数值个数64,得到DCT矩阵中所有数据的平均值,将8*8的DCT矩阵转换为64位的一维DCT向量,将DCT向量中大于上述平均值的数值均设置为1,将DCT向量中小于上述平均值的数值均设置为0,得到目标图片的目标哈希值,该目标哈希值为64位的一维向量。
步骤S206:利用sift特征提取算法提取目标图片中的各个特征点,得到目标图片的目标描述特征参数。
上述目标描述特征参数可以为sift特征,该sift特征可以是128位的sift特征描述子。综合考虑sift算法,特征向量可以采用4*4*8维向量表征,因此,图片的特征描述子可以为n*128的特征子矩阵,其中,n为特征点。
为了进一步提升图片检索的准确度,本实施例提供了基于第一相似度和第二相似度,从图片数据库中获取目标图片的匹配图片的具体实施方式:当图片数据库中各图片与目标图片的第一相似度中存在第一相似度的值为1时,将第一相似度值为1的图片作为与目标图片所对应的图片检索结果。当图片数据库中各图片与目标图片的第一相似度中不存在第一相似度的值为1时,计算第一相似度和第二相似度的加权平均值,得到图片数据库中各图片与目标图片的最终相似度;将图片数据库中最终相似度大于预设阈值的图片作为目标图片所对应的图片检索结果。当图片数据库中存在图片的哈希值与目标图片的目标哈希值相同时(即存在大小为1或100%的第一相似度),将该图片确定为目标图片的检索结果。当图片数据库中不存在图片的哈希值与目标图片的目标哈希值相同时,计算第一相似度和第二相似度的加权平均值,第一相似度和第二相似度的权重可以根据实际情况进行设置,诸如,第一相似度和第二相似度的权重均为0.5。将图片数据库中各个图片的第一相似度和第二相似度的加权平均值作为与目标图片的最终相似度,将图片数据库中与目标图片的最终相似度最大的图片作为目标图片的检索结果,还可以将目标图片的检索结果显示给用户。
本实施例提供的上述图片检索方法,通过计算上述第一相似度和第二相似度的加权平均值,得到图片数据库中各图片与目标图片的最终相似度,并将图片数据库中最终相似度大于预设阈值的图片作为目标图片的检索结果,可以将不同种类的图片作为目标图片进行检索,提升了图片检索的准确度。
对应于上述图片检索方法,本实施例提供了一种图片检索装置,参见如图3所示的图片检索装置结构示意图,该装置包括:
特征提取模块31,用于提取目标图片的目标哈希值和目标描述特征参数。
第一计算模块32,用于基于目标哈希值计算目标图片与图片数据库中各个图片的第一相似度;其中,图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数。
第二计算模块33,用于基于目标描述特征参数计算目标图片与图片数据库中各个图片的第二相似度。
图片获取模块34,用于基于第一相似度和第二相似度,从图片数据库中获取目标图片的匹配图片。
本实施例提供的上述图片检索装置,通过分别计算目标图片与图片数据库中各个图片的第一相似度和第二相似度,并基于第一相似度和第二相似度确定图片数据库中与目标图片相匹配的图片,提升了图片检索的准确度,由于图片检索过程中计算相似度时使用的各个图片的哈希值和各个图片的描述特征参数是预先存储在图片数据库中的,提升了图片检索效率。
在一种实施方式中,上述图片数据库的建立过程包括:利用互联网检测器从目标网络中采集图片;提取采集到的图片的哈希值和描述特征参数;基于采集到的图片的哈希值和描述特征参数,从采集到的图片中选择图片,并将选择的图片添加至图片数据库。
在一种实施方式中,上述目标描述特征参数为sift特征;上述特征提取模块31,进一步用于接收用户输入的目标图片,对目标图片进行图片预处理;其中图片预处理包括图片降噪处理和图片灰度化处理;利用离散余弦变换算法对预处理后的目标图片进行图像变换,得到目标图片的目标哈希值;利用sift特征提取算法提取目标图片中的各个特征点,得到目标图片的目标描述特征参数。
在一种实施方式中,上述特征提取模块31,进一步用于将预处理后的目标图片缩放为预设尺寸的目标图片;其中,预设尺寸为32*32;利用离散余弦变换算法从目标图片的左上角提取8*8的DCT矩阵;计算DCT矩阵中所有数据的平均值,并确定DCT矩阵对应的DCT向量;将DCT向量中大于平均值的数值设置为1,将DCT向量中小于平均值的数值设置为0,得到目标图片的目标哈希值;其中,目标哈希值是长度为64位的向量。
在一种实施方式中,上述图片数据库中各个图片对应的哈希值和目标图片的目标哈希值为相等长度的向量;上述第一计算模块32,进一步用于分别计算图片数据库中各个图片对应的哈希值与目标图片的目标哈希值之间的海明距离,得到目标图片与图片数据库中各个图片的第一相似度。
在一种实施方式中,上述目标描述特征参数为sift特征;上述第二计算模块33,进一步用于将图片数据库中与目标图片的第一相似度大于预设相似度阈值的图片加入目标数据库;分别计算目标图片的目标描述特征参数与图片数据库中各个图片的描述特征参数之间的相似度,得到目标图片与图片数据库中各个图片的第二相似度。
在一种实施方式中,上述图片获取模块34,进一步用于当图片数据库中各图片与目标图片的第一相似度中存在第一相似度的值为1时,将第一相似度值为1的图片作为与目标图片所对应的图片检索结果;当图片数据库中各图片与目标图片的第一相似度中不存在第一相似度的值为1时,计算第一相似度和第二相似度的加权平均值,得到图片数据库中各图片与目标图片的最终相似度;将图片数据库中最终相似度大于预设阈值的图片作为目标图片所对应的图片检索结果。
本实施例提供的上述图片检索装置,通过计算上述第一相似度和第二相似度的加权平均值,得到图片数据库中各图片与目标图片的最终相似度,并将图片数据库中最终相似度大于预设阈值的图片作为目标图片的检索结果,可以将不同种类的图片作为目标图片进行检索,提升了图片检索的准确度。
本实施例所提供的装置,其实现原理及产生的技术效果和前述实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例提供了一种电子设备,如图4所示的电子设备结构示意图,电子设备包括处理器41、存储器42,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。
参见图4,电子设备还包括:总线44和通信接口43,处理器41、通信接口43和存储器42通过总线44连接。处理器41用于执行存储器42中存储的可执行模块,例如计算机程序。
其中,存储器42可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线44可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器42用于存储程序,所述处理器41在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器41中,或者由处理器41实现。
处理器41可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器41中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器41可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等。还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器42,处理器41读取存储器42中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供了一种计算机可读介质,其中,所述计算机可读介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使所述处理器实现上述实施例所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种图片检索方法,其特征在于,包括:
提取目标图片的目标哈希值和目标描述特征参数;
基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度;其中,所述图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数;
基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度;
基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片。
2.根据权利要求1所述的方法,其特征在于,所述图片数据库的建立过程包括:
利用互联网检测器从目标网络中采集图片;
提取采集到的图片的哈希值和描述特征参数;
基于采集到的图片的哈希值和描述特征参数,从采集到的图片中选择图片,并将选择的图片添加至图片数据库。
3.根据权利要求1所述的方法,其特征在于,所述目标描述特征参数为sift特征;
所述提取目标图片的目标哈希值和目标描述特征参数的步骤,包括:
接收用户输入的目标图片,对所述目标图片进行图片预处理;其中所述图片预处理包括图片降噪处理和图片灰度化处理;
利用离散余弦变换算法对预处理后的所述目标图片进行图像变换,得到所述目标图片的目标哈希值;
利用sift特征提取算法提取所述目标图片中的各个特征点,得到所述目标图片的目标描述特征参数。
4.根据权利要求3所述的方法,其特征在于,所述利用离散余弦变换算法对预处理后的所述目标图片进行图像变换,得到所述目标图片的目标哈希值的步骤,包括:
将预处理后的所述目标图片缩放为预设尺寸的目标图片;其中,所述预设尺寸为32*32;
利用离散余弦变换算法从所述目标图片的左上角提取8*8的DCT矩阵;
计算所述DCT矩阵中所有数据的平均值,并确定所述DCT矩阵对应的DCT向量;
将所述DCT向量中大于所述平均值的数值设置为1,将所述DCT向量中小于所述平均值的数值设置为0,得到所述目标图片的目标哈希值;其中,所述目标哈希值是长度为64位的向量。
5.根据权利要求1所述的方法,其特征在于,所述图片数据库中各个图片对应的哈希值和所述目标图片的目标哈希值为相等长度的向量;
所述基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度的步骤,包括:
分别计算所述图片数据库中各个图片对应的哈希值与所述目标图片的目标哈希值之间的海明距离,得到所述目标图片与图片数据库中各个图片的第一相似度。
6.根据权利要求5所述的方法,其特征在于,所述目标描述特征参数为sift特征;
所述基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度的步骤,包括:
将所述图片数据库中与所述目标图片的第一相似度大于预设相似度阈值的图片加入目标数据库;
分别计算所述目标图片的目标描述特征参数与所述图片数据库中各个图片的描述特征参数之间的相似度,得到所述目标图片与所述图片数据库中各个图片的第二相似度。
7.根据权利要求1所述的方法,其特征在于,所述基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片的步骤,包括:
当所述图片数据库中各图片与所述目标图片的所述第一相似度中存在第一相似度的值为1时,将第一相似度值为1的图片作为与所述目标图片所对应的图片检索结果;
当所述图片数据库中各图片与所述目标图片的所述第一相似度中不存在第一相似度的值为1时,计算所述第一相似度和所述第二相似度的加权平均值,得到所述图片数据库中各图片与所述目标图片的最终相似度;
将所述图片数据库中所述最终相似度大于预设阈值的图片作为所述目标图片所对应的图片检索结果。
8.一种图片检索装置,其特征在于,包括:
特征提取模块,用于提取目标图片的目标哈希值和目标描述特征参数;
第一计算模块,用于基于所述目标哈希值计算所述目标图片与图片数据库中各个图片的第一相似度;其中,所述图片数据库中存储有各个图片的哈希值和各个图片的描述特征参数;
第二计算模块,用于基于所述目标描述特征参数计算所述目标图片与所述图片数据库中各个图片的第二相似度;
图片获取模块,用于基于所述第一相似度和所述第二相似度,从所述图片数据库中获取所述目标图片的匹配图片。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-7任一项所述的方法。
10.一种计算机可读介质,其特征在于,所述计算机可读介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使所述处理器实现权利要求1-7任一项所述的方法。
CN202010205304.7A 2020-03-20 2020-03-20 图片检索方法、装置及电子设备 Active CN111428122B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010205304.7A CN111428122B (zh) 2020-03-20 2020-03-20 图片检索方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010205304.7A CN111428122B (zh) 2020-03-20 2020-03-20 图片检索方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111428122A true CN111428122A (zh) 2020-07-17
CN111428122B CN111428122B (zh) 2023-09-01

Family

ID=71550048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010205304.7A Active CN111428122B (zh) 2020-03-20 2020-03-20 图片检索方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111428122B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579812A (zh) * 2020-12-18 2021-03-30 中国平安财产保险股份有限公司 检索图片的方法、装置和计算机设备
CN112651953A (zh) * 2020-12-31 2021-04-13 平安国际智慧城市科技股份有限公司 图片相似度计算方法、装置、计算机设备及存储介质
CN113938649A (zh) * 2021-09-24 2022-01-14 成都智元汇信息技术股份有限公司 一种报警消息去重方法及装置
CN114926563A (zh) * 2022-07-18 2022-08-19 广州中望龙腾软件股份有限公司 一种图形自动补齐方法、装置及存储介质
CN115311477A (zh) * 2022-08-09 2022-11-08 北京惠朗时代科技有限公司 一种基于超分辨率重建的模仿式商标精准检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336835A (zh) * 2013-07-12 2013-10-02 西安电子科技大学 基于权值color-sift特征字典的图像检索方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统
CN108491498A (zh) * 2018-03-20 2018-09-04 山东神博数字技术有限公司 一种基于多特征检测的卡口图像目标搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336835A (zh) * 2013-07-12 2013-10-02 西安电子科技大学 基于权值color-sift特征字典的图像检索方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统
CN108491498A (zh) * 2018-03-20 2018-09-04 山东神博数字技术有限公司 一种基于多特征检测的卡口图像目标搜索方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579812A (zh) * 2020-12-18 2021-03-30 中国平安财产保险股份有限公司 检索图片的方法、装置和计算机设备
CN112579812B (zh) * 2020-12-18 2023-06-20 中国平安财产保险股份有限公司 检索图片的方法、装置和计算机设备
CN112651953A (zh) * 2020-12-31 2021-04-13 平安国际智慧城市科技股份有限公司 图片相似度计算方法、装置、计算机设备及存储介质
CN112651953B (zh) * 2020-12-31 2024-03-15 平安国际智慧城市科技股份有限公司 图片相似度计算方法、装置、计算机设备及存储介质
CN113938649A (zh) * 2021-09-24 2022-01-14 成都智元汇信息技术股份有限公司 一种报警消息去重方法及装置
CN114926563A (zh) * 2022-07-18 2022-08-19 广州中望龙腾软件股份有限公司 一种图形自动补齐方法、装置及存储介质
CN115311477A (zh) * 2022-08-09 2022-11-08 北京惠朗时代科技有限公司 一种基于超分辨率重建的模仿式商标精准检测方法及系统
CN115311477B (zh) * 2022-08-09 2024-01-16 北京惠朗时代科技有限公司 一种基于超分辨率重建的模仿式商标精准检测方法及系统

Also Published As

Publication number Publication date
CN111428122B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
CN111428122A (zh) 图片检索方法、装置及电子设备
US11586664B2 (en) Image retrieval method and apparatus, and electronic device
WO2021258699A1 (zh) 一种图像识别方法、装置、电子设备和计算机可读介质
CN112653928B (zh) 一种基于内容相同的视频过滤方法、系统及设备
WO2021175040A1 (zh) 视频处理方法及相关装置
CN110991310A (zh) 人像检测方法、装置、电子设备及计算机可读介质
CN112489063A (zh) 图像分割方法、图像分割模型的训练方法和装置
CN111368143A (zh) 一种视频相似度检索方法、装置、电子设备及存储介质
CN111738173B (zh) 视频片段检测方法、装置、电子设备及存储介质
CN110765291A (zh) 检索方法、装置及电子设备
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
CN111311573B (zh) 枝条确定方法、装置及电子设备
CN112650881A (zh) 监控数据的处理方法、装置及存储介质
CN112364918A (zh) 异常识别方法、终端和计算机可读存储介质
CN116912556A (zh) 图片分类方法、装置、电子设备及存储介质
CN111627041B (zh) 多帧数据的处理方法、装置及电子设备
CN114550256A (zh) 极小目标检测方法、装置、设备及计算机可读介质
CN110134813B (zh) 图像检索方法、图像检索装置及终端设备
CN113705314A (zh) 视频处理方法、设备、可读存储介质及程序产品
CN110287943B (zh) 图像的对象识别方法、装置、电子设备及存储介质
CN111428067B (zh) 公文图片获取方法、装置及电子设备
CN112036501A (zh) 基于卷积神经网络的图片的相似度检测方法及其相关设备
CN112508187A (zh) 一种机器学习模型压缩方法、装置及设备
CN114092334A (zh) 一种图像处理方法、装置及设备
JPH09275565A (ja) 画像ブロックマッチング方法及び画像符号化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant