CN111506750B - 图片检索方法、装置及电子设备 - Google Patents

图片检索方法、装置及电子设备 Download PDF

Info

Publication number
CN111506750B
CN111506750B CN202010540395.XA CN202010540395A CN111506750B CN 111506750 B CN111506750 B CN 111506750B CN 202010540395 A CN202010540395 A CN 202010540395A CN 111506750 B CN111506750 B CN 111506750B
Authority
CN
China
Prior art keywords
picture
information
retrieved
historical
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010540395.XA
Other languages
English (en)
Other versions
CN111506750A (zh
Inventor
王森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingsoft Cloud Shenzhen Edge Computing Technology Co ltd
Beijing Kingsoft Cloud Network Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN202010540395.XA priority Critical patent/CN111506750B/zh
Publication of CN111506750A publication Critical patent/CN111506750A/zh
Application granted granted Critical
Publication of CN111506750B publication Critical patent/CN111506750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种图片检索方法、装置及电子设备,涉及检索技术领域,如果接收到待检索图片,提取该待检索图片的特征信息;根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;通过筛选出的该图片标识,得到该待检索图片的检索结果。本发明实施例通过预先构建图片信息库,将相似图片的图片标识划分到同一个图片信息集合中,当进行图片检索时,只在与待检索图片的特征信息相匹配的图片信息集合中检索,缩小了检索空间,进而缩短了检索耗时,并提高了检索服务的质量。

Description

图片检索方法、装置及电子设备
技术领域
本发明涉及检索技术领域,尤其是涉及一种图片检索方法、装置及电子设备。
背景技术
随着互联网和信息技术的迅速发展,各公司、组织以及个人积累了大量的图片数据,如何在海量规模的图片数据中,高效且准确地检索出所需要的图片,是媒资管理中非常重要的一步。
目前,图片检索的方式主要是基于内容完成检索,通过卷积网络提取图片的纹理、颜色、风格、轮廓的信息,组合成高维特征,并进行特征相似度的遍历计算进行筛选。在海量图片数据的检索场景中,如果要从海量图片库中找到和待识别图片相近的图片,传统图片检索方式的检索需要较长的耗时,从而导致检索服务的质量下降。
发明内容
有鉴于此,本发明的目的在于提供一种图片检索方法、装置及电子设备,可以减少图片检索的耗时,提高检索效率,从而提高检索服务的质量。
第一方面,本发明实施例提供了一种图片检索方法,包括:如果接收到待检索图片,提取该待检索图片的特征信息;根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;通过筛选出的该图片标识,得到该待检索图片的检索结果。
在本发明的较佳实施例中,上述图片信息库通过下述方式构建:获取多张历史图片,以及该历史图片的图片标识;提取该历史图片的特征信息;根据该历史图片的特征信息,将该多张历史图片的图片标识划分到多个图片信息集合中;其中,该图片信息集合中的图片标识对应的历史图片,两两之间的相似度满足预设第一相似度要求;根据该多个图片信息集合,构建该多张历史图片的图片信息库。
在本发明的较佳实施例中,上述提取该历史图片的特征信息的步骤,包括:提取该历史图片的图片特征向量和/或文字特征向量。
在本发明的较佳实施例中,上述提取该历史图片的图片特征向量和/或文字特征向量的步骤,包括:通过预设的卷积神经网络,提取该历史图片的图片特征向量。
在本发明的较佳实施例中,上述提取该历史图片的图片特征向量和/或文字特征向量的步骤,包括:确定该历史图片中是否包括文字信息;如果是,通过word2vec模型将该历史图片中的文字信息转换为文字特征向量。
在本发明的较佳实施例中,上述根据该历史图片的特征信息,将该多张历史图片的图片标识划分到多个图片信息集合中的步骤,包括:根据该历史图片的特征信息,计算该历史图片的哈希值;将该多张历史图片的图片标识中,具有相同哈希值的历史图片的图片标识,划分到同一个图片信息集合中,得到多个图片信息集合。
在本发明的较佳实施例中,上述历史图片的特征信息包括图片特征向量,上述根据该特征信息计算该历史图片的哈希值,包括:根据该历史图片的图片特征向量,计算该历史图片的哈希值。
在本发明的较佳实施例中,上述根据该历史图片的图片特征向量,计算该历史图片的哈希值的步骤,包括:根据该历史图片的图片特征向量,通过局部敏感哈希算法计算该历史图片的哈希值。
在本发明的较佳实施例中,上述根据该多个图片信息集合,构建该多张历史图片的图片信息库的步骤,包括:对该多个图片信息集合中的每个图片标识,按下述方式存储该图片标识对应的历史图片的图片信息,得到该多张历史图片的图片信息库:以该图片信息集合的集合标识为行键,以该图片标识为列键,存储该图片标识对应的历史图片的图片信息;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识。
在本发明的较佳实施例中,上述方法还包括:将提取的该历史图片的特征信息,与该历史图片的图片标识关联保存。
在本发明的较佳实施例中,上述将提取的该历史图片的特征信息,与该历史图片的图片标识关联保存的步骤,包括:以该历史图片的图片标识为行键,以该历史图片的特征信息为列键,存储该历史图片的图片标识和特征信息。
在本发明的较佳实施例中,上述提取该待检索图片的特征信息的步骤,包括:确定该待检索图片中是否包含文字信息;如果是,输出该文字信息,以根据该文字信息生成该待检索图片的文字特征向量;提取该待检索图片的图片特征向量。
在本发明的较佳实施例中,上述确定该待检索图片中是否包含文字信息的步骤,包括:通过光学字符识别技术,确定该待检索图片中是否包含文字信息。
在本发明的较佳实施例中,上述根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合的步骤,包括:根据该待检索图片的特征信息,计算该待检索图片的哈希值;从预先构建的图片信息库中,筛选与该哈希值相同的集合标识对应的图片信息集合;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识;将筛选出的图片信息集合,确定为与该特征信息相匹配的图片信息集合。
在本发明的较佳实施例中,上述根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识的步骤,包括:根据确定出的图片信息集合中的图片标识,获取与该图片标识关联的特征信息;根据该待检索图片的特征信息,以及该图片标识关联的特征信息,计算该待检索图片与该图片标识对应的历史图片之间的相似度值;如果该相似度值满足预设第二相似度要求,将该图片标识确定为目标图片标识。
在本发明的较佳实施例中,上述根据该待检索图片的特征信息,以及该图片标识关联的特征信息,计算该待检索图片与该图片标识对应的历史图片之间的相似度值的计算公式包括:simi=w1*cos(p_feature,p_featurei)+flag*w2*cos(w_feature,w_featurei),式中,simi表示该待检索图片与历史图片i的相似度值;w1和w2为权重系数,且w1和w2的取值在0~1之间;flag为常系数,如果该待检索图片中包含文字信息,flag取值为1,否则,flag取值为0;p_feature表示该待检索图片的图片特征向量;w_feature表示该待检索图片的文字特征向量;p_featurei表示该历史图片i的图片特征向量;w_featurei表示该历史图片i的文字特征向量;cos()为余弦函数,用于计算向量间的余弦距离。
在本发明的较佳实施例中,上述方法应用于分布式存储服务器集群的主节点服务器,该主节点服务器与预设的至少一个从节点服务器通信连接,上述根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识的步骤,包括:将确定出的该图片信息集合中的图片标识分配给上述至少一个从节点,并将该待检索图片的特征信息发送给该至少一个从节点,以使该从节点根据该待检索图片的特征信息和分配到的图片标识,从分配到的该图片标识中,筛选与该待检索图片的相似度满足预设第三相似度要求的图片的图片标识;接收该从节点返回的筛选出的图片标识,以及该图片标识对应的相似度值;根据该从节点返回的相似度值,从该从节点返回的图片标识中,筛选满足预设第二相似度要求的图片标识。
在本发明的较佳实施例中,上述将该待检索图片的特征信息发送给该至少一个从节点的步骤,包括:通过广播的方式,将该待检索图片的特征信息广播至该至少一个从节点。
在本发明的较佳实施例中,上述通过筛选出的该图片标识,得到该待检索图片的检索结果的步骤,包括:通过筛选出的该图片标识获取对应的历史图片,将该历史图片输出为该待检索图片的检索结果。
第二方面,本发明实施例还提供了一种图片检索装置,包括:特征信息提取模块,用于如果接收到待检索图片,提取该待检索图片的特征信息;图片信息集合确定模块,用于根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;图片标识筛选模块,用于根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;检索结果输出模块,用于通过筛选出的该图片标识,得到该待检索图片的检索结果。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括处理器和存储器,该存储器存储有能够被该处理器执行的计算机可执行指令,该处理器执行该计算机可执行指令以实现上述图片检索方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述图片检索方法。
本发明实施例带来了以下有益效果:
本发明实施例提供的一种图片检索方法、装置及电子设备,如果接收到待检索图片,提取该待检索图片的特征信息;根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;通过筛选出的该图片标识,得到该待检索图片的检索结果。该方式中,通过预先构建图片信息库,将相似图片的图片标识划分到同一个图片信息集合中,当需要进行图片检索时,只在与待检索图片的特征信息相匹配的图片信息集合中检索,缩小了检索空间,从而实现快速检索,缩短了检索耗时,并提高了检索服务的质量。
此外,该图片检索方法通过结合待检索图片的图片特征向量和文字特征向量进行检索,缓解了二次加工图片对检索结果的干扰,进一步提高了检索结果的准确度。并且,通过分布式存储方式,缓解了图片检索中海量图片的存储压力;以及,还通过分布式计算框架,将检索任务分配给多个从节点以并行计算和检索,提高了整体的检索效率。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图片检索方法的流程示意图;
图2为本发明实施例提供的一种图片信息库的构建流程示意图;
图3为本发明实施例提供的另一种图片检索方法的流程示意图;
图4为本发明实施例提供的另一种图片检索方法的流程示意图;
图5为本发明实施例提供的一种图片检索装置的结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
图标:51-特征信息提取模块;52-图片信息集合确定模块;53-图片标识筛选模块;54-检索结果输出模块;61-处理器;62-存储器;63-总线;64-通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到传统图片检索方式在海量图片检索场景中的检索耗时较长的问题,本发明实施例提供的一种图片检索方法、装置及电子设备,该技术可以应用于各类图片检索的场景中。为便于对本实施例进行理解,首先对本发明实施例所公开的一种图片检索方法进行详细介绍。
参见图1,所示为本发明实施例提供的一种图片检索方法的流程示意图,由图1可见,该方法包括以下步骤:
步骤S102:如果接收到待检索图片,提取该待检索图片的特征信息。
通常情况下,可以通过卷积神经网络提取该待检索图片的特征信息,其中,该特征信息可以是图片的纹理、颜色、风格、轮廓等信息。在其中一种可能的实施方式中,提取得到的待检索图片的特征信息可以是图片特征向量的形式。
步骤S104:根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联。
在本实施例中,预先构建了图片信息库,其中,该图片信息库中包括多个图片信息集合,并且,每一个图片信息集合均由多张相似的图片构成。这里,如果多张图片两两之间均满足预设的第一相似度要求,则将这几张图片各自的图片标识组成一个图片信息集合。
这里,上述第一相似度要求可以是指各张图片彼此之间的相似度。例如,假设预设的第一相似度要求为,图片之间的相似度超过80%;其中,有100张图片,对应的图片标识分别为000~099,已知通过计算彼此之间的相似度发现,前50张图片彼此之间的相似度超过80%,后50张图片的相似度也超过80%,那么,可以将图片标识000~049划分为一个图片信息集合,将图片标识050~099划分为另一个图片信息集合。
依此类推,可以对于海量图片进行划分,得到多个图片信息集合,并构建得到图片信息库。在实际操作中,当构建图片信息库时,还对该库中每个图片标识对应的图片提取特征信息,并且,将各张图片的图片标识与其特征信息相关联。这样,基于图片标识可以获取对应该图片的特征信息。
此外,在提取该待检索图片的特征信息之后,基于该特征信息,从上述图片信息库中确定与该特征信息相匹配的图片信息集合,这里,相匹配的图片信息集合是指,该集合中图片标识对应的图片与待检索图片相似。在其中一种可能的实施方式中,可以为图片信息集合设置集合标识,并且,该集合标识反映该集合中图片标识对应图片的特征信息,例如,可以取图片的哈希值作为集合标识,这样,通过计算待检索图片的哈希值,并查找以同样哈希值为集合标识的图片信息集合,即可实现确定与待检索图片的特征信息相匹配的图片信息集合。
步骤S106:根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识。
基于步骤S104中确定的图片信息集合进行检索,已经从海量的图片信息中极大地缩小了检索范围。具体地,根据确定出的图片信息集合,可以获取该集合中的图片标识,并基于图片标识获取对应图片的特征信息,从而可以根据该特征信息计算其与待检索图片之间的相似度。
在实际操作中,可以预设相似度阈值,使得当任一张图片与该待检索图片的相似度值超过该相似度阈值时,确定其为目标图片。例如,预设第二相似度要求为,如果图片A与待检索图片之间的相似度超过85%,则确定该图片A为目标图片。这样,根据上述方式,即可从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识。
步骤S108:通过筛选出的该图片标识,得到该待检索图片的检索结果。
在实际操作中,可以通过筛选出的该图片标识获取对应的历史图片,并将该历史图片输出为该待检索图片的检索结果。这里,历史图片是指上述图片信息库中各个图片标识对应的图片。这样,即可将满足相似度要求的图片输出,最终得到该待检索图片的检索结果。
本发明实施例提供的一种图片检索方法,如果接收到待检索图片,提取该待检索图片的特征信息;根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;通过筛选出的该图片标识,得到该待检索图片的检索结果。该方式中,通过预先构建图片信息库,将相似图片的图片标识划分到同一个图片信息集合中,当需要进行图片检索时,只在与待检索图片的特征信息相匹配的图片信息集合中检索,缩小了检索空间,从而实现快速检索,缩短了检索耗时,并提高了检索服务的质量。
为了更加清楚理解图1所示图片检索方法,本发明实施对该方法中构建图片信息库的具体实现过程进行了重点描述。如图2所示,其为本发明实施例提供的一种图片信息库的构建流程示意图,由图2可见,该方法包括以下步骤:
步骤S202:获取多张历史图片,以及该历史图片的图片标识。
这里,每一张历史图片均对应唯一的图片标识。
步骤S204:提取该历史图片的特征信息。
在实际操作中,考虑到图片二次创作(二次加工)的流行,使得原有图片的语义会发生变化(例如,在原图上添加文字,根据原图制作表情包等),而受检索图库中的这类二次加工图片的影响,会导致图片检索结果的准确度下降。因此,在传统提取图片的纹理、颜色、风格、轮廓等信息的基础上,还提取图片中的文字信息。这里,提取该历史图片的图片特征向量和/或文字特征向量。
其中,可以通过预设的卷积神经网络,提取该历史图片的图片特征向量。并且,对于某些历史图片,其中可能会含有文字信息,此时,可以先确定历史图片中是否包括文字信息,如果确定包含文字信息,则可以通过word2vec模型,将该历史图片中的文字信息转换为文字特征向量。
步骤S206:根据该历史图片的特征信息,将该多张历史图片的图片标识划分到多个图片信息集合中;其中,该图片信息集合中的图片标识对应的历史图片,两两之间的相似度满足预设第一相似度要求。
在至少一种可能的实施方式中,可以通过下述步骤11-12实现将该多张历史图片的图片标识划分到多个图片信息集合中:
(11)根据该历史图片的特征信息,计算该历史图片的哈希值。
这里,上述哈希值均为正整数。并且,可以根据该历史图片的图片特征向量,计算该历史图片的哈希值。
在其中一种可能的实施方式中,根据该历史图片的图片特征向量,通过局部敏感哈希算法(Locality Sensitive Hashing,LSH)计算该历史图片的哈希值。其中,局部敏感哈希也称作位置敏感哈希,其主要运用高维海量数据进行快速近似查找,这里,近似查找是指比较数据点之间的距离或者是相似度。
(12)将该多张历史图片的图片标识中,具有相同哈希值的历史图片的图片标识,划分到同一个图片信息集合中,得到多个图片信息集合。
例如,图片标识为000~099的100张历史图片中,根据每张历史图片的特征信息,分别计算各张历史图片的哈希值,得到前40张图片的哈希值均为5,中间30张图片的哈希值均为6,后30张图片的哈希值均为7,则可将该100张历史图片的图片标识划分为3个图片信息集合,其中图片标识000~039为一个集合,040~069为另一个集合,070~099为又一个集合。这样,即实现将多张历史图片的图片标识划分到多个图片信息集合中。
步骤S208:根据该多个图片信息集合,构建该多张历史图片的图片信息库。
在实际操作中,可以对该多个图片信息集合中的每个图片标识,按下述方式存储该图片标识对应的历史图片的图片信息,得到该多张历史图片的图片信息库:以该图片信息集合的集合标识为行键,以该图片标识为列键,存储该图片标识对应的历史图片的图片信息;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识。
此外,还将上述提取的该历史图片的特征信息,与该历史图片的图片标识关联保存,在其中一种实施方式中,以该历史图片的图片标识为行键,以该历史图片的特征信息为列键,存储该历史图片的图片标识和特征信息。
这里,以基于大数据平台HBase构建上述图片信息库进行举例,对每张历史图片,按下述格式存储其图片信息:<bucket-key, image_id, time_stamp>,其中,bucket-key为图片信息集合的集合标识,image_id为历史图片的图片标识,time_stamp为时间戳,表示存储该历史图片信息的时间。并且,还以下述格式存储图片特征信息,实现图片标识与对应特征信息的关联存储:<image_id, p_feature, w_feature, image_content, time_stamp>;其中,image_id为该历史图片的图片标识,p_feature为该历史图片的图片特征向量,w_feature为该历史图片的文字特征向量,image_content为该历史图片的图片内容,time_stamp为时间戳,表示存储该图片特征信息的时间。这样,即实现了基于大数据平台HBase构建图片信息库。
基于上述构建的图片信息库进行图片检索,由于预先将相似图片的图片标识划分到同一个图片信息集合中,当需要进行图片检索时,只在与待检索图片的特征信息相匹配的图片信息集合中检索,缩小了检索空间,从而可以实现快速检索,缩短检索耗时。
在图1所示图片检索方法的基础上,本发明实施例还提供了另一种图片检索方法,该方法重点描述了前述实施例中,步骤S106(根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识)的具体实现过程。参见图3,所示为该方法的流程示意图,其中,该方法包括以下步骤:
步骤S302:如果接收到待检索图片,提取该待检索图片的特征信息。
在本实施例中,通过下述步骤21-23提取该待检索图片的特征信息:
(21)确定该待检索图片中是否包含文字信息。
这里,可以通过光学字符识别技术(Optical Character Recognition, OCR),确定该待检索图片中是否包含文字信息。
(22)如果是,输出该文字信息,以根据该文字信息生成该待检索图片的文字特征向量。
例如,可以通过word2vec模型,将该文字信息转换为文字特征向量。
(23)提取该待检索图片的图片特征向量。
这样,对于包含文字信息的图片,则同时提取了其图片特征向量和文字特征向量;对于不包含文字信息的图片,则提取其图片特征向量。
步骤S304:根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联。
在其中一种可能的实施方式中,可以通过下述步骤31-33从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合:
(31)根据该待检索图片的特征信息,计算该待检索图片的哈希值;
(32)从预先构建的图片信息库中,筛选与该哈希值相同的集合标识对应的图片信息集合;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识;
(33)将筛选出的图片信息集合,确定为与该特征信息相匹配的图片信息集合。
这里,由于在构建图片信息库时,将哈希值相同的图片对应的图片标识划分到同一个图片信息集合中,并且,以该哈希值为该图片信息集合的集合标识。这样,每个图片信息集合的集合标识均表示其集合中各图片标识对应图片的哈希值,如果计算得到待检索图片的哈希值,并将具有同样哈希值为集合标识的图片信息集合确定为与其相匹配,则显然,因具有相同的哈希值,待检索图片与该匹配的图片信息集合中个图片标识对应的图片是特征相似的,从而基于该图片信息集合进行检索可以大大缩小检索空间。
步骤S306:根据确定出的图片信息集合中的图片标识,获取与该图片标识关联的特征信息。
由于图片标识和其对应图片的特征信息彼此关联,因此,可以根据确定出的图片信息集合中的图片标识获取对应的特征信息。
步骤S308:根据该待检索图片的特征信息,以及该图片标识关联的特征信息,计算该待检索图片与该图片标识对应的历史图片之间的相似度值。
在其中一种可能的实施方式中,可以通过下述公式,计算待检索图片与该图片标识对应的历史图片之间的相似度值:
simi=w1*cos(p_feature,p_featurei)+flag*w2*cos(w_feature,w_featurei)
式中,simi表示该待检索图片与历史图片i的相似度值;w1和w2为权重系数,且w1和w2的取值在0~1之间;flag为常系数,如果该待检索图片中包含文字信息,flag取值为1,否则,flag取值为0;p_feature表示该待检索图片的图片特征向量;w_feature表示该待检索图片的文字特征向量;p_featurei表示该历史图片i的图片特征向量;w_featurei表示该历史图片i的文字特征向量;cos()为余弦函数,用于计算向量间的余弦距离。
步骤S310:如果该相似度值满足预设第二相似度要求,将该图片标识确定为目标图片标识。
根据前述步骤计算得到的相似度值,确定该图片标识是否为目标图片标识。
在其中一种可能的实施方式中,上述预设第二相似度要求,可以是关于相似度值的数值要求,例如,要求相似度大于90%,从而确定出目标图片标识。
在另一种可能的实施方式中,上述预设第二相似度要求,还可以是将相似度最大的K张图片对应的标识确定为目标图片标识。也即,将确定出的图片信息集合中,图片标识对应的图片与待检索图片的相似度排序中的TOP-K(前K张图片对应的图片标识)输出。例如,假设确定出的图片信息集合中有100个图片标识,则分别计算其对应图片与待检索图片之间的相似度后,进行降序排列,将前K个相似度值对应的图片标识确定为目标图片标识。其中,K可以为任意正整数。
步骤S312:通过筛选出的该图片标识,得到该待检索图片的检索结果。
这里,本实施例中的步骤S312对应前述实施例中的步骤S108,相应内容的描述可以参考前述实施例的对应部分,在此不再赘述。
本实施例提供的图片检索方法,在图1所示方法的基础上,还通过结合待检索图片的图片特征向量和文字特征向量进行检索,缓解了二次加工图片对检索结果的干扰,进一步提高了检索结果的准确度。
为了进一步提高图片检索效率,本发明实施例还提供了另一种图片检索方法,其中,该方法应用于分布式存储服务器集群的主节点服务器,并且,该主节点服务器与预设的至少一个从节点服务器通信连接。
参见图4,所示为另一种图片检索方法的流程示意图,由图4可见,该方法包括以下步骤:
步骤S402:如果接收到待检索图片,提取该待检索图片的特征信息。
步骤S404:根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联。
这里,本实施例中的步骤S402至步骤S404,对应上述实施例中的步骤S302至步骤S304,相应内容的描述可以参考前述实施例的对应部分,在此不再赘述。
步骤S406:将确定出的该图片信息集合中的图片标识分配给上述至少一个从节点,并将该待检索图片的特征信息发送给该至少一个从节点,以使该从节点根据该待检索图片的特征信息和分配到的图片标识,从分配到的该图片标识中,筛选与该待检索图片的相似度满足预设第三相似度要求的图片的图片标识。
在本实施例中,由主节点服务器确定出与待检索图片相匹配的图片信息集合,并获取到该图片信息集合中的图片标识,从而在这些图片标识中进行检索。
这里,主节点服务器将确定出的图片标识分配给上述至少一个从节点服务器,例如,可以通过负载均衡的方式,将图片标识分配到该至少一个从节点。
此外,还将该待检索图片的特征信息发送给该至少一个从节点,例如,可以通过广播的方式,将该待检索图片的特征信息广播至该至少一个从节点,这样,通过广播变量的方式,使得待检索图片的特征信息作为共享变量常驻节点,从而避免了计算过程中特征信息的多次传输,进一步提升计算效率和存储效率。
对于每一个从节点服务器,均根据该待检索图片的特征信息和分配到的图片标识,从分配到的该图片标识中,筛选与该待检索图片的相似度满足预设第三相似度要求的图片的图片标识。这里,预设第三相似度要求的设置可以参考前述实施例中第一相似度要求和第二相似度要求,在此不再赘述,需要说明的是,此处的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
步骤S408:接收该从节点返回的筛选出的图片标识,以及该图片标识对应的相似度值。
每个从节点服务器将计算和筛选的结果返回给主节点服务器,其中,包括返回筛选出的图片标识和对应的相似度值。
步骤S410:根据该从节点返回的相似度值,从该从节点返回的图片标识中,筛选满足预设第二相似度要求的图片标识。
在其中一种实施方式中,可以对所有从节点服务器返回的图片标识,依照相似度值进行降序排序,并将TOP-K输出,也即输出前K个相似度最大的值对应的图片标识,确定为目标图片标识。
步骤S412:通过筛选出的该图片标识,得到该待检索图片的检索结果。
这样,即实现了通过分布式计算框架进行图片检索。在实际操作中,该分布式计算框架可以基于Spark平台实现。并且,由于本实施例中的图片检索方法应用于分布式存储服务器集群的主节点服务器,检索库中的海量历史图片可以分布式存储于集群中的各个节点,从而可以缓解海量图片的巨大存储压力。
本实施例提供的图片检索方法,在图1所示图片检索方法的基础上,还通过分布式存储方式,缓解了图片检索中海量图片的存储压力;以及,还通过分布式计算框架,将检索任务分配给多个从节点以并行计算和检索,从而提高了整体的检索效率。
对应于图1中所示的图片检索方法,本发明实施例还提供了一种图片检索方装置,如图5所示,其为该图片检索方装置的结构示意图,由图5可见,该装置包括依次连接的:特征信息提取模块51、图片信息集合确定模块52、图片标识筛选模块53和检索结果输出模块54,其中,各个模块的功能如下:
特征信息提取模块51,用于如果接收到待检索图片,提取该待检索图片的特征信息;
图片信息集合确定模块52,用于根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;
图片标识筛选模块53,用于根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;
检索结果输出模块54,用于通过筛选出的该图片标识,得到该待检索图片的检索结果。
本发明实施例提供的一种图片检索装置,如果接收到待检索图片,提取该待检索图片的特征信息;根据该待检索图片的特征信息,从预先构建的图片信息库中确定与该特征信息相匹配的图片信息集合;其中,该图片信息库由多个图片信息集合构成,该图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;该图片标识与对应图片的特征信息相关联;根据该待检索图片的特征信息,从确定出的图片信息集合中,筛选与该待检索图片的相似度满足预设第二相似度要求的图片的图片标识;通过筛选出的该图片标识,得到该待检索图片的检索结果。该装置中,通过预先构建图片信息库,将相似图片的图片标识划分到同一个图片信息集合中,当需要进行图片检索时,只在与待检索图片的特征信息相匹配的图片信息集合中检索,缩小了检索空间,从而实现快速检索,缩短了检索耗时,并提高了检索服务的质量。
在其中一种可能的实施方式中,上述图片信息库通过下述方式构建:获取多张历史图片,以及该历史图片的图片标识;提取该历史图片的特征信息;根据该历史图片的特征信息,将该多张历史图片的图片标识划分到多个图片信息集合中;其中,该图片信息集合中的图片标识对应的历史图片,两两之间的相似度满足预设第一相似度要求;根据该多个图片信息集合,构建该多张历史图片的图片信息库。
在另一种可能的实施方式中,上述特征信息提取模块51还用于:提取该历史图片的图片特征向量和/或文字特征向量。
在另一种可能的实施方式中,上述特征信息提取模块51还用于:通过预设的卷积神经网络,提取该历史图片的图片特征向量;
在另一种可能的实施方式中,上述特征信息提取模块51还用于:确定该历史图片中是否包括文字信息,如果是,通过word2vec模型将该历史图片中的文字信息转换为文字特征向量。
在另一种可能的实施方式中,上述图片信息集合确定模块52还用于:根据该历史图片的特征信息,计算该历史图片的哈希值;将该多张历史图片的图片标识中,具有相同哈希值的历史图片的图片标识,划分到同一个图片信息集合中,得到多个图片信息集合。
在另一种可能的实施方式中,上述历史图片的特征信息包括图片特征向量,上述图片信息集合确定模块52还用于:根据该历史图片的图片特征向量,计算该历史图片的哈希值。
在另一种可能的实施方式中,上述图片信息集合确定模块52还用于:根据该历史图片的图片特征向量,通过局部敏感哈希算法计算该历史图片的哈希值。
在另一种可能的实施方式中,上述根据该多个图片信息集合,构建该多张历史图片的图片信息库的步骤,包括:对该多个图片信息集合中的每个图片标识,按下述方式存储该图片标识对应的历史图片的图片信息,得到该多张历史图片的图片信息库:以该图片信息集合的集合标识为行键,以该图片标识为列键,存储该图片标识对应的历史图片的图片信息;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识。
在另一种可能的实施方式中,上述装置还包括关联保存模块,用于将提取的该历史图片的特征信息,与该历史图片的图片标识关联保存。
在另一种可能的实施方式中,上述关联保存模块还用于:以该历史图片的图片标识为行键,以该历史图片的特征信息为列键,存储该历史图片的图片标识和特征信息。
在另一种可能的实施方式中,上述特征信息提取模块51还用于:确定该待检索图片中是否包含文字信息;如果是,输出该文字信息,以根据该文字信息生成该待检索图片的文字特征向量;提取该待检索图片的图片特征向量。
在另一种可能的实施方式中,上述特征信息提取模块51还用于:通过光学字符识别技术,确定该待检索图片中是否包含文字信息。
在另一种可能的实施方式中,上述图片信息集合确定模块52还用于:根据该待检索图片的特征信息,计算该待检索图片的哈希值;从预先构建的图片信息库中,筛选与该哈希值相同的集合标识对应的图片信息集合;其中,该图片信息集合中的图片标识对应的图片具有相同的哈希值,且该图片信息集合以该哈希值为集合标识;将筛选出的图片信息集合,确定为与该特征信息相匹配的图片信息集合。
在另一种可能的实施方式中,上述图片标识筛选模块53还用于:根据确定出的图片信息集合中的图片标识,获取与该图片标识关联的特征信息;根据该待检索图片的特征信息,以及该图片标识关联的特征信息,计算该待检索图片与该图片标识对应的历史图片之间的相似度值;如果该相似度值满足预设第二相似度要求,将该图片标识确定为目标图片标识。
在另一种可能的实施方式中,上述根据该待检索图片的特征信息,以及该图片标识关联的特征信息,计算该待检索图片与该图片标识对应的历史图片之间的相似度值的计算公式包括:simi=w1*cos(p_feature,p_featurei)+flag*w2*cos(w_feature,w_featurei),式中,simi表示该待检索图片与历史图片i的相似度值;w1和w2为权重系数,且w1和w2的取值在0~1之间;flag为常系数,如果该待检索图片中包含文字信息,flag取值为1,否则,flag取值为0;p_feature表示该待检索图片的图片特征向量;w_feature表示该待检索图片的文字特征向量;p_featurei表示该历史图片i的图片特征向量;w_featurei表示该历史图片i的文字特征向量;cos()为余弦函数,用于计算向量间的余弦距离。
在另一种可能的实施方式中,上述方法应用于分布式存储服务器集群的主节点服务器,该主节点服务器与预设的至少一个从节点服务器通信连接,上述图片标识筛选模块53还用于:将确定出的该图片信息集合中的图片标识分配给上述至少一个从节点,并将该待检索图片的特征信息发送给该至少一个从节点,以使该从节点根据该待检索图片的特征信息和分配到的图片标识,从分配到的该图片标识中,筛选与该待检索图片的相似度满足预设第三相似度要求的图片的图片标识;接收该从节点返回的筛选出的图片标识,以及该图片标识对应的相似度值;根据该从节点返回的相似度值,从该从节点返回的图片标识中,筛选满足预设第二相似度要求的图片标识。
在另一种可能的实施方式中,上述图片标识筛选模块53还用于:通过广播的方式,将该待检索图片的特征信息广播至该至少一个从节点。
在另一种可能的实施方式中,上述检索结果输出模块54还用于:通过筛选出的该图片标识获取对应的历史图片,将该历史图片输出为该待检索图片的检索结果。
本发明实施例提供的图片检索装置,其实现原理及产生的技术效果和前述图片检索方法实施例相同,为简要描述,图片检索装置的实施例部分未提及之处,可参考前述图片检索方法实施例中相应内容。
本发明实施例还提供了一种电子设备,如图6所示,为该电子设备的结构示意图,其中,该电子设备包括处理器61和存储器62,该存储器62存储有能够被该处理器61执行的机器可执行指令,该处理器61执行该机器可执行指令以实现上述图片检索方法。
在图6示出的实施方式中,该电子设备还包括总线63和通信接口64,其中,处理器61、通信接口64和存储器62通过总线连接。
其中,存储器62可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口64(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器61可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器61中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器61可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器61读取存储器62中的信息,结合其硬件完成前述实施例的图片检索方法的步骤。
本发明实施例还提供了一种机器可读存储介质,该机器可读存储介质存储有机器可执行指令,该机器可执行指令在被处理器调用和执行时,该机器可执行指令促使处理器实现上述图片检索方法,具体实现可参见前述方法实施例,在此不再赘述。
本发明实施例所提供的图片检索方法、图片检索装置和电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的图片检索方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (19)

1.一种图片检索方法,其特征在于,所述方法应用于分布式存储服务器集群的主节点服务器,所述主节点服务器与预设的至少一个从节点服务器通信连接,所述主节点服务器和所述至少一个从节点服务器基于Spark平台构建分布式计算框架,所述方法包括:
如果接收到待检索图片,提取所述待检索图片的特征信息;其中,所述提取所述待检索图片的特征信息的步骤,包括:确定所述待检索图片中是否包含文字信息;如果是,输出所述文字信息,以根据所述文字信息生成所述待检索图片的文字特征向量,并提取所述待检索图片的图片特征向量;
根据所述待检索图片的特征信息,计算所述待检索图片的哈希值;
从预先构建的图片信息库中,筛选与所述哈希值相同的集合标识对应的图片信息集合;其中,所述图片信息集合中的图片标识对应的图片具有相同的哈希值,且所述图片信息集合以该哈希值为集合标识;并且,所述图片信息库由多个图片信息集合构成,所述图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;所述图片标识与对应图片的特征信息相关联;所述图片信息库基于大数据平台HBase构建,按下述格式存储所述图片信息库中的每张历史图片的图片信息:<bucket-key,image_id,time_stamp>,其中,bucket-key为图片信息集合的集合标识,image_id为该历史图片的图片标识,time_stamp为该历史图片的时间戳;
将筛选出的图片信息集合,确定为与所述特征信息相匹配的图片信息集合;
将确定出的所述图片信息集合中的图片标识分配给所述至少一个从节点,并将所述待检索图片的特征信息发送给所述至少一个从节点,以使所述从节点根据所述待检索图片的特征信息和分配到的图片标识,从分配到的所述图片标识中,筛选与所述待检索图片的相似度满足预设第三相似度要求的图片的图片标识;
接收所述从节点返回的筛选出的图片标识,以及所述图片标识对应的相似度值;
根据所述从节点返回的相似度值,从所述从节点返回的图片标识中,筛选满足预设第二相似度要求的图片标识;
通过筛选出的所述图片标识,得到所述待检索图片的检索结果。
2.根据权利要求1所述的图片检索方法,其特征在于,所述图片信息库通过下述方式构建:
获取多张历史图片,以及所述历史图片的图片标识;
提取所述历史图片的特征信息;
根据所述历史图片的特征信息,将所述多张历史图片的图片标识划分到多个图片信息集合中;其中,所述图片信息集合中的图片标识对应的历史图片,两两之间的相似度满足预设第一相似度要求;
根据所述多个图片信息集合,构建所述多张历史图片的图片信息库。
3.根据权利要求2所述的图片检索方法,其特征在于,所述提取所述历史图片的特征信息的步骤,包括:
提取所述历史图片的图片特征向量和/或文字特征向量。
4.根据权利要求3所述的图片检索方法,其特征在于,所述提取所述历史图片的图片特征向量和/或文字特征向量的步骤,包括:
通过预设的卷积神经网络,提取所述历史图片的图片特征向量。
5.根据权利要求3所述的图片检索方法,其特征在于,所述提取所述历史图片的图片特征向量和/或文字特征向量的步骤,包括:
确定所述历史图片中是否包括文字信息;
如果是,通过word2vec模型将所述历史图片中的文字信息转换为文字特征向量。
6.根据权利要求2所述的图片检索方法,其特征在于,所述根据所述历史图片的特征信息,将所述多张历史图片的图片标识划分到多个图片信息集合中的步骤,包括:
根据所述历史图片的特征信息,计算所述历史图片的哈希值;
将所述多张历史图片的图片标识中,具有相同哈希值的历史图片的图片标识,划分到同一个图片信息集合中,得到多个图片信息集合。
7.根据权利要求6所述的图片检索方法,其特征在于,所述历史图片的特征信息包括图片特征向量,所述根据所述特征信息计算所述历史图片的哈希值,包括:
根据所述历史图片的图片特征向量,计算所述历史图片的哈希值。
8.根据权利要求7所述的图片检索方法,其特征在于,所述根据所述历史图片的图片特征向量,计算所述历史图片的哈希值的步骤,包括:
根据所述历史图片的图片特征向量,通过局部敏感哈希算法计算所述历史图片的哈希值。
9.根据权利要求2所述的图片检索方法,其特征在于,所述根据所述多个图片信息集合,构建所述多张历史图片的图片信息库的步骤,包括:
对所述多个图片信息集合中的每个图片标识,按下述方式存储该图片标识对应的历史图片的图片信息,得到所述多张历史图片的图片信息库:
以所述图片信息集合的集合标识为行键,以该图片标识为列键,存储该图片标识对应的历史图片的图片信息;其中,所述图片信息集合中的图片标识对应的图片具有相同的哈希值,且所述图片信息集合以该哈希值为集合标识。
10.根据权利要求2所述的图片检索方法,其特征在于,所述方法还包括:
将提取的所述历史图片的特征信息,与所述历史图片的图片标识关联保存。
11.根据权利要求10所述的图片检索方法,其特征在于,所述将提取的所述历史图片的特征信息,与所述历史图片的图片标识关联保存的步骤,包括:
以所述历史图片的图片标识为行键,以所述历史图片的特征信息为列键,存储所述历史图片的图片标识和特征信息。
12.根据权利要求1所述的图片检索方法,其特征在于,所述确定所述待检索图片中是否包含文字信息的步骤,包括:
通过光学字符识别技术,确定所述待检索图片中是否包含文字信息。
13.根据权利要求1所述的图片检索方法,其特征在于,所述根据所述待检索图片的特征信息,从确定出的图片信息集合中,筛选与所述待检索图片的相似度满足预设第二相似度要求的图片的图片标识的步骤,包括:
根据确定出的图片信息集合中的图片标识,获取与该图片标识关联的特征信息;
根据所述待检索图片的特征信息,以及该图片标识关联的特征信息,计算所述待检索图片与该图片标识对应的历史图片之间的相似度值;
如果所述相似度值满足预设第二相似度要求,将该图片标识确定为目标图片标识。
14.根据权利要求13所述的图片检索方法,其特征在于,所述根据所述待检索图片的特征信息,以及该图片标识关联的特征信息,计算所述待检索图片与该图片标识对应的历史图片之间的相似度值的计算公式包括:
simi=w1*cos(p_feature,p_featurei)+flag*w2*cos(w_feature,w_featurei)
式中,simi表示所述待检索图片与历史图片i的相似度值;w1和w2为权重系数,且w1和w2的取值在0~1之间;flag为常系数,如果所述待检索图片中包含文字信息,flag取值为1,否则,flag取值为0;p_feature表示所述待检索图片的图片特征向量;w_feature表示所述待检索图片的文字特征向量;p_featurei表示所述历史图片i的图片特征向量;w_featurei表示所述历史图片i的文字特征向量;cos()为余弦函数,用于计算向量间的余弦距离。
15.根据权利要求1所述的图片检索方法,其特征在于,所述将所述待检索图片的特征信息发送给所述至少一个从节点的步骤,包括:
通过广播的方式,将所述待检索图片的特征信息广播至所述至少一个从节点。
16.根据权利要求1所述的图片检索方法,其特征在于,所述通过筛选出的所述图片标识,得到所述待检索图片的检索结果的步骤,包括:
通过筛选出的所述图片标识获取对应的历史图片,将所述历史图片输出为所述待检索图片的检索结果。
17.一种图片检索装置,其特征在于,所述装置应用于分布式存储服务器集群的主节点服务器,所述主节点服务器与预设的至少一个从节点服务器通信连接,所述主节点服务器和所述至少一个从节点服务器基于Spark平台构建分布式计算框架,所述装置包括:
特征信息提取模块,用于如果接收到待检索图片,提取所述待检索图片的特征信息;其中,所述提取所述待检索图片的特征信息的步骤,包括:确定所述待检索图片中是否包含文字信息;如果是,输出所述文字信息,以根据所述文字信息生成所述待检索图片的文字特征向量,并提取所述待检索图片的图片特征向量;
图片信息集合确定模块,用于根据所述待检索图片的特征信息,计算所述待检索图片的哈希值;从预先构建的图片信息库中,筛选与所述哈希值相同的集合标识对应的图片信息集合;其中,所述图片信息集合中的图片标识对应的图片具有相同的哈希值,且所述图片信息集合以该哈希值为集合标识;并且,所述图片信息库由多个图片信息集合构成,所述图片信息集合中包括满足预设第一相似度要求的多张图片的图片标识;所述图片标识与对应图片的特征信息相关联;所述图片信息库基于大数据平台HBase构建,按下述格式存储所述图片信息库中的每张历史图片的图片信息:<bucket-key,image_id,time_stamp>,其中,bucket-key为图片信息集合的集合标识,image_id为该历史图片的图片标识,time_stamp为该历史图片的时间戳;将筛选出的图片信息集合,确定为与所述特征信息相匹配的图片信息集合;
图片标识筛选模块,用于将确定出的所述图片信息集合中的图片标识分配给所述至少一个从节点,并将所述待检索图片的特征信息发送给所述至少一个从节点,以使所述从节点根据所述待检索图片的特征信息和分配到的图片标识,从分配到的所述图片标识中,筛选与所述待检索图片的相似度满足预设第三相似度要求的图片的图片标识;接收所述从节点返回的筛选出的图片标识,以及所述图片标识对应的相似度值;根据所述从节点返回的相似度值,从所述从节点返回的图片标识中,筛选满足预设第二相似度要求的图片标识;
检索结果输出模块,用于通过筛选出的所述图片标识,得到所述待检索图片的检索结果。
18.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至16任一项所述的图片检索方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至16任一项所述的图片检索方法。
CN202010540395.XA 2020-06-15 2020-06-15 图片检索方法、装置及电子设备 Active CN111506750B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010540395.XA CN111506750B (zh) 2020-06-15 2020-06-15 图片检索方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010540395.XA CN111506750B (zh) 2020-06-15 2020-06-15 图片检索方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111506750A CN111506750A (zh) 2020-08-07
CN111506750B true CN111506750B (zh) 2021-03-16

Family

ID=71864565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010540395.XA Active CN111506750B (zh) 2020-06-15 2020-06-15 图片检索方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111506750B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836759B (zh) * 2021-02-09 2023-05-30 重庆紫光华山智安科技有限公司 一种机选图片评价方法、装置、存储介质及电子设备
CN112836688B (zh) * 2021-03-26 2023-09-26 广东电网有限责任公司江门供电局 瓦片图像的特征提取方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036009A (zh) * 2014-06-24 2014-09-10 北京奇虎科技有限公司 一种搜索匹配图片的方法、图片搜索方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914463B (zh) * 2012-12-31 2017-09-26 北京新媒传信科技有限公司 一种图片信息的相似性检索方法和装置
CN104933154B (zh) * 2015-06-25 2017-12-29 北京邮电大学 一种基于分布式网络实现图像按内容快速检索的方法
CN109426831B (zh) * 2017-08-30 2022-12-13 腾讯科技(深圳)有限公司 图片相似匹配及模型训练的方法、装置及计算机设备
CN108121806A (zh) * 2017-12-26 2018-06-05 湖北工业大学 一种基于局部特征匹配的图像搜索方法及系统
WO2020014770A1 (en) * 2018-07-17 2020-01-23 Avigilon Corporation Hash-based appearance search

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036009A (zh) * 2014-06-24 2014-09-10 北京奇虎科技有限公司 一种搜索匹配图片的方法、图片搜索方法及装置

Also Published As

Publication number Publication date
CN111506750A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
US9053386B2 (en) Method and apparatus of identifying similar images
CN111460311A (zh) 基于字典树的搜索处理方法、装置、设备和存储介质
US20090083275A1 (en) Method, Apparatus and Computer Program Product for Performing a Visual Search Using Grid-Based Feature Organization
CN111506750B (zh) 图片检索方法、装置及电子设备
JP4457988B2 (ja) 画像管理装置、画像管理方法およびコンピュータプログラム
CN103797509A (zh) 图像检索装置、图像检索方法、程序和计算机可读取的存储介质
CN108491715B (zh) 终端指纹库的生成方法、装置和服务器
EP2804115A1 (en) Index scanning apparatus and index scanning method
CN110825894A (zh) 数据索引建立、数据检索方法、装置、设备和存储介质
CN104221015A (zh) 图像检索装置、图像检索方法、程序以及计算机可读取的存储介质
CN112016623A (zh) 一种人脸聚类方法、装置、设备及存储介质
CN111221982B (zh) 信息处理方法、装置、计算机可读存储介质和计算机设备
CN111309946B (zh) 一种已建立档案优化方法及装置
CN113157962B (zh) 图像检索方法、电子装置和存储介质
CN113255610B (zh) 特征底库构建、特征检索方法以及相关装置
CN110209853B (zh) 车辆的图片搜索方法、装置和设备
CN110149234B (zh) 图数据压缩方法、装置、服务器及存储介质
US20170103285A1 (en) Method and device for detecting copies in a stream of visual data
CN113553980A (zh) 一种图片的商标图形要素编码生成方法、系统及装置
JP5923744B2 (ja) 画像検索システム、画像検索方法及び検索装置
CN111241103B (zh) 数据存储方法、数据查询方法及相关装置
US20180293461A1 (en) Method and device for detecting copies in a stream of visual data
CN114186100B (zh) 数据存储及查询方法、装置及数据库系统
JP6300982B2 (ja) 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム
CN114722302A (zh) 图片处理方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221222

Address after: No.006, 6th floor, building 4, No.33 yard, middle Xierqi Road, Haidian District, Beijing 100085

Patentee after: BEIJING KINGSOFT CLOUD NETWORK TECHNOLOGY Co.,Ltd.

Patentee after: Kingsoft Cloud (Shenzhen) Edge Computing Technology Co.,Ltd.

Address before: Room 3f02, 33 Xiaoying West Road, Haidian District, Beijing

Patentee before: BEIJING KINGSOFT CLOUD NETWORK TECHNOLOGY Co.,Ltd.