CN110458224A - 图像处理方法、装置、电子设备及计算机可读介质 - Google Patents

图像处理方法、装置、电子设备及计算机可读介质 Download PDF

Info

Publication number
CN110458224A
CN110458224A CN201910723195.5A CN201910723195A CN110458224A CN 110458224 A CN110458224 A CN 110458224A CN 201910723195 A CN201910723195 A CN 201910723195A CN 110458224 A CN110458224 A CN 110458224A
Authority
CN
China
Prior art keywords
image
processed
word
similarity
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910723195.5A
Other languages
English (en)
Inventor
陈扬羽
何轶
李磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910723195.5A priority Critical patent/CN110458224A/zh
Publication of CN110458224A publication Critical patent/CN110458224A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例提供了一种图像处理方法、装置、电子设备及计算机可读介质。该方法包括:提取待处理图像对应的至少一个视觉单词;基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像;计算待处理图像与至少一个相似图像分别对应的相似度,并依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。本公开实施例不仅减少了后续需要进行相似性计算的图像的数量,还缩短了相似图像的查询时间;同时,由于需要进行相似性计算的图像的数量的减少,因而提高了待处理图像与相似图像的相似度的计算速度,进而提高了依据相似度执行相应操作的效率。

Description

图像处理方法、装置、电子设备及计算机可读介质
技术领域
本公开涉及图像识别及处理技术领域,具体而言,本公开涉及一种图像处理方法、装置、电子设备及计算机可读介质。
背景技术
随着计算机技术的发展,图像识别技术被应用到多种领域,如图像检索、图像去重等领域。不论将图像识别技术应用在哪种领域,均需要对不同图像间的相似性进行判断,再依据相似性的判断结果执行与图像检索、图像去重等领域的相应操作。
现有技术中,主要是通过提取不同的待处理图像对应图像特征,并依据提取到的图像特征判断不同图像间的相似性。因此,需要进行相似性判断的图像的数量越多,图像间相似性判断的效率越低,后续依据相似性的判断结果进行处理的效率越低。
发明内容
本公开提供了一种图像处理方法、装置、电子设备及计算机可读介质,可以解决上述技术问题。所述技术方案如下:
第一方面,提供了一种图像处理方法,该方法包括:
提取待处理图像对应的至少一个视觉单词;
基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系;
确定待处理图像与至少一个相似图像分别对应的相似度;
依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
进一步地,提取待处理图像对应的至少一个视觉单词,包括:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
进一步地,确定待处理图像与至少一个相似图像分别对应的相似度,包括:
依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的至少一个视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
进一步地,确定待处理图像与至少一个相似图像分别对应的相似度,包括:
获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
进一步地,基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像之前,该方法还包括:
基于单词图片关系库中多个图像分别对应的至少一个视觉单词,确定单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
进一步地,若待处理图像是来自图像存储请求的待存储图片,依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作,包括:
若相似度大于第一预设相似度阈值,则对待处理图像及相似图像中至少一个进行去重处理;
若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
进一步地,若待处理图像是来自图片搜索请求的待搜索图片,依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作,包括:
将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
第二方面,提供了一种图像处理装置,该装置包括:
单词提取模块,用于提取待处理图像对应的至少一个视觉单词;
图像匹配模块,用于基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词分别与多个图像的倒排索引关系;
相似度确定模块,用于确定待处理图像与至少一个相似图像分别对应的相似度;
图像处理模块,用于依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
进一步地,单词提取模块用于:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
进一步地,图像处理模块用于:
依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的至少一个视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
进一步地,图像处理模块用于:
获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
进一步地,基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一个相似图像之前,图像匹配模块还用于:
基于单词图片库中多个图像分别对应的至少一个视觉单词,确定单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
进一步地,若待处理图像是来自图像存储请求的待存储图片,图像处理模块用于:
若相似度大于第一预设相似度阈值,则对待处理图像及相似图像中至少一个进行去重处理;
若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
进一步地,若待处理图像是来自图片搜索请求的待搜索图片,图像处理模块还用于:
将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行上述图像处理方法。
第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现上述图像处理方法。
本公开实施例提供的技术方案带来的有益效果是:通过提取待处理图像对应的至少一个视觉单词,以基于待处理图像对应的至少一个视觉单词,在预构建的单词图片关系库中查询包括有任一待处理图像对应的至少一个视觉单词的至少一张相似图像,这种以视觉单词在单词图片关系库中进行查询的方式,不仅减少了后续需要进行相似性计算的图像的数量,还缩短了确定需要进行相似性计算的图像的查询时间;同时,由于需要进行相似性计算的图像的数量的减少,因而提高了待处理图像与至少一个相似图像分别对应的相似度的计算速度,进而提高了以便依据相似度,确定对待处理图像与相似图像中至少一个所执行的操作的效率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种图像处理方法的流程示意图;
图2为本公开实施例提供的种图像处理方法中多个视觉单词与多个图像的对应关系一个实施例的示意图;
图3为本公开实施例提供的一种图像处理方法中对单词图片关系库中多个图像进行视觉单词进行提取的结果示意图;
图4为本公开实施例提供的一种图像处理装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供了一种图像处理方法,如图1所示,该方法包括:步骤S101至步骤S104。
步骤S101、提取待处理图像对应的至少一个视觉单词。
本公开实施例中,视觉单词用于表征待处理图像的图像特征。具体地,可以预先设定提取的视觉单词的数量,例如,可以提取待处理图像的10个视觉单词。
步骤S102、基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有任一待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系。
本公开实施例中,倒排索引是以视觉单词为属性值建立的与单词图片关系库中多个视觉单词与多个图像的对应关系。
具体地,多个视觉单词与多个图像的倒排索引关系可以如图2所示,将待处理图像的任一视觉单词在图2所示的多个视觉单词与多个图像的倒排索引关系中进行查询,能够快速查询到包括有待处理图像的任一视觉单词至少一张相似图像。
步骤S103、确定待处理图像与至少一个相似图像分别对应的相似度。
步骤S104、依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
本公开实施例,通过提取待处理图像对应的至少一个视觉单词,以基于待处理图像对应的至少一个视觉单词,在预构建的单词图片关系库中查询包括有任一待处理图像对应的至少一个视觉单词的至少一张相似图像,这种以视觉单词在单词图片关系库中进行查询的方式,不仅减少了后续需要进行相似性计算的图像的数量,还缩短了确定需要进行相似性计算的图像的查询时间;同时,由于需要进行相似性计算的图像的数量的减少,因而提高了待处理图像与至少一个相似图像分别对应的相似度的计算速度,进而提高了以便依据相似度,确定对待处理图像与相似图像中至少一个所执行的操作的效率。
在一个实现方式中,如图1所示,步骤S101提取待处理图像对应的至少一个视觉单词,包括:
步骤S1011(图中未示出)、提取待处理图像的图像特征,并依据提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
具体应用时,可以利用图像特征提取算法(如SIFT模型)提取待处理图像的图像特征,得到待处理图像的特征集合,并对该集合中的特征进行聚类处理,例如,通过K-Means算法对通过SIFT模型提取的N个SIFT特征进行聚类,实现依据提取到的图像特征构造至少一个视觉单词的目的。具体地,K-Means算法是一种基于样本间相似性度量的间接聚类方法,该算法以K为参数,把N个对象(即N个SIFT特征)分为K个簇,以使簇内具有较高的相似度,而簇间相似度较低,因此提取到的多个视觉单词均不同。
在另一个实现方式中,如图1所示,步骤S103中确定待处理图像与至少一个相似图像分别对应的相似度,包括:
步骤S1031(图中未示出)、依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
具体应用时,可以参照步骤S1011的方式预先对单词图片关系库中多个图像进行视觉单词的提取。具体地,可以对单词图片关系库中每个图像都提取预定数量的视觉单词,例如,对单词图片关系库中每个图像都提取10个视觉单词。假设,提取到的待处理图像的视觉单词为:A1、A3和A5,分别通过A1、A3、A5在单词图片关系库中进行查询,若图像a的10个视觉单词中包括A1,图像b的10个视觉单词中包括A1和A3,图像c的10个视觉单词中同时包括A1、A3和A5,那么确定图像a、图片b和图片c均为相似图像,那么待处理图像与图像a的相似度为0.1,待处理图像与图像b的相似度为0.2,待处理图像与图像c的相似度为0.3。
具体应用时,至少一个相似图像分别对应的视觉单词可以是预先存储的,也可以在需要计算待处理图像与至少一个相似图像分别对应的相似度时进行提取。
本公开实施例中,为了提高图像查询的效率,一般会预先存储单词图片关系库中所有图像分别对应的视觉单词,在按照步骤S102选定出至少一张相似图像后,只需获取预存储的这几个相似图像分别对应的视觉单词即可,无需执行更多步骤,进而缩短待处理图像与至少一个相似图像分别对应的相似度的计算时间,提高相似度计算的效率。
在又一个实现方式中,如图1所示,步骤S103中确定待处理图像与至少一个相似图像分别对应的相似度,包括:
步骤S1032(图中未示出)、获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
步骤S1033(图中未示出)、依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
具体应用时,至少一个相似图像的图像特征既可以是预先存储的,也可以在需要计算相似度时提取。
本公开实施例中,待处理图像的图像特征可以在提取视觉单词过程中进行存储,如将步骤S1011提取到的待处理图像的图像特征进行存储,以待获取;或者待处理图像的图像特征还可以在确定至少一张相似图像后再进行提取。本公开实施例通过图像特征计算待处理图像与至少一个相似图像分别对应的相似度,最大限度的保留了不同图像的特征,从而能够提高图像识别的精度。
在又一个实现方式中,如图1所示,步骤S102将待处理图像对应的至少一个视觉单词在预建立的单词图片关系库中进行查询之前,该方法还包括:
步骤S1021(图中未示出)基于多个图像分别对应的至少一个视觉单词,确定所述单词图片关系库中包括多个图像以及多个视觉单词分别与多个图像的倒排索引关系。
例如,假设多个图片分别对应的至少一个视觉单词如图3所示,具体地,图3中至少一个图片分别对应的至少一个视觉单词均可以按照步骤S101进行提取,若该实施例中对单词图像关系库中对每个图像提取了5个视觉单词。依据步骤S1021对图3进行处理,生成如图2所示的多个视觉单词与多个图像的倒排索引关系,这种倒排索引关系以视觉单词为查询条件,起到了优化查询的速度,缩短查找到相似图像的时间的作用。
例如,若待处理图像对应的视觉单词包括单词A1和单词A3,分别以单词A1、单词A3在如图2所示的倒排索引关系中进行查询,确定包括A1的图像为图片1、图片2和图片4,包括A3的图像为图片1、图片3和图片4,因此,确定相似图像为图片1、图片2、图片3和图片4。
具体应用时候,单词图片关系库中所有图像也可以参照步骤S101、步骤S102和步骤S103进行处理,最终实现对单词图片关系库中多个图像的去重处理,解决了现有图像数据库因存储多张相似图像导致的内存资源浪费问题,提高了内存资源的利用率。
在又一个实现方式中,若待处理图像是来自图像存储请求的待存储图片,如图1所示,步骤S104依据相似度执行相应请求,包括:
步骤S1041(图中未示出)、若相似度大于第一预设相似度阈值,则对待处理图像以及相似图像中至少一个进行去重处理;
步骤S1042(图中未示出)、若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
具体应用时,一般通过图像存储请求将待存储图片存储至预定的图像存储区域,例如将图片存储至数据库A,服务器接收到图像存储请求后,确定图像存储请求对应的待处理图像。
例如,若单词图像关系库中多个图像为XX电视剧的图像,而待处理图像为对该电视剧中图像帧M进行调整后得到的图像,通过执行步骤S101和步骤S102,将XX电视机中的图像帧M作为相似图像,通过计算,若该待处理图像与图像帧M的相似度大于预设相似度阈值,那么对该待处理图像及图像帧M进行去重处理;若该待处理图像与图像帧M的相似度不大于预设相似度阈值,直接将该待处理图像存储。本公开实施例通过去重处理解决了现有技术中因存储多张相似图像导致的存储资源浪费问题。
在又一个实现方式中,若待处理图像是来自图片搜索请求的待搜索图片,如图1所示,步骤S104中依据相似度执行相应处理,包括:
步骤S1043(图中未示出)、将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
具体应用时,可以将该实施例应用在具有图像检索功能的网站(如购物网站),具体可以通过预设接口获取用户上传的图像,再依据用户上传的图像进行检索。
为了进一步说明本公开提供的图像处理方法,下面以对图像X为例进行说明。
提取图像X的3个视觉单词,假设这3个视觉单词分别为float1、float2和float3,若单词图片关系库中存储有5张摄影图像,以及这5摄影图像分别对应的5个视觉单词,其中,摄影图像001的视觉单词为{float1,float2,float30,float4,float5},摄影图像002的视觉单词为{float2,float4,float5,float6,float7},摄影图像003的视觉单词为{float1,float3,float5,float6,float18},摄影图像004的视觉单词为{float6,float7,float8,float9,float10},摄影图像005的视觉单词为{float0,float5,float9,float10,float17},将图像X的float1在单词图片关系库中进行查询,查询到包括有视觉单词float1的图像为摄影图像001和摄影图像003,以此类推,包括有视觉单词float2的图像为摄影图像001和摄影图像002,包括有视觉单词float3的图像有摄影图像003,因此,将摄影图像001、摄影图像002和摄影图像003作为图像X的相似图像,并计算图像X分别与摄影图像001、摄影图像002和摄影图像003的相似度,依据相似度执行相应处理。
应用时,若本公开提供的图像处理方法应用在图像检索领域,若经过计算图像X分别与摄影图像001、摄影图像002和摄影图像003的相似度均大于第一预设相似度阈值,那么将摄影图像001、摄影图像002和摄影图像003均作为检索结果进行输出。
应用时,若将本公开提供的图像处理方法应用在对版权图像进行保护的场景,图像X为用户上传至具有对版权图像进行保护的网站的图像,若经过计算图像X与该网站中具有版权的摄影图像001的相似度均大于预设在该网站的相似度阈值,那么确定图像X存在侵权风险,具体应用时,该网站可以对图像X进行拦截处理;或者还可以对生成图像X存在侵权风险的提示信息。最终减少了图像侵权案件的数量,起到对版权作品进行保护的目的。
应用时,若对特定的图像数据库进行去重处理,则可以按照实施例一的步骤S101对该特定的图像数据库中任两个图像分别对应的视觉单词,计算任两个图像的相似度,依据相似度确定是否对该特定的图像数据库中的图像执行去重处理操作。
本公开实施例提供了一种图像处理装置,如图4所示,该图像处理装置30可以包括:单词提取模块301、图像匹配模块302、相似度确定模块303以及图像处理模块304,其中,
单词提取模块301,用于提取待处理图像对应的至少一个视觉单词;
图像匹配模块302,用于基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系;
相似度确定模块303,用于确定待处理图像与至少一个相似图像分别对应的相似度;
图像处理模块304,用于依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
本公开实施例,通过提取待处理图像对应的至少一个视觉单词,以基于待处理图像对应的至少一个视觉单词,在预构建的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,这种以视觉单词在单词图片关系库中进行查询的方式,不仅减少了后续需要进行相似性计算的图像的数量,还缩短了确定需要进行相似性计算的图像的查询时间;同时,由于需要进行相似性计算的图像的数量的减少,因而提高了待处理图像与至少一个相似图像分别对应的相似度的计算速度,进而提高依据相似度,确定对待处理图像和相似图像中至少一个锁执行的操作的作的效率。
进一步地,单词提取模块用于:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
进一步地,图像处理模块,用于:
依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的至少一个视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
进一步地,图像处理模块用于:
获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
进一步地,基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一个相似图像之前,图像匹配模块还用于:
基于单词图片库中多个图像分别对应的至少一个视觉单词,确定单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
进一步地,若待处理图像是来自图像存储请求的待存储图片,图像处理模块用于:
若相似度大于第一预设相似度阈值,则对待处理图像及相似图像中至少一个进行去重处理;
若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
进一步地,若待处理图像是来自图片搜索请求的待搜索图片,图像处理模块还用于:
将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
本实施例的图像处理装置可执行本公开实施例一提供的图像处理方法,其实现原理相类似,此处不再赘述。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备(例如图5中的终端设备或服务器)400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备包括:存储器以及处理器,其中,这里的处理器可以称为下文所述的处理装置401,存储器可以包括下文中的只读存储器(ROM)402、随机访问存储器(RAM)403以及存储装置408中的至少一项,具体如下所示:如图5所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:提取待处理图像对应的至少一个视觉单词;基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系;确定待处理图像分别与至少一个相似图像分别对应的相似度;依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“提取待处理图像对应的至少一个视觉单词的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储就以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例A提供一种图像处理方法,包括:
提取待处理图像对应的至少一个视觉单词;
基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系;
确定待处理图像与至少一个相似图像分别对应的相似度;
依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
根据本公开的一个或多个实施例,示例A提取待处理图像对应的至少一个视觉单词,包括:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
根据本公开的一个或多个实施例,示例A确定待处理图像与至少一个相似图像分别对应的相似度,包括:
依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的至少一个视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
根据本公开的一个或多个实施例,示例A确定待处理图像与至少一个相似图像分别对应的相似度,包括:
获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
根据本公开的一个或多个实施例,示例A基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像之前,该方法还包括:
基于单词图片关系库中多个图像分别对应的至少一个视觉单词,确定单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
根据本公开的一个或多个实施例,示例A若待处理图像是来自图像存储请求的待存储图片,依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作,包括:
若相似度大于第一预设相似度阈值,则对待处理图像及相似图像中至少一个进行去重处理;
若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
根据本公开的一个或多个实施例,示例A若待处理图像是来自图片搜索请求的待搜索图片,依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作,包括:
将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
根据本公开的一个或多个实施例,示例B提供了一种图像处理装置,该装置包括:
单词提取模块,用于提取待处理图像对应的至少一个视觉单词;
图像匹配模块,用于基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一张相似图像,单词图片关系库中包括多个图像以及多个视觉单词分别与多个图像的倒排索引关系;
相似度确定模块,用于确定待处理图像与至少一个相似图像分别对应的相似度;
图像处理模块,用于依据相似度,确定对待处理图像和相似图像中至少一个所执行的操作。
根据本公开的一个或多个实施例,示例B中单词提取模块用于:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,视觉单词为图像中图像特征的预定长度的浮点型数据表达。
根据本公开的一个或多个实施例,示例B中图像处理模块用于:
依据待处理图像对应的至少一个视觉单词,以及至少一个相似图像分别对应的至少一个视觉单词,计算待处理图像与至少一个相似图像分别对应的相似度。
根据本公开的一个或多个实施例,示例B中图像处理模块用于:
获取待处理图像的图像特征与至少一个相似图像分别对应的图像特征;
依据待处理图像的图像特征与至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
根据本公开的一个或多个实施例,示例B基于待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有待处理图像对应的至少一个视觉单词的至少一个相似图像之前,图像匹配模块还用于:
基于单词图片库中多个图像分别对应的至少一个视觉单词,确定单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
根据本公开的一个或多个实施例,示例B若待处理图像是来自图像存储请求的待存储图片,图像处理模块用于:
若相似度大于第一预设相似度阈值,则对待处理图像及相似图像中至少一个进行去重处理;
若相似度不大于第一预设相似度阈值,则将待处理图像存储至预定的图像存储区域。
根据本公开的一个或多个实施例,示例B若待处理图像是来自图片搜索请求的待搜索图片,图像处理模块还用于:
将相似度大于第二预设相似度阈值的相似图像,作为图片搜索请求对应的图片搜索结果。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (10)

1.一种图像处理方法,其特征在于,包括:
提取待处理图像对应的至少一个视觉单词;
基于所述待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有所述待处理图像对应的至少一个视觉单词的至少一张相似图像,所述单词图片关系库中包括多个图像以及多个视觉单词分别与多个图像的倒排索引关系;
确定所述待处理图像与所述至少一个相似图像分别对应的相似度;
基于所述相似度,确定对所述待处理图像和所述相似图像中的至少一个所执行的操作。
2.根据权利要求1所述的方法,其特征在于,所述提取待处理图像对应的至少一个视觉单词,包括:
提取待处理图像的图像特征;
基于提取到的图像特征构造至少一个视觉单词,所述视觉单词为图像中图像特征的预定长度的浮点型数据表达。
3.根据权利要求1所述的方法,其特征在于,所述确定所述待处理图像与所述至少一个相似图像分别对应的相似度,包括:
依据所述待处理图像对应的至少一个视觉单词,以及所述至少一个相似图像分别对应的至少一个视觉单词,计算所述待处理图像与所述至少一个相似图像分别对应的相似度。
4.根据权利要求1所述的方法,其特征在于,所述确定所述待处理图像与所述至少一个相似图像分别对应的相似度,包括:
获取所述待处理图像的图像特征与所述至少一个相似图像分别对应的图像特征;
依据所述待处理图像的图像特征与所述至少一个相似图像分别对应的图像特征,分别进行图像间的相似度计算。
5.根据权利要求1所述的方法,其特征在于,所述基于所述待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有所述待处理图像对应的至少一个视觉单词的至少一张相似图像之前,所述方法还包括:
基于所述单词图片关系库中多个图像分别对应的至少一个视觉单词,确定所述单词图片关系库中多个视觉单词分别与多个图像的倒排索引关系。
6.根据权利要求1所述的方法,其特征在于,若所述待处理图像是来自图像存储请求的待存储图片,所述确定对所述待处理图像和所述相似图像中的至少一个所执行的操作,包括:
若所述相似度大于第一预设相似度阈值,则对所述待处理图像及所述相似图像中至少一个进行去重处理;
若所述相似度不大于第一预设相似度阈值,则将所述待处理图像存储至预定的图像存储区域。
7.根据权利要求1所述的方法,其特征在于,若所述待处理图像是来自图片搜索请求的待搜索图片,所述确定对所述待处理图像和所述相似图像中的至少一个所执行的操作,包括:
将所述相似度大于第二预设相似度阈值的相似图像,作为所述图片搜索请求对应的图片搜索结果。
8.一种图像处理装置,其特征在于,包括:
单词提取模块,用于提取待处理图像对应的至少一个视觉单词;
图像匹配模块,用于基于所述待处理图像对应的至少一个视觉单词,在预建立的单词图片关系库中查询包括有所述待处理图像对应的至少一个视觉单词的至少一张相似图像,所述单词图片关系库中包括多个图像以及多个视觉单词与多个图像的倒排索引关系;
相似度确定模块,用于确定所述待处理图像与所述至少一个相似图像分别对应的相似度;
图像处理模块,用于依据所述相似度,确定对所述待处理图像和所述相似图像中至少一个所执行的操作。
9.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1-7任一项所述的图像处理方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的图像处理方法。
CN201910723195.5A 2019-08-06 2019-08-06 图像处理方法、装置、电子设备及计算机可读介质 Pending CN110458224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910723195.5A CN110458224A (zh) 2019-08-06 2019-08-06 图像处理方法、装置、电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910723195.5A CN110458224A (zh) 2019-08-06 2019-08-06 图像处理方法、装置、电子设备及计算机可读介质

Publications (1)

Publication Number Publication Date
CN110458224A true CN110458224A (zh) 2019-11-15

Family

ID=68485194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910723195.5A Pending CN110458224A (zh) 2019-08-06 2019-08-06 图像处理方法、装置、电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110458224A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859004A (zh) * 2020-07-29 2020-10-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统
CN102982165A (zh) * 2012-12-10 2013-03-20 南京大学 一种大规模人脸图像检索方法
CN105260423A (zh) * 2015-09-28 2016-01-20 北京橙鑫数据科技有限公司 电子名片去重方法及装置
CN108536753A (zh) * 2018-03-13 2018-09-14 腾讯科技(深圳)有限公司 重复信息的确定方法及相关装置
CN108595710A (zh) * 2018-05-11 2018-09-28 杨晓春 一种快速的海量图片去重方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统
CN102982165A (zh) * 2012-12-10 2013-03-20 南京大学 一种大规模人脸图像检索方法
CN105260423A (zh) * 2015-09-28 2016-01-20 北京橙鑫数据科技有限公司 电子名片去重方法及装置
CN108536753A (zh) * 2018-03-13 2018-09-14 腾讯科技(深圳)有限公司 重复信息的确定方法及相关装置
CN108595710A (zh) * 2018-05-11 2018-09-28 杨晓春 一种快速的海量图片去重方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859004A (zh) * 2020-07-29 2020-10-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质
CN111859004B (zh) * 2020-07-29 2024-07-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN111414498B (zh) 多媒体信息推荐方法、装置及电子设备
CN110321958A (zh) 神经网络模型的训练方法、视频相似度确定方法
CN111368185B (zh) 数据展示方法、装置、存储介质及电子设备
CN106911697B (zh) 访问权限设置方法、装置、服务器及存储介质
CN110222775B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN110213614A (zh) 从视频文件中提取关键帧的方法和装置
WO2022247562A1 (zh) 多模态数据检索方法、装置、介质及电子设备
CN110413812A (zh) 神经网络模型的训练方法、装置、电子设备及存储介质
CN109684589B (zh) 客户端的评论数据的处理方法、装置及计算机存储介质
CN111400625B (zh) 页面处理方法、装置、电子设备及计算机可读存储介质
WO2023151589A1 (zh) 视频显示方法、装置、电子设备和存储介质
CN111897950A (zh) 用于生成信息的方法和装置
CN109255035A (zh) 用于构建知识图谱的方法和装置
CN111241137B (zh) 数据处理方法、装置、电子设备及存储介质
CN110209658A (zh) 数据清洗方法和装置
CN110198473A (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN110188782B (zh) 图像相似性确定方法、装置、电子设备及可读存储介质
CN110188113B (zh) 一种利用复杂表达式进行数据比对的方法、装置及存储介质
CN109919220A (zh) 用于生成视频的特征向量的方法和装置
CN116628049B (zh) 一种基于大数据的信息系统维护管理系统及方法
CN110458224A (zh) 图像处理方法、装置、电子设备及计算机可读介质
WO2021258972A1 (zh) 视频检索方法、装置、电子设备和计算机可读介质
CN115269978A (zh) 一种视频标签生成方法、装置、设备及介质
CN110413603B (zh) 重复数据的确定方法、装置、电子设备及计算机存储介质
CN109614137B (zh) 软件版本控制方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191115