CN111666442A - 一种图像检索方法、装置及计算机设备 - Google Patents

一种图像检索方法、装置及计算机设备 Download PDF

Info

Publication number
CN111666442A
CN111666442A CN202010489577.9A CN202010489577A CN111666442A CN 111666442 A CN111666442 A CN 111666442A CN 202010489577 A CN202010489577 A CN 202010489577A CN 111666442 A CN111666442 A CN 111666442A
Authority
CN
China
Prior art keywords
image
sequence
retrieved
template
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010489577.9A
Other languages
English (en)
Other versions
CN111666442B (zh
Inventor
傅强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010489577.9A priority Critical patent/CN111666442B/zh
Publication of CN111666442A publication Critical patent/CN111666442A/zh
Application granted granted Critical
Publication of CN111666442B publication Critical patent/CN111666442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请实施例公开了一种图像检索方法、装置及计算机设备;本申请实施例可以对待检索图像进行多通道数据提取,得到待检索图像在至少一个图像通道上的通道数据;基于所述通道数据,生成待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括待检索图像中像素的感知哈希值;将所述至少两个子感知哈希序列级联,得到待检索图像的感知哈希序列;将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;基于所述匹配模板序列对应的模板图像,确定待检索图像的检索结果图像。该方案可以提高图像检索的效率,并且降低系统开发中出现图像资源的冗余或者错误引用等问题的概率。

Description

一种图像检索方法、装置及计算机设备
技术领域
本申请涉及计算机技术领域,具体涉及一种图像检索方法、装置及计算机设备。
背景技术
图像在表达信息上具有独特的视觉意义,并且可以传递复杂的数据。在现代科技的发展过程中,图像作为重要的传播媒介,在不同的领域都发挥了巨大的作用。例如,在具有用户界面的系统中,图像资源的使用除了可以实现信息的传递以外,还可以提高用户的使用体验。
在对相关技术的研究和实践过程中,本申请的发明人发现,在系统开发中,针对图像资源进行的重复性检查依靠历史经验及人眼比对,使得图像检索效率十分低下;进一步地,会导致针对图像资源的检索耗时耗力甚至出现漏判,从而导致系统中出现冗余资源;而对于相似度极高的图像资源,由于人眼比对容易出错,使得在系统开发中极易出现资源引用错误等问题。
发明内容
本申请实施例提供一种图像检索方法、装置及计算机设备,可以提高图像检索的效率。
本申请实施例提供一种图像检索方法,包括:
对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;
基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;
将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;
将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;
基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
相应的,本申请实施例还提供一种图像检索装置,包括:
数据提取单元,用于对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;
生成单元,用于基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;
级联单元,用于将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;
匹配单元,用于将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;
确定单元,用于基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
在一实施例中,所述至少两个子感知哈希序列包括第一子感知哈希序列和第二子感知哈希序列;所述生成单元,包括:
特征确定子单元,用于基于所述通道数据,确定所述待检索图像在至少一个图像通道上的通道数据分布特征;
灰度解析子单元,用于对所述通道数据进行灰度化解析,得到所述待检索图像的灰度数据;
第一生成子单元,用于基于所述待检索图像的灰度数据,生成所述第一子感知哈希序列;
第二生成子单元,用于基于所述待检索图像的通道数据分布特征和所述灰度数据,生成所述第二子感知哈希序列。
在一实施例中,所述图像通道包括颜色通道和透明通道,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;所述特征确定子单元,用于基于所述颜色通道的通道数据计算所述通道数据的颜色均值与颜色极值,以确定所述待检索图像的颜色数据分布特征;基于所述透明通道的通道数据计算所述通道数据的透明均值,以确定所述待检索图像的透明数据分布特征;将所述颜色数据分布特征和所述透明数据分布特征进行组合,得到所述待检索图像的通道数据分布特征。
在一实施例中,所述灰度数据包括所述待检索图像中像素的灰度值;所述第一生成子单元,用于基于所述灰度数据中像素的灰度值,确定所述像素的灰度均值;将所述灰度数据中各像素的灰度值与所述灰度均值进行比较,以确定所述第一子感知哈希序列中与所述像素对应的感知哈希值;将所述感知哈希值组成所述第一子感知哈希序列。
在一实施例中,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;所述第二生成子单元,用于基于所述灰度数据的灰度均值,确定所述待检索图像的灰度分布特征;将所述颜色数据分布特征,所述透明数据分布特征和所述灰度分布特征进行组合,得到所述第二子感知哈希序列。
在一实施例中,所述图像检索装置还包括:
图像提取单元,用于从原始图像中提取需要进行缩放处理的待缩放图像;
缩放单元,用于基于所述待缩放图像的当前尺寸,对所述待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像;
增强单元,用于对所述缩略图像进行图像数据增强操作,得到待检索图像。
在一实施例中,所述图像提取单元,包括:
方式确定子单元,用于确定所述原始图像的图像检索方式;
缩放图像提取子单元,用于基于所述图像检索方式,从所述原始图像中提取需要进行缩放处理的待缩放图像。
在一实施例中,所述缩放单元,包括:
尺寸获取子单元,用于获取所述待缩放图像的当前尺寸;
比例确定子单元,用于基于所述当前尺寸,确定所述待缩放图像的缩放比例;
图像缩放子单元,用于基于所述缩放比例,对所述待缩放图像进行至少一次图像缩放操作,得到目标尺寸的缩略图像。
在一实施例中,所述匹配单元,包括:
序列比较子单元,用于将所述感知哈希序列的感知哈希值与所述模板序列的序列值进行按位比较,得到所述感知哈希序列与所述模板序列的差异位数;
结果确定子单元,用于基于所述差异位数与所述感知哈希序列的长度,确定所述感知哈希序列与所述模板序列的匹配结果;
序列确定子单元,用于若所述匹配结果小于等于预定的匹配阈值,则确定所述模板序列为所述感知哈希序列的匹配模板序列。
在一实施例中,所述确定单元,包括:
候选确定子单元,用于根据所述匹配模板序列的源图标志,确定与所述匹配模板序列对应的模板图像,得到所述原始图像的候选匹配图像;
匹配确定子单元,用于基于所述匹配模板序列与所述感知哈希序列之间的匹配结果,从所述候选匹配图像中确定所述原始图像的匹配结果图像。
在一实施例中,所述匹配确定子单元,用于若所述匹配结果不满足预设条件时,从所述原始图像中提取预设尺寸的复核图像,将待检索图像更新为所述复核图像,返回执行对所述待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据的步骤,直至得到所述待检索图像的检索结果图像。
在一实施例中,所述级联单元,包括:
顺序确定子单元,用于确定所述至少两个子感知哈希序列的连接顺序;
序列连接子单元,用于基于所述连接顺序,将所述至少两个子感知哈希序列进行序列连接,得到所述待检索图像的感知哈希序列。
在一实施例中,所述图像检索装置,还包括:
更新单元,用于若所述模板序列集中不包括所述感知哈希序列的匹配模板序列时,建立所述感知哈希序列与原始图像的映射关联;根据所述哈希感知序列,对所述模板序列集进行更新。
本实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如本发明实施例所示的图像检索方法的步骤。
本申请实施例提供了一种图像检索方法、装置及计算机设备,可以对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
该方案可以将复杂的数字图像信息抽象成感知哈希序列,并将图像的检索转化为序列的匹配,使得针对图像的检索在具备了哈希值的抗碰撞性特点与摘要性特点的同时,也保持了对图像的格式变化、明暗变化等多种图像变换操作的鲁棒性,从而大大提高了图像检索的效率。进一步地,本方案可以作为基于内容的图像资源的检索及匹配技术的有益补充,减少了人力消耗并降低了误匹配率。此外,通过本方案进行图像检索,在系统开发中既可以避免人为疏漏导致的工程内图像资源的冗余,又可以精准匹配工程内的图像资源,并减低出现资源引用错误的概率,进而极大地提升了图像检索的效率,以及具备用户界面的系统的开发效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的图像检索方法的场景示意图;
图2是本申请实施例提供的图像检索方法的另一场景示意图;
图3是本申请实施例提供的图像检索方法的图像资源依赖关系示意图;
图4是本申请实施例提供的图像检索方法的流程示意图;
图5是本申请实施例提供的图像检索方法的像素坐标示意图;
图6是本申请实施例提供的图像检索方法的宫格类型切图结构示意图;
图7是本申请实施例提供的图像检索方法的九宫格结构切图输出示意图;
图8是本申请实施例提供的图像检索方法的图像数据增强操作示意图;
图9是本申请实施例提供的图像检索方法的待缩放图像提取示意图;
图10是本申请实施例提供的图像检索方法的均值哈希碰撞示意图;
图11是本申请实施例提供的图像检索方法的灰度图像示意图;
图12是本申请实施例提供的图像检索方法的灰度值比较结果示意图;
图13是本申请实施例提供的图像检索方法的子哈希序列示意图;
图14是本申请实施例提供的图像检索方法的回溯实例示意图;
图15是本申请实施例提供的图像检索方法的另一流程示意图;
图16是本申请实施例提供的图像检索方法的检索匹配流程图;
图17是本申请实施例提供的图像检索方法的图像变换示意图;
图18是本申请实施例提供的图像检索方法的同家族图像资源示意图;
图19申请实施例提供的图像检索装置的结构示意图;
图20申请实施例提供的图像检索装置的另一结构示意图;
图21申请实施例提供的图像检索装置的另一结构示意图;
图22申请实施例提供的图像检索装置的另一结构示意图;
图23申请实施例提供的图像检索装置的另一结构示意图;
图24申请实施例提供的图像检索装置的另一结构示意图;
图25申请实施例提供的图像检索装置的另一结构示意图;
图26申请实施例提供的图像检索装置的另一结构示意图;
图27申请实施例提供的图像检索装置的另一结构示意图;
图28申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种图像检测方法及装置。具体地,本申请实施例提供适用于计算机设备的图像检索装置。其中,该计算机设备可以为终端或服务器等设备,该终端可以为手机、平板电脑、笔记本电脑等设备。该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群。
本申请实施例将以图像检索方法由服务器执行为例,来介绍图像检索方法。
参考图1,服务器10可以从终端20获取原始图像,并从该原始图像中提取待进行图像检索的待检索图像。进一步地,服务器10可以对该检索图像进行多通道数据提取,以得到该待检索图像在至少一个图像通道上的通道数据,并基于该通道数据,生成该待检索图像的至少两个子感知哈希序列,其中,该子感知哈希序列包括该待检索图像中像素的感知哈希值。
进一步地,服务器10可以将该至少两个子感知哈希序列级联,从而得到该待检索图像的感知哈希序列,并将该感知哈希序列与模板序列集中模板图像的模板序列进行匹配,从而得到与该感知哈希序列匹配的匹配模板序列。而后,服务器10可以基于该匹配模板序列对应的模板图像,确定该待检索图像的检索结果图像。在实际应用中,若该模板序列集中不包括该感知哈希序列的匹配模板序列,服务器10还可以建立该感知哈希序列与原始图像的映射关联,并根据该感知哈希序列,对模板序列集进行更新。
在一实施例中,参考图2,图像检索方法可以应用于游戏用户界面(UI,UserInterface)系统的开发过程中,其中,图中的箭头方向为工作流的输出方向。具体地,在开发游戏UI系统时,美术人员会根据游戏系统的交互,辅以合适的意象图片来生成游戏系统的效果图,其中,效果图可以通过位图文件格式,如PSD(PhotoshopDocument)格式,来合并成目标图像以进行输出。在位图文件格式的效果图文件中,各层图片以图层的形式存在,且每一图层中可以包括至少一个可用的图像资源;例如,可以通过切片工具,从图层中分离出图像资源,以便进行页面的制作,其中,该分离出的图像资源也称切图。
参考图2,程序人员在收到美术人员输出的切图后,可以将该切图导入游戏工程中,形成工程资源。在实际应用中,这些工程资源可以以多种形式存在,例如,可以将这些工程资源组装成在游戏开发过程中所使用到的游戏对象,如,预设体(Prefab)。
参考图3,作为一种资源类型,Prefab可以被重复使用并实例化成游戏对象。Prefab中保存了待使用的所有资源的信息、相对位置、缩放、旋转等信息,此外,Prefab还可以支持嵌套操作,即Prefab可以由其他Prefab组成,从而在系统开发中,无需所有的Prefab都必须持有对具体工程资源的直接引用,参考图3,图中的箭头方向为依赖关系方向。
在游戏UI系统的开发过程中,参考图2,当程序人员需要参照设计稿将游戏UI系统进行复原的时候,既需要将组成游戏UI系统的切图导入到工程中,又需通过引用Prefab来实现游戏UI系统的复原。在这个过程中,需要进行图像检索,以避免将工程中已有的游戏资源重复地导入到工程中,导致冗余资源的出现,此外,还需要通过图像检索实现对Prefab的精准引用,以实现游戏UI系统的复原。
因此,在游戏UI系统的开发过程中,服务器可以从切图中提取待检索图像,并对该待检索图像进行多通道数据提取,以得到该待检索图像在至少一个图像通道上的通道数据。而后,服务器可以基于该通道数据,生成该待检索图像的至少两个子感知哈希序列,并将该至少两个子感知哈希序列级联,得到该待检索图像的感知哈希序列。通过将该感知哈希序列与模板序列集中模板图像的模板序列进匹配,得到与该感知哈希序列匹配的匹配模板序列,并基于该匹配模板序列对应的模板图像,确定该待检索图像的检索结果图像。该检索结果图像可以在游戏UI系统开发的过程中为程序人员提供极大的帮助,一来,在按照设计稿复原游戏UI的时候,可以快速确认工程中是否已存在切图资源,或者是否需要导入切图;二来,在进行系统开发的时候,可以精准引用该检索结果图像,从而避免出现业务错误。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本申请实施例提供的一种图像检索方法,该方法可以由服务器执行,也可以由终端和服务器共同执行;本申请实施例以图像检索方法由服务器执行为例来进行说明,具体的,由集成在服务器中的图像检索装置来执行,如图4所述,该图像检索方法的具体流程可以如下:
101、对待检索图像进行多通道数据提取,得到待检索图像在至少一个图像通道上的通道数据。
其中,图像是客观对象的一种相似性的、生动性的描述或写真,是人类社会生活中最常用的信息载体。图像的记录方式可以有多种,比如,可以通过计算机储存的数据来记录图像上各点的亮度信息,得到数字图像。数字图像是二维图像用有限数字数值像素的表示。数字图像由数组或矩阵表示,其光照位置和强度都是离散的。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
数字图像可以由至少一个像素组成,其中,像素为数字图像的基本元素,是在模拟图像数字化时对连续空间进行离散化得到的。每个像素具有整数行(高)和列(宽)位置坐标,同时每个像素都具有整数灰度值或颜色值。可以将像素视为整个图像中不可分割的单位或者是元素。可以通过像素坐标来确定像素在图像中的位置,具体地,可以以图像左上角为原点建立以像素为单位的直接坐标系u-v。像素的横坐标u与纵坐标v分别是在其图像数组中所在的列数与所在行数。参考图5,像素A在图中对应的坐标即为(u0,v0)。
其中,图像可以包括至少一个图像通道,且每个图像通道上可以包括至少一个与图像像素对应的通道数据。例如,在红蓝绿(RGB,RedGreenBlue)色彩模式下,图像可以包括红色(R,Red)通道、绿色(G,Green)通道和蓝色(B,Blue)通道这三个图像通道;又如,在色调饱和度明度(HSV,HueSaturation Value)色系中,图像可以包括色调(H,Hue)通道、饱和度(S,Saturation)通道和亮度(V,Value)通道这三个图像通道,等等。
在一实施例中,图像可以仅包括一个图像通道,如,灰度通道;相应地,仅由灰度通道构成的图像即为灰度图。在灰度图中,每个像素仅用一个像素值表示颜色,且在像素值取不同的值的时候对应不同的灰色程度,例如,当规定每个像素值的取值范围在0到255之间时,像素值为0时可以表示黑色,像素值为255时可以表示白色,而像素值在0和255之间时即可相应地表示不同等级的灰色。
再如,图像可以包括四个图像通道,如R通道、G通道,B通道和透明(A,Alpha)通道;相应地,由R、G、B、A四个图像通道构成的图像即为带透明通道的彩色图像。其中,图像中的每个像素在R通道、G通道、B通道和A通道上可以分别具有对应的像素值,且像素值的取值范围可以有多种形式,例如,可以在0到255之间或在0到1之间,等等。对于一个像素,当其在R通道、G通道、B通道和A通道上的像素值分别为255,255,255,0时,该像素表示完全透明的白色;又如,当一个像素在R通道、G通道、B通道和A通道上的像素值分别为0,0,0,255时,该像素表示完全不透明的黑色,等等。
在本实施例中,待检索图像可以为RGB色彩模式下的彩色图像,并且附加了额外的透明通道信息,使得待检索图像包括R、G、B、A四个图像通道。此外,该待检索图像中每个像素在这四个图像通道中分别具有相应的像素值,使得该待检索图像在每个图像通道上具有相应的通道数据。具体地,在步骤“对待检图像进行多通道数据提取”之前,还可以包括:
从原始图像中提取需要进行缩放处理的待缩放图像;
基于待缩放图像的当前尺寸,对待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像;
对缩略图像进行图像数据增强操作,得到待检索图像。
其中,原始图像可以为输入到图像检索系统的原始资源,例如,在游戏UI系统的开发过程中,当美术人员向程序人员输出了某一游戏装备的切图时,程序人员需要确定已有的工程资源里是否已经存在该切图,因此需要基于该切图进行图像检索,此时,该切图即为原始图像。
在一实施例中,原始图像可以为九宫格类型或者三宫格的切图。具体地,参考图6中九宫格类型切图结构,可知九宫格类型的图像具有如下特征:在进行图像放大或缩小时,图像的1,3,7,9部分保持不变,图像的4,6部分在垂直方向拉伸,图像的2,8部分在水平方向拉伸,而图像的5部分在水平及垂直方向拉伸。参考图6中三宫格类型切图结构1,三宫格类型的图像可以具有如下特征:在进行图像放大或缩小时,图像的1,3部分保持不变,图像的2部分在垂直方向拉伸;或者参考图6中三宫格类型切图结构2,三宫格类型的图像可以具有如下特征:在进行图像放大或缩小时,图像的1,3部分保持不变,图像的2部分在水平方向拉伸。
在一实施例中,参考图7,图7中的初始美术资源为九宫格类型的切图,当对该初始美术资源进行九宫格拉伸后,可以相应得到输出切图,值得注意的是,该输出切图的四角部分并未发生拉伸变化,仍然与初始美术资源的四角保持一致。
其中,待缩放图像可以为从原始图像中提取得到、并需要进行图像缩放处理的图像资源。例如,待缩放图像可以为原始图像中的一部分,也可以为将原始图像中多个部分进行合并后得到的合并图像,也可以为原始图像本身,等等。
在一实施例中,可以在原始图像的四角分别取相同尺寸大小的分块,得到四个分块图像,并将得到的分块图像确定为原始图像的待缩放图像,如,当原始图像为九宫格类型的切图时,可以在该切图的四角分别提取相同尺寸大小的分块,并将得到的分块图像确定为该切图的待缩放图像。
在另一实施例中,可以在原始图像的四角分别取相同尺寸大小的分块,并基于四个分块在原始图像中的位置将这四个分块进行合并得到合并图像,该得到的合并图像即为原始图像的待缩放图像,如,当原始图像为九宫格类型的切图时,可以在该切图的四角分别提取相同尺寸大小的分块,并将分块进行合并得到合并后的待缩放图像。
在另一实施例中,可以不对原始图像进行任何分块或合并操作,而是将该原始图像确定为待缩放图像,等等。
其中,图像缩放操作为对图像进行的尺寸缩小或尺寸放大操作,在实际应用中,图像缩放操作还可以包括保持图像尺寸不变的操作。进行图像缩放操作的方式可以有多种,例如,可以通过双线性插值的方式进行;具体地,双线性插值,又称为双线性内插,在数学上,双线性插值是有两个变量的插值函数的线性差值扩展,其核心思想是在两个方向分别进行一次线性插值;而线性插值是指插值函数为一次多项式的插值方式,其在插值节点上的插值误差为零。线性插值相比其他插值方式,如抛物线插值,具有简单、方便的特点。线性插值可以用来近似代替原函数,也可以用来计算得到查表过程中表中没有的数值。双线性插值作为数值分析中的一种插值算法,广泛应用在信号处理,数字图像和视频处理等方面。
在本实施例中,可以通过双线性插值的方式,对从原始图像中提取到待缩放图像进行图像缩放操作,以得到目标尺寸的缩略图像。其中,目标尺寸可以基于实际需求进行设置,例如,可以将目标尺寸设置为8×8、16×16等n×n的形式,其中,n为2的整数次幂。
其中,图像数据增强操作可以为针对图像进行的数据增强操作,可以在不实质性的增加图像数据的情况下,让有限的图像数据产生等价于更多图像数据的价值。例如,图像数据增强操作可以包括对图像进行的旋转变换、翻转变换、对比度变换、噪声扰动、颜色变化,等等。
在本实施例中,图像数据增强操作可以包括翻转变换、旋转变换,以及通过对所述翻转变换与所述旋转变换进行组合得到的组合变换。例如,可以对缩略图像进行如下图像数据增强操作,以实现基于该缩略图像得到至少一个待检索图像:
垂直翻转;水平翻转;垂直翻转及水平翻转;顺时针90度旋转;顺时针90度旋转及水平翻转;顺时针90度旋转及垂直翻转;顺时针90度旋转并且垂直翻转以及水平翻转。
通过上述七种图像数据增强操作,再加上保留缩略图像本身,可以基于该缩略图像得到八个待检索图像,例如,参考图8,图中通过对一待略图像进行图像数据增强操作后,再加上保留该缩略图像本身,可以得到八个待检索图像。
在本实施例中,可以从原始图像中提取待缩放图像,在对该待缩放图像进行图像缩放操作后,得到缩略图像,并通过对缩略图像进行图像数据增强操作,最终得到待检索图像,具体地,步骤“从原始图像中提取需要进行缩放处理的待缩放图像”,可以包括:
确定原始图像的图像检索方式;
基于该图像检索方式,从原始图像中提取需要进行缩放处理的待缩放图像。
其中,基于原始图像的不同,图像检索方式也相应地具有多种情况。例如,图像检索方式可以包括整体检索、分块检索、合并检索,等等。针对不同的图像检索方式,可以采取不同的方式从原始图像中提取需要进行缩放处理的待缩放图像。
具体地,参考图9,若图像检索标志为整体检索,则可以将该原始图像确定为待缩放图像。若图像检索标志为分块检索,则可以在该原始图像的左上角、右上角、右下角及左下角分别进行图像提取,得到4个相同尺寸的待缩放图像。若图像检索标志为合并检索,则可以在该原始图像的左上角、右上角、右下角及左下角分别进行图像提取,得到4个相同尺寸的分块图像后,基于分块图像在原始图像中的位置,将这些分块图像进行合并,得到合并后的待缩放图像。
在一实施例中,若原始图像为九宫格类型或者三宫格类型的切图,则该原始图像的图像检索标志可以包括合并检索及分块检索,具体地,从原始图像中提取需要进行缩放处理的待缩放图像可以包括如下步骤:
对于合并检索,则可以从该原始图像的左上角、右上角、右下角及左下角分别进行图像提取,得到四个4×4大小的分块图像,并将这四个4×4大小的分块图像基于其在原始图像中的位置进行合并,得到一个8×8的待缩放图像。值得注意的是,该步骤中分块图像的尺寸并不限制为4×4,而是可以包括多种情况,例如,分块图像的尺寸取值在0×0到4×4之间均可。具体地,当分块图像的尺寸取0×0时,相当于在此步骤未进行图像提取;当分块图像的尺寸取1×1时,则相应地可以得到一个尺寸为2×2的合并后的待缩放图像;当分块图像的尺寸取2×2时,则相应地可以得到一个尺寸为4×4的合并后的待缩放图像;当分块图像的尺寸取3×3时,则相应地可以得到一个尺寸为6×6的合并后的待缩放图像。在实际应用中,分块图像的尺寸可以按照实际需求进行调整,不单单局限于0×0到4×4的区间,也可以包括大于4×4的情况。
而对于分块检索,则可以在该原始图像的左上角、右上角、右下角及左下角分别进行图像提取,得到四个8×8的分块图像,并将这四个分块图像确定为待缩放图像;值得注意的是,分块图像的尺寸并不限制为8×8,而是可以包括多种情况,例如,可以为n×n,其中,n为2的整数次幂;又如,可以为i×i,其中,i为自然数,等等。
在另一实施例中,若原始图像为进行了旋转处理或者缩放处理的切图资源,则该原始图像的图像检索标志可以为整体检索,因此无需进行图像提取,可以将该原始图像确定为待缩放图像。
其中,确定图像检索方式的方法可以有多种,例如,当图像检索系统在获得原始图像作为图像检测方法的输入数据时,可以将该原始图像的图像检索标志设置为整体检索,并针对该原始图像进行图像检索,若该原始图像在首次图像检索后无匹配的检索结果图像,则可以将该原始图像的检索标志更新为合并检索及分块检索,并将该更新后的原始图像作为数据输入再次进行图像检索,以获得最终的图像检索结果。
在一实施例中,对于输入图像检索系统的原始图像,在针对该切图初次进行图像检索时,可以设置该切图的图像检索方式为整体检索,若未能通过图像检索方法检索到匹配的检索结果图像,则可以重置该切图的图像检索方式为合并检索。随后,在该切图的左上角、右上角、右下角及左下角分别进行图像提取,得到四个4×4大小的分块图像,并将这四个4×4大小的分块图像基于其在原始图像中的位置进行合并,得到一个8×8的待缩放图像后,确定该8×8的待缩放图像的图像检索结果。若针对该8×8的待缩放图像进行的图像检索未能检索到匹配的检索结果图像,或者检索到至少两个匹配的检索结果图像,则可以重置该切图的图像检索方式为分块检索,并将重置后的切图再次进行图像检索,以确定与之匹配的检索结果图像。
在本实施例中,当基于原始图像的图像检索方式,从原始图像中提取了需要进行缩放处理的待缩放图像后,即可基于该待缩放图像的当前尺寸,确定对该待缩放图像进行图像缩小操作或图像放大操作,以得到目标尺寸的缩略图像。具体地,步骤“基于待缩放图像的当前尺寸,对待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像”,可以包括:
获取待缩放图像的当前尺寸;
基于该当前尺寸,确定待缩放图像的缩放比例;
基于该缩放比例,对待缩放图像进行至少一次图像缩放操作,得到目标尺寸的缩略图像。
其中,可以将待缩放图像的当前尺寸与目标尺寸进行比较,以确定应该对该待缩放图像进行图像缩小操作,或者图像放大操作,或者直接确定当前尺寸的待缩放图像为目标尺寸的缩略图像。
在一实施例中,若待缩放图像的当前尺寸大于缩略图像的目标尺寸,则可以确定对该待缩放图像进行图像缩小操作;若待缩放图像的当前尺寸小于缩略图像的目标尺寸,则可以确定对该待缩放图像进行图像放大操作;若待缩放图像的当前尺寸等于缩略图像的目标尺寸,则可以确定无需对该待缩放图像进行图像放大操作或图像缩小操作,可以直接将该当前尺寸的待缩放图像为目标尺寸的缩略图像。
其中,待缩放图像的缩放比例可以基于业务需求进行设置,例如,可以首先在该待缩放图像的当前尺寸中确定宽和高的较大值m,并计算不大于m的最大的n的值,其中,n为2的整数次幂;随后,在将该待缩放图像缩放至n×n后,可以将该待缩放图像从n×n逐次缩放到目标尺寸,其中,每次图像缩放操作均遵循等比缩放:具体地,若为图像缩小操作,则缩放比例可以为,缩放前图像的宽与缩放后图像的宽的比值为0.5;若为图像放大操作,则缩放比例可以为,缩放前图像的宽与缩放后图像的宽的比值为2,等等。
在一实施例中,若待缩放图像的当前尺寸为33×33,缩略图像的目标尺寸为8×8,则可以通过对该待缩放图像进行至少一次图像缩放操作得到目标尺寸的缩略图像,具体地,可以通过第一次图像缩小操作,将该待缩放图像从33×33缩小到32×32;通过第二次图像缩小操作,将该待缩放图像从32×32缩小到16×16;通过第三次图像缩小操作,将该待缩放图像从16×16缩小到8×8,得到8×8的缩略图像。
102、基于通道数据,生成待检索图像的至少两个子感知哈希序列,其中,该子感知哈希序列包括待检索图像中像素的感知哈希值。
其中,哈希的概念来源于传统密码学,哈希是把任意长度的输入通过散列算法变换成固定长度的输出,即对于任意长度的输入产生固定长度的哈希值。这种转换是一种压缩映射,即哈希值的空间通常远小于输入的空间,且不同的输入可能会映射成相同的输出,所以不可能从哈希值来确定唯一的输入值。通过以简短的哈希值表示任意长度的输入,使哈希具备摘要性的特点。此外,哈希同时具有单向性和抗碰撞性的特点,具体地,单向性是指由哈希值不能反推原输入信息,抗碰撞性是指不同的输入数据的哈希值不能相同。
例如,可以基于字母序列计算对应的哈希值:
“FatherAndMotherILoveYou”对应“d1f3bb50ec8144adbc23fda1ba709dbb”;“FatherAndMotherILoveyou”对应“4e8c13234d9aa2a8b45b8d411fb9ff39”;“fatherAndMotherILoveYou”对应“6bcf71c8b5c9395f70c18393b4284202”。可以看出,正是由于单向性和抗碰撞性的特点,决定了哈希对输入数据的比特变化敏感,即输入数据的任何一个二进制位发生变化,都会导致输出结果的明显随机变化。
而对于数字图像而言,数据图像格式的变化、图像的缩放旋转或分辨率改变等变换操作,都会导致数字图像的哈希值的剧烈变化,但图像呈现的内容信息却可能没有发生改变,所以传统密码学的哈希算法并不适用于数字图像检索与匹配。
感知哈希借鉴了传统密码学的摘要性特点和抗碰撞性特点,并且,对于一幅给定的数字图像,输出固定长度的二进制序列,并将该二进制序列称为感知哈希值或感知哈希序列。感知哈希函数能将大数据量的多媒体对象映射成长度较小的比特序列,且能将感知相近的媒体对象映射成数学相近的哈希值。因此,感知哈希算法在具备了摘要性和抗碰撞性的同时,还保持了对图像格式变化的鲁棒性。即只要图像内容信息不变,不论其存储格式如何,图像的感知哈希值都应该保持不变或者在一个较小的阈值内变化。
感知哈希可以基于数字图像的统计特性来生成感知哈希序列,然而,在数字图像的内容信息高度相似而统计特性不变时,将会生成相同或相近的感知哈希序列,从而影响图像匹配的结果。参考图10,图中切图资源a对应的均值哈希序列与切图资源b对应的均值哈希序列一样,但是切图资源a与切图资源b为感知不同的图像,因此,若使用均值哈希序列来进行图像检索的话,会导致错误的匹配结果。
在本实施例中,可以基于待检索图像的通道数据,生成待检索图像的至少两个子感知哈希序列,其中,该子感知哈希序列包括该待检索图像中像素的感知哈希值,具体地,以该待检索图像的至少两个子感知哈希序列包括第一子感知哈希序列和第二子感知哈希序列为例,步骤“基于通道数据,生成待检索图像的至少两个子感知哈希序列”,可以包括:
基于通道数据,确定待检索图像在至少一个图像通道上的通道数据分布特征;
对通道数据进行灰度化解析,得到待检索图像的灰度数据;
基于待检索图像的灰度数据,生成第一子感知哈希序列;
基于待检索图像的通道数据分布特征和该灰度数据,生成第二子感知哈希序列。
其中,待检索图像的通道数据分布特征描述了该待检索图像在图像通道上像素值的分布特征,例如,若该待检索图像为RGB色彩模式下的带透明通道的数字图像,则可以基于该待检索图像在R通道、G通道、B通道,以及A通道上的通道数据,相应地确定该待检索图像在各个图像通道上的通道数据分布特征。具体的,该通道数据分布特征可以包括颜色数据分布特征以及透明数据分布特征,其中,颜色数据分布特征可以包括该待检索图像在R通道上的红色数据分布特征、在G通道上的绿色通道数据特征,以及在B通道上的蓝色数据分布特征;而透明数据分布特征可以包括该待检索图像在A通道上的数据分布特征。
其中,灰度化解析可以将待检索图像从彩色图像转换为灰度图像,具体地,灰度化解析可以通过对待检索图像的通道数据进行预设的计算实现。例如,可以采用最大值法,将彩色图像中各像素在R、G、B三个图像通道中像素值的最大值作为该像素在灰度图的灰度值,从而得到灰度图像;又如,可以采用平均值法,将彩色图像中各像素在R、G、B三个图像通道的像素值得平均值确定为该像素在灰度图中的灰度值,从而得到灰度图像;再如,可以采用加权平均法,将彩色图像中各像素在R、G、B三个图像通道的像素值以不同的权值进行加权平均,得到该像素在灰度图中的灰度值,从而得到灰度图像,等等。
在本实施例中,对待检索图像的通道数据进行灰度化解析可以采用加权平均方法,并且在灰度化解析的过程中,将待检索图像的透明通道上的信息附加进去,使得该待检索图像对应的灰度图像中包括了灰度通道的信息。例如,可以遵循下式,计算待检索图像中各像素带透明通道的灰度值:AlphaGray(i,j)=(r(i,j)×299+g(i,j)×587+b(i,j)×114)/1000×a(i,j)/255,其中,(i,j)为像素的坐标,r(i,j)为该像素在R通道的像素值,g(i,j)为该像素在G通道的像素值,b(i,j)为该像素在B通道的像素值,a(i,j)为该像素在A通道的像素值,最后得到的AlphaGray(i,j)为该像素对应的灰度值。当得到该待检索图像中每个像素对应的灰度值后,即可得到该待检索图像的灰度数据。在一实施例中,参考图11,该图即为对待检索图像进行灰度化之后得到的灰度图像,该灰度图像中的每个方格即为像素,且每个像素中颜色的深浅对应着灰度值的高低。
由于待检索图像的图像通道可以包括颜色通道和透明通道,相应地,通道数据分布特征可以包括颜色数据分布特征和透明数据分布特征,因此,步骤“基于通道数据,确定待检索图像在至少一个图像通道上的通道数据分布特征”,可以包括:
基于颜色通道的通道数据计算该通道数据的颜色均值与颜色极值,以确定待检索图像的颜色数据分布特征;
基于透明通道的通道数据计算该通道数据的透明均值,以确定待检索图像的透明数据分布特征;
将颜色数据分布特征和透明数据分布特征进行组合,得到待检索图像的通道数据分布特征。
其中,待检索图像的颜色通道可以包括R通道,G通道和B通道,因此,相应地,该待检索图像具有R通道上的通道数据、G通道上的通道数据和B通道上的通道数据。
其中,颜色均值可以通过针对不同颜色通道上的通道数据进行求均值操作得到,值得注意的是,该颜色均值可以从数学上的多种平均值中进行选择,例如,可以为算术平均值,几何平均值,平方平均值,调和平均值,或加权平均值,等等。颜色极值可以通过针对不同颜色通道上的通道数据进行求极值操作得到,值得注意的时,该颜色极值可以包括极大值和极小值。
在本实施例中,在计算颜色均值的时候,可以采用算术平均值的计算方法;在计算颜色极值的时候,可以选择极大值作为颜色极值。在计算得到颜色均值与颜色极值后,可以将该颜色均值与颜色极值确定为该待检索图像的颜色数据分布特征。具体地,可以遵循下式,求得cMax[1]、cMax[2]及cMax[3],其中,cMax[1]表示通道数据在R通道上的颜色极值;cMax[2]表示通道数据在G通道上的颜色极值;cMax[3]表示通道数据在B通道上的颜色极值:
cMax[m]=Max(cMax[m],c[m](i,j)),
其中,m∈[0,2];(i,j)为待检索图像中像素的坐标;c[m](i,j)在m等于0、1、2时分别表示该像素在R通道、G通道和B通道上的像素值。
在本实施例中,可以规定缩略图像的目标尺寸为8×8,并且,可以遵循下式,求得AvgC[1]、AvgC[2]及AvgC[3],其中,AvgC[1]表示通道数据在R通道上的颜色均值;AvgC[2]表示通道数据在G通道上的颜色均值;AvgC[3]表示通道数据在B通道上的颜色均值:
Figure BDA0002520410030000191
其中,m∈[0,2];(i,j)为待检索图像中像素的坐标;c[m](i,j)在m等于0、1、2时分别表示该像素在R通道、G通道和B通道上的像素值。
在本实施例中,在得到待检索图像在R通道、G通道、B通道上的颜色均值和颜色极值后,即在计算得到AvgC[0]、AvgC[1]、AvgC[2]和cMax[0]、cMax[1]、cMax[2]后,即可确定待检索图像的颜色数据分布特征。
其中,待检索图像的图像通道中可以包括A通道,因此,相应地,待检索图像具有A通道上的通道数据。计算A通道上通道数据的透明均值可以通过针对该通道数据进行求平均值操作得到,值得注意的时,该透明均值可以从数学上的多种平均值中进行选择,例如,可以为算术平均值,几何平均值,平方平均值,调和平均值,或加权平均值,等等。
在本实施例中,可以遵循下式,求得表示透明均值的AvgC[3]:
Figure BDA0002520410030000192
其中,m的取值为3;(i,j)为待检索图像中像素的坐标;c[m](i,j)表示该像素在A通道上的像素值。
在本实施例中,在得到待检索图像在A通道上的透明均值后,即在计算得到AvgC[3]后,即可将该透明均值确定为该待检索图像的透明数据分布特征。
在本实施例中,可以将颜色数据分布特征和透明数据分布特征进行组合,以得到待检索图像的通道数据分布特征。具体地,可以将颜色数据分布特征中的AvgC[0],AvgC[1],AvgC[2],cMax[0],cMax[1],cMax[2],和透明数据分布特征AvgC[3]按照下面的顺序进行组合,得到描述了通道数据分布特征的序列:[AvgC[0],AvgC[1],AvgC[2],AvgC[3],cMax[0],cMax[1],cMax[2]]。
在确定了待检索图像的通道数据分布特征和灰度数据后,可以生成该待检索图像的第一子感知哈希序列和第二子感知哈希序列,其中,待检索图像的灰度数据包括该待检索图像中像素的灰度值,则步骤“基于待检索图像的灰度数据,生成第一子感知哈希序列”,可以包括:
基于灰度数据中像素的灰度值,确定该像素的灰度均值;
将灰度数据中各像素的灰度值与灰度均值进行比较,以确定第一子感知哈希序列中与该像素对应的感知哈希值;
将该感知哈希值组成第一子感知哈希序列。
其中,灰度均值的计算方式可以有多种,譬如,可以通过对灰度数据中像素的灰度值进行加权求和获得,也可以通过求取灰度数据中像素的灰度值得算是平均值获得,等等。值得注意的是,该灰度均值可以从数学上的多种平均值中进行选择,例如,可以为算术平均值,几何平均值,平方平均值,调和平均值,或加权平均值,等等。
在本实施例中,可以通过遵循下式来计算灰度均值:
Figure BDA0002520410030000201
其中,(i,j)为待检索图像中像素的坐标,AlphaGray(i,j)为待检索图像的灰度图像中像素的灰度值,最后求得的AvgAlphaGray即为灰度均值。
在确定灰度均值后,可以将各像素的灰度值与该灰度均值进行比较,以确定第一子感知哈希序列中的感知哈希值。值得注意的时,比较的方式可以有多种,比如,若像素的灰度值大于该灰度均值,则确定第一子检测序列中与该像素对应的比特位的值为0;若像素的灰度值小于或等于该灰度均值,则确定第一子检测序列中与该像素对应的比特位的值为1,等等。
在本实施例中,若像素的灰度值大于该灰度均值,则确定第一子检测序列中与该像素对应的比特位的值为1;若像素的灰度值小于或等于该灰度均值,则确定第一子检测序列中与该像素对应的比特位的值为0,具体地,可以遵循下式来确定第一子感知哈希序列中的感知哈希值:
Figure BDA0002520410030000211
其中,(i,j)为待检索图像中像素的坐标,AlphaGray(i,j)为待检索图像的灰度图像中像素的灰度值,AvgAlphaGray为灰度均值,最后求得的AvgAlphaHash(i,j)即为第一子感知哈希序列中与该像素对应的感知哈希值。
在本实施例中,参考图12,该图中各像素内标注的数字,即为将灰度数据中将灰度数据中各像素的灰度值与灰度均值进行比较得到的结果。
在确定了第一子感知哈希序列中与各像素对应的感知哈希值之后,即可相应地确定第一子感知哈希序列。在本实施例中,可以基于各像素在待检索图像中的位置,将各感知哈希值进行组合,得到第一子感知哈希序列。具体地,可以遵循下式,生成第一子感知哈希序列:
AvgAlphaH={AvgAlphaHash(0,0),AvgAlphaHash(0,1),...,AvgAlphaHash(7,7)}其中,AvgAlphaHash(0,0)为待检索图像中坐标为(0,0)的像素对应的感知哈希值,AvgAlphaHash(0,1)为待检索图像中坐标为(0,1)的像素对应的感知哈希值,...,AvgAlphaHash(7,7)为待检索图像中坐标为(7,7)的像素对应的感知哈希值,最后求得的AvgAlphaH即为待检索图像的第一子感知哈希序列。
而对于第二子感知序列,步骤“基于待检索图像的通道数据分布特征和该灰度数据,生成第二子感知哈希序列”,可以包括:
基于灰度数据的灰度均值,确定待检索图像的灰度分布特征;
将颜色数据分布特征,透明数据分布特征和灰度分布特征进行组合,得到第二子感知哈希序列。
其中,待检索图像的灰度分布特征描述了待检索图像对应的灰度图像中各像素的灰度值的分布特征。灰度分布特征可以以多种方式确定,例如,可以将灰度数据的灰度均值确定为待检索图像的灰度分布特征。
在本实施例中,颜色数据分布特征包括AvgC[0],AvgC[1],AvgC[2],cMax[0],cMax[1],cMax[2];透明数据分布特征包括AvgC[3];当用灰度数据的灰度均值AvgAlphaGray来描述待检索图像的灰度分布特征时,可以遵循下式,将颜色数据分布特征,透明数据分布特征和灰度分布特征进行组合,以生成第二子感知哈希序列:
[AvgC[0],AvgC[1],AvgC[2],AvgC[3],cMax[0],cMax[1],cMax[2],AvgAlphaGray]
在另一实施例中,参考图13,当规定缩略图像的目标尺寸为8×8时,相应地,生成的感知哈希序列的长度为64位,且AvgC[0],AvgC[1],AvgC[2],AvgC[3],cMax[0],cMax[1],cMax[2]和AvgAlphaGray的长度分别都为8位。
103、将至少两个子感知哈希序列级联,得到待检索图像的感知哈希序列。
其中,对至少两个子序列级联可以建立子序列之间的连接关系,并且,可以使得生成的结果序列既携带了原本子序列中的信息,同时又包含将子序列进行级联后产生的新信息。
在一实施例中,对子感知哈希序列进行级联的方式可以有多种,例如,可以将子感知哈希序列进行简单的首尾连接,从而得到连接后的感知哈希序列;又如,可以将子感知哈希序列进行分片,并将分片后的各个序列片进行组合,从而得到组合后的感知哈希序列,等等。
在本实施例中,可以将至少两个子感知哈希序列级联,以得到待检索图像的感知哈希序列,具体地,步骤“将至少两个子感知哈希序列级联,得到待检索图像的感知哈希序列”,可以包括:
确定至少两个子感知哈希序列的连接顺序;
基于该连接顺序,将至少两个子感知哈希序列进行序列连接,得到待检索图像的感知哈希序列。
其中,子感知哈希序列的连接顺序可以有多种,例如,可以基于子感知哈希序列生成的顺序,使得在先生成的子感知哈希序列后连接的为在后生成的子感知哈希序列;又如,可以基于特定的业务需求,将子感知哈希序列的连接顺序固定,无需考虑子感知哈希序列的生成时间,等等。
在本实施例中,若待检索图像的感知哈希序列包括第一子感知哈希序列以及第二子感知哈希序列,则连接顺序可以为第一子感知哈希序列后连接第二子感知哈希序列,即第一子检测序列的最后一个比特位后为第二子检测序列的第一个比特位;也可以为第二子感知哈希序列后连接第一子感知哈希序列,即第二子检测序列的最后一个比特位后为第一子检测序列的第一个比特位。
在确定连接顺序后,即可遵循该连接顺序,将至少两个子感知哈希序列进行序列连接,以得到连接后的感知哈希序列。
104、将感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与该感知哈希序列匹配的匹配模板序列。
其中,模板序列集为包括至少一个用于进行序列匹配的模板序列的集合,其中的每个模板序列可以通过对模板图像进行感知哈希序列的计算得到。
在本实施例中,模板图像可以为游戏UI系统开发中程序人员已导入的切图资源,而与模板图像对应的模板序列可以通过计算与该模板序列对应的至少两个子感知哈希序列后,将该至少两个子感知哈希序列级联,并将级联后得到的感知哈希序列确定为模板序列。进一步地,可以通过对系统中所有已导入的切图进行模板序列的计算,并将得到的模板序列添加进一个集合中,得到模板序列集。
其中,将感知哈希序列与模板序列进行匹配的方式可以有多种,比如,可以通过计算感知哈希序列与模板序列之间的汉明距离、欧式距离、曼哈顿距离、夹角余弦,等等。
可以通过将感知哈希序列与模板序列集中模板图像的模板序列进行匹配,以从该模板序列集中的模板序列中确定与该感知哈希序列匹配的匹配模板序列,具体地,步骤“将感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与该感知哈希序列匹配的匹配模板序列”,可以包括:
将感知哈希序列的感知哈希值与模板序列的序列值进行按位比较,得到感知哈希序列与模板序列的差异位数;
基于差异位数与感知哈希序列的长度,确定感知哈希序列与模板序列的匹配结果;
若匹配结果小于等于预定的匹配阈值,则确定模板序列为感知哈希序列的匹配模板序列。
其中,将感知哈希序列的感知哈希值与模板序列的序列值进行按位比较可以确定感知哈希序列与模板序列中不同的位的个数。进行按位比较的方式可以有多种,例如,可以通过对感知哈希序列与模板序列进行按位异或计算,又如,可以通过计算感知哈希序列与模板序列之间的汉明距离,等等。具体地,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。
在一个实施例中,将序列“110100010”变换成序列“110000110”所需要替换的字符个数是2个,因此它们之间的汉明距离即为2。
在本实施例中,感知哈希序列与模板序列之间的差异位数可以通过计算感知哈希序列与模板序列之间的汉明距离确定。
进一步地,可以基于差异位数和感知哈希序列的长度来确定感知哈希序列与模板序列的匹配结果,例如,可以通过计算两者之间的相似度来确定该匹配结果。例如,可以通过差异位数与感知哈希序列的长度的比值来计算相似度,具体地,可以通过遵循下式来进行相似度的计算:
Figure BDA0002520410030000241
其中,x表示感知哈希序列,y表示模板序列,Δ(x,y)表示感知哈希序列与模板序列之间的差异位数,n表示感知哈希序列与模板序列的总长度。值得注意的是,在本实施例中,由于规定了缩略图像的目标尺寸为8×8,使得生成的第一子感知哈希序列与第二子感知哈希序列的长度均为64,故感知哈希序列的长度n的取值为128。通过遵循上式,最后求得的Sim(x,y)即为感知哈希序列与模板序列之间的相似度。进一步地,可以将该相似度确定为感知哈希序列与模板序列的匹配结果。
其中,匹配阈值的确定可以基于业务需求进行设置,例如,当使用相似度来度量感知哈希序列和模板序列的匹配结果时,可以设置匹配阈值为95%,那么若感知哈希序列与模板序列的匹配结果大于等于95%,则可以确定该模板序列为感知哈希序列的匹配模板序列;相应地,若感知哈希序列与模板序列的匹配结果小于95%,则确定该模板序列不为感知哈希序列的匹配模板序列。又如,可以设置匹配阈值为100%,那么只有在感知哈希序列与模板序列完全匹配的时候,才可以将该模板序列确定为该感知哈希序列的匹配模板序列;等等。
又如,当使用感知哈希序列与模板序列之间的差异位数来度量两者的匹配结果时,可以设置匹配阈值为10,那么若感知哈希序列与模板序列之间的差异位数小于等于10时,则可以确定该模板序列为感知哈希序列的匹配模板序列;相应地,若感知哈希序列与模板序列的差异位数大于10时,则确定该模板序列不为感知哈希序列的匹配模板序列。再如,当感知哈希序列是由两个子感知哈希序列级联得到时,可以对两个子感知哈希序列分别设置匹配阈值,并且,当且仅当两个子感知哈希序列与模板序列的差异位数都在其匹配阈值内时,才可以确定该模板序列为感知哈希序列的匹配模板序列;等等。
105、基于匹配模板序列对应的模板图像,确定待检索图像的检索结果图像。
值得注意的是,与匹配模板序列对应的模板图像可以为一个,也可以为至少两个。具体地,由于模板序列的长度具有长度限制,因此该长度下的模板数据空间也是有限的,因而在计算模板图像的模板序列时,对于不同的模板图像可能生成相同的模板序列。此外,若不同的模板图像具有相同的子感知哈希序列,则也有可能导致不同的模板图像具有相同的模板序列。
因此,可以基于匹配模板序列对应的模板图像,进一步地确定待检索图像的检索结果图像。具体地,步骤“基于匹配模板序列对应的模板图像,确定待检索图像的检索结果图像”,可以包括:
根据匹配模板序列的源图标志,确定与该匹配模板序列对应的模板图像,得到原始图像的候选匹配图像;
基于匹配模板序列与感知哈希序列之间的匹配结果,从候选匹配图像中确定原始图像的匹配结果图像。
其中,匹配模板序列的源图标志用于确定与该匹配模板序列对应的模板图像,具体地,该源图标志中可以包括用于确定模板图像的数据信息,如模板图像的序列号(ID,IdentityDocument)、储存路径,等等。进一步地,可以将与该匹配模板序列对应的模板图像,确定为原始图像的候选匹配图像,也可以从中选择部分模板图像作为原始图像的候选匹配图像,等等。例如,若匹配模板序列具有两个与之对应的模板图像,则可以将该两个模板图像确定为原始图像的候选匹配图像。
在本实施例中,可以将与该匹配模板序列对应的模板图像,确定为原始图像的候选匹配图像。并且可以进一步地基于匹配模板序列与感知哈希序列之间的匹配结果,从候选匹配图像中确定原始图像的匹配结果图像。具体地,步骤“基于匹配模板序列与感知哈希序列之间的匹配结果,从候选匹配图像中确定原始图像的匹配结果图像”,可以包括:
若匹配结果不满足预设条件时,从原始图像中提取预设尺寸的复核图像,将待检索图像更新为该复核图像,返回执行对待检索图像进行多通道数据提取,得到待检索图像在至少一个图像通道上的通道数据的步骤,直至得到待检索图像的检索结果图像。
其中,由于感知哈希的实质是对图像进行高度抽象,将数据量较大的图像抽象为固定长度的二进制序列,如,128位。则感知哈希在带来高度摘要性的同时,同时也会伴随着信息的损失。而信息的损失则会造成在不同的图像上发生感知哈希值重复的问题,影响资源的检索成功率。因此,在匹配结果不满足预设条件时,可以进一步地进行对原始图像的回溯及验算。
具体地,当将预设条件设置为感知哈希序列与模板序列之间的汉明距离为0,且与该感知哈希序列匹配的匹配模板序列有且仅有一个与之对应的模板图像时,可以遵循下列步骤对原始图像进行回溯及验算:
若匹配结果为汉明距离为0,且具有至少两个对应的模板图像,则可以将原始图片迭代回溯至不大于原尺寸的2的整数次幂的尺寸进行比对,直至比对成功。在每次迭代过程中,可以在将原始图像进行缩放后,从缩放后的原始图像中提取多个预设尺寸的复核图像,并基于该复核图像进行回溯;
若匹配结果为汉明距离不为0,但是满足了匹配阈值,则可以将原始图片缩放至目标尺寸的两倍后,从缩放后的原始图像中提取多个预设尺寸的复核图像,并基于该复核图像的比对结果进行验算。
在一个实施例中,可以将图像检索方法中的目标尺寸设置为8×8,参考图14,在一麻将游戏UI开发中,工程资源中存在“三莴”麻将的对应切图(为避免不必要的重复,在本实施例中将‘“三莴”麻将的对应切图’简称为‘“三莴”)与“六莴”麻将对应的切图(为避免不必要的重复,在本实施例中将‘“六莴”麻将的对应切图简称为“六莴”)。当程序人员将“三莴”作为原始图片进行图像检索时,在模板序列集中检索到的匹配模板序列具有两个与之对应的模板图像:“三莴”与“六莴”。而且,在该目标尺寸下,由于工程资源中的“三莴”与“六莴”所对应的模板序列完全重复,且待检索图像与它们之间的汉明距离均为0,因此,可以进行回溯以进一步确定原始图像的匹配结果图像。具体地,可以将原始图像缩放至目标尺寸的两倍,即16×16后,对该16×16的图像进行分块,以实现从该16×16的图像中提取到4个8×8的分块图像,并将以该分块图像为复核图像,通过对复核图像进行感知哈希序列的比对来进一步确定与原始图像匹配的匹配结果图像。参考图14,回溯到16×16后得以区分“三莴”与“六莴”。进一步地,若是在16×16的尺寸下仍不能区分“三莴”与“六莴”,则可以再回溯到32×32比对八个8×8的分块图像,直至缩放至不大于原图尺寸的2的整数次幂的尺寸大小。这样即使在初始目标尺寸下检索到的匹配模板序列具有至少两个与之对应的模板图像,也能通过回溯确定最终的匹配结果图像。
在另一实施例中,将图像检索方法中的目标尺寸设置为8×8,若感知哈希序列与模板序列之间的汉明距离不为0,但是满足了预设的匹配阈值,则可以将原始图片缩放至16×16后,从缩放后的原始图片中提取4个8×8的分块图像,并以该分块图像为复核图像进一步确定每个复核图像的匹配结果,若每个复核图像均为匹配,则可以确定验算成功。
在实际应用中,若模板序列集中不包括感知哈希序列的匹配模板序列时,还可以:
建立感知哈希序列与原始图像的映射关联;
根据该哈希感知序列,对该模板序列集进行更新。
其中,感知哈希序列与原始图像的映射关联可以通过对感知哈希序列进行源图标志的设置完成。例如,可以在该感知哈希序列的源图标志中添加该原始图像的ID、保存路径,等等。
进一步地,在建立了感知哈希序列与原始图像的映射关联后,可以通过将该感知哈希序列添加到模板序列集中对该模板序列集进行更新。
由上可知,本实施例可以将复杂的数字图像信息抽象成感知哈希序列,并将图像的检索转化为序列的匹配,使得针对图像的检索在具备了哈希值的抗碰撞性特点与摘要性特点的同时,也保持了对图像的格式变化、明暗变化等多种图像变换操作的鲁棒性,从而大大提高了图像检索的效率。进一步地,本方案可以作为基于内容的图像资源的检索及匹配技术的有益补充,减少了人力消耗并降低了误匹配率。此外,通过本方案进行图像检索,在系统开发中既可以避免人为疏漏导致的工程内图像资源的冗余,又可以精准匹配工程内的图像资源,并减低出现资源引用错误的概率,进而极大地提升了图像检索的效率,以及具备用户界面的系统的开发效率。
并且,本方案在传统感知哈希函数的基础上,提出了以图像结构信息为主、同时辅以亮度与通道分量做补充的感知哈希算法,实现了针对图像资源的检索的同时,还使得图像检索方法增加了对图像缩放、图像旋转、图像宫格拉伸等多种图像变换的鲁棒性,从而大大提高了图像检索的效率,尤其是具备用户界面的系统的开发效率。
此外,对待缩放图像进行缩放处理以得到目标尺寸的缩略图像的过程中,通过采用逐次缩放的方法,使得生成的缩略图像不会在缩放过程中丢失重要的感知信息,而是与原始大小图像的感知哈希序列高度相似甚至完全一致,从而使得后续的基于感知哈希序列的图像匹配步骤能够更有效地进行。
另外,本方案提出的图像检索方法,还提供了在感知哈希值重复时的回溯方案,使得当与感知哈希序列匹配的匹配模板序列具有多个与之对应的模板图像时,可以进一步地确定该感知哈希序列的匹配结果图像,从而改善了图像检索的效率;而对于成功匹配的图像资源的还提供了进一步的验算方案,使得图像检索具有更高的准确率。
根据上面实施例所描述的方法,以下将举例进一步详细说明。
在本实施例中,将以图像检索装置集成在服务器与终端为例进行说明,该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群;该终端可以为手机、平板电脑、笔记本电脑等设备。
如图15所示,一种图像检索方法,具体流程如下:
201、服务器从终端的原始图像中提取需要进行缩放处理的待缩放图像。
终端的原始图像可以为待进行图像检索的原始资源,例如,可以为进行用户界面开发的过程需要用到的切图。在本实施例中,参考图16,当终端的原始图像为切图的时候,可以将该切图发送到服务器,以便将该切图导入到工程资源,并且对该切图进行图像检索。
值得注意的是,将该切图导入到工程资源的时候,该切图可以发生一些变换,例如,参考图17,常见的变换形式可以包括:保留原图、镜像变换、缩放变换、旋转变换、宫格拉伸;除此之外,还可能存在格式变换,例如,从联合图像专家组(jpeg,Joint PhotographicExperts Group)格式变成便携式网络图形(png,Portable Network Graphics)格式,等等。
服务器在获取到原始图像后,可以进一步地从该原始图像中提取需要进行缩放处理的待缩放图像,具体地,该待缩放图像可以为原始图像中的一部分,也可以为将原始图像中多个部分进行合并后得到的合并图像,也可以为原始图像本身,等等。
202、服务器基于待缩放图像的当前尺寸,对该待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像。
在一实施例中,所述待缩放图像的当前尺寸为65×65,所述目标尺寸为16×16,那么,可以通过对该65×65的待缩放图像进行多次图像缩小操作,以得到8×8的缩略图像。具体地,可以通过第一次图像缩小操作,将该待缩放图像从65×65缩小到64×64;通过第二次图像缩小操作,将该待缩放图像从64×64缩小到32×32;通过第三次图像缩小操作,将该待缩放图像从32×32缩小到16×16,得到16×16的缩略图像;其中,每次图像缩小操作均可以通过双线性插值实现。
203、服务器对该缩略图像进行图像数据增强操作,得到待检索图像。
在一实施例中,可以通过对该缩略图像进行以下操作来进行图像数据增强:垂直翻转;水平翻转;垂直翻转及水平翻转;顺时针90度旋转;顺时针90度旋转及水平翻转;顺时针90度旋转及垂直翻转;顺时针90度旋转并且垂直翻转以及水平翻转。此外,除了可以将基于上述每一项操作得到的图像确定为该缩略图像的待检索图像外,再加上该缩略图像本身,可以基于该缩略图像得到八个待检索图像。
204、服务器对待检索图像进行多通道数据提取,得到该待检索图像在至少一个图像通道上的通道数据。
在一实施例中,待检索图像可以为RGB色彩模式下的彩色图像,并且附加了额外的透明通道信息,使得待检索图像包括R、G、B、A四个图像通道。服务器可以基于该待检索图像中的各个像素在R、G、B、A四个图像通道上的像素值进行多通道数据提取,得到该待检索图像在R通道上的通道数据、在G通道上的通道数据、在B通道上的通道数据,以及在A通道上的通道数据。其中,各个图像通道上的通道数据可以包括至少一个像素在该图像通道上的像素值。
205、服务器基于通道数据,生成待检索图像的至少两个子感知哈希序列,其中,该子感知哈希序列包括待检索图像中像素的感知哈希值。
其中,该子感知哈希序列的长度可以有多种情况,例如,当所述待检索图像的尺寸为8×8时,可以规定子感知哈希序列的长度为64;又如,可以基于业务需求,对不同的子感知哈希序列赋予不同的参考权重,对于参考权重较大的子感知哈希序列设置较大的长度,对于参考权重较小的子感知哈希序列设置较小的长度,等等。
在本实施例中,待检索图像的至少两个子感知哈希序列可以包括第一子感知哈希序列和第二子感知哈希序列。具体地,可以将待检索图像转换为灰度图像后,基于该灰度图像中像素的像素值生成第一子感知哈希序列,并基于该待检索图像中像素在各个图像通道上的数据分布特征和该灰度图像的灰度特征,生成第二子感知哈希序列。
206、服务器将至少两个子感知哈希序列级联,得到待检索图像的感知哈希序列。
在本实施例中,在确定了子感知哈希序列的连接顺序后,可以基于该连接顺序,将该至少两个子感知哈希序列进行序列连接,从而得到待检索图像的感知哈希序列。
在实际应用中,参考图16,可以设置专门的感知哈希计算模块来计算待检索图像的感知哈希序列,例如,可以通过图中的Mix_Hash模块生成待检索图像的至少两个子感知哈希序列,并将生成的子感知哈希序列级联,以便进一步地确定待检索图像的感知哈希序列HashValue。
207、服务器将感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与该感知哈希序列匹配的匹配模板序列。
在本实施例中,可以通过计算感知哈希序列与模板序列之间的汉明距离,来确定感知哈希序列与模板序列的匹配结果,并进一步基于该匹配结果,从模板序列集中确定感知哈希序列的匹配模板序列。
值得注意的是,参考图16,在实际应用中,可以通过对工程资源中的各个图像资源进行感知哈希序列的计算,并将得到的感知哈希序列值储存在数据库中,以对数据库中的模板序列集进行更新。
208、服务器基于匹配模板序列对应的模板图像,确定待检索图像的检索结果图像。
在一实施例中,服务器可以基于匹配模板序列的源图标志,确定与该匹配模板序列对应的模板图像,并从该模板图像中确定原始图像的候选匹配图像。具体地,当该匹配模板序列具有两个或者两个以上模板图像与之对应时,可以将所有的模板图像确定为原始图像的候选匹配图像,也可以从多个模板图像中选择部分作为原始图像的候选匹配图像。在确定原始图像的候选匹配图像后,可以基于匹配模板序列与感知哈希序列之间的匹配结果,从候选匹配图像中确定原始图像的匹配结果图像。
值得注意的是,以系统UI界面开发为例,对于同家族图像资源,如物品品质外框、物品图标、技能图标、选中框等等,这些资源在美术人员输出效果图时仅列出一种情形,但在根据效果图进行UI界面开发时,可能引用同家族的其他资源,因此,在图像检索的过程中,需要将此类资源视作同一家族资源。参考图18,图中列举了属于同一家族的四种选中框切图资源:切图资源c、切图资源d、切图资源e和切图资源f。
由于同家族图像资源可能是感知上相似的,例如属于同一家族的选中框图标具有相同的结构,只是在颜色上有差异;也可能是感知上完全不一致,但逻辑上是同家族的,例如游戏UI系统中的技能图标。因此,可以在本方案的基础上引入白名单机制,以作为针对同家族图像资源的检索方法的有益补充。具体地,在将图像导入到工程资源中时,可以手动维护一个同家族资源白名单,使得处于白名单中同一家族的资源,在匹配时被视作同一资源,以此完成对同家族资源的处理。
由上可知,本实施例可以将复杂的数字图像信息抽象成感知哈希序列,并将图像的检索转化为序列的匹配,使得针对图像的检索在具备了哈希值的抗碰撞性特点与摘要性特点的同时,也保持了对图像的格式变化、明暗变化等多种图像变换操作的鲁棒性,从而大大提高了图像检索的效率。进一步地,本方案可以作为基于内容的图像资源的检索及匹配技术的有益补充,减少了人力消耗并降低了误匹配率。此外,通过本方案进行图像检索,在系统开发中既可以避免人为疏漏导致的工程内图像资源的冗余,又可以精准匹配工程内的图像资源,并减低出现资源引用错误的概率,进而极大地提升了图像检索的效率,以及具备用户界面的系统的开发效率。
此外,对待缩放图像进行缩放处理以得到目标尺寸的缩略图像的过程中,通过采用逐次缩放的方法,使得生成的缩略图像不会在缩放过程中丢失重要的感知信息,而是与原始大小图像的感知哈希序列高度相似甚至完全一致,从而使得后续的基于感知哈希序列的图像匹配步骤能够更有效地进行。另外,通过引进白名单机制,使得本方案的图像检索方法同样适用于同家族的图像资源,使得本方案的图像检索方法具有更广泛的适用性。
为了更好地实施以上方法,相应的,本申请实施例还提供一种图像检索装置,其中,该图像检索装置可以集成在服务器或终端中。该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群;该终端可以为手机、平板电脑、笔记本电脑等设备。
例如,如图19,该图像检索装置可以包括数据提取单元301,生成单元302,级联单元303,匹配单元304以及确定单元305,如下:
数据提取单元301,用于对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;
生成单元302,用于基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;
级联单元303,用于将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;
匹配单元304,用于将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;
确定单元305,用于基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
在一实施例中,参考图20述至少两个子感知哈希序列包括第一子感知哈希序列和第二子感知哈希序列;所述生成单元302,包括:
特征确定子单元3021,用于基于所述通道数据,确定所述待检索图像在至少一个图像通道上的通道数据分布特征;
灰度解析子单3022元,用于对所述通道数据进行灰度化解析,得到所述待检索图像的灰度数据;
第一生成子单元3023,用于基于所述待检索图像的灰度数据,生成所述第一子感知哈希序列;
第二生成子单元3024,用于基于所述待检索图像的通道数据分布特征和所述灰度数据,生成所述第二子感知哈希序列。
在一实施例中,所述图像通道包括颜色通道和透明通道,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;所述特征确定子单元3021,用于基于所述颜色通道的通道数据计算所述通道数据的颜色均值与颜色极值,以确定所述待检索图像的颜色数据分布特征;基于所述透明通道的通道数据计算所述通道数据的透明均值,以确定所述待检索图像的透明数据分布特征;将所述颜色数据分布特征和所述透明数据分布特征进行组合,得到所述待检索图像的通道数据分布特征。
在一实施例中,所述灰度数据包括所述待检索图像中像素的灰度值;所述第一生成子单元3023,用于基于所述灰度数据中像素的灰度值,确定所述像素的灰度均值;将所述灰度数据中各像素的灰度值与所述灰度均值进行比较,以确定所述第一子感知哈希序列中与所述像素对应的感知哈希值;将所述感知哈希值组成所述第一子感知哈希序列。
在一实施例中,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;所述第二生成子单元3024,用于基于所述灰度数据的灰度均值,确定所述待检索图像的灰度分布特征;将所述颜色数据分布特征,所述透明数据分布特征和所述灰度分布特征进行组合,得到所述第二子感知哈希序列。
在一实施例中,参考图21,所述图像检索装置,还包括:
图像提取单元306,用于从原始图像中提取需要进行缩放处理的待缩放图像;
缩放单元307,用于基于所述待缩放图像的当前尺寸,对所述待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像;
增强单元308,用于对所述缩略图像进行图像数据增强操作,得到待检索图像。
在一实施例中,参考图22,所述图像提取单元306,包括:
方式确定子单元3061,用于确定所述原始图像的图像检索方式;
缩放提取子单元3062,用于基于所述图像检索方式,从所述原始图像中提取需要进行缩放处理的待缩放图像。
在一实施例中,参考图23,所述缩放单元307,包括:
尺寸获取子单元3071,用于获取所述待缩放图像的当前尺寸;
比例确定子单元3072,用于基于所述当前尺寸,确定所述待缩放图像的缩放比例;
图像缩放子单元3073,用于基于所述缩放比例,对所述待缩放图像进行至少一次图像缩放操作,得到目标尺寸的缩略图像。
在一实施例中,参考图24,所述匹配单元304,包括:
序列比较子单元3041,用于将所述感知哈希序列的感知哈希值与所述模板序列的序列值进行按位比较,得到所述感知哈希序列与所述模板序列的差异位数;
结果确定子单元3042,用于基于所述差异位数与所述感知哈希序列的长度,确定所述感知哈希序列与所述模板序列的匹配结果;
序列确定子单元3043,用于若所述匹配结果小于等于预定的匹配阈值,则确定所述模板序列为所述感知哈希序列的匹配模板序列。
在一实施例中,参考图25,所述确定单元305,包括:
候选确定子单元3051,用于根据所述匹配模板序列的源图标志,确定与所述匹配模板序列对应的模板图像,得到所述原始图像的候选匹配图像;
匹配确定子单元3052,用于基于所述匹配模板序列与所述感知哈希序列之间的匹配结果,从所述候选匹配图像中确定所述原始图像的匹配结果图像。
在一实施例中,所述匹配确定子单元3052,用于若所述匹配结果不满足预设条件时,从所述原始图像中提取预设尺寸的复核图像,将待检索图像更新为所述复核图像,返回执行对所述待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据的步骤,直至得到所述待检索图像的检索结果图像。
在一实施例中,参考图26,所述级联单元303,包括:
顺序确定子单元3031,用于确定所述至少两个子感知哈希序列的连接顺序;
序列连接子单元3032,用于基于所述连接顺序,将所述至少两个子感知哈希序列进行序列连接,得到所述待检索图像的感知哈希序列。
在一实施例中,参考图27,所述图像检索装置,还包括:
更新单元309,用于若所述模板序列集中不包括所述感知哈希序列的匹配模板序列时,建立所述感知哈希序列与原始图像的映射关联;根据所述哈希感知序列,对所述模板序列集进行更新。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的图像检索装置中数据提取单元301对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;由生成单元302基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;由级联单元303将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;由匹配单元304将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;由确定单元305基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
该方案可以将复杂的数字图像信息抽象成感知哈希序列,并将图像的检索转化为序列的匹配,使得针对图像的检索在具备了哈希值的抗碰撞性特点与摘要性特点的同时,也保持了对图像的格式变化、明暗变化等多种图像变换操作的鲁棒性,从而大大提高了图像检索的效率。进一步地,本方案可以作为基于内容的图像资源的检索及匹配技术的有益补充,减少了人力消耗并降低了误匹配率。此外,通过本方案进行图像检索,在系统开发中既可以避免人为疏漏导致的工程内图像资源的冗余,又可以精准匹配工程内的图像资源,并减低出现资源引用错误的概率,进而极大地提升了图像检索的效率,以及具备用户界面的系统的开发效率。
此外,本申请实施例还提供一种计算机设备,该计算机设备可以为服务器或终端等设备,如图28所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括有一个或一个以上计算机可读存储介质的存储器401、包括有一个或者一个以上处理核心的处理器402、以及电源403等部件。本领域技术人员可以理解,图28中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
存储器401可用于存储软件程序以及模块,处理器402通过运行存储在存储器401的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器401可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器401还可以包括存储器控制器,以提供处理器402和对存储器401的访问。
处理器402是计算机设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器401内的软件程序和/或模块,以及调用存储在存储器401内的数据,执行计算机设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器402可包括一个或多个处理核心;优选的,处理器402可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器402中。
计算机设备还包括给各个部件供电的电源403(比如电池),优选的,电源可以通过电源管理系统与处理器402逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,计算机设备还可以包括输入单元模块、输出单元模块等,在此不再赘述。具体在本实施例中,计算机设备中的处理器402会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器401中,并由处理器402来运行存储在存储器401中的应用程序,从而实现各种功能,如下:
对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例的计算机设备可以将复杂的数字图像信息抽象成感知哈希序列,并将图像的检索转化为序列的匹配,使得针对图像的检索在具备了哈希值的抗碰撞性特点与摘要性特点的同时,也保持了对图像的格式变化、明暗变化等多种图像变换操作的鲁棒性,从而大大提高了图像检索的效率。进一步地,本方案可以作为基于内容的图像资源的检索及匹配技术的有益补充,减少了人力消耗并降低了误匹配率。此外,通过本方案进行图像检索,在系统开发中既可以避免人为疏漏导致的工程内图像资源的冗余,又可以精准匹配工程内的图像资源,并减低出现资源引用错误的概率,进而极大地提升了图像检索的效率,以及具备用户界面的系统的开发效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种图像检索方法中的步骤。例如,该指令可以执行如下步骤:
对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种图像检索方法中的步骤,因此,可以实现本申请实施例所提供的任一种图像检索方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种图像检索方法、装置及计算机设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种图像检索方法,其特征在于,包括:
对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;
基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;
将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;
将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;
基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
2.根据权利要求1所述的图像检索方法,其特征在于,所述至少两个子感知哈希序列包括第一子感知哈希序列和第二子感知哈希序列;
基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,包括:
基于所述通道数据,确定所述待检索图像在至少一个图像通道上的通道数据分布特征;
对所述通道数据进行灰度化解析,得到所述待检索图像的灰度数据;
基于所述待检索图像的灰度数据,生成所述第一子感知哈希序列;
基于所述待检索图像的通道数据分布特征和所述灰度数据,生成所述第二子感知哈希序列。
3.根据权利要求2所述的图像检索方法,其特征在于,所述图像通道包括颜色通道和透明通道,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;
基于所述通道数据,确定所述待检索图像在至少一个图像通道上的通道数据分布特征,包括:
基于所述颜色通道的通道数据计算所述通道数据的颜色均值与颜色极值,以确定所述待检索图像的颜色数据分布特征;
基于所述透明通道的通道数据计算所述通道数据的透明均值,以确定所述待检索图像的透明数据分布特征;
将所述颜色数据分布特征和所述透明数据分布特征进行组合,得到所述待检索图像的通道数据分布特征。
4.根据权利要求2所述的图像检索方法,其特征在于,所述灰度数据包括所述待检索图像中像素的灰度值;
基于所述待检索图像的灰度数据,生成所述第一子感知哈希序列,包括:
基于所述灰度数据中像素的灰度值,确定所述像素的灰度均值;
将所述灰度数据中各像素的灰度值与所述灰度均值进行比较,以确定所述第一子感知哈希序列中与所述像素对应的感知哈希值;
将所述感知哈希值组成所述第一子感知哈希序列。
5.根据权利要求2所述的图像检索方法,其特征在于,所述通道数据分布特征包括颜色数据分布特征和透明数据分布特征;
基于所述待检索图像的通道数据分布特征和所述灰度数据,生成所述第二子感知哈希序列,包括:
基于所述灰度数据的灰度均值,确定所述待检索图像的灰度分布特征;
将所述颜色数据分布特征,所述透明数据分布特征和所述灰度分布特征进行组合,得到所述第二子感知哈希序列。
6.根据权利要求1所述的图像检索方法,其特征在于,在对待检索图像进行多通道数据提取之前,所述方法还包括:
从原始图像中提取需要进行缩放处理的待缩放图像;
基于所述待缩放图像的当前尺寸,对所述待缩放图像进行图像缩放操作,得到目标尺寸的缩略图像;
对所述缩略图像进行图像数据增强操作,得到待检索图像。
7.根据权利要求6所述的图像检索方法,其特征在于,从原始图像中提取需要进行缩放处理的待缩放图像,包括:
确定所述原始图像的图像检索方式;
基于所述图像检索方式,从所述原始图像中提取需要进行缩放处理的待缩放图像。
8.根据权利要求6所述的图像检索方法,其特征在于,基于所述待缩放图像的当前尺寸,对所述待缩放图像进行缩放操作,得到目标尺寸的缩略图像,包括:
获取所述待缩放图像的当前尺寸;
基于所述当前尺寸,确定所述待缩放图像的缩放比例;
基于所述缩放比例,对所述待缩放图像进行至少一次图像缩放操作,得到目标尺寸的缩略图像。
9.根据权利要求1所述的图像检索方法,其特征在于,将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列的匹配模板序列,包括:
将所述感知哈希序列的感知哈希值与所述模板序列的序列值进行按位比较,得到所述感知哈希序列与所述模板序列的差异位数;
基于所述差异位数与所述感知哈希序列的长度,确定所述感知哈希序列与所述模板序列的匹配结果;
若所述匹配结果小于等于预定的匹配阈值,则确定所述模板序列为所述感知哈希序列的匹配模板序列。
10.根据权利要求6所述的图像检索方法,其特征在于,基于所述匹配模板序列对应的模板图像,确定所述待检索图像的匹配结果图像,包括:
根据所述匹配模板序列的源图标志,确定与所述匹配模板序列对应的模板图像,得到所述原始图像的候选匹配图像;
基于所述匹配模板序列与所述感知哈希序列之间的匹配结果,从所述候选匹配图像中确定所述原始图像的匹配结果图像。
11.根据权利要求10所述的图像检索方法,其特征在于,基于所述匹配模板序列与所述感知哈希序列之间的匹配结果,从所述候选匹配图像中确定所述原始图像的匹配结果图像,包括:
若所述匹配结果不满足预设条件时,从所述原始图像中提取预设尺寸的复核图像,将待检索图像更新为所述复核图像,返回执行对所述待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据的步骤,直至得到所述待检索图像的检索结果图像。
12.根据权利要求1所述的图像检索方法,其特征在于,将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列,包括:
确定所述至少两个子感知哈希序列的连接顺序;
基于所述连接顺序,将所述至少两个子感知哈希序列进行序列连接,得到所述待检索图像的感知哈希序列。
13.根据权利要求1所述的图像检索方法,其特征在于,所述方法还包括:
若所述模板序列集中不包括所述感知哈希序列的匹配模板序列时,建立所述感知哈希序列与原始图像的映射关联;
根据所述哈希感知序列,对所述模板序列集进行更新。
14.一种图像检索装置,其特征在于,包括:
数据提取单元,用于对待检索图像进行多通道数据提取,得到所述待检索图像在至少一个图像通道上的通道数据;
生成单元,用于基于所述通道数据,生成所述待检索图像的至少两个子感知哈希序列,其中,所述子感知哈希序列包括所述待检索图像中像素的感知哈希值;
级联单元,用于将所述至少两个子感知哈希序列级联,得到所述待检索图像的感知哈希序列;
匹配单元,用于将所述感知哈希序列与模板序列集中模板图像的模板序列进行匹配,得到与所述感知哈希序列匹配的匹配模板序列;
确定单元,用于基于所述匹配模板序列对应的模板图像,确定所述待检索图像的检索结果图像。
15.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-13任一项所述方法的步骤。
CN202010489577.9A 2020-06-02 2020-06-02 一种图像检索方法、装置及计算机设备 Active CN111666442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010489577.9A CN111666442B (zh) 2020-06-02 2020-06-02 一种图像检索方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010489577.9A CN111666442B (zh) 2020-06-02 2020-06-02 一种图像检索方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN111666442A true CN111666442A (zh) 2020-09-15
CN111666442B CN111666442B (zh) 2023-04-18

Family

ID=72385447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010489577.9A Active CN111666442B (zh) 2020-06-02 2020-06-02 一种图像检索方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN111666442B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112668672A (zh) * 2021-03-16 2021-04-16 深圳市安软科技股份有限公司 基于TensorRT的目标检测模型加速方法及装置
CN113537388A (zh) * 2021-08-04 2021-10-22 广州四三九九信息科技有限公司 一种基于图层特性的缩放图像模板匹配方法
CN113704532A (zh) * 2020-11-25 2021-11-26 天翼智慧家庭科技有限公司 一种提升图片检索召回率的方法和系统
CN117493603A (zh) * 2023-11-29 2024-02-02 安庆市长三角未来产业研究院 一种用于图像检索的多通道图像哈希方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747254A (zh) * 2014-01-27 2014-04-23 深圳大学 一种基于时域感知哈希的视频篡改检测方法和装置
EP3035213A1 (en) * 2014-12-18 2016-06-22 Thomson Licensing Method and apparatus for deriving a perceptual hash value from an image
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN108631787A (zh) * 2018-05-09 2018-10-09 腾讯科技(深圳)有限公司 数据编码方法、装置、计算机设备及存储介质
CN109902714A (zh) * 2019-01-18 2019-06-18 重庆邮电大学 一种基于多图正则化深度哈希的多模态医学图像检索方法
CN110175248A (zh) * 2019-04-04 2019-08-27 中国科学院信息工程研究所 一种基于深度学习和哈希编码的人脸图像检索方法和装置
CN110309336A (zh) * 2018-03-12 2019-10-08 腾讯科技(深圳)有限公司 图像检索方法、装置、系统、服务器以及存储介质
CN110738236A (zh) * 2019-09-16 2020-01-31 深圳市国信合成科技有限公司 图像匹配方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747254A (zh) * 2014-01-27 2014-04-23 深圳大学 一种基于时域感知哈希的视频篡改检测方法和装置
EP3035213A1 (en) * 2014-12-18 2016-06-22 Thomson Licensing Method and apparatus for deriving a perceptual hash value from an image
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN110309336A (zh) * 2018-03-12 2019-10-08 腾讯科技(深圳)有限公司 图像检索方法、装置、系统、服务器以及存储介质
CN108631787A (zh) * 2018-05-09 2018-10-09 腾讯科技(深圳)有限公司 数据编码方法、装置、计算机设备及存储介质
CN109902714A (zh) * 2019-01-18 2019-06-18 重庆邮电大学 一种基于多图正则化深度哈希的多模态医学图像检索方法
CN110175248A (zh) * 2019-04-04 2019-08-27 中国科学院信息工程研究所 一种基于深度学习和哈希编码的人脸图像检索方法和装置
CN110738236A (zh) * 2019-09-16 2020-01-31 深圳市国信合成科技有限公司 图像匹配方法、装置、计算机设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KHAWAJA TEHSEEN AHMED 等: "convolution,approximation and spatial information based object and color signatures for content based image retrieval", 《2019 INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION SCIENCES (ICCIS)》 *
张慧: "图像感知哈希测评基准及算法研究", 《中国博士学位论文全文数据库 (信息科技辑)》 *
张慧等: "基于人类视觉系统的图像感知哈希算法", 《电子学报》 *
梁中岩 等: "基于多特征融合的车辆检索方法", 《信息化研究》 *
郭佳宇等: "融合颜色特征与词汇树的图像检索", 《小型微型计算机系统》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704532A (zh) * 2020-11-25 2021-11-26 天翼智慧家庭科技有限公司 一种提升图片检索召回率的方法和系统
CN113704532B (zh) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 一种提升图片检索召回率的方法和系统
CN112668672A (zh) * 2021-03-16 2021-04-16 深圳市安软科技股份有限公司 基于TensorRT的目标检测模型加速方法及装置
CN113537388A (zh) * 2021-08-04 2021-10-22 广州四三九九信息科技有限公司 一种基于图层特性的缩放图像模板匹配方法
CN113537388B (zh) * 2021-08-04 2023-08-11 广州四三九九信息科技有限公司 一种基于图层特性的缩放图像模板匹配方法
CN117493603A (zh) * 2023-11-29 2024-02-02 安庆市长三角未来产业研究院 一种用于图像检索的多通道图像哈希方法及系统

Also Published As

Publication number Publication date
CN111666442B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111666442B (zh) 一种图像检索方法、装置及计算机设备
US11507770B2 (en) Precomputed similarity index of files in data protection systems with neural network
CN110245469B (zh) 网页的水印生成方法、水印解析方法、装置及存储介质
JP2004522228A (ja) ディジタル画像を表現し比較する方法
US11714921B2 (en) Image processing method with ash code on local feature vectors, image processing device and storage medium
JP2020525935A (ja) 重複ビデオの判定方法及び装置
CN115630236B (zh) 无源遥感影像的全球快速检索定位方法、存储介质及设备
CN111831844A (zh) 图像检索方法、图像检索装置、图像检索设备及介质
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
CN113516697A (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
US11361189B2 (en) Image generation method and computing device
CN113704276A (zh) 地图更新方法、装置、电子设备及计算机可读存储介质
CN112541902A (zh) 相似区域搜索方法、装置、电子设备及介质
CN116863419A (zh) 一种目标检测模型轻量化的方法、装置、电子设备及介质
US11093474B2 (en) Computer architecture for emulating multi-dimensional string correlithm object dynamic time warping in a correlithm object processing system
US11593582B2 (en) Method and device for comparing media features
CN114881913A (zh) 图像瑕疵检测方法、装置、电子设备及存储介质
CN112232125A (zh) 关键点检测方法和关键点检测模型的训练方法
CN111597375B (zh) 基于相似图片组代表特征向量的图片检索方法及相关设备
US20220375240A1 (en) Method for detecting cells in images using autoencoder, computer device, and storage medium
CN117494248B (zh) 坐标数据处理方法、装置、计算机设备、存储介质
Liu et al. A novel inverted index file based searching strategy for video copy detection
US10657415B2 (en) Image correspondence determining method and apparatus
US10997143B2 (en) Computer architecture for emulating single dimensional string correlithm object dynamic time warping in a correlithm object processing system
CN111008301A (zh) 一种以图搜视频的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40028492

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant