CN115455222A - 图像检索方法、装置、计算机设备和计算机可读存储介质 - Google Patents
图像检索方法、装置、计算机设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN115455222A CN115455222A CN202211126172.4A CN202211126172A CN115455222A CN 115455222 A CN115455222 A CN 115455222A CN 202211126172 A CN202211126172 A CN 202211126172A CN 115455222 A CN115455222 A CN 115455222A
- Authority
- CN
- China
- Prior art keywords
- image
- information
- preset
- retrieval
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种图像检索方法、图像检索装置、计算机设备和计算机可读存储介质。其中,方法包括如下步骤:构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表;将采集图像输入特征提取模型中得到第一特征信息;通过第一特征信息查询映射表,得到检索结果并输出。因此,本申请能够通过建立特征提取模型保证特征信息的统一获取,在检索之前预先建立映射表,则在之后有海量的采集图像输入时,通过息查询映射表确定采集图像的检索结果,从而实现检索的高效化、准确化。
Description
技术领域
本申请属于图像检索技术领域,特别是涉及一种图像检索方法、图像检索装置、计算机设备和计算机可读存储介质。
背景技术
传统的电力图像、视频检索方式被称为基于文本的检索,人们利用人工的方式为图片进行标注,描述图片中所含的关键信息如物体、位置及场景等等。在检索的过程中,人们输入关键词即可从数据库中取出符合关键词描述的图片。这种方式检索效率高但是短板也十分明显。第一,电力图片的标注带有强烈的主观性,检索精度受到标注者的认知语言水平的影响;第二,在海量数据的时代,对上百万量级的数据库进行人工标注已经难以实现,千万亿级数据库中更是无法完成。例如在电力巡检的实施场景中,通常会有无人机对电力设备进行巡检,无人机最后发回的巡检数据包括但不限于图片或视频的形式,而数据量往往是百万甚至于千万级别的。如何从海量的数据中,高效检索到相应的图像数据,是本领域人员亟待解决的技术问题。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
基于此,有必要针对上述问题,提出了一种图像检索方法、图像检索装置、计算机设备和计算机可读存储介质。
本申请解决其技术问题是采用以下的技术方案来实现的:
本申请提供了一种图像检索方法,包括如下步骤:构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表;将采集图像输入特征提取模型中得到第一特征信息;通过第一特征信息查询映射表,得到检索结果并输出。
在本申请一可选实施例中,特征提取模型包括:预处理层,用于通过预设算法将图像信息处理为过滤数值;过滤层,过滤层包括布隆滤波器,用于将过滤数值输入布隆滤波器中,以得到特征信息。
在本申请一可选实施例中,将过滤数值输入布隆滤波器中,以得到特征信息,包括:设定N个第一数组,N为大于或等于1的整数,每个第一数组长度都为预设长度,且第一数组每个位置都为0;确定N个素数,根据每个素数分别建立N个哈希函数;将过滤数值分别根据N个哈希函数进行运算,得到N个计算数值;根据N个计算数值分别对第一数组进行设置,得到N个第二数组;汇总N个第二数组得到图像信息的特征信息。
在本申请一可选实施例中,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表,包括:获取缺陷图像数据库中的所有预设缺陷图像,将每一个预设缺陷图像输入特征提取模型中得到所有预设缺陷图像对应的预设特征信息;根据预设缺陷图像与对应的预设特征信息的映射关系,建立映射表。
在本申请一可选实施例中,通过第一特征信息查询映射表,得到检索结果并输出,包括:将第一特征信息依次与映射表中的预设特征信息进行比较,计算第一特征信息与预设特征信息的近似度;若近似度大于或等于检索近似阈值,则生成检索结果并输出;若近似度小于检索近似阈值,则生成检索失败提示信息并输出。
在本申请一可选实施例中,生成检索结果并输出,包括:根据近似度查询映射表,获取近似度大于或等于检索近似阈值对应的预设缺陷图像;根据预设缺陷图像的图像信息生成检索信息,图像信息包括缺陷信息、拍摄信息、上传信息;生成包括检索信息的检索结果,按照预设缺陷图像对应的近似度的高低排列检索结果并输出,或输出预设缺陷图像对应的近似度最高的检索结果。
在本申请一可选实施例中,将采集图像输入特征提取模型中得到第一特征信息之前,方法包括:当采集图像为视频图像时,从视频图像中提取多个关键帧图像作为采集图像。
本申请还提供了一种图像检索装置,包括:模型构建模块,用于构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;映射表构建模块,用于获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表;特征提取模块,用于将采集图像输入特征提取模型中得到第一特征信息;检索模块,用于通过第一特征信息查询映射表,得到检索结果并输出。
本申请还提供了一种计算机设备,包括处理器和存储器:处理器用于执行存储器中存储的计算机程序以实现如前述的方法。
本申请还提供了一种计算机可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现如前述的方法。
采用本申请实施例,具有如下有益效果:
本申请能够通过建立特征提取模型保证图像都能统一确定为相应的特征信息,在检索之前先根据预设缺陷图像输入特征提取模型建立映射表,则在之后有海量的采集图像输入时,能够根据采集图像的第一特征信息查询映射表确定采集图像的检索结果,从而实现检索的高效化、准确。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为实施例一提供的一种图像检索方法的流程示意图;
图2.1为实施例一提供的布隆过滤器简易流程中的第一数组第一样式示意图;
图2.2为实施例一提供的布隆过滤器简易流程中的第一数组第二样式示意图;
图2.3为实施例一提供的布隆过滤器简易流程中的得到第二数组示意图;
图3为实施例二提供的通过特征提取模型提取图像的特征信息的流程示意图;
图4为实施例三提供的一种根据特征信息进行图像检索的流程示意图;
图5为实施例四提供的一种图像检索装置的结构示意框图;
图6为实施例四提供的一种计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
图1为实施例一提供的一种的流程示意图。为了清楚描述本实施例提供的一种图像检索方法,请参考图1。
检索作为一种在数据处理的过程中最常见的运算,其检索的本质是在一个集合里找到满足一定限定条件的数据对象,检索过程一般会有两种结果:一种是找到符合一定限定条件的对象,便该对象另外的特征信息如表述内容,关键字等;另外一种找不到符合条件的数据对象,就返回检索不成功。然而在电力设备巡检的实施场景中,通常是由无人机对预定区域内的电力设备进行图片或视频的图像信息的采集和获取,之后将多个无人机拍摄的海量图像信息中进行检索,检索出其中有异常的缺陷图片。可以理解的是,电力设备通常有较大区域覆盖面积,因而最终无人机巡检发回的图像信息是百万、甚至于千万的数量级。如何从海量的数据中,高效检索到相应的图像数据,提出了本申请实施例一所提供的图像检索方法,具体包括有步骤S110~S140。
步骤S110:构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息。
在一实施方式中,特征提取模型包括:预处理层,用于通过预设算法将图像信息处理为过滤数值;过滤层,过滤层包括布隆滤波器,用于将过滤数值输入布隆滤波器中,以得到特征信息。
在一实施方式中,本申请实施例所提供的图像检索方法,总的来说可以理解成“以图搜图”的过程。而检索的过程,也即可以是对于输入的图像进行特征提取,再将该特征与数据库中存储的特征进行匹配的过程。数据库中存储的特征又是根据预设的图像进行提取得到的。因此可以看到特征提取是一个重要的环节,为保证输入图像和预设图像提取特征的标注的一致,因此需要建立一个统一的特征提取模型。其中,在本实施方式中的特征提取模型包括有预处理层和过滤层。其中,预处理层是将输入图像进行处理,以处理成预定的数值形成,以便于后续进行计算。其中,对于预设算法可以为通过采用文件校验工具HASH软件对驶入图像进行批量处理提取图像的MD5值,然后对提取的信息进行筛选截取,将截取后的MD5特征值转换成十进制的数,从而将图像的高维特征表示映射为紧致的二维编码,实现了数据降维,降低了搜索的空间复杂度与时间复杂度。此外还可以对图像本身进行处理,可以理解的是,无人机采集某一设备的图像,可能是多方向、多角度进行采集的,并且所采集的距离、画质、图像中设备的显示大小都会有所不同,这些差异都会影响到过滤数值的生成。为此,将图像信息处理为过滤数值之前,还可以对图像信息进行调整。以将图像信息调整为统一的格式,具体的包括但不限于有图像的大小、拍摄对象的角度、相对距离、画面中的显示比例等,从而确保提取特征信息的统一性。之后则是对过滤数值的特征提取,在本申请中则优选的采取布隆过滤器对过滤数值进行特征提取。将过滤数值注入布隆过滤器中,汇总即可得到该输入图像对应的特征信息。
在一实施方式中,将过滤数值输入布隆滤波器中,以得到特征信息,包括:设定N个第一数组,N为大于或等于1的整数,每个第一数组长度都为预设长度,且第一数组每个位置都为0;确定N个素数,根据每个素数分别建立N个哈希函数;将过滤数值分别根据N个哈希函数进行运算,得到N个计算数值;根据N个计算数值分别对第一数组进行设置,得到N个第二数组;汇总N个第二数组得到图像信息的特征信息。
在一实施方式中,布隆过滤器这种高效简洁的数据结构在表示集合和对元素进行检索的同时,虽然能够有效的过滤掉不属于集合内的元素,但是当某个数据元素不属于数据集合时而会被错误的判断是集合中的一员,即存在误判;不过不会出现元素属于集合中却被误判为不属于集合的情况。也即是说,对元素进行检索判断是否在集合中,仅会返回两种结果:“属于集合一员(存在一定误判)”和“不属于集合(绝对正确)”。因此可以得出布隆过滤器是降低检索的正确率来换取时间和空间,虽然这种误判概率是十分低的。为消除布隆过滤器机制本身所会带来的误判率,本申请采取了多个预设长度的布隆过滤器加上素数取模结合的方式用以消除。为便于理解,可以参考图2.1~图2.3,图2.1为实施例一提供的布隆过滤器简易流程中的第一数组第一样式示意图;图2.2为实施例一提供的布隆过滤器简易流程中的第一数组第二样式示意图;图2.3为实施例一提供的布隆过滤器简易流程中的得到第二数组示意图。在图2.1~图2.3中,为便于理解,将N设定为4、预设长度为4。因此以图2.1和图2.2所示,可知第一数组的两种具体形式,可以是数组各自并列,也可以融合成一长串数组,具体可根据实际情况进行设定,在此不做限制。进一步地,确定第二数组的过程则可参考图2.3,首先将预处理层得到得到的过滤数值分别注入多个根据预先确定的素数所构建的哈希函数中,以使得各哈希函数能够进行计算以确定以4个计算数值。根据N个计算数值分别对第一数组进行设置,得到N个第二数组,以图2.3所示,既可以是例如,过滤数值经过哈希函数1计算得到的计算数值为2,则可将哈希函数对应的第一数组中的数组1中的第二个位置设置为0;并且进一步地进行特征提取的过滤数值通常不只有一个,因此如果得到计算数值对应的数组的位置已经设置为1时,则不做任何操作。进一步的,过滤数值则同样根据以上规律分别经过剩余对应的哈希函数进行计算以对第一数组中对应的数组进行设置,从而最后累积汇总得到第二数组,其中特征信息即可以用第二数组来进行表示。此外,图2.3是以图2.1对应的第一数组的第一样式进行说明,对于图2.2对应的第二样式,仅是形式的不同,确定第二数组的过程还是相同的,在此便不再赘述了。并且可以理解的是,图2.1~图2.3所述的数组是为了便于理解的简易化形式,例如数组如果只有4个,则4个过滤数值便可将一个数组填满,误判率极高。因此为使误判率最小,在较佳的实施方式中:N取7,预设长度为108。也即是说包括有7组第一数组,每组长度都为108,且每个数组中的所有位置都为0。进一步地,所需要确定的素数在较佳的实施例中为108以内的最大的7个素数,分别为:99999839、99999847、99999931、99999941、99999959、99999971、99999989,以此作为取模标准以建立哈希函数。因为素数的约数只有1和本身,以素数作为取模标准,取模结果重复的可能会降低,并使每个素数对应一个布隆过滤器。因此,基于本实施方式的流程,采用HASH文件校验工具只需要对图片进行一次MD5值的提取,就可以获取到每张图片唯一的特征值,然后通过多次Hash函数计算,减少多次初始Hash函数值转换带来的运行时间。此外,通过对布隆过滤器数量的设定,其中数组长度的设定以及哈希函数的构建方法的限定,都使得检索结果能够在准确度和计算量之间取得一个较佳的平衡,也即拥有准确度和计算量之间最高的性价比,节省了计算能源也保证检索结果的准确率,有效遏制了布隆过滤器机制上会带来的误差,提高了用户使用体验。
步骤S120:获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表。
在一实施方式中,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表,包括:获取缺陷图像数据库中的所有预设缺陷图像,将每一个预设缺陷图像输入特征提取模型中得到所有预设缺陷图像对应的预设特征信息;根据预设缺陷图像与对应的预设特征信息的映射关系,建立映射表。
在一实施方式中,如前文所述检索的过程也即是特征对比的过程,而预先所要确定的也即是一预设设定好的特征数据库。具体的,本申请在较佳的实施方式中是针对于电力设备巡检设备异常或缺陷的图片检索的实施场景,因此所建立的特征数据库的来源,也即是根据预设缺陷图像确定。其中预设缺陷图像则可以是用户预先设定好的,电力设备如输配电线缺陷或故障的图片,累积而形成的数据库。并且该数据库是可以实时更新的,除用户根据操作手动在数据库中添加或删除外,还可以是在检索过程中,如果输入的检索图像与库内的预设缺陷图像的特征信息近似度高于一定阈值时,表明该检索图像也属于缺陷图像的一种,则可自动将该检索图像添加至预设缺陷图像的数据库中,从而丰富数据库内容。此外,可以理解的是,检索的过程不仅是特征匹配的过程,对于用户而言需要有个明晰直观的检索结果进行输出,也即是说不仅能确定检索图像是否属于预设缺陷图像对应的情况,也即是是否在数据库中,还可以在检索图像属于预设缺陷图像时生成相应的检索结果并输出。而检索结果通常是与检索图像特征信息匹配的预设缺陷图像所包含的信息汇总,例如拍摄的时间、地点、缺陷或故障类型、解决方案等等,也即是说需要确定特征信息与预设缺陷图像的映射关系。因此在本实施方式中,需要在检索之前,将预设缺陷图像输入前文所述的特征提取模型中,按照前文所述的特征提取方法提取出对应的预设特征信息,将所有预设缺陷图像都进行特征提取工作后,即可将预设缺陷图像与对应的预设特征信息的映射关系建立映射表。映射表中除存储有预设缺陷图像与对应的预设特征信息的映射关系外,还可以包括有预设缺陷图像在数据库中的地址信息,如HBase的Rowkey,从而在输出检索结果时,能够快速定位至预设缺陷图像。另外还可以包括有预设缺陷图像的表述信息和相关特征,具体可以不包括但不限于有时间、地点、缺陷或故障类型、解决方案、上传人、上传日期、图片大小、视频大小等等,以为确定检索结果做充分准备,使得检索能够快速输出检索结果。
步骤S130:将采集图像输入特征提取模型中得到第一特征信息。
在一实施方式中,将采集图像输入特征提取模型中得到第一特征信息之前,方法包括:当采集图像为视频图像时,从视频图像中提取多个关键帧图像作为采集图像。
在一实施方式中,采集图像也即是可以无人机巡检过后输入的图像数据。并且可以理解的是,无人机拍摄的采集图像,有可能是视频图像的形式,在此情况下,可以通过关键帧提取方式将每个训练视频转化称若干个关键帧,从而得到采集图像;此外,还可以是用户手动提交的若干图片,例如用户自行拍摄若干图像,通过本申请提供的图像检索方法,确定拍摄的图像是否在对应数据库中,也即是说,获取采集图像的途径不做具体限制。如前文所述,为保证特征提取的统一性,同样将采集图像输入前文所属的特征提取模型中,按照预处理层到包含布隆过滤器的过滤层的处理,得到相应的第一特征信息。
步骤S140:通过第一特征信息查询映射表,得到检索结果并输出。
在一实施方式中,通过第一特征信息查询映射表,得到检索结果并输出,包括:将第一特征信息依次与映射表中的预设特征信息进行比较,计算第一特征信息与预设特征信息的近似度;若近似度大于或等于检索近似阈值,则生成检索结果并输出;若近似度小于检索近似阈值,则生成检索失败提示信息并输出。
在一实施方式中,检索的过程也即是特征对比的过程,在本申请实施方式中,也即是将采集图像的第一特征信息,与映射表中的预设特征信息进行对比的过程。具体的对比过程可以是将第一特征信息逐次与预设表中的所有预设特征信息进行计算,计算第一特征信息逐次与所有预设特征信息的近似度,或说数据距离。并且由前文可知,特征信息可以由第二数组表示,参照图2.3所展示第二数组的形式,即可知道可以通过对比第一特征信息和预设特征信息中每个对应数组中对应位置的数字是否相同,从而确定特征信息是否相同,或近似度的高低。在较佳的实施方式中,由于有7个布隆过滤器,也即每个布隆过滤器对应有一个数组,因此,可以将第一特征信息中的七个数组分别与预设特征信息中的七个数组进行对比,如果相应位置为1,再去依次跟下一个布隆过滤器进行比较,直到七个布隆过滤器对应的位置全部为1,则可确定第一特征信息与预设特征信息是确定关系,也即对应的采集图像属于预设缺陷图像的合集。并且,对比的顺序也可以进行设定,在前文中布隆过滤器对应的哈希函数在较佳的实施方式中是取108以内的最大的7个素数构建的,因此可以按照素数大小顺序排列对应的布隆过滤器以依次进行对比。在其他实施方式中,还可以逐次计算第一特征信息与预设特征信息中各数据的距离,从而确定第一特征信息与预设特征信息的近似度。若近似度大于或等于检索近似阈值,则生成检索结果并输出;若近似度小于检索近似阈值,则生成检索失败提示信息并输出。其中检索近似阈值为用户预先设定的数值,用以确定第一特征信息是否属于预设特征信息所包含的情况。如果第一特征信息与预设特征信息的对比结果不满足以上条件,则可说明对应的采集图像不在预设缺陷图像的集合当中,则可输出检索失败提示信息,告知用户未检索到与采集图像对应的图像。确定全部数组都相同的实施方式属于精准搜索;而通过近似度的设置,使得本申请扩展了模糊搜索的实施方式。通过两种检索方式,使得本申请能够在精准检索到采集图像是否属于预设缺陷图像的情况下,还能够进一步得拓展搜索范围,使得检索结果涵盖情况更广,从而使得能够给人工判定以空间和自由,满足更多的实施场景。
在一实施方式中,生成检索结果并输出,包括:根据近似度查询映射表,获取近似度大于或等于检索近似阈值对应的预设缺陷图像;根据预设缺陷图像的图像信息生成检索信息,图像信息包括缺陷信息、拍摄信息、上传信息;生成包括检索信息的检索结果,按照预设缺陷图像对应的近似度的高低排列检索结果并输出,或输出预设缺陷图像对应的近似度最高的检索结果。
在一实施方式中,检索的过程是确定采集图像是否属于预设缺陷图像的集合的过程,然而这个过程是相对抽象的。对于用户而言,需要得到一个更加确定的结果,也即是检索结果。检索结果的生成过程,也即可以是通过检索确定的预设缺陷图像反推生成检索结果的过程。可以理解的是,预设缺陷图像不仅仅是图像本身,还可以包括有图像信息,其中图像信息可以包括但不限于有缺陷信息、拍摄信息、上传信息,以上信息都能够为进行检索的用户提供更为明确的参考,以便进行更进一步的判断。此外,由于本申请一实施方式提供的图像检索方法中引入了近似度的技术细节,也即是说每一最终确定满足检索近似阈值的预设缺陷图像所生成的检索结果,实际上都对应有一近似度。因此在输出检索结果时,可以按照对应的近似度的高低排列相应的检索结果,使得用户能够优先查询近似度最高的检索结果,对于本实施方式尤其针对于模糊检索的实施场景,使得用户有更多人为判断的空间或自由;还可以是仅输出近似度最高的检索结果,此实施方式更优于应用与精确检索的场景中,使得用户能够更明确检索结果的正确与否。
因此,本申请能够通过建立特征提取模型保证特征信息的统一获取,在检索之前预先建立映射表,则在之后有海量的采集图像输入时,通过息查询映射表确定采集图像的检索结果,从而实现检索的高效化、准确化。
实施例二
图3为实施例二提供的通过特征提取模型提取图像的特征信息的流程示意图。为了清楚描述本实施例提供的通过特征提取模型提取图像的特征信息的流程,请参考图1~图3,包括有步骤S210~S240。
步骤S210:预处理层通过预设算法将图像信息处理为过滤数值。
在一实施方式中,对于预处理层中的算法,可以为通过采用文件校验工具HASH软件对驶入图像进行批量处理提取图像的MD5值,然后对提取的信息进行筛选截取,将截取后的MD5特征值转换成十进制的数,从而将图像的高维特征表示映射为紧致的二维编码,实现了数据降维,降低了搜索的空间复杂度与时间复杂度。此外还可以对图像本身进行处理,可以理解的是,无人机采集某一设备的图像,可能是多方向、多角度进行采集的,并且所采集的距离、画质、图像中设备的显示大小都会有所不同,这些差异都会影响到过滤数值的生成。为此,将图像信息处理为过滤数值之前,还可以对图像信息进行调整。以将图像信息调整为统一的格式,具体的包括但不限于有图像的大小、拍摄对象的角度、相对距离、画面中的显示比例等,从而确保提取特征信息的统一性。
步骤S220:设定N个第一数组,N为大于或等于1的整数,每个第一数组长度都为预设长度,且第一数组每个位置都为0;确定N个素数,根据每个素数分别建立N个哈希函数。
在一实施方式中,布隆过滤器这种高效简洁的数据结构在表示集合和对元素进行检索的同时,虽然能够有效的过滤掉不属于集合内的元素,但是当某个数据元素不属于数据集合时而会被错误的判断是集合中的一员,即存在误判;不过不会出现元素属于集合中却被误判为不属于集合的情况。也即是说,对元素进行检索判断是否在集合中,仅会返回两种结果:“属于集合一员(存在一定误判)”和“不属于集合(绝对正确)”。因此可以得出布隆过滤器是降低检索的正确率来换取时间和空间,虽然这种误判概率是十分低的。为消除布隆过滤器机制本身所会带来的误判率,本申请采取了多个预设长度的布隆过滤器加上素数取模结合的方式用以消除。为使误判率最小,在较佳的实施方式中:N取7,预设长度为108。也即是说先设置7组第一数组,每组长度都为108,且每个数组中的所有位置都为0。进一步地,所需要确定的素数在较佳的实施例中为108以内的最大的7个素数,分别为:99999839、99999847、99999931、99999941、99999959、99999971、99999989,以此作为取模标准以建立哈希函数。因为素数的约数只有1和本身,以素数作为取模标准,取模结果重复的可能会降低,并使每个素数对应一个布隆过滤器。
步骤S230:将过滤数值分别根据N个哈希函数进行运算,得到N个计算数值;根据N个计算数值分别对第一数组进行设置,得到N个第二数组。
步骤S240:汇总N个第二数组得到图像信息的特征信息。
在一实施方式中,大致计算过程可以参考图2.3所示的简易流程,将过滤数值注入对应的哈希函数中,通过计算会得到一个计算数值。根据该计算数值去查看对应的数组中对应位置是否为1,如果是0则将其设置为1;如果是1的花就不改变其值。通过一个哈希函数设置完一个对应数组后,再按照同样的方法设置第一数组中的下一个数组,直至N个哈希函数和对一个的数组都设置完毕。再将设置得到的N个第二数组按照预设的形式汇总,即可得到图像信息的特征信息。
因此,基于本实施方式的流程,采用HASH文件校验工具只需要对图片进行一次MD5值的提取,就可以获取到每张图片唯一的特征值,然后通过多次Hash函数计算,减少多次初始Hash函数值转换带来的运行时间。此外,通过对布隆过滤器数量的设定,其中数组长度的设定以及哈希函数的构建方法的限定,都使得检索结果能够在准确度和计算量之间取得一个较佳的平衡,也即拥有准确度和计算量之间最高的性价比,节省了计算能源也保证检索结果的准确率,有效遏制了布隆过滤器机制上会带来的误差,提高了用户使用体验。
实施例三
图4为实施例三提供的一种根据特征信息进行图像检索的流程示意图。清楚描述本实施例提供的根据特征信息进行图像检索的流程,请参考图1~图4,包括有步骤S310~步骤S340。
步骤S310:将第一特征信息依次与映射表中的预设特征信息进行比较,计算第一特征信息与预设特征信息的近似度
在一实施方式中,对于第一特征心和预设特征信息都是将图像输入特征提取模型,经过特征提取模型处理,将图像的高维特征表示映射为紧致的二维编码,实现了数据降维,降低了搜索的空间复杂度与时间复杂度。具体的确定过程已经在本申请实施例一及实施例二中有了详细描述,具体请参考前文,在此不再赘述。此外第一特征信息和预设特征信息的区别在于,输入特征提取模型的数据不同:第一特征信息对应的是需要进行检索的采集图像;预设特征信息则是根据数据库中的预设缺陷图像生成的,对于此差异同样在前文中有了详细描述,在此不再赘述。另外,近似度可以理解为数据的距离,并且由前文可知,特征信息可以由第二数组表示,参照图2.3所展示第二数组的形式,即可知道可以通过对比第一特征信息和预设特征信息中每个对应数组中对应位置的数字是否相同,从而确定特征信息是否相同,或近似度的高低。在较佳的实施方式中,由于有7个布隆过滤器,也即每个布隆过滤器对应有一个数组,因此,可以将第一特征信息中的七个数组分别与预设特征信息中的七个数组进行对比,如果相应位置为1,再去依次跟下一个布隆过滤器进行比较,直到七个布隆过滤器对应的位置全部为1,则可确定第一特征信息与预设特征信息是确定关系,也即对应的采集图像属于预设缺陷图像的合集。并且,对比的顺序也可以进行设定,在前文中布隆过滤器对应的哈希函数在较佳的实施方式中是取108以内的最大的7个素数构建的,因此可以按照素数大小顺序排列对应的布隆过滤器以依次进行对比。在其他实施方式中,还可以逐次计算第一特征信息与预设特征信息中各数据的距离,从而确定第一特征信息与预设特征信息的近似度。
步骤S320:判断近似度是否低于检索近似阈值;
若近似度大于或等于检索近似阈值,则执行步骤S330:生成检索结果并输出;
若近似度小于检索近似阈值,则执行步骤S340:生成检索失败提示信息并输出。
在一实施方式中,其中检索近似阈值为用户预先设定的数值,用以确定第一特征信息是否属于预设特征信息所包含的情况。如果第一特征信息与预设特征信息的对比结果不满足以上条件,则可说明对应的采集图像不在预设缺陷图像的集合当中,则可输出检索失败提示信息,告知用户未检索到与采集图像对应的图像。
在一实施方式中,生成检索结果并输出,包括:根据近似度查询映射表,获取近似度大于或等于检索近似阈值对应的预设缺陷图像;根据预设缺陷图像的图像信息生成检索信息,图像信息包括缺陷信息、拍摄信息、上传信息;生成包括检索信息的检索结果,按照预设缺陷图像对应的近似度的高低排列检索结果并输出,或输出预设缺陷图像对应的近似度最高的检索结果。
在一实施方式中,检索的过程是确定采集图像是否属于预设缺陷图像的集合的过程,然而这个过程是相对抽象的。对于用户而言,需要得到一个更加确定的结果,也即是检索结果。检索结果的生成过程,也即可以是通过检索确定的预设缺陷图像反推生成检索结果的过程。可以理解的是,预设缺陷图像不仅仅是图像本身,还可以包括有图像信息,其中图像信息可以包括但不限于有缺陷信息、拍摄信息、上传信息,以上信息都能够为进行检索的用户提供更为明确的参考,以便进行更进一步的判断。此外,由于本申请一实施方式提供的图像检索方法中引入了近似度的技术细节,也即是说每一最终确定满足检索近似阈值的预设缺陷图像所生成的检索结果,实际上都对应有一近似度。因此在输出检索结果时,可以按照对应的近似度的高低排列相应的检索结果,使得用户能够优先查询近似度最高的检索结果,对于本实施方式尤其针对于模糊检索的实施场景,使得用户有更多人为判断的空间或自由;还可以是仅输出近似度最高的检索结果,此实施方式更优于应用与精确检索的场景中,使得用户能够更明确检索结果的正确与否。
因此,本申请在图像检索,输出检索结果的过程中提出了两种搜索模式:确定全部数组都相同的实施方式属于精准搜索;而通过近似度的设置,使得本申请扩展了模糊搜索的实施方式。通过两种检索方式,使得本申请能够在精准检索到采集图像是否属于预设缺陷图像的情况下,还能够进一步得拓展搜索范围,使得检索结果涵盖情况更广,从而使得能够给人工判定以空间和自由,满足更多的实施场景。
实施例四
图5为实施例四提供的一种图像检索装置的结构示意框图。图像检索装置50,包括:模型构建模块A510,用于构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;映射表构建模块A520,用于获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表;特征提取模块A530,用于将采集图像输入特征提取模型中得到第一特征信息;检索模块A540,用于通过第一特征信息查询映射表,得到检索结果并输出。
图6示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像检索方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行年龄识别方法。本领域技术人员可以理解,图X中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:步骤S110:构建特征提取模型,特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;步骤S120:获取预设缺陷图像,将预设缺陷图像输入特征提取模型中得到预设缺陷图像的预设特征信息,建立预设缺陷图像与预设特征信息的映射表;步骤S130:将采集图像输入特征提取模型中得到第一特征信息;步骤S140:通过第一特征信息查询映射表,得到检索结果并输出。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如实施例一、实施例二=或实施例三所描述的方法、流程的步骤。
因此,本申请能够通过建立特征提取模型保证特征信息的统一获取,在检索之前预先建立映射表,则在之后有海量的采集图像输入时,通过息查询映射表确定采集图像的检索结果,从而实现检索的高效化、准确化。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像检索方法,其特征在于,包括如下步骤:
构建特征提取模型,所述特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;
获取预设缺陷图像,将所述预设缺陷图像输入所述特征提取模型中得到所述预设缺陷图像的预设特征信息,建立所述预设缺陷图像与所述预设特征信息的映射表;
将采集图像输入所述特征提取模型中得到第一特征信息;
通过所述第一特征信息查询所述映射表,得到检索结果并输出。
2.如权利要求1所述的图像检索方法,其特征在于,所述特征提取模型包括:
预处理层,用于通过预设算法将所述图像信息处理为过滤数值;
过滤层,所述过滤层包括布隆滤波器,用于将所述过滤数值输入所述布隆滤波器中,以得到所述特征信息。
3.如权利要求2所述的图像检索方法,其特征在于,所述将所述过滤数值输入所述布隆滤波器中,以得到所述特征信息,包括:
设定N个第一数组,N为大于或等于1的整数,每个所述第一数组长度都为预设长度,且所述第一数组每个位置都为0;确定N个素数,根据每个所述素数分别建立N个哈希函数;
将所述过滤数值分别根据所述N个所述哈希函数进行运算,得到N个计算数值;
根据所述N个计算数值分别对所述第一数组进行设置,得到N个第二数组;
汇总所述N个第二数组得到所述图像信息的所述特征信息。
4.如权利要求1所述的图像检索方法,其特征在于,所述将所述预设缺陷图像输入所述特征提取模型中得到所述预设缺陷图像的预设特征信息,建立所述预设缺陷图像与所述预设特征信息的映射表,包括:
获取缺陷图像数据库中的所有预设缺陷图像,将每一个所述预设缺陷图像输入所述特征提取模型中得到所有预设缺陷图像对应的预设特征信息;
根据所述预设缺陷图像与对应的预设特征信息的映射关系,建立所述映射表。
5.如权利要求1所述的图像检索方法,其特征在于,所述通过所述第一特征信息查询所述映射表,得到检索结果并输出,包括:
将所述第一特征信息依次与所述映射表中的所述预设特征信息进行比较,计算所述第一特征信息与所述预设特征信息的近似度;
若所述近似度大于或等于检索近似阈值,则生成所述检索结果并输出;
若所述近似度小于所述检索近似阈值,则生成检索失败提示信息并输出。
6.如权利要求5所述的图像检索方法,其特征在于,所述生成所述检索结果并输出,包括:
根据所述近似度查询所述映射表,获取所述近似度大于或等于检索近似阈值对应的预设缺陷图像;
根据所述预设缺陷图像的图像信息生成检索信息,所述图像信息包括缺陷信息、拍摄信息、上传信息;
生成包括所述检索信息的检索结果,按照所述预设缺陷图像对应的所述近似度的高低排列所述检索结果并输出,或输出所述预设缺陷图像对应的所述近似度最高的检索结果。
7.如权利要求1所述的图像检索方法,其特征在于,所述将采集图像输入所述特征提取模型中得到第一特征信息之前,所述方法包括:
当所述采集图像为视频图像时,从所述视频图像中提取多个关键帧图像作为所述采集图像。
8.一种图像检索装置,其特征在于,包括:
模型构建模块,用于构建特征提取模型,所述特征提取模型用于将输入图像的图像信息转换为低维度的特征信息;
映射表构建模块,用于获取预设缺陷图像,将所述预设缺陷图像输入所述特征提取模型中得到所述预设缺陷图像的预设特征信息,建立所述预设缺陷图像与所述预设特征信息的映射表;
特征提取模块,用于将采集图像输入所述特征提取模型中得到第一特征信息;
检索模块,用于通过所述第一特征信息查询所述映射表,得到检索结果并输出。
9.一种计算机设备,其特征在于,包括处理器和存储器:
所述处理器用于执行所述存储器中存储的计算机程序以实现如权利要求1到7中任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1到7中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211126172.4A CN115455222A (zh) | 2022-09-16 | 2022-09-16 | 图像检索方法、装置、计算机设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211126172.4A CN115455222A (zh) | 2022-09-16 | 2022-09-16 | 图像检索方法、装置、计算机设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115455222A true CN115455222A (zh) | 2022-12-09 |
Family
ID=84304940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211126172.4A Pending CN115455222A (zh) | 2022-09-16 | 2022-09-16 | 图像检索方法、装置、计算机设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115455222A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576425A (zh) * | 2024-01-17 | 2024-02-20 | 南京掌控网络科技有限公司 | 一种窜拍图像检测的方法和系统 |
-
2022
- 2022-09-16 CN CN202211126172.4A patent/CN115455222A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576425A (zh) * | 2024-01-17 | 2024-02-20 | 南京掌控网络科技有限公司 | 一种窜拍图像检测的方法和系统 |
CN117576425B (zh) * | 2024-01-17 | 2024-04-16 | 南京掌控网络科技有限公司 | 一种窜拍图像检测的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110866491B (zh) | 目标检索方法、装置、计算机可读存储介质和计算机设备 | |
CN110162665B (zh) | 视频搜索方法、计算机设备及存储介质 | |
CN111708794B (zh) | 基于大数据平台的数据比对方法、装置和计算机设备 | |
CN111625540A (zh) | 一种关系型数据库数据同步完整性校验方法和装置 | |
CN111368867B (zh) | 档案归类方法及系统、计算机可读存储介质 | |
CN110659282A (zh) | 数据路由的构建方法、装置、计算机设备和存储介质 | |
CN115455222A (zh) | 图像检索方法、装置、计算机设备和计算机可读存储介质 | |
CN110059077A (zh) | 一种数据核对方法、装置、设备和存储介质 | |
CN115827922B (zh) | 基于风电数据的可视化分析处理方法、系统和计算机设备 | |
CN111294613A (zh) | 一种视频处理方法、客户端、服务器 | |
CN112148920A (zh) | 数据管理方法 | |
CN116070149A (zh) | 基于人工智能的数据分析方法、系统及云平台 | |
CN111597444B (zh) | 一种搜索方法、装置、服务器、存储介质 | |
CN115391596A (zh) | 视频档案生成方法、装置及存储介质 | |
CN111340580B (zh) | 房型的确定方法、装置、计算机设备和存储介质 | |
CN111522941B (zh) | 文本聚类方法、装置、电子设备及计算机存储介质 | |
CN111294610B (zh) | 一种视频处理方法及装置 | |
CN117274110B (zh) | 一种基于生成式人工智能与图神经网络的影像优化方法 | |
CN117473200B (zh) | 一种用于网站信息数据的综合采集分析方法 | |
CN113887718B (zh) | 一种基于相对激活率的通道剪枝方法和装置及轻量级流量特征提取网络模型简化的方法 | |
CN112866504B (zh) | 一种空三加密方法和系统 | |
CN112866692B (zh) | 一种基于hevc的编码单元划分方法、装置及电子设备 | |
CN113987250A (zh) | 一种适用于大规模图像库的相似图像检索方法及装置 | |
CN112579809A (zh) | 一种数据处理方法和相关装置 | |
CN117094316A (zh) | 日志模板提取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |