CN110275970A - 图像检索的方法、装置、服务器及存储介质 - Google Patents

图像检索的方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110275970A
CN110275970A CN201910544073.XA CN201910544073A CN110275970A CN 110275970 A CN110275970 A CN 110275970A CN 201910544073 A CN201910544073 A CN 201910544073A CN 110275970 A CN110275970 A CN 110275970A
Authority
CN
China
Prior art keywords
similarity
image
row chain
selection
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910544073.XA
Other languages
English (en)
Other versions
CN110275970B (zh
Inventor
张存义
袁勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910544073.XA priority Critical patent/CN110275970B/zh
Publication of CN110275970A publication Critical patent/CN110275970A/zh
Application granted granted Critical
Publication of CN110275970B publication Critical patent/CN110275970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本公开是关于一种图像检索的方法,方法包括:接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。采用本方法,可以减少图像检索的时延。

Description

图像检索的方法、装置、服务器及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种图像检索的方法、装置、服务器及存储介质。
背景技术
随着大数据的发展,图像、视频等数据量呈爆发式增长。在多达数十亿,甚至数百亿的数据中,如何检索出与目标图像最为相似的数据,也就成了一个热点问题。
目前,常用的视频、图像等的检索方法一般会将检索与目标图像最为相似的图像的问题,转换为检索与目标图像的目标特征向量距离相近的特征向量的问题。此类算法流程一般可以如下。首先要对海量数据对应的特征向量,使用聚类算法,分为多个类,每类有一个聚类中心,该聚类中心是一个高维向量,以下将其称为类中心向量。这样,属于每个类的特征向量组成了一个特征向量集合(该向量集合一般可称为倒排链)。然后,计算出目标图像的目标特征向量到各倒排链的类中心向量的距离,根据距离由小到大的顺序,选取出距离最小对应的预设数目个倒排链。接下来,进行倒排链粗排,即在确定出的每个倒排链上选取出与目标图像的目标特征向量距离小于预设距离阈值的所有特征向量。最后,再对选取的特征向量进行精排排序,即将选取的特征向量向量按照与目标特征向量的距离由小到大进行排序,再进行后续处理。
在实现本公开的过程中,申请人发现相关技术至少存在以下问题:
上述检索方法中对于确定出的每个倒排链都使用同一预设距离阈值来选取特征向量,这样可能会出现以下问题,如果某个倒排链中的特征向量与目标特征向量的距离都比较小,那么,很有可能会将该倒排链上的特征向量都选取出来,会导致最终选取出的特征向量过多,导致后续的排序计算量过大,产生较大延时。
发明内容
本公开提供一种图像检索的方法,能够克服相关数据方法中时延大的问题。
根据本公开实施例的第一方面,提供一种图像检索的方法,包括:
接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;
确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;
基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
可选的,所述确定所述多个类中心向量分别对应的倒排链之后,还包括:
在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量;
确定每个倒排链中的各抽样图像特征向量与所述目标图像特征向量的相似度,组成每个倒排链对应的相似度集合;
所述基于所述选取比例系数,以及每个倒排链中各图像特征向量对应的相似度的大小,在每个倒排链中,选取图像特征向量,包括:
在每个倒排链对应的相似度集合中,基于所述相似度集合中各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值;
在每个倒排链中,选取与目标图像特征向量的相似度大于所述倒排链的选取相似度阈值的图像特征向量。
可选的,所述基于各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值,包括:
将所述选取比例系数乘以所述第一预设数目,得到选取顺序值;
对所述相似度集合中各相似度按照从大到小的顺序进行排序,在排序后的相似度中,确定所述选取顺序值对应的相似度,作为所述相似度集合对应的倒排链的选取相似度阈值。
可选的,所述确定选取比例系数,包括:
确定所述检索请求对应的目标业务类型;
基于预先存储的业务类型与选取比例系数的对应关系,确定所述目标业务类型对应的选取比例系数。
可选的,所述基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈,包括:
在选取的所有图像特征向量中,确定对应的相似度最大的第二预设数目个图像特征向量,基于所述第二预设数目个图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
可选的,所述相似度为欧氏距离。
根据本公开实施例的第二方面,提供一种数据检索的装置,包括:
确定模块,用于接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;
选取模块,用于确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;
反馈模块,用于基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
可选的,所述装置,还包括:
抽样模块,用于在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量,确定每个倒排链中的各抽样图像特征向量与所述目标图像特征向量的相似度,组成每个倒排链对应的相似度集合;
所述选取模块,用于:
在每个倒排链对应的相似度集合中,基于所述相似度集合中各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值,在每个倒排链中,选取与目标图像特征向量的相似度大于所述倒排链的选取相似度阈值的图像特征向量。
可选的,所述选取模块,用于:
将所述选取比例系数乘以所述第一预设数目,得到选取顺序值,对所述相似度集合中各相似度按照从大到小的顺序进行排序,在排序后的相似度中,确定所述选取顺序值对应的相似度,作为所述相似度集合对应的倒排链的选取相似度阈值。
可选的,所述选取模块,用于:
确定所述检索请求对应的目标业务类型,基于预先存储的业务类型与选取比例系数的对应关系,确定所述目标业务类型对应的选取比例系数。
可选的,所述反馈模块,用于:
在选取的所有图像特征向量中,确定对应的相似度最大的第二预设数目个图像特征向量,基于所述第二预设数目个图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
可选的,所述相似度为欧氏距离。
根据本公开实施例的第三方面,提供一种服务器,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的图像检索的方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由图像检索的服务器的处理器执行时,使得数据检索的服务器能够执行如第一方面所述的图像检索的方法。
根据本公开实施例的第五方面,提供一种应用程序,当应用程序在图像检索的服务器中运行时,使得图像检索的服务器能够执行如第一方面所述的图像检索的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
在所有的倒排链的类中心向量中,确定出多个满足预设相似度条件的类中心向量,再确定出这些类中心向量分别对应的倒排链。由于每个倒排链中的图像特征向量与该倒排链的类中心向量的相似度都较高,则由此确定出的倒排链中的特征向量与目标图像特征向量的相似度也应该相对较高,这样就没有必要从全部的倒排链中选取特征向量了,节省了检索时间。再确定一个选取比例系数,根据该选取比例系数在这些倒排链中选取图像特征向量。可见,每条倒排链中选取的图像特征向量都是依据这个选取比例系数选取的,不会出现,把一个倒排链里的图像特征向量都选取出来的情况,这样选取出的图像特征向量数目也就不会过大,则后续计算量就相对较小,产生的时延也就较小。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种图像检索的方法的流程图。
图2是根据一示例性实施例示出的一种图像检索的装置的结构示意图。
图3是根据一示例性实施例示出的一种服务器的结构示意图流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本公开的示例性实施例提供了一种图像检索的方法,该方法可以服务器实现。采用该方法可以检索的图像可以为视频、图片等。图像检索的应用十分广泛,用户在终端输入想要检索的图像,并触发检索,终端便向服务器发送检索请求,此时,服务器可以基于本申请实施例提供的方法进行检索,以向终端反馈与检索的图像相似度较高的图像。具体应用程序场景可以如下:
对于检索图片来说,可以为购物应用程序,用户在购物应用程序的搜索栏中输入想要搜索的物品图片,并进行搜索,终端会向后台用于检索的服务器发送该物品图片检索请求,服务器可以基于本申请实施例提供的方法进行检索,并向终端返回与该物品图片相似度较高的一些物品图片,同时可以返回这些物品对应的购买链接等信息。对于视频检索来说,可以为短视频应用程序,服务器获取用户经常观看的短视频,然后,可以基于本申请实施例提供的方法对该短视频进行检索,并向终端与该短视频相似度较高的一些短视频,终端可以在应用程序的推荐页面进行展示。
图1是根据一示例性实施例示出的一种图像检索方法的流程图,如图1所示,图像检索方法用于服务器中,包括以下步骤。
在步骤S101中,接收携带有目标图像的检索请求,确定与目标图像的目标特征向量满足预设相似度条件的多个类中心向量,确定满足预设相似度条件的多个类中心向量分别对应的倒排链。
其中,目标图像可以为视频、图片等。
在实施中,用户在终端可以在终端输入要检索的图像,例如,一些购物应用程序中,用户可以输入物品图片进行检索。另外,终端还可以按照预设周期或者其他一些触发条件,向服务器发送需要检索的图像,例如,一些短视频应用程序,终端可以在用户观看某短视频后,请求服务器对该短视频进行检索。终端向服务器检索请求服务器接收检索请求,该检索请求中可以携带有目标图像。然后,服务器对于接受到的图像进行特征提取,以确定出目标图像对应的目标图像特征向量。对于目标图像是图片的情况,目标图像对应的目标图像特征向量即为该图片的特征向量。对于目标图像是视频的情况,可以在该目标图像中选取出多帧图像,分别确定出这多帧图像对应的特征向量,将这些特征向量均作为目标图像对应的目标图像特征向量,即对于目标图像是视频的情况,目标图像可以对应有多个目标特征向量。
确定出目标图像对应的目标特征向量与数据库中的所有倒排链的类中心向量间的相似度。然后,从所有的类中心向量中确定出来多个与目标特征向量满足预设相似度条件的类中心向量,进一步的,确定出这些类中心向量对应的倒排链。
此处相似度可以用欧氏距离表达,则上述确定多个类中心向量的过程可以为如下。计算目标图像对应的目标图像特征向量与数据库所有倒排链的类中心向量的欧氏距离。然后,在所有类中心向量中确定出与目标图像特征向量的欧式距离最小的多个类中心向量,具体要确定出多少个类中心向量可以根据实际需求进行设置,例如,可以确定出出与目标图像特征向量的欧式距离最小的3个类中心向量。
在步骤S102中,确定选取比例系数,基于该选取比例系数,以及每个倒排链中各图像特征向量与目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量。
在实施中,确定出一个选取比例系数,该选取比例系数对于上述步骤确定出的倒排链均适用。此处,需要说明的是,确定选取比例系数的处理,可以在接收到检索请求后进行,也可以在确定出多个倒排链后进行,本实施例对此不做限定。该选取比例系数可以为0.1到0.8间的数值。
在上述确定出多个倒排链后,可以先确定出每个倒排链中的各图像特征向量与目标图像特征向量的相似度。然后,使用该选取比例系数乘以分别乘以倒排链中图像特征向量的数目,即为每个倒排链分别对应的要选取图像特征向量的数目。在每个倒排链中按照的各图像特征向量与目标图像特征向量的相似度大小,从大到小选取出上述确定出的要选取图像特征向量的数目个图像特征向量。例如,确定出了3个倒排链分别为倒排链1、倒排链2和倒排链3,选取比例系数为0.6,倒排链1中有图像特征向量1万个,则可以在该倒排链1中选取6千个图像特征向量,倒排链2中有图像特征向量5千个,则可以在该到倒排链2中选取3千个图像特征向量,倒排链2中有图像特征向量2万个,则可以在该到倒排链3中选取1.2万个图像特征向量,则在三个倒排链中总共选取出了2.3万个图像特征向量。
需要说明的是,如果上述图像特征向量与目标图像特征向量的相似度用欧氏距离表达的话,则欧式距离越大表示相似度越小,反之,欧式距离越小,相似度越大。
在一种可能的实施方式中,可以根据检索请求的业务类型确定选取比例系数,相应的,在步骤S102中的处理可以如下:确定检索请求对应的目标业务类型;基于预先存储的业务类型与选取比例系数的对应关系,确定目标业务类型对应的选取比例系数。
在实施中,技术人员可以预先建立一个检索的业务类型和选取比例系数的对应关系表并存储,具体形式可以如下表1。
表1
业务类型 选取比例系数
业务类型1 0.2
业务类型2 0.5
业务类型3 0.6
技术人员在建立该对应关系表时,可以基于相应的业务对于时延的要求、对于要检索得到的数据量的要求等来综合确定。例如,如果某种业务类型对于时延要求较高,则相应的该业务类型对应的选取比例系数可以相对较小,如果某种业务类型对于要检索到数据量需要很大,则相应的该业务类型对应的选取比例系数可以相对较大。
这样,检索请求的还可以携带有目标业务标识,在接收到检索请求后,根据目标业务标识确定出对应的目标业务类型,根据目标业务类型在业务类型和选取比例系数对应关系表中,确定出目标业务类型对应的选取比例系数。
在一种可能的实施方式中,为了使检索的时延更小,可以采用抽样的方式确定每个倒排链中选取图像特征向量的数目,相应的,在步骤S101确定出多个倒排链之后,可以进行如下处理:在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量。确定每个倒排链中的各抽样图像特征向量与目标图像特征向量的相似度,组成每个倒排链对应的相似度集合。
在一种可能的实施方式中,可以采用随机抽样的方式,在每个倒排链中确定出第一预设数目的图像特征向量,作为抽样图像特征向量。该第一预设数目的设置,技术人员可以根据经验进行设置,即,使确定出的抽样图像特征向量既不会因为过多而增大时延,也不会因为过小而无法表征该倒排链中图像特征向量的分布。在每个倒排链中确定出第一预设数目个抽样图像特征向量后,可以确定出每个抽样图像特征向量与目标图像特征向量的相似度,组成相似度集合。同样的,这里的相似度也可以使用欧式距离来表示。
相应的,在步骤S102中可以进行如下处理:在每个倒排链对应的相似度集合中,基于对应的相似度集合中各相似度的大小,确定选取比例系数对应的抽样相似度,作为相似度集合对应的倒排链的选取相似度阈值,在每个倒排链中,选取与目标图像特征向量的相似度大于倒排链的选取相似度阈值的图像特征向量。
在实施中,可以使用选取比例系数乘以第一预设数目,得到选取顺序值。然后,在每个倒排链对应的相似度集合中,将该相似度集合中的各相似度按照从大到小的顺序进行排序,在排序后的相似度中,确定选取顺序值对应的相似度,作为所述相似度集合对应的倒排链的选取相似度阈值。同样的,相似度可以用欧式距离表达,则上述按照相似度从大到小的顺序进行排序,可以为按照欧式距离从小到大的顺序进行排序。下面对上述过程进行举例说明。
例如,对于确定出的倒排链1,其对应的相似度集合中有5千个图像特征向量对应的相似度,选取比例系数为0.5,第一预设数目为1千,则选取顺序值为0.5×1000,即500。那么,在该倒排链1对应的相似度集合中确定出第500大的相似度为选取相似度阈值。
然后,在每个倒排链中,选取出与目标图像特征向量的相似度大于该倒排链对应的选取相似度阈值的图像特征向量。
此处在确定选取相似度阈值时,还可以采用建立倒排链对应的相似度分布的方法,具体的可以如下。根据每个倒排链对应的相似度集合,建立该倒排链对应的相似度分布。可以使用多维的数组进行统计分布,由于倒排链中的图像特征向量与目标图像特征向量的相似度在0到1之间,如果统计分布采用相似度精度为0.01,则相似度在0到1之间有100个取值。在相似度集合中,将所有的相似度分别均归到精度为0.01的相似度分布中的,例如,相似度为0.321,则将其归为0.32中。这样,在相似度分布中,可以统计有0到1之间精度为0.01的100个目标相似度中,每个目标相似度对应有多少个相似度集合中的相似度(可以称为统计个数),例如,在相似度集合中有0.312、0315、0.313和0.318,则在相似度分布中0.31对应的统计个数为4。在相似度分布中是按照相似度由大到小进行排序的,即依次统计有0.00对应的统计个数、0.01对应的统计个数,依次类推,直到0.99对应的统计个数。这样,根据确定出的选取顺序值,在该分布中确定出一个目标相似度,作为选取相似度阈值,例如,选取顺序值为25,将0.00对应统计个数到0.11对应的统计个数,进行累加等于22,0.00对应统计个数到0.12对应的统计个数,进行累加等于26,则选取顺序值落在了目标相似度为0.12对应的统计个数上,则将0.12确定为选取相似度阈值。
在步骤S103中,基于选取的图像特征向量,确定反馈图像,基于反馈图像,对检索请求进行反馈。
在实施中,可以在选取的所有图像特征向量中,确定对应的相似度最大的第二预设数目个图像特征向量,然后,确定出第二预设数目的图像特征向量对应的图像,将这些图像可以分次或者一次返回给发送检索请求的客户端。此处的第二预设数目可以为技术人员根据实际需求确定出的值。如果想要返回的图像多些,该第二预设数目则设置的较大,反之,如果想要返回的图像少些,该第二预设数目则设置的较小。
通过上述方法,在所有的倒排链的类中心向量中,确定出多个满足预设相似度条件的类中心向量,再确定出这些类中心向量分别对应的倒排链。由于每个倒排链中的图像特征向量与该倒排链的类中心向量的相似度都较高,则由此确定出的倒排链中的特征向量与目标图像特征向量的相似度也应该相对较高,这样就没有必要从全部的倒排链中选取特征向量了,节省了检索时间。再确定一个选取比例系数,根据该选取比例系数在这些倒排链中选取图像特征向量。可见,每条倒排链中选取的图像特征向量都是依据这个选取比例系数选取的,不会出现,把一个倒排链里的图像特征向量都选取出来的情况,这样选取出的图像特征向量数目也就不会过大,则后续计算量就相对较小,产生的时延也就较小。
图2是根据一示例性实施例示出的一种数据检索的装置框图。参照图2,该装置包括确定模块210,选取模块220和反馈模块230。
确定模块210,用于接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;
选取模块220,用于确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;
反馈模块230,用于基于选取的图像特征向量,对所述检索请求进行反馈。
在一种可能的实施方式中,所述装置,还包括:
抽样模块,用于在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量;
确定每个倒排链中的各抽样图像特征向量与所述目标图像特征向量的相似度,组成每个倒排链对应的相似度集合;
所述选取模块220,用于:
在每个倒排链对应的相似度集合中,基于所述相似度集合中各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值;
在每个倒排链中,选取与目标图像特征向量的相似度大于所述倒排链的选取相似度阈值的图像特征向量。
在一种可能的实施方式中,所述选取模块220,用于:
将所述选取比例系数乘以所述第一预设数目,得到选取顺序值;
对所述相似度集合中各相似度按照从大到小的顺序进行排序,在排序后的相似度中,确定所述选取顺序值对应的相似度,作为所述相似度集合对应的倒排链的选取相似度阈值。
在一种可能的实施方式中,所述选取模块220,用于:
确定所述检索请求对应的目标业务类型;
基于预先存储的业务类型与选取比例系数的对应关系,确定所述目标业务类型对应的选取比例系数。
在一种可能的实施方式中,所述反馈模块230,用于:
在选取的所有图像特征向量中,确定对应的相似度最大的第二预设数目个图像特征向量,基于所述第二预设数目个图像特征向量,对所述检索请求进行反馈。
在一种可能的实施方式中,所述相似度为欧氏距离。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的另一种电子设备的结构框图,该电子设备可以是服务器300,服务器300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)301和一个或一个以上的存储器302,其中,所述存储器302中存储有至少一条指令,所述至少一条指令由所述处理器301加载并执行以实现上述数据检索的方法,方法包括:接收携带有目标图像的检索请求,确定与目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定多个类中心向量分别对应的倒排链;确定选取比例系数,基于选取比例系数,以及每个倒排链中各图像特征向量与目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;基于选取的图像特征向量,对检索请求进行反馈。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由上述电子设备的处理器执行以完成上述数据检索的方法,方法包括:接收携带有目标图像的检索请求,确定与目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定多个类中心向量分别对应的倒排链;确定选取比例系数,基于选取比例系数,以及每个倒排链中各图像特征向量与目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;基于选取的图像特征向量,对检索请求进行反馈。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种应用程序,包括一条或多条指令,该一条或多条指令可以由上述电子设备的处理器执行,以完成上述数据检索的方法,该方法包括:接收携带有目标图像的检索请求,确定与目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定多个类中心向量分别对应的倒排链;确定选取比例系数,基于选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;基于选取的图像特征向量,对检索请求进行反馈。可选地,上述指令还可以由上述电子设备的处理器执行以完成上述示例性实施例中所涉及的其他步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种图像检索的方法,其特征在于,所述方法包括:
接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;
确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;
基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多个类中心向量分别对应的倒排链之后,还包括:
在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量;
确定每个倒排链中的各抽样图像特征向量与所述目标图像特征向量的相似度,组成每个倒排链对应的相似度集合;
所述基于所述选取比例系数,以及每个倒排链中各图像特征向量对应的相似度的大小,在每个倒排链中,选取图像特征向量,包括:
在每个倒排链对应的相似度集合中,基于所述相似度集合中各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值;
在每个倒排链中,选取与目标图像特征向量的相似度大于所述倒排链的选取相似度阈值的图像特征向量。
3.根据权利要求2所述的方法,其特征在于,所述基于各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值,包括:
将所述选取比例系数乘以所述第一预设数目,得到选取顺序值;
对所述相似度集合中各相似度按照从大到小的顺序进行排序,在排序后的相似度中,确定所述选取顺序值对应的相似度,作为所述相似度集合对应的倒排链的选取相似度阈值。
4.根据权利要求1所述的方法,其特征在于,所述确定选取比例系数,包括:
确定所述检索请求对应的目标业务类型;
基于预先存储的业务类型与选取比例系数的对应关系,确定所述目标业务类型对应的选取比例系数。
5.根据权利要求1所述的方法,其特征在于,所述基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈,包括:
在选取的所有图像特征向量中,确定对应的相似度最大的第二预设数目个图像特征向量,基于所述第二预设数目个图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
6.根据权利要求1所述的方法,其特征在于,所述相似度为欧氏距离。
7.一种图像检索的装置,其特征在于,所述装置包括:
确定模块,用于接收携带有目标图像的检索请求,确定与所述目标图像的目标图像特征向量满足预设相似度条件的多个类中心向量,确定所述多个类中心向量分别对应的倒排链;
选取模块,用于确定选取比例系数,基于所述选取比例系数,以及每个倒排链中各图像特征向量与所述目标图像特征向量的相似度的大小,在每个倒排链中,选取图像特征向量;
反馈模块,用于基于选取的图像特征向量,确定反馈图像,基于所述反馈图像,对所述检索请求进行反馈。
8.根据权利要求7所述的装置,其特征在于,所述装置,还包括:
抽样模块,用于在每个倒排链中,随机确定出第一预设数目的图像特征向量,作为抽样图像特征向量,确定每个倒排链中的各抽样图像特征向量与所述目标图像特征向量的相似度,组成每个倒排链对应的相似度集合;
所述选取模块,用于:
在每个倒排链对应的相似度集合中,基于所述相似度集合中各相似度的大小,确定所述选取比例系数对应的抽样相似度,作为所述相似度集合对应的倒排链的选取相似度阈值,在每个倒排链中,选取与目标图像特征向量的相似度大于所述倒排链的选取相似度阈值的图像特征向量。
9.一种数据检索的服务器,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的图像检索的方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由数据检索的服务器的处理器执行时,使得数据检索的服务器能够执行如权利要求1至6中任一项所述的图像检索的方法。
CN201910544073.XA 2019-06-21 2019-06-21 图像检索的方法、装置、服务器及存储介质 Active CN110275970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910544073.XA CN110275970B (zh) 2019-06-21 2019-06-21 图像检索的方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910544073.XA CN110275970B (zh) 2019-06-21 2019-06-21 图像检索的方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110275970A true CN110275970A (zh) 2019-09-24
CN110275970B CN110275970B (zh) 2022-05-06

Family

ID=67962274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910544073.XA Active CN110275970B (zh) 2019-06-21 2019-06-21 图像检索的方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110275970B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111651624A (zh) * 2020-06-11 2020-09-11 浙江大华技术股份有限公司 一种图像检索方法及装置
CN111859004A (zh) * 2020-07-29 2020-10-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859320A (zh) * 2010-05-13 2010-10-13 复旦大学 一种基于多特征签名的海量图像检索方法
CN103069825A (zh) * 2010-07-28 2013-04-24 雅虎公司 用于电视搜索助手的系统和方法
CN103164436A (zh) * 2011-12-13 2013-06-19 阿里巴巴集团控股有限公司 一种图像搜索方法及装置
CN104156362A (zh) * 2013-05-14 2014-11-19 视辰信息科技(上海)有限公司 一种大规模图像特征点匹配方法
CN105426533A (zh) * 2015-12-17 2016-03-23 电子科技大学 一种融合空间约束信息的图像检索方法
CN105912611A (zh) * 2016-04-05 2016-08-31 中国科学技术大学 一种基于cnn的快速图像检索方法
WO2017020741A1 (zh) * 2015-08-06 2017-02-09 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
WO2017055250A1 (fr) * 2015-09-30 2017-04-06 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procédé et système de recherche d'images similaires quasi-indépendant de l'échelle de la collection d'images
CN106649490A (zh) * 2016-10-08 2017-05-10 中国人民解放军理工大学 一种基于深度特征的图像检索方法及装置
CN107273476A (zh) * 2017-06-08 2017-10-20 广州优视网络科技有限公司 一种文章搜索方法、装置及服务器
US9940100B2 (en) * 2014-08-29 2018-04-10 Adobe Systems Incorporated Shortlist computation for searching high-dimensional spaces
CN109165331A (zh) * 2018-08-20 2019-01-08 南京师范大学 一种英文地名的索引建立方法及其查询方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859320A (zh) * 2010-05-13 2010-10-13 复旦大学 一种基于多特征签名的海量图像检索方法
CN103069825A (zh) * 2010-07-28 2013-04-24 雅虎公司 用于电视搜索助手的系统和方法
CN103164436A (zh) * 2011-12-13 2013-06-19 阿里巴巴集团控股有限公司 一种图像搜索方法及装置
CN104156362A (zh) * 2013-05-14 2014-11-19 视辰信息科技(上海)有限公司 一种大规模图像特征点匹配方法
US9940100B2 (en) * 2014-08-29 2018-04-10 Adobe Systems Incorporated Shortlist computation for searching high-dimensional spaces
WO2017020741A1 (zh) * 2015-08-06 2017-02-09 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
WO2017055250A1 (fr) * 2015-09-30 2017-04-06 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procédé et système de recherche d'images similaires quasi-indépendant de l'échelle de la collection d'images
CN105426533A (zh) * 2015-12-17 2016-03-23 电子科技大学 一种融合空间约束信息的图像检索方法
CN105912611A (zh) * 2016-04-05 2016-08-31 中国科学技术大学 一种基于cnn的快速图像检索方法
CN106649490A (zh) * 2016-10-08 2017-05-10 中国人民解放军理工大学 一种基于深度特征的图像检索方法及装置
CN107273476A (zh) * 2017-06-08 2017-10-20 广州优视网络科技有限公司 一种文章搜索方法、装置及服务器
CN109165331A (zh) * 2018-08-20 2019-01-08 南京师范大学 一种英文地名的索引建立方法及其查询方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111143597B (zh) * 2019-12-13 2023-06-20 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111651624A (zh) * 2020-06-11 2020-09-11 浙江大华技术股份有限公司 一种图像检索方法及装置
CN111651624B (zh) * 2020-06-11 2023-09-19 浙江大华技术股份有限公司 一种图像检索方法及装置
CN111859004A (zh) * 2020-07-29 2020-10-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN110275970B (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
WO2018041168A1 (zh) 信息推送方法、存储介质和服务器
CN110275970A (zh) 图像检索的方法、装置、服务器及存储介质
CN109299344A (zh) 排序模型的生成方法、搜索结果的排序方法、装置及设备
JPWO2016001998A1 (ja) 類似度算出システム、類似度算出方法およびプログラム
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN105589929B (zh) 图像检索方法和装置
US20220261591A1 (en) Data processing method and apparatus
CN106127506B (zh) 一种基于主动学习解决商品冷启动问题的推荐方法
CN112231555A (zh) 基于用户画像标签的召回方法、装置、设备及存储介质
CN108604248B (zh) 利用基于人工智能的相关性计算的笔记提供方法及装置
CN111159553A (zh) 信息推送方法、装置、计算机设备及存储介质
US20150186934A1 (en) Group composition based recommender system and method
JP6570978B2 (ja) クラスタ選択装置
CN112988848B (zh) 一种数据处理方法、装置、设备及存储介质
JP2018173909A (ja) 学習プログラム、学習方法および学習装置
CN110968790B (zh) 基于大数据的潜在客户智能推荐方法、设备和存储介质
JP6062981B2 (ja) 映像検索装置、方法、及びプログラム
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
CN111582967A (zh) 内容搜索方法、装置、设备及存储介质
CN109885651A (zh) 一种问题推送方法和装置
CN114385714A (zh) 基于反馈的多排序融合方法、装置、设备及可读存储介质
CN109474832B (zh) 一种信息搜索排序方法、智能终端及存储介质
CN112417290A (zh) 书籍排序推送模型的训练方法、电子设备及存储介质
US20140126817A1 (en) Image analysis using coefficient distributions with selective basis feature representation
CN110275986A (zh) 基于协同过滤的视频推荐方法、服务器及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant