CN112988794B - 一种动态调整搜索策略的数据搜索方法、装置及电子设备 - Google Patents

一种动态调整搜索策略的数据搜索方法、装置及电子设备 Download PDF

Info

Publication number
CN112988794B
CN112988794B CN201911214309.XA CN201911214309A CN112988794B CN 112988794 B CN112988794 B CN 112988794B CN 201911214309 A CN201911214309 A CN 201911214309A CN 112988794 B CN112988794 B CN 112988794B
Authority
CN
China
Prior art keywords
data
search
range
preset
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911214309.XA
Other languages
English (en)
Other versions
CN112988794A (zh
Inventor
刘浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN201911214309.XA priority Critical patent/CN112988794B/zh
Publication of CN112988794A publication Critical patent/CN112988794A/zh
Application granted granted Critical
Publication of CN112988794B publication Critical patent/CN112988794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24549Run-time optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种动态调整搜索策略的数据搜索方法、装置及电子设备,所述动态调整搜索策略的数据搜索方法包括以下步骤:获取搜索请求;判断所述搜索范围是否超出预设搜索范围;若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;并通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;基于所述第一搜索结果以及第二搜索结果进行输出。本发明解决了由于数据部署时间长数据量变大,需要对全部的历史数据进行搜索,使得搜索时间变长,导致数据搜索效率低的问题,进而提高数据搜索效率。

Description

一种动态调整搜索策略的数据搜索方法、装置及电子设备
技术领域
本发明涉及数据检索技术领域,尤其涉及一种动态调整搜索策略的数据搜索方法、装置及电子设备。
背景技术
随着社会工业化、信息化水平的不断提高,如今数据已取代计算成为信息计算的中心,大数据(Big Data)正在成为一种趋势和潮流。大数据的影响渗透到了各行业,对未来的科技和经济发展带来深远影响。然而,正可谓利弊相生。大数据带来便利的同时,随着时间的推移,越来越多的人类活动每个月都会产生大量的数据。在之前的搜索项目中,常常由于数据部署时间长,数据量变大。要搜索某个数据时,需要对全部的历史数据进行搜索。但客户一般检索都只是希望搜索最近时间段的数据(图片数据),所以如果把时间很长的数据也检索进来。当数量越来越庞大时,导致会搜索效率变低,极大地影响搜索效率。可见现有技术中的数据搜索方式存在搜索效率低的问题。
发明内容
本发明实施例提供一种动态调整搜索策略的数据搜索方法,能够提高数据搜索效率。
第一方面,本发明实施例提供一种动态调整搜索策略的数据搜索方法,包括以下步骤:
获取搜索请求,所述搜索请求包括搜索范围以及源数据;
判断所述搜索范围是否超出预设搜索范围;
若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;所述第一搜索结果包括所述预设搜索范围中与所述源数据匹配的数据;
并通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;所述第二搜索结果包括所述超出预设搜索范围外的搜索范围中与所述源数据匹配的数据。
可选的,在所述判断搜索范围是否超出预设搜索范围的步骤之后,所述方法还包括:
若所述搜索范围未超出所述预设搜索范围,则通过所述预设的第一搜索策略对所述搜索范围中搜索所述源数据,并得到第三搜索结果,所述第三搜索结果包括所述搜索范围中与所述源数据匹配的数据;
所述通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果的步骤包括:
基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,所述第一相似度为源数据与预设搜索范围中的数据之间的相似度;
对所述前N个数据进行过滤处理,得到所述第一搜索结果;所述过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
可选的,所述通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果的步骤,包括:
计算属于超出所述预设搜索范围外的搜索范围中的数据量;
针对所述数据量创建线程组暴力搜索所述源数据,得到暴力搜索结果,所述暴力搜索结果包括所述超出所述预设搜索范围外的搜索范围中与所述源数据匹配的数据;
将所述暴力搜索结果按第二相似度进行排序并输出,得到所述第二搜索结果;所述第二相似度为所述源数据与所述超出预设搜索范围外的搜索范围中的数据之间的相似度。
可选的,所述预设搜索范围包含预设搜索时间范围,在所述获取搜索请求的步骤之前,所述方法还包括:
获取目标数据的存储时长,所述目标数据的存储时长为目标数据录入时刻至当前时刻的时长;
判断所述目标数据的存储时长是否超出预设搜索时间范围;
若所述目标数据的存储时长超出预设搜索时间范围,则将所述目标数据进行冷处理得到冷数据范围;
若所述目标数据的时间范围未超出预设时间范围,则判断所述目标数据为热数据,进而得到热数据范围。
第二方面,本发明实施例还提供了一种动态调整搜索策略的数据搜索装置,所述动态调整搜索策略的数据搜索装置包括:
搜索请求获取模块,用于获取搜索请求,所述搜索请求包括搜索范围以及源数据;
判断模块,用于判断所述搜索范围是否超出预设搜索范围;
第一搜索模块,用于若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;所述第一搜索结果包括与所述源数据匹配的数据;
第二搜索模块,用于并通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;所述第二搜索结果包括与所述源数据匹配的数据。
可选的,在所述判断模块之后,所述动态调整搜索策略的数据搜索装置还包括:
第三搜索模块,用于若所述搜索范围未超出所述预设搜索范围,则通过所述预设的第一搜索策略对所述搜索范围中搜索所述源数据,并得到第三搜索结果,所述第三搜索结果包括与所述源数据匹配的数据;
所述第一搜索模块包括:
获取单元,用于基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,所述第一相似度为源数据与预设搜索范围中的数据之间的相似度;
过滤单元,用于对所述前N个数据进行过滤处理,得到所述第一搜索结果;所述过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
可选的,所述第二搜索模块包括:
数据量计算单元,用于计算属于超出所述预设搜索范围外的搜索范围中的数据量;
暴力搜索单元,用于针对所述数据量创建线程组暴力搜索所述源数据,得到暴力搜索结果,所述暴力搜索结果包括所述超出所述预设搜索范围外的搜索范围中与所述源数据匹配的数据;
排序输出单元,用于将所述暴力搜索结果按第二相似度进行排序并输出,得到所述第二搜索结果;所述第二相似度为所述源数据与所述超出预设搜索范围外的搜索范围中的数据之间的相似度。
可选的,所述预设搜索范围包含预设搜索时间范围,在搜索请求获取模块之前,所述动态调整搜索策略的数据搜索装置还包括:
存储时长获取模块,用于获取目标数据的存储时长,所述目标数据的存储时长为目标数据录入时刻至当前时刻的时长;
存储时长判断模块,用于判断所述目标数据的存储时长是否超出预设搜索时间范围;
冷数据判断模块,用于若所述目标数据的存储时长超出预设搜索时间范围,则将所述目标数据进行冷处理得到冷数据范围;
热数据判断模块,用于若所述目标数据的时间范围未超出预设时间范围,则判断所述目标数据为热数据,进而得到热数据范围。
第三方面,本发明实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中所述的动态调整搜索策略的数据搜索方法中的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中所述的动态调整搜索策略的数据搜索方法中的步骤。
本发明实施例中,通过获取搜索请求,所述搜索请求包括搜索范围以及源数据;判断所述搜索范围是否超出预设搜索范围;若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;所述第一搜索结果包括与所述源数据匹配的数据;以及,通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;所述第二搜索结果包括与所述源数据匹配的数据。这样通过搜索请求中的搜索范围与预设搜索范围做比较,若搜索请求中的搜索范围超出预设搜索范围,则针对预设搜索范围以及超出所述预设搜索范围外的搜索范围选择不同的搜索策略进行搜索,并基于不同的搜索策略得到的搜索结果进行综合输出。本发明解决了由于数据部署时间长数据量变大,需要对全部的历史数据进行搜索,使得搜索时间变长,导致数据搜索效率低的问题,进而提高数据搜索效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种动态调整搜索策略的数据搜索方法的流程图;
图2是本发明实施例提供的另一种动态调整搜索策略的数据搜索方法的流程图;
图3是图1实施例中步骤103提供的一种方法的流程图;
图4是本发明实施例提供的又一种动态调整搜索策略的数据搜索方法的流程图;
图5是本发明实施例提供的一种动态调整搜索策略的数据搜索方法的流程图;
图6是本发明实施例提供的一种冷数据范围与热数据范围划分示意图;
图7是本发明实施例提供的一种动态调整搜索策略的数据搜索装置的结构示意图;
图8是本发明实施例提供的另一种动态调整搜索策略的数据搜索装置的结构示意图;
图9是图7实施例中第一搜索模块提供的另一种结构示意图;
图10是本发明实施例提供的另一种动态调整搜索策略的数据搜索装置的结构示意图;
图11是本发明实施例提供的又一种动态调整搜索策略的数据搜索装置的结构示意图;
图12是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,图1是本发明实施例提供的一种动态调整搜索策略的数据搜索方法的流程图,该动态调整搜索策略的数据搜索方法包括以下步骤:
步骤101、获取搜索请求。
其中,搜索请求包括搜索范围以及源数据。搜索范围为用户当前需要搜索的数据范围,该搜索范围也可以称为当前搜索范围。源数据为用户当前需要搜索的对象数据,该源数据也可以称为当前数据。该搜索请求是用户提交给搜索系统的,且针对某一个源数据以及某一搜索范围进行设置得到的。搜索范围以及源数据可根据用户需要设置的,比如,以时间范围(存储时长或录入时间范围)为搜索范围,以图片数据为源数据为例,用户提供的搜索范围可以是近4个月内(可以是,若当前时刻为2016年12月31日,那么近4个月,可以用“2016年9月1日至2016年12月31日”来表示)。那么搜索请求可以是请求搜索近4个月内的图片数据。具体实施时,搜索范围可以根据用户需要进行设置,比如,可以是半个月、1个月、2个月、3个月、半年、1年等。这样用户就可以根据该搜索请求在搜索系统中进行搜索搜索范围中与源数据匹配的数据,以达到数据检索的目的。该源数据可以是图片,还可以是文字、语音、视频等。在本实施例中,搜索系统为搜索3.0系统,为搜索项目提供搜索环境的搜索系统。
步骤102、判断搜索范围是否超出预设搜索范围。
其中,上述预设搜索范围可以是热数据范围。热数据范围中的数据存储在搜索系统的内存或显存中,这样便于数据搜索,搜索速度快。实际实施时,预设搜索范围可以根据时间来进行设置,根据时间来设置的预设搜索范围可以称为预设搜索时间范围,示例性的,预设搜索时间范围设置为3个月,该预设搜索范围是冷数据范围与热数据范围之间的分界线,当数据在预设搜索范围内,则称该数据为热数据,当数据超出该预设搜索范围时,称该数据为冷数据。
具体的,当接收到用户提供的搜索范围后,可将该搜索范围与预设搜索范围进行比较,当搜索范围大于预设搜索范围则,判断该搜索范围超出预设搜索范围;若搜索范围小于等于预设搜索范围,则判断该搜索范围没有超出预设搜索范围。
需要说明的是,当搜索范围大于预设搜索范围时,说明用户当前提供的搜索范围包括了预设搜索范围以及超出预设搜索范围外的搜索范围两个部分。由于步骤101中,可以知道预设搜索范围为热数据范围,而超出热数据范围的搜索范围则为冷数据范围。也即知道,该当前搜索范围包含了热数据范围部分和冷数据范围部分。那么需要针对热数据范围部分和冷数据范围部分选择不同的搜索策略来进行数据搜索。
步骤103、若搜索范围超出预设搜索范围,则通过预设的第一搜索策略在预设搜索范围中搜索源数据,得到第一搜索结果。
其中,第一搜索结果包括预设搜索范围中与源数据匹配的数据。上述预设的第一搜索策略可以称为热查询,用于在热数据范围中进行搜索的策略。预设搜索范围可以称为热数据范围,预设搜索范围中的数据可以称为热数据。预设搜索范围的数据存储在内存或显存中,这样便于搜索,提高计算效率。
具体的,当用户提供的搜索范围已经超出预设搜索范围,也就是超出了热数据搜索范围,也即确定当前搜索范围包含了热数据范围部分和冷数据范围部分时,需要选择不同的搜索策略在对应的搜索范围进行搜索。在热数据范围内搜索主要通过预设的第一搜索策略走内存/显存计算搜索,进而得到第一搜索结果。
步骤104、通过预设的第二搜索策略在超出预设搜索范围外的搜索范围中搜索源数据,得到第二搜索结果。
其中,第二搜索结果包括超出预设搜索范围外的搜索范围中与源数据匹配的数据。预设的第二搜索策略可以称为冷查询,用于在冷数据范围中进行搜索的策略。超出预设搜索范围外的搜索范围可以称为冷数据范围,超出预设搜索范围外的搜索范围的数据可以称为冷数据。超出预设搜索范围外的搜索范围的数据存储在磁盘或硬盘中,这样可以存储大量的冷数据,并且磁盘或硬盘可以增加或移动。
具体的,在对预设搜索范围部分的热数据范围部分通过预设的第一搜索策略走内存/显存计算搜索外,还需要通过预设的第二搜索策略对超出预设搜索范围外的搜索范围中的冷数据范围执行暴力搜索,进而得到第二搜索结果。
进一步的,基于第一搜索结果以及第二搜索结果进行输出。
具体的,将预设的第一搜索策略对热数据范围进行搜索后得到与源数据匹配的数据,以及将预设的第二搜索策略对冷数据范围部分进行搜索后得到的与源数据匹配的数据进行综合输出。这样就可以得到用户提供的搜索范围中与源数据匹配的所有数据。
在本实施例中,通过获取搜索请求,搜索请求包括搜索范围以及源数据;判断搜索范围是否超出预设搜索范围;若搜索范围超出预设搜索范围,则通过预设的第一搜索策略在预设搜索范围中搜索源数据,得到第一搜索结果;第一搜索结果包括与源数据匹配的数据;以及,通过预设的第二搜索策略在超出预设搜索范围外的搜索范围中搜索源数据,得到第二搜索结果;第二搜索结果包括与源数据匹配的数据。这样通过搜索请求中的搜索范围与预设搜索范围做比较,若搜索请求中的搜索范围超出预设搜索范围,则针对预设搜索范围以及超出预设搜索范围外的搜索范围选择不同的搜索策略进行搜索,并基于不同的搜索策略得到的搜索结果进行综合输出。本发明解决了由于数据部署时间长数据量变大,需要对全部的历史数据进行搜索,使得搜索时间变长,导致数据搜索效率低的问题,进而提高数据搜索效率。
参见图2、图2是本发明实施例提供的另一种动态调整搜索策略的数据搜索方法的流程图;在图1的基础上,在步骤102之后,方法还包括:
步骤201、若搜索范围未超出预设搜索范围,则通过预设的第一搜索策略对搜索范围中搜索源数据,并得到第三搜索结果。
其中,第三搜索结果包括搜索范围中与源数据匹配的数据。
具体的,若搜索范围未超出预设搜索范围,则只需要通过预设的第一搜索策略对搜索范围中搜索与源数据匹配的数据,并得到第三搜索结果。具体的步骤为:基于相似度获取当前搜索范围中的前M个数据。
其中,M为大于等于1的整数,相似度为源数据与当前搜索范围中的数据之间的相似度。
具体的,基于相似度获取当前搜索范围中的前M个数据的具体为:通过topN算法在搜索系统的内存或显存中计算源数据与当前搜索范围中的数据之间的相似度,并根据相似度对当前搜索范围中的数据进排序,并提取出排序为前M的数据。这样就可以从搜索系统的当前搜索范围对应的范围中筛选出与源数据最相似的数据。
需要说明的是,当源数据为图片时,相似度为源数据图片特征值与当前搜索范围中的图片特征值之间的相似度。在这里的特征值为图片生成的矩阵向量。
当源数据为文本时,相似度为源数据文本字符与当前搜索范围中的文本字符之间的相似度。
当然,当源数据为文字、语音、视频时,相似度对应的为,源数据文字、语音、视频与当前搜索范围中的文字、语音、视频之间的相似度。
进一步的,对前M个数据进行过滤处理,得到第三搜索结果。
其中,过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
具体的,对当前搜索范围中,相似度排序在前M的数据的数据进行属性过滤,比如源数据为某张图片中的某个人物。那么就可以根据图像识别等技术提取出源数据图片中该人物的属性特征,比如,性别特征(男或女)、服饰特征(颜色、款式、服饰类型等)、体型特征(高、矮、胖、瘦等)。这样再将源数据图像中提取到的属性特征与相似度排序在前N的图片中人物属性特征进行对比,进一步从相似度排序在前N的图片中筛选出与源数据图片中人物更相近的图片。
另一种实施方式,还可以对相似度排序在前N的数据进行时间过滤,比如源数据图片的拍摄时间为2019年10月1日的中午12点,那么可以对相似度排序在前N的图片中拍摄时间为2019年10月1日的中午12点左右的图片。
又一种实施方式,还可以对相似度排序在前N的数据进行相似度门限值过滤,具体可以是,设置一个相似度门限值,如相似度门限值设置为90%,那么将相似度排序在前N的数据的相似度与相似度门限值进行比较,大于或等于相似度门限值90%的数据才能够被保留,小于相似度门限值90%的数据则被放弃。
需要说明的是,属性过滤、时间过滤、相似度门限过滤可以单独过滤,也可以两种、或三种进行配合过滤,最后可以从当前搜索范围中搜索得到剩下的与源数据最匹配的数据,也即得到第三搜索结果。
作为本发明又一实施方式中,当搜索系统中的数据为数据表时,根据相似度排序在前N的数据表的id查询相应的数据表名,并根据数据表名对id进行过来。
进一步的,基于第三搜索结果进行输出。
具体的,当得到剩余的当前搜索范围中相似度排序在前M的数据时,对剩余的数据进行相似度或者时间排序来输出。也即将第三结果中得到的数据进行进而相似度或者时间排序来输出,提高搜索的精准度。
可选的,参见图3,图3是图1实施例中步骤103提供的一种方法的流程图;步骤103包括:
步骤301、基于第一相似度获取预设搜索范围中的前N个数据。
其中,N为大于等于1的整数,第一相似度为源数据与预设搜索范围中的数据之间的相似度。
具体的,基于第一相似度获取预设搜索范围中的前N个数据的具体为:通过topN算法在搜索系统的内存或显存中计算源数据与预设搜索范围中的数据之间的第一相似度,并根据第一相似度对预设搜索范围中的数据进排序,并提取出排序为前N的数据。这样就可以筛选出与源数据最相似的数据。
需要说明的是,当源数据为图片时,第一相似度为源数据图片特征值与预设搜索范围中的图片特征值之间的相似度。在这里的特征值为图片特征生成的矩阵向量。
当源数据为文本时,第一相似度为源数据文本字符与预设搜索范围中的文本字符之间的相似度。
当然,当源数据为语音、视频时,第一相似度对应的为,源数据文本、语音、视频与预设搜索范围中的文本、语音、视频之间的相似度。
步骤302、对前N个数据进行过滤处理,得到第一搜索结果。
其中,过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
具体的,对预设搜索范围中,第一相似度排序在前N的数据的数据进行属性过滤,比如源数据为某张图片中的某个人物。那么就可以根据图像识别等技术提取出源数据图片中该人物的属性特征,比如,性别特征(男或女)、服饰特征(颜色、款式、服饰类型等)、体型特征(高、矮、胖、瘦等)。这样再将源数据图像中提取到的属性特征与第一相似度排序在前N的图片中人物属性特征进行对比,进一步从相似度排序在前N的图片中筛选出与源数据图片中人物更相近的图片。
另一种实施方式,还可以对相似度排序在前N的数据进行时间过滤,比如源数据图片的拍摄时间为2019年10月1日的中午12点,那么可以对第一相似度排序在前N的图片中拍摄时间为2019年10月1日的中午12点左右的图片。
又一种实施方式,还可以对第一相似度排序在前N的数据进行相似度门限值过滤,具体可以是,设置一个相似度门限值,如相似度门限值设置为90%,那么将第一相似度排序在前N的数据的相似度与相似度门限值进行比较,大于或等于相似度门限值90%的数据才能够被保留,小于相似度门限值90%的数据则被放弃。
需要说明的是,属性过滤、时间过滤、相似度门限过滤可以单独过滤,也可以两种、或三种进行配合过滤,最后可以从预设搜索范围中搜索得到剩下的与源数据最匹配的数据,也即得到第一搜索结果,进而提高搜索的精准度。
在本发明实施例中,通过对预设搜索范围内分热数据进行相似度计算以及过滤处理,进而提高数据搜索的准确度。
在本发明实施例中,当用户请求的搜索范围在预设范围内时,只需要通过预设的第一搜索策略对预设搜索范围中的数据进行搜索得到与源数据匹配的数据。而且由于预设搜索范围的数据都比较少,这样搜索起来搜索时间比较快,进而提高搜索效率。
参见图4,图4是本发明实施例提供的又一种动态调整搜索策略的数据搜索方法的流程图;在图1的基础上,步骤104包括:
步骤401、计算属于超出预设搜索范围外的搜索范围中的数据量。
其中,超出预设搜索范围外的搜索范围具体为冷数据范围中的一部分,所以,超出预设搜索范围外的搜索范围中的数据也称为冷数据。
具体的,计算属于超出预设搜索范围外的搜索范围中冷数据的全部数据量。
步骤402、针对数据量创建线程组暴力搜索源数据,得到暴力搜索结果。
其中,暴力搜索结果包括超出预设搜索范围外的搜索范围中与源数据匹配的数据。具体的,当确定超出预设搜索范围外的搜索范围中的冷数据的数据量后,建立线程组(包括多个线程)请求该冷数据所存储的数据库。比如,超出预设搜索范围外的搜索范围中冷数据存储在数据表上,并且在超出预设搜索范围外的搜索范围中总共有10张数据表,那么针对每张数据表建立对应的线程分别对每张数据表进行暴力搜索(主要是通过相似度来搜索的),且多个线程并行搜索能够降低搜索时间。这样就可以通过暴力搜索(将源数据与超出预设搜索范围外的搜索范围中每条冷数据进行一一对应比较)。从而一一计算超出预设搜索范围外的搜索范围中所有冷数据与源数据之间的相似度,并基于相似度选择与源数据匹配的数据作为暴力搜索结果。
需要说明的是,判断各个搜索范围中的数据与源数是否主要是通过相似度来判断的,即将各个搜索范围中的数据与源数据之间的相似度与预设相似度阈值进行判断,相似度大于或等于相似度阈值时,则说明各个搜索范围中的数据与源数据相匹配。。
步骤403、将暴力搜索结果按第二相似度进行排序并输出,得到第二搜索结果。
其中,第二相似度为源数据与超出预设搜索范围外的搜索范围中的数据之间的相似度。
具体的,得到超出预设搜索范围外的搜索范围中的所有冷数据与源数据之间的第二相似度后,将超出预设搜索范围外的搜索范围中所有冷数据与源数据之间的第二相似度进行排序,得到冷数据以及源数据对应的第二相似度队列进行输出,以得到第二搜索结果。
在本发明实施例中,通过对超出预设搜索范围外的搜索范围中的冷数据分线程以及暴力搜索,从而保证数据搜索的准确度。
参见图5,图5是本发明实施例提供的一种动态调整搜索策略的数据搜索方法的流程图;预设搜索范围包含预设搜索时间范围,在图1的基础上,在步骤101之前,该动态调整搜索策略的数据搜索方法还包括:
步骤501、获取目标数据的存储时长,目标数据的存储时长为目标数据录入时刻至当前时刻的时长。
步骤502、判断目标数据的存储时长是否超出预设搜索时间范围。
步骤503、若目标数据的存储时长超出预设搜索时间范围,则将目标数据进行冷处理得到冷数据范围。
步骤504、若目标数据的时间范围未超出预设时间范围,则判断目标数据为热数据,进而得到热数据范围。
其中,预设搜索时间范围可以是热数据的存储时长。可以预先根据数据的存储时长对目标数据进行划分数据范围,目标数据可以是指存储在搜索系统数据库中或者存储在搜索系统提供的数据存储链接对应数据库中的数据,比如图片、文字、语音、视频等。该目标数据也可以称为数据、资料等。可以通过以下方式来完成:
具体的,用户可以预先为搜索系统设置有一个或多个数据库,或者设置存储数据的一个或多个数据链接,这样用户可以根据需要在搜索系统中查询到对应的数据。搜索系统中的数据可以根据数据的存储时长、存储位置的不同对数据进行划分数据范围,比如划分为热数据范围、冷数据范围等。存储时长为数据存储时刻到当前时刻之间的存储时间长度。具体实施时,以某个存储时长为例对搜索系统中的数据进行划分数据范围,比如,以3个月的存储时长作为热数据范围和冷数据范围的分界线,数据存储时的录入时刻到当前时刻之间的存储时长小于等于3个月,则判断该数据为热数据,并且该数据所属于的存储时长范围属于热数据范围;数据存储时的录入时刻到当前时刻之间的存储时长大于3个月,则判断存储时长大于3个月的数据为冷数据,且该数据所属的存储时长属于冷数据范围。具体实施时冷数据范围和热数据范围的分界线还可以设置为半个月、1个月、2个月、半年、1年等,可根据实际需要来进行设置。
当判断目标数据的存储时长大于预设时间范围时,则对该目标数据进行制冷处理。示例性的,参见图6,图6是本发明实施例提供的一种冷数据范围与热数据范围划分示意图;
在本实施例中,以2016年一年的数据作为目标数据,以3个月的存储时长作为热数据范围和冷数据范围之间的分界线,也即将3个月设置有预设时间范围。当目标数据刚录入系统时,目标数据的存储时长均比较短,并且目标数据的存储时长在3个月范围内,所以刚录入的目标数据均为热数据。但随着存储时间的推移,目标数据的存储时长会逐渐变长,目标数据录入的时间最早,存储时长总是比后录入的目标数据的存储时长长。当设置3个月为热数据范围和冷数据范围的分界线后,目标数据存储时长小于等于3个月时,该目标数据为热数据,该目标数据的存储时长属于热数据范围。而当目标数据的存储时长大于3个月后,该目标数据则为冷数据,该目标数据的存储时长属于冷数据范围。比如,最新一次录入目标数据的时刻为2016年12月31日,而在2016年12月31日之前均不断有目标数据的录入,由于热数据范围和冷数据范围的分界线为3个月,所以,在2016年10月1日之后存储的目标数据的存储时长均在3个月内,所以在2016年10月1日之后到2016年12月31日的目标数据均为热数据。而2016年10月1日之前录入的目标数据的存储时长均大于3个月,所以,2016年10月1日之前录入的目标数据均为冷数据。这样,2016年一年的目标数据就有9个月冷数据,3个月的热热数据。
当然,随着时间的推移,会在预设时间间隔对热数据范围中的目标数据进行判断,若热数据范围内的目标数据的存储时长大于预设搜索时间范围,则对该目标数据进行制冷,也即将存储时长大于预设搜索时间范围的目标数据转移到冷数据范围中。或者将存储时长大于预设搜索时间范围的目标数据存储到磁盘或硬盘中。若热数据范围中的目标数据的存储时长小于或等于预设搜索时间范围,则不进行任何操作。具体实施时,预设时间间隔可以设置为每天的凌晨0-6点,因为每天凌晨0-6点均是休息时间,对目标数据进行冷热划分,不会影响用户的使用。
在本实施例中,目标数据可以存储在数据表中,并且每个数据表均设置有自己的生命周期最大的是创建时间(createTime),最小更新时间(updateTime),数据表里面的所有数据都在这个范围内,所以确定当创建时间大于冷热分界线,说明该数据表所有数据为冷数据,应该做制冷处理。
在本实施例中,通过对目标数据进行冷热数据划分,设置热数据范围和冷数据范围,便于搜索时根据冷热分界线调整搜索策略,进而根据不同的搜索策略得到不同的搜索结果,具有针对性的搜索,从而提高数据搜索效率。
可选的,基于第一搜索结果以及第二搜索结果进行输出的步骤包括:
基于相似度将第一搜索结果以及第二结果中的与源数据匹配的数据进行排序输出。将第一搜索结果中的每个计算得到的与源数据相似度大于相似度阈值的数据与第二搜索结果中每个计算得到的与源数据相似度大于相似度阈值的数据,一同按照相似度的大小进行排序,并且将相似度由高到低进行输出,或者由低到高进行输出。或者,将第一搜索结果中的每个计算得到的与源数据相似度大于相似度阈值的数据与第二搜索结果中每个计算得到的与源数据相似度大于相似度阈值的数据,一同按照时间(存储时长、或录入时刻)进行排序,并且将相似度由高到低进行输出,或者由低到高进行输出。
参见图图7,图7是本发明实施例提供的一种动态调整搜索策略的数据搜索装置的结构示意图,该动态调整搜索策略的数据搜索装置60包括:
搜索请求获取模块601,用于获取搜索请求,搜索请求包括搜索范围以及源数据。判断模块602,用于判断搜索范围是否超出预设搜索范围。第一搜索模块603,用于若搜索范围超出预设搜索范围,则通过预设的第一搜索策略在预设搜索范围中搜索源数据,得到第一搜索结果;第一搜索结果包括与源数据匹配的数据。第二搜索模块604,用于并通过预设的第二搜索策略在超出预设搜索范围外的搜索范围中搜索源数据,得到第二搜索结果;第二搜索结果包括与源数据匹配的数据。
参见图图8,图8是本发明实施例提供的另一种动态调整搜索策略的数据搜索装置的结构示意图,在图7的基础上,在判断模块之后,该动态调整搜索策略的数据搜索装置60还包括:
第三搜索模块606,用于若搜索范围未超出预设搜索范围,则通过预设的第一搜索策略对搜索范围中搜索源数据,并得到第三搜索结果,第三搜索结果包括与源数据匹配的数据。
可选的,参见图图9,图9是图7中第一搜索模块实施例提供的另一种结构示意图;该第一搜索模块603包括:
获取单元6031,用于基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,第一相似度为源数据与预设搜索范围中的数据之间的相似度。过滤单元6032,用于对前N个数据进行过滤处理,得到第一搜索结果;过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
参见图图10,图10是本发明实施例提供的另一种动态调整搜索策略的数据搜索装置的结构示意图;在图7的基础上,第二搜索模块604包括:
数据量计算单元6041,用于计算属于超出预设搜索范围外的搜索范围中的数据量;暴力搜索单元6042,用于针对数据量创建线程组暴力搜索源数据,得到暴力搜索结果,暴力搜索结果包括超出预设搜索范围外的搜索范围中与源数据匹配的数据;排序输出单元6043,用于将暴力搜索结果按第二相似度进行排序并输出,得到第二搜索结果;第二相似度为源数据与超出预设搜索范围外的搜索范围中的数据之间的相似度。
参见图图11,图11是本发明实施例提供的又一种动态调整搜索策略的数据搜索装置的结构示意图,在图7的基础上,在搜索请求获取模块之前,该动态调整搜索策略的数据搜索装置60还包括:
存储时长获取模块608,用于获取目标数据的存储时长,目标数据的存储时长为目标数据录入时刻至当前时刻的时长;存储时长判断模块609,用于判断目标数据的存储时长是否超出预设搜索时间范围;冷数据判断模块610,用于若目标数据的存储时长超出预设搜索时间范围,则将目标数据进行冷处理得到冷数据范围;热数据判断模块611,用于若目标数据的时间范围未超出预设时间范围,则判断目标数据为热数据,进而得到热数据范围。
可选的,第一输出模块605包括:
第一输出单元,用于基于相似度将第一搜索结果以及第二结果中的与源数据匹配的数据进行排序输出。
本发明实施例提供的动态调整搜索策略的数据搜索装置能够实现上述方法实施例提供的动态调整搜索策略的数据搜索方法中的各个步骤,且可以达到相同的有益效果,为避免重复,这里不再赘述。
参见图12,图12是本发明实施例提供的一种电子设备的结构示意图,该电子设备70包括:存储器702、处理器701及存储在存储器702上并可在处理器701上运行的计算机程序,其中,处理器701用于调用存储器702存储的计算机程序,执行如下步骤:
获取搜索请求,搜索请求包括搜索范围以及源数据;判断搜索范围是否超出预设搜索范围;若搜索范围超出预设搜索范围,则通过预设的第一搜索策略在预设搜索范围中搜索源数据,得到第一搜索结果;第一搜索结果包括预设搜索范围中与源数据匹配的数据;并通过预设的第二搜索策略在超出预设搜索范围外的搜索范围中搜索源数据,得到第二搜索结果;第二搜索结果包括超出预设搜索范围外的搜索范围中与源数据匹配的数据。
可选的,在判断搜索范围是否超出预设搜索范围的步骤之后,处理器701还执行以下步骤:
若搜索范围未超出预设搜索范围,则通过预设的第一搜索策略对搜索范围中搜索源数据,并得到第三搜索结果,第三搜索结果包括搜索范围中与源数据匹配的数据。
可选的,处理器701执行的通过预设的第一搜索策略在预设搜索范围中搜索源数据,得到第一搜索结果的步骤包括:
基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,第一相似度为源数据与预设搜索范围中的数据之间的相似度;对前N个数据进行过滤处理,得到第一搜索结果;过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
可选的,处理器701执行的通过预设的第二搜索策略在超出预设搜索范围外的搜索范围中搜索源数据,得到第二搜索结果的步骤,包括:
计算属于超出预设搜索范围外的搜索范围中的数据量;针对数据量创建线程组暴力搜索源数据,得到暴力搜索结果,暴力搜索结果包括超出预设搜索范围外的搜索范围中与源数据匹配的数据;将暴力搜索结果按第二相似度进行排序并输出,得到第二搜索结果;第二相似度为源数据与超出预设搜索范围外的搜索范围中的数据之间的相似度。
可选的,预设搜索范围包含预设搜索时间范围,在获取搜索请求的步骤之前,处理器701还执行以下步骤:获取目标数据的存储时长,目标数据的存储时长为目标数据录入时刻至当前时刻的时长;判断目标数据的存储时长是否超出预设搜索时间范围;若目标数据的存储时长超出预设搜索时间范围,则将目标数据进行冷处理得到冷数据范围;若目标数据的时间范围未超出预设时间范围,则判断目标数据为热数据,进而得到热数据范围。
可选的,处理器701执行的基于第一搜索结果以及第二搜索结果进行输出的步骤包括:
基于相似度将第一搜索结果以及第二结果中的与源数据匹配的数据进行排序输出。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中所述的动态调整搜索策略的数据搜索方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器22(Random Access Memory,简称RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (9)

1.一种动态调整搜索策略的数据搜索方法,其特征在于,包括以下步骤:
获取搜索请求,所述搜索请求包括搜索范围以及源数据;
判断所述搜索范围是否超出预设搜索范围;
若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;所述第一搜索结果包括所述预设搜索范围中与所述源数据匹配的数据;
并通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;所述第二搜索结果包括所述超出预设搜索范围外的搜索范围中与所述源数据匹配的数据;
所述通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果的步骤,包括:
计算属于超出所述预设搜索范围外的搜索范围中的数据量;
针对所述数据量创建线程组暴力搜索所述源数据,得到暴力搜索结果,所述暴力搜索结果包括所述超出所述预设搜索范围外的搜索范围中与所述源数据匹配的数据;
将所述暴力搜索结果按第二相似度进行排序并输出,得到所述第二搜索结果;所述第二相似度为所述源数据与所述超出预设搜索范围外的搜索范围中的数据之间的相似度。
2.如权利要求1所述的动态调整搜索策略的数据搜索方法,其特征在于,在所述判断搜索范围是否超出预设搜索范围的步骤之后,所述方法还包括:
若所述搜索范围未超出所述预设搜索范围,则通过所述预设的第一搜索策略对所述搜索范围中搜索所述源数据,并得到第三搜索结果,所述第三搜索结果包括所述搜索范围中与所述源数据匹配的数据;
所述通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果的步骤包括:
基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,所述第一相似度为源数据与预设搜索范围中的数据之间的相似度;
对所述前N个数据进行过滤处理,得到所述第一搜索结果;所述过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
3.如权利要求1或2所述的动态调整搜索策略的数据搜索方法,其特征在于,所述预设搜索范围包含预设搜索时间范围,在所述获取搜索请求的步骤之前,所述方法还包括:
获取目标数据的存储时长,所述目标数据的存储时长为目标数据录入时刻至当前时刻的时长;
判断所述目标数据的存储时长是否超出预设搜索时间范围;
若所述目标数据的存储时长超出预设搜索时间范围,则将所述目标数据进行冷处理得到冷数据范围;
若所述目标数据的时间范围未超出预设时间范围,则判断所述目标数据为热数据,进而得到热数据范围。
4.一种动态调整搜索策略的数据搜索装置,其特征在于,所述动态调整搜索策略的数据搜索装置包括:
搜索请求获取模块,用于获取搜索请求,所述搜索请求包括搜索范围以及源数据;
判断模块,用于判断所述搜索范围是否超出预设搜索范围;
第一搜索模块,用于若所述搜索范围超出所述预设搜索范围,则通过预设的第一搜索策略在所述预设搜索范围中搜索所述源数据,得到第一搜索结果;所述第一搜索结果包括与所述源数据匹配的数据;
第二搜索模块,用于并通过预设的第二搜索策略在所述超出预设搜索范围外的搜索范围中搜索所述源数据,得到第二搜索结果;所述第二搜索结果包括与所述源数据匹配的数据;
所述第二搜索模块还用于计算属于超出所述预设搜索范围外的搜索范围中的数据量;针对所述数据量创建线程组暴力搜索所述源数据,得到暴力搜索结果,所述暴力搜索结果包括所述超出所述预设搜索范围外的搜索范围中与所述源数据匹配的数据;将所述暴力搜索结果按第二相似度进行排序并输出,得到所述第二搜索结果;所述第二相似度为所述源数据与所述超出预设搜索范围外的搜索范围中的数据之间的相似度。
5.如权利要求4所述的动态调整搜索策略的数据搜索装置,其特征在于,在所述判断模块之后,所述动态调整搜索策略的数据搜索装置还包括:
第三搜索模块,用于若所述搜索范围未超出所述预设搜索范围,则通过所述预设的第一搜索策略对所述搜索范围中搜索所述源数据,并得到第三搜索结果,所述第三搜索结果包括与所述源数据匹配的数据;
所述第一搜索模块包括:
获取单元,用于基于第一相似度获取预设搜索范围中的前N个数据;N为大于等于1的整数,所述第一相似度为源数据与预设搜索范围中的数据之间的相似度;
过滤单元,用于对所述前N个数据进行过滤处理,得到所述第一搜索结果;所述过滤处理包含属性过滤、时间过滤、相似度门限过滤中的至少一种。
6.如权利要求4所述的动态调整搜索策略的数据搜索装置,其特征在于,所述第二搜索模块包括:
数据量计算单元,用于计算属于超出所述预设搜索范围外的搜索范围中的数据量;
暴力搜索单元,用于针对所述数据量创建线程组暴力搜索所述源数据,得到暴力搜索结果,所述暴力搜索结果包括所述超出所述预设搜索范围外的搜索范围中与所述源数据匹配的数据;
排序输出单元,用于将所述暴力搜索结果按第二相似度进行排序并输出,得到所述第二搜索结果;所述第二相似度为所述源数据与所述超出预设搜索范围外的搜索范围中的数据之间的相似度。
7.如权利要求4-6中任一项所述的动态调整搜索策略的数据搜索装置,其特征在于,所述预设搜索范围包含预设搜索时间范围,在搜索请求获取模块之前,所述动态调整搜索策略的数据搜索装置还包括:
存储时长获取模块,用于获取目标数据的存储时长,所述目标数据的存储时长为目标数据录入时刻至当前时刻的时长;
存储时长判断模块,用于判断所述目标数据的存储时长是否超出预设搜索时间范围;
冷数据判断模块,用于若所述目标数据的存储时长超出预设搜索时间范围,则将所述目标数据进行冷处理得到冷数据范围;
热数据判断模块,用于若所述目标数据的时间范围未超出预设时间范围,则判断所述目标数据为热数据,进而得到热数据范围。
8.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的动态调整搜索策略的数据搜索方法中的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的动态调整搜索策略的数据搜索方法中的步骤。
CN201911214309.XA 2019-12-02 2019-12-02 一种动态调整搜索策略的数据搜索方法、装置及电子设备 Active CN112988794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911214309.XA CN112988794B (zh) 2019-12-02 2019-12-02 一种动态调整搜索策略的数据搜索方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911214309.XA CN112988794B (zh) 2019-12-02 2019-12-02 一种动态调整搜索策略的数据搜索方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112988794A CN112988794A (zh) 2021-06-18
CN112988794B true CN112988794B (zh) 2024-05-03

Family

ID=76331167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911214309.XA Active CN112988794B (zh) 2019-12-02 2019-12-02 一种动态调整搜索策略的数据搜索方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112988794B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407856B (zh) * 2021-08-19 2022-04-29 北京金堤征信服务有限公司 搜索结果排序方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007095834A1 (fr) * 2006-02-22 2007-08-30 Dong Wang Procédé d'affichage composite et système pour moteur de recherche d'informations de ressources identiques sur la base du degré d'attention
CN109033261A (zh) * 2018-07-06 2018-12-18 北京旷视科技有限公司 图像处理方法、装置、处理设备及其存储介质
WO2019127832A1 (zh) * 2017-12-29 2019-07-04 国民技术股份有限公司 智能搜索方法、装置、终端及服务器、存储介质
WO2019179014A1 (zh) * 2018-03-22 2019-09-26 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7225197B2 (en) * 2002-10-31 2007-05-29 Elecdecom, Inc. Data entry, cross reference database and search systems and methods thereof
CN104346354B (zh) * 2013-07-29 2017-12-01 阿里巴巴集团控股有限公司 一种提供推荐词的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007095834A1 (fr) * 2006-02-22 2007-08-30 Dong Wang Procédé d'affichage composite et système pour moteur de recherche d'informations de ressources identiques sur la base du degré d'attention
WO2019127832A1 (zh) * 2017-12-29 2019-07-04 国民技术股份有限公司 智能搜索方法、装置、终端及服务器、存储介质
WO2019179014A1 (zh) * 2018-03-22 2019-09-26 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质
CN109033261A (zh) * 2018-07-06 2018-12-18 北京旷视科技有限公司 图像处理方法、装置、处理设备及其存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中美韩三国八大搜索引擎多媒体检索比较分析;李苗;;图书馆学研究(12);全文 *
分布式学术搜索引擎研制及其大数据应用;吴广印;;数字图书馆论坛(06);全文 *

Also Published As

Publication number Publication date
CN112988794A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
US20200341988A1 (en) Search ranking method and apparatus, electronic device and storage medium
US7711668B2 (en) Online document clustering using TFIDF and predefined time windows
US8989450B1 (en) Scoring items
US20230043174A1 (en) Method for pushing anchor information, computer device, and storage medium
CN109190017B (zh) 热点信息的确定方法、装置、服务器及存储介质
CN106055704B (zh) 一种图像检索与匹配方法及系统
US11003649B2 (en) Index establishment method and device
CN107315795B (zh) 联合特定人物和场景的视频实例检索方法及系统
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JP6932360B2 (ja) オブジェクト検索方法、装置およびサーバ
WO2021248791A1 (zh) 数据增强策略的更新方法、装置、设备及存储介质
WO2015154679A1 (zh) 多搜索引擎搜索结果的排序方法及装置
US20170109403A1 (en) Pre-caching
CN112988794B (zh) 一种动态调整搜索策略的数据搜索方法、装置及电子设备
CN111327955A (zh) 基于用户画像的点播方法、存储介质及智能电视
De Marsico et al. FACE: Face analysis for commercial entities
CN112597274A (zh) 基于bm25算法的文档确定方法、装置、设备及存储介质
CN110851675A (zh) 一种数据提取方法、装置及介质
JP2018173909A (ja) 学習プログラム、学習方法および学習装置
CN111143587B (zh) 一种数据检索方法、装置及电子设备
CN107193979B (zh) 一种同源图片检索的方法
US10909167B1 (en) Systems and methods for organizing an image gallery
CN111723179B (zh) 基于概念图谱的反馈模型信息检索方法、系统及介质
WO2021196551A1 (zh) 图像检索方法、装置、计算机设备和存储介质
CN108170665B (zh) 基于综合相似度的关键词拓展方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant