CN116821175A - 数据查询、索引服务创建方法、装置及电子设备 - Google Patents

数据查询、索引服务创建方法、装置及电子设备 Download PDF

Info

Publication number
CN116821175A
CN116821175A CN202310989548.2A CN202310989548A CN116821175A CN 116821175 A CN116821175 A CN 116821175A CN 202310989548 A CN202310989548 A CN 202310989548A CN 116821175 A CN116821175 A CN 116821175A
Authority
CN
China
Prior art keywords
index
data
service
target
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310989548.2A
Other languages
English (en)
Inventor
卢嘉龙
段雪涛
马鑫云
陈再萍
段宏睿
马震
袁列萍
荣兴汉
侯向荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu China Co Ltd
Original Assignee
Baidu China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu China Co Ltd filed Critical Baidu China Co Ltd
Priority to CN202310989548.2A priority Critical patent/CN116821175A/zh
Publication of CN116821175A publication Critical patent/CN116821175A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了数据查询、索引服务创建方法、装置及电子设备,涉及数据处理技术领域,尤其涉及云服务或者数据索引技术领域。数据查询方法的具体实现方案为:接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。

Description

数据查询、索引服务创建方法、装置及电子设备
技术领域
本公开涉及数据处理技术领域,尤其涉及云服务或者数据索引技术领域,具体而言,本公开涉及一种数据查询、索引服务创建方法、装置及电子设备。
背景技术
索引是为了提升数据查询效率而引入的一种技术,一般会为数据表中的数据建立索引,以便快速对数据表进行数据查询。
随着云服务的快速发展,基于云服务实现的索引服务也应运而生。相关技术中的索引服务多是独立部署并管理的,在进行数据查询时,一般仅能够针对特定的索引服务发起查询请求。
发明内容
本公开为了解决上述缺陷中的至少一项,提供了一种数据查询、索引服务创建方法、装置及电子设备。
根据本公开的第一方面,提供了一种数据查询方法,该方法包括:
接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;
从索引服务中确定查询请求所调用的目标索引服务;
调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。
根据本公开的第二方面,提供了一种索引服务创建方法,该方法包括:
响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;
创建待索引数据源对应的当前索引数据;
基于当前索引数据,创建当前索引服务。
根据本公开的第三方面,提供了一种数据查询装置,该装置包括:
查询请求接收模块,用于接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;
目标索引服务确定模块,用于从索引服务中确定查询请求所调用的目标索引服务;
数据查询模块,用于调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。
根据本公开的第四方面,提供了一种索引服务创建装置,该装置包括:
待索引数据源确定模块,用于响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;
索引数据创建模块,用于创建待索引数据源对应的当前索引数据;
索引服务创建模块,用于基于当前索引数据,创建当前索引服务。
根据本公开的第五方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与上述至少一个处理器通信连接的存储器;其中,
存储器存储有可被上述至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行上述数据查询或者索引服务创建方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使计算机执行上述数据查询或者索引服务创建方法。
根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述数据查询或者索引服务创建方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的一种数据查询方法的流程示意图;
图2是本公开实施例提供的一种索引服务创建方法的流程示意图;
图3是本公开实施例提供的索引服务平台的整体结构示意图;
图4是本公开实施例提供的一种数据查询装置的结构示意图;
图5是本公开实施例提供的一种索引服务创建装置的结构示意图;
图6是用来实现本公开实施例的数据查询或者索引服务创建方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
相关技术中,索引服务一般是独立部署并管理的,对外提供独立的数据查询服务。在调用一种索引服务进行数据查询时,一般需要针对该索引服务发起查询请求,例如针对该索引服务提供的特定查询接口发起查询请求,而在调用另一种索引服务进行数据查询时,则需要针对另一种索引服发起查询请求。可见,调用独立部署并独立管理的不同索引服务进行数据查询时,由于需要分别向不同的索引服务发起查询请求,会造成调用索引服务的不便。例如,在分别向不同的索引服务发起查询请求,发起方需要分别适配不同的索引服务提供的查询接口后,才能基于查询接口发起查询请求,造成调用索引服务的不便。
目前,随着云服务技术业务的发展以及索引技术的普及,索引服务支持的业务也越来越丰富。根据不同的索引建库算法、索引检索算法等会有多种不同的索引形态。索引业务以及和索引业务两个维度的共同增长,导致需要管理的索引服务的数量大幅增加,而相关技术中,索引服务多是独立进行管理的,导致管理效率低下。因此,亟需一种能够对多种索引服务进行统一管理的方式,以提升对索引服务的管理效率。
相关技术中,索引服务一般是基于具体业务进行定制化创建,使得索引服务的创建操作通用性差,不便于推广,并且索引技术无法有效复用。
相关技术中,独立部署的索引服务一般会独占资源,为了保证索引服务在服务高峰期的可用性,各索引服务一般都会额外申请资源,使得各索引服务存在资源冗余,且冗余的资源无法实现共享。
本公开实施例提供的数据查询、索引服务创建方法、装置及电子设备,旨在解决现有技术的如上技术问题中的至少一个。
图1示出了本公开实施例提供的一种数据查询方法的流程示意图,如图1中所示,该方法主要可以包括:
步骤S110:接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;
步骤S120:从索引服务中确定查询请求所调用的目标索引服务;
步骤S130:调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。
其中,索引服务是用于基于索引数据从数据源中进行数据查询的云服务。可以将多项索引服务的技术参数进行标准化,统一接入索引服务平台,使得索引服务平台能够统一地管理所接入的各项索引服务。
作为一个示例,索引服务平台可以基于软件即服务(Software as aService,SaaS)模式实现。各项索引服务可以抽象为云计算产品,索引服务平台相当于在各项索引服务的上层进行封装,由索引服务平台统一对外提供服务。
本公开实施例中,索引服务平台所管理的各项索引服务逻辑独立,各索引服务分别对应有数据源,并分别管理对应数据源的索引数据。各索引服务在被调度后可以独立地基于所管理的索引数据对相应数据源进行数据查询。
本公开实施例中,数据查询方可以向索引服务平台发起查询请求。数据查询方可以为用户,也可以为其他云服务。
作为一个示例,索引服务平台可以提供查询接口,数据查询方基于索引服务平台的查询接口发起数据查询请求。
本公开实施例中,查询请求中可以指定所需调用的目标索引服务,由索引服务平台调度目标索引服务进行数据查询。具体而言,可以将目标索引服务对应的数据源记做目标数据源,将目标数据源的索引数据记做目标索引数据,目标索引数据由目标索引服务管理。目标索引服务在被调用后,可以基于目标索引数据从目标数据源中进行数据查询,得到查询请求的查询结果。
本公开实施例中,在获取到查询请求的查询结果后,索引服务平台可以将查询结果返回给数据查询方。
本公开实施例中,由于是通过索引服务平台统一对外提供数据查询服务,使得数据查询方可以直接向索引服务平台发起数据查询请求,并指定所调用的索引服务,即可实现数据查询。在需要分别调用不同的索引服务时,也可以直接向索引服务平台发起数据查询请求,从而便于调用索引服务,便于实现基于索引服务的数据查询。
本公开实施例提供的方法,通过接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。
本公开实施例中,可以通过索引服务平台对所接入的各项索引服务进行统一管理,使得对索引服务的管理效率高。并且相关的索引算法也可以由索引服务平台统一管理,便于对索引算法的复用,也便于在索引服务平台层面对索引算法进行快速迭代。
本公开的一种可选方式中,从索引服务中确定查询请求所调用的目标索引服务,包括:
获取查询请求中携带的索引服务标识;
基于索引服务标识从索引服务中确定目标索引服务。
本公开实施例中,可以由数据查询方指定在进行数据查询时所调用的索引服务。将数据查询方指定的索引服务记做目标索引服务。在数据查询方指定了目标索引服务后,可以将目标索引服务的服务标识添加至查询请求中,使得查询请求中携带索引服务标识。
索引服务平台在接收到查询请求后,可以获取中查询请求携带的索引服务标识,从而基于索引服务标识确定目标索引服务,以便调用目标索引服务进行相应的数据查询。
本公开的一种可选方式中,调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,包括:
确定目标索引服务对应的服务实例;
基于目标索引服务对应的服务实例的当前运行状态,从目标索引服务对应的服务实例中确定目标服务实例;
调用目标服务实例基于目标索引数据从目标数据源中确定查询请求的查询结果。
本公开实施例中,各索引服务一般会对应有多个服务实例,可以对各服务实例的运行状态进行实时监控。在调度目标索引服务时,可以基于目标索引服务对应的各服务实例的当前运行状态,选择目标服务实例,从而调度目标服务实例向目标数据源进行数据查询。
本公开实施例中,当前运行状态可以表示服务实例在当前的运行情况,当前运行状态可以包括但是不限于计算资源的使用情况、存储资源的使用情况等。
作为一个示例,在服务实例的计算资源使用程度较低时,表示该服务实例具有空闲的计算资源,能够执行数据查询任务,可以将其作为目标服务实例。例如,可以从目标索引服务对应的服务实例中,选择计算资源使用程度最低的服务实例作为目标服务实例。
本公开的一种可选方式中,基于目标索引数据从目标数据源中确定查询请求的查询结果,包括:
获取查询请求携带的待查询索引字段;
响应于目标索引数据中存在待查询索引字段,基于待查询索引字段对目标数据源进行查询,得到查询请求的查询结果。
本公开实施例中,可以由数据查询方提交待查询索引字段,而后将待查询索引字段添加至查询请求,使得查询请求中能够携带有待查询索引字段。
在进行数据查询时,可以基于待查询索引字段向目标索引数据进行查询,确定目标索引数据中是否存在待查询索引字段,如果目标索引数据存在待查询索引字段,即索引数据中存在所需查询数据的数据片段,此时目标数据源中也应存在所需查询的完整数据,因此,可以基于查询索引字段对目标数据源进行查询,得到查询结果,即得到所需查询的完整数据。
如果目标索引数据不存在待查询索引字段,即索引数据中不存在所需查询数据的数据片段,此时目标数据源中也不存在所需查询的完整数据。此时可以返回查询结果为空。
本公开的一种可选方式中,索引数据包括以下至少一项:
倒排索引数据;
向量索引数据。
本公开实施例中,索引服务平台可以支持倒排索引形式的索引数据以及向量索引形式的索引数据。
图2示出了本公开实施例提供的一种索引服务创建方法的流程示意图,如图2中所示,该方法主要可以包括:
步骤S210:响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;
步骤S220:创建待索引数据源对应的当前索引数据;
步骤S230:基于当前索引数据,创建当前索引服务。
其中,服务创建方可以向索引服务平台发起索引服务的服务创建请求。索引服务平台可以提供用于发起服务创建请求的接口。
索引服务是用于基于索引数据从数据源中进行数据查询的云服务。可以将多项索引服务的技术参数进行标准化,统一接入索引服务平台,使得索引服务平台能够统一地管理所接入的各项索引服务。
作为一个示例,索引服务平台可以基于软件即服务(Software as aService,SaaS)模式实现。各项索引服务可以抽象为云计算产品,索引服务平台相当于在各项索引服务的上层进行封装,由索引服务平台统一对外提供服务。
本公开实施例中,索引服务需要对应有数据源,并管理数据源对应的索引数据,使得索引服务可以基于索引数据从数据源中进行数据查询。
索引服务的服务创建方可以在发起服务创建请求时,指定索引服务对应的数据源。例如,可以指定数据源的标识或者数据源的云路径,使得服务创建请求中可以携带有数据源的标识或者数据源的云路径,从而使得索引服务平台在接收到当前索引服务的服务创建请求后,能够确定出当前索引服务对应的待索引数据源。
本公开实施例中,可以创建待索引数据源对应的当前索引数据,并通过当前索引服务管理当前索引数据,从而实现对当前索引服务的创建。
作为一个示例,可以创建当前索引数据的索引数据库,将当前索引数据存储于该索引数据库中,由当前索引服务管理该索引数据库。
本公开实施例中,由于可以采用向索引服务平台发起对索引服务的创建请求的方式,使索引服务平台创建索引服务,便于进行索引服务的创建。相较于相关技术中基于具体业务进行索引服务的定制化创建,本方案中的索引服务的创建方式,具有更好地通用性,便于索引服务的推广与使用。
本公开实施例提供的方法,通过响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;创建待索引数据源对应的当前索引数据;基于当前索引数据,创建当前索引服务。基于本方案,能够便捷的创建索引服务,有助于索引服务的推广与使用。
本公开实施例中,在索引服务平台中所创建的各项索引服务的逻辑上是独立的,各索引服务分别对应有数据源,并分别管理对应数据源的索引数据,各索引服务在被调度后可以独立地基于索引数据对数据源进行数据查询。
本公开的一种可选方式中,创建待索引数据源对应的当前索引数据,包括:
获取服务创建请求中携带的数据筛选规则;
基于数据筛选规则对待索引数据源进行筛选,得到筛选后数据;
基于筛选后数据创建待索引数据源对应的当前索引数据。
本公开实施例中,在创建待索引数据源对应的当前索引数据时,可以使用待索引数据源中的部分数据片段来生成索引数据。为有效确定生成索引数据所需的数据,可以从服务创建请求中获取数据筛选规则。
本公开实施例中,可由服务创建方根据业务需求设定数据筛选规则,并在生成服务创建请求时将数据筛选规则添加至服务创建请求,使得服务创建请求能够携带有数据筛选规则。
索引服务平台在获取到数据筛选规则后,可以根据数据筛选规则对待索引数据源进行筛选,得到筛选后数据,从而基于筛选后数据创建当前索引数据。
本公开实施例中,可以将数据筛选规则进行存储,用于在后续数据源发生更新时,读取数据筛选规则,更新筛选后数据,进而更新当前索引数据。
本公开实施例中,索引服务平台可以对数据筛选规则进行存储及管理,服务创建方可以向索引服务平台发起数据筛选规则的更新请求,更新请求中可以携带新的数据筛选规则,使得索引服务平台能够对数据筛选规则进行更新。在数据筛选规则进行更新后,可以基于更新后数据筛选规则更新当前索引数据。
本公开的一种可选方式中,基于筛选后数据创建待索引数据源对应的当前索引数据,包括:
确定服务创建请求中所指定的索引算法;
基于索引算法,并基于筛选后数据创建待索引数据源对应的当前索引数据。
本公开实施例中,可以基于索引算法对筛选后数据进行创建索引运算,从而生成当前索引数据。
索引服务平台可以管理有多种索引算法,服务创建方可以根据业务需求进行选择。
作为一个示例,在生成服务创建请求时,可以将服务创建方所选择索引算法的算法标识添加至服务创建请求,使得服务创建请求能够携带有索引算法的算法标识,索引服务平台能够基于索引算法的算法标识快速确定出当前所使用的索引算法。
本公开实施例中,索引算法可以由索引服务平台统一管理,便于对索引算法的复用,也便于在索引服务平台层面对索引算法进行快速迭代。
本公开的一种可选方式中,上述方法还包括:
获取服务创建请求中携带的当前索引服务的资源需求信息;
基于资源需求信息,创建当前索引服务对应的服务实例。
本公开实施例中,资源需求信息为当前索引服务所需要使用的资源,通过资源需求信息能够向索引服务平台进行资源申请。
资源需求信息可以由服务创建方根据实际的业务情况设定,可以将资源需求信息添加至服务创建请求,使得服务创建请求能够携带有资源需求信息,索引服务平台能够基于资源需求信息为当前索引服务分配资源,并根据所分配的资源创建服务实例。
本公开实施例中,资源需求信息包括但是不限于计算资源需求信息以及内存资源需求信息。
作为一个示例,资源需求信息包括计算资源需求信息,如需要100个单位的CPU资源,索引服务平台可以为当前索引服务分配100个单位的CPU资源,并使得所创建的各服务实例中计算资源的总和为100个单位的CPU资源。
作为一个示例,基于服务创建请求创建当前索引服务的具体步骤可以包括:基于服务创建请求指定的数据筛选规则对所述待索引数据源进行筛选,得到筛选后数据。基于服务创建请求中所指定的索引算法,对筛选后数据进行创建索引运算,得到当前索引数据。根据服务创建请求中携带的资源需求信息,为当前索引服务分配资源,并根据所分配的资源创建服务实例。在创建服务实例后,可通过服务实例管理当前索引数据,即实现了对当前索引服务的创建。
本公开的一种可选方式中,在建当前索引服务对应的服务实例之后,上述方法还包括:
获取在预设监控周期内当前索引服务对应的服务实例的资源使用情况;
基于资源使用情况,对当前索引服务对应的服务实例进行资源配置。
本公开实施例中,索引服务平台可以定期对各服务实例的资源使用情况进行巡检。资源使用请求情况可以为资源超发或者资源不足,当资源使用请求情况为资源超发时,可以及时回收冗余资源,如回收冗余的计算资源或者降低内存容量。当资源使用请求情况为资源不足时,可以及时增发资源,如对内存容量进行扩充或者对计算资源进行增发。
本公开实施例中,还可以在索引服务层面进行资源使用情况的巡检,即基于索引服务下各服务实例的资源使用情况确定该索引服务的整体资源使用情况,基于索引服务的整体资源使用情况,对当前索引服务进行资源配置。当索引服务的整体资源使用情况为资源超发时,可以及时回收该索引服务的冗余资源。当索引服务的整体资源使用情况为资源不足时,可以为该索引服务及时增发资源。
本公开实施例中,在对索引服务进行资源使用情况的巡检时,还可以及时识别异常索引服务,对该索引服务进行相应处理。
作为一个示例,当某一索引服务对计算资源的使用量超出了某一使用量阈值时,可以认为该索引服务存在异常情况,如继续放任该索引服务超用计算资源,则可能影响索引服务平台整套系统的正常运行,这时可以对该索引服务所能够使用的计算资源限制。例如,使用量阈值可以为该索引服务创建时通过资源需求信息所申请资源量的一点五倍。在对该索引服务所能够使用的计算资源进行限制时,将其所能够使用的计算资源限制在所申请的资源量以下。
本公开实施例中,通过及时回收各索引服务的冗余资源,能够实现资源的有效共享,提升资源利用率。
本公开的一种可选方式中,在创建当前索引服务之后,上述方法还包括:
响应于检测到待索引数据源发生了数据更新,获取更新后的待索引数据源;
基于更新后的待索引数据源对当前索引数据进行更新。
本公开实施例中,数据源可能为流式数据,其数据会实时发生更新。可以定期检测待索引数据源是否发生了数据更新,并在待索引数据源发生了数据更新时,获取更新后的待索引数据源,从而基于更新后的待索引数据源对当前索引数据进行更新。
具体而言,可以基于数据筛选规则对更新后的待索引数据源进行数据筛选,得到更新后的筛选后数据,基于更新后的筛选后数据以及索引算法生成更新后的当前索引数据。
本公开实施例中,还可以支持服务创建方更改所使用的索引算法,并及时根据更改后的索引算法重新创建索引数据。
作为一个示例,图3为本公开实施例提供的索引服务平台的整体结构示意图。
如图3中所示,索引平台具体包括如下模块:
(1)索引引擎统一服务
索引引擎统一服务用于支持进行不同索引服务的部署。
索引算法引擎,用于管理索引算法,可以包括索引创建算法以及索引检索算法。
数据管理,用于管理索引数据以及数据源。
降级机制,用于对存在异常的索引服务进行降级处理,降级处理后,分配给索引服务的计算量会减少,避免单个索引服务的异常影响索引服务平台的整个系统。
实例状态管理,用于监控索引服务端的各服务实例的运行状态。
服务框架,是指将索引服务平台提供的各功能整合,并提供接口对外提供服务的整个系统框架。
(2)调度系统
调度系统用于根据索引服务平台的资源情况,服务创建方提出的创建索引服务时的资源需求信息,为索引服务的各服务实例分配资源。也用于在数据查询方发起数据查询请求时,根据目标索引服务的各服务实例的运行情况,调用目标服务实例进行数据查询。
名字服务,用于管理各索引服务的服务标识,以及各服务实例的实例标识等标识信息。
心跳汇报服务,用于通过心跳信号采集各服务实例的运行状态。
元数据管理,用于管理的各服务实例的运行状态,以便根据运行状态进行服务实例的调度。
控制台,用于对服务实例调度进行整体控制。
干预接口,用于实现人工干预,例如在发现某个实例故障时,可以人工进行服务实例移除操作,将故障实例移除。
(3)索引建库系统
索引建库系统用于根据服务创建请求中携带的数据筛选规则,创建索引数据,并创建用于存储索引数据的索引数据库。
建库信号分发,用于将创建索引数据库的各条指令会被分发给不同实例执行。
建库信号生成,即生成索引数据管理命令。例如,新建索引、更新索引以及删除索引的命令。
建库规则引擎,用于管理用户提供的数据筛选规则。
(4)配置管理系统
整个系统有大量的用户与平台、平台与各子系统之间的配置信息同步。配置信息的存储、分发可以通过配置管理系统进行。配置管理系统,将配置信息进行集中管理,并负责在各索引服务之间进行最终一致的配置同步。
(5)索引人/机入口
索引人/机入口即索引接入平台,用于向用户提供自助的创建索引服务,以及进行系统调试的能力。另外索引接入平台也会定期展开所有索引产品实例的巡检,回收冗余资源,识别超用的一些业务,以及一些日常的索引维护,例如计算资源评估、计算量扩容等。
索引信息管理,索引的具体信息如索引的算法引擎、索引数据库、索引服务的创建方、筛选后数据等一些业务相关的信息。
新索引产品接入,即向用户提供自助的创建索引服务的功能。
自助系统,用户可以自助参与一些日常服务,如索引服务的扩容、缩容,加资源,下线等。自助系统所针对的可以是比较安全的一些操作。
巡检机制,是指巡检各索引服务的状态。
联调系统,用于在巡检发现异常的索引服务,确定异常原因。
(6)标准索引产品
标准索引产品,即以云计算产品形式对外提供的索引服务,如可以包括令牌索引(Token Index)产品、向量索引(Vec Index)产品等。
基于与图1中所示的方法相同的原理,图4示出了本公开实施例提供的一种数据查询装置的结构示意图,如图4所示,该数据查询装置40可以包括:
查询请求接收模块410,用于接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;
目标索引服务确定模块420,用于从索引服务中确定查询请求所调用的目标索引服务;
数据查询模块430,用于调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。
本公开实施例提供的装置,通过接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。
可选地,目标索引服务确定模块具体用于:
获取查询请求中携带的索引服务标识;
基于索引服务标识从索引服务中确定目标索引服务。
可选地,数据查询模块在调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果时,具体用于:
确定目标索引服务对应的服务实例;
基于目标索引服务对应的服务实例的当前运行状态,从目标索引服务对应的服务实例中确定目标服务实例;
调用目标服务实例基于目标索引数据从目标数据源中确定查询请求的查询结果。
可选地,数据查询模块在基于目标索引数据从目标数据源中确定查询请求的查询结果时,具体用于:
获取查询请求携带的待查询索引字段;
响应于目标索引数据中存在待查询索引字段,基于待查询索引字段对目标数据源进行查询,得到查询请求的查询结果。
可选地,索引数据包括以下至少一项:
倒排索引数据;
向量索引数据。
可以理解的是,本公开实施例中的数据查询装置的上述各模块具有实现图1中所示的实施例中的数据查询方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述数据查询装置的各模块的功能描述具体可以参见图1中所示实施例中的数据查询方法的对应描述,在此不再赘述。
基于与图2中所示的方法相同的原理,图5示出了本公开实施例提供的一种索引服务创建装置的结构示意图,如图5所示,该索引服务创建装置50可以包括:
待索引数据源确定模块510,用于响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;
索引数据创建模块520,用于创建待索引数据源对应的当前索引数据;
索引服务创建模块530,用于基于当前索引数据,创建当前索引服务。
本公开实施例提供的装置,通过响应于接收到对待创建的当前索引服务的服务创建请求,确定当前索引服务对应的待索引数据源;创建待索引数据源对应的当前索引数据;基于当前索引数据,创建当前索引服务。基于本方案,能够便捷的创建索引服务,有助于索引服务的推广与使用。
可选地,索引数据创建模块具体用于:
获取服务创建请求中携带的数据筛选规则;
基于数据筛选规则对待索引数据源进行筛选,得到筛选后数据;
基于筛选后数据创建待索引数据源对应的当前索引数据。
可选地,索引数据创建模块在基于筛选后数据创建待索引数据源对应的当前索引数据时,具体用于:
确定服务创建请求中所指定的索引算法;
基于索引算法,并基于筛选后数据创建待索引数据源对应的当前索引数据。
可选地,上述装置还包括资源配置模块,资源配置模块用于:
获取服务创建请求中携带的当前索引服务的资源需求信息;
基于资源需求信息,创建当前索引服务对应的服务实例。
可选地,上述装置还包括资源巡检模块,资源巡检模块用于:
在建当前索引服务对应的服务实例之后,获取在预设监控周期内当前索引服务对应的服务实例的资源使用情况;
基于资源使用情况,对当前索引服务对应的服务实例进行资源配置。
可选地,上述装置还包括索引数据更新模块,索引数据更新模块用于:
在创建当前索引服务之后,响应于检测到待索引数据源发生了数据更新,获取更新后的待索引数据源;
基于更新后的待索引数据源对当前索引数据进行更新。
可以理解的是,本公开实施例中的索引服务创建装置的上述各模块具有实现图2中所示的实施例中的索引服务创建方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述索引服务创建装置的各模块的功能描述具体可以参见图2中所示实施例中的索引服务创建方法的对应描述,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如本公开实施例提供的数据查询或者索引服务创建方法。
该电子设备与现有技术相比,通过接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。
该可读存储介质为存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如本公开实施例提供的数据查询或者索引服务创建方法。
该可读存储介质与现有技术相比,通过接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。
该计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如本公开实施例提供的数据查询或者索引服务创建方法。
该计算机程序产品与现有技术相比,通过接收向索引服务平台发起的查询请求,索引服务平台管理有多个索引服务,各索引服务分别对应有数据源,各索引服务分别管理对应数据源的索引数据;从索引服务中确定查询请求所调用的目标索引服务;调用目标索引服务基于目标索引数据从目标数据源中确定查询请求的查询结果,目标数据源为目标索引服务对应的数据源,目标索引数据为目标数据源的索引数据。基于本方案,能够通过直接向索引服务平台发起查询请求,使索引服务平台调用相应的索引服务进行数据查询,便于对索引服务的调用。
图6示出了可以用来实施本公开的实施例的示例电子设备60的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,电子设备60包括计算单元610,其可以根据存储在只读存储器(ROM)620中的计算机程序或者从存储单元680加载到随机访问存储器(RAM)630中的计算机程序,来执行各种适当的动作和处理。在RAM 630中,还可存储设备60操作所需的各种程序和数据。计算单元610、ROM 620以及RAM 630通过总线640彼此相连。输入/输出(I/O)接口650也连接至总线640。
设备60中的多个部件连接至I/O接口650,包括:输入单元660,例如键盘、鼠标等;输出单元670,例如各种类型的显示器、扬声器等;存储单元680,例如磁盘、光盘等;以及通信单元690,例如网卡、调制解调器、无线通信收发机等。通信单元690允许设备60通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元610可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元610的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元610执行本公开实施例中所提供的数据查询或者索引服务创建方法。例如,在一些实施例中,执行本公开实施例中所提供的数据查询或者索引服务创建方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元680。在一些实施例中,计算机程序的部分或者全部可以经由ROM 620和/或通信单元690而被载入和/或安装到设备60上。当计算机程序加载到RAM 630并由计算单元610执行时,可以执行本公开实施例中所提供的数据查询或者索引服务创建方法的一个或多个步骤。备选地,在其他实施例中,计算单元610可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开实施例中所提供的数据查询或者索引服务创建方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (20)

1.一种数据查询方法,包括:
接收向索引服务平台发起的查询请求,所述索引服务平台管理有多个索引服务,各所述索引服务分别对应有数据源,各所述索引服务分别管理对应数据源的索引数据;
从所述索引服务中确定所述查询请求所调用的目标索引服务;
调用所述目标索引服务基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果,所述目标数据源为所述目标索引服务对应的数据源,所述目标索引数据为所述目标数据源的索引数据。
2.根据权利要求1所述的方法,其中,所述从所述索引服务中确定所述查询请求所调用的目标索引服务,包括:
获取所述查询请求中携带的索引服务标识;
基于所述索引服务标识从所述索引服务中确定目标索引服务。
3.根据权利要求1或2所述的方法,其中,所述调用所述目标索引服务基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果,包括:
确定所述目标索引服务对应的服务实例;
基于所述目标索引服务对应的服务实例的当前运行状态,从所述目标索引服务对应的服务实例中确定目标服务实例;
调用所述目标服务实例基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果。
4.根据权利要求1-3中任一项所述的方法,其中,所述基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果,包括:
获取所述查询请求携带的待查询索引字段;
响应于所述目标索引数据中存在所述待查询索引字段,基于所述待查询索引字段对所述目标数据源进行查询,得到所述查询请求的查询结果。
5.根据权利要求1-4中任一项所述的方法,其中,所述索引数据包括以下至少一项:
倒排索引数据;
向量索引数据。
6.一种索引服务创建方法,包括:
响应于接收到对待创建的当前索引服务的服务创建请求,确定所述当前索引服务对应的待索引数据源;
创建所述待索引数据源对应的当前索引数据;
基于所述当前索引数据,创建所述当前索引服务。
7.根据权利要求6所述的方法,其中,所述创建所述待索引数据源对应的当前索引数据,包括:
获取所述服务创建请求中携带的数据筛选规则;
基于所述数据筛选规则对所述待索引数据源进行筛选,得到筛选后数据;
基于所述筛选后数据创建所述待索引数据源对应的当前索引数据。
8.根据权利要求7所述的方法,其中,所述基于所述筛选后数据创建所述待索引数据源对应的当前索引数据,包括:
确定所述服务创建请求中所指定的索引算法;
基于所述索引算法,并基于所述筛选后数据创建所述待索引数据源对应的当前索引数据。
9.根据权利要求6-8中任一项所述的方法,其中,还包括:
获取所述服务创建请求中携带的所述当前索引服务的资源需求信息;
基于所述资源需求信息,创建所述当前索引服务对应的服务实例。
10.根据权利要求9所述的方法,其中,在所述建所述当前索引服务对应的服务实例之后,所述方法还包括:
获取在预设监控周期内所述当前索引服务对应的服务实例的资源使用情况;
基于所述资源使用情况,对所述当前索引服务对应的服务实例进行资源配置。
11.根据权利要求6-10中任一项所述的方法,其中,在所述创建所述当前索引服务之后,所述方法还包括:
响应于检测到所述待索引数据源发生了数据更新,获取更新后的所述待索引数据源;
基于更新后的所述待索引数据源对所述当前索引数据进行更新。
12.一种数据查询装置,包括:
查询请求接收模块,用于接收向索引服务平台发起的查询请求,所述索引服务平台管理有多个索引服务,各所述索引服务分别对应有数据源,各所述索引服务分别管理对应数据源的索引数据;
目标索引服务确定模块,用于从所述索引服务中确定所述查询请求所调用的目标索引服务;
数据查询模块,用于调用所述目标索引服务基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果,所述目标数据源为所述目标索引服务对应的数据源,所述目标索引数据为所述目标数据源的索引数据。
13.根据权利要求12所述的装置,其中,所述目标索引服务确定模块具体用于:
获取所述查询请求中携带的索引服务标识;
基于所述索引服务标识从所述索引服务中确定目标索引服务。
14.根据权利要求12或13所述的装置,其中,所述数据查询模块在调用所述目标索引服务基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果时,具体用于:
确定所述目标索引服务对应的服务实例;
基于所述目标索引服务对应的服务实例的当前运行状态,从所述目标索引服务对应的服务实例中确定目标服务实例;
调用所述目标服务实例基于目标索引数据从所述目标数据源中确定所述查询请求的查询结果。
15.一种索引服务创建装置,包括:
待索引数据源确定模块,用于响应于接收到对待创建的当前索引服务的服务创建请求,确定所述当前索引服务对应的待索引数据源;
索引数据创建模块,用于创建所述待索引数据源对应的当前索引数据;
索引服务创建模块,用于基于所述当前索引数据,创建所述当前索引服务。
16.根据权利要求15所述的装置,其中,所述索引数据创建模块具体用于:
获取所述服务创建请求中携带的数据筛选规则;
基于所述数据筛选规则对所述待索引数据源进行筛选,得到筛选后数据;
基于所述筛选后数据创建所述待索引数据源对应的当前索引数据。
17.根据权利要求16所述的装置,其中,所述索引数据创建模块在基于所述筛选后数据创建所述待索引数据源对应的当前索引数据时,具体用于:
确定所述服务创建请求中所指定的索引算法;
基于所述索引算法,并基于所述筛选后数据创建所述待索引数据源对应的当前索引数据。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。
CN202310989548.2A 2023-08-07 2023-08-07 数据查询、索引服务创建方法、装置及电子设备 Pending CN116821175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310989548.2A CN116821175A (zh) 2023-08-07 2023-08-07 数据查询、索引服务创建方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310989548.2A CN116821175A (zh) 2023-08-07 2023-08-07 数据查询、索引服务创建方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116821175A true CN116821175A (zh) 2023-09-29

Family

ID=88118624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310989548.2A Pending CN116821175A (zh) 2023-08-07 2023-08-07 数据查询、索引服务创建方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116821175A (zh)

Similar Documents

Publication Publication Date Title
CN111049705B (zh) 一种监控分布式存储系统的方法及装置
CN111506401B (zh) 自动驾驶仿真任务调度方法、装置、电子设备及存储介质
CN112231108A (zh) 任务处理方法、装置、计算机可读存储介质及服务器
CN105740085A (zh) 容错处理方法及装置
CN115658311A (zh) 一种资源的调度方法、装置、设备和介质
US10331484B2 (en) Distributed data platform resource allocator
CN113032093B (zh) 分布式计算方法、装置及平台
CN114518974A (zh) 数据处理任务的检查点恢复方法、装置、设备及介质
CN114579323A (zh) 一种线程处理方法、装置、设备及介质
CN111064586B (zh) 一种分布式并行计费方法
CN112631756A (zh) 一种应用于航天测控软件的分布式调控方法及装置
CN109302723B (zh) 一种基于互联网的多节点实时无线电监测控制方法
CN113032092B (zh) 分布式计算方法、装置及平台
CN116821175A (zh) 数据查询、索引服务创建方法、装置及电子设备
CN115309558A (zh) 一种资源调度管理系统、方法、计算机设备及存储介质
CN116185578A (zh) 计算任务的调度方法和计算任务的执行方法
CN114610719A (zh) 跨集群数据处理方法、装置、电子设备以及存储介质
CN114862223A (zh) 一种机器人调度方法、装置、设备及存储介质
CN114090234A (zh) 请求的调度方法、装置、电子设备和存储介质
CN113656239A (zh) 针对中间件的监控方法、装置及计算机程序产品
CN116991562B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN114780021B (zh) 副本修复方法、装置、电子设备及存储介质
CN108984271A (zh) 一种均衡负载的方法以及相关设备
US20230195594A1 (en) Extensibility to monitor multiple products
CN115858309B (zh) 面向分布式系统的数据监控方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination