CN115348185B - 一种分布式查询引擎的控制方法及其控制装置 - Google Patents
一种分布式查询引擎的控制方法及其控制装置 Download PDFInfo
- Publication number
- CN115348185B CN115348185B CN202210998964.4A CN202210998964A CN115348185B CN 115348185 B CN115348185 B CN 115348185B CN 202210998964 A CN202210998964 A CN 202210998964A CN 115348185 B CN115348185 B CN 115348185B
- Authority
- CN
- China
- Prior art keywords
- data source
- cluster manager
- cluster
- master node
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000012986 modification Methods 0.000 claims abstract description 123
- 230000004048 modification Effects 0.000 claims abstract description 123
- 238000004891 communication Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 42
- 230000000903 blocking effect Effects 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 19
- 238000012217 deletion Methods 0.000 claims description 16
- 230000037430 deletion Effects 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 12
- 230000002085 persistent effect Effects 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000007726 management method Methods 0.000 description 15
- 230000000007 visual effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/22—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/0246—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种分布式查询引擎的控制方法及其控制装置,用于提高集群管理的效率,控制方法包括:集群管理器接收客户端发送的数据源的修改信息;集群管理器将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,以使得主节点通过广播方式将数据源的修改信息向主节点下所有子节点发送。本申请实施例改变了集群管理器的工作流程,允许集群管理器在启动后修改数据源。在修改数据源时,通过接口的方式动态修改索引集群的数据源,无需集群管理器停机,集群管理器的程序能够连续工作,提高了集群管理的效率。
Description
技术领域
本申请实施例涉及查询引擎领域,具体涉及一种分布式查询引擎的控制方法及其控制装置。
背景技术
现有技术提供了一种分布式向量检索引擎,包括:索引集群和集群管理器。其中,索引集群用于提供检索服务。索引集群包括多个节点。节点的具体数量由集群管理器决定。每个节点包括向量索引组件和查询组件。向量索引组件用于存储检索匹配数据。检索匹配数据为向量数据。检索匹配数据包括图像数据、视频数据、语音数据和文本数据中的至少一种数据。向量索引组件还用于提供最近邻检索引擎和/或近似最近邻检索引擎。最近邻检索引擎为基于线性扫描的最近邻检索引擎。近似最近邻检索引擎为基于量化的近似最近邻检索引擎。查询组件用于提供查询聚合服务,每个节点的查询组件均连接多个节点,因此保证了节点的统一和维护的便利性。集群管理器用于获取索引集群的信息,以进行数据均衡负载。
现有技术的方案中,集群管理器的工作流程要求在启动前确定所有的数据源,当需要对索引集群的数据源进行修改时,必须将集群管理器停机,修改集群管理器中索引集群的数据源,然后重新启动集群管理器使得集群管理器能够管理修改后的索引集群的数据源。
现有技术修改索引集群的数据源,必须将集群管理器停机,步骤繁琐,且由此造成了集群管理进程的中断,集群管理效率低下。
发明内容
本申请实施例提供了一种分布式查询引擎的控制方法及其控制装置,用于提高集群管理的效率。
本申请实施例第一方面提供了一种分布式查询引擎的控制方法,包括:分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
集群管理器接收客户端发送的数据源的修改信息;
集群管理器将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,以使得主节点通过广播方式将数据源的修改信息向主节点下所有子节点发送。
可选的,修改数据源接口包括新增数据源接口和删除数据源接口;
数据源的修改信息包括数据库的链接信息;
链接信息包括修改标识字符,修改标识字符包括新增标识字符或删除标识字符;
集群管理器将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,具体包括:
集群管理器从数据库的链接信息中读取修改标识字符;
若修改标识字符是新增标识字符,则集群管理器将数据库的链接信息通过主节点的新增数据源接口,发送到注册在集群管理器的所有主节点;
若修改标识字符是删除标识字符,则集群管理器将数据库的链接信息通过主节点的删除数据源接口,发送到注册在集群管理器的所有主节点。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
方法还包括:
集群管理器接收客户端发送的数据库的配置信息;
集群管理器将数据库的配置信息,通过主节点的更新数据源接口发送到注册在集群管理器的所有主节点,以使得主节点接口通过广播方式将数据库的配置信息向主节点下所有子节点发送。
可选的,方法还包括:
集群管理器通过主节点的代理接口收集索引集群的运行状况;
集群管理器根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用;
若注册在集群管理器的所有主节点存在可用节点,集群管理器将所有可用节点放入可用节点集合;
集群管理器对所有可用节点在预设时间内的任务量进行排序;
集群管理器从所有可用节点中选取任务量最少的目标主节点;
集群管理器接收客户端发送的数据处理请求,并向目标主节点发送数据处理请求。
可选的,集群管理器根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用,具体包括:
集群管理器根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务;
集群管理器确定阻塞超时任务对应的主节点为不可用节点,确定不可用节点之外其余主节点为可用节点。
可选的,集群管理器根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务后,方法还包括:
若存在阻塞超时任务,集群管理器根据预设的告警设置向客户端发送告警信息;
集群管理器将阻塞超时任务注册为异步任务。
可选的,集群管理器根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用后,方法还包括:
若注册在集群管理器的所有主节点存在不可用节点,集群管理器将不可用节点放入不可用节点集合;
集群管理器从子节点中确定目标子节点,将目标子节点注册为主节点替补不可用节点。
可选的,方法还包括:
集群管理器对数据源的修改信息进行唯一性校验,若校验通过则生成唯一的数据源标识,唯一性校验用于确保客户端和数据库之间仅有一条数据源标识;
集群管理器接收客户端发送的数据处理请求;
集群管理器获取数据处理请求对应的数据源标识、数据库标识或数据表标识;
集群管理器获取客户端的用户标识;
集群管理器查询用户标识对应的数据库权限或数据表权限,判断数据源标识、数据库标识或数据表标识是否在数据库权限或数据表权限内;
若数据源标识、数据库标识或数据表标识不在数据库权限或数据表权限内,则拒绝数据处理请求。
可选的,方法还包括:
集群管理器接收客户端发送的弹性策略阈值;
集群管理器根据弹性策略阈值判断分布式查询引擎是处于流量高峰还是流量低谷;
若处于流量高峰,集群管理器向索引集群新增主节点;
若处于流量低谷,集群管理器从索引集群删除主节点。
本申请实施例第二方面提供了一种分布式查询引擎的控制方法,包括:分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
主节点通过主节点的修改数据源接口,接收集群管理器发送的数据源的修改信息;
主节点通过广播方式,将数据源的修改信息向主节点下所有子节点发送。
可选的,数据源的修改信息包括数据库的链接信息;
修改数据源接口包括新增数据源接口和删除数据源接口;
主节点通过主节点的修改数据源接口,接收集群管理器发送的数据源的修改信息,具体包括:
主节点通过主节点的新增数据源接口,接收集群管理器发送的数据库的链接信息;
或者,主节点通过主节点的删除数据源接口,接收集群管理器发送的数据库的链接信息。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
方法还包括:
主节点通过主节点的更新数据源接口,接收集群管理器发送的数据库的配置信息;
主节点通过广播方式,将数据库的配置信息向主节点下所有子节点发送。
可选的,方法还包括:
主节点监测主节点的运行状况;
主节点通过主节点的代理接口,向集群管理器发送主节点的运行状况。
本申请实施例第三方面提供了一种分布式查询引擎的控制装置,分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
控制装置包括:
接收单元,用于接收客户端发送的数据源的修改信息;
发送单元,用于将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,以使得主节点通过广播方式将数据源的修改信息向主节点下所有子节点发送。
可选的,修改数据源接口包括新增数据源接口和删除数据源接口;
数据源的修改信息包括数据库的链接信息;
链接信息包括修改标识字符,修改标识字符包括新增标识字符或删除标识字符;
发送单元,具体包括:
读取子单元,用于从数据库的链接信息中读取修改标识字符;
发送子单元,用于在修改标识字符是新增标识字符时,将数据库的链接信息通过主节点的新增数据源接口,发送到注册在集群管理器的所有主节点;
发送子单元,还用于在修改标识字符是删除标识字符时,将数据库的链接信息通过主节点的删除数据源接口,发送到注册在集群管理器的所有主节点。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
接收单元,还用于接收客户端发送的数据库的配置信息;
发送单元,还用于将数据库的配置信息,通过主节点的更新数据源接口发送到注册在集群管理器的所有主节点,以使得主节点接口通过广播方式将数据库的配置信息向主节点下所有子节点发送。
可选的,控制装置还包括:
收集单元,用于通过主节点的代理接口收集索引集群的运行状况;
判断单元,用于根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用;
放入单元,用于在注册在集群管理器的所有主节点存在可用节点时,将所有可用节点放入可用节点集合;
排序单元,用于对所有可用节点在预设时间内的任务量进行排序;
选取单元,用于从所有可用节点中选取任务量最少的目标主节点;
接收单元,还用于接收客户端发送的数据处理请求;
发送单元,还用于向目标主节点发送数据处理请求。
可选的,判断单元,具体包括:
判断子单元,用于根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务;
确定子单元,用于确定阻塞超时任务对应的主节点为不可用节点,确定不可用节点之外其余主节点为可用节点。
可选的,集群管理器根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务后,控制装置还包括:
告警单元,用于在存在阻塞超时任务时,根据预设的告警设置向客户端发送告警信息;
异步单元,用于将阻塞超时任务注册为异步任务。
可选的,放入单元,还用于在注册在集群管理器的所有主节点存在不可用节点时,将不可用节点放入不可用节点集合;
控制装置还包括:替补单元,用于从子节点中确定目标子节点,将目标子节点注册为主节点替补不可用节点。
可选的,控制装置还包括:
校验单元,用于对数据源的修改信息进行唯一性校验,若校验通过则生成唯一的数据源标识,唯一性校验用于确保客户端和数据库之间仅有一条数据源标识;
接收单元,还用于接收客户端发送的数据处理请求;
获取单元,用于获取数据处理请求对应的数据源标识、数据库标识或数据表标识;
获取单元,还用于获取客户端的用户标识;
查询单元,用于查询用户标识对应的数据库权限或数据表权限,判断数据源标识、数据库标识或数据表标识是否在数据库权限或数据表权限内;
拒绝单元,用于在数据源标识、数据库标识或数据表标识不在数据库权限或数据表权限内时,拒绝数据处理请求。
可选的,控制装置还包括:
接收单元,还用于接收客户端发送的弹性策略阈值;
判断单元,还用于根据弹性策略阈值判断分布式查询引擎是处于流量高峰还是流量低谷;
新增单元,用于在处于流量高峰时,向索引集群新增主节点;
删除单元,用于在处于流量低谷时,从索引集群删除主节点。
本申请实施例第四方面提供了一种分布式查询引擎的控制装置,包括:分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
接收单元,用于通过主节点的修改数据源接口,接收集群管理器发送的数据源的修改信息;
发送单元,用于通过广播方式,将数据源的修改信息向主节点下所有子节点发送。
可选的,数据源的修改信息包括数据库的链接信息;
修改数据源接口包括新增数据源接口和删除数据源接口;
接收单元,具体用于:
通过主节点的新增数据源接口,接收集群管理器发送的数据库的链接信息;
或者,通过主节点的删除数据源接口,接收集群管理器发送的数据库的链接信息。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
接收单元,还用于通过主节点的更新数据源接口,接收集群管理器发送的数据库的配置信息;
发送单元,还用于通过广播方式,将数据库的配置信息向主节点下所有子节点发送。
可选的,控制装置还包括:
监测单元,用于监测主节点的运行状况;
代理单元,用于通过主节点的代理接口,向集群管理器发送主节点的运行状况。
本申请实施例第五方面提供了一种计算机设备,包括:
中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;
存储器为短暂存储存储器或持久存储存储器;
中央处理器配置为与存储器通信,并执行存储器中的指令操作以执行第一方面或第二方面的方法。
本申请实施例的第六方面提供了一种计算机可读存储介质,计算机可读存储介质包括指令,当指令在计算机上运行时,使得计算机执行第一方面或第二方面的方法。
本申请实施例的第七方面提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行第一方面或第二方面的方法。
本申请实施例的第八方面提供了一种芯片系统,芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行第一方面或第二方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例改变了集群管理器的工作流程,允许集群管理器在启动后修改数据源。在主节点设置了修改数据源接口。修改数据源接口是在主节点的源代码设置的接口。在修改数据源时,通过接口的方式动态修改索引集群的数据源,无需集群管理器停机,集群管理器的程序能够连续工作,提高了集群管理的效率。
附图说明
图1是本申请实施例分布式查询引擎的控制方法的一种流程图;
图2是本申请实施例分布式查询引擎的拓扑结构示意图;
图3是本申请实施例分布式查询引擎的控制方法的一种信令流程图;
图4是本申请实施例分布式查询引擎的控制方法的另一种信令流程图;
图5是本申请实施例分布式查询引擎的控制方法的另一种信令流程图;
图6是本申请实施例分布式查询引擎的控制方法的另一种流程图;
图7是本申请实施例分布式查询引擎的控制方法的另一种流程图;
图8是本申请实施例分布式查询引擎的控制方法的另一种信令流程图;
图9是本申请实施例分布式查询引擎的控制方法的另一种流程图;
图10是本申请实施例分布式查询引擎的控制装置的一种架构图;
图11是本申请实施例分布式查询引擎的控制装置的另一种架构图;
图12是本申请实施例分布式查询引擎的控制装置的另一种架构图;
图13是本申请实施例分布式查询引擎的控制装置的另一种架构图;
图14是本申请实施例的计算机设备的示意图。
具体实施方式
本申请实施例可以由计算机设备实现,计算机设备可以包括终端以及服务器中的至少之一,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
如图1所示,本申请实施例提供了一种分布式查询引擎的控制方法,分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
101、集群管理器接收客户端发送的数据源的修改信息;
客户端编辑或选择数据源的修改信息,并发送到集群管理器。集群管理器通过网络接口接收客户端发送的数据源的修改信息。
102、集群管理器将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点。
集群管理器确定数据源的修改信息的类型,并根据数据源的修改信息的类型确定主节点的修改数据源接口的类型,将数据源的修改信息通过相应类型的主节点的修改数据源接口发送。集群管理器可以依次将数据源的修改信息发送到所有主节点,也可以通过广播的方式发送到所有主节点。主节点在接收到数据源的修改信息后,通过广播方式将数据源的修改信息向主节点下所有子节点发送。
本申请实施例在快速搭建高性能、高可用,高并发的查询引擎集群的基础上,针对海量数据(PB级,1PB=1024TB)实现快速地交互式分析。集群管理前端包含了控制面板、节点管理、查询计划、历史记录、弹性策略、预警监控、用户中心、集群设置等八大功能模块,以可视化界面的操作方式对查询引擎进行全方位管理,大大提高了集群管理效率,降低了操作上手难度。通过Server-Client的架构模式,屏蔽了底层操作细节,保证了系统安全性。
客户端也可以称为集群管理前端或client端。集群管理器也可以称为集群管理后端、服务端或server端。索引集群可以简称集群。分布式查询引擎可以简称查询引擎或引擎。
在开发融合分析平台(multiple analysis platform,MAP)的过程中,需要一种查询引擎,可以实时处理查询和计算图表所需要的数据,因为图表的数据来源、数据量级都是不确定的。在现有的联机分析处理(on-line analytic processing,OLAP)技术的基础上,本申请实施例的查询计算业务对查询引擎有以下几点要求:
1、处理PB级别以上的数据;
2、不停机水平扩容增加节点来提高算力;
3、支持各种主流的数据库或者自定义的数据连接器类型;
4、不停机动态增加数据源;
5、使用通用的结构化查询语言(structured query language,SQL)来提交任务;
6、在秒级别返回响应,并且可以自定义选择缓存模式;
7、在主节点宕机的情况下,不影响业务正常运行;
8、可以做到用户级别和表级别的权限控制;
9、故障自愈,弹性自实适应流量峰谷;
10、历史信息留存分析,针对性任务优化,监控自告警。
为应对以上技术需求,在现有的开源的分布式查询引擎的基础上进行优化和二次开发,改造了底层源码,研发新的中间调度层,研发可视化操作界面,以适应产品需要。
本申请实施例拓展了丰富的数据源支持,如文件数据源、在线数据源等;在集群管理器不停机的情况下通过接口广播机制动态增加数据源;提供小规模数据、大批量查询的集群模式和海量数据复杂查询低频率的集群模式,给业务提供一个适合的底层引擎。
客户端实现普通用户的可视化界面操作;集群管理器通过远程连接工具(SecureShell,SSH),来操作每一个集群节点。客户端可以采用flutter编写,可以编译成windows,linux,macOS,浏览器,安卓,IOS等各个主流的操作界面,用户可以在任意平台上通过管理工具来管理索引集群。flutter是基于编程语言dart的跨平台前端界面开发框架。集群管理器采用django开发,可以安装在linux操作系统上。django是基于编程语言pythont的web框架。客户端可以登录到集群管理器上,向集群管理器发送数据处理请求,通过集群管理器向索引集群发送各种调度指令。
集群管理由客户端和集群管理器实现,其中拓扑结构如图2所示。
一个集群管理器201可以管理若干索引集群。索引集群由主节点202和子节点203构成。每个索引集群可以包括若干主节点202。每个主节点202下有多个子节点203。多个客户端204与集群管理器201连接。
在一种实现方式中,在不停机的情况下,用户在客户端可视化界面中,输入数据库的链接信息,通过HTTP接口发送到集群管理器,通过唯一性校验,生成唯一的连接ID。需要说明的是,除了输入数据库的链接信息,如果是其他类型的数据源,也可以输入数据库的配置信息。
集群管理器通过轮训方式,将数据库的链接信息发送到注册在集群管理器的所有主节点。改造后的主节点,新增了三个处理数据源的接口,分别是新增数据源接口、更新数据源接口和删除数据源接口。主节点接收集群管理器发送的数据库的链接信息,通过MAP数据结构存储,来保证唯一性,并持久化到该主节点的磁盘中,保证集群管理器停机重启也能载入数据库的链接信息。轮训方式是指循环、依次执行的方式。
主节点通过广播方式,下发到与主节点连接的所有子节点,保证所有的子节点的配置信息是一致的。这样一条新的链接信息就注册到了索引集群中,用户可以通过指定连接ID,来实现跨源查询。连接ID也可以称为源ID。
在进行请求处理时,主节点对各类SQL语句进行词法解析、语法分析、语义分析和语句优化,生成执行计划,得到多个子任务,最后在主节点的调度模块进行任务的分发,把子任务分发到各个worker节点。worker节点是实际的执行节点,会执行包括聚合、排序、连接(join)以及去重等操作。
需要说明的是,主节点也可以称为master节点。子节点也可以称为worker节点或工作节点。
数据源的修改信息可以包括数据库的链接信息或数据库的配置信息。其中,数据库的链接信息可以有不同的修改标识字符,例如新增标识字符和删除标识字符。
修改数据源接口有多种,例如新增数据源接口、删除数据源接口和更新数据源接口。不同的修改数据源接口对应不同的数据源的修改信息,新增数据源接口,对应具有新增标识字符的数据库的链接信息;删除数据源接口,对应具有删除标识字符的数据库的链接信息;更新数据源接口,对应数据库的配置信息。
下面根据修改数据源接口的不同详细说明分布式查询引擎的控制方法的步骤。
一、如图3所示,新增数据源接口:
301、客户端显示可视化界面。
客户端可以设置多个功能模块,功能模块能够在可视化界面中显示。功能模块例如:控制面板模块、节点管理模块、查询计划模块、历史记录模块、弹性策略模块、监控预警模块、用户中心模块和集群设置模块。下面对各个功能模块进行说明。
控制面板模块:用于通过集群管理器接口,展示整个集群的负载情况,包含子节点的排队状况,载入行数等基础信息;主节点的内存、CPU、磁盘使用信息,已经连接的数据源信息。用户还能够通过控制面板模块搜索数据源信息,增加数据源连接,编辑数据源连接。
节点管理模块:用于展示集群节点卡片,包括主机,端口,运行状况等节点基本信息。用户还能够通过节点管理模块手动停止,启动,增加集群节点。集群节点包括主节点和子节点。
查询计划模块:用于选择数据源,格式美化SQL语句;执行SQL语句,输出查询结果和报错信息,并将查询结果导出为数据模型。
历史记录模块:用于查询和分析历史执行过的的查询任务。
弹性策略模块:用于进行机房选择,开启调度策略,自定义最大最小副本数量,选择调度策略,峰谷模式定时弹性伸缩,设置定时计划(cron)调度任务。调度策略也可以称为弹性策略。
监控预警模块:用于进行集群告警模式设置,告警阈值设置,告警自修复策略选择,告警邮件发送设置。
用户中心模块:用于设置用户基本信息,租户信息展示,权限展示,界面设置。
集群设置模块:用于私人化部署时设置主节点基本配置,节点副本发送配置,节点注册模式设置。
302、客户端在可视化界面中接收数据库的链接信息。
客户端可以通过可视化界面接收用户输入或选择的数据库的链接信息。
303、集群管理器接收客户端发送的数据库的链接信息。
客户端与集群管理器可以通过HTTP接口等网络接口通讯连接。
在一种实现方式中,集群管理器是通过HTTP请求接口的方式来与客户端交互的。集群管理器与集群主节点,是通过传输控制协议(transmission control protocol,TCP)通信来交互的。
集群管理器可以划分为多个功能模块:
登录模块:负责客户端登录鉴权。
集群模块:负责集群管理器与主节点之间保活(keepalive),节点同步,通过SSH操作子节点。
客户端模块:提供客户端操作配置需要的接口,验证并执行客户端的命令。
304、集群管理器从数据库的链接信息中读取修改标识字符。
修改标识字符包括新增标识字符或删除标识字符。新增标识字符代表用户要求在检索集群中加入新的数据源。删除标识字符代表用户要求在检索集群中删除特定的数据源。
305、集群管理器确认修改标识字符是新增标识字符;
306、集群管理器将数据库的链接信息通过主节点的新增数据源接口,发送到注册在集群管理器的所有主节点。
集群管理器可以依次将数据库的链接信息发送到注册在集群管理器的所有主节点。
307、主节点通过广播方式将数据库的链接信息或数据库的配置信息向主节点下所有子节点发送。
各个主节点分别向与自身连接的子节点广播。
二、如图4所示,删除数据源接口:
401、客户端显示可视化界面。
402、客户端在可视化界面中接收数据库的链接信息。
403、集群管理器接收客户端发送的数据库的链接信息。
404、集群管理器从数据库的链接信息中读取修改标识字符。
步骤401至404与步骤301至304类似,不作赘述。
405、集群管理器确认修改标识字符是删除标识字符;
406、集群管理器将数据库的链接信息通过主节点的删除数据源接口,发送到注册在集群管理器的所有主节点。
集群管理器可以依次将数据库的链接信息发送到注册在集群管理器的所有主节点。
407、主节点通过广播方式将数据库的链接信息向主节点下所有子节点发送。
步骤406与步骤306类似,不作赘述。
三、如图5所示,更新数据源接口:
501、客户端显示可视化界面。
步骤501与步骤301类似,不作赘述。
502、客户端在可视化界面中接收数据库的配置信息。
客户端可以通过可视化界面接收用户输入或选择的数据库的配置信息。
503、集群管理器接收客户端发送的数据库的配置信息。
504、集群管理器将数据库的配置信息通过主节点的更新数据源接口,发送到注册在集群管理器的所有主节点。
集群管理器可以依次将数据库的配置信息发送到注册在集群管理器的所有主节点。
505、主节点通过广播方式将数据库的链接信息或数据库的配置信息向主节点下所有子节点发送。
完成上述步骤301至306、401至406或501至505,就实现了对索引集群的数据源的动态修改。在修改了数据源后,还可以进行任务优化、哨兵模式、过滤非法查询或弹性策略等功能操作。下面对各个功能操作的步骤进行说明。
如图6所示,任务优化:
601、集群管理器通过主节点的代理接口收集索引集群的运行状况;
索引集群运行的状况,都会通过节点池中各个节点的代理(agent)接口,收集到集群管理器。索引集群中的主节点和子节点构成节点池。
602、集群管理器根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用;
6021、集群管理器根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务;
6022、集群管理器确定阻塞超时任务对应的主节点为不可用节点,确定不可用节点之外其余主节点为可用节点。
603、若注册在集群管理器的所有主节点存在可用节点,集群管理器将所有可用节点放入可用节点集合;
同时,因为每一条任务都是通过集群管理器发送到节点执行的,集群管理器可以剔除节点池中相应的坏掉的或者阻塞的节点,重新下发任务到运行良好的节点中,保证任务顺利完成。
604、集群管理器对所有可用节点在预设时间内的任务量进行排序;
605、集群管理器从所有可用节点中选取任务量最少的目标主节点;
通过任务优化,保证每一个查询任务下发到最适合的节点执行,以保证执行效率。
606、集群管理器接收客户端发送的数据处理请求,并向目标主节点发送数据处理请求。
607、若存在阻塞超时任务,集群管理器根据预设的告警设置向客户端发送告警信息;
一旦有任务阻塞超时,节点不可用等状况,集群管理器会根据告警设置,把相应的告警信息通过邮件,发送到用户的邮箱中。以告警信息的形式将任务运行结果发送给用户,能够将结果尽快返回用户。
608、集群管理器将阻塞超时任务注册为异步任务。
任务异常时,为解决超时问题,任务会被重新调度,集群管理器会把阻塞超时任务注册为一个异步任务。
需要说明的是,步骤607和608为可选步骤,可以不执行。
集群管理器从节点池中,获取所有的保持活性的主节点。其中,每一个主节点,都是通过server-master轮训的方式,来判断活性的,即集群管理器依次判断每个主节点的是否保持活性,并循环进行。节点中保存有预设时长内(例如一分钟内)收到的任务,确定收到任务最少的那一个节点为目标主节点。保证目标主节点是负载最轻的主节点,收到任务后可以快速处理。
选择负载最轻的主节点可以采用下面的方法:回调时间窗口函数和任务运行时间,对每一个节点处理任务的能力进行评分。回调是指将输出反馈到输入端,形成循环,以逐渐调整参数。在分配任务的时候,可以将评分作为任务分配的权重。保证集群的任务下发处于较优的状态。
保持活性也可以称为可用或保活。
如图7所示,哨兵模式:
701、集群管理器通过主节点的代理接口收集索引集群的运行状况;
702、集群管理器根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用;
步骤701至702与步骤601至602类似,不再赘述。
703、若注册在集群管理器的所有主节点存在不可用节点,集群管理器将不可用节点放入不可用节点集合;
704、集群管理器从子节点中确定目标子节点,将目标子节点注册为主节点替补不可用节点。
当集群设置为哨兵模式的时候,集群管理器会首先剔除节点池中坏掉的主节点,保证节点池中所有的主节点可用,重新调度原先在坏掉节点中执行的任务。节点池中每一个节点的节点服务器作为哨兵监控自身运行状态。当哨兵监测到主节点宕机时,集群管理器会将子节点切换成主节点,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让从服务器切换主机。从服务器是指子节点的服务器。然后将新的主节点注册到节点池中,进入接受任务的状态。
通过哨兵模式,监测节点运行状态,保证集群始终处于高可用状态。
如图8所示,过滤非法查询:
801、集群管理器对数据源的修改信息进行唯一性校验,若校验通过则生成唯一的数据源标识。
唯一性校验用于确保客户端和数据库之间仅有一条数据源标识;一个客户端可以访问多个数据库,一个数据库可以允许多个客户端访问,但是一个客户端与一个数据库之间在同一时刻仅允许有一条数据源标识。
集群管理器利用数据库的链接信息或数据库的配置信息进行唯一性校验。唯一的数据源标识也可以称为唯一的连接标识或唯一的连接id。
802、集群管理器接收客户端发送的数据处理请求;
当用户在客户端输入一条SQL之后,首先可以运用客户端的格式美化功能,对SQL格式进行美化,使SQL的逻辑结构更加清晰,例如进行高亮、大小写转换、换行、增减空格等,方便排除错误。用户点击执行SQL,客户端会通过HTTP接口将数据处理请求以SQL语句发送到集群管理器。
803、集群管理器获取数据处理请求对应的数据源标识、数据库标识或数据表标识;
集群管理器在收到语句后,首先做安全性校验,通过解析成抽象语法树(abstractsyntax Tree,AST)的结构,判断SQL语句运行的源ID,库ID,表ID。
804、集群管理器获取客户端的用户标识;
用户标识可以是用户ID。
805、集群管理器查询用户标识对应的数据库权限或数据表权限,判断数据源标识、数据库标识或数据表标识是否在数据库权限或数据表权限内;
根据发出请求的用户ID,查询用户所拥有的的库权限,表权限。通过核对权限过滤非法查询。
806、若数据源标识、数据库标识或数据表标识不在数据库权限或数据表权限内,则拒绝数据处理请求。
807、若数据源标识、数据库标识或数据表标识在数据库权限或数据表权限内,则集群管理器向主节点发送数据处理请求。
808、主节点接收集群管理器发送的数据处理请求,并根据数据处理请求生成执行计划;
809、主节点的调度模块根据执行计划向子节点发送子任务。
810、子节点根据子任务对数据源进行处理(聚合、排序、连接或去重)。
811、子节点向客户端反馈处理结果。
客户端接收处理结果后,客户端能够根据自定义选择的缓存模式存储反馈的处理结果。
如图9所示,弹性策略:
901、集群管理器接收客户端发送的弹性策略阈值;
通过客户端来设置弹性策略,以应对流量高峰带来的冲击和流量低谷所造成的成本损失。集群管理器根据设置的弹性策略阈值,如CPU阈值,内存阈值等,决定是否通过SSH远程操作节点服务器增加和删减节点。
当用户设置好弹性策略之后,点击开启弹性策略,客户端会把配置发送到集群管理器,集群管理器持久化保存到数据库之后生成历史的策略快照。根据策略内容,注册相应的crontab(一种linux系统的定时任务工具)命令,定时执行调度策略。如果弹性策略阈值更新,那么就更新保存在数据库中的全局变量,以实时更新弹性策略。
902、集群管理器根据弹性策略阈值判断分布式查询引擎是处于流量高峰还是流量低谷;
弹性策略可以通过业务属性来调度节点,如果白天是流量高峰,夜晚流量低,可以设置早晨8:00-晚上20:00扩容节点,其余时间缩减节点,降低机器成本。
903、若处于流量高峰,集群管理器向索引集群新增主节点;
每一个节点都附带了一个代理(agent)接口,用于上报当前节点的运行状况到集群管理器。收集到的任务运行数据,会保存在集群管理器的数据库中,经过分析函数处理,得到每一个节点的性能状况。每次调度,都根据处理能力进行优先级排序,优先将性能最好的节点注册到节点池中。
904、若处于流量低谷,集群管理器从索引集群删除主节点。
被删除的主节点不再注册在集群管理器。因而删除也可以称为注销。
如图10所示,本申请实施例提供了一种分布式查询引擎的控制装置,分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
控制装置包括:
接收单元1001,用于接收客户端发送的数据源的修改信息;
发送单元1002,用于将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,以使得主节点通过广播方式将数据源的修改信息向主节点下所有子节点发送。
如图11所示,本申请实施例提供了一种分布式查询引擎的控制装置,分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
控制装置包括:
接收单元1101,用于接收客户端发送的数据源的修改信息;
发送单元1102,用于将数据源的修改信息通过主节点的修改数据源接口,发送到注册在集群管理器的所有主节点,以使得主节点通过广播方式将数据源的修改信息向主节点下所有子节点发送。
可选的,修改数据源接口包括新增数据源接口和删除数据源接口;
数据源的修改信息包括数据库的链接信息;
链接信息包括修改标识字符,修改标识字符包括新增标识字符或删除标识字符;
发送单元1102,具体包括:
读取子单元11021,用于从数据库的链接信息中读取修改标识字符;
发送子单元11022,用于在修改标识字符是新增标识字符时,将数据库的链接信息通过主节点的新增数据源接口,发送到注册在集群管理器的所有主节点;
发送子单元11022,还用于在修改标识字符是删除标识字符时,将数据库的链接信息通过主节点的删除数据源接口,发送到注册在集群管理器的所有主节点。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
接收单元1101,还用于接收客户端发送的数据库的配置信息;
发送单元1102,还用于将数据库的配置信息,通过主节点的更新数据源接口发送到注册在集群管理器的所有主节点,以使得主节点接口通过广播方式将数据库的配置信息向主节点下所有子节点发送。
可选的,控制装置还包括:
收集单元1103,用于通过主节点的代理接口收集索引集群的运行状况;
判断单元1104,用于根据索引集群的运行状况,依次判断注册在集群管理器的所有主节点是否可用;
放入单元1105,用于在注册在集群管理器的所有主节点存在可用节点时,将所有可用节点放入可用节点集合;
排序单元1106,用于对所有可用节点在预设时间内的任务量进行排序;
选取单元1107,用于从所有可用节点中选取任务量最少的目标主节点;
接收单元1101,还用于接收客户端发送的数据处理请求;
发送单元1102,还用于向目标主节点发送数据处理请求。
可选的,判断单元1104,具体包括:
判断子单元11041,用于根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务;
确定子单元11042,用于确定阻塞超时任务对应的主节点为不可用节点,确定不可用节点之外其余主节点为可用节点。
可选的,集群管理器根据索引集群的运行状况,判断索引集群是否存在阻塞超时任务后,控制装置还包括:
告警单元1108,用于在存在阻塞超时任务时,根据预设的告警设置向客户端发送告警信息;
异步单元1109,用于将阻塞超时任务注册为异步任务。
可选的,放入单元1105,还用于在注册在集群管理器的所有主节点存在不可用节点时,将不可用节点放入不可用节点集合;
控制装置还包括:替补单元1110,用于从子节点中确定目标子节点,将目标子节点注册为主节点替补不可用节点。
可选的,控制装置还包括:
校验单元1111,用于对数据源的修改信息进行唯一性校验,若校验通过则生成唯一的数据源标识,唯一性校验用于确保客户端和数据库之间仅有一条数据源标识;
接收单元1101,还用于接收客户端发送的数据处理请求;
获取单元1112,用于获取数据处理请求对应的数据源标识、数据库标识或数据表标识;
获取单元1112,还用于获取客户端的用户标识;
查询单元1113,用于查询用户标识对应的数据库权限或数据表权限,判断数据源标识、数据库标识或数据表标识是否在数据库权限或数据表权限内;
拒绝单元1114,用于在数据源标识、数据库标识或数据表标识不在数据库权限或数据表权限内时,拒绝数据处理请求。
可选的,控制装置还包括:
接收单元1101,还用于接收客户端发送的弹性策略阈值;
判断单元1104,还用于根据弹性策略阈值判断分布式查询引擎是处于流量高峰还是流量低谷;
新增单元1115,用于在处于流量高峰时,向索引集群新增主节点;
删除单元1116,用于在处于流量低谷时,从索引集群删除主节点。
如图12所示,本申请实施例提供了一种分布式查询引擎的控制装置,包括:分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
接收单元1201,用于通过主节点的修改数据源接口,接收集群管理器发送的数据源的修改信息;
发送单元1202,用于通过广播方式,将数据源的修改信息向主节点下所有子节点发送。
如图13所示,本申请实施例提供了一种分布式查询引擎的控制装置,包括:分布式查询引擎包括集群管理器和索引集群,索引集群包括主节点和子节点;集群管理器与客户端通讯连接,集群管理器与主节点通讯连接,主节点与子节点通讯连接;
接收单元1301,用于通过主节点的修改数据源接口,接收集群管理器发送的数据源的修改信息;
发送单元1302,用于通过广播方式,将数据源的修改信息向主节点下所有子节点发送。
可选的,数据源的修改信息包括数据库的链接信息;
修改数据源接口包括新增数据源接口和删除数据源接口;
接收单元1301,具体用于:
通过主节点的新增数据源接口,接收集群管理器发送的数据库的链接信息;
或者,通过主节点的删除数据源接口,接收集群管理器发送的数据库的链接信息。
可选的,修改数据源接口包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
接收单元1301,还用于通过主节点的更新数据源接口,接收集群管理器发送的数据库的配置信息;
发送单元1302,还用于通过广播方式,将数据库的配置信息向主节点下所有子节点发送。
可选的,控制装置还包括:
监测单元1303,用于监测主节点的运行状况;
代理单元1304,用于通过主节点的代理接口,向集群管理器发送主节点的运行状况。
如图14所示,本申请实施例还提供了一种计算机设备1400,包括:
中央处理器1401,存储器1405,输入输出接口1404,有线或无线网络接口1403以及电源1402;
存储器1405为短暂存储存储器或持久存储存储器;
中央处理器1401配置为与存储器1405通信,并执行存储器1405中的指令操作以执行如图1至图9所示实施例中的方法。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质包括指令,当指令在计算机上运行时,使得计算机执行如图1至图9所示实施例中的方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如图1至图9所示实施例中的方法。
本申请实施例还提供了一种芯片系统,芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行如图1至图9所示实施例中的方法。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地
方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (13)
1.一种分布式查询引擎的控制方法,其特征在于,包括:所述分布式查询引擎包括集群管理器和索引集群,所述索引集群包括主节点和子节点;所述集群管理器与客户端通讯连接,所述集群管理器与所述主节点通讯连接,所述主节点与所述子节点通讯连接;
所述集群管理器接收客户端发送的数据源的修改信息;
所述集群管理器将所述数据源的修改信息通过所述主节点的修改数据源接口,发送到注册在所述集群管理器的所有所述主节点,以使得所述主节点通过广播方式将所述数据源的修改信息向所述主节点下所有所述子节点发送;
所述修改数据源接口包括新增数据源接口和删除数据源接口;
所述数据源的修改信息包括数据库的链接信息;
所述链接信息包括修改标识字符,所述修改标识字符包括新增标识字符或删除标识字符;
所述集群管理器将所述数据源的修改信息通过所述主节点的修改数据源接口,发送到注册在所述集群管理器的所有所述主节点,具体包括:
所述集群管理器从所述数据库的链接信息中读取所述修改标识字符;
若所述修改标识字符是所述新增标识字符,则所述集群管理器将所述数据库的链接信息通过所述主节点的所述新增数据源接口,发送到注册在所述集群管理器的所有所述主节点;
若所述修改标识字符是所述删除标识字符,则所述集群管理器将所述数据库的链接信息通过所述主节点的所述删除数据源接口,发送到注册在所述集群管理器的所有所述主节点;
所述修改数据源接口还包括更新数据源接口;
所述数据源的修改信息包括数据库的配置信息;
所述方法还包括:
所述集群管理器接收所述客户端发送的所述数据库的配置信息;
所述集群管理器将所述数据库的配置信息,通过所述主节点的所述更新数据源接口发送到注册在所述集群管理器的所有所述主节点,以使得所述主节点接口通过广播方式将所述数据库的配置信息向所述主节点下所有所述子节点发送。
2.根据权利要求1所述的分布式查询引擎的控制方法,其特征在于,所述方法还包括:
所述集群管理器通过所述主节点的代理接口收集所述索引集群的运行状况;
所述集群管理器根据所述索引集群的运行状况,依次判断注册在所述集群管理器的所有所述主节点是否可用;
若注册在所述集群管理器的所有所述主节点存在可用节点,所述集群管理器将所有所述可用节点放入可用节点集合;
所述集群管理器对所有所述可用节点在预设时间内的任务量进行排序;
所述集群管理器从所有所述可用节点中选取任务量最少的目标主节点;
所述集群管理器接收所述客户端发送的数据处理请求,并向所述目标主节点发送所述数据处理请求。
3.根据权利要求2所述的分布式查询引擎的控制方法,其特征在于,
所述集群管理器根据所述索引集群的运行状况,依次判断注册在所述集群管理器的所有所述主节点是否可用,具体包括:
所述集群管理器根据所述索引集群的运行状况,判断所述索引集群是否存在阻塞超时任务;
所述集群管理器确定所述阻塞超时任务对应的所述主节点为不可用节点,确定不可用节点之外其余所述主节点为所述可用节点。
4.根据权利要求3所述的分布式查询引擎的控制方法,其特征在于,
所述集群管理器根据所述索引集群的运行状况,判断所述索引集群是否存在阻塞超时任务后,所述方法还包括:
若存在所述阻塞超时任务,所述集群管理器根据预设的告警设置向所述客户端发送告警信息;
所述集群管理器将所述阻塞超时任务注册为异步任务。
5.根据权利要求2所述的分布式查询引擎的控制方法,其特征在于,所述集群管理器根据所述索引集群的运行状况,依次判断注册在所述集群管理器的所有所述主节点是否可用后,所述方法还包括:
若注册在所述集群管理器的所有所述主节点存在不可用节点,所述集群管理器将所述不可用节点放入不可用节点集合;
所述集群管理器从所述子节点中确定目标子节点,将所述目标子节点注册为所述主节点替补所述不可用节点。
6.根据权利要求3至5任一项所述的分布式查询引擎的控制方法,其特征在于,所述方法还包括:
所述集群管理器对所述数据源的修改信息进行唯一性校验,若校验通过则生成唯一的数据源标识,所述唯一性校验用于确保所述客户端和数据库之间仅有一条所述数据源标识;
所述集群管理器接收所述客户端发送的数据处理请求;
所述集群管理器获取所述数据处理请求对应的所述数据源标识、数据库标识或数据表标识;
所述集群管理器获取所述客户端的用户标识;
所述集群管理器查询所述用户标识对应的数据库权限或数据表权限,判断所述数据源标识、所述数据库标识或所述数据表标识是否在所述数据库权限或所述数据表权限内;
若所述数据源标识、所述数据库标识或所述数据表标识不在所述数据库权限或所述数据表权限内,则拒绝所述数据处理请求。
7.根据权利要求3至5任一项所述的分布式查询引擎的控制方法,其特征在于,所述方法还包括:
所述集群管理器接收所述客户端发送的弹性策略阈值;
所述集群管理器根据所述弹性策略阈值判断所述分布式查询引擎是处于流量高峰还是流量低谷;
若处于流量高峰,所述集群管理器向索引集群新增主节点;
若处于流量低谷,所述集群管理器从索引集群删除主节点。
8.一种分布式查询引擎的控制方法,其特征在于,包括:所述分布式查询引擎包括集群管理器和索引集群,所述索引集群包括主节点和子节点;所述集群管理器与客户端通讯连接,所述集群管理器与所述主节点通讯连接,所述主节点与所述子节点通讯连接;
所述主节点通过所述主节点的修改数据源接口,接收所述集群管理器发送的数据源的修改信息;
所述主节点通过广播方式,将所述数据源的修改信息向所述主节点下所有所述子节点发送;
所述数据源的修改信息包括数据库的链接信息;
所述修改数据源接口包括新增数据源接口和删除数据源接口;
所述主节点通过所述主节点的修改数据源接口,接收所述集群管理器发送的数据源的修改信息,具体包括:
所述主节点通过所述主节点的新增数据源接口,接收所述集群管理器发送的所述数据库的链接信息;
或者,所述主节点通过所述主节点的删除数据源接口,接收所述集群管理器发送的所述数据库的链接信息;
所述修改数据源接口还包括更新数据源接口;
所述数据源的修改信息包括数据库的配置信息;
所述方法还包括:
所述主节点通过所述主节点的更新数据源接口,接收所述集群管理器发送的所述数据库的配置信息;
所述主节点通过广播方式,将所述数据库的配置信息向所述主节点下所有所述子节点发送。
9.根据权利要求8所述的分布式查询引擎的控制方法,其特征在于,所述方法还包括:
所述主节点监测所述主节点的运行状况;
所述主节点通过所述主节点的代理接口,向所述集群管理器发送所述主节点的运行状况。
10.一种分布式查询引擎的控制装置,其特征在于,所述分布式查询引擎包括集群管理器和索引集群,所述索引集群包括主节点和子节点;所述集群管理器与客户端通讯连接,所述集群管理器与所述主节点通讯连接,所述主节点与所述子节点通讯连接;
所述控制装置包括:
接收单元,用于接收客户端发送的数据源的修改信息;
发送单元,用于将所述数据源的修改信息通过所述主节点的修改数据源接口,发送到注册在所述集群管理器的所有所述主节点,以使得所述主节点通过广播方式将所述数据源的修改信息向所述主节点下所有所述子节点发送;
所述修改数据源接口包括新增数据源接口和删除数据源接口;
所述数据源的修改信息包括数据库的链接信息;
所述链接信息包括修改标识字符,所述修改标识字符包括新增标识字符或删除标识字符;
所述发送单元,具体包括:
读取子单元,用于从数据库的链接信息中读取修改标识字符;
发送子单元,用于在修改标识字符是新增标识字符时,将数据库的链接信息通过主节点的新增数据源接口,发送到注册在集群管理器的所有主节点;
发送子单元,还用于在修改标识字符是删除标识字符时,将数据库的链接信息通过主节点的删除数据源接口,发送到注册在集群管理器的所有主节点;
所述修改数据源接口还包括更新数据源接口;
所述数据源的修改信息包括数据库的配置信息;
所述装置还包括:
所述接收单元,还用于接收客户端发送的数据库的配置信息;
所述发送单元,还用于将数据库的配置信息,通过主节点的更新数据源接口发送到注册在集群管理器的所有主节点,以使得主节点接口通过广播方式将数据库的配置信息向主节点下所有子节点发送。
11.一种分布式查询引擎的控制装置,其特征在于,包括:所述分布式查询引擎包括集群管理器和索引集群,所述索引集群包括主节点和子节点;所述集群管理器与客户端通讯连接,所述集群管理器与所述主节点通讯连接,所述主节点与所述子节点通讯连接;
接收单元,用于通过所述主节点的修改数据源接口,接收所述集群管理器发送的数据源的修改信息;
发送单元,用于通过广播方式,将所述数据源的修改信息向所述主节点下所有所述子节点发送;
数据源的修改信息包括数据库的链接信息;
修改数据源接口包括新增数据源接口和删除数据源接口;
所述接收单元,具体用于:
通过主节点的新增数据源接口,接收集群管理器发送的数据库的链接信息;
或者,通过主节点的删除数据源接口,接收集群管理器发送的数据库的链接信息;
修改数据源接口还包括更新数据源接口;
数据源的修改信息包括数据库的配置信息;
所述接收单元,还用于通过主节点的更新数据源接口,接收集群管理器发送的数据库的配置信息;
所述发送单元,还用于通过广播方式,将数据库的配置信息向主节点下所有子节点发送。
12.一种计算机设备,其特征在于,包括:
中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;
存储器为短暂存储存储器或持久存储存储器;
中央处理器配置为与存储器通信,并执行存储器中的指令操作以执行如权利要求1至9中任意一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至9中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210998964.4A CN115348185B (zh) | 2022-08-19 | 2022-08-19 | 一种分布式查询引擎的控制方法及其控制装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210998964.4A CN115348185B (zh) | 2022-08-19 | 2022-08-19 | 一种分布式查询引擎的控制方法及其控制装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115348185A CN115348185A (zh) | 2022-11-15 |
CN115348185B true CN115348185B (zh) | 2023-12-05 |
Family
ID=83954393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210998964.4A Active CN115348185B (zh) | 2022-08-19 | 2022-08-19 | 一种分布式查询引擎的控制方法及其控制装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115348185B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050026306A (ko) * | 2003-09-09 | 2005-03-15 | 학교법인 인하학원 | 비공유 구조의 데이터베이스 클러스터 서버 시스템과온라인 확장 방법 |
CN103067463A (zh) * | 2012-12-19 | 2013-04-24 | 新浪网技术(中国)有限公司 | 用户root权限集中管理系统和管理方法 |
CN105447156A (zh) * | 2015-11-30 | 2016-03-30 | 北京航空航天大学 | 资源描述框架分布式引擎及增量式更新方法 |
CN106331047A (zh) * | 2015-06-30 | 2017-01-11 | 中兴通讯股份有限公司 | 一种集群设备性能同步统计方法及系统 |
CN106503163A (zh) * | 2016-10-31 | 2017-03-15 | 用友网络科技股份有限公司 | 基于SaaS应用的全局配置多租户动态数据源系统 |
CN108989399A (zh) * | 2018-06-28 | 2018-12-11 | 郑州云海信息技术有限公司 | 一种集群公共数据查询方法、系统、装置及可读存储介质 |
WO2019189963A1 (ko) * | 2018-03-28 | 2019-10-03 | 주식회사 리얼타임테크 | 분산 클러스터 관리 시스템 및 그 방법 |
CN110647580A (zh) * | 2019-09-05 | 2020-01-03 | 南京邮电大学 | 分布式容器集群镜像管理主节点、从节点、系统及方法 |
US10607271B1 (en) * | 2017-03-16 | 2020-03-31 | Walgreen Co. | Search platform with data driven search relevancy management |
CN111198921A (zh) * | 2019-12-31 | 2020-05-26 | 招银云创(深圳)信息技术有限公司 | 数据库的切换方法、装置、计算机设备和存储介质 |
US10725993B1 (en) * | 2015-12-30 | 2020-07-28 | Amazon Technologies, Inc. | Indexing data sources using a highly available ETL for managed search |
KR102328384B1 (ko) * | 2020-07-23 | 2021-11-18 | 아콘소프트 주식회사 | 관리형 클러스터 자동 프로비저닝 엔진 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체 |
CN114035962A (zh) * | 2021-11-18 | 2022-02-11 | 中国工商银行股份有限公司 | 资源调配方法、装置、计算机设备和存储介质 |
CN114090113A (zh) * | 2021-10-27 | 2022-02-25 | 北京百度网讯科技有限公司 | 数据源处理插件动态加载的方法、装置、设备及存储介质 |
CN114138754A (zh) * | 2021-12-09 | 2022-03-04 | 安超云软件有限公司 | 基于Kubernetes平台的软件部署方法及装置 |
CN114143203A (zh) * | 2021-11-05 | 2022-03-04 | 华东师范大学 | 一种基于动态服务拓扑映射的Kubernetes容器网络数据包指标采集的方法及系统 |
CN114217981A (zh) * | 2021-11-09 | 2022-03-22 | 招银云创信息技术有限公司 | 银企直连的通信方法、装置、计算机设备和存储介质 |
CN114372040A (zh) * | 2022-01-04 | 2022-04-19 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 动态数据源管理方法及系统、客户端、设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7426578B2 (en) * | 2003-12-12 | 2008-09-16 | Intercall, Inc. | Systems and methods for synchronizing data between communication devices in a networked environment |
US20060184553A1 (en) * | 2005-02-15 | 2006-08-17 | Matsushita Electric Industrial Co., Ltd. | Distributed MPEG-7 based surveillance servers for digital surveillance applications |
US8965921B2 (en) * | 2012-06-06 | 2015-02-24 | Rackspace Us, Inc. | Data management and indexing across a distributed database |
US10382540B2 (en) * | 2014-05-29 | 2019-08-13 | Sandisk Technologies Llc | Synchronizing storage state information |
US10885064B2 (en) * | 2015-12-14 | 2021-01-05 | Pivotal Software, Inc. | Performing global computation in distributed database systems |
-
2022
- 2022-08-19 CN CN202210998964.4A patent/CN115348185B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050026306A (ko) * | 2003-09-09 | 2005-03-15 | 학교법인 인하학원 | 비공유 구조의 데이터베이스 클러스터 서버 시스템과온라인 확장 방법 |
CN103067463A (zh) * | 2012-12-19 | 2013-04-24 | 新浪网技术(中国)有限公司 | 用户root权限集中管理系统和管理方法 |
CN106331047A (zh) * | 2015-06-30 | 2017-01-11 | 中兴通讯股份有限公司 | 一种集群设备性能同步统计方法及系统 |
CN105447156A (zh) * | 2015-11-30 | 2016-03-30 | 北京航空航天大学 | 资源描述框架分布式引擎及增量式更新方法 |
US10725993B1 (en) * | 2015-12-30 | 2020-07-28 | Amazon Technologies, Inc. | Indexing data sources using a highly available ETL for managed search |
CN106503163A (zh) * | 2016-10-31 | 2017-03-15 | 用友网络科技股份有限公司 | 基于SaaS应用的全局配置多租户动态数据源系统 |
US10607271B1 (en) * | 2017-03-16 | 2020-03-31 | Walgreen Co. | Search platform with data driven search relevancy management |
WO2019189963A1 (ko) * | 2018-03-28 | 2019-10-03 | 주식회사 리얼타임테크 | 분산 클러스터 관리 시스템 및 그 방법 |
CN108989399A (zh) * | 2018-06-28 | 2018-12-11 | 郑州云海信息技术有限公司 | 一种集群公共数据查询方法、系统、装置及可读存储介质 |
CN110647580A (zh) * | 2019-09-05 | 2020-01-03 | 南京邮电大学 | 分布式容器集群镜像管理主节点、从节点、系统及方法 |
CN111198921A (zh) * | 2019-12-31 | 2020-05-26 | 招银云创(深圳)信息技术有限公司 | 数据库的切换方法、装置、计算机设备和存储介质 |
KR102328384B1 (ko) * | 2020-07-23 | 2021-11-18 | 아콘소프트 주식회사 | 관리형 클러스터 자동 프로비저닝 엔진 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체 |
CN114090113A (zh) * | 2021-10-27 | 2022-02-25 | 北京百度网讯科技有限公司 | 数据源处理插件动态加载的方法、装置、设备及存储介质 |
CN114143203A (zh) * | 2021-11-05 | 2022-03-04 | 华东师范大学 | 一种基于动态服务拓扑映射的Kubernetes容器网络数据包指标采集的方法及系统 |
CN114217981A (zh) * | 2021-11-09 | 2022-03-22 | 招银云创信息技术有限公司 | 银企直连的通信方法、装置、计算机设备和存储介质 |
CN114035962A (zh) * | 2021-11-18 | 2022-02-11 | 中国工商银行股份有限公司 | 资源调配方法、装置、计算机设备和存储介质 |
CN114138754A (zh) * | 2021-12-09 | 2022-03-04 | 安超云软件有限公司 | 基于Kubernetes平台的软件部署方法及装置 |
CN114372040A (zh) * | 2022-01-04 | 2022-04-19 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 动态数据源管理方法及系统、客户端、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
分布式数据流查询处理的P2P中间件研究;杨颖;陈秋莲;杨磊;;计算机工程(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115348185A (zh) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10515000B2 (en) | Systems and methods for performance testing cloud applications from multiple different geographic locations | |
CN103034735B (zh) | 一种大数据分布式文件导出方法 | |
WO2020253079A1 (zh) | 基于Jmeter的分布式性能测试方法、装置、设备及存储介质 | |
CN108694195B (zh) | 一种分布式数据仓库的管理方法及系统 | |
EP1607860A2 (en) | System and method for auditing a network | |
WO2021203979A1 (zh) | 运维处理方法、装置及计算机设备 | |
US20160062880A1 (en) | Methods and Systems for the Use of Synthetic Users To Performance Test Cloud Applications | |
CN111400011B (zh) | 一种实时任务调度方法、系统、设备及可读存储介质 | |
CN113094385B (zh) | 一种基于软件定义开放工具集的数据共享融合平台及方法 | |
US20090144743A1 (en) | Mailbox Configuration Mechanism | |
CN112579289B (zh) | 一种可智能调度的分布式解析引擎方法及装置 | |
CN113242159A (zh) | 应用访问关系确定方法及装置 | |
CN117389830A (zh) | 集群日志采集方法、装置、计算机设备及存储介质 | |
CN111984505A (zh) | 一种运维数据采集引擎及采集方法 | |
CN112559525B (zh) | 数据检查系统、方法、装置和服务器 | |
CN114912255A (zh) | 在线仿真实验系统及方法 | |
CN113157790B (zh) | 一种核聚变曲线编辑方法、系统、终端及介质 | |
CN115335821B (zh) | 卸载统计收集 | |
CN106656592B (zh) | 基于角色配置的服务管理方法和装置 | |
CN115348185B (zh) | 一种分布式查询引擎的控制方法及其控制装置 | |
CN110929130A (zh) | 一种基于分布式调度的公安部级审计数据查询方法 | |
US20190087296A1 (en) | Data layering in a network management system | |
CN115344633A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN111143177B (zh) | Ibm主机的rmf iii数据的收集方法、系统、装置及存储介质 | |
US20210306236A1 (en) | System and method for triage management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |