CN110046178A - 分布式数据查询的方法和装置 - Google Patents

分布式数据查询的方法和装置 Download PDF

Info

Publication number
CN110046178A
CN110046178A CN201810043476.1A CN201810043476A CN110046178A CN 110046178 A CN110046178 A CN 110046178A CN 201810043476 A CN201810043476 A CN 201810043476A CN 110046178 A CN110046178 A CN 110046178A
Authority
CN
China
Prior art keywords
server
request
sub
data
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810043476.1A
Other languages
English (en)
Inventor
秦营连
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810043476.1A priority Critical patent/CN110046178A/zh
Publication of CN110046178A publication Critical patent/CN110046178A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了分布式数据查询的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将数据查询请求拆解成多个子请求;将所述子请求分配至对应的从服务器;获取每个从服务器根据分配的子请求得到该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。该实施方式由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。

Description

分布式数据查询的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种分布式数据查询的方法和装置。
背景技术
随着互联网大数据时代的来临,数据通常存储在数据库中,对于数据库的数据导出、查询工作目前通常使用Apache POI来实现。Apache POI是Apache软件基金会的开放源码函式库,Apache POI提供对数据库数据的读写的功能。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1.在大批量获取数据查询结果时,一系列获取工作全部集中于单台WEB服务器,CUP和内存、磁盘读写量同时激增,甚至会引起服务器系统崩溃。
2.每次处理大批量获取数据查询结果时,整个过程持续时间长,耗费大量的时间成本。
3.大批量获取数据查询结果时容易引起服务器故障,影响到其他业务的正常运行。
发明内容
有鉴于此,本发明实施例提供一种分布式数据查询的方法和装置,将数据查询请求拆解后分配到各从服务器中处理,对从服务器处理后的查询结果进行合并,由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。
为实现上述目的,根据本发明实施例的一个方面,提供了一种分布式数据查询的方法,包括:将数据查询请求拆解成多个子请求;将所述子请求分配至对应的从服务器;获取每个从服务器根据分配的子请求得到该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
可选地,所述分配至对应的从服务器,包括:确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。
可选地,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。
可选地,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。
可选地,所述将数据查询请求拆解成多个子请求之前,包括:获取从服务器的数量。子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。
可选地,所述获取从服务器的数量,包括:获取未发生故障或未停止工作的从服务器的数量。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种分布式数据查询的装置,包括:逻辑控制单元、分配单元和合并单元;所述逻辑控制单元,用于:将数据查询请求拆解成多个子请求;所述分配单元,用于:将子请求分配至对应的从服务器;所述合并单元,用于:获取每个从服务器根据分配的子请求得到该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
可选地,所述分配单元,用于:确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。
可选地,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。
可选地,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。
可选地,所述装置还包括:注册中心单元;所述注册中心单元,用于:获取从服务器的数量。子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。
可选地,所述注册中心单元,用于:获取未发生故障或未停止工作的从服务器的数量。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的分布式数据查询的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明所提供的分布式数据查询的方法。
上述发明中的一个实施例具有如下优点或有益效果:将数据查询请求拆解后分配到各从服务器中处理,对从服务器处理后的查询结果进行合并,由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是现有技术中数据查询的流程的示意图;
图2是根据本发明实施例的分布式数据查询的方法的基本流程的示意图;
图3是是根据本发明实施例的分布式数据存储数据库分片示意图;
图4是是根据本发明实施例的集中式存储数据库分片示意图;
图5是根据本发明实施例的分布式数据查询的方法的优选流程的示意图;
图6是根据本发明实施例的分布式数据查询的装置的基本单元的示意图;
图7是根据本发明实施例的分布式数据查询的装置的优选单元的示意图;
图8是本发明实施例可以应用于其中的示例性系统架构图;
图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是现有技术中数据查询的方法的流程的示意图;如图1所示,WEB服务器接收到客户端的数据导出请求后,将客户端传来的筛选条件,转换成数据库查询语句,然后从数据库中查询,接着把数据库的返回结果,封装、转换成报表文件,最后以二进制流的方式返回给客户端。
图2是根据本发明实施例的分布式数据查询的方法的基本流程的示意图;如图2所示,本发明实施例提供了一种分布式数据查询的方法,包括:
步骤S201.将数据查询请求拆解成多个子请求;
步骤S202.将所述子请求分配至对应的从服务器;
步骤S203.获取每个从服务器根据分配的子请求得到的该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
本发明实施例将数据查询请求拆解后分配到各从服务器中处理,对从服务器处理后的查询结果进行合并,由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。
本发明实施例中,所述分配至对应的从服务器,包括:确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。本发明实施例通过分片号列表将子请求与从服务器进行匹配,在从服务器执行子请求时,不需要将子请求附加其他条件,提高服务的通用性,加快查询速度和效率。
本发明实施例中,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。
分布式存储数据库可以将数据进行分库或者分表,每个从服务器查询指定的库或者表。例如,数据库中的用户数据可以按时间维度,存储在库名分别为“users_2015”、“users_2016”、“users_2017”等多个分库中,并将库名作为分片号。至少一个分片号组成分片号列表后,将分片号列表分配给从服务器。图3是是根据本发明实施例的分布式数据存储数据库分片示意图;如图3所示,将“users_2015”、“users_2016”组成的分片号列表分配给编号为从服务器A,则该服务器负责在“users_2015”、“users_2016”两个分库中,执行子请求,查询数据。将“users_2017”、“users_2018”组成的分片号列表分配给从服务器B,则该服务器负责在“users_2017”、“users_2018”两个分库中,执行子请求,查询数据。将只有一个分片号“users_2019”分片号列表分配给从服务器C,则该服务器负责在“users_2019”的分库中,执行子请求,查询数据。
本发明实施例中,从服务器可以从较小的数据范围中,执行子请求,获取查询结果,可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度。
本发明实施例中,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。
集中式存储数据库可以给库中的每条数据配置数据标识,此时该数据标识可以作为分片号,由至少一个分片号组成的分片号列表后,通过该分片号列表就可以获得由列表内数据标识对应的数据所组成的数据集合。获得该分片号列表的从服务器就可以在该数据集合中,根据子请求,查询数据。例如,将所有的数据,全部存储在一张用户数据表中,给每条数据分配一个数据标识,数据标识可以从0-63依次循环,可以将数据标识平均分进4个分片号列表中。图4是是根据本发明实施例的集中式存储数据库分片示意图;如图4所示,编号为“a”的分片号列表中的分片号即数据标识是:“0、4、8、12、16、20、24、28、32、36、40、44、48、52、56、60”;则获取分片号列表“a”的从服务器A,在以上数据标识对应的数据中获取查询结果。编号为“b”的分片号列表中的分片号即数据标识是:“1、5、9、13、17、21、25、29、33、37、41、45、49、53、57、61”;则获取分片号列表“b”的从服务器B,在以上数据标识对应的数据中获取查询结果。编号为“c”的分片号列表中的分片号即数据标识是:“2、6、10、14、18、22、26、30、34、38、42、46、50、54、58、62”;则获取分片号列表“c”的从服务器C,在以上数据标识对应的数据中获取查询结果。编号为“d”的分片号列表中的分片号即数据标识是:“3、7、11、15、19、23、27、31、35、39、43、47、51、55、59、63”;则获取分片号列表“d”的从服务器D,在以上数据标识对应的数据中获取查询结果。
本发明实施例中,从服务器可以从较小的数据范围中,执行子请求,获取查询结果,可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度。
本发明实施例中,所述将数据查询请求拆解成多个子请求之前,可以包括:获取从服务器的数量。子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。本发明实施例在获取从服务器的数量后,对数据库中的数据进行划分,分成与从服务器的数量相等的分片号列表,按照从服务器的数量,对数据查询请求进行拆解,拆解得到的子请求的个数也要与从服务器的数量相同。一个从服务器获得一个分片号列表,执行一个子请求。这样可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度,提高查询效率,并且保证了查询的准确性。
本发明实施例中,所述获取从服务器的数量,可以包括:获取未发生故障或未停止工作的从服务器的数量,未停止工作的从服务器还包括新启动的从服务器即新进入工作状态的从服务器。在获取从服务器的数量之前,可以先判断各从服务器是否发生故障或停止工作,是否有新启动的从服务器,若服务器的工作状态发生改变,可以实时获取未发生故障或未停止工作的从服务器的数量,动态调整分片号列表的数量和拆解得到的子请求的数量,使查询资源得到有效的利用,并提高了查询结果的准确性,防止因单个从服务器发生故障或停止工作而导致的查询故障或错误。从服务器一旦发生故障,会重新计算每台从服务器的分片号列表,保证后续请求会被正常处理。有新的从服务器启动后,主服务器会接收到该服务器的工作状态信息,实现了服务器的自动发现功能,也便于服务的横向扩展,增强服务处理能力。
图5是根据本发明实施例的分布式数据查询的方法的优选流程的示意图;如图5所示,接收数据查询请求后,根据对个服务器工作状态的判断结果,获取未发生故障或未停止工作的从服务器的数量N;数据库中的数据被划分成N个组,每个组对应一个分片号列表;获取这N个分片号列表后,将这N个分片号列表分配至一一对应的从服务器中;将数据查询请求拆解成N个子请求,每个子请求分配有对应的分片号列表,分配单元将这N个子请求按照其对应的分片号列表分配至从服务器中;获取每个从服务器根据子请求得到的该子请求的查询结果;对所有的子请求的查询结果进行合并处理,获取数据查询请求的查询结果。
图6是根据本发明实施例的分布式数据查询的装置的基本单元的示意图;如图6所示,本发明实施例提供了一种分布式数据查询的装置600,包括:逻辑控制单元601、分配单元602和合并单元603;所述逻辑控制单元601,可以用于:将数据查询请求拆解成多个子请求;所述分配单元602,可以用于:将子请求分配至对应的从服务器;所述合并单元603,可以用于:获取每个从服务器根据分配的子请求得到该子请求的查询结果,对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
本发明实施例将数据查询请求拆解后分配到各从服务器中处理,对从服务器处理后的查询结果进行合并,由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。
本发明实施例中,所述分配单元602,可以用于:确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。本发明实施例通过分片号列表将子请求与从服务器进行匹配,在从服务器执行子请求时,不需要将子请求附加其他条件,提高服务的通用性,加快查询速度和效率。
本发明实施例中,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。从服务器在分片号对应的分布式存储数据库的分库中,根据子请求,获取该子请求的查询结果。从服务器可以从较小的数据范围中,执行子请求,获取查询结果,可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度。
本发明实施例中,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。从服务器根据分片号列表中的集中式存储数据库的数据标识,获取由与其对应的数据库数据组成的数据集合;在所述数据集合中,根据子请求,获取该子请求的查询结果。从服务器可以从较小的数据范围中,执行子请求,获取查询结果,可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度。
本发明实施例中,所述装置还包括:注册中心单元;所述注册中心单元,可以用于:获取从服务器的数量。子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。本发明实施例在获取从服务器的数量后,对数据库中的数据进行划分,分成与从服务器的数量相等的分片号列表,按照从服务器的数量,对数据查询请求进行拆解,拆解得到的子请求的个数也要与从服务器的数量相同。一个从服务器获得一个分片号列表,执行一个子请求。这样可以优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,减少了处理时间,加快查询速度,提高查询效率,并且保证了查询的准确性。
本发明实施例中,所述装置还包括心跳检测单元,所述心跳检测单元,可以用于:在获取从服务器的数量之前,判断各从服务器是否发生故障或停止工作,是否有新启动的从服务器。所述注册中心单元,用于:获取未发生故障或未停止工作的从服务器的数量,未停止工作的从服务器还包括新启动的从服务器即新进入工作状态的从服务器。本发明实施例可以实时获取未发生故障或未停止工作的从服务器的数量,动态调整分片号列表的数量和拆解得到的子请求的数量,使查询资源得到有效的利用,并提高了查询结果的准确性,防止因单个从服务器发生故障或停止工作而导致的查询故障或错误。从服务器一旦发生故障,可通过心跳检测单元同步给主服务器,并重新计算每台从服务器的分片号列表,保证后续请求会被正常处理,实现了服务器容灾。有新的从服务器启动后,主服务器会通过心跳检测单元获取该从服务器的工作状态信息,实现了服务器扩展性,服务器的自动发现功能,也便于服务的横向扩展,增强服务处理能力。
图7是根据本发明实施例的分布式数据查询的装置的优选单元的示意图;如图7所示,接收数据查询请求后,注册中心单元根据心跳检测单元对各从服务器工作状态的判断结果,获取未发生故障或未停止工作的从服务器的数量N;根据未发生故障或未停止工作的从服务器的数量N,数据库中的数据被划分成N个组,每个组对应一个分片号列表;分配单元获取这N个分片号列表后,将这N个分片号列表分配至一一对应的从服务器中;逻辑控制层将数据查询请求拆解成N个子请求,每个子请求分配有对应的分片号列表,分配单元将这N个子请求按照分片号列表分配至对应的从服务器中;从服务器根据子请求得到的该子请求的查询结果;合并单元获取每个从服务器得到的子请求的查询结果,将所有的子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
图8示出了可以应用本发明实施例的分布式数据查询的方法或分布式数据查询的装置的示例性系统架构800。
如图8所示,系统架构800可以包括终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器805可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的分布式数据查询的方法一般由服务器805执行,相应地,分布式数据查询的装置一般设置于服务器805中。
应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种可读介质。
本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的分布式数据查询的方法。
本发明实施例的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的分布式数据查询的方法。
下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理模块(CPU)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM903中,还存储有系统900操作所需的各种程序和数据。CPU901、ROM902以及RAM903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理模块(CPU)901执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,上述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括:逻辑控制单元、分配单元和合并单元,其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,“逻辑控制单元”还可以被描述为“将数据查询请求拆解成多个子请求的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:步骤S201.将数据查询请求拆解成多个子请求;步骤S202.将所述子请求分配至对应的从服务器;步骤S203.获取每个从服务器根据分配的子请求得到的该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
根据本发明实施例的技术方案,将数据查询请求拆解后分配到各从服务器中处理,对从服务器处理后的查询结果进行合并,由现有技术中的单台服务器处理转变成分布式协同处理,数据处理分流,优化数据查询,降低了处理期间CPU和内存高占用、磁盘读写量大等问题,同时大大减少了处理时间,加快查询速度。有效减少了查询过程中故障的发生,保障了其他业务的正常运行。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (14)

1.一种分布式数据查询的方法,其特征在于,包括:
将数据查询请求拆解成多个子请求;
将所述子请求分配至对应的从服务器;
获取每个从服务器根据分配的子请求得到的该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
2.根据权利要求1所述的方法,其特征在于,所述子请求分配至对应的从服务器,包括:
确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。
3.根据权利要求2所述的方法,其特征在于,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;
每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。
4.根据权利要求2所述的方法,其特征在于,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;
每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。
5.根据权利要求1-4任一所述的方法,其特征在于,所述将数据查询请求拆解成多个子请求之前,包括:获取从服务器的数量;
子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。
6.根据权利要求5所述的方法,其特征在于,所述获取从服务器的数量,包括:获取未发生故障或未停止工作的从服务器的数量。
7.一种分布式数据查询的装置,其特征在于,包括:逻辑控制单元、分配单元和合并单元;
所述逻辑控制单元,用于:将数据查询请求拆解成多个子请求;
所述分配单元,用于:将子请求分配至对应的从服务器;
所述合并单元,用于:获取每个从服务器根据分配的子请求得到的该子请求的查询结果,并对所有子请求的查询结果进行合并处理,得到数据查询请求的查询结果。
8.根据权利要求7所述的装置,其特征在于,所述分配单元,用于:
确定与所述子请求对应的分片号列表,将所述子请求分配至与该分片号列表对应的从服务器;其中,每个从服务器对应一个分片号列表。
9.根据权利要求8所述的装置,其特征在于,所述分片号列表中包括至少一个分片号,所述分片号为分布式存储数据库的分库名;
每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表中的所述分库名对应的分布式存储数据库的分库中获取的。
10.根据权利要求8所述的装置,其特征在于,所述分片号列表中包括至少一个分片号,所述分片号为集中式存储数据库的数据标识;
每个子请求的查询结果是由所述子请求对应的从服务器,在该从服务器的分片号列表对应的数据集合中获取的;其中,所述数据集合是由该分片号列表中的所述数据标识对应的集中式存储数据库的数据组成的集合。
11.根据权利要求7-10任一所述的装置,其特征在于,所述装置还包括:注册中心单元;所述注册中心单元,用于:获取从服务器的数量;
子请求的数量、分片号列表的数量与从服务器的数量相等,且子请求、分片号列表、从服务器之间一一对应。
12.根据权利要求11所述的装置,其特征在于,所述注册中心单元,用于:获取未发生故障或未停止工作的从服务器的数量。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201810043476.1A 2018-01-17 2018-01-17 分布式数据查询的方法和装置 Pending CN110046178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810043476.1A CN110046178A (zh) 2018-01-17 2018-01-17 分布式数据查询的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810043476.1A CN110046178A (zh) 2018-01-17 2018-01-17 分布式数据查询的方法和装置

Publications (1)

Publication Number Publication Date
CN110046178A true CN110046178A (zh) 2019-07-23

Family

ID=67273047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810043476.1A Pending CN110046178A (zh) 2018-01-17 2018-01-17 分布式数据查询的方法和装置

Country Status (1)

Country Link
CN (1) CN110046178A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382156A (zh) * 2020-02-14 2020-07-07 石化盈科信息技术有限责任公司 一种数据采集方法、系统、装置、电子设备及存储介质
CN111444445A (zh) * 2020-03-25 2020-07-24 平安医疗健康管理股份有限公司 一种数据传输方法、系统、计算机设备和可读存储介质
CN112765169A (zh) * 2021-01-11 2021-05-07 北京众享比特科技有限公司 数据处理方法、装置、设备及存储介质
CN113051456A (zh) * 2021-05-11 2021-06-29 北京字节跳动网络技术有限公司 请求处理方法、装置、电子设备和计算机可读介质
CN117349323A (zh) * 2023-12-05 2024-01-05 苏州元脑智能科技有限公司 数据库的数据处理方法及装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082655A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. Parallel execution of range query
CN104216984A (zh) * 2014-09-02 2014-12-17 上海新储集成电路有限公司 数据查询方法
CN105045877A (zh) * 2015-07-20 2015-11-11 深圳市深信服电子科技有限公司 数据库数据分片存储方法和装置、数据查询方法和装置
CN106934001A (zh) * 2017-03-03 2017-07-07 广州天源迪科信息技术有限公司 分布式快速清单查询系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082655A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. Parallel execution of range query
CN104216984A (zh) * 2014-09-02 2014-12-17 上海新储集成电路有限公司 数据查询方法
CN105045877A (zh) * 2015-07-20 2015-11-11 深圳市深信服电子科技有限公司 数据库数据分片存储方法和装置、数据查询方法和装置
CN106934001A (zh) * 2017-03-03 2017-07-07 广州天源迪科信息技术有限公司 分布式快速清单查询系统及方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382156A (zh) * 2020-02-14 2020-07-07 石化盈科信息技术有限责任公司 一种数据采集方法、系统、装置、电子设备及存储介质
CN111444445A (zh) * 2020-03-25 2020-07-24 平安医疗健康管理股份有限公司 一种数据传输方法、系统、计算机设备和可读存储介质
CN112765169A (zh) * 2021-01-11 2021-05-07 北京众享比特科技有限公司 数据处理方法、装置、设备及存储介质
CN113051456A (zh) * 2021-05-11 2021-06-29 北京字节跳动网络技术有限公司 请求处理方法、装置、电子设备和计算机可读介质
CN117349323A (zh) * 2023-12-05 2024-01-05 苏州元脑智能科技有限公司 数据库的数据处理方法及装置、存储介质及电子设备
CN117349323B (zh) * 2023-12-05 2024-02-27 苏州元脑智能科技有限公司 数据库的数据处理方法及装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110046178A (zh) 分布式数据查询的方法和装置
CN107666525A (zh) 集群容器ip分配的方法和装置
CN110365752A (zh) 业务数据的处理方法、装置、电子设备和存储介质
CN110019125A (zh) 数据库管理的方法和装置
CN111970198A (zh) 一种服务路由方法、装置、电子设备及介质
CN108874513A (zh) 处理定时任务的方法、系统、电子设备和计算机可读介质
CN108897854A (zh) 一种超时任务的监控方法和装置
CN110427304A (zh) 用于银行系统的运维方法、装置、电子设备以及介质
CN110471848A (zh) 一种动态返回报文的方法和装置
CN108776692A (zh) 用于处理信息的方法和装置
CN110377416A (zh) 分布式分区任务调度方法和装置
CN111444077A (zh) 一种生成流程节点测试数据的方法和装置
CN109413125A (zh) 动态调节分布式系统资源的方法和装置
CN110515741A (zh) 一种基于本地任务队列的降级处理方法和装置
CN109873863A (zh) 服务的异步调用方法和装置
CN109857577A (zh) 访问控制方法、装置、介质及电子设备
CN109597810A (zh) 一种任务切分方法、装置、介质及电子设备
CN108764866B (zh) 用于分配资源、领取资源的方法和设备
CN113946816A (zh) 基于云服务的鉴权方法、装置、电子设备和存储介质
CN108959636A (zh) 数据处理方法、装置、系统、计算机可读介质
CN110389976A (zh) 一种多接口数据的调度方法和装置
CN110083501A (zh) 接口调用计数方法和装置
CN107045452B (zh) 虚拟机调度方法和装置
CN110493291A (zh) 一种处理http请求的方法和装置
CN110851483B (zh) 用于筛选对象的方法、装置、电子设备以及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination