CN107451154B - 一种数据表的处理方法、装置及系统 - Google Patents

一种数据表的处理方法、装置及系统 Download PDF

Info

Publication number
CN107451154B
CN107451154B CN201610379416.8A CN201610379416A CN107451154B CN 107451154 B CN107451154 B CN 107451154B CN 201610379416 A CN201610379416 A CN 201610379416A CN 107451154 B CN107451154 B CN 107451154B
Authority
CN
China
Prior art keywords
query
partition
instruction
host
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610379416.8A
Other languages
English (en)
Other versions
CN107451154A (zh
Inventor
杜培亮
王传廷
黄琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610379416.8A priority Critical patent/CN107451154B/zh
Priority to PCT/CN2017/075998 priority patent/WO2017206562A1/zh
Publication of CN107451154A publication Critical patent/CN107451154A/zh
Priority to US16/204,526 priority patent/US20190108174A1/en
Application granted granted Critical
Publication of CN107451154B publication Critical patent/CN107451154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种数据表的处理方法、装置及系统,涉及计算机技术领域,能够节省数据库系统集群中的物理机的存储空间,从而提升数据处理的性能。该处理方法包括:主机获取第一分区指令和第二分区指令,第一分区指令包括第一分区键,第二分区指令包括第二分区键,第二分区键与第一分区键不同;主机根据第一分区指令,对主机上的第一数据表的数据按照第一分区键分区,以得到第一分区表;主机向备机发送第二分区指令,第二分区指令用于触发备机对备机上的第二数据表的数据按照第二分区键分区,以得到第二分区表,第二数据表与第一数据表相同。

Description

一种数据表的处理方法、装置及系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据表的处理方法、装置及系统。
背景技术
分区技术是数据库系统中常用的一种技术,其是指按照分区键将数据表中满足不同条件的行或列划分为不同的区域,即将数据表中的数据划分为多个有一定共性的更小的数据区域,这些数据区域在逻辑上属于同一个表空间(即同一张数据表),而在物理上则是相互独立的数据。其中,经过划分的数据表可称为分区表。在对分区表进行查询时,为了提高查询效率,通常采用分区剪枝技术,即按照查询列的条件筛选出需要的分区,而采用分区剪枝技术时,查询指令中的where子语句指定的查询列必须是分区键(用于指示一部分数据的属性,例如数据表中一列或多列的表头,或者数据表中一行或多行的表头),所以若要采用分区剪枝技术,则需保证待查询的分区表的分区键与查询列相同。
目前,某个物理机在创建数据表后,该物理机可通过对该数据表的数据按照不同的分区键分区,以得到不同的分区表。如此,当需要采用分区剪枝技术对该数据表中的数据进行查询时,该物理机可以直接在相应的分区表中进行查询,以提高查询效率。
然而,随着技术的发展,当前数据库系统需要维护的数据不断增加,在很多应用场景(如云计算,大数据等)中需维护的数据量的体量较大,物理机中存储的分区表的数量也越来越多,现有的分区表创建方式和管理方式,使得数据库系统中需要维护许多具有相同内容的分区表,冗余较大,浪费了物理机的存储空间,从而影响了数据处理的性能。
发明内容
本发明的实施例提供一种数据表的处理方法、装置及系统,能够节省数据库系统集群中的物理机的存储空间,从而提升数据处理的性能。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种数据表的处理方法,该处理方法应用于数据库系统集群中的主机,数据库系统集群包括该主机和备机,该处理方法包括:主机获取第一分区指令和第二分区指令,第一分区指令包括第一分区键,第二分区指令包括与第一分区键不同的第二分区键;且主机根据第一分区指令,对主机上的第一数据表的数据按照第一分区键分区,以得到第一分区表;以及主机向备机发送第二分区指令,第二分区指令用于触发备机对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区,以得到第二分区表。
其中,上述第一数据表中可以包括多个业务的数据,且每个业务的数据可以理解为第一数据表中的一列数据,即每个业务可以理解为第一数据表中的一列的表头。如此,第一分区键可以理解为多个业务中的一个业务,即第一分区键可以理解为第一数据表中一列的表头;第一分区表为对应于该业务的分区表。第二数据表、第二分区键以及第二分区表分别与第一数据表、第一分区键以及第一分区表类似,此处不再赘述。
本发明实施例提供的数据表的处理方法,由于可以在主机上按照第一分区键对主机上的第一数据表分区得到第一分区表,在备机上按照与第一分区键不同的第二分区键,对备机上与第一数据表相同的第二数据表分区得到第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
可选的,本发明实施例中,该处理方法还包括:主机获取用于创建第一数据表的第一创建指令和用于创建第二数据表的第二创建指令;且主机根据第一创建指令,在主机上创建第一数据表;以及主机向备机发送第二创建指令,用于触发备机在备机上创建第二数据表。
可选的,本发明实施例中,第一创建指令、第二创建指令、第一分区指令和第二分区指令均可以包含在一个指令集中。
可选的,在第一种可能的实现方式中,该处理方法还包括:主机获取包括查询列和查询条件的查询指令,该查询列与第一分区键相同,该查询指令用于查询第一分区表中满足该查询条件的数据;主机对第一分区表执行该查询指令。
可选的,在第二种可能的实现方式中,该处理方法还包括:主机获取包括查询列和查询条件的查询指令,该查询列与第二分区键相同,该查询指令用于查询第二分区表中满足该查询条件的数据;主机向备机发送该查询指令,以使备机对第二分区表执行该查询指令。
本发明实施例中,主机上的第一数据表按照第一分区键分区,备机上的第二数据表按照第二分区键分区,当需要对数据表中某个业务的数据进行查询时,如果主机确定查询指令中的查询列与第一分区键相同,则由主机对第一分区表执行该查询指令,即在主机上的第一分区表中查询满足该查询条件的数据;如果主机确定该查询列与第一分区键和第二分区键均不相同,则由主机对第一分区表执行该查询指令,即在主机上的第一分区表中查询满足该查询条件的数据;如果主机确定该查询列与第二分区键相同,则主机将该查询指令发送给备机,由备机对第二分区表执行该查询指令,即在备机上的第二分区表中查询满足该查询条件的数据。
本发明实施例中,为了提高对业务的数据进行查询时的查询效率,在查询过程中可采用分区剪枝技术。所谓分区剪枝技术是指根据查询语句中的from分区表和where子句中的查询列的条件(即查询条件)去除不需要的分区,并提取出需要的分区的过程。例如,分区表为T1,T1按照c1进行分区,查询列的条件为c1<200,则采用分区剪枝技术可以去除T1中除c1<200分区外的其他分区,并提取出c1<200的分区,即为T1中满足查询条件的数据。
可选的,在第三种可能的实现方式中,该处理方法还包括:主机获取包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件的查询指令,第一查询列与第一分区键相同,第二查询列与第二分区键相同,第一查询条件和第二查询条件之间为“与”的关系,该查询指令用于查询第一分区表中满足第一查询条件和第二查询条件的数据;且主机对第一分区表执行该查询指令。
可选的,在第四种可能的实现方式中,该处理方法还包括:主机获取包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件的查询指令,第一查询列与第一分区键相同,第二查询列与第二分区键相同,第一查询条件和第二查询条件之间为“或”的关系,该查询指令用于查询第一分区表中满足第一查询条件的数据,以及查询第二分区表中满足第二查询条件的数据;且主机将该查询指令拆分为包括第一查询列和第一查询条件的第一查询指令以及包括第二查询列和第二查询条件的第二查询指令,以及主机对第一分区表执行第一查询指令,且主机向备机发送第二查询指令,以使备机对第二分区表执行第二查询指令。
本发明实施例中,当查询指令包括两个查询列和两个查询条件(实际使用中还可以是多个查询列和多个查询条件)时,主机可根据两个查询条件的关系具体确定由哪个物理机(主机或备机)执行该查询指令。从而基于采用本发明实施例提供的数据表的处理方法得到的分区表,可以在一定程度上提高对该分区表进行查询的查询效率。
可选的,本发明实施例中,该处理方法还包括:主机获取修改指令;且主机根据该修改指令对第一分区表进行修改;以及主机向备机发送该修改指令,用于触发备机对第二分区表进行修改。
本发明实施例中,与主机和备机之间采用物理日志同步各自的分区表的方法(采用物理日志同步可以理解为:主机将修改的数据发送给备机,由备机更新该数据)相比,主机和备机之间采用逻辑日志同步各自的分区表的方法,由于主机直接将修改指令(修改指令的开销远远小于数据的开销)发送给备机,由备机通过执行该修改指令修改其分区表,因此能够节省主机上的第一分区表和备机上的第二分区表进行同步的同步开销。
第二方面,本发明实施例提供一种数据表的处理方法,该处理方法应用于数据库系统集群中的备机,数据库系统集群包括主机和备机,该处理方法包括:备机接收主机发送的包括分区键的分区指令;且备机根据该分区指令,对备机上的第二数据表的数据按照该分区键分区,以得到分区表,第二数据表与主机上的第一数据表相同,第一数据表按照与该分区键不同的分区键分区。其中,主机对第一数据表分区的分区键称为第一分区键,主机对第一数据表分区后得到的分区表称为第一分区表;备机对第二数据表分区的分区键称为第二分区键,备机对第二数据表分区后得到的分区表称为第二分区表。
本发明实施例提供的数据表的处理方法,由于可以在备机上按照与主机上对第一数据表分区的第一分区键不同的第二分区键,对与主机上的第一数据表相同的第二数据表分区,以得到与主机上的第一分区表不同的第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
可选的,本发明实施例中,该处理方法还包括:备机接收主机发送的包括查询列和查询条件的查询指令,该查询列与该分区键相同,该查询指令用于查询备机上的分区表(即第二分区表)中满足该查询条件的数据;且备机对备机上的分区表执行该查询指令。
本发明实施例中,基于采用本发明实施例提供的数据表的处理方法得到的分区表,可以由不同的物理机(主机或备机)执行相应的查询指令,例如由备机执行包括与第二分区键相同的查询列的查询指令,可以在一定程度上提高查询效率。
可选的,本发明实施例中,该处理方法还包括:备机接收主机发送的修改指令;且备机根据该修改指令对备机上的分区表进行修改。
本发明实施例中,当主机接收到对主机上的分区表的修改指令之后,主机可采用逻辑日志同步的方法将该修改指令发送给备机,由备机根据该修改指令修改备机上的分区表,如此能够节省主机上的分区表和备机上的分区表进行同步的同步开销。
第三方面,本发明实施例提供一种数据表的处理方法,该处理方法应用于数据库系统集群中的主机,该数据库系统集群包括主机和备机,该处理方法包括:主机获取包括第一查询列和与第一查询列对应的第一查询条件的查询指令,该查询指令用于查询分区表中满足第一查询条件的数据;在第一查询列与第一分区表的第一分区键相同的情况下,主机对第一分区表执行该查询指令,第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的;在第一查询列与第二分区表的第二分区键相同的情况下,主机向备机发送查询指令,以使备机对第二分区表执行该查询指令,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表与第一数据表相同,第二分区键与第一分区键不同。
本发明实施例提供的数据表的处理方法,由于第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的,且第二分区表是对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区得到的,因此当主机获取的查询指令中的第一查询列与第一分区键相同时,可以由主机对该第一分区表执行该查询指令,当主机获取的查询指令中的第一查询列与第二分区键相同时,可以由主机向备机发送该查询指令,由备机对该第二分区表执行该查询指令。由于可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
可选的,在第一种可能的实现方式中,在第一查询列与第一分区表的第一分区键相同的情况下,查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“与”的关系,查询指令还用于查询第一分区表中满足第二查询条件的数据,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和第一数据表相同,第二分区键与第一分区键不同。
可选的,在第二种可能的实现方式中,在第一查询列与第一分区表的第一分区键相同的情况下,查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“或”的关系,查询指令还用于查询第二分区表中满足第二查询条件的数据,该处理方法还包括:主机将查询指令拆分为包括第一查询列和第一查询条件的第一查询指令以及包括第二查询列和第二查询条件的第二查询指令,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和第一数据表相同,第二分区键与第一分区键不同;且主机向备机发送第二查询指令,以使备机对第二分区表执行第二查询指令;
其中,上述主机对第一分区表执行查询指令的方法包括:主机对第一分区表执行第一查询指令。
本发明实施例中,当查询指令包括两个查询列和两个查询条件(实际使用中还可以是多个查询列和多个查询条件)时,主机可根据两个查询条件的关系具体确定由哪个物理机(主机或备机)执行该查询指令。从而基于采用本发明实施例提供的数据表的处理方法得到的分区表,可以在一定程度上提高对该分区表进行查询的查询效率。
第四方面,本发明实施例提供一种数据表的处理方法,该处理方法应用于数据库系统集群中的备机,该数据库系统集群包括主机和备机,该处理方法包括:备机接收主机发送的包括查询列和查询条件的查询指令,该查询列与分区表的分区键相同,该查询指令用于查询该分区表中满足该查询条件的数据,该分区表是对备机上的第二数据表的数据按照该分区键分区得到的,第二数据表和主机上的第一数据表相同;且备机对该分区表执行该查询指令。
本发明实施例提供的数据表的处理方法,由于该分区表是对备机上与主机上的第一数据表相同的第二数据表的数据按照该分区键分区得到的,因此当主机获取的查询指令中的查询列与该分区键相同时,主机向备机发送该查询指令,由备机对该分区表执行该查询指令。与现有技术相比,本发明实施例提供的数据表的处理方法,由于备机无需存储多个与主机存储的分区表相同的分区表,因此可以减少备机中存储的分区表的数量,从而能够节省数据库系统集群中的备机的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
第五方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括获取单元、执行单元和发送单元。
获取单元用于获取包括第一分区键的第一分区指令和包括第二分区键的第二分区指令,第二分区键与第一分区键不同;执行单元用于根据获取单元获取的第一分区指令,对主机上的第一数据表的数据按照第一分区键分区,以得到第一分区表;发送单元,用于向备机发送获取单元获取的第二分区指令,第二分区指令用于触发备机对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区,以得到第二分区表。
本发明实施例提供的物理机为数据库系统集群中的主机,由于可以在主机上按照第一分区键对主机上的第一数据表分区得到第一分区表,在备机上按照与第一分区键不同的第二分区键,对备机上与第一数据表相同的第二数据表分区得到第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
需要说明的是,本发明实施例提供的物理机包括但不限于上述第五方面中的获取单元、执行单元和发送单元,并且上述第五方面中的获取单元、执行单元和发送单元具有的功能包括但不限于上述描述的功能。该物理机可以包括用于执行上述第一方面以及第一方面的各种可选方式所述的数据表的处理方法的单元/模块,这些单元/模块是为了执行上述第一方面以及第一方面的各种可选方式所述的数据表的处理方法,而对物理机进行的逻辑上的划分。
上述第五方面各种可选方式的技术效果的描述具体可参见上述对第一方面各种相应可选方式的技术效果的相关描述,此处不再赘述。
第六方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括接收单元和执行单元。
接收单元用于接收主机发送的包括分区键的分区指令;执行单元用于根据接收单元接收的分区指令,对备机上的第二数据表的数据按照分区键分区,以得到分区表,第二数据表与主机上的第一数据表相同,第一数据表按照与该分区键不同的分区键分区。其中,主机对第一数据表分区的分区键称为第一分区键,主机对第一数据表分区后得到的分区表称为第一分区表;备机对第二数据表分区的分区键称为第二分区键,备机对第二数据表分区后得到的分区表称为第二分区表。
本发明实施例提供的物理机为数据库系统集群中的备机,由于可以在备机上按照与主机上对第一数据表分区的第一分区键不同的第二分区键,对与主机上的第一数据表相同的第二数据表分区,以得到与主机上的第一分区表不同的第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
需要说明的是,本发明实施例提供的物理机包括但不限于上述第六方面中的接收单元和执行单元,并且上述第六方面中的接收单元和执行单元具有的功能包括但不限于上述描述的功能。该物理机可以包括用于执行上述第二方面以及第二方面的各种可选方式所述的数据表的处理方法的单元/模块,这些单元/模块是为了执行上述第二方面以及第二方面的各种可选方式所述的数据表的处理方法,而对物理机进行的逻辑上的划分。
上述第六方面各种可选方式的技术效果的描述具体可参见上述对第二方面各种相应可选方式的技术效果的相关描述,此处不再赘述。
第七方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括获取单元、执行单元和发送单元。
获取单元用于获取包括第一查询列和与第一查询列对应的第一查询条件查询指令,该查询指令用于查询分区表中满足第一查询条件的数据;执行单元用于在第一查询列与第一分区表的第一分区键相同的情况下,对第一分区表执行获取单元获取的该查询指令,第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的;发送单元,用于在第一查询列与第二分区表的第二分区键相同的情况下,向备机发送获取单元获取的查询指令,以使备机对第二分区表执行该查询指令,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表与第一数据表相同,第二分区键与第一分区键不同。
本发明实施例提供的物理机为数据库系统集群中的主机,由于第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的,且第二分区表是对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区得到的,因此当主机获取的查询指令中的第一查询列与第一分区键相同时,可以由主机对该第一分区表执行该查询指令,当主机获取的查询指令中的第一查询列与第二分区键相同时,可以由主机向备机发送该查询指令,由备机对该第二分区表执行该查询指令。由于可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
需要说明的是,本发明实施例提供的物理机包括但不限于上述第七方面中的获取单元和执行单元,并且上述第七方面中的获取单元和执行单元具有的功能包括但不限于上述描述的功能。该物理机可以包括用于执行上述第三方面以及第三方面的各种可选方式所述的数据表的处理方法的单元/模块,这些单元/模块是为了执行上述第三方面以及第三方面的各种可选方式所述的数据表的处理方法,而对物理机进行的逻辑上的划分。
上述第七方面各种可选方式的技术效果的描述具体可参见上述对第三方面各种相应可选方式的技术效果的相关描述,此处不再赘述。
第八方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括接收单元和执行单元。
接收单元用于接收主机发送的包括查询列和查询条件的查询指令,该查询列与分区表的分区键相同,该查询指令用于查询该分区表中满足该查询条件的数据,该分区表是对备机上的第二数据表的数据按照该分区键分区得到的,第二数据表和主机上的第一数据表相同;执行单元用于对该分区表执行接收单元接收的该查询指令。
本发明实施例提供的物理机为数据库系统集群中的备机,由于该分区表是对备机上与主机上的第一数据表相同的第二数据表的数据按照该分区键分区得到的,因此当主机获取的查询指令中的查询列与该分区键相同时,主机向备机发送该查询指令,由备机对该分区表执行该查询指令。与现有技术相比,本发明实施例提供的数据表的处理方法,由于备机无需存储多个与主机存储的分区表相同的分区表,因此可以减少备机中存储的分区表的数量,从而能够节省数据库系统集群中的备机的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
需要说明的是,本发明实施例提供的物理机包括但不限于上述第八方面中的接收单元和执行单元,并且上述第八方面中的接收单元和执行单元具有的功能包括但不限于上述描述的功能。该物理机可以包括用于执行上述第四方面以及第四方面的各种可选方式所述的数据表的处理方法的单元/模块,这些单元/模块是为了执行上述第四方面以及第四方面的各种可选方式所述的数据表的处理方法,而对物理机进行的逻辑上的划分。
第九方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括处理器、接口电路、存储器和系统总线。
存储器用于存储计算机执行指令,处理器、接口电路和存储器通过系统总线相互连接,当主机运行时,处理器执行存储器存储的计算机执行指令,以使主机执行上述第一方面或其任意一种可选方式所述的数据表的处理方法。
第十方面,本发明实施例提供一种可读存储介质,该可读存储介质包括计算机执行指令,当主机运行时,主机的处理器执行计算机执行指令,以使主机执行上述第一方面或其任意一种可选方式所述的数据表的处理方法。
上述第九方面和第十方面的技术效果的描述具体可参见上述对第一方面及其各种可选方式的技术效果的相关描述,此处不再赘述。
第十一方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括处理器、接口电路、存储器和系统总线。
存储器用于存储计算机执行指令,处理器、接口电路和存储器通过系统总线相互连接,当备机运行时,处理器执行存储器存储的计算机执行指令,以使备机执行上述第二方面或其任意一种可选方式所述的数据表的处理方法。
第十二方面,本发明实施例提供一种可读存储介质,可读存储介质包括计算机执行指令,当备机运行时,备机的处理器执行计算机执行指令,以使备机执行上述第二方面或其任意一种可选方式所述的数据表的处理方法。
上述第十一方面和第十二方面的技术效果的描述具体可参见上述对第二方面及其各种可选方式的技术效果的相关描述,此处不再赘述。
第十三方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括处理器、接口电路、存储器和系统总线。
存储器用于存储计算机执行指令,处理器、接口电路和存储器通过系统总线相互连接,当主机运行时,处理器执行存储器存储的计算机执行指令,以使主机执行上述第三方面或其任意一种可选方式所述的数据表的处理方法。
第十四方面,本发明实施例提供一种可读存储介质,该可读存储介质包括计算机执行指令,当主机运行时,主机的处理器执行计算机执行指令,以使主机执行上述第三方面或其任意一种可选方式所述的数据表的处理方法。
上述第十三方面和第十四方面的技术效果的描述具体可参见上述对第三方面及其各种可选方式的技术效果的相关描述,此处不再赘述。
第十五方面,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括处理器、接口电路、存储器和系统总线。
存储器用于存储计算机执行指令,处理器、接口电路和存储器通过系统总线相互连接,当备机运行时,处理器执行存储器存储的计算机执行指令,以使备机执行上述第四方面所述的数据表的处理方法。
第十六方面,本发明实施例提供一种可读存储介质,可读存储介质包括计算机执行指令,当备机运行时,备机的处理器执行计算机执行指令,以使备机执行上述第四方面所述的数据表的处理方法。
上述第十五方面和第十六方面的技术效果的描述具体可参见上述对第四方面的技术效果的相关描述,此处不再赘述。
第十七方面,本发明实施例提供一种数据库系统集群,该数据库系统集群包括主机和至少一个备机。其中:
该主机为上述第五方面所述的物理机,该备机为上述第六方面所述的物理机;或者,该主机为上述第七方面所述的物理机,该备机为上述第八方面所述的物理机;或者,该主机为上述第九方面所述的物理机,该备机为上述第十一方面所述的物理机;或者,该主机为上述第十三方面所述的物理机,该备机为上述第十五方面所述的物理机。
第十七方面的技术效果的描述具体可以参见上述对相应方面的技术效果的相关描述,此处不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本发明实施例提供的数据库系统集群的架构示意图;
图2为本发明实施例提供的一种数据表的处理方法的示意图一;
图3为本发明实施例提供的一种数据表的处理方法的示意图二;
图4为本发明实施例提供的一种数据表的处理方法的示意图三;
图5为本发明实施例提供的一种数据表的处理方法的示意图四;
图6为本发明实施例提供的一种数据表的处理方法的示意图五;
图7为本发明实施例提供的另一种数据表的处理方法的示意图一;
图8为本发明实施例提供的另一种数据表的处理方法的示意图二;
图9为本发明实施例提供的主机的结构示意图一;
图10为本发明实施例提供的备机的结构示意图一;
图11为本发明实施例提供的主机的结构示意图二;
图12为本发明实施例提供的物理机的硬件示意图。
具体实施方式
本文中字符“/”,一般表示前后关联对象是一种“或者”的关系。例如,A/B可以理解为A或者B。
本发明的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一分区表和第二分区表等是用于区别不同的分区表,而不是用于描述分区表的特征顺序。
在本发明的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个业务是指两个或两个以上业务。
此外,本发明的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行详细地描述,显然,以下所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。
为了更加清楚地理解本发明实施例的各种实现方式,下面首先对本发明实施例中涉及的技术术语进行定义/说明。
分区技术:是指按照分区键将数据表划分为更小的片段,这些片段在逻辑上属于同一个表空间,而在物理上则是相互独立的数据,这些相互独立的数据形成若干个数据分区。
表空间:是指一个或多个数据表的集合。
数据表:是指包括多个业务的数据的表。该表包括多行和多列,每一列或者每一行对应一个业务。为了便于表述,本发明实施例中以每一列对应一个业务为例进行描述,应理解,在每一行对应一个业务的情况下,本申请所述的方案同样可以执行,具体方式不再赘述。
在每一列对应一个业务的情况下,每一列的表头可以理解为一个业务,每一列的数据可以理解为一个业务的数据。
分区键:是指对数据表进行分区的一个或多个列的表头,或者对数据表进行分区的一个或多个行的表头。为了便于表述,本发明实施例中以分区键是对数据表进行分区的一个列的表头为例进行描述,应理解,在分区键是对数据表进行分区的多个列、一个行或多个行的表头的情况下,本申请所述的方案同样可以执行,具体方式不再赘述。
应理解,在分区键对应列的表头的情况下,查询指令中包括的是查询列,相应的,在分区键对应行的表头的情况下,查询指令中的查询列也可以适应性地被称为查询行,本申请所述的方案同样可以执行,为了便于表述,本申请实施例以分区键为列的表头为例进行叙述,应理解,在分区键对应行的表头的情况下,本申请所述的方案同样可以执行,具体方式不再赘述。
指令集:是指包含多个指令的一个集合。
分区表:是指按照分区键分区后的数据表。
分区:是指按照分区键,将数据表中满足不同条件的行或者列划分为不同区域(也称分区)的过程。需要说明的是,该划分过程通常并不会丢弃数据表中除划分所使用的分区键所在的行或者列之外的其他行或者列。例如,假设数据表有5列,如果按照第3列的表头(即分区键)分区,那么分区后的数据表(或者每个分区)仍然包括5列,即对数据表分区后,每个分区中都包含数据表中原来包含的所有列。可以理解,按照某一列的表头对数据表分区,只是将数据表的所有行划分为不同的分区,而数据表中的所有列在每个分区中都存在。相应的,按照某一行的表头对数据表分区,只是将数据表的所有列划分为不同的分区,而数据表中的所有行在每个分区中都存在。
一种可选方式中,为了提高查询效率,可以在对数据表分区后进一步对每个分区的数据分别进行排序,以使得每个分区的数据在物理上顺序存储。
另一种可选方式中,为了提高查询效率,也可以先对数据表中的数据进行排序,然后再进一步对排序后的数据表进行分区。例如,可以将分区键设置为聚集索引,使得该数据表中的数据均按照该聚集索引在物理上顺序存储,然后再按照分区键的分区条件将设置聚集索引后的数据表进行划分,以完成对数据表的分区。
需要说明的是,按照分区键对数据表进行分区后得到分区表,该分区表可以包括多个小表(每个小表即为一个分区),多个小表可以存储在同一个存储空间,也可以存储在不同的存储空间。但是无论多个小表如何存储,对于用户来说,多个小表在逻辑上仍然为一个大表。例如,本申请中的第一分区表和第二分区表在逻辑上为一个大表。
进一步地,本发明实施例中均以第一分区表和第二分区表为一个大表进行示例性的描述,即本发明实施例中第一分区表和第二分区表均为软件执行中的逻辑上的概念。实际中,第一分区表和第二分区表中的各个分区(即上述的小表)在物理上还可以分区存储,即在物理上存储在不同的存储空间。例如,假设第一分区表包括3个分区,每个分区即为一个小表,这3个小表可以分别存储在物理机的硬盘上的不同扇区中。
查询列:是指对数据表(或者分区表)进行查询的查询参数,示例性的,若对数据表进行查询的查询参数为c1(例如,查询c1满足某个条件的数据),则c1即为查询列。查询列与上述分区键的概念类似,都为数据表中一列或者多列的表头。
分区剪枝:是指根据查询语句中的from分区表和where子句中的查询列和查询条件去除不需要的分区,并提取出需要的分区的过程。例如,分区表为T,T按照c1进行分区,查询列为c1,查询条件为c1<200,则采用分区剪枝技术可以去除T中除c1<200分区外的其他分区,并提取出c1<200的分区,即为T中满足查询条件的数据。
本发明实施例提供的数据表的处理方法可以应用于数据库系统集群中。如图1所示,为本发明实施例提供的一种数据库系统集群的架构示意图。该数据库系统集群包括一个主机A和与该主机连接的若干个备机B,其中,主机和备机上均运行有数据库系统。为了更好地理解运行在不同物理机上的数据库系统,运行在主机上的数据库系统通常称为主数据库系统,运行在每个备机上的数据库系统称为备数据库系统。示例性的,如图1所示,本发明实施例的数据库系统集群包括硬件实体和软件环境。其中,硬件实体包括主机A和若干个备机B;软件环境包括主数据库系统和若干个备数据库系统。
本发明实施例提供的数据库系统集群中,对于主机的具体实现可以参见下述实施例中对主机的结构、主机的硬件以及主机执行的本发明实施例提供的数据表的处理方法的相关描述,此处不再赘述。对于备机的具体实现可以参见下述实施例中对备机的结构、备机的硬件以及备机执行的本发明实施例提供的数据表的处理方法的相关描述,此处不再赘述。
本发明实施例中,具体实现时,可以用数据库系统运行时所处的状态标识数据库系统为主数据库系统或者备数据库系统。具体的,当某个数据库系统运行时所处的状态为“主(英文:primary)”的状态时,表示该数据库系统为主数据库系统;当某个数据库系统运行时所处的状态为“备(英文:standby)”的状态时,表示该数据库系统为备数据库系统。如果某个数据库系统为主数据库系统,则表示还有一个或多个备数据库系统与该主数据库系统连接;如果某个数据库系统为备数据库系统,则表示该备数据库系统连接到主数据库系统。
本领域技术人员可以理解,本发明实施例中的主数据库系统(或者主机)和备数据库系统(或者备机)是相对概念,即主数据库系统和备数据库系统并非是绝对不变的,而是可以根据实际应用需求/场景/环境变化的,本发明不作具体限定。示例性的,假设在一个场景中,数据库系统1为主数据库系统,数据库系统2为备数据库系统;当场景发生变化时,即在另一个场景中,数据库系统1可能为备数据库系统,数据库系统2可能为主数据库系统。
基于上述如图1所示的数据库系统集群,如图2所示,本发明实施例提供一种数据表的处理方法,该处理方法可以应用于数据库系统集群中的主机和备机,该处理方法可以包括:
S101、主机获取第一分区指令和第二分区指令,第一分区指令包括第一分区键,第二分区指令包括第二分区键。
上述第一分区指令用于对主机上的第一数据表按照第一分区键分区,第二分区指令用于对备机上的第二数据表按照第二分区键分区。第一数据表和第二数据表相同,且第一分区键和第二分区键不同。
本发明实施例中,上述主机上的第一数据表表示主机可以读取到的数据表,例如第一数据表可以是存储在主机的存储介质中的,也可以是存储在与该主机对应的存储服务器等存储设备上的,本发明不作具体限定。上述备机上的第二数据表表示备机可以读取到的数据表,例如第二数据表可以是存储在备机的存储介质中的,也可以是主机发送给该备机的,还可以是存储在与该备机对应的存储服务器等存储设备上的,本发明不作具体限定。
其中,上述第一数据表中可以包括多个业务的数据,且每个业务的数据可以理解为第一数据表中的一列数据,即每个业务可以理解为第一数据表中的一列的表头。如此,第一分区键可以理解为多个业务中的一个业务,即第一分区键可以理解为第一数据表中一列的表头;第一分区表为对应于该业务的分区表。第二数据表、第二分区键以及第二分区表分别与第一数据表、第一分区键以及第一分区表类似,此处不再赘述。
一种可选的实现方式是,本发明实施例提供的数据表的处理方法中,在S101之前,该处理方法还包括:
主机获取第一创建指令和第二创建指令,第一创建指令用于在主机上创建第一数据表,第二创建指令用于在备机上创建第二数据表;主机根据第一创建指令在主机上创建第一数据表;主机向备机发送第二创建指令,由备机根据第二创建指令在备机上创建第二数据表。
可选的,本发明实施例中,主机也可以同时获取第一创建指令、第一分区指令、第二创建指令和第二分区指令。
具体的,一种可能的实现方式是主机获取第一指令集和第二指令集,第一指令集包括第一创建指令和第一分区指令,第二指令集包括第二创建指令和第二分区指令。
示例性的,本发明实施例中,第一创建指令和第一分区指令具体可以表示为:
create table T(c1int,c2int)
partition by range(c1)
(partition c1_p1values less than(100),
partition c1_p2values less than(200),
partition c1_p3values less than(300))。
其中,第一创建指令为:
create table T(c1int,c2int);
第一分区指令为:
partition by range(c1)
(partition c1_p1values less than(100),
partition c1_p2values less than(200),
partition c1_p3values less than(300));
上述第一分区指令中的第一分区键为c1(即可以理解为第一分区键为上述数据表中的c1列的表头)。
具体的,上述第一分区指令用于指示按照c1列对第一数据表进行分区,例如,将第一数据表中c1列的数值小于100的所有行分为第一分区(可用上述c1_p1表示),将第一数据表中c1列的数值小于200的所有行分为第二分区(可用上述c1_p2表示),以及将第一数据表中c1列的数值小于300的所有行分为第三分区(可用上述c1_p3表示)等。
示例性的,本发明实施例中,第二创建指令和第二分区指令具体可以表示为:
create table T(c1int,c2int)
partition by range(c2)
(partition c2_p1values less than(1000),
partition c2_p2values less than(2000),
partition c2_p3values less than(3000),
partition c2_p4values less than(4000))。
其中,第二创建指令为:
create table T(c1int,c2int);
第二分区指令为:
partition by range(c2)
(partition c2_p1values less than(1000),
partition c2_p2values less than(2000),
partition c2_p3values less than(3000),
partition c2_p4values less than(4000));
上述第二分区指令中的第二分区键为c2(即可以理解为第二分区键为上述数据表中的c2列的表头)。
由于第一分区键和第二分区键不同,因此上述c1列和c2列为数据表中不同的两列,即c1列的表头和c2列的表头不同,且c1列的表头和c2列的表头分别代表不同的业务。
具体的,上述第二分区指令用于指示按照c2列对第二数据表进行分区,例如,将第二数据表中c2列的数值小于1000的所有行分为第一分区(可用上述c2_p1表示),将第二数据表中c2列的数值小于2000的所有行分为第二分区(可用上述c2_p2表示),将第二数据表中c2列的数值小于3000的所有行分为第三分区(可用上述c2_p3表示),以及将c2列的数值小于4000的所有行分为第四分区(可用上述c2_p4表示)等。
S102、主机根据第一分区指令,对主机上的第一数据表的数据按照第一分区键分区,以得到第一分区表。
示例性的,本发明实施例中,假设主机根据第一创建指令创建的第一数据表为表1(可以表示为T),则表1可以表示为:
表1(T)
行数 客户姓名 账号 年龄(岁) 余额(元)
1 李XX 056 15 859
2 张XX 089 16 1236
3 徐XX 168 16 2568
4 王XX 076 20 3689
5 张XX 273 14 1569
6 张XX 105 18 2880
7 徐XX 289 25 3786
8 王XX 295 31 3900
其中,上述表1中每一列的表头即可表示一个业务。例如,表1中包括客户姓名、账号、年龄以及余额四个业务等。
本发明实施例中,假设第一分区键(例如为上述列举的第一分区指令中的c1)为上述表1中的账号,则主机根据上述列举的第一分区指令(即上述列举的第一分区指令中第一分区键满足的条件),按照账号对表1中的数据分区后得到的第一分区表可以表示为表2(由于表2中的数据与表1相同,因此表2仍然可以表示为T)。
表2(T)
行数 客户姓名 账号 年龄(岁) 余额(元)
1 李XX 056 15 859
4 王XX 076 20 3689
2 张XX 089 16 1236
6 张XX 105 18 2880
3 徐XX 168 16 2568
5 张XX 273 14 1569
7 徐XX 289 25 3786
8 王XX 295 31 3900
从表2可以看出,本发明实施例中,主机对表1按照账号分区后得到的第一分区表可以包括三个分区,假设三个分区分别表示为c1_p1(账号小于100)、c1_p2(账号小于200)和c1_p3(账号小于300),则c1_p1包括表2中行数为1、2和4的三行数据;c1_p2包括表2中行数为1-4和6的五行数据;c1_p3包括表2中行数为1-8的八行数据。
S103、主机向备机发送第二分区指令。
其中,第二分区指令用于触发备机对第二数据表的数据按照第二分区键分区,以得到第二分区表。
S104、备机接收主机发送的第二分区指令。
S105、备机根据第二分区指令,对备机上的第二数据表的数据按照第二分区键分区,以得到第二分区表。
本发明实施例中,上述备机上的第二数据表可以为预先存储在备机上的,也可以为主机在执行本发明实施例提供的数据表的处理方法之前发送给备机的,还可以为主机向备机发送第二分区指令时发送给备机的。具体可以根据实际使用需求确定,本发明不作限定。
本发明实施例中,由于主机上的第一数据表和备机上的第二数据表相同,因此示例性的,假设备机根据第二创建指令创建的第二数据表也为上述表1,且第二分区键(例如为上述列举的第二分区指令中的c2)为上述表1中的余额,则备机根据上述列举的第二分区指令(即上述列举的第二分区指令中第二分区键满足的条件),按照余额对表1中的数据分区后得到的第二分区表可以表示为表3(由于表3中的数据与表1相同,因此表3仍然可以表示为T)。
表3(T)
行数 客户姓名 账号 年龄(岁) 余额(元)
1 李XX 056 15 859
2 张XX 089 16 1236
5 张XX 273 14 1569
3 徐XX 168 16 2568
6 张XX 105 18 2880
4 王XX 076 20 3689
7 徐XX 289 25 3786
8 王XX 295 31 3900
从表3可以看出,本发明实施例中,备机对表1按照余额分区后得到的第二分区表可以包括四个分区,假设四个分区分别表示为c2_p1(余额小于1000)、c2_p2(余额小于2000)、c2_p3(余额小于3000)和c2_p4(余额小于4000),则c2_p1包括表3中行数为1的一行数据;c2_p2包括表3中行数为1、2和5的三行数据;c2_p3包括表3中行数为1-3和5-6的五行数据;c2_p4包括表3中行数为1-8的八行数据。
具体实现中,上述表2和表3中的每个分区也可以单独为一个小表,这些小表可以在物理上分区存储,即在物理上存储在不同的存储空间。例如上述表2为一个大表,该大表包括3个小表,这3个小表对应表2包括的三个分区,这3个小表可以在物理上分区存储;上述表3也为一个大表,该大表包括4个小表,这4个小表对应表3包括的四个分区,这4个小表可以在物理上分区存储。本发明实施例中仅以表2和表3是一个大表,即表2和表3为软件执行中逻辑上的概念为例进行示例性的说明。
进一步地,本发明实施例提供的数据表的处理方法,主机和备机按照上述如图2所示的方法流程分别得到分区表之后,可以针对主机获取的查询指令中的查询列和查询条件在相应的分区表中查询所需的数据。对于对分区表进行查询的描述将在下述实施例中进行详细说明。
本发明实施例提供的数据表的处理方法,由于可以在主机上按照第一分区键对第一数据表分区得到第一分区表,在备机上按照与第一分区键不同的第二分区键,对与第一数据表相同的第二数据表分区得到第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
进一步地,采用本发明实施例提供的数据表的处理方法对数据表进行分区得到分区表后,若采用分区剪枝技术对该分区表进行查询,则可以保证能够准确地筛选出该分区表中满足查询条件的分区。
进一步地,采用本发明实施例提供的数据表的处理方法对数据表进行分区后,由于不同的分区表分别存储在不同的物理机上(例如按照第一分区键分区得到的第一分区表存储在主机上,按照第二分区键分区得到的第二分区表存储在备机上等),因此使得主机上不用存储冗余的分区表,从而能够提升主机的系统性能。
进一步地,采用本发明实施例提供的数据表的处理方法,由于可以在备机上存储与主机上存储的分区表不同的分区表,因此当查询需求越来越大时,可以在不增加主机负荷的情况下,通过扩展备机满足该查询需求,从而提升数据库系统集群的查询能力。
可选的,结合图2,如图3所示,在S105之后,本发明实施例提供的数据表的处理方法还可以包括:
S106、主机获取查询指令。
其中,查询指令包括查询列和查询条件,该查询列与第一分区键相同。
S107、主机对第一分区表执行查询指令。
其中,该查询指令可以为用户通过主机上的输入接口输入的,也可以是由某个网络节点向主机发送的,具体的可以根据实际应用场景确定,本发明实施例不作限定。该查询指令可用于查询第一分区表中满足查询条件的数据。
示例性的,假设查询指令为select*from T where c1<200,则该查询指令中的查询列为c1,查询条件为c1小于200。由于该查询列与第一分区键相同,则该查询指令可用于查询第一分区表中c1小于200的数据。例如,结合上述表1和表2,该查询指令可用于在表2所示的第一分区表中查询账号小于200的数据,即包括表2中行数为1-4和6的五行数据。同时,也可以理解为在第一分区表中查询出c1<200的分区。
具体的,主机对第一分区表执行查询指令可以理解为:主机在第一分区表中查询满足查询条件的数据。例如,基于上述表2,主机在第一分区表中查询账号小于200的数据(即上述所述的c1_p2,包括表2中行数为1-4和6的五行数据)等。
可选的,结合图2,如图4所示,在S105之后,本发明实施例提供的数据表的处理方法还可以包括:
S108、主机获取查询指令。
其中,查询指令包括查询列和查询条件,该查询列与第二分区键相同。
S109、主机向备机发送查询指令。
S110、备机接收主机发送的查询指令。
S111、备机对第二分区表执行该查询指令。
对于查询指令的描述具体可以参见上述如图3所示的实施例中对查询指令的相关描述,此处不再赘述。
示例性的,假设查询指令为select*from T where c2<2000,则该查询指令中的查询列为c2,查询条件为c2小于2000。由于该查询列与第二分区键相同,则该查询指令可用于查询第二分区表中c2小于2000的数据。例如,结合上述表1和表3,该查询指令可用于在表3所示的第二分区表中查询余额小于2000的数据,即包括表3中行数为1、2和5的三行数据。同时,也可以理解为在第二分区表中查询出c2<2000的分区。
具体的,备机对第二分区表执行查询指令可以理解为:备机在第二分区表中查询满足查询条件的数据。例如,基于上述表3,备机在第二分区表中查询余额小于2000的数据(即上述所述的c2_p2,包括表3中行数为1、2和5的三行数据)等。
结合上述图3和图4,本发明实施例提供的数据表的处理方法中,在主机和备机分别得到相应的分区表之后,若主机接收到用户输入或某个网络节点发送的查询指令,则主机首先确定该查询指令中的查询列是否与主机上的第一分区键或备机上的第二分区键相同。如果主机确定该查询列与主机上的第一分区键相同,则主机对第一分区表执行该查询指令。如果主机确定该查询列与备机上的第二分区键相同,则主机将该查询指令发送给备机,由备机对第二分区表执行该查询指令。如果主机确定该查询列与主机上的第一分区键和备机上的第二分区键均不相同,则默认由主机执行该查询指令;具体的,主机通过对第一分区表的数据逐行进行查询,以查询出第一分区表中满足查询条件的数据。
进一步地,在对分区表进行查询时,为了提高查询效率,通常采用分区剪枝技术对分区表进行查询。对于分区剪枝技术的描述具体可参见实施例之前对分区剪枝技术的定义,此处不再赘述。
本发明实施例中,当需要对某个业务进行查询时,可以根据查询指令包括的查询列确定由主机或者备机执行该查询指令,即确定主机和备机中哪一个得到的分区表是按照与该查询列相同的分区键分区的就由哪一个执行该查询指令。如此能够在提高查询效率(只需在相应分区中筛选出满足查询条件的数据,无需对整个数据表进行筛选)的同时节省数据库系统集群中的物理机的存储空间(由于每个物理机上都无需存储多个相同的分区表,因此可以减少数据库系统集群中的每个物理机中存储的分区表的数量)。
可选的,结合图2,如图5所示,在S105之后,本发明实施例提供的数据表的处理方法还可以包括:
S112、主机获取查询指令。
其中,该查询指令包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件,第一查询列与第一分区键相同,第二查询列与第二分区键相同。第一查询条件和第二查询条件之间为“与”的关系。该查询指令用于查询第一分区表中满足第一查询条件和第二查询条件的数据。
为了便于理解本发明实施例的具体实现方式,本发明实施例以查询指令包括两个查询列和两个查询条件为例进行示例性的说明,对于两个以上的查询列和两个以上的查询条件的具体实现方式均与两个查询列和两个查询条件的具体实现方式类似,此处不再赘述。
S113、主机对第一分区表执行该查询指令。
主机获取到查询指令后,首先主机可确定查询指令包括第一查询列,与第一查询列对应的第一查询条件、第二查询列以及与第二查询列对应的第二查询条件;其次主机再判断第一查询列和第二查询列是否与第一分区键和第二分区键相同;若主机确定第一查询列与第一分区键相同,且第二查询列与第二分区键相同,以及第一查询条件和第二查询条件之间为“与”的关系,则主机对第一分区表执行该查询指令。
本实施例中,由于该查询指令既包括与主机上的第一分区键相同的第一查询列,又包括与备机上的第二分区键相同的第二查询列,且主机和备机分别针对相应的查询列和查询条件查询后再做交集的过程非常复杂,因此为了降低查询复杂度,可以直接默认由主机对第一分区表执行该查询指令。具体的,主机可在第一分区表中查询满足第一查询条件的数据,然后主机再在满足第一查询条件的数据中查询满足第二查询条件的数据;或者主机可在第一分区表中查询满足第二查询条件的数据,然后主机再在满足第二查询条件的数据中查询满足第一查询条件的数据,本发明不作限定。
示例性的,假设查询指令为:select*from T where c1<200and c2<2000,由于该查询指令中既包括与主机上的第一分区键相同的第一查询列c1,又包括与备机上的第二分区键相同的第二查询列c2,且两个查询条件(即c1<200和c2<2000)之间为“与”的关系,因此为了降低查询复杂度,可直接由主机对第一分区表执行该查询指令,以在第一分区表中确定出c1<200且c2<2000的数据(例如表2中行数为1和2的两行数据)。
可选的,结合图2,如图6所示,在S105之后,本发明实施例提供的数据表的处理方法还可以包括:
S114、主机获取查询指令。
其中,该查询指令包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件,第一查询列与第一分区键相同,第二查询列与第二分区键相同。对于S114的其他描述具体可参见上述如图5所示的实施例中对S112的相关描述,此处不再赘述。
S114与S112不同的地方在于:
S112中第一查询条件和第二查询条件之间为“与”的关系;S114中第一查询条件和第二查询条件之间为“或”的关系。且S112中查询指令用于查询第一分区表中满足第一查询条件和第二查询条件的数据;S114中查询指令用于查询第一分区表中满足第一查询条件的数据,以及查询第二分区表中满足第二查询条件的数据。
S115、主机将查询指令拆分为第一查询指令和第二查询指令。
其中,第一查询指令包括第一查询列和第一查询条件,用于在第一分区表中查询满足第一查询条件的数据;第二查询指令包括第二查询列和第二查询条件,用于在第二分区表中查询满足第二查询条件的数据。
S116、主机对第一分区表执行第一查询指令。
S117、主机向备机发送第二查询指令。
S118、备机接收主机发送的第二查询指令。
S119、备机对第二分区表执行第二查询指令。
需要说明的是,本发明实施例不限定S116和S117的执行顺序,即本发明实施例可以先执行S116,后执行S117;也可以先执行S117,后执行S116;还可以同时执行S116和S117。
本发明实施例中,由于第一查询指令中的第一查询列与主机上的第一分区表的第一分区键相同,所以可以由主机对第一分区表执行第一查询指令;相应的,由于第二查询指令中的第二查询列与备机上的第二分区表的第二分区键相同,所以可以由备机对第二分区表执行第二查询指令。
示例性的,假设查询指令为:select*from T where c1<200or c2<2000,由于该查询指令中既包括与主机上的第一分区键相同的第一查询列c1,又包括与备机上的第二分区键相同的第二查询列c2,且两个查询条件(即c1<200和c2<2000)之间为“或”的关系,因此主机可将该查询指令拆分为第一查询指令和第二查询指令两个查询指令。其中,第一查询指令可以表示为:select*from T where c1<200;第二查询指令可以表示为select*from T where c2<2000。
本发明实施例中,当查询指令包括两个查询条件(实际使用中还可以是多个查询条件)时,主机可根据两个查询条件的关系具体确定由哪个物理机(主机或备机)执行该查询指令。从而基于采用本发明实施例提供的数据表的处理方法得到的分区表,可以在一定程度上提高对该分区表进行查询的查询效率。
本发明实施例提供的数据表的处理方法中,上述查询指令还可以包括更多数量的查询列。具体的,当上述查询指令包括多个查询列时,主机和备机执行的查询流程仍然可以采用上述图5和图6所示的方法流程。例如,若多个查询条件之间为“与”的关系,则采用如图5所示的方法流程,由主机对第一分区表执行查询指令;若多个查询条件之间为“或”的关系,则采用如图6所示的方法流程,由主机和备机执行查询指令(具体的由主机执行将查询指令拆分后的第一查询指令,由备机执行将查询指令拆分后的第二查询指令)。当然,对于多个查询条件之间既有“与”的关系,又有“或”的关系的情况,在具体实现中可以具体结合如图5和图6所示的方法流程,设计由主机执行如图5所示的方法流程,由备机执行如图6所示的方法流程实现。由于在数据库系统的实际应用中,一般对数据表(或者分区表)查询时,均是多个查询条件之间为“与”的关系,或者多个查询条件之间为“或”的关系的情况,因此,对于多个查询条件之间既有“与”的关系,又有“或”的关系的情况,本发明实施例在此不再详述。
本领域技术人员可以理解,结合上述图3、图4、图5和图6可知,若查询指令包括一个查询条件,则本发明实施例中主机和备机按照上述如图3或图4所示的方法流程执行;若查询指令包括多个查询条件,则本发明实施例中主机和备机按照上述如图5或图6所示的方法流程执行。
可选的,本发明实施例提供的数据表的处理方法中,上述S101中所示的主机获取第一指令集和第二指令集的方法具体可以包括:
主机获取指令集,指令集包括创建指令、第一分区指令和第二分区指令;主机根据创建指令和第一分区指令生成第一指令集,并根据创建指令和第二分区指令生成第二指令集。
其中,该指令集可以为用户通过主机上的输入接口输入的,也可以是由某个网络节点向主机发送的,具体的可以根据实际应用场景确定,本发明实施例不作限定。
示例性的,本发明实施例中,该指令集可以表示为:
create table T(c1int,c2int)
partition by range(c1)on primary
(partition c1_p1values less than(100),
partition c1_p2values less than(200),
partition c1_p3values less than(300))
partition by range(c2)on standby
(partition c2_p1values less than(1000),
partition c2_p2values less than(2000),
partition c2_p3values less than(3000),
partition c2_p4values less than(4000))。
其中,上述指令集中的创建指令为:
create table T(c1int,c2int);
上述指令集中的第一分区指令为:
partition by range(c1)on primary
(partition c1_p1values less than(100),
partition c1_p2values less than(200),
partition c1_p3values less than(300));
上述指令集中的第二分区指令为:
partition by range(c2)on standby
(partition c2_p1values less than(1000),
partition c2_p2values less than(2000),
partition c2_p3values less than(3000),
partition c2_p4values less than(4000))
需要说明的是,该指令集中的第一分区指令与上述第一指令集中的分区指令是完全等价的,且该指令集中的第二分区指令与上述第二分区指令集中的第二分区指令也是完全等价的。由于该指令集中既包括第一分区指令又包括第二分区指令,因此该指令集中的第一分区指令还指示了在主机上按照第一分区键c1分区(即上述partition by range(c1)on primary),且该指令集中的第二分区指令还指示了在备机上按照第二分区键c2分区(partition by range(c2)on standby)。
对于第一指令集和第二指令集的描述具体可参见上述S101中对第一指令集和第二指令集的相关描述,此处不再赘述。
可选的,本发明实施例提供的数据表的处理方法中,在主机得到第一分区表,备机得到第二分区表之后,主机和备机之间还可以通过逻辑日志同步第一分区表和第二分区表,即主机和备机之间可以通过逻辑日志保持第一分区表中的数据和第二分区表中的数据一致。
具体的,主机和备机之间通过逻辑日志同步可以理解为:主机接收到修改指令后,主机直接将修改指令发送给备机,这样主机和备机分别通过执行修改指令对各自的分区表进行修改。
示例性的,本发明实施例提供的数据表的处理方法还可以包括:
主机接收修改指令;主机根据修改指令对第一分区表进行修改;主机向备机发送修改指令;备机接收主机发送的修改指令;备机根据修改指令对第二分区表进行修改。
其中,该修改指令用于对数据表(具体可以包括第一数据表和第二数据表)中的数据进行修改。该修改包括插入、删除或改变等。
采用本实施例的方法流程,可以保证主机和备机上的数据表(或者分区表)同步。本发明实施例中,采用上述S101-S105,主机和备机可以创建相同的数据表;相应的,采用本实施例的方法流程,由于主机接收到修改指令后,主机将根据该修改指令修改主机上的第一分区表,并且主机会将该修改指令发送给备机,使得备机也根据该修改指令修改备机上的第二分区表,因此仍然能够保证主机上的第一分区表中的数据和备机上的第二分区表中的数据保持一致。
本发明实施例中,与主机和备机之间采用物理日志同步各自的分区表的方法(采用物理日志同步可以理解为:主机将修改的数据发送给备机,由备机更新该数据)相比,主机和备机之间采用逻辑日志同步各自的分区表的方法,由于主机直接将修改指令(修改指令的开销远远小于数据的开销)发送给备机,由备机通过执行该修改指令修改其分区表,因此能够节省主机上的第一分区表和备机上的第二分区表进行同步的同步开销。
如图7所示,本发明实施例还提供一种数据表的处理方法,该处理方法应用于数据库系统集群中的主机,该数据库系统集群包括主机和备机,该处理方法包括:
S201、主机获取查询指令,该查询指令包括第一查询列和与第一查询列对应的第一查询条件。
其中,该查询指令用于查询分区表中满足第一查询条件的数据。
S202、在第一查询列与第一分区表的第一分区键相同的情况下,主机对第一分区表执行该查询指令。
其中,第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的。第一数据表中可以包括多个业务的数据,且每个业务的数据可以理解为第一数据表中的一列数据,即每个业务可以理解为第一数据表中的一列的表头。如此,第一分区键可以理解为多个业务中的一个业务,即第一分区键可以理解为第一数据表中一列的表头;第一分区表为对应于该业务的分区表。
本发明实施例中,上述S201和S202的其他描述具体可参见上述如图3所示的实施例中对S106-S107的相关描述及举例,为了避免重复,此处不再赘述。
本发明实施例中,在执行S201之前,主机在主机上创建第一数据表,并对第一数据表的数据按照第一分区键分区以得到第一分区表;备机在备机上创建与第一数据表相同的第二数据表,并对第二数据表按照第二分区键分区以得到第二分区表。具体的,主机创建第一数据表和得到第一分区表,以及备机创建第二数据表和得到第二分区表的方法可参见上述如图2所示的实施例中对S101-S105的相关描述及举例,为了避免重复,此处不再赘述。
S203、在第一查询列与第二分区表的第二分区键相同的情况下,主机向备机发送该查询指令。
S204、备机接收主机发送的查询指令。
S205、备机对第二分区表执行该查询指令。
其中,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表与主机上的第一数据表相同,第二分区键与上述第一分区键不同。第二数据表、第二分区键以及第二分区表分别与第一数据表、第一分区键以及第一分区表类似,具体可参见上述对第一数据表、第一分区键以及第一分区表的相关描述,此处不再赘述。
本发明实施例中,上述S201和S203-S205的描述具体可参见上述如图4所示的实施例中对S108-S111的相关描述及举例,为了避免重复,此处不再赘述。
需要说明的是,在上述S201之后,S202和S203-S205择一执行;即在S201之后执行S202或者执行S203-S205。为了清楚地描述S202和S203-S205的执行,图7中S202和S203-S205均以虚线表示。
本发明实施例提供的数据表的处理方法,由于第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的,且第二分区表是对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区得到的,因此当主机获取的查询指令中的第一查询列与第一分区键相同时,可以由主机对该第一分区表执行该查询指令,当主机获取的查询指令中的第一查询列与第二分区键相同时,可以由主机向备机发送该查询指令,由备机对该第二分区表执行该查询指令。由于可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
可选的,本发明实施例中,在上述第一查询列与第一分区表的第一分区键相同的情况下,查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“与”的关系,查询指令还用于查询第一分区表中满足第二查询条件的数据,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和第一数据表相同,第二分区键与第一分区键不同。
本发明实施例中,当查询指令还包括第二查询列和第二查询条件,且第二查询列与第二分区键相同,以及第一查询条件和第二查询条件之间为“与”的关系时的描述具体可参见上述如图5所示的实施例中对S112-S113的相关描述及举例,为了避免重复,此处不再赘述。
可选的,本发明实施例中,在上述第一查询列与第一分区表的第一分区键相同的情况下,查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“或”的关系,查询指令还用于查询第二分区表中满足第二查询条件的数据,结合图7,如图8所示,在S201之后,本发明实施例提供的数据表的处理方法还可以包括:
S206、主机将查询指令拆分为第一查询指令和第二查询指令。
其中,第一查询指令包括第一查询列和第一查询条件,第二查询指令包括第二查询列和第二查询条件,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和主机上的第一数据表相同,第二分区键与第一分区键不同。
S207、主机向备机发送第二查询指令。
S208、备机接收主机发送的第二查询指令。
S209、备机对第二分区表执行第二查询指令。
其中,如图8所示,上述如图7所示的S202具体可以包括S202a:
S202a、主机对第一分区表执行第一查询指令。
本发明实施例中,当查询指令还包括第二查询列和第二查询条件,且第二查询列与第二分区键相同,以及第一查询条件和第二查询条件之间为“或”的关系时,上述S201和S206-S210的描述具体可参见上述如图6所示的实施例中对S114-S119的相关描述及举例,为了避免重复,此处不再赘述。
本发明实施例中,当查询指令包括两个查询条件(实际使用中还可以是多个查询条件)时,主机可根据两个查询条件的关系具体确定由哪个物理机(主机或备机)执行该查询指令。从而基于采用本发明实施例提供的数据表的处理方法得到的分区表,可以在一定程度上提高对该分区表进行查询的查询效率。
如图9所示,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括:
获取单元10,用于获取第一分区指令和第二分区指令,第一分区指令包括第一分区键,第二分区指令包括第二分区键,第二分区键与第一分区键不同;执行单元11,用于根据获取单元10获取的第一分区指令,对主机上的第一数据表的数据按照第一分区键分区,以得到第一分区表;发送单元12,用于向备机发送获取单元10获取的第二分区指令,第二分区指令用于触发备机对备机上的第二数据表的数据按照第二分区键分区,以得到第二分区表,第二数据表与第一数据表相同。
可选的,获取单元10,还用于获取查询指令,该查询指令包括查询列和查询条件,该查询列与第一分区键相同,该查询指令用于查询第一分区表中满足该查询条件的数据;执行单元11,还用于对第一分区表执行获取单元10获取的1查询指令。
可选的,获取单元10,还用于获取查询指令,该查询指令包括查询列和查询条件,该查询列与第二分区键相同,该查询指令用于查询第二分区表中满足该查询条件的数据;发送单元12,还用于向备机发送获取单元10获取的查询指令,以使备机对第二分区表执行该查询指令。
可选的,获取单元10,还用于获取查询指令,该查询指令包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件,第一查询列与第一分区键相同,第二查询列与第二分区键相同,第一查询条件和第二查询条件之间为“与”的关系,该查询指令用于查询第一分区表中满足第一查询条件和第二查询条件的数据;执行单元11,还用于对第一分区表执行获取单元10获取的该查询指令。
可选的,获取单元10,还用于获取查询指令,该查询指令包括第一查询列、与第一查询列对应的第一查询条件、第二查询列和与第二查询列对应的第二查询条件,第一查询列与第一分区键相同,第二查询列与第二分区键相同,第一查询条件和第二查询条件之间为“或”的关系,该查询指令用于查询第一分区表中满足第一查询条件的数据,以及查询第二分区表中满足第二查询条件的数据。执行单元11,还用于将获取单元10获取的该查询指令拆分为第一查询指令和第二查询指令,第一查询指令包括第一查询列和第一查询条件,第二查询指令包括第二查询列和第二查询条件;并对第一分区表执行第一查询指令;发送单元12,还用于向备机发送执行单元11拆分后的第二查询指令,以使备机对第二分区表执行第二查询指令。
本发明实施例中,上述获取单元10和执行单元11均可以通过一个或多个处理器实现;上述发送单元12可以通过接口电路实现。示例性的,上述发送单元12具体可以为物理机上的接口电路(必要时还可以包括相应的软件接口)。
本发明实施例提供的物理机为数据库系统集群中的主机,由于可以在主机上按照第一分区键对主机上的第一数据表分区得到第一分区表,在备机上按照与第一分区键不同的第二分区键,对备机上与第一数据表相同的第二数据表分区得到第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
如图10所示,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括:
接收单元20,用于接收主机发送的分区指令,该分区指令包括分区键;执行单元21,用于根据接收单元20接收的该分区指令,对备机上的第二数据表的数据按照该分区键分区,以得到分区表,第二数据表与主机上的第一数据表相同。
本实施例中,第一数据表按照与该分区键不同的分区键分区。其中,主机对第一数据表分区的分区键称为第一分区键,主机对第一数据表分区后得到的分区表称为第一分区表;备机对第二数据表分区的分区键称为第二分区键,备机对第二数据表分区后得到的分区表称为第二分区表。
可选的,接收单元20,还用于接收主机发送的查询指令,该查询指令包括查询列和查询条件,该查询列与该分区键相同,该查询指令用于查询该分区表中满足该查询条件的数据;执行单元21,还用于对该分区表执行接收单元20接收的该查询指令。
本发明实施例中,上述执行单元21可以通过一个或多个处理器实现;上述接收单元20可以通过接口电路实现。示例性的,上述接收单元20具体可以为物理机上的接口电路(必要时还可以包括相应的软件接口)。
本发明实施例提供的物理机为数据库系统集群中的备机,由于可以在备机上按照与主机上对第一数据表分区的第一分区键不同的第二分区键,对与主机上的第一数据表相同的第二数据表分区,以得到与主机上的第一分区表不同的第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
如图11所示,本发明实施例提供一种物理机,该物理机为数据库系统集群中的主机,该数据库系统集群包括主机和备机,该主机包括:
获取单元30,用于获取查询指令,该查询指令包括第一查询列和与第一查询列对应的第一查询条件,该查询指令用于查询分区表中满足第一查询条件的数据;执行单元31,用于在第一查询列与第一分区表的第一分区键相同的情况下,对第一分区表执行获取单元30获取的该查询指令,第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的;发送单元32,用于在第一查询列与第二分区表的第二分区键相同的情况下,向备机发送获取单元30获取的该查询指令,以使备机对第二分区表执行该查询指令,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表与第一数据表相同,第二分区键与第一分区键不同。
可选的,在第一查询列与第一分区表的第一分区键相同的情况下,该查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“与”的关系,该查询指令还用于查询第一分区表中满足第二查询条件的数据,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和第一数据表相同,第二分区键与第一分区键不同。
可选的,在第一查询列与第一分区表的第一分区键相同的情况下,该查询指令还包括第二查询列和第二查询条件,第二查询列与第二分区表的第二分区键相同,第一查询条件和第二查询条件之间为“或”的关系,该查询指令还用于查询第二分区表中满足第二查询条件的数据,
执行单元31,还用于将获取单元30获取的查询指令拆分为第一查询指令和第二查询指令,第一查询指令包括第一查询列和第一查询条件,第二查询指令包括第二查询列和第二查询条件,第二分区表是对备机上的第二数据表的数据按照第二分区键分区得到的,第二数据表和第一数据表相同,第二分区键与第一分区键不同;发送单元32,还用于向备机发送执行单元31拆分后的第二查询指令,以使备机对第二分区表执行第二查询指令;执行单元31,具体用于对第一分区表执行第一查询指令。
本发明实施例中,上述获取单元30和执行单元31均可以通过一个或多个处理器实现;上述发送单元32可以通过接口电路实现。示例性的,上述发送单元32具体可以为物理机上的接口电路(必要时还可以包括相应的软件接口)。
本发明实施例提供的物理机为数据库系统集群中的主机,由于第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的,且第二分区表是对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区得到的,因此当主机获取的查询指令中的第一查询列与第一分区键相同时,可以由主机对该第一分区表执行该查询指令,当主机获取的查询指令中的第一查询列与第二分区键相同时,可以由主机向备机发送该查询指令,由备机对该第二分区表执行该查询指令。由于可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
如图10所示,本发明实施例提供一种物理机,该物理机为数据库系统集群中的备机,该数据库系统集群包括主机和备机,该备机包括:
接收单元20,用于接收主机发送的查询指令,该查询指令包括查询列和查询条件,该查询列与分区表的分区键相同,该查询指令用于查询该分区表中满足该查询条件的数据,该分区表是对备机上的第二数据表的数据按照该分区键分区得到的,第二数据表和主机上的第一数据表相同;执行单元21,用于对该分区表执行接收单元20接收的该查询指令。
本发明实施例中,上述执行单元21可以通过一个或多个处理器实现;上述接收单元20可以通过接口电路实现。示例性的,上述接收单元20具体可以为物理机上的接口电路(必要时还可以包括相应的软件接口)。
本发明实施例提供的物理机为数据库系统集群中的备机,由于该分区表是对备机上与主机上的第一数据表相同的第二数据表的数据按照该分区键分区得到的,因此当主机获取的查询指令中的查询列与该分区键相同时,主机向备机发送该查询指令,由备机对该分区表执行该查询指令。与现有技术相比,本发明实施例提供的数据表的处理方法,由于备机无需存储多个与主机存储的分区表相同的分区表,因此可以减少备机中存储的分区表的数量,从而能够节省数据库系统集群中的备机的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
如图12所示,本发明实施例提供一种物理机,该物理机包括处理器40、接口电路41、存储器42和系统总线43。
存储器42用于存储计算机执行指令,处理器40、接口电路41和存储器42通过系统总线43相互连接,当该物理机运行时,处理器40执行存储器42存储的计算机执行指令,以使该物理机执行本发明实施例提供的数据表的处理方法。
第一种可能的实现方式中,当如图12所示的物理机为上述如图9所示的主机时,上述如图9所示的获取单元10和执行单元11可以通过一个或多个如图12所示的处理器40实现;上述如图9所示的发送单元12可以通过如图12所示的接口电路41实现。
第二种可能的实现方式中,当如图12所示的物理机为上述如图10所示的备机时,上述如图10所示的执行单元21可以通过一个或多个如图12所示的处理器40实现;上述如图10所示的接收单元20可以通过如图12所示的接口电路41实现。
第三种可能的实现方式中,当如图12所示的物理机为上述如图11所示的主机时,上述如图11所示的获取单元30和执行单元31可以通过一个或多个如图12所示的处理器40实现;上述如图11所示的发送单元32可以通过如图12所示的接口电路41实现。
第四种可能的实现方式中,当如图12所示的物理机为上述如图10所示的备机时,上述如图10所示的执行单元21可以通过一个或多个如图12所示的处理器40实现;上述如图10所示的接收单元20可以通过如图12所示的接口电路41实现。
在第一种可能的实现方式和第二种可能的实现方式中,如图12所示的物理机执行如图2至图6任意之一所示的数据表的处理方法。在第三种可能的实现方式和第四种可能的实现方式中,如图12所示的物理机执行如图7至图8任意之一所示的数据表的处理方法。对于如图2至图6任意之一,以及图7至图8任意之一所示的数据表的处理方法,具体可参见上述实施例中的相关描述,为了避免重复,此处不再赘述。
处理器40可以通过一个或多个处理器实现,图12仅以一个处理器为例进行示例性的说明。处理器40可以为中央处理器(英文:central processing unit,缩写:CPU)。处理器40还可以为其他通用处理器、数字信号处理器(英文:digital signal processing,缩写:DSP)、专用集成电路(英文:application specific integrated circuit,缩写:ASIC)、现场可编程门阵列(英文:field-programmable gate array,缩写:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
接口电路41具体可以是物理机上的通信接口。该通信接口可以为无线通信接口。例如,无线通信接口可以是物理机的无线模块等。处理器40通过接口电路41与其他设备,例如其他物理机之间进行数据的收发。
存储器42可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器42也可以包括非易失性存储器(英文:non-volatile memory),例如只读存储器(英文:read-only memory,缩写:ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器42还可以包括上述种类的存储器的组合。
存储器42可以包括底层存储介质和内存。其中,内存耦合至底层存储介质,用于作为底层存储介质的缓存。
系统总线43可以包括数据总线、电源总线、控制总线和信号状态总线等。本实施例中为了清楚说明,在图12中将各种总线都示意为系统总线43。
可选的,本实施例还提供一种可读存储介质,该可读存储介质包括计算机执行指令,当物理机运行时,物理机的处理器执行该计算机执行指令,以使物理机执行本发明实施例提供的如图2至图6任意之一或者如图7至图8任意之一所示的数据表的处理方法。
可选的,本实施例中的可读存储介质可以为上述如图12所示的存储器42。
本发明实施例提供的物理机为数据库系统集群中的主机或备机,应用于上述如图2至图6任意之一所示的数据表的处理方法,由于可以在主机上按照第一分区键对主机上的第一数据表分区得到第一分区表,在备机上按照与第一分区键不同的第二分区键,对备机上与第一数据表相同的第二数据表分区得到第二分区表,即可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
本发明实施例提供的物理机为数据库系统集群中的主机或备机,应用于上述如图7至图8任意之一所示的数据表的处理方法,由于第一分区表是对主机上的第一数据表的数据按照第一分区键分区得到的,且第二分区表是对备机上与第一数据表相同的第二数据表的数据按照第二分区键分区得到的,因此当主机获取的查询指令中的第一查询列与第一分区键相同时,可以由主机对该第一分区表执行该查询指令,当主机获取的查询指令中的第一查询列与第二分区键相同时,可以由主机向备机发送该查询指令,由备机对该第二分区表执行该查询指令。由于可以在主机和备机上对相同的数据表按照不同的分区键分区,以得到不同的分区表,因此与现有技术相比,本发明实施例提供的数据表的处理方法,由于主机和备机均无需存储多个相同的分区表,因此可以减少主机和备机中存储的分区表的数量,从而能够节省数据库系统集群中的物理机(包括主机和备机)的存储空间,进而提升数据处理的性能,即能够更好地实现对数据的管理。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本发明各个实施例所述方法的全部或部分步骤。所述存储介质是非短暂性(英文:non-transitory)介质,包括:快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (19)

1.一种数据表的处理方法,其特征在于,所述处理方法应用于数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述处理方法包括:
所述主机获取第一分区指令和第二分区指令,所述第一分区指令包括第一分区键,所述第一分区指令用于对所述主机上的第一数据表按照所述第一分区键分区,所述第二分区指令包括第二分区键,所述第二分区键与所述第一分区键不同,所述第二分区指令用于对所述备机上的第二数据表按照所述第二分区键分区;
所述主机根据所述第一分区指令,对所述主机上的第一数据表的数据按照所述第一分区键分区,以得到第一分区表;
所述主机向所述备机发送所述第二分区指令,所述第二分区指令用于触发所述备机对所述备机上的第二数据表的数据按照所述第二分区键分区,以得到第二分区表,所述第二数据表与所述第一数据表相同。
2.根据权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
所述主机获取查询指令,所述查询指令包括查询列和查询条件,所述查询列与所述第一分区键相同,所述查询指令用于查询所述第一分区表中满足所述查询条件的数据;
所述主机对所述第一分区表执行所述查询指令。
3.根据权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
所述主机获取查询指令,所述查询指令包括查询列和查询条件,所述查询列与所述第二分区键相同,所述查询指令用于查询所述第二分区表中满足所述查询条件的数据;
所述主机向所述备机发送所述查询指令,以使所述备机对所述第二分区表执行所述查询指令。
4.根据权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
所述主机获取查询指令,所述查询指令包括第一查询列、与所述第一查询列对应的第一查询条件、第二查询列和与所述第二查询列对应的第二查询条件,所述第一查询列与所述第一分区键相同,所述第二查询列与所述第二分区键相同,所述第一查询条件和所述第二查询条件之间为“与”的关系,所述查询指令用于查询所述第一分区表中满足所述第一查询条件和所述第二查询条件的数据;
所述主机对所述第一分区表执行所述查询指令。
5.根据权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
所述主机获取查询指令,所述查询指令包括第一查询列、与所述第一查询列对应的第一查询条件、第二查询列和与所述第二查询列对应的第二查询条件,所述第一查询列与所述第一分区键相同,所述第二查询列与所述第二分区键相同,所述第一查询条件和所述第二查询条件之间为“或”的关系,所述查询指令用于查询所述第一分区表中满足所述第一查询条件的数据,以及查询所述第二分区表中满足所述第二查询条件的数据;
所述主机将所述查询指令拆分为第一查询指令和第二查询指令,所述第一查询指令包括所述第一查询列和所述第一查询条件,所述第二查询指令包括所述第二查询列和所述第二查询条件;
所述主机对所述第一分区表执行所述第一查询指令;
所述主机向所述备机发送所述第二查询指令,以使所述备机对所述第二分区表执行所述第二查询指令。
6.一种数据表的处理方法,其特征在于,所述处理方法应用于数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述处理方法包括:
所述主机获取查询指令,所述查询指令包括第一查询列和与所述第一查询列对应的第一查询条件,所述查询指令用于查询分区表中满足所述第一查询条件的数据;
在所述第一查询列与第一分区表的第一分区键相同的情况下,所述主机对所述第一分区表执行所述查询指令,所述第一分区表是对所述主机上的第一数据表的数据按照所述第一分区键分区得到的;
在所述第一查询列与第二分区表的第二分区键相同的情况下,所述主机向所述备机发送所述查询指令,以使所述备机对所述第二分区表执行所述查询指令,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表与所述第一数据表相同,所述第二分区键与所述第一分区键不同。
7.根据权利要求6所述的处理方法,其特征在于,在所述第一查询列与第一分区表的第一分区键相同的情况下,
所述查询指令还包括第二查询列和第二查询条件,所述第二查询列与第二分区表的第二分区键相同,所述第一查询条件和所述第二查询条件之间为“与”的关系,所述查询指令还用于查询所述第一分区表中满足所述第二查询条件的数据,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表和所述第一数据表相同,所述第二分区键与所述第一分区键不同。
8.根据权利要求6所述的处理方法,其特征在于,在所述第一查询列与第一分区表的第一分区键相同的情况下,
所述查询指令还包括第二查询列和第二查询条件,所述第二查询列与第二分区表的第二分区键相同,所述第一查询条件和所述第二查询条件之间为“或”的关系,所述查询指令还用于查询所述第二分区表中满足所述第二查询条件的数据,所述处理方法还包括:
所述主机将所述查询指令拆分为第一查询指令和第二查询指令,所述第一查询指令包括所述第一查询列和所述第一查询条件,所述第二查询指令包括所述第二查询列和所述第二查询条件,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表和所述第一数据表相同,所述第二分区键与所述第一分区键不同;
所述主机向所述备机发送所述第二查询指令,以使所述备机对所述第二分区表执行所述第二查询指令;
所述主机对所述第一分区表执行所述查询指令,包括:
所述主机对所述第一分区表执行所述第一查询指令。
9.一种物理机,其特征在于,所述物理机为数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述主机包括:
获取单元,用于获取第一分区指令和第二分区指令,所述第一分区指令包括第一分区键,所述第一分区指令用于对所述主机上的第一数据表按照所述第一分区键分区,所述第二分区指令包括第二分区键,所述第二分区键与所述第一分区键不同,所述第二分区指令用于对所述备机上的第二数据表按照所述第二分区键分区;
执行单元,用于根据所述获取单元获取的所述第一分区指令,对所述主机上的第一数据表的数据按照所述第一分区键分区,以得到第一分区表;
发送单元,用于向备机发送所述获取单元获取的所述第二分区指令,所述第二分区指令用于触发所述备机对所述备机上的第二数据表的数据按照所述第二分区键分区,以得到第二分区表,所述第二数据表与所述第一数据表相同。
10.根据权利要求9所述的物理机,其特征在于,
所述获取单元,还用于获取查询指令,所述查询指令包括查询列和查询条件,所述查询列与所述第一分区键相同,所述查询指令用于查询所述第一分区表中满足所述查询条件的数据;
所述执行单元,还用于对所述第一分区表执行所述获取单元获取的所述查询指令。
11.根据权利要求9所述的物理机,其特征在于,
所述获取单元,还用于获取查询指令,所述查询指令包括查询列和查询条件,所述查询列与所述第二分区键相同,所述查询指令用于查询所述第二分区表中满足所述查询条件的数据;
所述发送单元,还用于向所述备机发送所述获取单元获取的所述查询指令,以使所述备机对所述第二分区表执行所述查询指令。
12.根据权利要求9所述的物理机,其特征在于,
所述获取单元,还用于获取查询指令,所述查询指令包括第一查询列、与所述第一查询列对应的第一查询条件、第二查询列和与所述第二查询列对应的第二查询条件,所述第一查询列与所述第一分区键相同,所述第二查询列与所述第二分区键相同,所述第一查询条件和所述第二查询条件之间为“与”的关系,所述查询指令用于查询所述第一分区表中满足所述第一查询条件和所述第二查询条件的数据;
所述执行单元,还用于对所述第一分区表执行所述获取单元获取的所述查询指令。
13.根据权利要求9所述的物理机,其特征在于,
所述获取单元,还用于获取查询指令,所述查询指令包括第一查询列、与所述第一查询列对应的第一查询条件、第二查询列和与所述第二查询列对应的第二查询条件,所述第一查询列与所述第一分区键相同,所述第二查询列与所述第二分区键相同,所述第一查询条件和所述第二查询条件之间为“或”的关系,所述查询指令用于查询所述第一分区表中满足所述第一查询条件的数据,以及查询所述第二分区表中满足所述第二查询条件的数据;
所述执行单元,还用于将所述获取单元获取的所述查询指令拆分为第一查询指令和第二查询指令,所述第一查询指令包括所述第一查询列和所述第一查询条件,所述第二查询指令包括所述第二查询列和所述第二查询条件;并对所述第一分区表执行所述第一查询指令;
所述发送单元,还用于向所述备机发送所述执行单元拆分后的所述第二查询指令,以使所述备机对所述第二分区表执行所述第二查询指令。
14.一种物理机,其特征在于,所述物理机为数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述主机包括:
获取单元,用于获取查询指令,所述查询指令包括第一查询列和与所述第一查询列对应的第一查询条件,所述查询指令用于查询分区表中满足所述第一查询条件的数据;
执行单元,用于在所述第一查询列与第一分区表的第一分区键相同的情况下,对所述第一分区表执行所述获取单元获取的所述查询指令,所述第一分区表是对所述主机上的第一数据表的数据按照所述第一分区键分区得到的;
发送单元,用于在所述第一查询列与第二分区表的第二分区键相同的情况下,向所述备机发送所述获取单元获取的所述查询指令,以使所述备机对所述第二分区表执行所述查询指令,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表与所述第一数据表相同,所述第二分区键与所述第一分区键不同。
15.根据权利要求14所述的物理机,其特征在于,在所述第一查询列与第一分区表的第一分区键相同的情况下,
所述查询指令还包括第二查询列和第二查询条件,所述第二查询列与第二分区表的第二分区键相同,所述第一查询条件和所述第二查询条件之间为“与”的关系,所述查询指令还用于查询所述第一分区表中满足所述第二查询条件的数据,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表和所述第一数据表相同,所述第二分区键与所述第一分区键不同。
16.根据权利要求14所述的物理机,其特征在于,在所述第一查询列与第一分区表的第一分区键相同的情况下,
所述查询指令还包括第二查询列和第二查询条件,所述第二查询列与第二分区表的第二分区键相同,所述第一查询条件和所述第二查询条件之间为“或”的关系,所述查询指令还用于查询所述第二分区表中满足所述第二查询条件的数据,
所述执行单元,还用于将所述获取单元获取的所述查询指令拆分为第一查询指令和第二查询指令,所述第一查询指令包括所述第一查询列和所述第一查询条件,所述第二查询指令包括所述第二查询列和所述第二查询条件,所述第二分区表是对所述备机上的第二数据表的数据按照所述第二分区键分区得到的,所述第二数据表和所述第一数据表相同,所述第二分区键与所述第一分区键不同;
所述发送单元,还用于向所述备机发送所述执行单元拆分后的所述第二查询指令,以使所述备机对所述第二分区表执行所述第二查询指令;
所述执行单元,具体用于对所述第一分区表执行所述第一查询指令。
17.一种物理机,其特征在于,所述物理机为数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述主机包括处理器、接口电路、存储器和系统总线;
所述存储器用于存储计算机执行指令,所述处理器、所述接口电路和所述存储器通过所述系统总线相互连接,当所述主机运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述主机执行如权利要求1至5任意一项所述的数据表的处理方法。
18.一种物理机,其特征在于,所述物理机为数据库系统集群中的主机,所述数据库系统集群包括所述主机和备机,所述主机包括处理器、接口电路、存储器和系统总线;
所述存储器用于存储计算机执行指令,所述处理器、所述接口电路和所述存储器通过所述系统总线相互连接,当所述主机运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述主机执行如权利要求6至8任意一项所述的数据表的处理方法。
19.一种数据库系统集群,其特征在于,所述数据库系统集群包括主机和至少一个备机,其中:
所述主机如权利要求9至13任意一项或17所述,所述主机与所述至少一个备机进行交互,其中,所述备机用于接收所述主机发送的第二分区指令以及根据所述第二分区指令对所述备机上的第二数据表的数据按照所述第二分区指令中的第二分区键分区以得到第二分区表;或者,
所述主机如权利要求14至16任意一项或18所述,所述主机与所述至少一个备机进行交互,其中,所述备机用于接收所述主机发送的查询指令以及对所述备机上的第二分区表执行所述查询指令。
CN201610379416.8A 2016-05-31 2016-05-31 一种数据表的处理方法、装置及系统 Active CN107451154B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610379416.8A CN107451154B (zh) 2016-05-31 2016-05-31 一种数据表的处理方法、装置及系统
PCT/CN2017/075998 WO2017206562A1 (zh) 2016-05-31 2017-03-08 一种数据表的处理方法、装置及系统
US16/204,526 US20190108174A1 (en) 2016-05-31 2018-11-29 Data Table Processing Method and Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610379416.8A CN107451154B (zh) 2016-05-31 2016-05-31 一种数据表的处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN107451154A CN107451154A (zh) 2017-12-08
CN107451154B true CN107451154B (zh) 2021-03-30

Family

ID=60479708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610379416.8A Active CN107451154B (zh) 2016-05-31 2016-05-31 一种数据表的处理方法、装置及系统

Country Status (3)

Country Link
US (1) US20190108174A1 (zh)
CN (1) CN107451154B (zh)
WO (1) WO2017206562A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019274B (zh) * 2017-12-29 2023-09-26 阿里巴巴集团控股有限公司 一种数据库系统以及查询数据库的方法和装置
US11347705B2 (en) * 2019-04-02 2022-05-31 Sap Se Supporting scalable distributed secondary index using replication engine for high-performance distributed database systems
CN113590613A (zh) * 2021-07-13 2021-11-02 上海一谈网络科技有限公司 数据表分区方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101572625A (zh) * 2009-04-24 2009-11-04 北京锐安科技有限公司 一种ip分区方法
US7650394B2 (en) * 2006-09-15 2010-01-19 Microsoft Corporation Synchronizing email recipient lists using block partition information
CN103942287A (zh) * 2014-04-10 2014-07-23 大唐移动通信设备有限公司 海量数据处理方法、数据库服务器及应用服务器
CN105069134A (zh) * 2015-08-18 2015-11-18 上海新炬网络信息技术有限公司 一种Oracle统计信息自动收集方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086732A (zh) * 2006-06-11 2007-12-12 上海全成通信技术有限公司 一种海量数据管理方法
CN101556589A (zh) * 2008-04-09 2009-10-14 北京闻言科技有限公司 一种Oracle在数据库中定期淘汰过期数据的方法
US20100169289A1 (en) * 2008-12-30 2010-07-01 International Business Machines Corporation Two Phase Commit With Grid Elements
US8904381B2 (en) * 2009-01-23 2014-12-02 Hewlett-Packard Development Company, L.P. User defined data partitioning (UDP)—grouping of data based on computation model
CN101876983B (zh) * 2009-04-30 2012-11-28 国际商业机器公司 数据库分区方法与系统
US8676751B2 (en) * 2011-06-23 2014-03-18 International Business Machines Corporation High availability database systems and methods
CN104871153B8 (zh) * 2012-10-29 2019-02-01 华为技术有限公司 用于分布式大规模并行处理数据库的方法和系统
CN103440301B (zh) * 2013-08-21 2017-06-13 曙光信息产业股份有限公司 一种数据多副本混合存储方法及系统
US10002148B2 (en) * 2014-07-22 2018-06-19 Oracle International Corporation Memory-aware joins based in a database cluster
CN104199881B (zh) * 2014-08-21 2018-07-06 广州华多网络科技有限公司 数据库集群、数据查询方法、数据同步方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7650394B2 (en) * 2006-09-15 2010-01-19 Microsoft Corporation Synchronizing email recipient lists using block partition information
CN101572625A (zh) * 2009-04-24 2009-11-04 北京锐安科技有限公司 一种ip分区方法
CN103942287A (zh) * 2014-04-10 2014-07-23 大唐移动通信设备有限公司 海量数据处理方法、数据库服务器及应用服务器
CN105069134A (zh) * 2015-08-18 2015-11-18 上海新炬网络信息技术有限公司 一种Oracle统计信息自动收集方法

Also Published As

Publication number Publication date
US20190108174A1 (en) 2019-04-11
WO2017206562A1 (zh) 2017-12-07
CN107451154A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
US10331642B2 (en) Data storage method and apparatus
CN108733681B (zh) 信息处理方法及装置
US10374792B1 (en) Layout-independent cryptographic stamp of a distributed dataset
CN107515878B (zh) 一种数据索引的管理方法及装置
US11030178B2 (en) Data storage method and apparatus
US20160179836A1 (en) Method for updating data table of keyvalue database and apparatus for updating table data
US20190197040A1 (en) Method and apparatus for processing join query
CN107451154B (zh) 一种数据表的处理方法、装置及系统
US20150149437A1 (en) Method and System for Optimizing Reduce-Side Join Operation in a Map-Reduce Framework
US11226986B2 (en) Data table partitioning management method and apparatus
WO2018205689A1 (zh) 合并文件的方法、存储装置、存储设备和存储介质
CN111104250B (zh) 用于数据处理的方法、设备和计算机可读介质
CN110609924A (zh) 基于图数据的全量关系计算方法、装置、设备及存储介质
US10896056B2 (en) Cluster expansion method and apparatus, electronic device and storage medium
EP4012573A1 (en) Graph reconstruction method and apparatus
EP4170512A1 (en) Time series data injection method, time series data query method and database system
CN112162731B (zh) 数据扩展方法、装置、存储介质及电子装置
US10712959B2 (en) Method, device and computer program product for storing data
US8782364B2 (en) Determining availability of data elements in a storage system
JP6397105B2 (ja) データを記憶する方法及び装置
CN115687387A (zh) 一种sql语句生成方法、装置、设备及存储介质
Cao et al. Efficient and Flexible Index Access in MapReduce.
CN115934761A (zh) 一种基于Counting布隆过滤器的数据库中间件查询优化方法
CN117931790A (zh) 数据存储方法、装置、计算机设备和存储介质
CN114756626A (zh) 数据处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant