CN114942965A - 一种数据库主备同步操作的加速方法和系统 - Google Patents

一种数据库主备同步操作的加速方法和系统 Download PDF

Info

Publication number
CN114942965A
CN114942965A CN202210751846.3A CN202210751846A CN114942965A CN 114942965 A CN114942965 A CN 114942965A CN 202210751846 A CN202210751846 A CN 202210751846A CN 114942965 A CN114942965 A CN 114942965A
Authority
CN
China
Prior art keywords
database
operation module
data
module
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210751846.3A
Other languages
English (en)
Other versions
CN114942965B (zh
Inventor
刘睿民
李文峰
莫明勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Birui Data Technology Co ltd
Original Assignee
Beijing Birui Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Birui Data Technology Co ltd filed Critical Beijing Birui Data Technology Co ltd
Priority to CN202210751846.3A priority Critical patent/CN114942965B/zh
Publication of CN114942965A publication Critical patent/CN114942965A/zh
Application granted granted Critical
Publication of CN114942965B publication Critical patent/CN114942965B/zh
Priority to PCT/CN2022/139851 priority patent/WO2024001079A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的一种数据库主备同步操作的加速方法和系统,从根本上提升了数据库集群的运行效率和读写性能,解决了数据库集群因现有数据同步方法和读写分离方案所带来的问题,包括数据库集群性能不足、响应延迟大、计算资源难以充分利用等,进而极大地提升了数据库集群处理数据库操作的性能。

Description

一种数据库主备同步操作的加速方法和系统
技术领域
本发明涉及数据库技术领域,特别涉及一种数据库主备同步操作的加速方法和系统。
背景技术
在数据库技术领域,数据同步操作和数据读写分离是提升数据库系统读写性能和数据同步效率、以及保证数据一致性的重要手段,尤其在由一主多备的数据库节点组成的数据库集群中。
目前,数据同步的方法主要是由主数据库节点完成相关的数据库操作,然后通过数据异步复制或同步复制的方式实现数据同步,其中包括增量同步和全量同步。不管异步复制,还是同步复制都能够在确保数据一致性的基础上,都能够实现数据增量同步,但由于数据同步需要等待主节点完成一定的数据库操作后才能由主数据库节点通过数据传输网络向备数据库节点进行数据复制,使得数据同步依然存在很大的延迟,严重影响了数据库集群的运行效率和整体性能。
在此基础上,为了提升数据库集群的性能,提出了数据读写分离的技术方案,该方案通过由主数据库节点承担写操作(包括数据增加、删除和修改操作),由备节点承担读操作。此种方式很大程度上有效地减轻主数据库节点的负载压力,提升了数据库集群的读写性能,但因主数据库节点存在性能瓶颈,且受到目前数据同步方法的影响,读写分离的技术方案并未从根本上解决制约数据库集群性能的问题,数据库集群依然存在性能瓶颈、响应延迟大,以及数据库节点计算资源难以得到充分利用的问题。具体存在如下问题:
1、数据库操作完成后,才进行数据同步,使得数据同步存在较大延迟;
2、数据库操作均由数据库主节点的CPU完成,消耗大量主节点资源,同时因主节点的性能瓶颈,导致降低了整个集群的性能;
3、在读取数据时,无法根据集群中节点闲置情况,动态响应用户的读取请求,导致响应存在较大延迟。
因此,有必要引入一种新的方法及系统,解决数据库集群因现有数据同步方法和读写分离方案所带来的数据库集群性能不足、响应延迟大、计算资源难以充分利用等问题,进而在保障数据一致性的基础上,从根本上提升数据库集群的运行效率和读写性能。
发明内容
针对现有技术的不足,本发明提出了一种数据库主备同步操作的加速方法和系统,通过在由主备节点构成的数据库集群中增加和部署数据库操作模块,将数据库操作(增、删和更新)的计算和需要同步的数据,以及数据库读服务都下载至操作模块,解决了如下问题:
首先,本发明数据库操作和数据同步可以同步进行和完成,而传统的数据库操作完成后,才进行数据同步,使得数据同步存在较大延迟。
其次,本发明可以释放数据库节点资源,而现有数据库操作均由数据库主节点的CPU完成,消耗大量主节点资源,同时因主节点的性能瓶颈,导致降低了整个集群的性能。
最后,本发明操作模块统一管理和动态协调,实现了负载均衡,而现有技术在读取数据时,无法根据集群中节点闲置情况,动态响应用户的读取请求,导致响应存在较大延迟。
第一方面,本发明提供一种数据库主备同步操作的加速方法,应用于由主备节点构成的数据库集群中,所述方法包括:S1,初始化操作:执行时间信息同步,以及从数据库节点下载数据;S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步;S3,向用户端返回数据库操作结果。
其中,所述S1,初始化操作:执行时间信息同步,以及从数据库节点下载数据,具体包括:
S1-1,主操作模块通过时间模块获取时间信息,并向数据库主备节点上的操作模块发送初始化操作指令;
S1-2,部署于数据库主备节点上的操作模块收到所述指令后,分别从对应数据库节点上下载数据,并提取数据库节点上的数据信息;
S1-3,数据下载完成后,将所述指令完成结果信息和时间信息返回至主操作模块;
S1-4,主操作模块根据所述指令完成结果信息进行比对,判断各个数据库节点上的操作模块初始化数据是否一致;
S1-5,当所述初始化数据一致时,获取并存储所述数据库节点上的数据信息;
S1-6,统计各个操作模块的闲置状态;其中,所述闲置状态包括是否执行任务、执行任务数量、当前执行任务的类型。
其中,所述S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步,具体包括:
S2-1,主操作模块实时接收用户端请求,打上时间标签Tstart
S2-2,主操作模块提取所述用户端请求中的SQL语句,并对SQL进行解析、编译和优化,生成带有所述时间标签Tstart的执行计划;
S2-3,主操作模块根据请求类型和数据库节点上各个操作模块的闲置状况及主从关系,将所述执行计划分发至数据库节点上的各个操作模块执行;其中,所述请求类型包括数据增加、删除、更新和查询;
S2-4,所述操作模块将所述执行计划执行完成后,返回执行结果。
其中,所述S3,向用户端返回数据库操作结果,具体包括;
S3-1,所述主操作模块收到所述执行结果,判断所述执行结果的类型;
S3-2,如果所述执行结果为增加、删除或更新的数据库操作的执行结果,所述主操作模块在收到第一个执行结果时,即向用户端返回所述数据库操作结果,同时提取并更新所述数据信息,以及数据库操作信息,并记录所述完成时间Tend,更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作是否成功和/或操作量;
S3-3,如果所述执行结果为数据查询结果,所述主操作模块在收到所述执行结果时,向用户端返回数据查询结果,同时记录所述时间信息Tend,并更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作为数据查询结果。
第二方面,本发明提供一种数据库主备同步操作的加速系统,包括一主操作单元,以及部署在多个数据库节点上的操作模块;
所述主操作单元包括主操作模块以及时间模块,所述时间模块通过IO总线与主操作模块连接;所述主操作模块分别与用户端以及部署在数据库节点上的操作模块相连接;
其中,所述时间模块,用于获取时间信息;
其中,所述主操作模块,具体包括:
输入单元,用于接收用户端的请求指令;
第一同步单元,用于从时间模块中获取时间信息,并为从用户端接收的用户端请求打上时间标签;以及完成主操作模块与部署于数据库节点上的操作模块之间的时间信息同步;
第一数据操作执行单元,用于对所述用户端请求进行解析、优化、编译并生成对应的执行计划;并用于统计部署于数据库节点上的操作模块的闲置状态信息;
第一发送单元,用于将所述执行计划发送给部署于数据库节点上的操作模块;
第一接收单元,用于接收所述操作模块返回的执行结果;
第一缓存单元,用于缓存所述执行计划和所述操作模块返回的执行结果;
第一数据存储单元,用于存储各个操作模块的闲置状态信息、返回的执行结果,以及数据信息;
第一节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口;
输出单元,用于向用户端返回所述用户端请求对应的执行结果;
其中,所述部署在数据库节点上的操作模块,具体包括:
第二同步单元,用于获取所述主操作模块发送的时间信息,并在所述操作模块完成数据库操作后,为数据库操作打上所述数据库操作完成的时间标签;
第二数据操作执行单元,用于执行对所述操作模块接收到的执行计划;
第二发送单元,用于将所述执行结果返回所述主操作模块;
第二接收单元,用于接收所述主操作模块发出的执行计划和同步的时间信息;
第二缓存单元,用于缓存所述执行计划和所述执行计划执行的中间结果,以及从数据库中提取的数据信息和数据;
第二数据存储单元,用于存储从数据库中提取的数据信息及数据;
第二节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口。
可见,本发明通过数据库操作模块在主备节点上的部署和集中管理,将数据库操作(增、删和更新)的计算和需要同步的数据下载至操作模块,由操作模块统一完成处理,并在处理结束后,通过各个操作模块将这些数据库操作结果及数据同步至数据库集群中的主备节点上执行;当用户读取数据时,主操作模块解析和优化读取指令,并根据各个操作模块的闲置状态统一协调,将任务分发至闲置的操作模块执行,使得所有操作模块均可以响应读取请求。与现有技术中相比,本发明至少具备如下有益效果:
首先,通过使用自主设计的用于数据库主备同步操作加速的操作模块,实现了将此前由数据库完成的数据库操作下载至操作模块完成,减轻了数据库本身的工作负载,提升了数据库集群的读写性能和效率;
其次,操作模块在完成数据库操作的同时,完成了主备数据库集群中各个数据库节点的数据同步,并由主操作模块通过统一校验保障了数据的一致性,避免了数据库节点间通过网络传输完成数据同步操作带来延迟问题,也从根本上解决了主备数据库节点的数据同步机制制约数据库集群性能的问题,提供了一种全新的方法,进而有效提升了准备数据库节点间数据同步的实时性,以及数据库集群性能;
最后,通过主操作模块对部署于各个数据库节点上的操作模块进行统一的管理、时间同步和负载均衡,充分且有效地利用数据库集群中的闲置资源,进一步提升了数据库集群的数据同步和整体运行的效率和可用性。
综上,本发明由此实现了操作模块在处理和加速数据库操作的同时,也完成了主备数据库节点间以及操作模块与数据库节点间的数据同步操作,以及主备节点动态响应读取请求,从而在保障了主备节点数据一致性的基础上,省去了节点间的数据同步复制操作,提升数据同步复制的实时性,更进一步节省了节点的计算资源,提升数据库系统对外提供读写服务的性能;并且通过统一管理和动态协调,实现了系统的负载均衡。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明数据库主备同步操作的加速方法流程示意图。
图2为本发明数据库主备同步操作的加速系统架构图。
图3为本发明数据库主备同步操作的加速系统中的主操作模块结构示意图。
图4为本发明数据库主备同步操作的加速系统中的操作模块结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1所示,本发明实施例提供一种数据库主备同步操作的加速方法,应用于由主备节点构成的数据库集群中,数据库以主流数据库为主,mysql,oracle,informix,db2等,集群以统一的数据库为主。
优选地,在一个实施例中,数据库主备同步操作的加速方法执行以下流程:
S101,执行操作模块时间信息和数据初始化,包括执行时间信息同步,以及从数据库节点下载数据。主操作模块可以通过IO总线,从时间模块获取时间信息。
S102,判断时间信息和数据初始化是否成功,如果不成功,返回S101,执行操作模块时间信息和数据初始化,如果成功,进入下一步骤。
S103,主操作模块实时接收用户端请求,并打上时间标签。
S104,提取SQL语句,并对SQL进行解析、编译和优化,生成带有所述时间标签的执行计划。
S105,数据查询操作的同步与其他操作不同,因此进行请求类型是否为数据查询操作的判断。
如果不是数据查询操作,则进入S106,主操作模块将执行计划下发至数据节点上的各个操作模块中执行,并更新各个操作模块的闲置状态。
S107,各个操作模块执行执行计划,并生成包含元数据、操作状态、时间消耗、和数据量大小等数据信息,以及数据库操作信息和完成时间等信息的执行结果。
S108,将执行结果返回主操作模块,同时将执行结果发送至部署所述操作模块的数据库节点上的数据库中,同步完成每个数据库节点的数据同步更新。
最后执行S122,主操作模块收到执行结果,向用户端返回数据库操作结果,并记录时间信息,更新操作模块的闲置状态。
如果是数据查询操作,则进入S109,主操作模块根据数据库节点上的各个操作模块的正在执行任务或待执行任务的情况,优先将所述执行计划下发至资源闲置或剩余执行任务较少的所述操作模块上执行,并更新所述操作模块的闲置状态;
S120,所述操作模块执行完成所述执行计划后生成执行结果,执行结果包括查询结果和查询完成的时间等信息。
S121,操作模块将执行结果返回主操作模块。
最后同样执行S122,主操作模块收到执行结果,向用户端返回数据库操作结果,并记录时间信息,更新操作模块的闲置状态。
通过使用操作模块,实现了将此前由数据库完成的数据库操作下载至操作模块完成,操作模块在完成数据库操作的同时,完成了主备数据库集群中各个数据库节点的数据同步。
可见,本发明由此实现了操作模块在处理和加速数据库操作的同时,也完成了主备数据库节点间以及操作模块与数据库节点间的数据同步操作,以及主备节点动态响应读取请求,从而在保障了主备节点数据一致性的基础上,省去了节点间的数据同步复制操作,提升数据同步复制的实时性,更进一步节省了节点的计算资源,提升数据库系统对外提供读写服务的性能;并且通过统一管理和动态协调,实现了系统的负载均衡。
综上所述,本发明数据库主备同步操作的加速方法总结如下:S1,初始化操作:执行时间信息同步,以及从数据库节点下载数据;S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步;S3,向用户端返回数据库操作结果。
优选地,所述S1,初始化操作:执行时间信息同步,以及从数据库节点下载数据,具体包括:
S1-1,主操作模块通过时间模块获取时间信息,并向数据库主备节点上的操作模块发送初始化操作指令;
S1-2,部署于数据库主备节点上的操作模块收到所述指令后,分别从对应数据库节点上下载数据,并提取数据库节点上的数据信息;
S1-3,数据下载完成后,将所述指令完成结果信息和时间信息返回至主操作模块;
S1-4,主操作模块根据所述指令完成结果信息进行比对,判断各个数据库节点上的操作模块初始化数据是否一致;
S1-5,当所述初始化数据一致时,获取并存储所述数据库节点上的数据信息;
S1-6,统计各个操作模块的闲置状态;其中,所述闲置状态包括是否执行任务、执行任务数量、当前执行任务的类型。
优选地,所述S1-1,主操作模块通过时间模块获取时间信息,并向数据库主备节点上的操作模块发送初始化操作指令,具体包括:
S1-1-1,初始化操作时,主操作模块通过IO总线,从时间模块获取时间信息,记为数据库集群初始化启动时间Tsu;其中,所述时间模块通过IO总线与主操作模块连接,时间模块的时间信息与真实时间同步更新;
S1-1-2,向数据库主备节点上的操作模块发送初始化操作指令,并同步发送初始化启动时间Tsu;其中,所述初始化操作指令为由SQL编译后生成的能够被数据库系统直接执行的操作指令,所述操作指令中包含数据初始化比例P,
P=(CMmax×P操作模块)/CMdata×100%;
其中,CMmax为操作模块可使用的最大存储空间;P操作模块为预设的操作模块允许使用的存储空间比例,如60%、80%等;CMdata为数据库节点上的所有数据所占存储空间的大小。,
优选地,所述S1-2,部署于数据库主备节点上的操作模块收到所述指令后,分别从对应数据库节点上下载数据,并提取数据库节点上的数据信息,具体包括:
S1-2-1,部署于数据库主备节点上的操作模块收到所述指令后,对指令进行分解,获得初始化启动时间Tsu和初始化操作指令;
S1-2-2,将所述初始化操作指令下推至同一节点的数据库中执行;
S1-2-3,执行数据库根据所述初始化操作指令,获取比例为所述初始化比例P的数据,并将所述数据下载至部署于该节点上的操作模块中;
S1-2-4,数据加载完成时,所述操作模块获取主操作模块同步的时间信息,记为数据加载完成时间TSE
S1-2-5,将所述数据加载完成时间TSE与所述操作指令完成结果信息返回至主操作模块;其中,所述操作指令完成结果信息至少包括以下数据:元数据、操作状态、时间消耗、和数据量大小。
优选地,所述S1-3,数据下载完成后,将所述指令完成结果信息和时间信息返回至主操作模块,还包括:
S1-3-1,主操作模块收到所述操作指令完成结果信息后,提取其中的数据与部署于主节点上的所述操作模块返回的信息进行比对;
S1-3-2,如果一致,则初始化成功,并记录数据库集群初始化结束时间TSE
S1-3-3,如果不一致,则将主数据库节点上的数据重新备份至不一致的数据库节点,并执行步骤S1-3-2,直到初始化成功,并记录数据库集群初始化结束时间TSE
优选地,所述S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步,具体包括:
S2-1,主操作模块实时接收用户端请求,打上时间标签Tstart
S2-2,主操作模块提取所述用户端请求中的SQL语句,并对SQL进行解析、编译和优化,生成带有所述时间标签Tstart的执行计划;
S2-3,主操作模块根据请求类型和数据库节点上各个操作模块的闲置状况及主从关系,将所述执行计划分发至数据库节点上的各个操作模块执行;其中,所述请求类型包括数据增加、删除、更新和查询,通过请求中的SQL语句即可判断;
S2-4,所述操作模块将所述执行计划执行完成后,返回执行结果。
优选地,所述S2-3,主操作模块根据请求类型和数据库节点上各个操作模块的闲置状况及主从关系,将所述执行计划分发至数据库节点上的各个操作模块执行,具体包括:
S2-3-1,主操作模块根据SQL语句判断并识别所述请求类型;
S2-3-2,如果所述请求类型为增加、删除或更新的数据库操作,则执行S2-3-3;如果所述请求类型为数据查询,则执行S2-3-4;
S2-3-3,主操作模块根据数据库节点上的各个操作模块的正在执行任务或待执行任务的情况,依次将所述执行计划下发至数据库节点上的各个操作模块中执行,并更新各个操作模块的闲置状态;所述操作模块执行完成所述执行计划后生成执行结果;其中,执行结果至少包括以下数据信息:元数据、数据量大小,以及数据库操作信息和完成时间Tend;.
S2-3-4,主操作模块根据数据库节点上的各个操作模块的正在执行任务或待执行任务的情况,优先将所述执行计划下发至资源闲置或剩余执行任务较少的所述操作模块上执行,并更新所述操作模块的闲置状态;所述操作模块执行完成所述执行计划后生成执行结果;其中,执行结果包括查询结果和查询完成的时间Tend
优选地,所述S2-3-4,所述操作模块执行完成所述执行计划后生成执行结果,具体包括:
S2-3-4-1,所述操作模块接收到执行计划,优先判断所述执行计划涉及的数据的存储位置;
S2-3-4-2,如果所述存储位置均处于所述操作模块中,则执行S1-3-4-3;如果所述存储位置部分处于所述操作模块中,则执行S1-3-4-4;
S2-3-4-3,由所述操作模块完成查询操作后即可向所述主操作模块返回查询结果和查询完成的时间信息Tend
S2-3-4-4,所述操作模块将所述执行计划发送至其所在的数据库中执行,执行结束后,将查询结果返回所述执行模块,所述执行结果将收到所述查询结果的时间记为查询完成的时间信息Tend,将所述查询结果和所述时间信息Tend作为执行结果返回所述主操作模块。
优选地,所述S3,向用户端返回数据库操作结果,具体包括;
S3-1,所述主操作模块收到所述执行结果,判断所述执行结果的类型;
S3-2,如果所述执行结果为增加、删除或更新的数据库操作的执行结果,所述主操作模块在收到第一个执行结果时,即向用户端返回所述数据库操作结果,同时提取并更新所述数据信息,以及数据库操作信息,并记录所述完成时间Tend,更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作是否成功和/或操作量;例如,增加、删除或删除操作返回的数据库操作结果为:增加/删除/修改成功,增加/删除/修改了n条数据。
S3-3,如果所述执行结果为数据查询结果,所述主操作模块在收到所述执行结果时,向用户端返回数据查询结果,同时记录所述时间信息Tend,并更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作为数据查询结果。
参照图2所示,本发明实施例还提供一种数据库主备同步操作的加速系统,包括一主操作单元,以及部署在多个数据库节点上的操作模块。
所述主操作单元包括主操作模块以及时间模块,所述时间模块通过IO总线与主操作模块连接;所述主操作模块分别与用户端以及部署在数据库节点上的操作模块相连接。
优选地,所述时间模块,用于获取时间信息。
在一个实施例中,参照图3所示,主操作模块具体包括:
输入单元,用于接收用户端的请求指令;
第一同步单元,用于从时间模块中获取时间信息,并为从用户端接收的用户端请求打上时间标签;以及完成主操作模块与部署于数据库节点上的操作模块之间的时间信息同步;
第一数据操作执行单元,用于对所述用户端请求进行解析、优化、编译并生成对应的执行计划;并用于统计部署于数据库节点上的操作模块的闲置状态信息;
第一发送单元,用于将所述执行计划发送给部署于数据库节点上的操作模块;
第一接收单元,用于接收所述操作模块返回的执行结果;
第一缓存单元,用于缓存所述执行计划和所述操作模块返回的执行结果;
第一数据存储单元,用于存储各个操作模块的闲置状态信息、返回的执行结果,以及数据信息;
第一节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口,该接口可以是以太口、IB口等;
输出单元,用于向用户端返回所述用户端请求对应的执行结果;
在一个实施例中,参照图4所示,部署在数据库节点上的操作模块具体包括:
第二同步单元,用于获取所述主操作模块发送的时间信息,并在所述操作模块完成数据库操作(包括增加、删除、修改和读取)后,为数据库操作打上所述数据库操作完成的时间标签;
第二数据操作执行单元,用于执行对所述操作模块接收到的执行计划;
第二发送单元,用于将所述执行结果返回所述主操作模块;
第二接收单元,用于接收所述主操作模块发出的执行计划和同步的时间信息;
第二缓存单元,用于缓存所述执行计划和所述执行计划执行的中间结果,以及从数据库中提取的数据信息和数据;
第二数据存储单元,用于存储从数据库中提取的数据信息及数据;
第二节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口,该接口可以是以太口、IB口等。
可见,本发明通过数据库操作模块在主备节点上的部署和集中管理,将数据库操作(增、删和更新)的计算和需要同步的数据下载至操作模块,由操作模块统一完成处理,并在处理结束后,通过各个操作模块将这些数据库操作结果及数据同步至数据库集群中的主备节点上执行;当用户读取数据时,主操作模块解析和优化读取指令,并根据各个操作模块的闲置状态统一协调,将任务分发至闲置的操作模块执行,使得所有操作模块均可以响应读取请求。与现有技术中相比,本发明至少具备如下有益效果:
首先,通过使用自主设计的用于数据库主备同步操作加速的操作模块,实现了将此前由数据库完成的数据库操作下载至操作模块完成,减轻了数据库本身的工作负载,提升了数据库集群的读写性能和效率;
其次,操作模块在完成数据库操作的同时,完成了主备数据库集群中各个数据库节点的数据同步,并由主操作模块通过统一校验保障了数据的一致性,避免了数据库节点间通过网络传输完成数据同步操作带来延迟问题,也从根本上解决了主备数据库节点的数据同步机制制约数据库集群性能的问题,提供了一种全新的方法,进而有效提升了准备数据库节点间数据同步的实时性,以及数据库集群性能;
最后,通过主操作模块对部署于各个数据库节点上的操作模块进行统一的管理、时间同步和负载均衡,充分且有效地利用数据库集群中的闲置资源,进一步提升了数据库集群的数据同步和整体运行的效率和可用性。
综上,本发明由此实现了操作模块在处理和加速数据库操作的同时,也完成了主备数据库节点间以及操作模块与数据库节点间的数据同步操作,以及主备节点动态响应读取请求,从而在保障了主备节点数据一致性的基础上,省去了节点间的数据同步复制操作,提升数据同步复制的实时性,更进一步节省了节点的计算资源,提升数据库系统对外提供读写服务的性能;并且通过统一管理和动态协调,实现了系统的负载均衡。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种数据库主备同步操作的加速方法,应用于由主备节点构成的数据库集群中,其特征在于,所述方法包括:
S1,进行初始化操作:执行时间信息同步,以及从数据库节点下载数据;
S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步;
S3,向用户端返回数据库操作结果。
2.如权利要求1所述的方法,其中,所述S1,进行初始化操作:执行时间信息同步,以及从数据库节点下载数据,具体包括:
S1-1,主操作模块通过时间模块获取时间信息,并向数据库主备节点上的操作模块发送初始化操作指令;
S1-2,部署于数据库主备节点上的操作模块收到所述指令后,分别从对应数据库节点上下载数据,并提取数据库节点上的数据信息;
S1-3,数据下载完成后,将所述指令完成结果信息和时间信息返回至主操作模块;
S1-4,主操作模块根据所述指令完成结果信息进行比对,判断各个数据库节点上的操作模块初始化数据是否一致;
S1-5,当所述初始化数据一致时,获取并存储所述数据库节点上的数据信息;
S1-6,统计各个操作模块的闲置状态;其中,所述闲置状态包括是否执行任务、执行任务数量、当前执行任务的类型。
3.如权利要求2所述的方法,其中,所述S1-1,主操作模块通过时间模块获取时间信息,并向数据库主备节点上的操作模块发送初始化操作指令,具体包括:
S1-1-1,初始化操作时,主操作模块通过IO总线,从时间模块获取时间信息,记为数据库集群初始化启动时间Tsu;其中,所述时间模块通过IO总线与主操作模块连接,时间模块的时间信息与真实时间同步更新;
S1-1-2,向数据库主备节点上的操作模块发送初始化操作指令,并同步发送初始化启动时间Tsu;其中,所述初始化操作指令为由SQL编译后生成的能够被数据库系统直接执行的操作指令,所述操作指令中包含数据初始化比例P,
P=(CMmax×P操作模块)/CMdata×100%;
其中,CMmax为操作模块可使用的最大存储空间;
P操作模块为预设的操作模块允许使用的存储空间比例;
CMdata为数据库节点上的所有数据所占存储空间的大小。
4.如权利要求3所述的方法,其中,所述S1-2,部署于数据库主备节点上的操作模块收到所述指令后,分别从对应数据库节点上下载数据,并提取数据库节点上的数据信息,具体包括:
S1-2-1,部署于数据库主备节点上的操作模块收到所述指令后,对指令进行分解,获得初始化启动时间Tsu和初始化操作指令;
S1-2-2,将所述初始化操作指令下推至同一节点的数据库中执行;
S1-2-3,执行数据库根据所述初始化操作指令,获取比例为所述初始化比例P的数据,并将所述数据下载至部署于该节点上的操作模块中;
S1-2-4,数据加载完成时,所述操作模块获取主操作模块同步的时间信息,记为数据加载完成时间TSE
S1-2-5,将所述数据加载完成时间TSE与所述操作指令完成结果信息返回至主操作模块;其中,所述操作指令完成结果信息至少包括以下数据:元数据、操作状态、时间消耗、和数据量大小。
5.如权利要求2所述的方法,其中,所述S1-3,数据下载完成后,将所述指令完成结果信息和时间信息返回至主操作模块,还包括:
S1-3-1,主操作模块收到所述操作指令完成结果信息后,提取其中的数据与部署于主节点上的所述操作模块返回的信息进行比对;
S1-3-2,如果一致,则初始化成功,并记录数据库集群初始化结束时间TSE
S1-3-3,如果不一致,则将主数据库节点上的数据重新备份至不一致的数据库节点,并执行步骤S1-3-2,直到初始化成功,并记录数据库集群初始化结束时间TSE
6.如权利要求1所述的方法,其中,所述S2,实时接收用户端请求,并根据请求类型完成对应的数据库操作和数据同步,具体包括:
S2-1,主操作模块实时接收用户端请求,打上时间标签Tstart
S2-2,主操作模块提取所述用户端请求中的SQL语句,并对SQL进行解析、编译和优化,生成带有所述时间标签Tstart的执行计划;
S2-3,主操作模块根据请求类型和数据库节点上各个操作模块的闲置状况及主从关系,将所述执行计划分发至数据库节点上的各个操作模块执行;其中,所述请求类型包括数据增加、删除、更新和查询;
S2-4,所述操作模块将所述执行计划执行完成后,返回执行结果。
7.如权利要求6所述的方法,其中,所述S2-3,主操作模块根据请求类型和数据库节点上各个操作模块的闲置状况及主从关系,将所述执行计划分发至数据库节点上的各个操作模块执行,具体包括:
S2-3-1,主操作模块根据SQL语句判断并识别所述请求类型;
S2-3-2,如果所述请求类型为增加、删除或更新的数据库操作,则执行S2-3-3;如果所述请求类型为数据查询,则执行S2-3-4;
S2-3-3,主操作模块根据数据库节点上的各个操作模块的正在执行任务或待执行任务的情况,依次将所述执行计划下发至数据库节点上的各个操作模块中执行,并更新各个操作模块的闲置状态;所述操作模块执行完成所述执行计划后生成执行结果;其中,执行结果至少包括以下数据信息:元数据、数据量大小,以及数据库操作信息和完成时间Tend
S2-3-4,主操作模块根据数据库节点上的各个操作模块的正在执行任务或待执行任务的情况,优先将所述执行计划下发至资源闲置或剩余执行任务较少的所述操作模块上执行,并更新所述操作模块的闲置状态;所述操作模块执行完成所述执行计划后生成执行结果;其中,执行结果包括查询结果和查询完成的时间Tend
8.如权利要求7所述的方法,其中,所述S2-3-4,所述操作模块执行完成所述执行计划后生成执行结果,具体包括:
S2-3-4-1,所述操作模块接收到执行计划,优先判断所述执行计划涉及的数据的存储位置;
S2-3-4-2,如果所述存储位置均处于所述操作模块中,则执行S2-3-4-3;如果所述存储位置部分处于所述操作模块中,则执行S2-3-4-4;
S2-3-4-3,由所述操作模块完成查询操作后即可向所述主操作模块返回查询结果和查询完成的时间信息Tend
S2-3-4-4,所述操作模块将所述执行计划发送至其所在的数据库中执行,执行结束后,将查询结果返回所述执行模块,所述执行结果将收到所述查询结果的时间记为查询完成的时间信息Tend,将所述查询结果和所述时间信息Tend作为执行结果返回所述主操作模块。
9.如权利要求1所述的方法,其中,所述S3,向用户端返回数据库操作结果,具体包括;
S3-1,主操作模块收到所述执行结果,判断所述执行结果的类型;
S3-2,如果所述执行结果为增加、删除或更新的数据库操作的执行结果,所述主操作模块在收到第一个执行结果时,即向用户端返回所述数据库操作结果,同时提取并更新所述数据信息,以及数据库操作信息,并记录所述完成时间Tend,更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作是否成功和/或操作量;
S3-3,如果所述执行结果为数据查询结果,所述主操作模块在收到所述执行结果时,向用户端返回数据查询结果,同时记录所述时间信息Tend,并更新所述操作模块的闲置状态;其中,所述数据库操作结果为所述数据操作为数据查询结果。
10.一种数据库主备同步操作的加速系统,其特征在于,系统包括一主操作单元,以及部署在多个数据库节点上的操作模块;
所述主操作单元包括主操作模块以及时间模块,所述时间模块通过IO总线与主操作模块连接;所述主操作模块分别与用户端以及部署在数据库节点上的操作模块相连接;
其中,所述时间模块,用于获取时间信息;
其中,所述主操作模块,具体包括:
输入单元,用于接收用户端的请求指令;
第一同步单元,用于从时间模块中获取时间信息,并为从用户端接收的用户端请求打上时间标签;以及完成主操作模块与部署于数据库节点上的操作模块之间的时间信息同步;
第一数据操作执行单元,用于对所述用户端请求进行解析、优化、编译并生成对应的执行计划;并用于统计部署于数据库节点上的操作模块的闲置状态信息;
第一发送单元,用于将所述执行计划发送给部署于数据库节点上的操作模块;
第一接收单元,用于接收所述操作模块返回的执行结果;
第一缓存单元,用于缓存所述执行计划和所述操作模块返回的执行结果;
第一数据存储单元,用于存储各个操作模块的闲置状态信息、返回的执行结果,以及数据信息;
第一节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口;
输出单元,用于向用户端返回所述用户端请求对应的执行结果;
其中,所述部署在数据库节点上的操作模块,具体包括:
第二同步单元,用于获取所述主操作模块发送的时间信息,并在所述操作模块完成数据库操作后,为数据库操作打上所述数据库操作完成的时间标签;
第二数据操作执行单元,用于执行对所述操作模块接收到的执行计划;
第二发送单元,用于将所述执行结果返回所述主操作模块;
第二接收单元,用于接收所述主操作模块发出的执行计划和同步的时间信息;
第二缓存单元,用于缓存所述执行计划和所述执行计划执行的中间结果,以及从数据库中提取的数据信息和数据;
第二数据存储单元,用于存储从数据库中提取的数据信息及数据;
第二节点和操作装置接口,用于为主操作模块与部署于数据库节点上的操作模块之间的连接提供接口。
CN202210751846.3A 2022-06-29 2022-06-29 一种数据库主备同步操作的加速方法和系统 Active CN114942965B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210751846.3A CN114942965B (zh) 2022-06-29 2022-06-29 一种数据库主备同步操作的加速方法和系统
PCT/CN2022/139851 WO2024001079A1 (zh) 2022-06-29 2022-12-19 一种数据库主备同步操作的加速方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210751846.3A CN114942965B (zh) 2022-06-29 2022-06-29 一种数据库主备同步操作的加速方法和系统

Publications (2)

Publication Number Publication Date
CN114942965A true CN114942965A (zh) 2022-08-26
CN114942965B CN114942965B (zh) 2022-12-16

Family

ID=82911068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210751846.3A Active CN114942965B (zh) 2022-06-29 2022-06-29 一种数据库主备同步操作的加速方法和系统

Country Status (2)

Country Link
CN (1) CN114942965B (zh)
WO (1) WO2024001079A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116303791A (zh) * 2023-03-22 2023-06-23 合肥申威睿思信息科技有限公司 一种基于加速系统的数据同步方法和装置
WO2024001079A1 (zh) * 2022-06-29 2024-01-04 北京柏睿数据技术股份有限公司 一种数据库主备同步操作的加速方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277144A (zh) * 2017-06-22 2017-10-20 浙江力石科技股份有限公司 一种分布式高并发云存储数据库系统及其负荷均衡方法
CN108090222A (zh) * 2018-01-05 2018-05-29 中国科学院计算技术研究所 一种数据库集群节点间数据同步系统
CN111858097A (zh) * 2020-07-22 2020-10-30 安徽华典大数据科技有限公司 分布式数据库系统、数据库访问方法
EP3754514A1 (en) * 2018-02-12 2020-12-23 ZTE Corporation Distributed database cluster system, data synchronization method and storage medium
CN112417033A (zh) * 2020-10-19 2021-02-26 中国科学院计算机网络信息中心 一种分布式图数据库多节点数据一致性实现方法和系统
US20210216502A1 (en) * 2020-01-09 2021-07-15 Salesforce.Com, Inc. System and method for synchronizing delete operations between primary and secondary databases
CN114328743A (zh) * 2021-12-30 2022-04-12 瀚高基础软件股份有限公司 集群中实现对等服务的方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10121169B2 (en) * 2015-09-16 2018-11-06 Amobee, Inc. Table level distributed database system for big data storage and query
US20200349172A1 (en) * 2019-04-30 2020-11-05 Microsoft Technology Licensing, Llc Managing code and data in multi-cluster environments
CN113779087A (zh) * 2021-09-09 2021-12-10 苏州浪潮智能科技有限公司 一种基于远程直接内存访问的数据库高可用的方法、系统
CN114942965B (zh) * 2022-06-29 2022-12-16 北京柏睿数据技术股份有限公司 一种数据库主备同步操作的加速方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277144A (zh) * 2017-06-22 2017-10-20 浙江力石科技股份有限公司 一种分布式高并发云存储数据库系统及其负荷均衡方法
CN108090222A (zh) * 2018-01-05 2018-05-29 中国科学院计算技术研究所 一种数据库集群节点间数据同步系统
EP3754514A1 (en) * 2018-02-12 2020-12-23 ZTE Corporation Distributed database cluster system, data synchronization method and storage medium
US20210216502A1 (en) * 2020-01-09 2021-07-15 Salesforce.Com, Inc. System and method for synchronizing delete operations between primary and secondary databases
CN111858097A (zh) * 2020-07-22 2020-10-30 安徽华典大数据科技有限公司 分布式数据库系统、数据库访问方法
CN112417033A (zh) * 2020-10-19 2021-02-26 中国科学院计算机网络信息中心 一种分布式图数据库多节点数据一致性实现方法和系统
CN114328743A (zh) * 2021-12-30 2022-04-12 瀚高基础软件股份有限公司 集群中实现对等服务的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024001079A1 (zh) * 2022-06-29 2024-01-04 北京柏睿数据技术股份有限公司 一种数据库主备同步操作的加速方法和系统
CN116303791A (zh) * 2023-03-22 2023-06-23 合肥申威睿思信息科技有限公司 一种基于加速系统的数据同步方法和装置

Also Published As

Publication number Publication date
WO2024001079A1 (zh) 2024-01-04
CN114942965B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN114942965B (zh) 一种数据库主备同步操作的加速方法和系统
JP2731375B2 (ja) データ識別方法
CN109656911A (zh) 分布式并行处理数据库系统及其数据处理方法
CN109063005B (zh) 一种数据迁移方法及系统、存储介质、电子设备
CN108073696B (zh) 基于分布式内存数据库的gis应用方法
CN109902127B (zh) 历史态数据处理方法、装置、计算机设备及存储介质
US10824641B1 (en) Deterministic query-based replication
CN104881418A (zh) 用于MySQL的快速回收回滚空间的方法和装置
CN108228725B (zh) 基于分布式数据库的gis应用系统
CN113868028A (zh) 一种在数据节点上回放日志的方法、数据节点及系统
US8812468B2 (en) Database management method
CN113297159A (zh) 数据存储方法以及装置
US11151157B2 (en) Database management method
CN111966656A (zh) 存储文件高负载场景模拟方法、系统、终端及存储介质
CN115562676A (zh) 一种图计算引擎的触发方法
CN115495436A (zh) 数据库升级方法及装置
CN114610351A (zh) 一种数据库升级方法
CN115587141A (zh) 一种数据库同步方法和装置
CN111581221B (zh) 一种分布式多站融合系统信息冗余存储与重构的方法
JP2019066939A (ja) 移行管理装置及び移行管理方法
CN112463447A (zh) 一种基于分布式数据库实现物理备份的优化方法
CN112966047B (zh) 一种基于分布式数据库的复制表功能实现方法
CN115712683A (zh) 数据库的同步方法、装置、计算机设备以及存储介质
CN113297326A (zh) 数据的处理方法及装置、计算机可读存储介质、处理器
CN114168545A (zh) 一种数据迁移方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant