CN111831754B - 数据库中数据的复制方法、装置、系统和介质 - Google Patents

数据库中数据的复制方法、装置、系统和介质 Download PDF

Info

Publication number
CN111831754B
CN111831754B CN202010701939.6A CN202010701939A CN111831754B CN 111831754 B CN111831754 B CN 111831754B CN 202010701939 A CN202010701939 A CN 202010701939A CN 111831754 B CN111831754 B CN 111831754B
Authority
CN
China
Prior art keywords
database
character string
target
data
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010701939.6A
Other languages
English (en)
Other versions
CN111831754A (zh
Inventor
杨诗平
毛超丹
李奇伟
唐阳光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010701939.6A priority Critical patent/CN111831754B/zh
Publication of CN111831754A publication Critical patent/CN111831754A/zh
Application granted granted Critical
Publication of CN111831754B publication Critical patent/CN111831754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/547Messaging middleware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据库中数据的复制方法,包括:获取数据库的日志文件;从日志文件中确定多个字符串,多个字符串中的每个字符串指示数据库的一条操作记录;根据预设复制清单,确定多个字符串中的目标字符串;以及将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。本公开还提供了一种数据库中数据的复制装置、一种计算机系统和一种计算机可读存储介质。

Description

数据库中数据的复制方法、装置、系统和介质
技术领域
本公开涉及数据处理领域,更具体地,涉及一种数据库中数据的复制方法、装置、系统和介质。
背景技术
随着国家信息科技产业规划及安全可控战略的实施,计算机信息系统需要朝着“自主可控、安全可信、高效可用”的目标迈进。因此,各信息系统纷纷开展IT架构转型工作,例如将集中式系统架构向分布式系统架构转变。其中,数据库转型是信息系统转型中最基础、最重要及最核心的一个环节,各应用系统的核心数据库逐渐从DB2或ORACLE数据库向开源的分布式数据库(例如MySQL数据库)进行转型。
在实现本公开构思的过程中,发明人发现相关技术中至少存在以下问题:在MySQL数据库的普及使用过程中,各级应用系统对于跨应用的数据快速共享提出了更多的使用需求。相关技术中,通常根据上游应用的业务需求将MySQL数据库中的数据导出到文件,以文件方式供下游应用使用。或者,采用MySQL的异步/半同步模式,通过备份数据库来实现数据共享。该些方法往往需要开发人员编写大量的程序才能实现文件或数据地共享,从而导致数据的使用时效性较差,且该些方法是基于数据库级别的数据同步,因此会存在冗余数据被复制共享的情况。
发明内容
有鉴于此,本公开提供了一种提高数据库中数据复制的时效性和实现细粒度准确复制的数据库中数据的复制方法和装置。
本公开一方面提供了一种数据库中数据的复制方法,包括:获取数据库的日志文件;从日志文件中确定多个字符串,多个字符串中的每个字符串指示数据库的一条操作记录;根据预设复制清单,确定多个字符串中的目标字符串;以及将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。
可选地,从日志文件中确定多个字符串包括:解析日志文件,以从日志文件中提取得到多串二进制码,该多串二进制码中的每串二进制码指示数据库的一条操作记录;以及转换多串二进制码,得到多个字符串。
可选地,获取数据库的日志文件包括:根据预配置的IP地址,确定IP地址属于预配置的IP地址的数据库为源数据库;以及获取源数据库的日志文件。
可选地,数据库中数据的复制方法还包括:根据获取日志文件的时刻、确定每个字符串的时刻、确定得到目标字符串的时刻及发送目标字符串的时刻,确定复制数据的统计信息;以及在统计信息不满足信息阈值的情况下,产生告警信息。其中,统计信息包括以下至少之一:速率、延迟时长。
可选地,数据库包括针对第一应用的数据库;经由中间件发送至目标数据库的目标字符串用于供第二应用获取,其中,目标字符串指示述第一应用和第二应用共享的数据,第二应用为第一应用的下游应用。
可选地,数据库包括MySQL数据库;中间件包括分布式的消息中间件。
本公开的另一方面提供了一种数据库中数据的复制装置,包括:文件获取模块,用于获取数据库的日志文件;字符串确定模块,用于从日志文件中确定多个字符串,多个字符串中的每个字符串指示数据库的一条操作记录;字符串筛选模块,用于根据预设复制清单,确定多个字符串中的目标字符串;以及发送模块,用于将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。
可选地,上述字符串确定模块包括:解析子模块,用于解析日志文件,以从日志文件中提取得到多串二进制码,该多串二进制码中的每串二进制码指示数据库的一条操作记录;以及转换子模块,用于转换多串二进制码,得到多个字符串。
可选地,上述数据库中数据的复制装置还包括:信息统计模块,用于根据文件获取模块获取日志文件的时刻、字符串确定模块确定每个字符串的时刻、字符串筛选模块确定目标字符串的时刻及发送模块发送所述目标字符串的时刻,确定复制数据的统计信息;以及告警模块,用于在统计信息不满足信息阈值的情况下,产生告警信息,其中,统计信息包括以下至少之一:速率、延迟时长。
本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;以及存储装置,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述的数据库中数据的复制方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被处理器执行时用于执行如上所述的数据库中数据的复制方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的数据库中数据的复制方法。
根据本公开的实施例,至少可以部分地避免相关技术中数据共享时效性差及数据共享准确性低的技术问题。本公开实施例通过从日志文件中确定出目标字符串,可以实现表粒度的数据复制,从而可以在一定程度上提高数据共享的速率及准确性。再者,本公开实施例在获取到日志文件后,可以经由中间件自动将数据复制至目标数据库来实现应用间数据的共享,不仅不会对源数据库的业务产生影响,还可以降低数据共享的门槛,提高数据共享的时效性。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的数据库中数据的复制方法、装置、系统和介质的应用场景;
图2示意性示出了根据本公开实施例的数据库中数据的复制方法的流程图;
图3示意性示出了根据本公开另一实施例的数据库中数据的复制方法的流程图;
图4示意性示出了根据本公开实施例的始于实现数据库中数据的复制方法的示例性场景的框架结构图;
图5示意性示出了根据本公开实施例的数据库中数据的复制装置的结构框图;以及
图6示意性示出了根据本公开实施例的适于执行数据库中数据的复制方法的计算机系统的结构框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种数据库中数据的复制方法,该方法首先获取数据库的日志文件。然后从日志文件中确定多个字符串,该多个字符串中的每个字符串指示数据库的一条操作记录。随后根据预设复制清单,确定多个字符串中的目标字符串。最后将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。
图1示意性示出了根据本公开实施例的数据库中数据的复制方法、装置、系统和介质的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,该实施例的应用场景100例如可以包括第一数据库110、终端设备120和第二数据库130。终端设备120上可以运行有第一应用121、中间件122和第二应用123。终端设备120中的第一应用121可以访问第一数据库110,对第一数据库110中的数据进行读写操作等,终端设备120中的第二应用123可以访问第二数据库130,对第二数据库130中的数据进行读写操作等。
根据本公开的实施例,第一数据库110与第二数据库130例如可以为分布式的关系型数据库。在一实施例中,第一数据库110与第二数据库130可以为MySQL数据库,第一应用121和第二应用123可以通过SQL语言来分别访问第一数据库110和第二数据库130。在该第一数据库110和第二数据库130中,写入的数据以表形式进行维护,而并非将所有数据放在一个大仓库中,因此可以有效增加数据的读取速度及读取灵活性。
根据本公开的实施例,第一应用121和第二应用123可以为企业内大型软件系统包括的几十上百个应用系统中的两个应用系统,该第一应用121与第二应用123可以具有关联关系,例如,第一应用121为第二应用123的上游应用。且第一应用121对应的第一数据库110中存储有第二应用123所需的数据。因此,为了实现数据共享,本公开实施例的终端设备120例如可以通过其安装的中间件122将第一数据库110中存储的第二应用123所需的数据复制至第二数据库130,以便于第二应用123通过访问第二数据库130获取到所需的数据。相应地,终端设备120例如还可以通过中间件122访问第二数据库130,以将复制的数据写入第二数据库130。中间件122例如可以通过信息发布的方式将数据写入第二数据库130,第二数据库130订阅有该中间件122接收的信息。
需要说明的是,本公开实施例的数据库中数据的复制方法一般可以由终端设备执行。相应地,本公开实施例的数据库中数据的复制装置一般可以设置于该终端设备中。
应该理解,图1中的第一数据库、第二数据库和终端设备仅仅是示意性的。根据实现需要,可以具有任意类型的第一数据库、第二数据库和终端设备。
以下将结合图1描述的应用场景,通过图2~图3对本公开实施例的数据库中数据的复制方法进行详细描述。
图2示意性示出了根据本公开实施例的数据库中数据的复制方法的流程图。
如图2所示,该实施例的数据库中数据的复制方法可以包括操作S210~操作S240。
在操作S210,获取数据库的日志文件。
根据本公开的实施例,数据库例如可以为图1中的第一数据库110。在第一数据库110为MySQL数据库时,获取的日志文件例如可以为binlog文件,即为MySQL数据库的二进制日志,记录有用户对数据库操作的SQL语句信息,具体记录有数据库表结构变更及表数据修改的信息。
根据本公开的实施例,该操作S210例如可以通过第一应用121来从第一数据库110中读取日志文件。
根据本公开的实施例,为了确保复制的数据的准确性,本实施例例如可以预配置有数据库的IP地址。在获取日志文件时,根据IP地址来确定源数据库,获取的日志文件为源数据库生成的日志文件。其中,源数据库为IP地址属于预配置的IP地址的数据库。通过此方式,可以限定存储有需要共享的数据的数据库及生成该共享的数据的第一应用。存储有需要共享的数据的数据库即为针对第一应用的数据库,且该数据库中存储的数据为第一应用运行过程中生成的数据。
在操作S220,从日志文件中确定多个字符串,多个字符串中的每个字符串指示数据库的一条操作记录。
根据本公开的实施例,例如可以先根据MySQL数据库中binlog日志的生成规则,对日志文件进行拆分,通过拆分可以得到多串二进制码,然后再将多个二进制码分别转换为多个字符串。多串二进制码中的每串二进制码用于指示数据库的一条操作记录。
在一实施例中,为了提高拆分准确性,例如可以通过解析日志文件来进行日志文件的拆分,从而从日志文件中提取得到多串二进制码。通过该解析操作,例如可以将该串二进制码转换为一个字符串。
示例性地,若日志文件中用于指示插入数据的二进制码是从日志文件中第三位的二进制码至第五位的二进制码,则将该第三位~第五位的二进制码作为一串二进制码,该串二进制码指示数据库的一条增加数据的操作记录,该串二进制码可以转换得到一个字符串。
示例性地,本实施例还可以维护有针对操作记录的二进制码库,二进制码库中包括多串分别用于指示单条操作记录的预定二进制码串。上述日志文件的切分例如可以是将日志文件中的二进制码,自第一位开始,确定多个预定二进制码串中是否包括与该第一位二进制码相同的预定二进制码,若有,则将第一位二进制码作为从日志文件中提取得到的一串二进制码。若没有,则确定多个预定二进制码中是否包括与该第一位二进制码和第二二进制码组成的二进制码串相同的预定二进制码;若有,则将第一位二进制码和第二二进制码组成的二进制码串作为从日志文件中提取得到的一串二进制码。若没有,则继续确定是否包括与第一位~第三位二进制码组成的二进制码串相同的预定二进制码。以此类推,直至确定包括与第一位~第i位二进制码组成的二进制码串相同的预定二进制码,将该第一位~第i位二进制码组成的二进制码串作为从日志文件中提取得到的第一串二进制码。随后,从第i+1位开始,依据上述方法确定从日志文件中提取得到的第二串二进制码。以此类推,得到从日志文件中提取得到的多串二进制码。可以理解的是,上述二进制码库中的预定二进制码例如可以根据实际需求进行设定。在一实施例中,该预定二进制码例如可以参考MySQL官网中规定的有指定含义的二进制码来进行设定。
示例性地,得到的多个字符串例如可以为Json(JavaScript Object Notation)字符串。在得到多串二进制码后,即可采用通用的二进制码与Json字符串之间的转换方法,将多串二进制码中的每串二进制码转换为一个字符串,总共得到与多串二进制码的数量相等的多串字符串。
在操作S230,根据预设复制清单,确定多个字符串中的目标字符串。
根据本公开的实施例,预设的复制清单例如可以指示前述第一应用的下游应用需要使用的目标数据库中存储的数据。具体地,该复制清单例如可以设定有目标数据库中存储的数据所在表的表名清单。
示例性地,在多个字符串为Json字符串时,由于Json字符串为Key-Value(键-值)格式,可以设定多个字符串中的每个字符串的Key的取值为每个字符串指示的操作记录所针对的数据所属表的表名,Value的取值为每个字符串指示的操作记录所针对的数据。本实施例可以将多个字符串中的每个字符串的Key与预设复制清单中的表名清单进行比对,确定表名清单中是否包括多个字符串中的每个字符串的Key。若预设复制清单包括多个字符串中某个字符串的Key,则将该某个字符串确定为目标字符串。
根据本公开的实施例,通过根据预设复制清单来确定目标字符串,可以将日志文件中记载的无需复制的操作记录所针对的数据过滤掉,从而提高数据复制的效率,降低不必要资源的消耗。
在操作S240,将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。
在确定了目标字符串后,为了提高数据复制的实时性,可以先将目标字符串发送至中间件,再由中间件实时地推送至目标数据库。该目标数据库为针对第二应用的数据库,即目标数据库中存储的数据用于供第二应用获取。第二应用为第一应用的下游应用,且目标字符串指示第一应用和第二应用共享的数据。
根据本公开的实施例,中间件例如可以包括以下任意一种:卡夫卡(KAFKA)中间件、面向消息的中间件(RabbitMQ)、RocketMQ中间件等分布式的消息中间件。中间件可以响应于接收到目标字符串,将目标字符串归类至同一个类别,并将目标字符串推送至订阅了该类别的信息的目标数据库。其中,目标数据库例如可以为多个,因此,第一应用的不同的下游应用可以共享消费同一个中间件。
示例性地,在将目标字符串推送至目标数据库后,目标数据库所对应的应用例如可以根据各自的业务特点来将目标字符串指示的共享的数据加工为结构化查询语句(Structured Query Language,SQL),并通过在目标数据库中执行该结构化查询语句获取到从第一应用复制得到的共享的数据。
综上可知,本公开实施例的数据库中数据的复制方法,通过从日志文件中确定出目标字符串,可以实现表粒度的数据复制,从而可以在一定程度上提高数据共享的速率及准确性。再者,本公开实施例在获取到日志文件后,可以经由中间件自动将数据复制至目标数据库来实现应用间数据的共享,不仅不会对源数据库的业务产生影响,还可以降低数据共享的门槛,提高数据共享的时效性。
根据本公开的实施例,为了保证数据复制的稳定性及准确性,本公开实施例的数据库中数据的复制方法,还可以实时监控数据复制过程,从而统计得到复制过程中各处理阶段的速率和/或延迟时长等,以便于在复制过程异常时及时告警,使得工作人员及时排障。
图3示意性示出了根据本公开另一实施例的数据库中数据的复制方法的流程图。
如图3所示,该实施例的数据库中数据的复制方法除了操作S210~操作S240外,还可以包括操作S350~操作S360。
在操作S350,根据获取日志文件的时刻、确定每个字符串的时刻、确定目标字符串的时刻及发送目标字符串的时刻,确定复制数据的统计信息。其中,统计信息例如可以包括复制数据的过程中,各处理阶段的速率,相邻处理阶段之间的延迟时长等。
根据本公开的实施例,本实施例可以监控前述操作S210~操作S240的执行。例如,操作S210每获取一个日志文件,通过监控就可以得到一个日志文件的获取时刻。通过统计操作S210获取的多个日志文件的获取时刻,可以确定得到复制数据的过程中获取日志文件的速率。例如,操作S220每确定得到一个字符串,通过监控就可以得到一个字符串的确定时刻。通过统计操作S220确定的多个字符串的确定时刻,可以确定得到复制数据的过程中确定字符串的速率。通过根据一个日志文件的获取时刻及该日志文件中字符串的确定时刻,可以确定得到操作S210与操作S220之间的延迟时长。采用类似方式,通过监控可以确定得到复制数据的过程中确定得到目标字符串的确定时刻,以及确定得到复制数据的过程中发送目标字符串的发送时刻。还可以得到操作S220与操作S230之间的延迟时长、操作S230与操作S240之间的延迟时长等。
在操作S360,在统计信息不满足信息阈值的情况下,产生告警信息。
根据本公开的实施例,对于不同的统计信息,例如可以设定有不同的信息阈值。例如,可以根据数据复制时效性的要求来设定各处理阶段的速率的信息阈值。若对数据复制的时效性要求高,则可以设定较小的信息阈值,例如获取日志文件的速率的信息阈值可以为10个/s。相邻步骤之间的延迟时长的信息阈值可以为5min等。可以理解的是,上述统计信息阈值仅作为示例以利于理解本公开,本公开对此不做限定。在一实施例中,统计信息例如还可以包括日志文件的时间戳,该时间戳例如可以为源数据库中数据修改的时间戳等。
根据本公开的实施例,操作S360可以是先将统计信息与信息阈值进行比对。在统计信息为速率,且速率低于信息阈值的情况下,确定统计信息不满足信息阈值。在统计信息为延迟时长,且延迟时长大于信息阈值的情况下,确定统计信息不满足信息阈值。
根据本公开的实施例,在统计信息不满足信息阈值的情况下,终端设备120例如可以产生告警信息。产生的告警信息例如可以为展示的提示框信息、声音提示信息或指示灯闪烁的电流信息等。
根据本公开的实施例,在终端设备120为不具有显示屏的设备时,产生的告警信息例如还可以由终端设备120发送至工作人员的工作设备上,以使得工作设备前的工作人员能够及时地注意到告警信息,并进行故障处理。
综上可知,本公开实施例通过统计得到统计信息,可以实现对数据库中数据复制过程的监控。从而便于在复制过程存在明显的处理延时及处理效率明显下降时,及时通知工作人员进行排障,提高数据复制的稳定性。
图4示意性示出了根据本公开实施例的始于实现数据库中数据的复制方法的示例性场景的框架结构图。
如图4所示,该实施例的示例性场景包括待复制的MySQL数据库410、解析装置421、缓存装置422、分发装置423、统计信息存储数据库424、监控装置425、中间件KAFKA430和集中监控装置440。其中,解析装置、缓存装置、分发装置、统计信息存储数据库、监控装置构成用于执行数据库中数据的复制方法的实时复制装置420。解析装置和缓存装置的个数可以根据需要复制的MySQL数据库的个数来定。如图4所示,MySQL数据库、解析装置、缓存装置分别为n个,n为大于2的整数。n个MySQL数据库分别表示为MySQL数据库1~n;n个解析装置分别表示为解析装置1~n;n个缓存装置分别表示为缓存装置1~n。分发装置423的个数可以根据缓存装置中缓存的数据量来定,若缓存装置中缓存的数据量大,则系统可以新开启一个线程(即增加一个分发装置)来进行数据分发。如图4所示,对应缓存装置1的分发装置包括a个,a个分发装置表示为分发装置1~a;对应缓存装置2的分发装置包括b个,b个分发装置表示为分发装置1~b;对应缓存装置n的c分发装置包括c个,c个分发装置分别表示为分发装置1~c。a、b、c均为正整数,在一实施例中,如图4所示,a、b、c均为大于2的整数。
解析装置1~n用于先依据预配置的IP地址,远程从源端MySQL数据库中读取binlog日志。然后对读取的binlog二进制日志进行解析,并将解析得到的多串二进制码转换为明文(Json字符串)。随后根据预配置的需要复制的表清单对转换得到的明文进行过滤,得到需要复制的目标字符串。最后将目标字符串缓存至与解析装置1~n一一对应的缓存装置1~n中。
缓存装置1~n分别用于负责临时保存对应的解析装置1~n解析得到的目标字符串。
分发装置负责从对应的缓存装置中获取目标字符串,并将获取的字符串发送至中间件KAFKA 430,以便于中间件将目标字符串推送至订阅的目标数据库中。
监控装置425用于定期监控解析装置、缓存装置和分发装置的运行数据,并记录到统计信息存储数据库424中。运行数据具体可以包括解析装置获取到binlog日志的时刻、解析装置将二进制码转换为Json字符串的时刻、解析装置对Json字符串过滤后得到目标字符串的时刻、分发装置分发各目标字符串的时刻等。监控装置425还用于对异常的运行数据进行监控,并实时产生告警信息,将告警信息发送至集中监控装置440。
图5示意性示出了根据本公开实施例的数据库中数据的复制装置的结构框图。
如图5所示,该实施例的数据库中数据的复制装置500例如可以包括文件获取模块510、字符串确定模块520、字符串筛选模块530和发送模块540。
文件获取模块510用于获取数据库的日志文件。在一实施例中,文件获取模块510用于执行图2描述的操作S210,在此不再赘述。
字符串确定模块520用于从日志文件中确定多个字符串,该多个字符串中的每个字符串指示数据库的一条操作记录。在一实施例中,字符串确定模块520用于执行图2描述的操作S220,在此不再赘述。
字符串筛选模块530用于根据预设复制清单,确定多个字符串中的目标字符串。在一实施例中,字符串筛选模块530用于执行图2描述的操作S230,在此不再赘述。
发送模块540用于将目标字符串经由中间件发送至目标数据库,完成数据库中数据的复制。在一实施例中,发送模块540用于执行图2描述的操作S240,在此不再赘述。
根据本公开的实施例,上述字符串确定模块520例如可以包括解析子模块和转换子模块。解析子模块用于解析日志文件,以从日志文件中提取得到多串二进制码,该多串二进制码中的每串二进制码指示数据库的一条操作记录。转换子模块用于转换多串二进制码,得到多个字符串。
根据本公开的实施例,上述文件获取模块510例如可以具体通过以下操作来获取日志文件:根据预配置的IP地址,确定IP地址属于预配置的IP地址的数据库为源数据库;以及获取源数据库的日志文件。
根据本公开的实施例,上述数据库中数据的复制装置500还可以包括信息统计模块和告警模块。信息统计模块用于根据文件获取模块510获取日志文件的时刻、字符串确定模块520确定得到每个字符串的时刻、字符串筛选模块530确定目标字符串的时刻及发送模块540发送目标字符串的时刻,确定复制数据的统计信息。告警模块用于在统计信息不满足信息阈值的情况下,产生告警信息。其中,统计信息包括以下至少之一:速率、延迟时长。在一实施例中,信息统计模块和告警模块例如可以分别用于执行图3描述的操作S350和操作S360,在此不再赘述。
根据本公开的实施例,数据库包括针对第一应用的数据库;经由中间件发送至目标数据库的目标字符串用于供第二应用获取。其中,目标字符串指示第一应用和第二应用共享的数据,第二应用为第一应用的下游应用。
根据本公开的实施例,数据库包括MySQL数据库;中间件包括分布式的消息中间件。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的适于执行数据库中数据的复制方法的计算机系统的结构框图。
如图6所示,根据本公开实施例的计算机系统600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有计算机系统600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,计算机系统600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。计算机系统600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的计算机系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (10)

1.一种数据库中数据的复制方法,包括:
获取数据库的日志文件;
从所述日志文件中确定多个字符串,多个字符串中的每个字符串指示所述数据库的一条操作记录;
根据预设复制清单,确定所述多个字符串中的目标字符串;以及
将所述目标字符串经由中间件发送至目标数据库,完成所述数据库中数据的复制,其中,
所述中间件响应于接收到所述目标字符串,将所述目标字符串归类至同一个类别,并将所述目标字符串推送至订阅了该类别的信息的所述目标数据库;
所述数据库包括针对第一应用的数据库;
经由所述中间件发送至所述目标数据库的目标字符串用于供第二应用获取,
其中,所述目标字符串指示所述第一应用和所述第二应用共享的数据,所述第二应用为所述第一应用的下游应用。
2.根据权利要求1所述的方法,其中,所述从所述日志文件中确定多个字符串包括:
解析所述日志文件,以从所述日志文件中提取得到多串二进制码,所述多串二进制码中的每串二进制码指示所述数据库的一条操作记录;以及
转换所述多串二进制码,得到所述多个字符串。
3.根据权利要求1所述的方法,其中,所述获取数据库的日志文件包括:
根据预配置的IP地址,确定IP地址属于所述预配置的IP地址的数据库为源数据库;以及
获取所述源数据库的日志文件。
4.根据权利要求1所述的方法,还包括:
根据获取所述日志文件的时刻、确定所述每个字符串的时刻、确定得到所述目标字符串的时刻及发送所述目标字符串的时刻,确定复制所述数据的统计信息;以及
在所述统计信息不满足信息阈值的情况下,产生告警信息,
其中,所述统计信息包括以下至少之一:速率、延迟时长。
5.根据权利要求1所述的方法,其中:
所述数据库包括MySQL数据库;
所述中间件包括分布式的消息中间件。
6.一种数据库中数据的复制装置,包括:
文件获取模块,用于获取数据库的日志文件;
字符串确定模块,用于从所述日志文件中确定多个字符串,多个字符串中的每个字符串指示所述数据库的一条操作记录;
字符串筛选模块,用于根据预设复制清单,确定所述多个字符串中的目标字符串;以及
发送模块,用于将所述目标字符串经由中间件发送至目标数据库,完成所述数据库中数据的复制,其中,所述中间件响应于接收到所述目标字符串,将所述目标字符串归类至同一个类别,并将所述目标字符串推送至订阅了该类别的信息的所述目标数据库;所述数据库包括针对第一应用的数据库;经由所述中间件发送至所述目标数据库的目标字符串用于供第二应用获取,其中,所述目标字符串指示所述第一应用和所述第二应用共享的数据,所述第二应用为所述第一应用的下游应用。
7.根据权利要求6所述的装置,其中,所述字符串确定模块包括:
解析子模块,用于解析所述日志文件,以从所述日志文件中提取得到多串二进制码,所述多串二进制码中的每串二进制码指示所述数据库的一条操作记录;以及
转换子模块,用于转换所述多串二进制码,得到所述多个字符串。
8.根据权利要求6所述的装置,还包括:
信息统计模块,用于根据所述文件获取模块获取所述日志文件的时刻、所述字符串确定模块确定所述每个字符串的时刻、所述字符串筛选模块确定所述目标字符串的时刻及所述发送模块发送所述目标字符串的时刻,确定复制所述数据的统计信息;以及
告警模块,用于在所述统计信息不满足信息阈值的情况下,产生告警信息,
其中,所述统计信息包括以下至少之一:速率、延迟时长。
9.一种计算机系统,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~5中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~5中任一项所述的方法。
CN202010701939.6A 2020-07-20 2020-07-20 数据库中数据的复制方法、装置、系统和介质 Active CN111831754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010701939.6A CN111831754B (zh) 2020-07-20 2020-07-20 数据库中数据的复制方法、装置、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010701939.6A CN111831754B (zh) 2020-07-20 2020-07-20 数据库中数据的复制方法、装置、系统和介质

Publications (2)

Publication Number Publication Date
CN111831754A CN111831754A (zh) 2020-10-27
CN111831754B true CN111831754B (zh) 2024-02-27

Family

ID=72924439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010701939.6A Active CN111831754B (zh) 2020-07-20 2020-07-20 数据库中数据的复制方法、装置、系统和介质

Country Status (1)

Country Link
CN (1) CN111831754B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027349A (ja) * 2015-07-22 2017-02-02 株式会社エクサ レプリケーションプログラム
CN108399256A (zh) * 2018-03-06 2018-08-14 北京慧萌信安软件技术有限公司 异构数据库内容同步方法、装置及中间件
CN110990365A (zh) * 2019-12-03 2020-04-10 北京奇艺世纪科技有限公司 一种数据同步方法、装置、服务器及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027349A (ja) * 2015-07-22 2017-02-02 株式会社エクサ レプリケーションプログラム
CN108399256A (zh) * 2018-03-06 2018-08-14 北京慧萌信安软件技术有限公司 异构数据库内容同步方法、装置及中间件
CN110990365A (zh) * 2019-12-03 2020-04-10 北京奇艺世纪科技有限公司 一种数据同步方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN111831754A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN107861859B (zh) 一种基于微服务架构的日志管理方法及系统
CN109213792B (zh) 数据处理的方法、服务端、客户端、装置及可读存储介质
CN108694195B (zh) 一种分布式数据仓库的管理方法及系统
US9037905B2 (en) Data processing failure recovery method, system and program
CN110287189B (zh) 一种基于spark streaming处理流动车辆数据的方法及系统
CN113360554B (zh) 一种数据抽取、转换和加载etl的方法和设备
US10922133B2 (en) Method and apparatus for task scheduling
US9811382B2 (en) Eliminating execution of jobs-based operational costs of related reports
US20120331333A1 (en) Stream Data Processing Failure Recovery Method and Device
US10031901B2 (en) Narrative generation using pattern recognition
CN111400288A (zh) 数据质量检查方法及系统
US20200112475A1 (en) Real-time adaptive infrastructure scenario identification using syntactic grouping at varied similarity
CN113094434A (zh) 数据库同步方法、系统、装置、电子设备及介质
JP2012113706A (ja) データベース・クエリ最適化のためのコンピュータで実装される方法、コンピュータ・プログラム、およびデータ処理システム
US11621987B2 (en) Method for processing streaming media data
CN109491834A (zh) 一种应用于数据库的数据恢复方法及装置
US20200110815A1 (en) Multi contextual clustering
CN111831754B (zh) 数据库中数据的复制方法、装置、系统和介质
CN112506490A (zh) 一种接口生成方法、装置、电子设备及存储介质
CN110502486B (zh) 日志处理方法、装置、电子设备和计算机可读存储介质
WO2017190469A1 (zh) 大数据处理中的数据优化方法和装置
CN113220530B (zh) 数据质量监控方法及平台
US20190164092A1 (en) Determining risk assessment based on assigned protocol values
EP3550451A1 (en) Data storage and maintenance method and device, and computer storage medium
Bitincka et al. Experiences with workload management in splunk

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant