CN112711599B - 数据增量更新方法 - Google Patents

数据增量更新方法 Download PDF

Info

Publication number
CN112711599B
CN112711599B CN202011591296.0A CN202011591296A CN112711599B CN 112711599 B CN112711599 B CN 112711599B CN 202011591296 A CN202011591296 A CN 202011591296A CN 112711599 B CN112711599 B CN 112711599B
Authority
CN
China
Prior art keywords
data
partition
latest
updating
written
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011591296.0A
Other languages
English (en)
Other versions
CN112711599A (zh
Inventor
王泰舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shiheng Shanghai Technology Service Co ltd
Original Assignee
Shiheng Shanghai Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shiheng Shanghai Technology Service Co ltd filed Critical Shiheng Shanghai Technology Service Co ltd
Priority to CN202011591296.0A priority Critical patent/CN112711599B/zh
Publication of CN112711599A publication Critical patent/CN112711599A/zh
Application granted granted Critical
Publication of CN112711599B publication Critical patent/CN112711599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • G06F9/4451User profiles; Roaming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了数据增量更新方法,包括:数据配置步骤,对来自消息队列的数据进行配置,包括以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume,经第一Flume写入为第一ODS数据,经第二Flume写入为第二ODS数据;数据初始化步骤,对DW数据进行初始化,从第一ODS数据中选取满足筛选条件的分区作为DW最新分区;数据合并步骤,将截止到当前的第二ODS数据作为最新写入数据,将DW最新分区和最新写入数据进行合并并进行标记;数据替换步骤,将合并数据写回DW最新分区覆盖原数据;更新判定步骤,在包含合并数据的DW中执行更新判定,标记参与更新判定操作;数据更新步骤,如果判断存在更新,则将带有标记的数据同步至数据库进行增量更新。

Description

数据增量更新方法
技术领域
本发明涉及软件技术领域,更具体地说,涉及以数据库和数据仓库技术。
背景技术
数据正在成为一种重要的资源,越来越多的应用都会调用或者存储大量的数据用于应用服务,或者对保存的数据进行分析运算来提升自身的功能。海量数据的存储和管理正在成为一个重要的问题。
目前的数据平台大多采用数据库(DB)+操作数据存储器(ODS)+数据仓库(DW)的架构。图1揭示了数据平台的架构的示意图,包括数据库DB 101、操作数据存储器ODS 102和数据仓库DW 103。数据库(Database)层多为关系型数据库,用于保存底层数据以及数据之间的关联关系。操作数据存储器(Operational Data Store)介于数据库DB和数据仓库(DataWarehouse)之间,ODS可以按照主题提供集成的、可变的当前数据的集合,ODS的数据源可以来自数据库DB,也可以接入其他的数据接收系统接收外来数据。ODS可以根据数据仓库DW的要求为数据仓库提供指定数据,可以认为是数据仓库的数据过渡区。数据仓库DW更多地是面向运用,数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合。
在这个架构体系中,数据库DB负责数据的维护和更新,所有的数据更改或者更新都需要在数据库中进行维护。数据仓库DW内的数据会随时间变化,但是不进行更改或者更新操作。由于数据库DB在底层,其性能受到硬件设备的限制,而数据仓库DW的计算能力可以通过各种手段扩充,因此数据仓库具有强大的计算能力。
于是,在存在大量高频变化数据的应用场景,比如外卖平台、电子商务平台等的应用中。由于应用需求的特点存在海量高强度变化的数据,数据仓库DW为了满足应用需求也会被配置强大的计算能力。但是在这种应用中,数据库DB对于数据的同步更新就存在很大的压力。目前的做法中,数据更新都是在数据库DB中完成,受限于关系型数据库的性能瓶颈,如果要对数据进行更新并且同步进行大量计算时,会超出数据库的能力负荷。所以只能进行相对简单的数据落库操作。这在一定程度上影响了数据平台整体的性能,在平台性能、实现成本和运行稳定性方面存在矛盾。
发明内容
本发明提出一种数据增量更新方法,在利用数据仓库的计算能力进行更新判定,挑选出发生变化的数据给数据库进行增量更新。
根据本发明的一实施例,提出一种数据增量更新方法,用于在由数据库、操作数据存储器(ODS)和数据仓库(DW)构成的存储架构中对数据进行增量更新,该数据增量更新方法包括:
数据配置步骤,对来自消息队列的数据进行配置,包括以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume,经第一Flume写入DW的数据为第一ODS数据,经第二Flume写入DW的数据为第二ODS数据;
数据初始化步骤,对DW数据进行初始化,从经第一Flume写入DW的第一ODS数据中选取满足筛选条件的分区作为DW最新分区;
数据合并步骤,将截止到当前的经第二Flume写入DW的第二ODS数据作为最新写入数据,将DW最新分区和最新写入数据进行合并,合并过程中对DW最新分区和最新写入数据进行标记;
数据替换步骤,将合并数据写回DW最新分区覆盖原数据;
更新判定步骤,在包含所述合并数据的DW中执行更新判定操作,判断是否存在更新,所述标记参与所述更新判定操作;
数据更新步骤,如果在更新判定步骤中判断存在更新,则将带有所述标记的数据同步至数据库进行增量更新。
在一个实施例中,数据配置步骤中,第一Flume或者第二Flume的分区粒度与计算粒度相关。
在一个实施例中,数据合并步骤中,筛选条件是可能的更新所对应的最远日期与当前日期的时间间隔。
在一个实施例中,数据合并步骤中,将DW最新分区和最新写入数据进行合并包括进行去重计算,剔除不满足筛选条件的数据。
在一个实施例中,合并过程中设置标志tag对DW最新分区和最新写入数据进行标记,其中最新写入数据tag为1,DW最新分区tag为0。
在一个实施例中,更新判定步骤中执行的更新判定操作包括聚合操作,所述标志tag参与聚合操作。
在一个实施例中,数据更新步骤中,经聚合后tag>0的数据被同步至数据库进行增量更新。
在一个实施例中,该数据增量更新方法还包括数据恢复步骤,如果该数据增量更新方法出现错误或中途终止,则进行数据恢复。
在一个实施例中,数据恢复步骤包括:
以满足筛选条件的全量第一ODS数据对DW数据进行恢复;
将DW数据全量同步至数据库对数据库数据进行恢复。
本发明的数据增量更新方法利用数据仓库的运算能力来判定是否存在数据更新,并且标记出发生改变的数据,这些带标记的数据被提供给数据库,数据库仅对带标记的数据进行更新,大大节省数据更新所占用的资源。
附图说明
图1揭示了数据平台的架构的示意图。
图2揭示了根据本发明的一实施例的数据增量更新方法的流程图。
图3揭示了根据本发明的一实施例的数据增量更新方法的执行过程示意图。
具体实施方式
图2揭示了根据本发明的一实施例的数据增量更新方法的流程图。参考图2所示,该数据增量更新方法用于在由数据库、操作数据存储器和数据仓库构成的存储架构中对数据进行增量更新,该数据增量更新方法包括:
S1、数据配置步骤。在数据配置步骤中对来自消息队列,比如Kafka队列的数据进行配置。在一个实施例中,数据按照两种方式进行配置,分别是以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume。经第一Flume写入DW的数据为第一ODS数据,经第二Flume写入DW的数据为第二ODS数据。第一Flume或者第二Flume的分区粒度与计算粒度相关。计算粒度可以是“日”、“小时”等。
S2、数据初始化步骤。数据初始化步骤中对DW数据进行初始化,从经第一Flume写入DW的第一ODS数据中选取满足筛选条件的分区作为DW最新分区。筛选条件是可能的更新所对应的最远日期与当前日期的时间间隔。比如,可以将筛选条件设置为最近90天,则会从经第一Flume写入DW的第一ODS数据中选取数据日期为最近90天的数据。
S3、数据合并步骤。数据合并步骤中将截止到当前的经第二Flume写入DW的第二ODS数据作为最新写入数据,将DW最新分区和最新写入数据进行合并,合并过程中对DW最新分区和最新写入数据进行标记。在一个实施例中,将DW最新分区和最新写入数据进行合并包括进行去重计算,剔除不满足筛选条件的数据。因为最新写入数据是直接选取截止当前的第二ODS数据,其中可能包括不满足筛选条件的数据,因此去重计算主要是将筛选条件应用到经第二Flume写入DW的第二ODS数据中。在合并操作完成后,将已经参与运算的第二ODS数据删除。在一个实施例中,在合并过程中设置标志tag对DW最新分区和最新写入数据进行标记,其中最新写入数据tag为1,DW最新分区tag为0。
S4、数据替换步骤。将前一步骤中计算得到的合并数据写回DW最新分区覆盖原数据。
S5、更新判定步骤。更新判定步骤中在包含合并数据的DW中执行更新判定操作,判断是否存在更新,标记参与更新判定操作。在一个实施例中,更新判定步骤中执行的更新判定操作包括聚合操作,标志tag参与聚合操作以标记出发生改变的增量数据。
S6、数据更新步骤。如果在更新判定步骤中判断存在更新,则将带有所述标记的数据同步至数据库进行增量更新。在一个实施例中,数据更新步骤中,经聚合操作后tag>0的数据被同步至数据库进行增量更新。
在数据同步的过程中,可能会由于各种原因出现中断或者发生错误,这是就需要恢复数据。在一个实施例中,该数据增量更新方法还包括数据恢复步骤,如果该数据增量更新方法出现错误或中途终止,则进行数据恢复。数据恢复步骤包括两个部分,对DW数据的恢复和对数据库DB数据的恢复。对DW数据的恢复是以满足筛选条件的全量第一ODS数据对DW数据进行恢复,对DB数据的恢复是将DW数据全量同步至数据库对数据库数据进行恢复。
下面结合一个具体的示例来说明本发明的数据增量更新方法执行过程。下面的描述结合图3进行,图3揭示了根据本发明的一实施例的数据增量更新方法的执行过程示意图。应用本发明的数据增量更新方法的数据平台的架构和现有技术相同,包括数据库DB101、操作数据存储器ODS 102和数据仓库DW 103。其数据流向是:操作数据存储器ODS 102接收数据(这些数据可能来自各个终端或者其他平台),ODS处理后将数据提供给数据仓库DW。数据仓库DW进行各种操作以服务于具体应用。数据库DB用于保存数据的变化和更新。
在数据配置步骤S1中对来自消息队列,比如Kafka队列的数据进行配置。数据按照两种方式进行配置,分别是以数据本身日期为分区进行配置的第一Flume(图中标记为Flume 1)和以数据采集日期为分区进行配置的第二Flume(图中标记为Flume 2)。Flume 1的Sink配置方式以数据本身的日期为分区(比如对于外卖订单数据以订单下单日期为分区)。Flume 2的Sink配置方式是以数据采集的日期,即数据写入的日期为分区(比如对于外卖订单数据以订单拉取日期为分区)。此处的“日期”的概念是操作日志中的日期概念,是一个时间单位。日期可以是年、月、日、也可以是小时、分秒或者更小的时间单位。数据的分区粒度与计算粒度相对应。如果计算是以“日”为单位,数据也以“日”为单位进行分区。如果计算是以“小时”为单位,数据也以“小时”为单位进行分区。最常用的计算粒度是“日”。来自Kafka队列的数据经Flume 1写入DW的数据为第一ODS数据,第一ODS数据被存入HDFS的第一目录中,在图中标记为HDFS Dir 1。来自Kafka队列的数据经Flume 2写入DW的数据为第二ODS数据,第二ODS数据被存入HDFS的第二目录中,在图中标记为HDFS Dir 2。
在数据初始化步骤S2中对DW数据进行初始化。在一个实施例中,DW数据初始化从经第一Flume写入DW的第一ODS数据中选取满足筛选条件的分区作为DW最新分区。筛选条件是可能的更新所对应的最远日期与当前日期的时间间隔。比如对于外卖订单来说,可能会每天拉取近90天的订单,所以可能更新的最大日期是90天前,换句话说,可能的更新所对应的最远日期与当前日期的时间间隔是90天。以这个时间间隔作为一个筛选条件,设置时间间隔interval=90天。然后从经第一Flume写入DW的第一ODS数据中选取数据日期满足时间间隔interval≤90天的数据作为DW最新分区。
数据合并步骤S3中首先将截止到当前的经第二Flume写入DW的第二ODS数据作为最新写入数据。初步选取最新写入数据是会选取截止当前时间的全部第二ODS数据,也就是截止目前所有新写入的数据。然后将DW最新分区和最新写入数据进行合并,并且在合并过程中对DW最新分区和最新写入数据进行标记。将DW最新分区和最新写入数据进行合并时会根据筛选条件进行去重计算,剔除不满足筛选条件的数据。因为最新写入数据是直接选取截止当前的第二ODS数据,其中可能包括不满足筛选条件的数据,而所需要的第二ODS数据仅仅是同样满足时间间隔interval≤90天这个筛选条件的第二ODS数据。因此去重计算主要是将筛选条件应用到经第二Flume写入DW的第二ODS数据中将不满足筛选条件的数据剔除。在合并操作完成后,将已经参与运算的第二ODS数据删除,以避免今后的重复计算。在一个实施例中,在合并过程中设置标志tag对DW最新分区和最新写入数据进行标记,其中最新写入数据tag为1(第二ODS数据的tag为1),DW最新分区tag为0(DW数据tag为0)。
数据替换步骤S4中将前一步骤S3中计算得到的合并数据写回DW最新分区覆盖原数据。在操作时,DW最新分区被设置成当前分区pt=current,然后将合并数据写回current分区。在一个实施例中,为了确保数据的完整性,数据替换步骤还可以包括保护性覆盖步骤,对current分区附近的分区进行数据更新以保证数据的完整性。比如,interval=90天时,对附近分区,比如interval+1,即pt=91天的数据也进行更新,以确保数据的完整性。
更新判定步骤S5中,在包含合并数据的DW中执行更新判定操作,判断是否存在更新,标记参与更新判定操作。更新判定操作可以包括基于DW的诸如聚合操作的各类操作,比如订单数据计算门店营业额等。在进行更新判定操作是,标志tag也参与操作,比如在聚合时的同时也聚合tag。根据判定结果确定是否存在更新,如果存在更新的话,通过tag标志可以找到哪些数据需要更新,这些被tag标志标记的数据就是发生改变的增量数据。
如果在更新判定步骤中判断存在更新,则在数据更新步骤S6中将带有标记的数据同步至数据库DB进行增量更新。在一个实施例中,数据更新步骤中将tag>0的数据同步至数据库DB进行增量更新。因为源自第二ODS(新采集数据)的数据tag为1而源自DW的数据(原数据)tag为0,并且聚合的过程中tag也参与聚合,如果有源自第二ODS的数据参与聚合,则tag>0,因此筛选tag>0的数据进行增量更新。
在数据同步的过程中,可能会由于各种原因出现中断或者发生错误,这是就需要恢复数据。在一个实施例中,该数据增量更新方法还包括数据恢复步骤,如果该数据增量更新方法出现错误或中途终止,则进行数据恢复。数据恢复步骤包括两个部分,对DW数据的恢复和对数据库DB数据的恢复。对DW数据的恢复是以满足筛选条件的全量第一ODS数据对DW数据进行恢复,比如以90天内的全量第一ODS(经Flume 1写入的ODS数据)对DW数据进行恢复。对DB数据的恢复是将DW数据全量同步至数据库对数据库数据进行恢复。
本发明的数据增量更新方法的优势在于:
实现功能增量计算,在正常情况下保证ODS数据只算一次,降低资源浪费。
数据携带tag,聚合计算中也不会丢失增量的信息。
数据携带tag,针对业务层,可实现增量精准更新,在不过多占用业务性资源的同时保证业务端数据的完整性。
该方法针对不同数据具有通用性,可进行自动化。
本发明的数据增量更新方法利用数据仓库的运算能力来判定是否存在数据更新,并且标记出发生改变的数据,这些带标记的数据被提供给数据库,数据库仅对带标记的数据进行更新,大大节省数据更新所占用的资源。
还需要注意的是,以上所列举的实施例仅为本发明的具体实施例。显然本发明不局限于以上实施例,随之做出的类似变化或变形是本领域技术人员能从本发明公开的内容直接得出或者很容易便联想到的,均应属于本发明的保护范围。上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。

Claims (9)

1.一种数据增量更新方法,用于在由数据库、操作数据存储器(ODS)和数据仓库(DW)构成的存储架构中对数据进行增量更新,其特征在于,该数据增量更新方法包括:
数据配置步骤,对来自消息队列的数据进行配置,包括以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume,经第一Flume写入DW的数据为第一ODS数据,经第二Flume写入DW的数据为第二ODS数据;
数据初始化步骤,对DW数据进行初始化,从经第一Flume写入DW的第一ODS数据中选取满足筛选条件的分区作为DW最新分区;
数据合并步骤,将截止到当前的经第二Flume写入DW的第二ODS数据作为最新写入数据,将DW最新分区和最新写入数据进行合并,合并过程中对DW最新分区和最新写入数据进行标记;
数据替换步骤,将合并数据写回DW最新分区覆盖原数据;
更新判定步骤,在包含所述合并数据的DW中执行更新判定操作,判断是否存在更新,所述标记参与所述更新判定操作;
数据更新步骤,如果在更新判定步骤中判断存在更新,则将带有所述标记的数据同步至数据库进行增量更新。
2.如权利要求1所述的数据增量更新方法,其特征在于,所述数据配置步骤中,第一Flume或者第二Flume的分区粒度与计算粒度相关。
3.如权利要求2所述的数据增量更新方法,其特征在于,所述数据合并步骤中,
所述筛选条件是可能的更新所对应的最远日期与当前日期的时间间隔。
4.如权利要求3所述的数据增量更新方法,其特征在于,所述数据合并步骤中,将DW最新分区和最新写入数据进行合并包括进行去重计算,剔除不满足筛选条件的数据。
5.如权利要求3所述的数据增量更新方法,其特征在于,
合并过程中设置标志tag对DW最新分区和最新写入数据进行标记,其中最新写入数据tag为1,DW最新分区tag为0。
6.如权利要求5所述的数据增量更新方法,其特征在于,所述更新判定步骤中执行的更新判定操作包括聚合操作,所述标志tag参与聚合操作。
7.如权利要求6所述的数据增量更新方法,其特征在于,所述数据更新步骤中,经聚合后tag>0的数据被同步至数据库进行增量更新。
8.如权利要求1所述的数据增量更新方法,其特征在于,还包括数据恢复步骤,如果该数据增量更新方法出现错误或中途终止,则进行数据恢复。
9.如权利要求8所述的数据增量更新方法,其特征在于,所述数据恢复步骤包括:
以满足筛选条件的全量第一ODS数据对DW数据进行恢复;
将DW数据全量同步至数据库对数据库数据进行恢复。
CN202011591296.0A 2020-12-29 2020-12-29 数据增量更新方法 Active CN112711599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011591296.0A CN112711599B (zh) 2020-12-29 2020-12-29 数据增量更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011591296.0A CN112711599B (zh) 2020-12-29 2020-12-29 数据增量更新方法

Publications (2)

Publication Number Publication Date
CN112711599A CN112711599A (zh) 2021-04-27
CN112711599B true CN112711599B (zh) 2023-02-28

Family

ID=75546149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011591296.0A Active CN112711599B (zh) 2020-12-29 2020-12-29 数据增量更新方法

Country Status (1)

Country Link
CN (1) CN112711599B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678392A (zh) * 2012-09-20 2014-03-26 阿里巴巴集团控股有限公司 一种数据增量合并的方法及其装置
CN107958082A (zh) * 2017-12-15 2018-04-24 杭州有赞科技有限公司 数据库到数据仓库的离线增量同步方法及系统
CN110222032A (zh) * 2019-05-22 2019-09-10 武汉掌游科技有限公司 一种基于软件数据分析的通用事件模型
CN111209352A (zh) * 2020-04-20 2020-05-29 北京聪明核桃教育科技有限公司 一种数据处理方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10409650B2 (en) * 2016-02-24 2019-09-10 Salesforce.Com, Inc. Efficient access scheduling for super scaled stream processing systems
CA3050220A1 (en) * 2018-07-19 2020-01-19 Bank Of Montreal Systems and methods for data storage and processing
CN109885581B (zh) * 2019-03-14 2021-09-17 苏州达家迎信息技术有限公司 数据库的同步方法、装置、设备及存储介质
CN111159272A (zh) * 2019-12-31 2020-05-15 青梧桐有限责任公司 基于数据仓库及etl的数据质量监控及预警方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678392A (zh) * 2012-09-20 2014-03-26 阿里巴巴集团控股有限公司 一种数据增量合并的方法及其装置
CN107958082A (zh) * 2017-12-15 2018-04-24 杭州有赞科技有限公司 数据库到数据仓库的离线增量同步方法及系统
CN110222032A (zh) * 2019-05-22 2019-09-10 武汉掌游科技有限公司 一种基于软件数据分析的通用事件模型
CN111209352A (zh) * 2020-04-20 2020-05-29 北京聪明核桃教育科技有限公司 一种数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112711599A (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
US11507594B2 (en) Bulk data distribution system
CN102142024A (zh) 在分布式数据库中使用递增捕捉来进行逻辑数据备份和回退
CN107256182A (zh) 一种数据库还原的方法及设备
CN113111129A (zh) 数据同步方法、装置、设备及存储介质
CN114528127A (zh) 数据处理方法、装置、存储介质及电子设备
US10642530B2 (en) Global occupancy aggregator for global garbage collection scheduling
CN111143323B (zh) Mpp数据库管理方法、装置及系统
CN110083372B (zh) 一种区块链数据版本升级方法
CN112711599B (zh) 数据增量更新方法
CN114153395A (zh) 一种对象存储数据生命周期管理方法、装置及设备
JP2001344139A (ja) データベース管理装置
US11093348B2 (en) Method, device and computer program product for recovering metadata
US20230058475A1 (en) Transaction based processing using asynchronous microservices
CN115421856A (zh) 一种数据恢复方法及装置
US11108862B2 (en) Bi-directional data sync between a client device and an application server
CN115202934A (zh) 数据备份的方法、装置、设备及存储介质
CN114358404A (zh) 航班数据的处理方法及装置电子设备、存储介质
CN108376104B (zh) 节点调度方法及装置、计算机可读存储介质
CN113434264A (zh) 一种任务组件的智能处理方法、装置、设备和存储介质
JP4983045B2 (ja) データベースの正常性チェック方法、正常性チェックプログラム、および正常性チェック装置
CN107402752B (zh) 应用的定时触发方法和装置
CN101364224A (zh) 用于信息管理的系统和方法
CN108614838B (zh) 一种用户群索引处理方法、装置及系统
CN113590257B (zh) 一种基于容器的数据库容灾的方法、系统、设备及介质
CN117785272B (zh) 一种代码统计方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant