CN113590596A - 数据处理方法、系统、设备、计算机程序产品及存储介质 - Google Patents

数据处理方法、系统、设备、计算机程序产品及存储介质 Download PDF

Info

Publication number
CN113590596A
CN113590596A CN202110751374.7A CN202110751374A CN113590596A CN 113590596 A CN113590596 A CN 113590596A CN 202110751374 A CN202110751374 A CN 202110751374A CN 113590596 A CN113590596 A CN 113590596A
Authority
CN
China
Prior art keywords
page
data
read
time
data page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110751374.7A
Other languages
English (en)
Inventor
庄泽超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Innovation Co
Original Assignee
Alibaba Singapore Holdings Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Singapore Holdings Pte Ltd filed Critical Alibaba Singapore Holdings Pte Ltd
Priority to CN202110751374.7A priority Critical patent/CN113590596A/zh
Publication of CN113590596A publication Critical patent/CN113590596A/zh
Priority to PCT/SG2022/050457 priority patent/WO2023277819A2/zh
Priority to US18/573,942 priority patent/US20240289352A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供数据处理方法、系统、设备、计算机程序产品及存储介质。其中,所述方法包括:数据页不满足写入磁盘的条件时,生成一复制页;其中,所述复制页包含有:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。本申请实施例提供的方案,可推进读写节点将数据页写入磁盘(即落盘)的进度,相应的,只读节点也可尽快删除内存中堆积的日志,使其具有接收新日志的能力。

Description

数据处理方法、系统、设备、计算机程序产品及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及数据处理方法、系统、设备、计算机程序产品及存储介质。
背景技术
随着云原生数据库技术的发展,越来越多的用户参与到云技术当中。用户对数据库的数据处理量、处理速度等性能的要求也逐渐提升。
数据库中读写节点上对某一数据页的数据进行了修改,但磁盘中的数据页没有及时同步更新,则会导致读写节点上数据页中的数据与磁盘中的数据页的数据不一致,该数据页就称为脏页。为了保证磁盘中与读写节点内存中数据页的数据一致,需要对该数据页进行刷脏处理,即将修改后的数据从读写节点内存中落盘持久化到磁盘的操作。然而,在实际应用中,会存在多种多样的原因导致无法对数据页进行刷脏处理,继而导致线程阻塞,直接影响数据库的性能。
发明内容
为解决或改善现有技术中存在的问题,本申请各实施例提供了数据处理方法、系统、设备、计算机程序产品及存储介质。
在本申请的一个实施例中,提供了一种数据处理方法。该方法,适用于读写节点,具体包括:
数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;
所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。
在本申请的另一个实施例中,提供了一种数据处理方法。该方法适用于只读节点,具体的包括:
从共享存储中读取日志;
将读取到的日志存储到内存中;
在确定数据页对应的第一序列标识被更新为复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除;
其中,所述复制页是在所述数据页不满足写入磁盘的条件时生成的,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
在本申请的又一个实施例中,提供了一种数据库系统。该数据库系统包括:
读写节点,用于在数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;所述复制页满足写入磁盘的条件,并执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作;
共享存储,具有所述磁盘,用于存储数据页及日志;
只读节点,用于从共享存储中读取日志;将读取到的日志存储到内存中;在确定所述数据页对应的所述第一序列标识被更新为所述复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除。
在本申请的又一个实施例中,提供了一种电子设备。该电子设备包括:存储器及处理器;其中,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现上述数据处理方法中步骤。
在本申请的又一个实施例中,提供了一种计算机程序产品。该计算机程序产品包括计算机程序或指令。当所述计算机程序或指令被处理器执行时,致使所述处理器能够实现上述数据处理方法中步骤。
在本申请的又一个实施例中,提供了一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述数据处理方法中步骤。
通常情况下不能满足写入条件的数据页是频繁被修改的页(即热点页),读写节点频繁的接收到针对该热点页的写请求,因为该写请求一直处于被修改状态,所以该数据页就总不能满足写入磁盘(即落盘)的条件。为此,本申请实施例提供的技术方案中,在出现数据页不满足写入磁盘(即刷脏)条件时,采用复制页机制,该复制页对读写节点来说属于一个不再被修改的页,即第二时间修改对应的日志的第二序列标识固定,不再增加;此时,该复制页定能满足写入磁盘的条件,因此可推进读写节点将数据页写入磁盘(即落盘)的进度,相应的,只读节点也可尽快删除内存中堆积的日志,使其具有接收新日志的能力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的数据库系统的结构示意图;
图2为本申请一实施例提供的数据库系统的另一表现形式的结构示意图;
图3为本申请一实施例提供的数据处理方法的流程示意图;
图4为本申请另一实施例提供的数据处理方法的流程示意图;
图5为本申请一实施例提供的数据处理装置的结构示意图;
图6为本申请另一实施例提供的数据处理装置的结构示意图;
图7为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在本申请的说明书、权利要求书及上述附图中描述的一些流程中,包含了按照特定顺序出现的多个操作,这些操作可以不按照其在本文中出现的顺序来执行或并行执行。操作的序号如101、102等,仅仅是用于区分各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。此外,下文描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在介绍本申请各实施例之前,先对本文中涉及到的专用名词、术语等进行简要说明。
共享存储:是指数据库不同节点在底层使用同一份数据存储,在共享存储的架构下,能够在不增加磁盘存储的情况下,实现更好的扩展读请求负载,能够快速的增加和删除只读节点,并且能在只读节点和读写节点进行实时HA(High Availability,高可用性)切换,大大提升了实例的可用性。
物理复制:是指Mysql数据库通过Redolog实现主备数据的同步,区别于原有的binlog主备同步机制,有着更好的同步性能和更低的同步延迟,是PolarDB的核心技术。
Redolog,日志(或称为物理日志),记录的是数据页(page)的物理修改,用来将数据页更新为修改后的数据页。其中,Redolog(即日志)包含有数据页标识、修改内容、写入时间(或时间戳)等。
Redolog的应用(Apply):使用Redolog对数据页进行更新,以将数据页更新为修改后数据页的过程。
LSN:一个一直在递增的日志序列号,从实例安装到当前已经产生的日志总量,可以通过LSN计算出其在日志中的位置。每个数据页在写入磁盘(或落盘)时,其最近一次修改的LSN也会记入其中,这样在崩溃恢复时,无需应用(Apply)该LSN之前的日志。
刷脏:是指数据库中读写节点将修改后的数据页从内存中落盘持久化到磁盘的操作,一般由读写节点后台线程周期对内存中的数据页(Page)进行刷脏。
热点页:在数据库中一直被频繁修改的Page,说明一直有用户请求在频繁的对这个相同或连续的数据进行频繁的更新操作。
PolarDB数据库采用一写多读的架构来服务用户。如图1所示,读写节点负责读写请求,又称之为Primary节点,并产生Redolog和数据页(Page)的持久化,产生的Redolog及持久化的数据页都保存在共享存储PFS上。只读节点可以为多个,只负责读请求,又称之为Replica节点。只读节点通过读取共享存储上的Redolog进行数据页的更新(或回放),将自己缓冲池(Buffer Pool)中存在的数据页更新为最新修改后的数据页,以便于后续的读请求能及时访问到最新的数据。
在PolarDB的架构中,为了保证用户线程的读请求在只读节点上访问数据页时给用户返回的数据的一致性,读写节点(Primary节点)在对数据页P1进行刷脏操作时,需要保证该数据页P1的最新修改的Redolog的LSN不能超过所有只读节点上被应用的Redolog的最小LSN,以避免用户在只读节点上访问到过新的数据。这里,被应用的Redolog不一定是该数据P1的Redolog。举例来说,假设图1所示的数据库系统包含有只读节点1、只读节点2和只读节点n。只读节点1上应用了LSN为a的Redolog对数据页P2进行了更新;只读节点2上应用了LSN为b的Redolog对数据页P3进行了更新;只读节点n上应用了LSN为c的Redolog对数据页P1进行了更新。其中,a<b<c。此时,读写节点需要保证该数据页P1的最新修改的LSN不能超过只读节点1上应用的Redolog的LSN=a。
因此,为了保证磁盘数据始终保持一致的状态,读写节点在对某一数据页进行刷脏时必须考虑所有只读节点上应用的Redolog的LSN,并且受只读节点应用的Redolog的LSN来完成数据落盘。
把所有只读节点上被应用的Redolog的最小LSN定义为safe LSN。读写节点在对该数据页P1进行刷脏处理(Flush Page)时,一定要保证该数据页P1的最新修改的RedologLSN(new_modification_lsn)要小于safe LSN,不然就不能对该数据页P1进行刷脏落盘,这样就有可能会导致读写节点上的数据页P1无法得到及时刷脏,并且无法推进最老修改的LSN(oldest_flush_lsn)。
而在只读节点上,为了加速物理复制的同步效率,新增了运行时应用(RuntimeApply)的机制。Runtime Apply是指在应用Redolog时,如果数据页P1不在内存(具体的如Buffer pool,缓存池)中,将不会应用相应的Redolog对这个数据页P1进行更新(或回放),避免了只读节点上后台Apply(应用)线程频繁从共享存储读取数据页P1,但是还是需要把解析好的该数据页P1对应的Redolog缓存起来,即保存在内存(具体的如Parse Buffer,解析缓存)中,以便后续用户的读请求到达时读取共享存储上的相应数据页P1,并通过Runtime Apply应用内存(具体的如Parse Buffer)中缓存的针对这个数据页P1修改的所有Redolog,最终返回最新的数据页。在内存(具体的如Parse Buffer)中缓存的Redolog必须要等到读写节点的oldest_flush_lsn推进之后才能进行清理,即意味着这段Redolog修改对应的数据页P1已经落盘,那这段Redolog就可以丢掉了。
在这种约束下,倘若出现热点Page的更新(即new_modification_lsn不停的在更新)或者读写节点刷脏过慢,就会导致只读节点的Parse Buffer中堆积大量的解析好的该热点Page的Redolog,同时会影响只读节点的Parse Buffer和Redolog Apply性能,导致只读节点的应用Redolog的LSN推进过慢,反向又会导致读写节点更加无法刷脏,最终影响用户线程的写入操作。如果读写节点应用Redolog的速度慢到一定程度,会导致应用Redolog的速度和读写节点产生的Redolog差距会越拉越大,导致复制延迟会持续增大。
正如上面所讲的,读写节点在对某一数据页进行刷脏时要求写磁盘的数据页对应的最新修改的Redolog的LSN不能超过safe LSN。当一个数据页被频繁更新时,就会出现此数据页的最新修改的Redolog的LSN(newest_modification_lsn)不断更新,其总也不满足刷脏的条件(即总是大于safe LSN),导致此数据页无法写到磁盘数据文件中,从而无法推进刷新LSN,最终结果是只读节点的Redolog堆积在内存(具体的如Buffer pool,缓存池)里,使之没有缓冲接收新的写请求。
为了解决这个问题,本申请各实施例提供的技术方案引入了复制页(Copy Page)技术。复制页是当一个数据页在类似于PolarDB的架构下,即一写多读的架构下,由于不满足刷脏条件导致其不能及时写入到磁盘数据文件的情况下,临时生成了一个数据的复制页。这个复制页包含有:数据页中的所有数据、最老修改的LSN、最新修改的LSN等。这样就能让该数据页满足刷脏条件以推进该数据页的刷脏过程。
图1和图2示出了本申请一实施例提供的数据库系统的结构示意图。如图所示,所述数据库系统包括:
读写节点11,用于在数据页不满足写入磁盘的条件时,生成一复制页;其中,所述复制页包含有:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作;
共享存储13,具有所述磁盘,用于存储数据页及日志;
只读节点12,用于从共享存储中读取日志;将读取到的日志存储到内存中;在确定数据页对应的所述第一序列标识被更新为所述复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除。
其中,只读节点12可以为多个,以为多个用户提供数据读取服务。例如,在具体实施时,本实施例中所述的数据库系统中还可包含有负责负载均衡、读写分发等功能的装置、设备或模块等。例如,本实施例所述的数据库系统还可包括中间层设备,该中间层设备在接收到多个用户读请求和/或写请求后,会将读请求和写请求进行分类发送,以将写请求发送至读写节点,将读请求发送至只读节点。若读请求为多个,则可按照负载均衡原则将多个读请求分发到不同的只读节点。
本实施例所述的数据库节点可以是PolarDB架构的数据库系统。参见图2所示,在PolarDB架构的数据库系统中,读写节点和只读节点通过物理复制来同步内存中的状态,由于同步的数据比较少,因此发生复制延迟的概率相比传统的MySQL复制还是小很多的。接下来简单介绍一下物理复制的过程:
Primary节点(即读写节点)会定期向Replica节点(即只读节点)发送通知,以告知Replica节点可安全读取的日志位点上限(即可读取的日志的最大序列标识)。Replica节点在这个周期内,可以安全读取到这个位点以下的日志,如果超过这个位点,可能会读到Primary节点正在写的日志。Replica节点定期反馈应用日志的位点,表示自己应用到的日志的最大序列标识,小于这个位点的一定已经应用完,大于这个位点的可能还没应用或者正在应用。Primary节点当前写到的日志位点和Replica节点应用到的位点之差即为复制延迟,如果复制延迟很大,就会导致Replica节点跟不上Primary节点。
图2中读写节点11中的LGWR(Log Writer,写日志单元),将日志缓缓存区中的所有日志写到共享存储的相应磁盘的日志文件中。该写日志进程在启动实例时自动启动。
所述磁盘中存储有数据页对应的第一序列标识,比如,第一序列标识包含在数据页中,此时,读写节点可在所述复制页满足写入磁盘的条件时,执行将所述磁盘中的所述数据页更新为所述复制页的操作,这样便同时完成了标识更新操作及数据信息更新操作(或称为数据落盘操作)。其中,标识更新操作即将数据页对应第一序列标识更新为第二序列标识的操作,该标识更新操作可让只读节点尽快删除内存中堆积的日志,使其具有接收新日志的能力。数据信息更新操作(或称为数据落盘操作)是将磁盘中所述数据页的数据信息更新为所述复制页包括的所述数据信息的操作,该数据信息更新操作推进了数据页写入磁盘(即落盘)的进度。
本系统实施例中的各组成单元,如读写节点11、只读节点12、共享存储13各组成单元的功能及相互间的交互过程可参见如下各方法实施例的描述。
图3示出了本申请一实施例提供的数据处理方法的流程示意图。本实施例提供的所述方法适用于上述数据库系统中的读写节点。具体的,所述方法包括:
101、数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
102、所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。
上述101中,所述数据页可以是写请求频率大于预设频率的热点页。
假设读写节点连续、且不断地接收到数据页P1的写请求,读写节点根据接收到的写请求不断的对P1进行修改,且针对每次修改生成相应的日志,并为各日志赋予一序列标识(如LSN,一个自增序号)。例如,下述表1中列出的P1对应每次写请求后修改得到的数据页及日志分别为:
Figure BDA0003146408900000101
上述各日志后的标识1、2、3、4、5、……分别为各日志对应的序列标号(即LSN)。
若针对数据页P1的写请求还持续不断的接收到,则数据页P1就需要不断的修改,就会出现最新修改的日志的LSN不断更新,该数据页P1总也不能满足写入磁盘(刷脏或落盘)的条件。为此,本实施例步骤101中,为数据页生成一个复制页。比如上面表所示的例子,生成一个复制页,该复制页包含数据页P1第一时间修改的日志对应的第一序列标识(如LSN=1)、数据页P1第二时间修改的日志对应的第二序列标识(如LSN=5)、以及数据页P1经第一时间至第二时间期间的多次修改后的数据信息(即数据页P15的数据信息)。该复制页被看做是一个不再被修改的页,即复制页的第二时间修改的日志对应的第二序列标识固定,不再变化,此时,判定复制页必定满足写入磁盘条件。
本实施例中将磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作,可推进只读节点删除其内存中堆积日志的进度,使其具有接收新日志的能力,而不至于影响其性能。实质上,除了将磁盘中所述对应的所述第一序列标识更新为所述第二序列标识之外,还可将磁盘中的所述数据页更新为所述复制页,以完成数据信息更新操作。即本实施例提供的所述方法,还可包括如下步骤:
将所述磁盘中所述数据页更新为所述复制页,以完成数据信息更新操作;
其中,所述数据信息更新操作是指将所述磁盘中所述数据页包括的数据信息更新为所述复制页包括的所述数据信息的操作。
在具体实施时,磁盘(即共享存储中的磁盘)中存储的数据页包含序列标识(比如本实施例中提及的所述数据页包含所述第一序列标识),则可直接将磁盘中包含所述第一序列标识的所述数据页更新为所述复制页。简单理解就是,将磁盘中包含所述第一序列标识的所述数据页直接替换为所述复制页。此时,磁盘中关于该数据页的数据信息及LSN,分别变为所述复制页包含的数据信息及第二序列标识(即该复制页的最新修改LSN,newest_modification_lsn),从而推进了读写节点将数据页写入磁盘的进度。即磁盘中存储的所述数据页变更为第二时间修改后的数据信息,完成了数据页的落盘,同时因数据页对应的第一序列标识更新为第二序列标识,对于只读节点来说可尽快删除其内存中堆积日志,使其具有接收新日志的能力,保持较好的性能。
如上述表格1所示的例子,还可再生成另一复制页(为区别上述复制页,下文称为拷贝页),该拷贝页包含数据页P1第三时间修改的日志对应的第三序列标识(如LSN=6)、数据页P1第四时间修改的日志对应的第四序列标识(如LSN=10)、以及数据页P1经第三时间至第四时间期间的多次修改后的数据信息(即数据页P110的数据信息)。然后,再执行将磁盘中包含第二序列标识的复制页更新为拷贝页的操作。
可见,采用本实施例提供的所述方法,在读写节点后台写入磁盘(或刷脏或落盘)线程进行检查时,数据页不满足检查条件的情况下,本实施例提供了一种复制页机制,因为数据页一直处于被频繁修改的状态,所以会长期处于无法刷脏落盘的情况,但给数据页做一个复制页,这个复制页的最新修改对应日志的第二序列标识固定,因此在后续的检查中该复制页就能满足检查条件进行落盘持久化,并且推动读写节点推进数据页的写入磁盘进度,降低只读节点因数据页迟迟不能写入磁盘出现的日志积压在内存中影响只读节点的性能等问题。在有了复制页这个机制后,再频繁的修改也不会影响数据库系统的稳定性,提升了数据库系统的稳定性。
这里需要补充的是:本申请文件中均采用数据页这一概念进行的描述。实际上,针对不同架构的数据库,其存储数据的结构不同,对应在本实施例中的数据名称也会不一样。本实施例中的数据页可替换为数据集、数据项、数据组等等名词,本实施例对此不作具体限定。
进一步的,本实施例提供的所述方法还可包括如下步骤:
103、获取至少一个只读节点应用的日志的序列标识;
104、根据所述至少一个只读节点应用的日志的序列标识,确定安全序列标识;
105、所述第二序列标识小于或等于所述安全序列标识时,所述复制页满足写入磁盘的条件。
上述104中“根据所述至少一个只读节点应用的日志的序列标识,确定安全序列标识”可具体为:
根据所述至少一个只读节点应用的日志的序列标识,确定最小序列标识;
将所述最小序列标识作为所述安全序列标识。
进一步的,本实施例提供的所述方法还可包括如下步骤:
106、定期向至少一个只读节点发送读取日志位点信息,所述读取日志位点信息中包含有只读节点能从共享存储中读取的日志的最大序列标识;
107、定期接收所述至少一个只读节点反馈的应用日志位点信息,所述应用日志位点信息中包含有只读节点应用的日志的序列标识。
进一步的,本实施例提供的所述方法还可包括如下步骤:
108、接收针对所述数据页的写请求;
109、根据所述写请求,对内存中的所述数据页进行修改并生成相应的日志;
110、为所述日志赋予一序列标识;
111、将所述日志发送至共享存储的磁盘中进行存储。
图4示出了本申请另一实施例提供的数据处理方法的流程示意图。本实施例提供的所述方法的执行主体可以是上述数据库系统中只读节点。具体的,所述方法包括:
201、从共享存储中读取日志;
202、将读取到的日志存储到内存中;
203、在确定数据页对应的第一序列标识被更新为复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除;
其中,所述复制页是在所述数据页不满足写入磁盘的条件时生成的,所述复制页包括:所述数据页的第一时间修改对应日志的所述第一序列标识、所述数据页的第二时间修改对应日志的所述第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
有关复制页的生成及如何利用复制页更新磁盘中数据页的内容可参见上述实施例中的相应内容,此处不作详述。
进一步的,本实施例提供的所述方法还可包括如下步骤:
204、接收针对所述数据页的读请求;
205、应用内存中存储的所述数据页的第三时间修改对应的日志,以对所述数据页进行修改;其中,所述第三时间晚于所述第二时间;
206、响应于所述读请求,反馈修改后的所述数据页。
图5示出了本申请一实施例提供的数据处理装置的结构示意图。如图5所示,所述装置包括:生成模块21、执行模块22。其中:
生成模块21,用于数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;
执行模块22,用于所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。
进一步的,所述执行模块22还用于将所述磁盘中所述数据页更新为所述复制页,以完成数据信息更新操作;
其中,所述数据信息更新操作是指将所述磁盘中所述数据页包括的数据信息更新为所述复制页包括的所述数据信息的操作。
进一步的,本实施例所述的装置还可包括获取模块及确定模块。其中,获取模块用于获取至少一个只读节点应用的日志的序列标识。所述确定模块用于根据所述至少一个只读节点应用的日志的序列标识,确定安全序列标识;所述第二序列标识小于或等于所述安全序列标识时,所述复制页满足写入磁盘的条件。
进一步的,所述确定模块具体用于:根据所述至少一个只读节点应用的日志的序列标识,确定最小序列标识;将所述最小序列标识作为所述安全序列标识。
进一步的,所述本实施例提供的所述装置还可包括收发模块。该收发模块用于定期向至少一个只读节点发送读取日志位点信息,所述读取日志位点信息中包含有只读节点能从共享存储中读取的日志的最大序列标识;定期接收所述至少一个只读节点反馈的应用日志位点信息,所述应用日志位点信息中包含有只读节点应用的日志的序列标识。
进一步的,本实施例提供的所述装置还包括:处理模块。收发模块用于接收针对所述数据页的写请求。所述处理模块用于根据所述写请求,对内存中的所述数据页进行修改并生成相应的日志;为所述日志赋予一序列标识;将所述日志发送至共享存储的磁盘中进行存储。
进一步的,所述数据页为写请求频率大于预设频率的热点页。
这里需要说明的是:上述实施例提供的装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
图6示出了本申请另一实施例提供的数据处理装置的结构示意图。如图所示,所述装置包括:读取模块31、存储模块32及删除模块33。其中,
读取模块31,用于从共享存储中读取日志;
存储模块32,用于将读取到的日志存储到内存中;
删除模块33,用于在确定数据页对应的第一序列标识被更新为复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除;
其中,所述复制页是在所述数据页不满足写入磁盘的条件时生成的,所述复制页包括:所述数据页的第一时间修改对应日志的所述第一序列标识、所述数据页的第二时间修改对应日志的所述第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
进一步的,本实施例提供的所述装置还可包括:接收模块、修改模块及反馈模块。其中,所述接收模块用于接收针对所述数据页的读请求。所述修改模块用于应用内存中存储的所述数据页的第三时间修改对应的日志,以对所述数据页进行修改;其中,所述第三时间晚于所述第二时间;所述反馈模块用于响应于所述读请求,反馈修改后的所述数据页。
这里需要说明的是:上述实施例提供的装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请还提供了一种电子设备,如图7所示,该电子设备包括处理器42和存储器41,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行,以用于:
数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;
所述复制页满足写入磁盘的条件,并执行将所述磁盘中包含所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。
上述存储器41可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在的电子设备上操作的任何应用程序或方法的指令。存储器41可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述处理器42在执行存储器41中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图7所示,电子设备还包括:通信组件43、显示器44、电源组件45、音频组件46等其它组件。图7中仅示意性给出部分组件,并不意味着电子设备只包括图6所示组件。具体实施时,本实施例提供的所述电子设备可以是数据库系统中的读写节点。
本申请又一个实施例提供一种电子设备,该电子设备的结构同图7。具体的,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行,以用于:
从共享存储中读取日志;
将读取到的日志存储到内存中;
在确定数据页对应的第一序列标识被更新为复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除;
其中,所述复制页是在所述数据页不满足写入磁盘的条件时生成的,所述复制页包括:所述数据页的第一时间修改对应日志的所述第一序列标识、所述数据页的第二时间修改对应日志的所述第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
上述处理器在执行存储中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
相应的,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的数据处理方法的步骤或功能。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的数据处理方法的步骤或功能。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (13)

1.一种数据处理方法,适用于读写节点,所述方法包括:
数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;
所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作。
2.根据权利要求1所述的方法,还包括:
将所述磁盘中所述数据页更新为所述复制页,以完成数据信息更新操作;
其中,所述数据信息更新操作是指将所述磁盘中所述数据页包括的数据信息更新为所述复制页包括的所述数据信息的操作。
3.根据权利要求1或2所述的方法,还包括:
获取至少一个只读节点应用的日志的序列标识;
根据所述至少一个只读节点应用的日志的序列标识,确定安全序列标识;
所述第二序列标识小于或等于所述安全序列标识时,所述复制页满足写入磁盘的条件。
4.根据权利要求3所述的方法,根据所述至少一个只读节点应用的日志的序列标识,确定安全序列标识,包括:
根据所述至少一个只读节点应用的日志的序列标识,确定最小序列标识;
将所述最小序列标识作为所述安全序列标识。
5.根据权利要求3所述的方法,还包括:
定期向至少一个只读节点发送读取日志位点信息,所述读取日志位点信息中包含有只读节点能从共享存储中读取的日志的最大序列标识;
定期接收所述至少一个只读节点反馈的应用日志位点信息,所述应用日志位点信息中包含有只读节点应用的日志的序列标识。
6.根据权利要求1或2所述的方法,还包括:
接收针对所述数据页的写请求;
根据所述写请求,对内存中的所述数据页进行修改并生成相应的日志;
为所述日志赋予一序列标识;
将所述日志发送至共享存储的磁盘中进行存储。
7.根据权利要求6所述的方法,所述数据页为写请求频率大于预设频率的热点页。
8.一种数据处理方法,适用于只读节点,包括:
从共享存储中读取日志;
将读取到的日志存储到内存中;
在确定数据页对应的第一序列标识被更新为复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除;
其中,所述复制页是在所述数据页不满足写入磁盘的条件时生成的,所述复制页包括:所述数据页的第一时间修改对应日志的所述第一序列标识、所述数据页的第二时间修改对应日志的所述第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间。
9.根据权利要求8所述的方法,还包括:
接收针对所述数据页的读请求;
应用内存中存储的所述数据页的第三时间修改对应的日志,以对所述数据页进行修改;其中,所述第三时间晚于所述第二时间;
响应于所述读请求,反馈修改后的所述数据页。
10.一种数据库系统,包括:
读写节点,用于在数据页不满足写入磁盘的条件时,生成复制页;其中,所述复制页包括:所述数据页的第一时间修改对应日志的第一序列标识、所述数据页的第二时间修改对应日志的第二序列标识、所述数据页经所述第一时间至所述第二时间期间的多次修改后的数据信息;所述第一时间早于所述第二时间;所述复制页满足写入磁盘的条件,执行将所述磁盘中所述数据页对应的所述第一序列标识更新为所述第二序列标识的操作;
共享存储,具有所述磁盘,用于存储数据页及日志;
只读节点,用于从共享存储中读取日志;将读取到的日志存储到内存中;在确定所述数据页对应的所述第一序列标识被更新为所述复制页包括的第二序列标识后,将所述内存中所述数据页经第一时间至第二时间期间的多次修改分别对应的日志删除。
11.一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现权利要求1至6中任一项,或权利要求7或8所述的数据处理方法。
12.一种计算机程序产品,包括计算机程序或指令,当所述计算机程序或指令被处理器执行时,致使所述处理器能够实现权利要求1至6中任一项所述方法中的步骤,或权利要求7或8所述方法中的步骤。
13.一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现权利要求1至6中任一项所述方法中的步骤,或权利要求7或8所述方法中的步骤。
CN202110751374.7A 2021-07-02 2021-07-02 数据处理方法、系统、设备、计算机程序产品及存储介质 Pending CN113590596A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110751374.7A CN113590596A (zh) 2021-07-02 2021-07-02 数据处理方法、系统、设备、计算机程序产品及存储介质
PCT/SG2022/050457 WO2023277819A2 (zh) 2021-07-02 2022-06-30 数据处理方法、系统、设备、计算机程序产品及存储功能
US18/573,942 US20240289352A1 (en) 2021-07-02 2022-06-30 Data processing method, system, device, computer program product, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110751374.7A CN113590596A (zh) 2021-07-02 2021-07-02 数据处理方法、系统、设备、计算机程序产品及存储介质

Publications (1)

Publication Number Publication Date
CN113590596A true CN113590596A (zh) 2021-11-02

Family

ID=78245778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110751374.7A Pending CN113590596A (zh) 2021-07-02 2021-07-02 数据处理方法、系统、设备、计算机程序产品及存储介质

Country Status (3)

Country Link
US (1) US20240289352A1 (zh)
CN (1) CN113590596A (zh)
WO (1) WO2023277819A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010430A (zh) * 2023-03-24 2023-04-25 杭州趣链科技有限公司 数据恢复方法、数据库系统、计算机设备和存储介质
CN116501736A (zh) * 2023-04-12 2023-07-28 北京优炫软件股份有限公司 一种数据库延迟回放的控制方法以及控制系统
CN117555884A (zh) * 2024-01-12 2024-02-13 腾讯科技(深圳)有限公司 数据页的读取方法、装置、设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3255563A1 (en) * 2016-06-09 2017-12-13 Mastercard International Incorporated Method and systems for monitoring changes for a server system
US11494408B2 (en) * 2019-09-24 2022-11-08 Salesforce.Com, Inc. Asynchronous row to object enrichment of database change streams
CN112182010B (zh) * 2020-11-30 2021-03-12 北京金山云网络技术有限公司 脏页刷新方法和装置、存储介质和电子设备
CN112506941B (zh) * 2021-02-03 2021-05-11 北京金山云网络技术有限公司 核查点的处理方法和装置、电子设备和存储介质
CN112835528B (zh) * 2021-02-22 2024-07-19 北京金山云网络技术有限公司 脏页刷新方法和装置、电子设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010430A (zh) * 2023-03-24 2023-04-25 杭州趣链科技有限公司 数据恢复方法、数据库系统、计算机设备和存储介质
CN116010430B (zh) * 2023-03-24 2023-06-20 杭州趣链科技有限公司 数据恢复方法、数据库系统、计算机设备和存储介质
CN116501736A (zh) * 2023-04-12 2023-07-28 北京优炫软件股份有限公司 一种数据库延迟回放的控制方法以及控制系统
CN117555884A (zh) * 2024-01-12 2024-02-13 腾讯科技(深圳)有限公司 数据页的读取方法、装置、设备及可读存储介质
CN117555884B (zh) * 2024-01-12 2024-04-26 腾讯科技(深圳)有限公司 数据页的读取方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
WO2023277819A3 (zh) 2023-04-20
WO2023277819A9 (zh) 2023-05-25
US20240289352A1 (en) 2024-08-29
WO2023277819A2 (zh) 2023-01-05

Similar Documents

Publication Publication Date Title
US20210056074A1 (en) File System Data Access Method and File System
US10788998B2 (en) Logging changes to data stored in distributed data storage system
CN113590596A (zh) 数据处理方法、系统、设备、计算机程序产品及存储介质
Fang et al. High performance database logging using storage class memory
US7987158B2 (en) Method, system and article of manufacture for metadata replication and restoration
US7457822B1 (en) Apparatus and method for hardware-based file system
US8438135B1 (en) Mirroring metadata in a continuous data protection environment
CN107533438B (zh) 存储器系统中的数据复制
CN103780638A (zh) 数据同步方法及系统
EP3206128A1 (en) Data storage method, data storage apparatus, and storage device
CN114281762B (zh) 一种日志存储加速方法、装置、设备及介质
CN103092905A (zh) 使用虚拟文件数据对象的列式数据库
CN109582686B (zh) 分布式元数据管理一致性保证方法、装置、系统及应用
CN115599747B (zh) 一种分布式存储系统的元数据同步方法、系统及设备
CN110196818A (zh) 缓存数据的方法、缓存设备和存储系统
CN107092598A (zh) 数据存储位置信息的管理方法和装置
CN116400855A (zh) 一种数据处理方法和数据存储系统
CN113204520B (zh) 一种基于分布式文件系统的遥感数据快速并发读写方法
EP3183675B1 (en) Systems and methods for highly-available file storage with fast online recovery
CN118035255A (zh) 存算分离数据库的非侵入式日志下推方法
CN109726211A (zh) 一种分布式时序数据库
US20130117221A1 (en) Moving Data Within A Distributed Data Storage System Using Virtual File Links
CN110895545A (zh) 共享数据同步方法及装置
US9575990B2 (en) Partitioning data within a distributed data storage system using virtual file links
US10073874B1 (en) Updating inverted indices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240309

Address after: # 03-06, Lai Zan Da Building 1, 51 Belarusian Road, Singapore

Applicant after: Alibaba Innovation Co.

Country or region after: Singapore

Address before: Room 01, 45th Floor, AXA Building, 8 Shanton Road, Singapore

Applicant before: Alibaba Singapore Holdings Ltd.

Country or region before: Singapore