WO2013163864A1

WO2013163864A1 - 数据持久化处理方法、装置及数据库系统

Info

Publication number: WO2013163864A1
Application number: PCT/CN2012/083305
Authority: WO
Inventors: 威诺斯; 彭勇飞; 杨上德
Original assignee: 华为技术有限公司
Priority date: 2012-05-02
Filing date: 2012-10-22
Publication date: 2013-11-07
Also published as: US20150058295A1; CN102750317A; CN102750317B

Abstract

本发明公开了一种数据持久化处理方法、装置及数据库系统，方法包括：在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；在检查点队列中确定活动组和当前组，并在预设的检查点发生时机，将活动组包括的各页标识对应的脏页依次转存到磁盘；检查点队列中与当前准备转存到磁盘的多个脏页分别对应的页标识，组成活动组；加入所述检查点队列的新的脏页插入的组为当前组；如果完成活动组相关的脏页转存，则在所述检查点队列中确定下一活动组，并在检查点发生时机，将下一活动组包括的各页标识对应的脏页依次转存到磁盘。本发明在脏页转存对正常事务操作产生较小影响的基础上，提高了脏页转存的效率。

Description

数据持久化处理方法、装置及数据库系统

技术领域本发明涉及计算机技术领域，特别是涉及一种数据持久化处理方法、装置及数据库系统。

背景技术

内存相对于磁盘能够提供较高的吞吐量和快速响应，数据库系统通常将某些数据如读写较为繁瑣的数据优先存放到内存中，以提高数据读写速度，实现高速緩存。数据库系统通常是以页作为高速緩存的单位，当进程修改了高速緩存里的数据时，该页就被内核标记为脏页（Dirty Page ) , 数据库系统将会在合适的时间把脏页的数据写到磁盘中去，以保持高速緩存中的数据和磁盘中的数据是一致的。

检查点（Checkpoint ) 机制是使数据库能够在发生故障之后进行恢复的机制。传统的检查点机制也称为全量检查点机制，是一次性将检查点队列中的所有脏页转存到磁盘中。在使用该检查点机制进行数据持久化处理时，为保证内存与磁盘数据的一致性，需要在整个数据持久化处理期间锁定整个检查点队列，也就是说，用户的正常事务操作将被阻止比较长的一段时间。

为了克服传统的全量检查点机制影响正常事务执行的弊端，名为 "模糊检查点" 的机制被提了出来。模糊检查点机制旨在将产生的脏页逐步刷到磁盘中，以此减少了因数据持久化处理对用户正常事务操作造成的影响，但是具体如何实现，现有技术尚缺少存少有效的解决方案。发明内容本发明实施例提供一种数据持久化处理方法、装置及数据库系统，用以在一定程度上提高脏页转存的效率。

一方面，本发明实施例提供了一种数据持久化处理方法，包括：在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；

在所述检查点队列中确定活动组和当前组；所述检查点队列中与当前准备转存到磁盘的多个脏页分别对应的页标识，组成所述活动组；所述检查点队列中新加入的脏页所插入的组为所述当前组；

在预设的检查点发生时机，将所述活动组包括的各页标识对应的脏页依次转存到磁盘的数据文件；

如果完成所述活动组相关的脏页转存，则在所述检查点队列中确定下一所述活动组，并在所述检查点发生时机，将下一所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。

另一方面，本发明实施例还提供了一种数据持久化处理装置，包括：检查点队列维护单元，用于在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；

分组处理单元，用于在所述检查点队列中确定活动组和当前组；所述检查点队列中与当前准备转存到磁盘的多个脏页分别对应的页标识，组成所述活动组；所述检查点队列中新加入的脏页所插入的组为所述当前组；脏页批量转存单元，用于在预设的检查点发生时机，将所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件；

所述分组处理单元，还用于如果完成所述活动组相关的脏页转存，则在所述检查点队列中确定下一所述活动组；

所述脏页批量转存单元，还用于在所述检查点发生时机，将下一所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。

再一方面，本发明实施例还提供了一种数据库系统，包括：磁盘文件、内存数据库以及数据库管理系统，所述数据库管理系统用于管理所述内存数据库中存储的数据，所述数据库管理系统包括上述的数据持久化处理装置，所述数据持久化处理装置用于将内存数据库中存储的数据转存到所述磁盘文件中。

本发明实施例提供的数据持久化处理方法和装置及数据库系统，动态维护一检查点队列，将检查点队列中与当前准备转存到磁盘的多个脏页对应的页标识作为活动组，检查点队列新加入的脏页所插入的组为当前组，每一检查点发生时机，将一活动组包括的各页标识对应的脏页依次转存到磁盘的数据库中，完成一活动组包括的各页标识对应的脏页的转存之后，在检查点队列中确定下一活动组，以在下一检查点发生时机，将该下一活动组包括的各页标识对应的脏页依次转存到磁盘的数据文件。如此循环处理，实现了按检查点发生时机分组批量向磁盘转存脏页，由此在脏页转存对正常事务操作产生较小影响的基础上，提高了脏页转存的效率。

附图说明

实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例提供的一种数据持久化处理方法流程图；图 2a为本发明实施例提供的检查点队列分组示例一；

图 2b为本发明实施例提供的向检测点队列加入页标识的示例；图 2c为本发明实施例提供的检查点队列分组示例二；

图 2d为本发明实施例提供的检查点队列分组示例三；

图 3为本发明实施例提供的检查点队列各页标识、原子操作以及日志緩冲区地址之间的对应关系示例；

图 4为本发明实施例提供的一种数据持久化处理装置的结构示意图；图 5 为本发明实施例提供的另一种数据持久化处理装置的结构示意图；

图 6为本发明实施例提供的一种数据库系统的结构示意图。

具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明实施例提供的一种数据持久化处理方法流程图。如图 1 所示，本实施例提供的数据持久化处理方法包括：

1 1 : 在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列。

数据库系统中动态维护一检查点队列，该检查点队列用于緩存数据库系统内存产生的各脏页对应的页标识。在数据库系统内存每次产生脏页时，可将产生的各脏页以时间先后顺序，依次将相应脏页的页标识加入检查点队列。如果检查点队列包括的任一页标识对应的脏页的数据，由内存转存到磁盘的数据文件之后，该脏页的页标识在检查点队列中自动删除。

12:在所述检查点队列中确定活动组（ Active Group )和当前组（ Current Group ) , 并在预设的检查点发生时机，将所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件；所述检查点队列中与当前准备转存到磁盘的多个脏页分别对应的页标识，组成所述活动组；所述检查点队列中新加入的脏页所插入的组为所述当前组。

可对检查点队列包括的各页标识进行分组，以便实现脏页的批量分组转存。例如：可将检查点队列中与当前需要转存到磁盘的各脏页分别对应的各页标识，组成活动组；检查点队列中新加入的脏页所插入的组为当前组。在一种可选的实现方式中，可为活动组包括的各页标识打一活动组标识；如此处理之后，检查点队列包括的各页标识分为两类，一类是打上活动组标识的页标识，即活动组包括的各页标识，这些页标识对应的脏页为当前需要从内存转存到磁盘的脏页；另一类为没有打上活动组标识的页标识，即检查点队列除了活动组包括的各页标识之外的其他各页标识，均没有打上活动组标识。活动组确定完成之后，检查点队列中当前组可选示例如图 2a所示。此时，如果数据库系统中产生有新的脏页，则将新产生的脏页按时间顺序依次加入检查点序列，并且新加入的页标识所插入的组为当前组，可选示例如图 2b所示。图 2a和图 2b是将检查点队列中最先加入的四个页标识作为活动组，该活动组的确定方式仅为一个示例性说明，不应理解为对本发明技术实质的限制。在确定当前的活动组之后，可在检查点发生时机，将活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。其中，检查点发生时机可预先确定，例如：可从原子操作角度确定所述检查点的发生时机，以降低检查点机制对正常事务操作的影响。

当任一页标识对应的脏页转存到磁盘的数据文件之后，检查点队列中可自动删除该页标识，即相当于在活动组中自动删除该页标识。

13 : 如果完成所述活动组相关的脏页转存，则在所述检查点队列中确定下一所述活动组，并在所述检查点发生时机，将下一所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。

在活动组包括的各页标识对应的脏页都转存到磁盘的数据文件之后，可在检查点队列中确定下一活动组，即相当于在检查点队列剩余的页标识中重新分组，其示例如图 2c 所示，虚线部分为检查点队列中已删除的上一活动组包括的各页标识。

如果检查点队列剩余的页标识数量，小于一个活动组预设的需包括的预设页标识数量，则可将检查点队列剩余的各页标识全部划分为活动组。例如图 2d所示，活动组预设的需包括 4个页标识，而检查点队列尚未完成转存的脏页的页标识的数量为 1 个，表示为 P9 , 该情形下，可直接将

P9作为一新活动组包括的页标识。

在下一活动组确定之后，可在新的检查点发生时机，将该活动组包括的各页标识对应的脏页转存到磁盘的数据文件中；并将在分组之后内存产生的新的脏页的页标识，加入当前组中，具体实现方式与 12相似，在此不再赘述。

如果检查点队列剩余的页标识数量为 0 , 即检查点队列为空，则不执行上述 12和 13 , 待检查点队列新加入有页标识且新的检查点发生时机到来时，重复执行上述 12和 13。

本实施例提供的数据持久化处理方法动态维护一检查点队列，将检查点队列中与当前准备转存到磁盘的多个脏页对应的页标识作为活动组，检查点队列新加入的脏页所插入的组为当前组，每一检查点发生时机，将一活动组包括的各页标识对应的脏页依次转存到磁盘的数据库中，完成一活动组包括的各页标识对应的脏页的转存之后，在检查点队列中确定下一活动组，以在下一检查点发生时机，将该下一活动组包括的各页标识对应的脏页依次转存到磁盘的数据文件。如此循环处理，实现了按检查点发生时机分组批量向磁盘转存脏页，由此在脏页转存对正常事务操作产生较小影响的基础上，提高了脏页转存的效率。

在上述技术方案的基础上，可选的，如果确定需要对所述检查点队列包括的任一页标识对应的脏页进行修改，则判断该页标识是否属于所述活动组；如果是，则在将该页标识对应的脏页转存到磁盘的数据文件之前，创建该页标识对应的脏页的镜像页；否则，不创建该页标识对应的脏页的镜像页。在完成该页标识对应的脏页的镜像页的创建之后，如果轮到该页标识对应的脏页的转存操作，则将该页标识对应的镜像页转存到磁盘的数据文件中。如此处理由于无需为检查点队列中每一页标识对应的脏页创建镜像页，而仅为活动组中确定需要修改的页标识创建相应的镜像页，因此减少了创建镜页所需的内存空间，保证了内存和磁盘的数据一致性。

在上述技术方案的基础上，可选的，一原子操作可涉及多个脏页，一活动组可能包括多个原子操作涉及的脏页。在将该活动组包括的各页标识对应的脏页转存到磁盘的数据文件之前，可将该活动组关联的各原子操作在内存的日志緩冲区中緩存的日志，转存到磁盘的日志文件中；例如：确定与当前的所述活动组包括的各页标识关联的原子操作；在所述数据库内存的日志緩冲区中，获取与确定的原子操作关联的各日志緩冲区地址；将获取的各日志緩冲区地址緩存的日志转存到所述磁盘的日志文件。在完成相应日志的转存之后，再将该活动组包括的各页标识对应的脏页转存到磁盘的数据文件。

下面以图 3为例进行说明。如图 3所示的示例中， P表示页标识， A 表示原子操作；检测点队列当前的活动组包括的页标识为 P1-P6, 其中： Pl、 P2和 P14为原子操作 A1涉及的各脏页的页标识， P1和 P2属于活动组， P14属于非活动组； PI 、 P2和 P14对应的脏页的最新数据緩存在内存的日志緩冲区与原子操作 A1相应的緩冲区地址内。该场景在检查点发生时机如数据库系统内存当前没有正在运行的原子操作，可获取与原子操作 A1关联的各日志緩冲区地址，将获取的各日志緩冲区地址緩存的日志，即 PI、 P2和 P14相应的日志转存到磁盘的日志文件；之后，在依次将 P1 和 P2对应的脏页转存到磁盘的数据文件。活动组包括的各页标识 P1-P6 各自对应的脏页都转存到磁盘的数据文件之后，在检查点队列剩余的页标识中重新确定下一活动组 , 并在下一检查点发生时机到来时执行上述相似的操作，如此处理有利于在基于磁盘进行数据库系统进行故障恢复时，保证恢复数据的正确性。

不妨再以图 3为例进行说明。例如：原子操作 A1涉及的页标识为 Pl、 P2和 P14的脏页。设原子操作 A1为：将用户帐号 U1转帐 100元到用户帐号 U2, 其中 P1 和 P2对应的脏页对应该原子操作中从用户帐号 U1 扣款 100元的操作， P14对应的脏页对应该原子操作中从用户帐号 U2增加 100元的操作。日志緩冲区记录了用户账号 U1和 U2的余额，如 P1对应的用户账号 U1的余额为 100而用户账号 U2的余额为 0, P2对应的用户账号 U1 的余额为 0而用户账号 U2的余额为 0, P14对应的用户账号 U1的余额为 0而用户账号 U2的余额为 100。如果数据库系统在将 P1和 P2对应的脏页转存到磁盘的数据文件之后发生故障，该情形下基于磁盘存储的信息对需要对发生故障的数据库系统进行恢复时，可根据磁盘的数据文件中 P1和 P2的数据恢复数据库系统中原子操作 A1涉及的相应数据，此时恢复的数据显示：用户账号 U1的余额为 0而用户账号 U2的余额为 0。之后在基于磁盘的日志文件中原子操作 A1涉及的各日志，对数据库系统中恢复的原子操作 A1 涉及的相应数据进行更新，如磁盘的日志文件中存储的与 P14对应的日志，即用户账号 U1的余额为 0而用户账号 U2的余额为 100, 将上述恢复数据中用户账号 U2的余额更新为 100, 由此在基于磁盘进行数据库系统进行故障恢复时，保证了恢复数据的正确性。

进一步可选的，可在活动组的脏页转存操作完成、且确定下一所述活动组之后，获取下一所述活动组包括的各页标识关联的各原子操作的日志文件起始点；任一原子操作的日志文件起始点用于指示：所述任一原子操作开始运行时产生的日志，在所述日志文件中的保存位置；所述日志文件包括的各日志按时间先后顺序保存。设置获取的各原子操作的日志文件起始点的最小值，为当前的数据库恢复点；所述数据库恢复点用于指示：如果所述数据库系统在完成将下一所述活动组包括的各页标识对应的脏页转存到所述磁盘之前发生故障，对发生故障的数据库系统进行恢复时，在所述日志文件中读取恢复所需日志的起始点。如此处理可根据恢复点快速确定数据库恢复需要使用的日志，以提高数据库系统恢复的速度。例如图

3 中，在完成将当前的活动组 G1 包括的各页标识 P1-P6对应的脏页转存到磁盘之后，获取下一活动组 G2关联的各原子操作 A2、 A3和 A4的曰志文件起始点，并从获取的各日志文件起始点中取最小值，将该最小值作为当前的数据库恢复点。如果数据库系统在执行活动组 G2的脏页转存操作过程中发生故障，则当前的数据库恢复点即作为数据库系进行恢复时，在所述日志文件中读取恢复所需日志的起始点，可确定日志文件中自恢复点之后的各日志为数据库恢复需要使用的日志。

需要说明的是：对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以釆用其他顺序或者同时进行。其次，本领域普通技术人员可以知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：只读存储器（Read-Only Memory, 简称 ROM ) 、随机存取存储器（ Random Access Memory, 简称 RAM ) 、磁碟或者光盘等各种可以存储程序代码的介质。

图 4为本发明实施例提供的一种数据持久化处理装置的结构示意图。具体的，如图 4所示的数据持久化处理装置 40包括：检查点队列维护单元 41、分组处理单元 42和脏页批量转存单元 43。

检查点队列维护单元 41 可用于在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；

分组处理单元 42可用于在所述检查点队列中确定活动组和当前组；所述检查点队列中与当前准备转存到磁盘的多个脏页分别对应的页标识，组成所述活动组；所述检查点队列中新加入的脏页所插入的组为当前组；脏页批量转存单元 43 可用于在预设的检查点发生时机，将所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。

所述分组处理单元 42还可用于如果完成所述活动组相关的脏页转存，则在所述检查点队列中确定下一所述活动组。

所述脏页批量转存单元 43还可用于在所述检查点发生时机，将下一所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件。

为了保证数据库系统内存运行的原子操作的连贯性，所述检查点发生时机包括：所述数据库系统内存当前没有正在运行的原子操作。

釆用上述数据持久化处理装置，可实现脏页根据检查点发生时机分组批量向磁盘的数据文件转存脏页，由此在尽量减少检查点执行过程中对用户正常事务处理过程的影响的同时，提高脏页转存的效率。

如图 5所示，在上述技术方案的基础上，可选的，数据持久化处理装置 40还可包括：镜像页创建单元 44。镜像页创建单元 44可用于在确定所述活动组之后，如果确定需要对所述检查点队列包括的任一页标识对应的脏页进行修改，则判断所述任一页标识是否属于所述活动组；如果是，则在将所述任一页标识对应的脏页转存到所述磁盘的数据文件之前，创建所述任一页标识对应的脏页的镜像页；否则，不创建所述任一页标识对应的脏页的镜像页。由于仅对当前的活动组包括的页标识对应的脏页进行修改时，才需创建该脏页的镜像页，由此节省了存储镜像页所需的存储空间。所述脏页批量转存单元 43在需要对任一页标识对应的脏页进行从内存到磁盘的转存处理时，如果该页标识创建有镜像页，则将该页标识对应的镜像页，从内存转存到磁盘的数据文件中。

在上述技术方案的基础上，可选的，数据持久化处理装置 40还可包括：日志文件转存处理单元 45。日志文件转存处理单元 45用于确定与所述活动组包括的各页标识关联的原子操作；在所述数据库内存的日志緩冲区中，获取与确定的原子操作关联的各日志緩冲区地址；将获取的各日志緩冲区地址緩存的日志转存到所述磁盘的日志文件。如此处理，有利于在基于磁盘进行数据库系统进行故障恢复时，保证恢复数据的正确性。

进一步可选的，数据持久化处理装置 40还可包括：数据库恢复点设置模块 46。数据库恢复点设置模块 46可用于获取下一所述活动组包括的各页标识关联的各原子操作的日志文件起始点；任一原子操作的日志文件起始点用于指示：所述任一原子操作开始运行时产生的日志，在所述日志文件中的保存位置；所述日志文件包括的各日志按时间先后顺序保存；设置获取的各原子操作的日志文件起始点的最小值，为当前的数据库恢复点；所述数据库恢复点用于指示：如果所述数据库系统在完成将下一所述活动组包括的各页标识对应的脏页转存到所述磁盘之前发生故障，对发生故障的数据库系统进行恢复时，在所述日志文件中读取恢复所需日志的起始点。如此处理，可根据恢复点快速确定数据库恢复需要使用的日志，以提高数据库系统恢复的速度。

本发明实施例提供的数据持久化处理装置，用于实现本发明实施例提供的数据持久化处理方法，其工作机理可参见本发明上述方法实施例的相应记载，在此不再赘述。

如图 6所示，本发明实施例还提供了一种数据库系统，包括磁盘文件 53、内存数据库 52以及数据库管理系统 51。数据库管理系统 51用于管理内存数据库 52中存储的数据，该数据库管理系统 51包括上述任一数据持久化处理装置 40 ,该数据持久化处理装置 40用于将内存数据库 52中存储的数据转存到磁盘文件 53 (即在磁盘上存储的数据文件）中，由此实现了按检查点发生时机分组批量向磁盘转存脏页，在脏页转存对正常事务操作产生较小影响的基础上，提高了脏页转存的效率。其中，数据持久化处理装置 40 的具体模块划分和功能方法流程可以参照前述实施例，在此不再赘述。

本发明方案可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序单元。一般地，程序单元包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明方案，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序单元可以位于包括存储设备在内的本地和远程计算机存储介质中。

另外，在本发明各个实施例中的各功能单元可以集成在一个单元中，也可以是各个功能单元单独物理存在，或者是两个或两个以上功能单元集成在一个单元中。上述集成的单元既可以釆用硬件的形式或釆用软件功能单元的形式实现，也可以釆用硬件加软件功能单元的形式实现。

本说明书中的各个实施例均釆用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本领域普通技术人员可以理解：实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的单元可以合并为一个单元，也可以进一步拆分成多个子模块。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备 (可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器（ ROM, Read-Only Memory )、随机存取存储器（ RAM, Random Access Memory ) 、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求书

1、一种数据持久化处理方法，其特征在于，包括：

在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；

在预设的检查点发生时机，将所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件；

2、根据权利要求 1 所述的方法，其特征在于，在确定所述活动组之后，所述方法还包括：

如果确定需要对所述检查点队列包括的任一页标识对应的脏页进行修改，则判断所述任一页标识是否属于所述活动组；如果是，则在将所述任一页标识对应的脏页转存到所述磁盘的数据文件之前，创建所述任一页标识对应的脏页的镜像页；否则，不创建所述任一页标识对应的脏页的镜像页。

3、根据权利要求 1或 2所述的方法，其特征在于，所述检查点发生时机包括：所述数据库系统内存当前没有正在运行的原子操作。

4、根据权利要求 1至 3任一项所述的方法，其特征在于，在将所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件之前，所述方法还包括：

确定与所述活动组包括的各页标识关联的原子操作；

在所述数据库内存的日志緩冲区中，获取与所述原子操作关联的各日志緩冲区地址；

将获取的各日志緩冲区地址緩存的日志转存到所述磁盘的日志文件。

5、根据权利要求 4所述的方法，其特征在于，在将当前所述活动组包括的各页标识对应的脏页依次转存到所述磁盘的数据文件、且确定下一所述活动组之后，所述方法还包括：

获取下一所述活动组包括的各页标识关联的各原子操作的日志文件起始点；任一原子操作的日志文件起始点用于指示：所述任一原子操作开始运行时产生的日志，在所述日志文件中的保存位置；所述日志文件包括的各日志按时间先后顺序保存；

设置获取的各原子操作的日志文件起始点的最小值，为数据库恢复点；所述数据库恢复点用于指示：如果所述数据库系统在完成将下一所述活动组包括的各页标识对应的脏页转存到所述磁盘之前发生故障，对发生故障的数据库系统进行恢复时，在所述日志文件中读取恢复所需日志的起始点。

6、一种数据持久化处理装置，其特征在于，包括：

检查点队列维护单元，用于在数据库系统内存每次产生脏页时，将产生的各脏页分别对应的页标识加入检查点队列；

7、根据权利要求 6所述的装置，其特征在于，所述装置还包括：镜像页创建单元，用于在确定所述活动组之后，如果确定需要对所述检查点队列包括的任一页标识对应的脏页进行修改，则判断所述任一页标识是否属于所述活动组；如果是，则在将所述任一页标识对应的脏页转存到所述磁盘的数据文件之前，创建所述任一页标识对应的脏页的镜像页；否则，不创建所述任一页标识对应的脏页的镜像页。

8、根据权利要求 6或 7所述的装置，其特征在于，所述检查点发生时机包括：所述数据库系统内存当前没有正在运行的原子操作。

9、根据权利要求 6至 8任一项所述的装置，其特征在于，所述装置还包括：

日志文件转存处理单元，用于确定与所述活动组包括的各页标识关联的原子操作；在所述数据库内存的日志緩冲区中，获取与所述原子操作关联的各日志緩冲区地址；将获取的各日志緩冲区地址緩存的日志转存到所述磁盘的日志文件。

10、根据权利要求 9所述的装置，其特征在于，所述装置还包括：数据库恢复点设置模块，用于获取下一所述活动组包括的各页标识关联的各原子操作的日志文件起始点；任一原子操作的日志文件起始点用于指示：所述任一原子操作开始运行时产生的日志，在所述日志文件中的保存位置；所述日志文件包括的各日志按时间先后顺序保存；设置获取的各原子操作的日志文件起始点的最小值，为数据库恢复点；所述数据库恢复点用于指示：如果所述数据库系统在完成将下一所述活动组包括的各页标识对应的脏页转存到所述磁盘之前发生故障，对发生故障的数据库系统进行恢复时，在所述日志文件中读取恢复所需日志的起始点。

1 1、一种数据库系统，其特征在于，包括磁盘文件、内存数据库以及数据库管理系统，所述数据库管理系统用于管理所述内存数据库中存储的数据，所述数据库管理系统包括如权利要求 6至 10任一项所述的数据持久化处理装置，所述数据持久化处理装置用于将内存数据库中存储的数据转存到所述磁盘文件中。