CN103064833A - 一种清理数据库历史数据的方法和系统 - Google Patents

一种清理数据库历史数据的方法和系统 Download PDF

Info

Publication number
CN103064833A
CN103064833A CN2011103172275A CN201110317227A CN103064833A CN 103064833 A CN103064833 A CN 103064833A CN 2011103172275 A CN2011103172275 A CN 2011103172275A CN 201110317227 A CN201110317227 A CN 201110317227A CN 103064833 A CN103064833 A CN 103064833A
Authority
CN
China
Prior art keywords
task
data
cleaning
database
data scrubbing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103172275A
Other languages
English (en)
Other versions
CN103064833B (zh
Inventor
樊振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110317227.5A priority Critical patent/CN103064833B/zh
Publication of CN103064833A publication Critical patent/CN103064833A/zh
Priority to HK13107235.5A priority patent/HK1180074A1/zh
Application granted granted Critical
Publication of CN103064833B publication Critical patent/CN103064833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种清理数据库历史数据的方法和系统,所述方法具体包括如下步骤:从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,所述数据清理任务中包括需要清理的历史数据索引信息,所述数据库被划分为至少两个子数据库,且所述至少两个子数据中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。通过上述技术方案,可以提高数据清理的效率。

Description

一种清理数据库历史数据的方法和系统
技术领域
本申请涉及数据库管理技术,尤其是涉及一种清理数据库历史数据的方法和系统。
背景技术
随着计算机及网络的技术不断发展,通过计算机处理的数据的量和业务种类也是越来越多,为了更好地提高用户感受到对数据的处理效率,以更好地实现对业务的处理,数据库就应运而生了。
但是,随着计算机业务及网络的更进一步发展,有了很多基于网络的新业务出现,如:网络购物,网络视频点播等;随着新业务的不断增加,数据库变得越来越庞大,就产生了很多技术问题,如:所述数据库中的数据库表的访问效率明显下降,导致外层应用的访问效率非常差,访问时间急剧上升,用户体验下降等。
为此,在现有技术中提出了水平拆分数据库的方案,通过所述方案,可以将一个数据库拆分成2个或2个以上的子数据库,如:按水平维度,将personalDB(Data-Base,数据库),根据用户id拆分成100个DB。拆分数据库的方案虽然在一定程度上克服了只有一个数据库的技术缺陷,如:因数据库容量特别大而导致的所述数据库中的数据库表的访问效率明显下降,导致外层应用的访问效率非常差的技术问题。
但是,在所述方案中,也存在很多技术问题,如:后期维护成本高,维护不方便等,尤其地,当需要对所述子数据库进行数据清理时,因为所述方案中都是由人工来实现,没有采用有效的机制和技术手段来自动地进行数据清理,所以本发明人发现上述现有技术方案中至少存在如下问题:
1.由于没有采用有效的机制和技术手段来自动地进行数据清理,从而导致对子数据库进行数据清理时,效率不高,容易遗漏清理任务的问题;
2.由于清理上无时间控制,所以,会经常对所述数据库中的处于工作状态的业务造成很大影响。
3.由于不针对于数据库集群,对于拆分数据库后,各子数据库自身的数据会发生变化,如果原来设定的清理条件不变,就导致对子数据库的清理工作无法进行,此时,就需要修改清理条件,给维护带来很大的难度和麻烦。
发明内容
本申请实施例提供一种清理数据库历史数据的方法和系统,用于提高数据清理的效率;
进一步,实现了异常自动恢复和个性化指定清理,解决了现有技术中清理失败时不能进行异常自动恢复清理及不能支持特殊需求的清理的问题。
本发明通过一个或多个实施例提供的一种清理数据库历史数据的方法,该方法具体包括如下步骤:
从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,该数据清理任务中包括需要清理的历史数据索引信息,该数据库被划分为至少两个子数据库,且至少两个子数据中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;
根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。
可选的,从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,具体包括:
从为数据库的子数据库建立的数据清理任务队列中,获取任务状态为未完成状态的数据清理任务;以及
根据未完成状态的数据清理任务的历史数据索引信息,成功清理子数据库中未完成状态的数据清理任务的历史数据后,将数据清理任务状态设置为清理成功状态。
可选的,未完成状态的数据清理任务中至少包括以下一种具体状态的任务,具体为:
初始状态的任务、异常中止状态的任务或清理失败状态的任务。
其中,所述初始状态的任务为,从未清理过的任务;
所述异常中止状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据的非数据性错误而造成清理过程异常中止时,设置数据清理任务状态为异常中止状态的任务;
所述清理失败状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据本身的数据性错误而导致清理失败时,设置数据清理任务状态为清理失败状态的任务。
进一步的,根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据后,还包括:更新记录在数据库表中的清理日志,该清理日志包括数据清理任务状态和清理时间。
可选的,所述获取任务状态为未完成状态的数据清理任务,具体包括:
根据如下两种未完成的数据清理任务的具体状态的优先级顺序,优先获取具体状态的排列顺序靠前的数据清理任务,并不再执行清理失败状态的任务:异常中止状态的任务、初始状态的任务。
可选的,在从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务之前,具体还包括:
确认当前时间符合限定的执行清理任务的时间。
进一步的,可以将该数据清理任务划分为至少包括如下一种任务:
查询子数据库的备数据库的历史数据索引信息,并当查询到满足限定条件的需要清理的历史数据时建立的第一种历史数据清理任务;
根据用户在子数据库的备数据库中的历史数据索引信息指定要清理的历史数据建立的第二种历史数据清理任务;
该历史数据索引信息为历史数据在备数据库的数据字典中的索引信息。
进一步的,当数据清理任务同时包括第一种历史数据清理任务和第二种历史数据清理任务时,所述获取数据清理任务,具体为:优先获取第二种历史数据清理任务。
可选的,根据所述数据清理任务,清理子数据库中需要清理的历史数据时,可以为:
根据任务队列中的历史数据索引信息,以及子数据库和其备数据库的数据字典中的数据索引信息之间的对应关系,确定历史数据在所述子数据库中的索引信息;并
根据确定的索引信息,查询并清理所述子数据库中的历史数据。
本发明通过实施例提供一种清理数据库历史数据的系统,该系统具体包括:
获取单元,用于从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,该数据清理任务中包括需要清理的历史数据索引信息,该数据库被划分为至少两个子数据库,且所述至少两个子数据中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;
清理单元,用于根据数据清理任务的历史数据索引信息,清理子数据库中需要清理的历史数据。
可选的,在获取单元之前,还可以包括:
确认单元,用于确认当前时间符合限定的执行清理任务的时间。
上述技术方案中的一个或多个技术方案,具有如下技术效果或优点之一:
1、利用任务队列,实现对数据库历史数据的清理,解决了现有技术中由于人工操作导致的效率不高,容易遗漏清理任务的问题;
2、进一步的,由于使用了数据库表来记录任务,在清理任务的各阶段,不仅根据具体情况修改了任务的状态,并且将任务清理日期及任务状态记录到数据库日志表中,所以在非数据错误的情况下清理失败时,可以自动选择上次清理过程中因非数据性错误而清理失败的任务,实现了异常自动恢复和个性化指定清理,解决了现有技术中清理失败时不能进行异常自动恢复清理及不能支持特殊需求的清理的问题。
3、因为在清理之前限定了可以执行数据清理的时间段,所以在利用任务队列来实现历史数据的清理时,用户可以根据自己的需求,对清理时间窗口作更好的控制,尽量避免在主数据库工作时间进行数据清理,从而减少了对主数据库工作状态的影响;
4、对数据清理任务中的任务进行分类,对各类任务中的每一个任务设置任务状态,且对分类的任务和任务状态设置优先级,能够提高数据清理的效率,节省时间;
5、由于是根据子数据库的备数据库中的历史数据索引信息确定历史数据在所述子数据库中的索引信息,并根据确定的索引信息,查询并清理所述子数据库中的历史数据,对子数据库只有写操作,对子数据库中正在工作的业务影响很小;
6、由于任务队列中的历史数据索引信息是历史数据在备数据库的数据字典中的索引信息,所以在拆分子数据库后,数据字典信息也自动发生改变,清理任务可以继续进行,更不需要担心因为修改业务逻辑而对维护造成困难的问题。
附图说明
图1为本申请实施例一中清理数据库历史数据的步骤流程图;
图2为本申请实施例一中delete进程清理任务过程中发生异常中止情况的流程图;
图3为本申请实施例一中delete进程清理任务过程中清理失败的流程图;
图4为本申请实施例三中delete进程执行流程图;
图5为本申请清理数据库历史数据的系统的第一实施例框架图;
图6为本申请清理数据库历史数据的系统的第二实施例框架图。
具体实施方式
本申请实施例提供一种清理数据库历史数据的方法和系统,利用任务队列,实现对数据库历史数据的清理,解决了现有技术中由于人工操作导致的效率不高,容易遗漏清理任务的问题;
进一步,实现了异常自动恢复和个性化指定清理,解决了现有技术中清理失败时不能进行异常自动恢复清理及不能支持特殊需求的清理的问题。
下面结合各个附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
请参考图1,本申请实施例一,提供一种清理数据库历史数据的方法,具体步骤如下:
步骤10,从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,该数据清理任务中包括需要清理的历史数据索引信息,该数据库被划分为至少两个子数据库,且每一个子数据库对应每一个子数据库建立的数据清理任务队列;
步骤20,根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。
本申请实施例一提供的方法中,每一个子数据库的历史数据清理工作可以用两个相互独立的进程init进程和delete进程来实现,其中:
init进程负责根据设定的数据清理条件,从数据库的子数据库中提取出需要清理的历史数据索引信息,每次同批清理的历史数据形成一个数据清理任务,并将数据清理任务初始化到为数据库的子数据库建立的数据清理任务队列中;
delete进程负责从清理任务队列中逐个获取数据清理任务,根据数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。
为保证数据清理任务的延续,本申请实施例中进一步将数据清理任务分为两种状态,一种是清理成功状态,另一种是未完成状态,对于在数据清理过程中,无论什么原因发生中断导致数据清理未完成时,将数据清理任务的状态设置为未完成状态,从而在下次启动数据清理后可以优先处理,以实现数据清理任务的自动恢复。因此,从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务时,根据为每一个数据清理任务设置的状态,具体操作包括:
delete进程从为数据库的子数据库建立的数据清理任务队列中,获取任务状态为未完成状态的数据清理任务;以及
根据所述未完成的数据清理任务的历史数据索引信息,成功清理子数据库中所述未完成状态的数据清理任务的历史数据后,将数据清理任务状态设置为清理成功状态(success)。
由于未完成状态的数据清理任务可能不同原因导致的,例如初始未执行过的任务、执行过程中异常中止的任务,以及最终无法完成的任务等,本申请实施例中再进一步将未完成的数据清理任务分为如下三种具体状态:
初始状态的任务(init)、异常中止状态的任务(updating)和清理失败状态的任务(fail)。
其中,初始状态的任务为,利用init进程将产生的任务初始化到数据清理任务队列中从未清理过的任务;
异常中止状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据的非数据性错误而造成清理过程异常中止时,设置数据清理任务状态为异常中止状态的任务;
清理失败状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据本身的数据性错误而导致清理失败时,设置数据清理任务状态为清理失败状态的任务。
如图2所示,为delete进程清理任务中发生程序异常中止的流程示意图,例如,delete进程启动时,选择数据清理任务中一个未完成状态的任务进行清理,当任务正在执行时,处理过程中若发生系统异常,如断电,down机,网络异常等因非数据型错误而导致程序异常中止,将该任务的未完成状态设置成updating状态,且updating状态是该任务的最终状态。
如图3所示,为delete进程清理任务过程中清理失败的流程图,例如,delete进程启动时,选择数据清理任务中一个未完成状态的任务进行清理,如果因为数据本身的原因而导致处理失败,将该任务的未完成状态设置成fail状态,由于fail状态的数据清理任务可能永远无法成功执行,因此也可以是在尝试设定次数,例如三次或四次后再将任务的未完成状态设置成fal状态。
本申请实施例中,可以将设置的数据清理任务状态和清理时间记录到数据库日志表中。例如,将任务状态为updating状态以及清理时间为2011-07-2310:38:49,fail状态以及清理时间为2011-07-23 10:38:50记录到数据库日志表中,在下次清理开始时,重新获取记录在数据库日志表中的任务进行清理。
综上实施例一所述的多种方法,由于使用了数据库表来记录任务,在清理任务的各阶段,不仅根据具体情况修改了任务的状态,并且将任务清理日期及任务状态记录到数据库日志表中,所以在非数据错误的情况下清理失败时,在下次delete进程启动时,可以自动选择上次清理过程中因非数据性错误而清理失败的任务,自动恢复清理。
本申请实施例二,为了能够更好的控制清理的时间,减少对工作时间的影响,可以为数据清理任务设定特定的执行时间,例如夜间。因此从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务之前,具体还包括:确认当前时间符合限定的执行清理任务的时间,该限定的执行清理任务的时间可以是系统默认的清理时间,也可以是根据用户自己实际清理需要而设置的清理时间。例如,当前时间为2011-07-28 22:35,用户限定的清理时间为2011-07-2822:30到2011-07-28 23:00,可以看出当前时间在限定的清理时间范围内,那么就可以从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,并根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。
从本发明实施例二提供的方法可以知道,因为在清理之前确认了当前时间是否符合了限定的执行清理任务的时间,所以在利用任务队列来实现历史数据的清理时,用户可以根据自己的需求,对清理时间窗口作更好的控制。
本申请实施例三,根据前述三种状态,为进一步提高历史数据的清理效率,按照三种状态的如下排序,优先获取状态排序在前的任务:异常中止状态和初始状态,不再处理fail状态的任务,从而优先恢复处理异常中止的任务。
例如,当数据清理任务中有异常中止状态的任务(updating)和初始状态的任务(init)时,delete进程优先获取具体状态为异常中止状态的任务(updating)进行清理,直到清理完成所有具体状态为异常中止状态(updating)的任务,再获取具体状态为初始状态(init)的任务进行清理,对于已经设定为清理失败状态(fail)的任务,不再进行清理。
如图4所示,为实施例三中delete进程执行流程图,直到获取的任务都清理完成或者当前时间不符合限定的执行清理任务的时间,那么delete进程才结束。
由本申请实施例三可以看出,对未完成状态的任务又划分为三种
状态的任务并对这三种状态的任务设置优先级,可以提高数据清理的工作效率,具体理由如下:
异常中止状态的任务是在上一次清理过程中由于系统异常,如断电等情况导致任务清理失败,所以在delete进程再次启动时,优先去获取该状态的任务并重新清理,这样不会遗漏掉上次没有清理成功的任务;
而清理失败的任务是在上一次清理过程中由于数据本身的原因而导致任务清理失败,可以知道该状态的任务很难清理成功,所以最后选择该状态的任务进行清理,以免浪费时间清理却没有清理成功。
而为了能够使数据清理任务的设定更加多元化,本申请实施例四将数据清理任务还可以包括根据设定条件自动生成的任务,和指定的任务,一般可以对这两种类型的任务设定优先级,例如优先处理指定任务等,具体的:
查询子数据库的备数据库的历史数据索引信息,并当查询到满足限定条件的需要清理的历史数据时建立的第一种历史数据清理任务;
根据用户在子数据库的备数据库中的历史数据索引信息指定要清理的历史数据建立的第二种历史数据清理任务;
该历史数据索引信息为历史数据在备数据库的数据字典中的索引信息;
其中,当数据清理任务同时包括第一种历史数据清理任务和第二种历史数据清理任务时,优先获取第二种历史数据清理任务。
为减少对主数据库的访问,可以利用备数据库生成数据清理任务,这样在根据获得的数据清理任务,清理子数据库中需要清理的历史数据时,是首先根据任务队列中的历史数据索引信息,以及子数据库和其备数据库的数据字典中的数据索引信息之间的对应关系,确定历史数据在所述子数据库中的索引信息;并根据确定的索引信息,查询并清理所述子数据库中的历史数据。
在实际应用中,综上所述的一个或多个实施例还可以得到以下有益技术效果:
由于是根据子数据库的备数据库中的历史数据索引信息确定历史数据在子数据库中的索引信息,并根据确定的索引信息,查询并清理子数据库中的历史数据,对子数据库只有写操作,对子数据库中正在工作的业务影响很小;
由于任务队列中的历史数据索引信息是历史数据在备数据库的数据字典中的索引信息,所以在拆分子数据库后,数据字典信息也自动发生改变,清理任务可以继续进行,进而不需要担心因为修改业务逻辑而对维护造成困难的问题。所述历史数据索引信息可以通过很多种形式来呈现,如:表,纯文字等。例如,如原子数据库A中包含了TEST_00,TEST01...TEST_19共20份表,则子数据库A的备数据库A'的数据字典中保存了以下信息:
TEST_00
TEST_01
......
TEST_19
将子数据库A拆分为2个子数据库:A1和A2,则备数据库A1的数据字典中包含:
TEST_00
TEST_01
……
TEST_09
备数据库A2的数据字典中包含:
TEST_10
TEST_11
……
TEST_19,
其对应关系并不会因为拆分而导致数据字典信息发生改变,所以不需要修改业务逻辑,不会影响后期维护;
因为使用了数据库表来记录任务,清理任务从数据字典中收集,所以可以用户指定清理,可以执行任意需求的清理工作,灵活性上得到更大的提升。
例如,默认需要清理实施例四中子数据库A2库中的:
TEST_00
TEST_01
......
TEST_09
共9个库默认一年前的数据,当用户需要清理TEST_02库最近2011年6,7月的数据时,可以手工的插入两条记录:
TEST_02  2011-06
TEST_02  2011-07
这两个月的数据即可进行清理。
如图5所示,为本发明清理数据库历史数据的第一实施例系统框架图,本申请提供一种清理数据库历史数据的系统,具体包括:
获取单元501,用于从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,所述数据清理任务中包括需要清理的历史数据索引信息,所述数据库被划分为至少两个子数据库,且所述至少两个子数据中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;
清理单元502,用于根据所述数据清理任务的历史数据索引信息,清理子数据库中需要清理的历史数据。
如图6所示,为本发明清理数据库历史数据的第二实施例系统框架图,本基于第一实施例的清理数据库历史数据的系统,为了能够更好的控制清理时间,在获取单元502之前,还可以包括:
确认单元601,用于确认当前时间符合限定的执行清理任务的时间。
本发明所设计的方法,可以使用任何计算机语言实现,且对于软件与硬件没有特殊要求。尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (13)

1.一种清理数据库历史数据的方法,其特征在于,包括如下步骤:
从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,所述数据清理任务中包括需要清理的历史数据索引信息,所述数据库被划分为至少两个子数据库,且所述至少两个子数据库中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;
根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据。
2.如权利要求1所述的方法,其特征在于,所述从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,具体包括:
从为数据库的子数据库建立的数据清理任务队列中,获取任务状态为未完成状态的数据清理任务;以及
根据所述未完成的数据清理任务的历史数据索引信息,成功清理子数据库中所述未完成状态的数据清理任务的历史数据后,将数据清理任务状态设置为清理成功状态。
3.如权利要求2所述的方法,其特征在于,所述未完成的数据清理任务中至少包括以下一种具体状态的任务,具体为:
初始状态的任务、异常中止状态的任务或清理失败状态的任务。
4.如权利要求3所述的方法,其特征在于,所述初始状态的任务为,从未清理过的任务;
所述异常中止状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据的非数据性错误而造成清理过程异常中止时,设置数据清理任务状态为异常中止状态的任务;
所述清理失败状态的任务为,上一次清理所述未完成状态的数据清理任务过程中,由于其历史数据本身的数据性错误而导致清理失败时,设置数据清理任务状态为清理失败状态的任务。
5.如权利要求2~4任一所述的方法,其特征在于,根据获取的数据清理任务中的历史数据索引信息,清理子数据库中需要清理的历史数据后,还包括:更新记录在数据库表中的清理日志,所述清理日志包括数据清理任务状态和清理时间。
6.如权利要求3所述的方法,其特征在于,所述获取任务状态为未完成状态的数据清理任务,具体包括:
根据如下两种未完成的数据清理任务的具体状态的优先级顺序,优先获取具体状态的排列顺序靠前的数据清理任务,并不再执行清理失败状态的任务:异常中止状态的任务、初始状态的任务。
7.如权利要求1~4或6任一所述的方法,其特征在于,所述从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务之前,具体还包括:
确认当前时间符合限定的执行清理任务的时间。
8.如权利要求1~4或6任一所述的方法,其特征在于,所述数据清理任务至少包括如下一种:
查询子数据库的备数据库的历史数据索引信息,并当查询到满足限定条件的需要清理的历史数据时建立的第一种历史数据清理任务;
根据用户在子数据库的备数据库中的历史数据索引信息指定要清理的历史数据建立的第二种历史数据清理任务;
所述历史数据索引信息为历史数据在备数据库的数据字典中的索引信息。
9.如权利要求8所述的方法,其特征在于,当数据清理任务同时包括第一种历史数据清理任务和第二种历史数据清理任务时,所述获取数据清理任务,具体为:优先获取第二种历史数据清理任务。
10.如权利要求8所述的方法,其特征在于,所述根据所述数据清理任务,清理子数据库中需要清理的历史数据,具体为:
根据任务队列中的历史数据索引信息,以及子数据库和其备数据库的数据字典中的数据索引信息之间的对应关系,确定历史数据在所述子数据库中的索引信息;并
根据确定的索引信息,查询并清理所述子数据库中的历史数据。
11.一种清理数据库历史数据的系统,其特征在于,包括:
获取单元,用于从为数据库的子数据库建立的数据清理任务队列中,获取数据清理任务,所述数据清理任务中包括需要清理的历史数据索引信息,所述数据库被划分为至少两个子数据库,且所述至少两个子数据库中的每一个子数据库对应每一个子数据库建立的数据清理任务队列;
清理单元,用于根据所述数据清理任务的历史数据索引信息,清理子数据库中需要清理的历史数据。
12.如权利要求11所述的系统,其特征在于,所述获取单元,具体用于从为数据库的子数据库建立的数据清理任务队列中,获取任务状态为未完成状态的数据清理任务;以及根据所述未完成的数据清理任务的历史数据索引信息,成功清理子数据库中所述未完成状态的数据清理任务的历史数据后,将数据清理任务状态设置为清理成功状态。
13.如权利要求12所述的系统,其特征在于,所述未完成的数据清理任务中至少包括以下一种具体状态的任务:初始状态的任务、异常中止状态的任务或清理失败状态的任务。
CN201110317227.5A 2011-10-18 2011-10-18 一种清理数据库历史数据的方法和系统 Active CN103064833B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110317227.5A CN103064833B (zh) 2011-10-18 2011-10-18 一种清理数据库历史数据的方法和系统
HK13107235.5A HK1180074A1 (zh) 2011-10-18 2013-06-21 種清理數據庫歷史數據的方法和系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110317227.5A CN103064833B (zh) 2011-10-18 2011-10-18 一种清理数据库历史数据的方法和系统

Publications (2)

Publication Number Publication Date
CN103064833A true CN103064833A (zh) 2013-04-24
CN103064833B CN103064833B (zh) 2016-03-16

Family

ID=48107463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110317227.5A Active CN103064833B (zh) 2011-10-18 2011-10-18 一种清理数据库历史数据的方法和系统

Country Status (2)

Country Link
CN (1) CN103064833B (zh)
HK (1) HK1180074A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793530A (zh) * 2014-02-26 2014-05-14 北京京东尚科信息技术有限公司 一种定期清理业务数据的方法、装置和系统
CN103870549A (zh) * 2014-02-27 2014-06-18 中国石油天然气股份有限公司 石油地质软件数据的清理方法及装置
CN105760487A (zh) * 2016-02-17 2016-07-13 中国工商银行股份有限公司 历史数据清理方法及装置
CN107066463A (zh) * 2016-10-28 2017-08-18 阿里巴巴集团控股有限公司 数据处理方法、装置和服务器
CN107291804A (zh) * 2017-05-15 2017-10-24 努比亚技术有限公司 数据清理的方法、设备及计算机可读存储介质
CN108573036A (zh) * 2018-04-02 2018-09-25 携程旅游网络技术(上海)有限公司 历史数据的清理方法及其系统、存储介质、电子设备
US11475408B2 (en) * 2020-05-01 2022-10-18 Monday.com Ltd. Digital processing systems and methods for automation troubleshooting tool in collaborative work systems
US11507738B2 (en) 2019-11-18 2022-11-22 Monday.Com Digital processing systems and methods for automatic updates in collaborative work systems
US11531452B2 (en) 2021-01-14 2022-12-20 Monday.com Ltd. Digital processing systems and methods for group-based document edit tracking in collaborative work systems
US11698890B2 (en) 2018-07-04 2023-07-11 Monday.com Ltd. System and method for generating a column-oriented data structure repository for columns of single data types
US11741071B1 (en) 2022-12-28 2023-08-29 Monday.com Ltd. Digital processing systems and methods for navigating and viewing displayed content
US11829953B1 (en) 2020-05-01 2023-11-28 Monday.com Ltd. Digital processing systems and methods for managing sprints using linked electronic boards
US11886683B1 (en) 2022-12-30 2024-01-30 Monday.com Ltd Digital processing systems and methods for presenting board graphics
US11893381B1 (en) 2023-02-21 2024-02-06 Monday.com Ltd Digital processing systems and methods for reducing file bundle sizes
US12014138B2 (en) 2020-01-15 2024-06-18 Monday.com Ltd. Digital processing systems and methods for graphical dynamic table gauges in collaborative work systems
US12020210B2 (en) 2020-02-12 2024-06-25 Monday.com Ltd. Digital processing systems and methods for table information displayed in and accessible via calendar in collaborative work systems

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725186A (zh) * 2004-07-23 2006-01-25 中兴通讯股份有限公司 一种多数据库数据同步方法
US20060106895A1 (en) * 2004-11-12 2006-05-18 Microsoft Corporation Method and subsystem for performing metadata cleanup for replication topologies
CN101122920A (zh) * 2007-09-18 2008-02-13 中兴通讯股份有限公司 一种数据库空间自动管理的方法及系统
CN101261693A (zh) * 2007-03-09 2008-09-10 上海宝信软件股份有限公司 一种计算机应用系统中的数据归档方法
CN101546403A (zh) * 2008-03-27 2009-09-30 天津德智科技有限公司 一种在线服务系统和一种提供在线服务的方法
CN101661470A (zh) * 2008-08-25 2010-03-03 中兴通讯股份有限公司 一种历史数据管理系统与方法
CN102024005A (zh) * 2009-09-22 2011-04-20 时文 信息项目集合目录的发布系统和方法
CN102117320A (zh) * 2011-01-11 2011-07-06 百度在线网络技术(北京)有限公司 一种结构化数据搜索的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725186A (zh) * 2004-07-23 2006-01-25 中兴通讯股份有限公司 一种多数据库数据同步方法
US20060106895A1 (en) * 2004-11-12 2006-05-18 Microsoft Corporation Method and subsystem for performing metadata cleanup for replication topologies
CN101261693A (zh) * 2007-03-09 2008-09-10 上海宝信软件股份有限公司 一种计算机应用系统中的数据归档方法
CN101122920A (zh) * 2007-09-18 2008-02-13 中兴通讯股份有限公司 一种数据库空间自动管理的方法及系统
CN101546403A (zh) * 2008-03-27 2009-09-30 天津德智科技有限公司 一种在线服务系统和一种提供在线服务的方法
CN101661470A (zh) * 2008-08-25 2010-03-03 中兴通讯股份有限公司 一种历史数据管理系统与方法
CN102024005A (zh) * 2009-09-22 2011-04-20 时文 信息项目集合目录的发布系统和方法
CN102117320A (zh) * 2011-01-11 2011-07-06 百度在线网络技术(北京)有限公司 一种结构化数据搜索的方法和装置

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793530A (zh) * 2014-02-26 2014-05-14 北京京东尚科信息技术有限公司 一种定期清理业务数据的方法、装置和系统
CN103870549A (zh) * 2014-02-27 2014-06-18 中国石油天然气股份有限公司 石油地质软件数据的清理方法及装置
CN105760487B (zh) * 2016-02-17 2019-11-08 中国工商银行股份有限公司 历史数据清理方法及装置
CN105760487A (zh) * 2016-02-17 2016-07-13 中国工商银行股份有限公司 历史数据清理方法及装置
CN107066463A (zh) * 2016-10-28 2017-08-18 阿里巴巴集团控股有限公司 数据处理方法、装置和服务器
CN107291804A (zh) * 2017-05-15 2017-10-24 努比亚技术有限公司 数据清理的方法、设备及计算机可读存储介质
CN108573036A (zh) * 2018-04-02 2018-09-25 携程旅游网络技术(上海)有限公司 历史数据的清理方法及其系统、存储介质、电子设备
US11698890B2 (en) 2018-07-04 2023-07-11 Monday.com Ltd. System and method for generating a column-oriented data structure repository for columns of single data types
US11507738B2 (en) 2019-11-18 2022-11-22 Monday.Com Digital processing systems and methods for automatic updates in collaborative work systems
US11526661B2 (en) 2019-11-18 2022-12-13 Monday.com Ltd. Digital processing systems and methods for integrated communications module in tables of collaborative work systems
US11727323B2 (en) 2019-11-18 2023-08-15 Monday.Com Digital processing systems and methods for dual permission access in tables of collaborative work systems
US12014138B2 (en) 2020-01-15 2024-06-18 Monday.com Ltd. Digital processing systems and methods for graphical dynamic table gauges in collaborative work systems
US12020210B2 (en) 2020-02-12 2024-06-25 Monday.com Ltd. Digital processing systems and methods for table information displayed in and accessible via calendar in collaborative work systems
US11829953B1 (en) 2020-05-01 2023-11-28 Monday.com Ltd. Digital processing systems and methods for managing sprints using linked electronic boards
US11907653B2 (en) 2020-05-01 2024-02-20 Monday.com Ltd. Digital processing systems and methods for network map visualizations of team interactions in collaborative work systems
US11675972B2 (en) 2020-05-01 2023-06-13 Monday.com Ltd. Digital processing systems and methods for digital workflow system dispensing physical reward in collaborative work systems
US11475408B2 (en) * 2020-05-01 2022-10-18 Monday.com Ltd. Digital processing systems and methods for automation troubleshooting tool in collaborative work systems
US11687706B2 (en) 2020-05-01 2023-06-27 Monday.com Ltd. Digital processing systems and methods for automatic display of value types based on custom heading in collaborative work systems
US11537991B2 (en) 2020-05-01 2022-12-27 Monday.com Ltd. Digital processing systems and methods for pre-populating templates in a tablature system
US11501255B2 (en) 2020-05-01 2022-11-15 Monday.com Ltd. Digital processing systems and methods for virtual file-based electronic white board in collaborative work systems
US11954428B2 (en) 2020-05-01 2024-04-09 Monday.com Ltd. Digital processing systems and methods for accessing another's display via social layer interactions in collaborative work systems
US11587039B2 (en) 2020-05-01 2023-02-21 Monday.com Ltd. Digital processing systems and methods for communications triggering table entries in collaborative work systems
US11755827B2 (en) 2020-05-01 2023-09-12 Monday.com Ltd. Digital processing systems and methods for stripping data from workflows to create generic templates in collaborative work systems
US11886804B2 (en) 2020-05-01 2024-01-30 Monday.com Ltd. Digital processing systems and methods for self-configuring automation packages in collaborative work systems
US11531966B2 (en) 2020-05-01 2022-12-20 Monday.com Ltd. Digital processing systems and methods for digital sound simulation system
US11782582B2 (en) 2021-01-14 2023-10-10 Monday.com Ltd. Digital processing systems and methods for detectable codes in presentation enabling targeted feedback in collaborative work systems
US11893213B2 (en) 2021-01-14 2024-02-06 Monday.com Ltd. Digital processing systems and methods for embedded live application in-line in a word processing document in collaborative work systems
US11928315B2 (en) 2021-01-14 2024-03-12 Monday.com Ltd. Digital processing systems and methods for tagging extraction engine for generating new documents in collaborative work systems
US11726640B2 (en) 2021-01-14 2023-08-15 Monday.com Ltd. Digital processing systems and methods for granular permission system for electronic documents in collaborative work systems
US11531452B2 (en) 2021-01-14 2022-12-20 Monday.com Ltd. Digital processing systems and methods for group-based document edit tracking in collaborative work systems
US11687216B2 (en) 2021-01-14 2023-06-27 Monday.com Ltd. Digital processing systems and methods for dynamically updating documents with data from linked files in collaborative work systems
US11741071B1 (en) 2022-12-28 2023-08-29 Monday.com Ltd. Digital processing systems and methods for navigating and viewing displayed content
US11886683B1 (en) 2022-12-30 2024-01-30 Monday.com Ltd Digital processing systems and methods for presenting board graphics
US11893381B1 (en) 2023-02-21 2024-02-06 Monday.com Ltd Digital processing systems and methods for reducing file bundle sizes

Also Published As

Publication number Publication date
CN103064833B (zh) 2016-03-16
HK1180074A1 (zh) 2013-10-11

Similar Documents

Publication Publication Date Title
CN103064833B (zh) 一种清理数据库历史数据的方法和系统
CN101567013B (zh) 一种etl调度的实现方法及装置
CN107870981B (zh) 电子装置、数据表归档处理的方法及存储介质
CN108009258B (zh) 一种可在线配置的数据采集与分析平台
CN101894348B (zh) 一种自扩展的联机交易系统及其实现方法
CN108764610A (zh) 基于大数据的标准工艺工程项目施工管理方法、存储介质
CN1794181A (zh) 重定序两阶段提交中的资源的最后代理优化方法和系统
CN103744906A (zh) 一种数据同步系统、方法及装置
US9164849B2 (en) Backup jobs scheduling optimization
US20190347593A1 (en) Method for improving semiconductor back-end factories
CN103944964A (zh) 一种分布式系统及根据该系统进行逐步扩容的方法
CN114254870A (zh) 一种生产订单自动排产方法、装置、电子设备及存储介质
CN101833319A (zh) 面向多重入制造系统在线调度的单台设备匹配重调度方法
CN101556660A (zh) 生产订单排配系统及方法
CN104063374A (zh) 一种对数据进行去重的方法和设备
CN106293995B (zh) 制造执行系统的数据备份系统及方法
CN101261693B (zh) 一种计算机应用系统中的数据归档方法
CN106250501A (zh) 报表处理方法及报表系统
CN117522057A (zh) 排产方法
CN112633850A (zh) 通过管理调用及监控rpa机器人实现业务流程自动化的方法
JP5622483B2 (ja) 加工スケジューリングシステム
CN101295376A (zh) 工单批量产生系统及方法
Warnke Computer manufacturing: change and competition
CN110502370B (zh) 一种自动清理备份对象的方法
CN111752949A (zh) 业务处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1180074

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20191209

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Patentee after: Innovative advanced technology Co., Ltd

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Co., Ltd.

TR01 Transfer of patent right