CN101076801A - 数据的存档 - Google Patents

数据的存档 Download PDF

Info

Publication number
CN101076801A
CN101076801A CNA2005800425405A CN200580042540A CN101076801A CN 101076801 A CN101076801 A CN 101076801A CN A2005800425405 A CNA2005800425405 A CN A2005800425405A CN 200580042540 A CN200580042540 A CN 200580042540A CN 101076801 A CN101076801 A CN 101076801A
Authority
CN
China
Prior art keywords
database
data recording
data
time
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800425405A
Other languages
English (en)
Inventor
斯特凡·恩斯特
马库斯·舒曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UBS AG
Original Assignee
UBS AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UBS AG filed Critical UBS AG
Publication of CN101076801A publication Critical patent/CN101076801A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于管理电子数据的计算机实现方法,包括步骤:将一个数据记录写入第一数据库(50),对于至少一个预定条件,检查所述一个数据记录的未改变内容,以及根据所述至少一个预定条件的满足情况,将所述一个数据记录写入第二数据库(52)。

Description

数据的存档
背景技术
目前,许多组织和公共实体中累计有大量数据,这些数据必须结构化并系统地存储,以便稍后可以跟踪数据流中所包括过程的背景和细节,并可以使用存储的数据进行评估。以银行为例。近年来,甚至是几十年来,银行中提供的服务和价格中出现了越来越多的区别。早期的标准服务(货币账户,证券账户)及其少数变体正被数量不断增长的不同服务和价格取代。提供的财务工具的范围持续扩大,个人财务工具也更具创造性和更加复杂。
同时,对于银行想顾客提供的信息的透明度、一致性和完整性,顾客对银行的要求也越来越高。许多顾客不再满足于对其账户货币收支的简单报表说明。例如,特别是辨别力强且富有的顾客,他们使用银行的多种不同服务,因为他们通过银行以证券、财产和其他投资形式进行交易,所以要求与其任一贸易事件有关的完整、详细和快捷的信息。为自动准备顾客的财务报表,必需与关于顾客资产的所有交易有关的详细信息,无论这些交易是现金交易、证券贸易或类似其他方式。
考虑银行每天处理几千件交易,甚至是成千上万,很容易看出现代银行系统中要处理和存储的数据量是多么大。当然,不仅是银行,对于其他许多企业或管理性质的组织,情况也是如此。
为系统和有序地存储数据,使用数据库。一般而言,如果可能,则针对相关内容的数据,使用单个数据库,使该数据库足够大以包括全部所需的数据集。但是,数据库越大,想要访问数据库中可用数据的应用程序对数据库的访问就更加复杂并耗时更多。同时,通过输入新数据对数据库进行的更新同样耗时,并要求复杂的措施,以便在写操作期间数据库保持得像平常一样对于应用程序的读取访问是可用的。
因此,人们通常接受的观点是并非所有需要的数据都可以存档,存档仅限于那些被看作绝对必要的特定数据。但是,这必然减小了所存信息的详细程度。
发明内容
本发明的目的是能够以数据库形式保存信息,在数据对于应用程序高度可用的同时,不会限制其详细程度。
为实现根据本发明的目的,提供了一种用于管理电子数据的计算机实现方法,包括以下步骤:
-将一个数据记录写入第一数据库,
-对于至少一个预定条件,检查所述一个数据记录的未改变内容,以及
-根据所述至少一个预定条件的满足情况,将所述一个数据记录写入第二数据库。
根据本发明的解决方案引起对第一数据库的“清除”,这在于将其中存储的数据记录复制到另一第二数据库中不是根据第一数据库的特定占用水平,而是根据相关数据记录的内容是否满足一个或多个预定条件。这样,第一数据库中存储的数据量可以保持为相对较少。但是,因为在将数据记录稍后传送至第二数据库之前,总是将它们初始地写入第一数据库,所以在第一数据库中可以实现快速的写操作和读操作。
这种根据本发明的构思允许将第一数据库有效地用作“可变”数据库,并将第二数据库有效地用作“静态”数据库。在银行和其他组织中,应该存储在数据库中的新(最新)交易流动数据频繁出现。根据本发明,第一数据库可以用于这种新数据的初始接受。然后形成“当前”数据库,其内容在例如一个工作日之类的特定观察时间段上持续改变。通过适当地规定预定条件,可以达到两种效果:首先,可以实现第一数据库中保持的数据量显著小于第二数据库中的数据量;第二,可以实现对第二数据库的写操作并不像对第一数据库那样连续发生,而是以较大的时间间隔进行,从而在前述特定时间段中第二数据库保持不变,并因此可看作是静态的。相比于连续改变的数据库,这种静态数据库在技术上容易建立并容易操作。可以将对第二数据库的写操作限制在特定时间帧中,例如,只在夜间或周末。
由此第二数据库可以称作历史数据库。当然,这决不表示只有对于应用程序是旧数据的数据才应该存储在第二数据库中。从应用程序的角度看来,两个数据库中数据的即时性均可以是较高的。为进行完整评估,很可能应用程序必须访问来自两个数据库中的数据。但是,出于商业安全原因,明智作法是总是在第一数据库中保持银行或类似组织交易所需的“关键生存(critical survival)”数据。例如,该关键生存数据可以包括与顾客收支和近期生效的交易有关的信息。因此,术语“历史”只表示如下事实:在多种数据的存储位置历史方面,第二数据库在第一数据库之后。
因为第二数据库可以建立为静态数据库,所以可以容易地测定其大小,以使其可以接受非常大的数据量。因为第二数据库可用作较大数据集的储存库,所以对于所存信息,采用根据本发明的解决方案可以实现较高水平的详细描述。例如,可以针对投资(一般而言,商业事件)的各个中间阶段创建和保存数据记录,以表示各个阶段的商业事件状态。
显然,第一数据库可以比第二数据库小很多。例如,第一数据库的大小可以小于第二数据库大小的10%,尤其小于5%。
在根据本发明的方法中,优选地,在与第一数据库中的数据记录写入第二数据库中的时间紧密相关的时间处,删除第一数据库中的数据记录。具体地,对第一数据库中数据记录的读取(为了传送至第二数据库)和删除可以采用联合操作方式进行。当然,在数据记录写入第二数据库之后仍在特定时间内将数据记录保留在第一数据库中也不是不可能的。
在许多情况下,例如,因为在第一数据库中同时或相继保存的若干个数据记录与公共的底层商业事件相关,所以在逻辑上可以将它们链接在一起。在数据层次,这种逻辑链接可以由公共数据元素来证明,该公共数据元素包括在每个互连的数据记录中,并专有地标识数据记录参照的主题,例如,底层商业事件。根据本发明的优选改进方案,根据一个数据记录向第二数据库中的写入,逻辑上与所述一个数据记录链接的若干个数据记录可以类似地写入第二数据库中。在这种情况下,优选地,也在与第一数据库中的数据记录写入第二数据库中的时间紧密相关的时间处,删除第一数据库中的数据记录。
在优选实施例中,第一数据库中存储的数据记录中的至少一些包含其中输入有状态的状态字段。优选地,这种状态不是与数据记录本身相关,而是与数据记录所代表的主题相关。例如,该状态可以与单个交易的当前状态或可能包括若干个这种单独交易的整个商业事件的当前状态相关。验证步骤可以包括针对预定状态,检查数据记录中的这种状态字段。
类似地,根据本发明的优选实施例,第一数据库中存储的数据记录中的至少一些可以包含时间条目。可选地或除上述状态检查之外,验证步骤还可以包括检查数据记录中的时间条目是否满足预定条件。
可能发生如下情况:已复制到第二数据库的数据记录或是它们的内容稍后被证明是不正确的或无效的。现在可以通过对相关数据记录的写访问,将其改变。但是,旨在改变现有数据记录的数据库写操作相对比较复杂。因此,在优选实施例中,第二数据库中的不正确或无效数据记录至少暂时保持不变,取而代之的是在第一数据库中记录指示符,指示第二数据库中的相关数据记录是无效的。为此,向第一数据库写入对相关数据记录进行专有标识的数据记录标识符,此外,还向第一数据库写入无效性指示符,该无效性指示符与数据记录标识符相关,并将数据记录标记为无效的。在第一数据库中建立专用表是特别可行的,在该专用表中只记录第二数据库的无效数据记录。
要写入第一数据库的数据记录中的至少一些可以包含具有时间戳的时间戳字段。该时间戳可以有效地用于将实际上代表同一信息对象、但是描述该信息对象的不同版本的数据记录彼此区分。可以想象在如下情况:数据系统中代表的信息对象可以在其存在期间经历不同的阶段或状态。例如,如果将商业订单看作这种信息对象,则可以容易地标识该商业订单的生命期中的不同阶段。例如,可以定义商业订单已发出但尚未接受的阶段。然后可以定义商业订单已接受但是尚未开始处理的阶段。还可以定义商业订单完全履行的阶段。当然,也可以定义进一步的或其他阶段。
为最大可能地详细描述与商业事件有关的所存信息,可能希望存储针对商业事件经历的不同阶段中的每个或至少一些的数据。借助于该时间戳,可以不通过每次产生针对具有相同数据记录标识符的每个版本的数据记录,而通过每次在该信息对象的数据记录的时间戳字段中输入不同时间戳,在数据系统中表示相同信息对象的版本。然后,可以将与特定版本有关的更多细节输入一个或多个附加数据记录字段,其中之一可以是前述的状态字段。例如,可以对状态字段进行输入操作,以显示商业订单(或一般而言,相关信息对象)处于那个阶段或状态。这种使用时间戳的数据记录的版本创建的有利之处在于,不需要为能够代表底层信息对象的改变而对现有数据记录进行复杂改变。时间戳优选地包含日期和时间。
相应地,可能发生的是,第一数据库中存在与同一信息对象相关的若干个数据记录,每一个代表该信息对象的不同版本,并已在不同时间写入了第一数据库,从而包含不同时间戳。优选实施例提供了如果这些数据记录中其时间戳标识信息对象的最新版本的一个数据记录满足所述至少一个预定条件,则将这些数据记录中每一个写入第二数据库。换言之,采用这个实施例,如果最新版本满足预定条件,则数据记录或信息对象的所有旧版本均自动写入第二数据库。
根据数据记录中表示的作为生命环境基础的信息模型,可能发生的是第一数据库包括代表不同信息对象的数据记录,但是这些信息对象在逻辑上是链接在一起的。例如,数据记录可以从总体上代表商业事件,一个或多个其他数据记录可以各自代表该商业事件中发生的单个交易。这些交易数据记录包含数据元素,该数据元素也包括在商业事件数据记录中,并专有地标识该商业事件。这样,商业事件数据记录和交易数据记录在逻辑上彼此链接。
当逻辑上互相链接的数据记录之一满足所述至少一个预定条件时,如果也将这些数据记录中的其他数据记录从第一数据库复制到第二数据库,则这是有利的。特别是如果信息对象是分级地彼此链接的,则可以根据数据记录将一组这种分级链接数据记录从第一数据库写入第二数据库,其中数据记录代表最高分级水平的信息对象并满足所述至少一个预定条件。
本发明还涉及一种计算机程序产品,当该计算机程序产品受到计算机处理时,它引起上述方法的执行。该计算机程序产品可以存储在计算机可读磁或光信息载体(例如CD-ROM或微型盘(minidisk))上。
附图说明
下面将根据附图详细描述本发明,附图中:
图1示出了作为数据系统中商业事件代表示例的模型;
图2示出了数据记录格式的示例;
图3示出了用于执行根据本发明的方法的示意性结构示例;以及
图4示出了商业事件的数据树示例。
具体实施方式
图1示出了本发明实施例中分级信息模型的多种信息对象10、12和14,根据该模型,在数据系统中表示主题。为代表主题,将信息对象像Lego拼装玩具(商标名称)块一样有效地聚集在一起,形成完整的画面。根据该信息模型,可以将一个或多个信息对象12指定给信息对象10,并可以将一个或多个信息对象14指定给每个信息对象12。因此,信息对象10在该分级结构中最高,信息对象12在该分级结构中部,而信息对象14在该分级结构底部。
从上可见,这种信息模型特别适合对数据系统中的银行服务进行建模。信息对象10可以用于描述与顾客协商达成的总体服务(商业事件;BD),信息对象12可以用于描述该总体服务中由银行提供的单个服务(交易;BTX),信息对象14可以用于代表该相关单个服务的提供中由银行进行处理(例如,移动、创建、发送)的交易对象(TXP)。例如,典型的单个服务是单个支付转帐、股票交易中的股票买入、息单、地址改变或股票买入的清算准备(打印和配送)。交易对象可以是例如价值批(value lot),该价值批定义交易内移动的金融工具(股票、货币、债务证券)集合。另一交易对象可以是价值批的价格和交易值。交易对象也可以代表与银行的顾客商业中提供的服务有关的税收估价(tax valuation)、股票交易清算、合同或顾客数据和其他结构化信息。这些自然只是可能交易对象的示例,绝非穷尽性的。
因为总体服务可以由多个单个服务组成,每个单个服务可以包含多个受处理对象,所以必须清楚了解,可以将多个信息对象12指定给每个信息对象10,并可以将多个信息对象14指定给每个信息对象12。但是,通常仅将每个信息对象14指定给一个单个信息对象12,并仅将每个信息对象12指定给一个单个信息对象10。
在这里所述的实施例中,通过数据记录描述信息对象10、12和14,每个数据记录代表一个信息对象,或更加精确地,代表一个信息对象的一个版本。为实现数据记录层次上信息对象的相互指定,可以为商业事件中得到的每个顾客订单(order)指定标识号,并可以将该标识号插入到代表相关商业事件的信息对象的每个数据记录中。
图2示出了数据记录格式的示例,可用于代表信息对象10、12和14的数据记录。该数据记录具有多个数据元素,图2中仅示出了其中的一部分。具体地,每个数据记录具有数据记录标识符DS_K,数据记录标识符DS_K作为数据字段16中保持的数据元素,并可以包含对由相关数据记录代表的有关信息对象(即,信息对象10、信息对象12或信息对象14)类型的指示。每个数据记录还包含在数据字段18中输入的并作为另一数据元素的标识号GF_ID,该标识号GF_ID专有地标识将相关数据记录以及信息对象指定到的商业事件。标识号GF_ID不标识数据记录,但是可以识别在逻辑上互连的数据记录,这是因为指定给相同商业事件的所有数据记录都包含有该标识号GF_ID。
每个数据记录还包含其中输入有时间戳TS的时间戳字段20。时间戳TS代表日期和时间。标识符DS_K和时间戳TS一起专有地识别所讨论的数据记录。时间戳TS允许用标识符D_SK对数据记录的特定版本进行标识。将不同的数据戳赋予在不同时间产生的数据记录。这样,可以根据具有相同标识符D_SK的多个数据记录的时间戳,对底层信息对象的历史演变进行跟踪。
在该实施例中,每个数据记录还包含其中输入有状态ST的状态字段22。状态ST规定该数据记录代表的信息对象的状态。如果上述数据模型用于代表银行服务,则优选的是在状态字段22中只输入与顾客相关的状态信息,而不是与商业事件的技术和内部银行处理有关的信息。如果达到相关状态时,事实或法律情况或顾客的实际行动选择改变,则状态是与顾客相关的。因此,例如,一旦执行了商业交易(状态:已执行),则顾客再不能撤回,而只能取消。应该优选的选择定义可能状态的状态模型,以使状态总是反映安全信息。因此,与信息对象有关的状态集应该表示在达到该状态之前必需的所有过程步骤已全部完成。但是,状态不指示必须在该实现状态之后执行的其他过程步骤是否已发生。
多种信息对象10、12和14可用的状态可以至少部分地不同。例如,在代表银行服务的情况下,可以针对商业事件信息对象10,定义诸如以下状态:“已命令”、“已接受”、“已拒绝”、“已删除”、“已撤回”、“失败”、“按照命令结束”和“结束,但未按照命令”。对于交易信息对象12,除了上述状态,还可以定义其他状态,例如“已开始”、“已执行”、“已完成”、“已准备过帐(post)”和“已过帐”。以上所列状态的一些也可以用于信息对象14。
除了数据字段16、18、20和22,每个数据记录还可以包括其他数据字段24、26、…,其中可以存储针对相关信息对象的其他描述信息(属性)。
现在参照图3。图3示意性地示出了由计算机实现的结构,其中可以应用本发明。该结构包括组件28,组件28产生具有图2所示格式的数据记录并将其提供至下游组件30,其中所提供的数据记录存储在数据库系统32中。组件28包含对至银行的顾客订单的处理进行控制的软件。建立该软件,以根据图1所示的数据模型,在数据记录中对进入的顾客订单进行映射。具体地,组件28指定并管理商业事件标识号。无论何时,可能由于必须在商业事件内执行进一步交易而不得不为商业事件创建新的信息对象时,组件28产生适当数量的数据记录,并将其提供至组件30。无论何时一个或多个现有数据记录所代表的信息对象中发生改变,如果这些改变的本质必须反映在数据库系统32的内容中,则组件28也同样产生新的数据记录。这种改变的示例是如上所述的信息对象状态的改变。但是数据库系统32的内容中必须反映的不仅仅是状态改变。数据库系统32的内容中也需要反映其他改变,特别是与顾客相关的改变。这些改变包括顾客名称和地址改变、账户改变和其他类似改变。在这种情况下,相关信息对象的状态可以保持不变,但是数据库系统32的内容中必须考虑该改变。
如果数据库系统32中已存储有信息对象的数据记录,假设与该信息对象关联的相关改变发生,则组件28产生另一数据记录,该数据记录具有与先前已有的数据记录相同的标识符DS_K,但是具有不同的时间戳TS。因此,另一数据记录代表信息对象的新版本,而先前已有的数据记录代表旧版本,从而避免数据库系统32中已有数据记录的改变。因此,在信息对象的生命周期中可能出现许多版本,根据时间戳可以容易地得到那个版本是当前版本或是上一有效版本。
如果与信息对象关联的改变发生,则可能需要不仅对该信息对象创建另一版本,还需要对与该信息对象在逻辑上链接的一个或多个其他信息对象创建另外的版本。这里优选是组件28只产生必需的那些信息对象的版本。因此,对于顾客订单,在其生命周期上可能出现该顾客订单的不同信息对象的不同数量的版本。图4示出了顾客订单的单独信息对象已经发生改变之后的该顾客订单的数据树的示例。该数据树的示例在其头部具有数据记录34,作为对顾客订单进行一般性描述的商业事件信息对象的第一版本。数据树还包含数据记录24’,数据记录24’描述该商业事件信息对象的另一稍后的版本。如上所述,数据记录34’的状态字段可以包含与数据记录34的状态不同的状态,但并不需要如此。但是,至少数据记录34和34’的时间戳是不同的。
在交易层次上,图4的数据树具有一个数据记录36和数据记录38、38’和38”,其中数据记录36代表第一交易,并只存在单个版本,数据记录38、38’和38”每个均代表第二交易的不同版本。交易均被指定给相同的商业事件,即,数据记录36、38、38’和38”通过例如普通的商业事件标识号,在逻辑上与数据记录34和34’链接。
在下面的交易对象层次上,图4的数据树还包含三个数据记录40、40’和40”、数据记录42和两个数据记录44和44’,数据记录40、40’和40”代表第一交易的第一交易对象的三个不同版本,数据记录42代表第一交易的第二交易对象的单个版本,数据记录44和44’代表第一交易的第四交易对象的两个不同版本。该数据树还具有代表第二交易的第一交易对象的两个不同版本的两个数据记录46和46’、以及代表第二交易的第二交易对象的单个版本的数据记录48。最低分级层次的数据记录在逻辑上正好与中间分级层次的一个数据记录链接,即正好与一个交易链接。为使该逻辑指定是可识别的,可以赋予组件28的单独交易专有的交易标识号—正如赋予商业事件专有的商业事件标识号一样。将该交易标识号输入代表所讨论的交易的版本的每个数据记录中、以及代表与所讨论的交易相关联的交易对象的版本的每个数据记录中。在图2的数据格式中,其他字段24、26、…之一可以用于输入该交易标识号。
在所示示例事件中,数据系统32包括两个数据库50和52,其中之一,即数据库50,用作保存当前信息的当前数据库,而另一数据库52用作历史数据库,根据特定条件,将数据库50向该历史数据库传送数据记录。输入组件30的所有数据记录初始写入数据库50,之后在稍后时间将其传送至数据库52。数据库50比数据库52小得多;例如,数据库50中存储的数据量只是数据库系统32的总数据量的大约3%,而剩余的97%容纳在数据库52中。在可选实施例中,可以设置两个或更多这样的当前数据库,而不是单个当前数据库50,将数据库52联合地指定到这些数据库。即,数据库52从多个当前数据库中的每一个接收数据记录。
通过组件30的合适软件,将数据记录从数据库50传送至数据库52。该软件检查数据库50中存储的数据记录是否满足一个或多个预定条件。如果数据记录满足这个或这些条件,则至少将其传送至数据库52。在优选实施例中,根据这种数据记录传送,还可以将一个或多个其他数据记录从数据库50传送至数据库52。具体地,组件30的软件可以建立来检查数据库50中是否还存在待传送的数据记录的更旧版本。如果存在,则软件使所代表的信息对象的相关数据记录的所有旧版本被传送。
在一个实施例中,根据满足传送条件的数据记录,也传送代表分级从属信息对象的所有数据记录。具体地,如果商业事件的信息对象分级结构中的顶层信息对象的最新版本满足传送条件,则可以应用上述原理。此时则传送该商业事件的整个数据树,包括顶层信息对象(商业事件层次上)的任何旧版本、以及交易层次和交易对象层次上的所有信息对象版本。甚至可以设置为组件30的软件只检查代表顶层信息对象的数据记录是否兼容预定传送条件。在这种变体中,仅当顶层的相关数据记录满足传送条件时,才传送代表除顶层之外的其他分级层次上的信息对象的数据记录。
可以将待检查的数据记录的状态字段22包含预定状态设置为传送条件。具体地,可以将分级结构顶层的信息对象的最新版本的状态字段显示这种预定状态设置为条件。在基于对银行服务建模的示例情况下,预定状态可以是显示顾客订单结束、并且顾客订单内没有银行要执行的其他交易的状态。在该实施例中,将对顾客订单或商业事件的多种信息对象进行建模的数据记录保持在数据库50中,直到顾客订单结束为止。之后,将这些数据记录全部传送至数据库52。
对于上述状态条件可选或附加地,可以设置在将已检查数据记录从当前数据库50复制到历史数据库52之前、该数据记录必须满足预定时间条件。可能的时间条件与相关数据记录已在当前数据库50中存在的时间有关。对于包括前述时间戳的数据记录,如果假设时间戳实质上反映相关数据记录写入数据库50时的时间,则可以容易地确定上述持续时间。由此,可以定义最小预定间隔,在允许将已检查数据记录传送至数据库52之前,该数据记录从写入数据库50开始,必须已在数据库50中存在了该最小预定间隔的时间长度。根据该申请,可以按照所希望的选择该间隔,例如,以天、星期或月为时间帧。
另一可能的时间条件是与数据库50中存储的数据记录中包含的时间条目相比较地定义特定时间,作为验证标准。上述时间戳是这种时间条目的示例。但是,同样可行的是数据库50保持不具有用于版本标识的时间戳而具有其内容代表时间条目的时间字段的数据记录。这种情况的示例是交易的执行日或收支位置(balance position)的过账日。应该指出,在这种情况下,除了代表图1所示类型的信息对象的数据记录,数据库50中自然也可以保持代表其他信息对象的数据记录,例如根据价值批类型的交易对象得到的账户位置,或从大量的单个账户过账得到的账户收支。对于这种数据记录,容易想象它们包含代表比所讨论的数据记录的产生时间晚的时间的一个或多个时间条目。例如,代表从证券交易得到的销售位置的数据记录可以包含对相关销售位置实际应该输入到顾客账户上的日子进行规定的价值日期。该价值日期通常比创建代表该销售位置的数据记录时的时间晚。
如果规定用作验证标准的时间取决于数据库50中发生数据记录检查时的时间,则是有用的。例如,可以规定要用作验证标准的时间是在数据记录检查发生日之前的预定间隔,例如,七日。在检查中,对所检查数据记录中包含的时间条目进行比较,以检查是否给出了在用作验证标准的时间之前的时间。如果该时间在要用作验证标准的时间之前,即,如果数据记录中的时间条目指的是检查发生日之前七日之前的日子,则对于该数据记录,算作该预定时间条件已满足。假设没有该数据记录要满足的其他条件,则此后原理上该数据记录可以传送至数据库52。如果一个数据记录中包括多个时间条目,则可能需要这些时间条目中多于一个的时间条目(理想情况下,全部)均满足该预定时间条件。
优选地,除了时间条件,代表图1所示类型的信息对象的数据记录还必须满足与时间无关的至少一个其他条件,特别是上述状态条件。因此,只要信息对象10、12和14的旧版本不满足状态条件,可以在数据库中存在更长时间,可能比预定最小间隔长很多。但是,一旦相关信息对象的新版本满足所有传送条件,则可以将信息对象的旧版本连同该新版本一并传送至数据库52。
由于上述从数据库50到数据库52的数据记录传送,所以可以将数据库50的容量保持得相对较小,从而当图3所示应用程序54、56、58、…进行读访问时,可以在任何时候实现写入新数据记录的数据库50的快速写访问。应用程序54、56、58、…还可以访问数据库52中的历史数据。
稍后可能证明已传送至数据库52的数据记录具有错误内容。例如,稍后可能发现先前的交易是疏忽大意或不正确地执行的。因为根据本发明,应该尽量避免对现有数据记录进行耗时的修改,所以优选实施例中在数据库50中建立图3所示的表60,与数据库52的无效数据记录有关的信息存储在表60中。例如,假设数据库52中标记为62的数据记录无效。则将数据记录62的数据记录标识符(这里,例如是“xyz”)输入表60中,并输入与该数据记录标识符相关的标记(这里,例如是“u”),显示该数据记录的无效性。例如,在有足够时间的其他合适阶段(stage),可以使用表60来删除数据库52中的无效数据记录。
代表多个信息对象10、12和14及其版本的数据记录可以采用多个表存储在数据库50和52中,即,第一表或第一表集用于存储各自代表信息对象10的数据记录,第二表或第二表集用于存储各自代表信息对象12的数据记录,第三表或第三表集用于存储各自代表信息对象14的数据记录。
优选地,以例如一星期一次的规则间隔检查是否可以传送数据库50的内容。在优选实施例中,在检查中,对数据库50中存储的每个数据记录进行单独检查,以确定该数据记录是否至少满足传送的时间条件。如上所述,可以附加地检查数据记录中的至少一些是否满足至少一个其他传送条件。对于满足时间条件以及在可用情况下满足所述其他传送条件的每个数据记录,将对应的条目写入传送列表。如果存在两个或更多当前数据库,则检查这些当前数据库中每一个的数据记录,并在可用情况下,在传送列表中输入对应条目。在对所有当前数据库进行处理之后,优选地对传送列表进行复审。在该复审中,针对所选数据记录在传送至数据库52之前必须满足的一个或多个其他预定条件,对选择并记录在传送列表中的数据记录进行检查。在复审中要检查的规则可以包括例如与彼此相关的数据记录的上下文有关的上下文规则。因此,复审规则的示例可以是仅当同时传送与特定信息对象(实体)在逻辑上关联的其他信息对象时,才可以将该特定信息对象传送出去。如果在复审中发现只选择了一个信息对象,而没有同时选择其他信息对象,则所述一个信息对象(或代表该信息对象的数据记录)不满足所有传送条件,因而必须保留在当前数据库50中。
因此,本实施例的过程如下:首先应用包含一条或多条传送规则的第一规则集,以选择当前数据库50中保持的一些数据记录,并在传送列表中输入对应条目。在随后的步骤中,使用同样包括一条或多条传送规则的第二规则集,对所选的数据记录进行复审。如果由此发现仍不能传送传送列表中记录的单独数据记录,则从传送列表中删除它们的对应条目。
然后,将复审结束之后仍保留在传送列表中的数据记录传送至数据库52,并将其从数据库50中删除。从当前数据库50到历史数据库52的数据传送可以发生在与数据记录的选择和复审时间不同的时间上。例如,可以设置用于传送复审后保留在传送列表中的数据记录的时间,该时间是在用于选择数据记录的检查例程开始之后的预定间隔处。优选地,从数据库50到数据库52的数据传送发生在数据业务量预计较小的时间上,例如夜间或周末。在完成数据传送之后,对传送列表进行删除,从而又可用于新的数据记录选择。

Claims (14)

1.一种用于管理电子数据的计算机实现方法,包括步骤:
-将一个数据记录写入第一数据库(50),
-对于至少一个预定条件,检查所述一个数据记录的未改变内容,以及
-根据所述至少一个预定条件的满足情况,将所述一个数据记录写入第二数据库(52)。
2.根据权利要求1所述的方法,还包括步骤:在与第一数据库(50)中的所述一个数据记录写入第二数据库(52)中的时间紧密相关的时间处,删除第一数据库(50)中的所述一个数据记录。
3.根据权利要求1或2所述的方法,还包括步骤:根据所述一个数据记录向第二数据库(52)中的写入,将逻辑上与所述一个数据记录链接的一个或多个其他数据记录写入第二数据库(52)中。
4.根据权利要求3所述的方法,还包括步骤:在与第一数据库(50)中的每个其他数据记录写入第二数据库(52)中的时间紧密相关的时间处,删除第一数据库(50)中的每个其他数据记录。
5.根据前述权利要求之一所述的方法,其中验证步骤包括对于预定状态,检查所述一个数据记录的状态字段(22)。
6.根据前述权利要求之一所述的方法,其中验证步骤包括检查所述一个数据记录中规定的时间(TS)是否满足预定时间条件。
7.根据前述权利要求之一所述的方法,还包括步骤:向第一数据库(50)中写入针对已写入第二数据库(52)中的数据记录(62)的数据记录标识符、以及与数据记录标识符(“xyz”)相关的、标识所述数据记录无效的无效性指示符(“u”)。
8.根据前述权利要求之一所述的方法,其中所述一个数据记录代表信息对象(10,12,14)的版本,并包含用于版本标识的时间戳(TS)。
9.根据权利要求8所述的方法,其中时间戳(TS)包含日期和时间。
10.根据权利要求8或9所述的方法,还包括步骤:
-在不同时间向第一数据库(50)中写入若干数据记录,所述数据记录中的每一个代表相同信息对象的不同版本(例如34,34’);以及
-根据所述数据记录之一对所述至少一个预定条件的满足情况,向第二数据库(52)中写入所述数据记录的每一个,其中所述数据记录的时间戳(TS)标识了信息对象的最新版本。
11.根据权利要求8到10之一所述的方法,还包括步骤:
-在不同时间向第一数据库(50)中写入若干数据记录(例如34,36,38,40,42,44,46,48),所述数据记录至少部分地代表在逻辑上相互链接的不同信息对象;以及
-根据所述数据记录之一对所述至少一个预定条件的满足情况,向第二数据库(52)中写入所述数据记录的每一个。
12.根据权利要求11所述的方法,其中所述信息对象(10,12,14)是彼此分级链接的,以及根据代表最高分级层次的信息对象(10)的数据记录满足所述至少一个预定条件,向第二数据库(52)中写入数据记录。
13.一种计算机程序产品,当其受到计算机处理时,引起根据前述权利要求之一所述的方法的执行。
14.根据权利要求13所述的计算机程序产品,其中该计算机程序产品存储在计算机可读磁或光信息载体上。
CNA2005800425405A 2004-12-13 2005-11-29 数据的存档 Pending CN101076801A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04029462.1 2004-12-13
EP04029462A EP1669887A1 (de) 2004-12-13 2004-12-13 Datenarchivierung

Publications (1)

Publication Number Publication Date
CN101076801A true CN101076801A (zh) 2007-11-21

Family

ID=34927743

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800425405A Pending CN101076801A (zh) 2004-12-13 2005-11-29 数据的存档

Country Status (4)

Country Link
US (1) US20060129594A1 (zh)
EP (1) EP1669887A1 (zh)
CN (1) CN101076801A (zh)
WO (1) WO2006063678A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657672A (zh) * 2013-11-19 2015-05-27 国际商业机器公司 用于对数据安全存档的方法和系统
CN106339209A (zh) * 2015-07-17 2017-01-18 阿里巴巴集团控股有限公司 一种数据处理方法和设备
CN111479464A (zh) * 2017-12-22 2020-07-31 阿西姆普托特有限公司 与用于生物样品的冷却条件相关的方法和系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8266126B2 (en) * 2010-03-24 2012-09-11 Matrixx Software, Inc. System with multiple conditional commit databases
JP2021189569A (ja) * 2020-05-26 2021-12-13 富士通株式会社 データ更新プログラム、データ更新装置及びデータ更新方法
US11657033B2 (en) 2020-10-16 2023-05-23 Capital One Services, Llc Systems and methods for maintaining data quality in a data store receiving both low and high quality data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2059615A1 (en) * 1991-01-23 1992-07-24 Edward J. Neubauer Method of selecting and representing data
EP0681721B1 (en) * 1993-02-01 2005-03-23 Sun Microsystems, Inc. Archiving file system for data servers in a distributed network environment
US6182121B1 (en) * 1995-02-03 2001-01-30 Enfish, Inc. Method and apparatus for a physical storage architecture having an improved information storage and retrieval system for a shared file environment
GB9818819D0 (en) * 1998-08-29 1998-10-21 Int Computers Ltd Time-versioned data storage mechanism
US7496607B2 (en) * 2003-08-29 2009-02-24 Yahoo! Inc. Method and system for maintaining synchronization between a local data cache and a data store

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657672A (zh) * 2013-11-19 2015-05-27 国际商业机器公司 用于对数据安全存档的方法和系统
CN104657672B (zh) * 2013-11-19 2018-04-06 国际商业机器公司 用于对表的预定义部分存档的方法和系统
US10013312B2 (en) 2013-11-19 2018-07-03 International Business Machines Corporation Method and system for a safe archiving of data
CN106339209A (zh) * 2015-07-17 2017-01-18 阿里巴巴集团控股有限公司 一种数据处理方法和设备
CN111479464A (zh) * 2017-12-22 2020-07-31 阿西姆普托特有限公司 与用于生物样品的冷却条件相关的方法和系统

Also Published As

Publication number Publication date
US20060129594A1 (en) 2006-06-15
WO2006063678A1 (de) 2006-06-22
EP1669887A1 (de) 2006-06-14

Similar Documents

Publication Publication Date Title
US6904411B2 (en) Multi-processing financial transaction processing system
Jorgenson Information technology and the US economy
US8156143B2 (en) System and method of reconciling human resource database
US20050055289A1 (en) Multi-dimensional business information accounting software engine
CN101076801A (zh) 数据的存档
CN1547717A (zh) 根据消费者捐助来确定市场需求的方法和系统
WO2010091456A1 (en) Creation of a data store
Chua et al. The evolution of e-commerce research: A stakeholder perspective.
Groh et al. Access 2007 Bible
WO2008123861A2 (en) Locality based index
Burchell et al. Energy and land use
CN101076802A (zh) 使用时间戳的数据版本化
Sorescu et al. Two centuries of innovations and stock market bubbles
Eisenberg et al. SQL standardization: the next steps
Koffi et al. Examining the impact of innovation types on Ivorian small and medium-sized enterprises (SMEs) performance and competitiveness
Healy Reflections on M&A accounting from AOL’s acquisition of Time Warner
Sharpe Corporate Cooperation Through Cost-Sharing
Hodgson Biotech’s baby boom
Huang et al. An overview of Web3 Technology: Infrastructure, Applications, and Popularity
CN1633668A (zh) 用于提供cd保险条款的方法
Hardman et al. 11 The Empirical Importance of the Floating Charge in Scotland
Wauthoz Master thesis: Creation of a domain specific language for an Extract-Transform-Load system
Bermès et al. Metrics and strategies for web heritage management and preservation
Araiza First-mover advantage: An integrative framework in economics, strategic management and marketing with empirical models in the banking industry
Cook Bucks for your Bytes: Monetary Appraisal for Tax Credit of Private-Sector Electronic Database Records

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1108744

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1108744

Country of ref document: HK