CN101681366A - 一种数据存储和管理方法 - Google Patents

一种数据存储和管理方法 Download PDF

Info

Publication number
CN101681366A
CN101681366A CN200880011840A CN200880011840A CN101681366A CN 101681366 A CN101681366 A CN 101681366A CN 200880011840 A CN200880011840 A CN 200880011840A CN 200880011840 A CN200880011840 A CN 200880011840A CN 101681366 A CN101681366 A CN 101681366A
Authority
CN
China
Prior art keywords
electronic
document
storage
retrieval
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880011840A
Other languages
English (en)
Inventor
金胜·齐
智·霍·斯蒂芬·白
卡鲁尔·尼扎姆·阿卜杜尔·哈利姆
荣常·王
志勇·朱
苏和·那
元凯·周
杰勇·易
德培·叶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MANUAL SYSTEM Sdn Bhd E
Original Assignee
MANUAL SYSTEM Sdn Bhd E
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MANUAL SYSTEM Sdn Bhd E filed Critical MANUAL SYSTEM Sdn Bhd E
Publication of CN101681366A publication Critical patent/CN101681366A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种电子数据存储、整合、管理、检索以及组织的方法,所述方法通过使用以账户为中心的非表格驱动的一套方法来模仿物理档案系统。本发明的方法将与同一账户有关的数据存储在以账户为中心的分类账文件中,其中这样的分类账是使用DBMS实现为档案设备的虚拟文件夹。该分类账中存储的数据可以在请求时作为整体检索。本发明另一个实施例涉及一种具有模块的计算机程序,其中所述模块的执行生成根据本发明所述的用于存储、整合、管理、检索以及组织数据的方法。

Description

一种数据存储和管理方法
技术领域
本发明涉及一种电子数据存储和管理方法。
背景技术
许多商店、组织、以及这类地方需要以有组织的方式存储大量的数据或文档,以使这些数据或文档在需要时容易找到。
在常规的纸面档案系统中,与客户、产品、交易和其他商业相关信息记录在文档中并一般按分类账文件(文件夹)分组。纸面档案系统的主要优势在于其对于变更的灵活性及其通过将相关文档分组到一处来组织数据的方式。虽然这些系统常见而且目前正在起作用,但管理大量这样的文档可能处理起来相当乏味且庞大。例如,必须在物理上一次一页地通读这些庞大的文档以找出所需信息的位置。这样阅读这些文档通常根本不切实际,因为这极耗费时间和可能容易漏看许多所需信息。
计算机和软件技术方面的进步导致许多数据库的创建,并在各种不同计算机系统中使用这些数据库以存储并管理大量数据和文档。然而,随着技术进步,这些系统变得越来越复杂。所开发的初始数据库技术受流行软件和硬件的局限性所限。20世纪70年代IBM将关系数据库管理系统(RDBMS)技术最终引入开始解决数据库设计中的大多数基本问题。
RDBMS是使用关系技术来存储并检索数据的的数据库管理系统(DBMS)。RDBMS将数据组织并存储在由多个行和列构成的表格中。RDBMS典型地将由许多表格构成而且每个表格典型地将有多个列和多个栏目。在RDBMS中,信息由关系定律来链接,并通过在表格中将有关数据分组在一起而组织起来。例如,联系人信息表格存储客户地址和电话信息,投诉表格存储所有来自客户的投诉,等等。
RDBMS常常不允许用户容易有效地检索所有相关文件,尤其是涉及复杂系统时。另外,现有的数据管理系统还无法让用户可以有效并容易地检索特定账户、产品或项目的全部历史。因为时常需要账户历史来理解客户询问或投诉,所以这是不利的。
RDBMS需要一个重要活动,即数据归一化。数据归一化是一种构造商业数据以去除冗余并保持数据完整性的处理,将这些数据组织到表格中,并且这可以减少数据操作期间潜在的异常。归一化这些数据是将单一关系打破成较小关系的集合的过程,其满足原始关系的约束。将商业数据跨多个表格展开并单纯代表部分数据或信息。必须将一些数据挖掘的技术编程为从数据库获得信息。
然而在RDBMS实现中,因为将数据归一化并存储到不同表格,所以为客户汇编类似记录将需要大量编码以从几个表格检索各自数据。涉及更复杂的应用时情况变得更糟,涉及几个以不同方式控制数据的不同系统,尤其是由于表格设计可以对于每个系统而不同,尽管它们有可能都在使用RDBMS。这显示了RDBMS设计中的最大问题之一:即使对于相同的需求集合,由于可以有不同的人设计该系统甚或相同的人在不同时间设计该系统,因此可以形成不同的表格设计。
市场上一些产品的目的是试图解决RDBMS中数据归一化的问题。例如,Intersystems公司的CACHE程序试图通过使用“类对象”用面向对象的方法表示该文档来解决该问题。“类对象”是运行时间数据存储的个别单元,用作程序的基本积木块。CACHE程序将数据存储在多维阵列中。这种方法使数据得以存取为对象和表格。它考虑了在CACHE程序下存储的对象要可视化为文档。
存储可扩展标记语言(XML)文档是RDBMS中另一种挑战。XML在其基层将所有信息都显示成文本,散布着标记或标签,这些标记或标签指示将所述信息分选成由字符数据、容器型元素、以及这些元素的属性构成的体系。一种XML结构可以用来表示文档并且这种XML可以存储在XML数据库中。XML提供一种基于文本的手段来描述并将树基结构应用到可用来表示商业文档的信息上。
然而上述两个例子都不适合商业用户将所表示的文档当作商业文档来看。它们只是对象的表示,为了程序员在该商业编程实现上利用,而不是作为商业对象。当需要将老版本和修改后的版本一起存储并管理时,它变得困难得多。
当前的一套方法还有一个问题是这些应用会让许多人花费几小时来构建和编程,时间多到商业需求在系统完成之前已改变,常常导致开销浪费而且系统不可用。
目前,商业需求上的变化包括不得不对目前的应用进行修改和重新编程(这常常导致系统效率低很多)或需要重新开始并设计整套的新表格。
因此,需要提供一种在计算机上以不费力且有效的方式存储和管理电子信息的方法,其中,可简单地检索该信息并在需要时容易找到该信息。
发明内容
本发明一个目的是通过提供一种模拟物理文档存储和管理系统的电子数据存储和管理方法来处理并克服上述局限性和缺点。
本发明另一个目的是使用RDBMS来解决商业数据存储的复杂性,这涉及数据归一化,将商业数据分到数个域构成的组中并因此失去对商业数据或信息的衔接分组。
本发明一方面用模仿物理档案系统的方式使用户可以存储、检索并路由电子数据。
本发明另一方面是提供一种模拟物理档案系统的电子数据存储和管理方法,该物理档案系统使用分类账文件(文件夹)、文档和纸张。本发明的一种方法模拟物理档案系统,信息以文档格式记录并存储在虚拟分类账文件中而且过账受到文档过账到分类账文件上的影响。
本发明另一方面提供一种以账户或客户为中心的档案系统,将同一客户的信息存储在同一位置,而不是跨多个表格展开。
本发明还有一方面提供一种具有虚拟分类账文件夹的存储装置,该装置包括存储账户明细的区段,存储该账户至少一个活动概略的区域以及存储与该账户有关的信息的至少一个电子页面。本发明另一方面提供一种电子数据存储和管理系统的方法,将从纸质文档获得的数据转换成计算机可读的预定结构。
本发明还有一方面提供一种电子数据存储和管理方法,将转换成预定结构的数据按时间次序附到电子页面上以形成该账户完全可追踪的事件序列。
本发明另一方面使得可以检索数据而且可以生成有关该账户的活动概略。
本发明还有一方面提供一种电子数据存储和管理方法,与常规RDBMS表格驱动方法相比简化了系统的后端设计。本发明另一方面提供使文档的完全审计追踪存储在分类账档案系统中的能力。
本发明还有另一方面提供一种计算机可用介质,所述计算机可用介质有形地体现可由计算机执行的指令程序以执行上述方法。
本发明的电子分类账档案系统意图是模拟将数据或信息作为文档存储的分类账档案系统。这种分类账档案系统仍然是商业世界中处理信息和数据的被公认最好的方法。本发明基于文档的分类账档案系统不仅提供更好的数据存储和检索方式,而且对于过账或更新数据所采取的每个行动还产生对这些用户的审计追踪。无疑地,一种使用户可以与人类处理数据类似的方式工作的技术是极有优势的。本发明一个实施例涉及一种电子数据存储、整合、管理、检索以及组织的方法,包括如下步骤:(a)获得数据;(b)将所述获得的数据转换成具有计算机可读的预定结构的电子文档;(c)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中;(d)识别目的地文件以存储所述电子文档;(e)检索所述目的地文件的预定电子页面,最近的电子文档记录在该预定电子页面中;(f)将所述电子文档按时间次序附到所述被检索的页面上;(g)根据所附的所述电子文档的数据更新所述目的地文件;(h)将所述目的地文件存储在特定存储装置中。上述方法是以账户为中心的非表格驱动的方法,将同一账户的各电子文档分组并存储在同一位置。
本发明另一实施例提供一种用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,该系统包括:i)存储账户明细的区段;ii)至少一个存储该账户活动概略的电子页面;iii)至少一个存储至少一个电子文档的电子页面,该电子文档有按预定结构排布的多个数据。
本发明的方法或系统是以账户为中心的非表格驱动的方法,将同一账户的各电子文档分组并存储在同一位置。
本发明还有一个实施例提供一种计算机程序,具有用来存储、合并、管理、检索以及组织从纸源获得的数据的模块,执行所述模块生成上述用来存储和管理数据的方法。
本发明还有一个实施例涉及一种计算机系统,该系统至少包括以下设备:
i)处理器;
ii)可操作地耦合到所述处理器上的内存设备;
iii)可操作地耦合到所述处理器上的存储介质;
该内存器件存储有模块,该处理器执行该模块生成上述用来存储和管理数据的方法。
附图说明
图1是根据本发明一个实施例所述的用来存储和管理电子数据的方法的处理流程图。
图2图示说明了根据本发明一个实施例的e分类账的概念,其包括该发明具体实施方式部分中所定义的第0行、第0个文档以及e页面。
图3图示说明了本发明的分类账档案系统以及本发明具体实施方式部分中所定义的第0行、第0个文档以及第X个文档如何与物理档案系统相关联。
图4图示说明了根据本发明所述的多数值体系结构的数据格式的一个例子。
图5图示说明了如何将常规清单构建成该发明具体实施方式部分中所定义的D-S-R-C格式的一个例子。
图6图示说明了本发明具体实施方式部分中所定义的e页面的一个例子,所述e页面包括每一栏目大小为128字节的十个栏目,形成1,280字节的e页面(10x128)。
图7图示说明使用常规的基于表格的DBMS来实现e页面的一个例子。
图8是关于本发明具体实施方式部分中所定义的交易e分类账和文档处理器(eDP)如何相互作用以执行过账和更新处理的图示。
图9图示说明该发明具体实施方式部分中所定义的库e分类账的一个例子,所述库e分类账使用通常的DBMS表格来实现。
具体实施方式
现在将详细参考该发明各优选实施例,其中各例子在各附图中图示说明。虽然将结合各优选实施例来描述该发明,但要理解的是它们的意图不是将该发明局限于这些实施例。
本发明涉及将信息作为文档存储并管理的一种系统和一种方法。应当指出本发明公开了一种电子分类账档案系统,其可以将任何相关数据编档成恰当的以账户为中心的分类账,这种分类账是使用DBMS实现为档案设备的虚拟文件夹。
根据本发明所述的一种方法涉及一种电子数据存储、整合、管理、检索以及组织的方法,其通过使用以账户为中心的非表格驱动的一套方法来模仿各文档的物理存储、整合、管理、检索以及组织。
本发明的电子分类账档案系统包括一个或多个DBMS数据库,每个数据库代表一个系统或应用,比如客户信息管理系统、人力资源管理系统、以及在线招聘和管理系统。本发明的电子分类账档案系统还包括对这些系统的创建、修改以及维护进行管理的软件。如下面的论述中图示说明的,本系统使用户可生成并可定制这些系统中的每一个。重要的是指出所生成的系统中每一个都有基本相同的一套表格设计,但有不同的商业规则和流程。
图1图示说明了根据本发明的方法的优选实施例的进程流。在本发明一个实施例中,一种电子数据存储、整合、管理、检索以及组织的方法包括以下步骤:
a)从纸质文档中获得数据(100);
b)将所述获得的数据转换成具有下面描述中所定义的预定结构的电子文档(101);
c)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
d)识别目的地文件以存储所述电子文档(103);
e)检索所述目的地文件的预定电子页面,最近的电子文档记录在此(104);
f)将所述电子文档按时间次序附到所述被检索的页面上;
g)根据所附的所述电子文档的数据来更新所述目的地文件(106);
以及
h)将所述目的地文件存储在特定存储装置中(107)。
本发明的档案系统使用常规RDBMS来实现,通过有效延长RDBMS的使用来补充RDBMS和SQL查询语言的强度以将复杂的数据对象作为文档存储并检索。本发明的分类账档案系统以这样的方式实现:保持SQL查询的简易程度和速度,而将RDBMS各固定长度的栏目延长得使可变长度的数据可以存储并因此文档对象可以存储。简而言之,本发明在检索账户、文档或对象的数据时去除许多繁琐的连接语法,而保持SQL语言用于搜索和报告的强大属性。
在计算机环境下,根据数据准则将来自文档的数据拆散并存储在几个表格中。例如,清单文档可能包含公司详情、总数额、账户参引、以及这类信息,而且它还可以包含附件或对其他文档的参引、常规的RDBMS系统拆散这些数据并将这些数据存储到几个表格中而且当这个文档要为了查看而检索或重新构建时导致复杂性上升。然而,在物理档案系统中,将文档当对象看待,因此不会将文档中的数据拆散到几个存储器中而会存储为整个文档。因此本发明的分类账档案系统试图反映如何将数据和信息存储并归档在物理文件夹中而且在需要这些数据时作为文档检索所述数据和信息。
本发明另一实施例提供一种用在关系数据库中的基于计算机的档案系统,其利用具有至少一个存储装置的非表格驱动方法,该存储装置有至少一个虚拟文件夹,该系统包括:
i)存储账户明细的区段(18);
ii)至少一个存储该账户活动概略的电子页面(16);
iii)至少一个存储至少一个电子文档(14)的电子页面(12),该电子文档具有按预定结构排布的多个数据。
图2是根据本发明所述的档案系统的纵览图。如图2中图示说明的,存储账户明细的区段由第0行(18)表示;存储该账户活动概略的电子页面由第0个文档(16)表示;存储至少一个电子文档的电子页面由e页面(12)表示,该电子文档由第X个文档(14)代表。如图2中所示的术语第0行(18)、第0个文档(16)、e页面(12)、以及第X个文档(14)将在下面的描述中定义。
现在将对本发明中使用的术语进行更详细地解释,如下:
e分类账
这里所用的术语e分类账根据本发明所述是代表该档案系统虚拟柜的存储装置。每个e分类账(10)包括至少一个虚拟文件夹,具有由第0行(18)、第0个文档(16)以及包括多个第X个文档(14)的电子页面(12)组成的集合。由第0行(18)、第0个文档(16)以及包括多个第X个文档(14)的电子页面(12)组成的集合用按图2中图示说明的以账户为中心的方式组织。
每个虚拟文件夹都会有至少一个第0行(16)、至少一个第0个文档(18)以及至少一个持有多个电子文档(14)的电子页面(12)。可以使用通常的DBMS将本发明的e分类账(10)实现为表格。
电子文档(e文档)
术语电子文档在这里用作对从纸质文档获得的而且已转换成根据本发明的预定结构的数据进行定义的术语。
该预定结构是包括编码系统的分层次的文档结构。根据本发明所述的分层次的文档结构由排布成多列的多个元素形成,这些元素如图5中图示说明的那样形成字符串(20)。所述多个元素包括至少一个唯一元素代码(22)和至少一个元素数据集(26)。所述多个元素由至少一个标记(24)表示。
图4示出多数值体系结构的数据格式的一个例子。该例子图示说明数据可以如何根据本发明的结构(即按D-S-R-C格式)来组织,在此D代表文档代码,S代表区段代码,R代表列代码以及C代表域定位。一个关于来自常规清单的数据可以如何构造成本发明的D-S-R-C格式在图5中图示说明。应当指出的是e文档实际上是带有某些标记(24)的字符串(20)以表示D-S-R-C区段。该格式类似于XML格式,但本发明使用标记和代码来表示各元素而不是使用标签。这优化了文档的存储需求,同时保持XML机动性和结构。
电子页面(e页面)
这里所用的电子页面指存储至少一个电子文档的虚拟页面。本发明的电子页面包括用于存储可变长度数据的至少一个长度固定的栏目。该电子页面包括多个栏目框,其中每个栏目长度基本相等。e页面的各栏目在图6中作为例子示出为第1-10行。在本发明的该优选实施例中,这些栏目中每一个的大小优选为128字节。
根据需要,可以定制e页面的大小以达到最佳性能。图6示出e页面有10个栏目框的几个例子,每一栏目有128字节,形成1,280字节的e页面(10x128)。
无论何时当前栏目装满,附到所述电子页面(12)上的这些电子文档(14)中每一个都在新栏目框处起始而且可以继续到下一个新栏目框,如果当前电子页面装满则电子页面可以继续到下一电子页面。这一特性使得存储性能更好并改进了后续的检索速度。如图6中示例所示,第一电子文档(14a)附到电子页面(12a)的第一栏目(即第1行)上,直到第一栏装满。然后电子文档(14a)其余部分附到第二栏目(即第2行)上。这一进程一直继续到整个电子文档完全附到该电子页面(12a)上为止。当第二电子文档(14b)要附到同一电子页面(12a)上时,第二电子文档(14b)开始于一个新栏目(即第5行),如图6中所示。类似地,第二电子文档(14b)继续到下一个新栏目,直到整个字符串完全附到电子页面(12a)上。在图6中,电子页面(12a)在第三电子文档(14c)一部分附到电子页面(12a)上(即第9行和第10行)时充满。然后为要附到新的电子页面(12b)的新栏目上的第三电子页面(14c)的余下部分生成新的电子页面(12b)。
无论何时电子文档要过账到账户中,都将检索预定的电子页面并且该电子文档会附到该预定电子页面上。该预定的电子页面是最近的电子文档所记录的页面。给该页面一个特定标识以便无论何时相关电子文档要过账到该账户中该页面都被认为其是最近的页面并且都将被检索。优选的是,该预定的电子页面的标识是页码N0的形式,在此N0是有固定顺序的符号集合中的第一个成员。无论何时所述预定电子页面完全地由电子文档所附,将该页面的标识变成第N页,在此N是所述符号集合中的成员而且将生成新页面并给其页码标识第N0页(page-N0)。在本发明的该优选实施例中,第N0页优选为第0页而且N优选为正整数。
例如,无论何时将一个或多个电子文档(第X个文档)过账并归档到账户,都会将它附到第0个电子页面上(第0个e页面),而且无论何时第0个e页面完全地由电子文档所附,都会将第0个e页面重命名为第1个电子页面。如图6中所示,当新的电子文档过账到这个账户上时,它将附到第0个e页面(12b)上。当第0个e页面(12b)装满时,会将它重命名为第N个e页面(在这种情况下为1)(12a)并且后续的电子文档将附到新的第0个e页面上。
本发明的e页面使用通常的DBMS来实现,在此每个e页面实际上是表格中的数据列。栏目(128字节长度的字符数据)代表e页面的一行。因此,由10行构成的e页面在用DBMS实现时是具有10个栏目的表格,每一个栏目都有128字节长的字符数据类型。将一些栏目添加到每个e页面上形成这些键值,而且再添加几个栏目以形成e页面的索引和概略信息。图7图示说明使用常规的基于表格的DBMS实现e页面的一个示例。
第0个文档(第0个文档)
这里所用的术语第0个文档指的是存储账户的活动概略的区域。它等效于物理文件夹的索引页面。本发明第0个文档存储可变长度的数据。无论何时电子文档附到该系统上都会相应地更新第0个文档。
除了将要从负1(-1)开始的e页码之外,第0个文档按与第X个文档相同的方式存储,而且将最后一页编号成第负n(-n)页。对第0个文档可被存储用于账的单元的数目没有限制,只要每个第0个文档包含唯一标识,以便无论何时请求该账户的活动概述都检索相关的第0个文档。
第0个文档(16)实际上模仿物理档案文件夹,其中该物理档案文件夹可以有不止一页如图3所示夹在扉页旁边的概略页面,并且该物理档案文件是从多个第X个文档取得的文档。每个过账到并附到账户上的第X个文档可以将某种信息更新成第0个文档和第0行,而且将作为在第0个文档处信息变更的支持文档。第0个文档一直保持最近的和当前的账户信息第0行(第0行)
在本说明书中所用的术语第0行指的是存储关联账户明细的区段。它等效于物理文件夹的概略注释。这个区段包括固定长度的区域,该区域具有多个用于数据存储的栏目,这些栏目包含检索关键词。
数据报告、搜索和分类中的大多数可以通过直接在这个第0行(18)上使用SQL语言而实现。无论何时将查询关键词输入系统,该关键词都会与数据检索用的所述区段中的检索关键词交叉匹配。根据本发明所述的查询关键词是数据库查询语言,优选为结构化查询语言(SQL)。
文档处理器(eDP)
本发明特性之一是其更新程序。被过账到该系统的数据是基于文档的,而且每个e分类账都会需要同一更新进程,即将e文档(14)附到e页面(12),而且将该数据更新到第0个文档(16)和第0行(18)。因此有可能采用标准文档处理器来处理每个文档,尽管这些文档的长度不同。这通过将一套更新规则包括到每个分类账-代码-文档X对中并在标准指令列(R000)中添加到每一个e文档(14),在此R000可由如下的域构成:分类账、分类帐代码(lgcode)、账户id(accid)。通过指向R000域,文档处理器将交叉参考该字典中的更新规制(Lxxx-Dxxx)并相应地更新第0个文档(16)和第0行(18)。
本发明保持文档结构并将数据作为整体存储到它们各自的账户(例如可接收账户),使后续检索更简洁且容易得多。为了使SQL查询方便,无论何时将文档附到账户上都会将通过用户接口选择的某些数据填充或更新到第0行(16)。为进一步改进该检索,将通过用户接口选择的某些数据更新到第0个文档(16),以形成账户的概略文档。所有电子文档(多个第X个文档)(14)按从最早到最晚的时间次序而附加以产生账户完全可追踪的事件序列。
为取得更好的存储性能,将第X个文档(14)附加并存储在一个或多个被称为电子页面(e页面)的片段中。可以存储在e页面(12)中的第X个文档(14)的数量取决于e页面的大小而且取决于第X个文档(14)的大小。当128字节长度的数据将在通常的DBMS实现中依次存储在硬盘中时,可优选以先前所述的128字节的倍数完全定制e页面(12)以确保更好的后续检索性能。
在本发明另一个实施例中,该电子数据存储、整合、管理、检索以及组织的方法进一步包括给每个文档分配优先级而且根据所分配的优先级处理每个文档。如果不止一个电子文档(14)分配有同一优先级,则会根据提交到系统中的日期和时间依次处理这些电子文档(14)。提交给系统的每个电子文档(14)会首先存储在暂存装置中,之后可以处理它并将它过账到它们各自的目的地。在这个暂存装置中,将电子文档(14)分类为(i)紧急,这种情况下需要立即归档;(ii)正常,这种情况下将依次处理这些文档或者(iii)不紧急,这种情况下在非峰值期间或CPU利用率低时分批处理文档。
一旦将相关电子文档附加并更新到所述目的地文件中,就会更新暂存装置中存储的这些电子文档的处理状态。该处理状态是显示附加和更新成功或失败的指示。
通过将所有的更新处理简化并统一成一个程序,本发明的方法不仅减少了对每个数据更新的更新程序进行编码所需的手工作业,而且还减少了所需的维护作业并去除了人为错误。
本发明另一个实施例公开了一种计算机程序,具有用于存储、整合、管理、检索以及组织从资源获得的数据的模块,其中执行所述模块生成上述的数据存储和管理方法。
在物理档案系统中,使用不同柜存储不同的文件夹。这些柜中每一个的大小都不同以保持不同类型的文件夹。这些柜等效于本发明的e分类账。我们注意到本IT系统中大多数可以通过利用近似10个不同类型的e分类账来实现,所述10个不同类型的e分类账是:
1.交易e分类账
2.库e分类账
3.字典e分类账
4.分组e分类账
5.主e分类账
6.操作e分类账
7.索引e分类账
8.概略e分类账
9.审计e分类账
10.大容量存储e分类账
在物理档案系统中,用户可能使用不止一个柜来存储类似信息,虽然它们是同一类型的柜。同样,本发明的e分类账可以在分布式环境中实现,其中可以将类似数据存储在不只一个表格(e分类账)中,却由账户特征(比如区域、邮政编码)等等分开。
本发明与常规的RDBMS片段相比主要区别在于数据根据账户而不是根据栏目来分段,即表格一样水平划分而不是像在通常RDBMS中竖直划分。重要的是数据检索和数据库维护的性能像竖直划分的数据一样需要复杂得多的“连接”SQL语句。
在该物理档案系统中,用户可以进一步使用分隔物和标签对柜中这些文件夹分类。这在用户可以将分类账代码栏作为键值添加到e分类账(表格)的本实现中容易实现。属于同一类的所有文件夹会有同一分类账代码并因此提供虚拟分隔物给这些文件夹。如下例子对如何使用通常的DBMS实现这个概念做了更多说明。
交易e分类账
交易e分类账等效于收件箱托盘。e文档的每次提交将在可以处理它并将它过账到它们各自的目的地之前通过这个e分类账。将向交易e分类账提交的e文档分类为紧急(需要立即归档)、正常(将根据提交到系统的日期和时间依次处理文档)、或者不紧急(将在非峰值期间或在CPU利用率低时分批处理文档)。
图8示出交易e分类账和文档处理器(eDP)互相作用以执行过账和更新进程。当e文档呈递给eDP时,eDP将处理该文档信息并提取系统数据(优选将这种数据存储在称为列代码R000的唯一列中),该系统数据包含更新指令,所述更新指令比如目的地e分类档、目标账户等等。一旦识别目的地柜(e分类账),就检索对应账户的文件夹(1)。eDP实际上不检索整个文件夹,而只取第0个电子页面和第0个文档。根据第0个电子页面上可用的空间,第X个文档将附到先前所述的电子页面上(2),而且更新后的第0个电子页面(如果第0个e页面没有足够的空间则是第n个e页面)会存储到适当的e分类账(表格)(5)。基于这个第X个文档的更新规则,会将某些列(R)相应地更新成第0个文档和第0行(3和4)。
一旦e文档成功过账并编档到账户,eDP就更新“收件箱托盘”(交易e分类账)中该e文档的状态以收集处理后的e文档并且稍后所述处理后的e文档会移动到存档e分类账。这是要在DBMS表格的读取/写入速度受表格大小直接影响时确保该系统有更好的性能。
记录并调查任一不成功的更新时,交易e分类账在分类账档案系统中起重要作用。这不仅给在更新进程中出现的问题提供更好的跟踪能力,而且有任何问题发生的话就提供直接反馈给该系统。
库e分类账
每个系统都需要一个库来跟踪并标准化系统中所用的术语并且存档更好更一致的参引。一般,它们是两类库:标准库和特定库。标准库包括世界上大多数人广泛使用且极少改变的术语和代码。标准库的示例术语中有一些是国家、性别、致敬、邮政编码等。特定库包括在有限的应用中使用的代码或术语,而且这些代码一般因组织不同而有差异,比如组织部门、职称等。特定库还包括某个行业特定的代码或术语,比如用于教育行业的课程代码、股票代码等。
在IT系统中,库术语或代码通常以下拉形式使用,或者是以单选/打对号框按钮作为选择的形式使用。物理RDBMS实现中常规的库表格将有最小审计追踪,库代码改变的全面审计历史通常不保留。
如先前所述,所有e分类账更新使用同一流程和同一例行程序。因此,所有库代码创建和修改都会需要将文档提交到交易e分类账。
图9示出了使用正常DBMS表格实现的库e分类账的一个例子。应当注意库e分类账中第0个文档(16y)等效于系统库代码的最新的副本,而第X个文档(14y)用作对这些代码进行的更改的审计历史。
字典e分类账
字典e分类账在某种程度上与库e分类账类似,除了字典e分类帐用于存储所有与系统有关的代码和参数(包括文档更新规则、商业规则、文档工作流以及确认规则)之外。字典e分类账的存储和检索机制与库e分类账完全相同,字典e分类账使用相同的更新程序(eDP)。
分组e分类账
使用分组e分类账基于准则来分组账户。用户可以选择按区域、账户代码、或其他准则来分组账户。再者,存储机制和更新方法与其他e分类账完全相同。
主e分类账
主e分类账的功能与常规RDBMS系统中找到的主记录表格类似。然而,由于本发明的e分类账提供以账户为中心的存储和检索方法,因此存储并检索来自主e分类账的数据与常规系统相比容易得多。
本发明的分类账档案系统使用户得以定义不止一个主e分类账。每一个主e分类账可以有它自己唯一的第0行和第0个文档设计。例如,用户可以定义客户主e分类账,具有由客户名称、地址、存款、欠款构成的第0行,由更详细的信息(比如账单地址、引用细节、最近6个交易历史)构成的第0个文档。用户还可以定义设备主e分类账,具有由设备ID、名称、制造商信息比如日期、服务到期日、花在服务上的累积额、以及这类信息。第0个文档由关于该设备的进一步细节比如最近几次服务的历史记录、供应商信息、以及这类信息构成。
第0行和第0个文档的设计是检索需求的功能。如果需要对某些数据进行搜索和分类,用户应当将它包括在第0行的域中,而第0个文档应当包含更外延的信息回答关于账户而且常常涉及商业智能和账户分析的问题。
再者,主e分类账中信息的过账和更新与其他分类账完全相同。
操作e分类账
操作e分类账用在本发明中以存储定期的和时间上敏感的文档。当本分类账档案系统通过封装文档(e文档)下的一切来工作时,对于需要例行提交的文档(像一天一次、一周一次、一个月的第一天、或每个周一和周五、或这类周期)、需要周期采取的动作将提交给操作e分类账。
由于本发明的e分类账是以账户为中心的存储系统,为使操作e分类账需求更容易满足,操作e分类账的账户ID将是以日期-时间为基础的。第X个文档将过账到它们各自的日期-时间账户并更新到它的第0个文档。按日程的程序将在后台不断运行并检索与当前日期-时间相匹配的所有第0个文档并将这些文档提交给交易e分类账用于处理。
再者,操作e分类账中信息的过账和更新与上述任何其他e分类账完全相同。
索引e分类账
根据本发明所述的分类账档案系统提供一个程序每个账户并索引每个e分类账中包含的信息。被索引的信息将作为e文档存储在索引e分类账中。索引e分类账的唯一目的是容易实现更好的搜索性能。关于如何存储并检索这个索引e文档的机制与任何其他e分类账完全相同。
概略e分类账
本发明基于用户指定准则使用概略e分类账来总计数据。用户可以用不同的准则来创建总计数据的多个概略e分类账并创建该信息的不同“检视(view)”。概略e分类账的例子包括按区域、按月份、按数量接收的付款(e文档)。概略e分类账通常不会利用第0个文档,却会大量使用第0行,尤其是对于报告和查询。
每次更新概略账户,第X个文档就会附加到该账户上以保持审计追踪并跟踪何时对概略进行最后一次编译和更新。再者,概略e分类账中信息的过账和更新与任何其他e分类账完全相同。
审计e分类账
本发明采用专门的程序对每个e分类账执行自审计以检测任何错误的或“不平衡”的交易。将生成审计报告并将其提交给审计e分类账以用于记录目的。用户可以指定审计的频率并为每次审计活动设置检查参数。再者,审计e分类账中信息的过账和更新与任何其他e分类账完全相同。
大容量存储器
在常规物理档案系统中,我们使用贮藏室保持不能在柜中归档的任何大型项目。我们通常对这些庞大项目作标签并组织它们以便我们可以随后检索这些项目。同样,本发明的分类账档案系统由使大文件得以存储的专门的e分类账构成,大文件比如视频、图像、音频、以及任何其他多媒体或二进制数据文件,以便对于存储和检索都使性能最优。
除了仅由一行构成的e页面之外,大容量存储e分类账实际上与其他e分类账相同,而且典型的是行的大小是千/兆字节,而不是128字节。归档和更新进程与其他e分类账完全相同,并因此使用同一更新程序进行任何过账和档案进程。
在用于这种大容量存储e分类账的DBMS实现中,行大小为1MB的大型栏目正使用BLOB数据类型而且如果二进制文件大于1MB,则会将其分割分段成多个片段并存储在多个e页面(表格中各列)中。
e页面的行大小是可定制的而且对在存储和检索上的性能来说非常重要。通过将数据分割成多个e页面,可以将大型二进制文件一次一个e页面地检索并发送给用户而且极大地增加对大型文件检索的响应时间。这对于获取流方法来转移大型文件的大小的应用尤其如此,所述大型文件比如视频和音频流。
在本发明另一个实施例中,计算机程序具有用来存储、整合、管理、检索以及组织从资源获得的数据的模块,其中执行所述模块生成上述数据存储和管理方法,包括步骤:
a)将所述获得的数据转换成具有计算机可读的预定结构的电子文档(101);
b)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
c)识别目的地文件以存储所述电子文档(103);
d)检索所述目的地文件的预定电子页面,最近的电子文档记录在该预定电子页面中(104);
e)将所述电子文档按时间次序附到所述被检索的页面上(105);
f)根据所附的所述电子文档的数据更新所述目的地文件(106);
g)将所述更新后的目的地文件存储在的特定的存储装置(107)中。
根据本发明,存储装置包括至少一个存储数据的虚拟文件夹,存储装置可以包括多个虚拟文件夹,所述虚拟文件夹具有根据存储需要而基本类似的设计。
计算机程序还包括分配优先级给每个电子文档(14)并根据所分配的优先级处理每个电子文档(14)的模块。无论何时不止一个电子文档(14)分配有同一优先级,都会根据输入该系统的日期和时间依次处理电子文档(14)。
在本发明优选实施例中,计算机程序还可以包括由一套更新规则构成的更新模块,其中无论何时电子文档(14)由所述内存设备接收,处理器都会用更新规则来交叉参引电子文档(14)并相应地更新目的地文件。更优选的是,这些更新规则包括:(i)读取存储在所述暂存装置中的所述转换后的电子文档(14);(ii)识别目的地文件以存储所述电子文档(14);(iii)检索所述目的地文件的预定电子页面(12),最近的电子文档记录在预定电子页面(12)中;(iv)将所述电子文档(14)按时间次序附到所述被检索的页面上;(v)根据所附的所述电子文档(14)的数据来更新所述目的地文件:(vi)一旦将相关电子文档(14)附到并更新到所述目的地文件中就更新所述暂存装置中存储的所述电子文档(14)的处理状态。该处理状态是示出将电子文档(14)附加和更新到目的地文件中的处理成功或失败的指示。
本发明还有一个实施例涉及一种计算机系统,该系统至少包括如下设备:(i)处理器;(ii)可操作地耦合到所述处理器上的内存设备;(iii)可操作地耦合到所述处理器上的存储介质;其中所述内存设备存储有模块,在该模块上由所述处理器执行所述模块生成上述数据存储和管理方法,包括步骤:
a)接收数据(100);
b)将所述获得的数据转换成具有计算机可读的预定结构的电子文档;
c)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
d)识别目的地文件以存储所述电子文档(103);
e)检索所述目的地文件的预定电子页面,最近的电子文档记录在此(104);
f)将所述电子文档按时间次序附到所述被检索的页面上(105);
g)根据所附的所述电子文档的数据来更新所述目的地文件(106);
h)将所述更新后的目的地文件存储在特定的存储装置(107)中。
上述对本发明特定实施例的说明用于展示和说明。它们意图不在于穷举或将发明局限于所公开的确切形式,显然可能有许多修改和变型。选择这些实施例进行描述是为了更好地解释该发明的原理和其实际应用,由此使本领域其他技术人员能够最佳地利用该发明并且适应个别部分进行的各种修改的各种实施例是可以预期的。本段的意图在于说明本发明的范围由所附权利要求和其等价表述来限定。

Claims (84)

1.一种电子数据存储、整合、管理、检索以及组织的方法,通过使用以账户为中心的非表格驱动的方法来模仿文档的物理存储、整合、管理、检索以及组织。
2.一种电子数据存储、整合、管理、检索以及组织的方法,包括以下步骤:
a)获得数据(100);
b)将所述获得的数据转换成具有计算机可读的预定结构的电子文档(14)(101);
c)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
d)识别目的地文件以存储所述电子文档(103);
e)检索所述目的地文件的预定电子页面(12),最近的电子文档记录在预定电子页面(12)中(104);
f)将所述电子文档(14)按时间次序附到所述被检索的页面上(105);
g)根据所附的所述电子文档(14)的数据来更新所述目的地文件;
h)将所述目的地文件存储在特定存储装置中(107);
所述方法是以账户为中心的非表格驱动的方法,其中,将同一账户的各电子文档(14)分组并存储在同一位置。
3.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述方法还包括步骤:一旦将相关电子文档(14)附到并更新到所述目的地文件中,就更新存储在所述暂存装置中的所述电子文档(14)的处理状态。
4.根据权利要求3所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述处理状态是示出将电子文档(14)附到和更新到目的地文件中的处理成功或失败的指示。
5.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子文档(14)的所述预定结构是分层次的文档结构。
6.根据权利要求5所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述预定结构包括编码系统以定义所述分层次的文档结构。
7.根据权利要求5至6所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述分层次的文档结构由多个元素形成。
8.根据权利要求7所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述多个元素排布成多列形成字符串(20)。
9.根据权利要求7至8所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述多个元素中每一个都包括至少一个唯一的元素代码(22)和至少一个元素数据集(26)。
10.根据权利要求9所述的电子数据存储、整合、管理、检索以及组织的方法,其中每个元素由至少一个标记(24)表示。
11.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述预定的电子页面(12)具有特定标识,以所述预定的电子页面(12)总被认为是最近的页面,而且无论何时相关电子文档(14)要过账到该账户中,都会检索所述预定的电子页面(12)。
12.根据权利要求11所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述预定电子页面(12)的所述标识优选为第N0页的形式,其中N0是有固定顺序的符号集合中的第一个成员。
13.根据权利要求12所述的电子数据存储、整合、管理、检索以及组织的方法,其中无论何时所述预定电子页面(12)完全地由电子文档所附,该页面的标识都会变成第N页,其中N是所述符号集合中各成员,并且会生成新页面并给它第N0页的标识。
14.根据权利要求12至13所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述第N0页优选为第0页而且所述N优选为正整数。
15.根据权利要求11至14所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子页面(12)包括用于存储可变长度数据的固定长度区域。
16.根据权利要求11至15所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子页面(12)包括固定长度栏目的至少一个框。
17.根据权利要求11至16所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子页面(12)包括多个栏目框而且每个栏目长度基本上相等。
18.根据权利要求11至17所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子页面(12)包括至少一个附到所述栏目上的电子文档。
19.根据权利要求11至18所述的电子数据存储、整合、管理、检索以及组织的方法,其中附到所述电子页面上的每个电子文档(14)开始于新的栏目框,而且无论何时充满当前的栏目框,所述电子文档(14)都可以继续到下一个新的栏目框。
20.根据权利要求11至19所述的电子数据存储、整合、管理、检索以及组织的方法,其中无论何时充满当前的电子页面,附到所述电子页面上的所述电子文档都可以继续到下一电子页面。
21.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中通过用户接口选择的多个元素可以更新到存储有关账户(18)的明细的区段。
22.根据权利要求21所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区段(18)包括有多个栏目的固定长度区域用于数据存储。
23.根据权利要求22所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述多个栏目包含检索关键词。
24.根据权利要求21至23所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区段(18)具有特定标识,以便无论何时将查询关键词输入系统,该关键词都会与数据检索用的所述区段(18)的检索关键词交叉匹配。
25.根据权利要求24所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区段的所述标识优选为第0行(18)。
26.根据权利要求24所述的电子数据存储、整合、管理、检索以及组织的方法,其中查询关键词是数据库查询语言。
27.根据权利要求26所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述数据库查询语言是结构化查询语言(SQL)。
28.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中通过用户接口选择的多个元素可以更新到存储该账户的活动概略的区域(16)。
29.根据权利要求28所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区域存储可变长度数据。
30.根据权利要求28至29所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区域具有特定标识,以便无论何时电子文档附到系统上,相关数据都更新到所述区域。
31.根据权利要求30所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区域的所述标识优选为第0个文档(16)。
32.根据权利要求28至31所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区域包括至少一个存储账户的活动概略的电子文档(16)。
33.根据权利要求32所述的电子数据存储、整合、管理、检索以及组织的方法,其中存储活动概略(16)的每一个所述电子文档包括唯一标识,以便无论何时请求该账户的相关活动概略,都检索相关的电子文档。
34.根据权利要求28至33所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述区域包括多个用于记录电子文档的页面,这些电子文档存储该账户的活动概略。
35.根据权利要求34所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述多个页面具有从第1页开始的反向页面编号系统。
36.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述存储装置包括至少一个存储数据的虚拟文件夹。
37.根据权利要求36所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述存储装置可以包括多个设计基本上类似的虚拟文件夹。
38.根据权利要求37所述的电子数据存储、整合、管理、检索以及组织的方法,其中,根据存储需要以特定方式设计所述虚拟文件夹。
39.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述电子文档(14)按时间次序附到所述电子页面(12)上以形成该账户完全可追踪的事件序列。
40.根据权利要求2所述的电子数据存储、整合、管理、检索以及组织的方法,其中所述方法还包括给每个电子文档(14)分配优先级并根据所分配的优先级处理每个文档。
41.根据权利要求40所述的电子数据存储、整合、管理、检索以及组织的方法,其中无论何时不止一个电子文档分配有同一优先级,都会根据提交到系统中的日期和时间依次处理这些电子文档。
42.一种计算机程序,具有用来存储、整合、管理、检索以及组织从资源获得的数据的模块,其中执行所述模块生成一种方法,该方法包括以下步骤:
a)将所述获得的数据转换成具有计算机可读的预定结构的电子文档(101);
b)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
c)识别目的地文件以存储所述电子文档(103);
d)检索所述目的地文件的预定电子页面,最近的电子文档记录在该预定电子页面中(104);
e)将所述电子文档按时间次序附到所述被检索的页面上(105);
f)根据所附的所述电子文档的数据来更新所述目的地文件(106);
g)将所述更新后的目的地文件存储在特定存储装置中(107);
所述方法是以账户为中心的非表格驱动的方法,将同一账户的各电子文档(14)分组并存储在同一位置。
43.根据权利要求42所述的计算机程序,其中所述程序还包括给每个电子文档(14)分配优先级并根据所分配的优先级处理每个电子文档(14)。
44.根据权利要求43所述的计算机程序,其中无论何时不止一个电子文档(14)分配有同一优先级,都会根据提交到系统中的日期和时间依次处理这些电子文档(14)。
45.根据权利要求42所述的计算机程序,其中所述存储装置包括至少一个存储数据的虚拟文件夹。
46.根据权利要求45所述的计算机程序,其中所述存储装置可以包括多个设计基本上类似的虚拟文件夹。
47.根据权利要求45至46所述的计算机程序,其中根据存储需要以特定方式设计所述虚拟文件夹。
48.根据权利要求42所述的计算机程序,其中所述程序还包括更新模块。
49.根据权利要求48所述的计算机程序,其中所述更新模块包括由一套更新规则,其中无论何时所述内存设备接收电子文档(14),该处理器都会用更新规则来交叉参引电子文档(14)并相应地更新目的地文件。
50.根据权利要求49所述的计算机程序,其中所述更新规则包括:
i)读取所述暂存装置中存储的所述转换后的电子文档(14);
ii)识别目的地文件以存储所述电子文档(14);
iii)检索所述目的地文件的预定电子页面(12),最近的电子文档(14)记录在该预定电子页面(12)中;
iv)将所述电子文档(14)按时间次序附到所述被检索的页面上;
v)根据所附的所述电子文档(14)的数据来更新所述目的地文件:
vi)一旦将相关电子文档(14)附到并更新到所述目的地文件中就更新所述暂存装置中存储的所述电子文档(14)的处理状态。
51.根据权利要求50所述的计算机程序,其中所述处理状态是示出将电子文档(14)附加和更新到目的地文件中的处理成功或失败的指示。
52.一种计算机系统,包括至少如下设备:(i)处理器;(ii)可操作地耦合到所述处理器上的内存设备;(iii)可操作地耦合到所述处理器上的存储介质;其中所述内存设备存储有模块,由所述处理器执行所述模块而生成方法,该方法包括如下步骤:
a)接收数据(100);
b)将所述获得的数据转换成具有计算机可读的预定结构的电子文档(101);
c)将所述电子文档存储在暂存装置中,所有转换后的数据都存储在该暂存装置中(102);
d)识别目的地文件以存储所述电子文档(103);
e)检索所述目的地文件的预定电子页面,最近的电子文档记录在该预定电子页面中(104);
f)将所述电子文档按时间次序附到所述被检索的页面上(105);
g)根据所附的所述电子文档的数据来更新所述目的地文件(106);
h)将所述更新后的目的地文件存储在特定的存储装置中(107);
所述方法是以账户为中心的非表格驱动的方法,将同一账户的各电子文档(14)分组并存储在同一位置。
53.根据权利要求52所述的计算机系统,其中所述方法还包括步骤:一旦将相关电子文档(14)附到并更新到所述目的地文件中,就更新存储在所述暂存装置中的所述电子文档(14)的处理状态。
54.根据权利要求53所述的计算机系统,其中所述处理状态是示出将电子文档(14)附到和更新到目的地文件中的处理成功或失败的指示。
55.根据权利要求52所述的计算机系统,其中所述方法还包括给每个电子文档(14)分配优先级并根据所分配的优先级处理每个电子文档(14)。
56.根据权利要求55所述的计算机系统,其中无论何时不止一个电子文档(14)分配有同一优先级,都会根据提交到系统中的日期和时间依次处理这些电子文档(14)。
57.根据权利要求52所述的计算机系统,其中所述存储装置包括至少一个存储数据的虚拟文件夹。
58.根据权利要求52所述的计算机系统,其中所述存储装置可以包括多个设计基本上类似的虚拟文件夹。
59.一种用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,该系统包括:
i)存储账户明细的区段(18);
ii)至少一个存储该账户活动概略的电子页面(16);
iii)至少一个存储至少一个电子文档(14)的电子页面(12),该电子文档有按预定结构排布的多个数据,
所述系统是以账户为中心的系统,将同一账户的各电子文档(14)分组并存储在同一位置。
60.根据权利要求59所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述区段(18)是固定长度的区域,该区域包括多个包含检索关键词的栏目。
61.根据权利要求59至60所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述区段(18)具有特定标识,以便无论何时将查询关键词输入系统,该关键词都会与数据检索用的所述区段(18)的检索关键词交叉匹配。
62.根据权利要求61所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述区段的所述标识优选为第0行(18)。
63.根据权利要求59所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述电子文档(14)的所述预定结构是分层次的文档结构。
64.根据权利要求61所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述预定结构包括编码系统以定义所述分层次的文档结构。
65.根据权利要求63至64所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述分层次的文档结构由多个元素形成。
66.根据权利要求65所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述多个元素排布成多列形成字符串(20)。
67.根据权利要求65至66所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述多个元素中的每一个都包括至少一个唯一的元素代码(22)和至少一个元素数据集合(26)。
68.根据权利要求67所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中每个元素由至少一个标记(24)表示。
69.根据权利要求59所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中所述存储装置中每一个可以包括多个设计上基本类似的虚拟文件夹。
70.根据权利要求69所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,该方法具有至少一个有至少一个虚拟文件夹的存储装置,其中根据存储需要以特定方式设计所述虚拟文件夹。
71.根据权利要求59所述的用在关系数据库中的基于计算机的档案系统,该数据库利用非表格驱动的方法,其中根据过账到系统的电子文档的数据来更新所述存储账户明细的区段(18)和所述具有相关账户的活动概略的页面(16)。
72.使用根据权利要求59至71所述的基于计算机的档案系统以存储系统中发生的交易。
73.使用根据权利要求59至71所述的基于计算机的档案系统以存储系统中使用的术语的定义。
74.使用根据权利要求59至71所述的基于计算机的档案系统以存储系统中使用的代码和参数。
75.使用根据权利要求59至71所述的基于计算机的档案系统以存储根据某个标准对账户进行的分组。
76.使用根据权利要求59至71所述的基于计算机的档案系统以存储账户信息。
77.使用根据权利要求59至71所述的基于计算机的档案系统以存储定期且时间上敏感的文档。
78.使用根据权利要求59至71所述的基于计算机的档案系统以存储系统中使用的索引信息用于更快的检索。
79.使用根据权利要求59至71所述的基于计算机的档案系统以存储从账户中取得的信息用于报告生成。
80.使用根据权利要求59至71所述的基于计算机的档案系统以存储审计报告。
81.使用根据权利要求59至71所述的基于计算机的档案系统以存储多媒体或任何其他二进制文件。
82.一种利用权利要求2至41中所述的方法的计算机程序,用于电子数据存储、整合、管理、检索、以及组织中任意一项功能或这些功能的任意组合。
83.一种利用权利要求2至41中所述的方法的计算机系统,用于电子数据存储、整合、管理、检索、以及组织中任意一项功能或这些功能的任意组合。
84.一种利用权利要求2至41中所述方法的用在关系数据库中的基于计算机的档案系统,用于电子数据存储、整合、管理、检索、以及组织中任意一项功能或这些功能的任意组合。
CN200880011840A 2007-03-02 2008-03-03 一种数据存储和管理方法 Pending CN101681366A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
MYPI20070321 MY151687A (en) 2007-03-02 2007-03-02 A method of data storage and management
MYPI20070321 2007-03-02
PCT/MY2008/000017 WO2008108626A1 (en) 2007-03-02 2008-03-03 A method of data storage and management

Publications (1)

Publication Number Publication Date
CN101681366A true CN101681366A (zh) 2010-03-24

Family

ID=39738452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880011840A Pending CN101681366A (zh) 2007-03-02 2008-03-03 一种数据存储和管理方法

Country Status (9)

Country Link
US (1) US20100198881A1 (zh)
EP (1) EP2132659A4 (zh)
JP (1) JP2010520549A (zh)
KR (1) KR20100015368A (zh)
CN (1) CN101681366A (zh)
CA (1) CA2697785A1 (zh)
MY (1) MY151687A (zh)
TW (1) TW200842630A (zh)
WO (1) WO2008108626A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103003803A (zh) * 2010-08-11 2013-03-27 株式会社日立制作所 时序数据处理装置及其方法
CN107656967A (zh) * 2017-08-31 2018-02-02 深圳市盛路物联通讯技术有限公司 一种场景信息处理方法及装置
CN107943661A (zh) * 2017-12-12 2018-04-20 温州市联科科技有限公司 一种数据储存管理系统
CN109791542A (zh) * 2016-09-28 2019-05-21 迈克菲有限责任公司 查询优化的分布式分类账系统
CN109844783A (zh) * 2016-09-30 2019-06-04 亚马逊技术有限公司 不可变的密码保护的分类账支持的数据库
CN109918081A (zh) * 2019-03-01 2019-06-21 中安智联未来有限公司 一种编译方法及编译器
CN110443590A (zh) * 2019-08-27 2019-11-12 山东方明药业集团股份有限公司 一种电子人力资源档案管理系统及其管理方法
CN110582988A (zh) * 2017-03-10 2019-12-17 爱迪德技术有限公司 安全的系统操作
CN116795296A (zh) * 2023-08-16 2023-09-22 中移(苏州)软件技术有限公司 一种数据存储方法、存储设备及计算机可读存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080320377A1 (en) * 2007-06-25 2008-12-25 France Telecom Document management system
WO2010147454A1 (en) * 2009-06-16 2010-12-23 Emanual System Sdn Bhd System and method of binary data storage and management in database management systems
TWI396987B (zh) * 2009-11-03 2013-05-21 Wistron Corp 儲存檔案於一網路儲存裝置的方法及應用該方法的網路儲存裝置
WO2016060551A1 (en) * 2014-10-13 2016-04-21 Kim Seng Kee A method for mining electronic documents and system thereof
GB2546912A (en) * 2014-10-13 2017-08-02 Seng Kee Kim Emulating manual system of filing using electronic document and electronic file
SG11201702939PA (en) * 2014-10-13 2017-05-30 Kim Seng Kee Electronic processing system for electronic document and electronic file
MY172251A (en) * 2014-10-13 2019-11-19 E Manual System Sdn Bhd System generator module for electronic document and electronic filing
CN104966040B (zh) * 2015-05-29 2018-04-17 上海爱数信息技术股份有限公司 一种基于扫码机制的案件文档快速追踪方法
CN105138564A (zh) * 2015-07-23 2015-12-09 小米科技有限责任公司 数据文件的读取方法及装置
WO2017074174A1 (en) * 2015-10-30 2017-05-04 Kim Seng Kee A system and method for processing big data using electronic document and electronic file-based system that operates on rdbms

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63273947A (ja) * 1987-04-24 1988-11-11 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション デ−タベ−ス・システム
JPH08506911A (ja) * 1992-11-23 1996-07-23 パラゴン、コンセプツ、インコーポレーテッド ファイル・アクセスを行うためにユーザーがカテゴリを選択するコンピュータ・ファイリング・システム
US6009442A (en) * 1997-10-08 1999-12-28 Caere Corporation Computer-based document management system
US7117208B2 (en) * 2000-09-28 2006-10-03 Oracle Corporation Enterprise web mining system and method
JP5525673B2 (ja) * 2000-09-28 2014-06-18 オラクル・インターナショナル・コーポレイション エンタープライズウェブマイニングシステム及び方法
US20030220823A1 (en) * 2002-03-27 2003-11-27 Sartorius Peter J. System for providing web-based case management

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103003803A (zh) * 2010-08-11 2013-03-27 株式会社日立制作所 时序数据处理装置及其方法
CN103003803B (zh) * 2010-08-11 2016-08-03 株式会社日立制作所 时序数据处理装置及其方法
CN109791542B (zh) * 2016-09-28 2023-10-27 迈克菲有限责任公司 查询优化的分布式分类账系统
CN109791542A (zh) * 2016-09-28 2019-05-21 迈克菲有限责任公司 查询优化的分布式分类账系统
CN109844783B (zh) * 2016-09-30 2023-11-07 亚马逊技术有限公司 不可变的密码保护的分类账支持的数据库
CN109844783A (zh) * 2016-09-30 2019-06-04 亚马逊技术有限公司 不可变的密码保护的分类账支持的数据库
CN110582988A (zh) * 2017-03-10 2019-12-17 爱迪德技术有限公司 安全的系统操作
US11606211B2 (en) 2017-03-10 2023-03-14 Irdeto B.V. Secured system operation
CN107656967A (zh) * 2017-08-31 2018-02-02 深圳市盛路物联通讯技术有限公司 一种场景信息处理方法及装置
CN107943661A (zh) * 2017-12-12 2018-04-20 温州市联科科技有限公司 一种数据储存管理系统
CN109918081A (zh) * 2019-03-01 2019-06-21 中安智联未来有限公司 一种编译方法及编译器
CN109918081B (zh) * 2019-03-01 2022-06-03 中安智联未来有限公司 一种编译方法及编译器
CN110443590A (zh) * 2019-08-27 2019-11-12 山东方明药业集团股份有限公司 一种电子人力资源档案管理系统及其管理方法
CN110443590B (zh) * 2019-08-27 2023-06-30 山东方明药业集团股份有限公司 一种电子人力资源档案管理系统及其管理方法
CN116795296A (zh) * 2023-08-16 2023-09-22 中移(苏州)软件技术有限公司 一种数据存储方法、存储设备及计算机可读存储介质
CN116795296B (zh) * 2023-08-16 2023-11-21 中移(苏州)软件技术有限公司 一种数据存储方法、存储设备及计算机可读存储介质

Also Published As

Publication number Publication date
US20100198881A1 (en) 2010-08-05
EP2132659A4 (en) 2011-03-30
TW200842630A (en) 2008-11-01
EP2132659A1 (en) 2009-12-16
KR20100015368A (ko) 2010-02-12
JP2010520549A (ja) 2010-06-10
WO2008108626A1 (en) 2008-09-12
CA2697785A1 (en) 2008-09-12
MY151687A (en) 2014-06-30

Similar Documents

Publication Publication Date Title
CN101681366A (zh) 一种数据存储和管理方法
US8386435B2 (en) Searchable archive
CN109952568B (zh) 用于高速搜索或过滤大数据集的系统和方法
Sumbaly et al. The big data ecosystem at linkedin
CN101553813B (zh) 管理可单独访问的数据单元的存储器
Lightstone et al. Physical Database Design: the database professional's guide to exploiting indexes, views, storage, and more
US5317729A (en) Method for the storage of multi-versioned data with retrieval based on searched query
CN101311930B (zh) 具有重复值的表的块压缩
CN101127034A (zh) 面向变化的电子表格应用
CN103177061A (zh) 分区表中的唯一值估计
CN102023979A (zh) 元数据管理方法及系统
CN103902698A (zh) 一种数据存储系统和存储方法
CN1639682A (zh) 在线索化应用中高效存储缩进式线索
CN103853802B (zh) 用于索引电子内容的装置和方法
CN104769635A (zh) 可互操作的病例系列系统
CN102346744A (zh) 用于在多租户应用系统中处理物化表的装置
CN101963993B (zh) 一种数据库单表记录快速查找的方法
US20130060740A1 (en) Data managing method, apparatus, and recording medium of program, and searching method, apparatus, and medium of program
CN111008235A (zh) 一种基于Spark的小文件合并方法及系统
CN111708895A (zh) 一种知识图谱系统的构建方法及装置
CN102567544A (zh) 数据库查询方法及装置
CN102323956A (zh) 数据管理装置和数据管理方法
US11093509B2 (en) Data processing system for curating search result facets
CN111881323B (zh) 基于排序字段与时间路由的表分离方法
Simon et al. Aspects of the Long-Term Preservation of Digitized Catalogue Data: Analysis of the Databases of Integrated Collection Management Systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100324