CN1783063A - 历史数据归档和查询装置及方法 - Google Patents
历史数据归档和查询装置及方法 Download PDFInfo
- Publication number
- CN1783063A CN1783063A CN 200410096255 CN200410096255A CN1783063A CN 1783063 A CN1783063 A CN 1783063A CN 200410096255 CN200410096255 CN 200410096255 CN 200410096255 A CN200410096255 A CN 200410096255A CN 1783063 A CN1783063 A CN 1783063A
- Authority
- CN
- China
- Prior art keywords
- filing
- data
- time
- record
- history lists
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种计算机领域中历史数据查询和归档装置及方法,所述方法中归档部分包括(1)根据具体情况选择归档类型、归档方式;(2)根据归档类型查找历史表元数据信息表得到需要归档的历史表和历史表的归档字段;(3)查找归档字段在此时间范围的记录,将记录以文本文件的方式保存在本地硬盘上;(4)将本次归档的历史表名,归档字段名,时间范围,记录数以文本文件的方式保存在归档备注文件中,同时修改历史表元数据信息表中相应历史表的归档时间。本发明克服现有技术中不能对部分库表,甚至单个库表进行归档,及效率低下、容易造成数据库中表空间满表溢出、用户掌握复杂的缺点,能够有效对部分库表直接查询归档、高效高稳定性而且简单。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种历史数据的归档和查询方法。
背景技术
历史数据的归档和查询在任何大型关系型数据库应用系统中都是一个不可或缺的功能。尤其在通讯行业,为了评估系统的近期性能必须要有性能历史数据。利用这些性能历史数据可进行故障的区段定位。当积累了较多的性能历史数据后,对性能历史数据的查询分析可预测将来可能发生的故障,对系统的维护是很有用的。
现有的应用系统一般是通过数据库管理系统DBMS(如:Sybase和Microsoft SQL Server)的备份归档工具实现。以Microsoft SQL Server为例,机械工业出版社出版的《SQL Server 7关系数据库系统管理与开发指南》提供了三种归档方式:完全归档——归档所有数据库对象、事务日志和数据;增量归档——归档从最近一次完全归档开始以来所有的数据;日志归档——归档从最近一次日志归档开始以来所有日志。
以上三种方式都是对整个数据库进行归档,包括数据库对象、数据结构、数据都进行了归档。如果用户要求对部分库表,甚至单个库表进行归档,则现有的方式不能满足要求。而且该三种方式不支持直接查询归档文件,如果用户要求查询归档文件中满足条件的记录,则只能将历史数据全部恢复到数据库中再查询,显然效率低下,也费时费力。另外由于历史数据量大,如果将历史数据全部恢复到数据库中再查询极易造成表空间满、表溢出的情况。最后,现有工具面向具有数据库系统知识的数据库管理员,对于普通用户不易掌握。
发明内容
本发明所要解决的技术问题是克服现有技术中不能对部分库表,甚至单个库表进行归档,以及效率低下、容易造成数据库中表空间满表溢出、用户掌握复杂的缺点,以期提出一种能够有效对部分库表直接查询归档、高效高稳定性而且简单的历史数据归档和查询装置及方法。
本发明所述历史数据查询和归档装置包括归档备注文件、归档模块和归档管理装载器;
所述归档备注文件在每完成一种类型的归档后,记录所归档的历史表名、归档字段、归档时间范围和归档记录数等信息;
所述归档模块具体完成数据的归档和装载,在查询归档文件时,为了提高查询效率,将归档数据装载到数据库管理系统的临时库中;
所述归档装载管理器负责在装载归档文件时,判断临时数据库是否有足够的自由空间,如果不满足则删除最近未使用的装载表。
所述历史数据查询和归档方法包括以下步骤:
第一步:准备工作
(1)在数据库中建立历史表元数据信息表;
(2)建立历史表记录限制链表,保存历史表记录大小。
(3)在数据库中建立归档装载信息表;
(4)建立归档装载信息链表。
第二步:归档历史数据
(1)根据具体情况选择归档类型、归档方式;
(2)根据归档类型查找历史表元数据信息表得到需要归档的历史表和历史表的归档字段。在数据库中以表的形式保存需要归档的历史表、历史表的归档字段及上次进行归档操作的时间。如果归档方式为增量归档,依据该信息表,得出此次归档的时间范围为上次归档操作的时间到当前时间。如果归档为全量归档,需归档所有数据,时间范围也需包括所有数据;
(3)查找归档字段在此时间范围的记录,将记录以文本文件的方式保存在本地硬盘上;
(4)将本次归档的历史表名,归档字段名,时间范围,记录数以文本文件的方式保存在归档备注文件中,同时修改历史表元数据信息表中相应历史表的归档时间。
第三步:检索归档文件
(1)根据具体情况灵活选择查询的归档类型和时间范围,形成查询条件;
(2)根据查询条件检索归档目录下的归档备注文件,找出满足条件的归档文件;
(3)根据归档文件名得到装载的数据库表;
(3.1)查找归档是否已装载到临时数据库,如找到,则修改归档装载信息表的访问时间,转(4);
(3.2)判断临时数据库是否有足够的自由空间;
(3.3)如不满足步骤(3.2)所述条件,根据归档装载信息链表中的各装载数据表的访问时间删除最近未访问的数据表,直到满足对临时数据库自由空间的要求;
(3.4)在临时数据库中创建数据库表,将数据恢复到该表;
(3.5)将创建的库表信息加入归档装载信息链表,并修改访问时间
(4)返回表中满足条件的记录。
本发明所述方法与现有的归档技术相比,可自由选择任意归档类型、任意时间范围的历史数据。而且由于使用归档备注文件的方式记录每次归档的信息,使装载历史数据时可有条件的选择部分数据进行装载。由于使用归档装载管理器,可提供高效快速地从归档文件查询满足条件的历史数据,充分利用了临时数据库的资源,避免了数据空间的浪费。另外,用户查询某个归档数据文件前,可查看归档备注文件,以确定是否查询。本发明所述方法支持不同的数据库,不同的操作平台。对操作人员的要求不高,无需知道数据库的结构和对象就可进行归档操作。查询归档文件时只需选择归档类型输入查询的时间范围即可。本发明适用于大型数据库应用系统中对历史数据需要归档及查询的情况。
附图说明
图1是本发明所述方法中归档历史数据流程图。
图2是本发明所述方法中查询归档历史数据的流程图。
图3是本发明所述方法中归档装载管理器的流程图。
具体实施方式
下面结合附图和具体实施实例对本发明作进一步的详细描述:
1)准备工作
1.根据数据来源划分历史表所属的归档类型:告警类型、性能类型和日志类型;
2.归档方式分为全量归档和增量归档;
3.在数据库中建立历史表元数据信息表,字段包括归档类型、历史表的表名、归档字段、归档时间。归档操作完成后需修改相应历史表的归档时间。
4.建立历史表记录限制链表,保存历史表记录大小。
5.在数据库中建立归档装载信息表,字段包括归档目录、归档名称、起始时间、终止时间、装载表名、装载表记录数、装载表访问时间。主要是在归档装载管理器中对其进行访问。归档装载信息表保存了归档装载的信息,每装载一个归档需同步修改归档装载信息表,在卸载归档时也需同步修改归档装载信息表。
6.建立归档装载信息链表,保存已经装载的转储信息,与归档装载信息表进行同步修改。
2)归档历史数据
图1给出了具体归档流程。
步骤1:输入归档类型和归档方式;
步骤2:检索历史表元数据信息表,找出该归档类型的历史表;
步骤3:对每一个历史表进行归档,如下表所示:
字段名1,字段名2,字段名3,字段名4,字段名5,......数据01, 数据02, 数据03, 数据04, 数据05,......数据11, 数据12, 数据13, 数据14, 数据15,......数据21, 数据22, 数据23, 数据24, 数据25,.................. |
步骤3.1:如果是增量归档,从历史表元数据信息表的归档时间字段得到上次归档时间,则本次归档时间范围为上次归档时间到当前时间。如果是全量归档,需归档全部记录,时间范围从1970年1月1日0点0分开始到当前时间。
步骤3.2:根据时间范围从历史表中找出满足条件的记录。
步骤3.3:将字段名写入数据文件第一行。
步骤3.4:读取每一条记录,依字段顺序,写入各个字段的值。
步骤4:将本次操作的归档表名,归档字段,时间范围,记录数等以文本文件的方式保存在归档备注文件中。并修改历史表元数据信息表中相应历史表的归档时间。
下表给出了归档备注文件的格式。
归档程序的版本归档操作的日期时间归档类型该归档类型的历史表个数历史表名1归档字段1起始时间1终止时间1归档文件名1记录数1历史表名2归档字段2起始时间2终止时间2归档文件名2记录数2 |
3)查询归档历史数据
图2给出了查询归档数据的流程。
步骤1:输入归档类型、起始时间和终止时间;
步骤2:从历史表元数据信息表中检索出该归档类型的历史表。搜索归档目录下所有的归档备注文件,找出历史表在此时间范围的归档文件名;
步骤3:检索归档装载信息表,根据归档文件名得到装载的数据库表,同时修改归档访问时间为当前时间。对于没有装载的归档文件,需通过归档装载管理器进行装载。归档装载管理器的流程图如图3所示;
步骤3.1:检索归档装载信息表,根据归档文件名得到装载的数据库表,同时修改归档访问时间为当前时间。转步骤4;
步骤3.2:对于没找到装载表的归档文件,需进行装载。
步骤3.2.1:读取该归档的备注文件,得到归档数据文件的记录数;
步骤3.2.2:根据历史表记录限制链表计算归档数据所需的空间;
步骤3.2.3:检查临时库是否有足够的未使用空间,如果不满足,需检索归档装载信息链表,根据归档访问时间卸载临时库中最近未访问的归档,卸载的同时修改归档装载信息链表和归档装载信息表。当临时库满足对自由空间的要求时停止卸载操作;
步骤3.2.4:在临时库中创建临时表并装载归档数据文件,同时修改归档装载信息表和归档装载信息链表。
步骤4:返回装载表中满足时间范围的记录。
Claims (5)
1、一种历史数据查询和归档装置,其特征在于,包括归档备注文件、归档模块和归档管理装载器;
所述归档备注文件在每完成一种类型的归档后,记录所归档的历史表名、归档字段、归档时间范围和归档记录数等信息;
所述归档模块具体完成数据的归档和装载,将归档数据装载到数据库管理系统的临时库中;
所述归档装载管理器负责在装载归档文件时,判断临时数据库是否有足够的自由空间,如果不满足则删除最近未使用的装载表。
2、一种历史数据查询和归档方法,其特征在于,包括以下步骤:
第一步:准备工作;
第二步:归档历史数据;
(1)根据具体情况选择归档类型、归档方式;
(2)根据归档类型查找历史表元数据信息表,得到需要归档的历史表和历史表的归档字段,在数据库中以表的形式保存需要归档的历史表、历史表的归档字段及上次进行归档操作的时间;
(3)查找归档字段在此时间范围的记录,将记录以文本文件的方式保存在本地硬盘上;
(4)将本次归档的历史表名、归档字段名、时间范围、记录数以文本文件的方式保存在归档备注文件中,同时修改历史表元数据信息表中相应历史表的归档时间;
第三步:检索归档文件
(1)根据具体情况灵活选择查询的归档类型和时间范围,形成查询条件;
(2)根据查询条件检索归档目录下的归档备注文件,找出满足条件的归档文件;
(3)根据归档文件名得到装载的数据库表;
(4)返回表中满足条件的记录。
3、根据权利要求2所述的历史数据查询和归档方法,其特征在于,所述第一步进一步包括以下步骤:
(1)在数据库中建立历史表元数据信息表;
(2)建立历史表记录限制链表,保存历史表记录大小;
(3)在数据库中建立归档装载信息表;
(4)建立归档装载信息链表。
4、根据权利要求2所述的历史数据查询和归档方法,其特征在于,所述第二步(2)中,如果归档方式为增量归档,依据该信息表,得出此次归档的时间范围为上次归档操作的时间到当前时间;如果归档为全量归档,需归档所有数据,时间范围也需包括所有数据。
5、根据权利要求2所述的历史数据查询和归档方法,其特征在于,所述第三步(3)进一步包括以下步骤:
(3.1)查找归档是否已装载到临时数据库,如找到,则修改归档装载信息表的访问时间,转(4);
(3.2)判断临时数据库是否有足够的自由空间;
(3.3)如不满足步骤(3.2)所述条件,根据归档装载信息链表中的各装载数据表的访问时间删除最近未访问的数据表,直到满足对临时数据库自由空间的要求;
(3.4)在临时数据库中创建数据库表,将数据恢复到该表;
(3.5)将创建的库表信息加入归档装载信息链表,并修改访问时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100962559A CN100367278C (zh) | 2004-11-29 | 2004-11-29 | 历史数据归档和查询装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100962559A CN100367278C (zh) | 2004-11-29 | 2004-11-29 | 历史数据归档和查询装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1783063A true CN1783063A (zh) | 2006-06-07 |
CN100367278C CN100367278C (zh) | 2008-02-06 |
Family
ID=36773260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100962559A Expired - Fee Related CN100367278C (zh) | 2004-11-29 | 2004-11-29 | 历史数据归档和查询装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100367278C (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101344893B (zh) * | 2008-07-17 | 2010-06-02 | 中兴通讯股份有限公司 | 一种历史数据的存取方法和装置 |
CN101261693B (zh) * | 2007-03-09 | 2011-06-29 | 上海宝信软件股份有限公司 | 一种计算机应用系统中的数据归档方法 |
CN101639839B (zh) * | 2008-07-30 | 2011-10-26 | 中兴通讯股份有限公司 | 一种基于临时表的多归档文件查询方法 |
CN102262626A (zh) * | 2010-05-24 | 2011-11-30 | 阿里巴巴集团控股有限公司 | 一种数据库存储数据的方法及装置 |
CN101667180B (zh) * | 2008-09-03 | 2012-10-17 | 神讯电脑(昆山)有限公司 | 数据库空间管理系统及其方法 |
CN103778176A (zh) * | 2012-10-18 | 2014-05-07 | 西门子公司 | Mes系统中数据的长期归档 |
CN103810060A (zh) * | 2013-11-21 | 2014-05-21 | 北京奇虎科技有限公司 | 基于分布式数据库的数据备份方法及其系统 |
CN104142930A (zh) * | 2013-05-06 | 2014-11-12 | Sap股份公司 | 通用δ数据装载 |
CN105677685A (zh) * | 2014-11-21 | 2016-06-15 | 中芯国际集成电路制造(天津)有限公司 | 数据库系统及于数据库系统中存储和查询数据的方法 |
CN105808749A (zh) * | 2016-03-14 | 2016-07-27 | 北京广利核系统工程有限公司 | 一种用于核电站的历史存储方法 |
CN106302751A (zh) * | 2016-08-17 | 2017-01-04 | 中国联合网络通信集团有限公司 | 电子档案的归档方法、接口服务器和归档系统 |
CN106909977A (zh) * | 2017-01-18 | 2017-06-30 | 四川航空股份有限公司 | 航空电子票务系统 |
CN107609170A (zh) * | 2017-09-28 | 2018-01-19 | 武汉汉邦世成信息技术有限公司 | 一种数据归档速查方法及系统 |
CN109583842A (zh) * | 2018-12-04 | 2019-04-05 | 北京诺士诚国际工程项目管理有限公司 | 一种监理月报生成方法、装置、电子设备及计算机存储介质 |
CN110019117A (zh) * | 2017-09-28 | 2019-07-16 | 中国石油化工股份有限公司 | 一种数据归档方法及装置 |
CN111538699A (zh) * | 2020-03-31 | 2020-08-14 | 首钢京唐钢铁联合有限责任公司 | 一种数据归档方法及装置 |
CN113111032A (zh) * | 2021-04-20 | 2021-07-13 | 河南水利与环境职业学院 | 一种档案管理系统数据归档方法和系统 |
CN117971839A (zh) * | 2024-03-29 | 2024-05-03 | 平凯星辰(北京)科技有限公司 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5838964A (en) * | 1995-06-26 | 1998-11-17 | Gubser; David R. | Dynamic numeric compression methods |
US6006232A (en) * | 1997-10-21 | 1999-12-21 | At&T Corp. | System and method for multirecord compression in a relational database |
JP2001282820A (ja) * | 2000-01-25 | 2001-10-12 | Sony Corp | データ圧縮方法、検索方法、検索装置、データパケット信号および記録媒体 |
-
2004
- 2004-11-29 CN CNB2004100962559A patent/CN100367278C/zh not_active Expired - Fee Related
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261693B (zh) * | 2007-03-09 | 2011-06-29 | 上海宝信软件股份有限公司 | 一种计算机应用系统中的数据归档方法 |
CN101344893B (zh) * | 2008-07-17 | 2010-06-02 | 中兴通讯股份有限公司 | 一种历史数据的存取方法和装置 |
CN101639839B (zh) * | 2008-07-30 | 2011-10-26 | 中兴通讯股份有限公司 | 一种基于临时表的多归档文件查询方法 |
CN101667180B (zh) * | 2008-09-03 | 2012-10-17 | 神讯电脑(昆山)有限公司 | 数据库空间管理系统及其方法 |
CN102262626A (zh) * | 2010-05-24 | 2011-11-30 | 阿里巴巴集团控股有限公司 | 一种数据库存储数据的方法及装置 |
CN102262626B (zh) * | 2010-05-24 | 2013-08-07 | 阿里巴巴集团控股有限公司 | 一种数据库存储数据的方法及装置 |
CN103778176B (zh) * | 2012-10-18 | 2019-01-01 | 西门子公司 | 用于mes系统中数据长期归档的系统、方法及计算机可用介质 |
CN103778176A (zh) * | 2012-10-18 | 2014-05-07 | 西门子公司 | Mes系统中数据的长期归档 |
CN104142930A (zh) * | 2013-05-06 | 2014-11-12 | Sap股份公司 | 通用δ数据装载 |
CN104142930B (zh) * | 2013-05-06 | 2019-09-13 | Sap欧洲公司 | 通用δ数据装载 |
CN103810060A (zh) * | 2013-11-21 | 2014-05-21 | 北京奇虎科技有限公司 | 基于分布式数据库的数据备份方法及其系统 |
CN105677685A (zh) * | 2014-11-21 | 2016-06-15 | 中芯国际集成电路制造(天津)有限公司 | 数据库系统及于数据库系统中存储和查询数据的方法 |
CN105808749B (zh) * | 2016-03-14 | 2019-12-06 | 北京广利核系统工程有限公司 | 一种用于核电站的历史存储方法 |
CN105808749A (zh) * | 2016-03-14 | 2016-07-27 | 北京广利核系统工程有限公司 | 一种用于核电站的历史存储方法 |
CN106302751A (zh) * | 2016-08-17 | 2017-01-04 | 中国联合网络通信集团有限公司 | 电子档案的归档方法、接口服务器和归档系统 |
CN106909977A (zh) * | 2017-01-18 | 2017-06-30 | 四川航空股份有限公司 | 航空电子票务系统 |
CN107609170A (zh) * | 2017-09-28 | 2018-01-19 | 武汉汉邦世成信息技术有限公司 | 一种数据归档速查方法及系统 |
CN110019117A (zh) * | 2017-09-28 | 2019-07-16 | 中国石油化工股份有限公司 | 一种数据归档方法及装置 |
CN107609170B (zh) * | 2017-09-28 | 2020-07-03 | 武汉汉邦世成信息技术有限公司 | 一种数据归档速查方法及系统 |
CN109583842A (zh) * | 2018-12-04 | 2019-04-05 | 北京诺士诚国际工程项目管理有限公司 | 一种监理月报生成方法、装置、电子设备及计算机存储介质 |
CN111538699A (zh) * | 2020-03-31 | 2020-08-14 | 首钢京唐钢铁联合有限责任公司 | 一种数据归档方法及装置 |
CN113111032A (zh) * | 2021-04-20 | 2021-07-13 | 河南水利与环境职业学院 | 一种档案管理系统数据归档方法和系统 |
CN113111032B (zh) * | 2021-04-20 | 2022-03-08 | 河南水利与环境职业学院 | 一种档案管理系统数据归档方法和系统 |
CN117971839A (zh) * | 2024-03-29 | 2024-05-03 | 平凯星辰(北京)科技有限公司 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN100367278C (zh) | 2008-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1783063A (zh) | 历史数据归档和查询装置及方法 | |
US20220197886A1 (en) | Selecting partitions for reclustering based on distribution of overlapping partitions | |
CN100485689C (zh) | 基于文件系统缓存的数据加速查询方法 | |
CN100345143C (zh) | 数据处理方法和装置 | |
US8352458B2 (en) | Techniques for transforming and loading data into a fact table in a data warehouse | |
US6879984B2 (en) | Analytical database system that models data to speed up and simplify data analysis | |
US8037059B2 (en) | Implementing aggregation combination using aggregate depth lists and cube aggregation conversion to rollup aggregation for optimizing query processing | |
CN1277231C (zh) | 从远程数据源加载数据 | |
US8126873B2 (en) | Portable and iterative re-usable suboptimization of database queries | |
CN1975731A (zh) | 用于管理对数据库中数据的访问的系统和方法 | |
US20050076018A1 (en) | Sorting result buffer | |
CN1426004A (zh) | 单元设计装置与方法 | |
CN101039278A (zh) | 数据管理方法及系统 | |
CN1251088C (zh) | 目标集成管理系统 | |
CN1731364A (zh) | 数据库备份数据的压缩和检索方法 | |
CN104636502A (zh) | 一种查询系统的数据加速查询方法 | |
CN101079124A (zh) | 将企业信息转换成电子媒体并进行行业排序的方法 | |
CN1866251A (zh) | 一种减少分页数据检索时间的方法及装置 | |
CN1345426A (zh) | 用于提取索引关键字数据字段的系统和方法 | |
CN1635494A (zh) | 实现类内存数据库存取和检索的方法 | |
CN1790334A (zh) | 文档管理系统和文档管理方法 | |
CN1351299A (zh) | 一种访问数据库的方法及装置 | |
CN1191540C (zh) | 为文本文档语料库建立索引的方法和装置 | |
CN115391346A (zh) | 数据库聚合索引的生成方法、存储介质与计算机设备 | |
CN1237445C (zh) | 分布式文件系统快速路径解析的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080206 Termination date: 20141129 |
|
EXPY | Termination of patent right or utility model |