CN101853287B - 数据压缩快速检索文件系统及其方法 - Google Patents

数据压缩快速检索文件系统及其方法 Download PDF

Info

Publication number
CN101853287B
CN101853287B CN201010180814XA CN201010180814A CN101853287B CN 101853287 B CN101853287 B CN 101853287B CN 201010180814X A CN201010180814X A CN 201010180814XA CN 201010180814 A CN201010180814 A CN 201010180814A CN 101853287 B CN101853287 B CN 101853287B
Authority
CN
China
Prior art keywords
data
file
compression
generate
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010180814XA
Other languages
English (en)
Other versions
CN101853287A (zh
Inventor
缪治国
户保银
朱化国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING GAOPU SCIENTIFICE AND TECHNOLOGICAL CO Ltd
Original Assignee
NANJING GAOPU SCIENTIFICE AND TECHNOLOGICAL CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING GAOPU SCIENTIFICE AND TECHNOLOGICAL CO Ltd filed Critical NANJING GAOPU SCIENTIFICE AND TECHNOLOGICAL CO Ltd
Priority to CN201010180814XA priority Critical patent/CN101853287B/zh
Publication of CN101853287A publication Critical patent/CN101853287A/zh
Application granted granted Critical
Publication of CN101853287B publication Critical patent/CN101853287B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种数据压缩快速检索文件系统及其方法,该系统包括:数据生成系统,用于将其他系统定义的数据文件或者其他类型数据库中的表数据转进行压缩生成压缩数据文件,同时生成系统索引文件和数据结构信息文件;请求连接处理系统,用于建立与客户端的连接;数据查询系统,用于收取客户端的连接,并分析客户端具体查询语句,并分析数据结构信息文件和索引文件,然后检索数据文件并将检索的数据返回;权限管理系统,用于建立用户并分配用户权限;数据恢复系统,用于将指定的数据文件恢复为其他类型数据库表或者其他系统定义的数据文件;数据实体系统,包括有数据结构信息文件,数据检索索引文件,数据文件。

Description

数据压缩快速检索文件系统及其方法
技术领域
本发明属于数据检索系统领域。尤其涉及需要进行数据压缩同时又要求支持快速查询的应用系统。
背景技术
在数据检索系统领域,目前普遍的做法是基于普通数据库技术实现的数据检索技术。普通数据库方式由于数据库采用了封装后特定的数据文件,外界无法对其数据进行直接压缩,如将多个表数据保存在同一个数据库中,外界无法直接分析其表数据,同时数据查询效率由于数据修改及事物处理等功能以及当前存储数据为海量数据等的影响无法保证快速的查询速度。
随着社会和经济的快速发展,社会生产和消费活动增长迅速,社会各个领域的需要保存的数据量大大增加。特别是在线事务处理系统随着用户量的增长和营业时间的积累,一些事件记录的数据正在膨胀,如通信领域运营商历史帐单数据,历史服务记录,通话详细记录数据等。它们的共同特点是数据量大,数据为静态,因为都是对一些已经发生并且确认的业务的原始记录,并不允许对这些数据做修改;远期数据访问频率低,近期数据频繁访问。为了降低系统建设成本,仅在线保存最近一段时间的数据。为了在有限的资源中提供更长、更及时的数据服务,需要提供更节约、更有效的数据服务系统。
因此,对历史和实时数据进行统一压缩存储管理和统计、查询,引入数据压缩存储快速检索文件系统,借以减小数据的在线查询时间、提高查询速度、减少数据保存和备份空间。这是提高服务质量、提高服务效率、节约成本的一种手段,也是统一管理,加强管控,方便用户使用的必然趋势。目前存在对历史和实时数据进行统一压缩存储管理的需求,可以给客户提高服务质量、提高服务效率、节约成本。
发明内容
为了概括本发明的目的,在这里描述了本发明的某些方面、优点和新颖特征。应了解,无需所有这些方面、优点和特征包含在任一特殊的实施例中。
为解决现有技术存在的问题和不足之处,本发明提供了一种数据压缩存储快速检索文件系统,从根本上改变传统数据库数据检索的实现方式,使对海量数据的检索不再是进行从大数据量中检索数据,而是对在线高比例压缩数据进行检索,同时提供快速的数据检索速度。
为了达到上述目的,本发明提供了一种数据压缩存储快速检索文件系统的方法:原始数据迁移,系统分析数据源并将数据源数据迁移到本系统中,以本系统自定义格式的临时文件保存;数据压缩生成,将临时保存的数据进行压缩处理生成压缩数据文件,同时生成指定数量的索引,然后将生成的数据录入到本文件系统中;数据检索,当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,然后分析请求的SQL语句,最后将请求的具体消息发送到数据引擎模块;数据恢复,将指定的数据文件恢复为其他系统定义的数据文件或者其他类型数据库表,提供特定的恢复工具。
本发明提供了一种数据压缩快速检索文件系统,该系统包括:数据生成系统,请求连接处理系统,数据查询系统,权限管理系统,数据恢复系统,数据实体系统。
本发明提供,数据生成系统,包括:数据迁移模块,用于将其他系统定义的数据文件或者其他类型数据库中的表数据转为系统自定义格式的临时文件,生成临时文件时需预定义数据记录结构信息;数据压缩模块,用于读取数据生成模块生成的临时文件并进行压缩生成压缩数据文件,同时生成数据检索索引文件和数据结构信息文件。
本发明还提供,请求连接处理系统,包括:连接请求管理部分,用于建立与客户端的连接,并将连接信息提交给权限管理系统,同时保证连接的稳定性;连接分发部分,用于生成查询请求对应的新的操作系统线程并将生成新的线程并将连接交给新线程,同时在任务完成后负责线程的回收工作。
本发明还提供,数据查询系统,包括:数据库外壳模块,用于收取客户端的连接,并分析客户端具体查询语句,最终将请求消息发送至数据搜索引擎获取查询数据,并将查询数据发送到查询客户端;数据搜索引擎,用于响应查询语句消息并分析数据结构信息文件和索引文件,根据索引文件定位数据记录位置,然后检索数据文件并将检索的数据返回到数据库外壳部分。
本发明还提供,权限管理系统,包括:查询用户权限处理部分,用于建立用户并分配用户权限,同时根据查询请求用户信息分配权限;查询信息控制部分,当客户端以某用户身份登录系统服务时,根据其权限处理SQL语句并返回相应权限的查询数据;
本发明还提供,数据恢复系统,包括:数据库方式恢复部分,用于将指定的数据文件恢复为其他类型数据库表;文件方式恢复部分,用于将指定的数据文件恢复为其他系统定义的数据文件。
本发明还提供,数据实体系统,包括:数据结构信息文件,数据检索索引文件,压缩数据文件。
附图说明
图1为本发明基于移动运营商的系统网络结构图;
图2为本发明的系统结构框图;
图3为本发明数据迁移的流程图;
图4为本发明数据压缩流程图;
图5为本发明数据检索流程图;
图6为本发明数据恢复流程图。
具体实施方式
下面结合说明书附图和具体实施方式对本发明作进一步的描述。
图1是本发明基于移动运营商的系统网络结构图。图1所示的数据压缩快速检索文件系统网络包括:生产系统1,生产系统实时产生用户话单;计费中心2,处理生成的详细话单最终产生确定的业务话单数据;数据检索服务器3,数据检索服务器包括数据生成工具用于从数据源导入数据到本系统中,数据检索模块用于从数据库数据文件中检索出相应的数据并返回到客户端;接口平台4,接口平台根据不同用户的请求访问数据检索服务器并获取特定的检索数据,然后返回到请求的用户;数据恢复中心5,数据恢复中心为系统需要备份或者恢复时的数据解压恢复服务器;自助打印机6,自助打印机为营业厅提供自助打印服务的打印设备,用户可以打印话单,数据从数据检索服务器经接口平台转发而来;客户服务中心7,客户服务中心为运营商提供客服服务的机构,用户可以请求话单查询服务,数据从数据检索服务器经接口平台转发而来;网上营业厅8,网上营业厅为运营商提供查询等服务的网络平台,用户可以进行话单查询,数据从数据检索服务器经接口平台转发而来。
图2是本发明的系统结构框图。本系统包括:数据生成工具1-1,数据迁移部分将系统定义的数据文件或者其他数据库中的表数据转为系统自定义格式的临时文件,数据压缩部分读取数据生成模块生成的临时文件并进行压缩生成压缩数据文件,同时生成系统索引文件和数据结构信息文件。数据查询语句分析1-4,查询系统外壳收取客户端的连接,并分析客户端具体查询语句,最终将请求消息发送至数据搜索引擎获取查询数据。数据检索引擎1-5,响应查询语句消息并分析数据结构信息文件和索引文件然后检索数据文件并将检索的数据返回到查询系统外壳。数据文件系统1-6,包括数据结构信息文件、数据检索索引文件、数据文件。数据恢复工具1-7,数据库方式恢复工具将指定的数据文件恢复为其他类型数据库表,文件方式恢复工具将指定的数据文件恢复为其他系统定义的数据文件。
下面结合图3到图6说明本发明的系统实现方法。
图3是本发明数据迁移流程图。在步骤S102中数据迁移工具首先分析数据源并根据配置文件读取数据源,如果出现异常则迁移系统退出,步骤S104读取正确则将数据源数据迁移到本系统中,在步骤S105中并生成特定格式的临时文件,同时生成数据格式信息文件,最终以本系统自定义格式的临时文件保存。临时文件是非压缩的数据文件,供下一步的数据压缩工具使用,数据压缩完毕后可将临时文件删除或者保留用作复用。
图4是本发明数据压缩流程图。在步骤S202中数据压缩工具分析迁移过来的临时数据,如果出现异常则迁移系统退出,在步骤S204中读取配置信息设置索引等信息,在步骤S205中进行压缩处理生成压缩数据文件,在步骤S206中分析数据信息生成索引文件,在步骤S207中进行数据的压缩处理生成压缩数据文件,至此数据压缩过程完成。数据压缩过程符合国际压缩标准,索引具有B+Tree功能。
图5是本发明数据检索流程图。在步骤S302中解析配置文件设置系统运行环境,在步骤S303中初始化服务器模块,包括内存申请辅助线程创建等,在步骤S304中循环等待连接并接受命令,当有命令时则接收连接并继续执行,否则继续循环等待,在步骤S306中当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,在步骤S307中分析请求的SQL语句并创建查询线程,在步骤S308中查询线程最后将请求的具体消息发送到数据引擎模块,数据搜索引擎部分,响应查询语句消息并分析数据结构信息文件和索引文件,根据索引文件定位数据记录位置,然后检索数据文件并将检索的数据返回到查询线程。一次SQL执行完毕后如果没有收到服务停止信号则继续等待连接请求。
图6是本发明数据压缩流程图。在步骤S402中数据恢复工具读取压缩文件系统中的数据文件,如果出现异常则恢复工具退出,正常情况程序继续执行,在步骤S404中读取配置信息获取恢复中心地址表结构以及恢复参数等信息,在步骤S405中将压缩后的数据文件解压并保存到特定的数据结构中,在步骤S406中将解压后的数据结构发送到恢复中心,在步骤S407中将解压过程的日志写入到日志系统。
虽然本发明已以较佳实施例公开如上,但它们并不是用来限定本发明,任何熟习此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,但同样在本发明创造的保护范围之内。因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。

Claims (2)

1.一种数据压缩存储快速检索文件的系统,该系统包括:
原始数据迁移单元,用于系统分析数据源并将数据源数据迁移到本单元中,以本单元自定义格式的临时文件保存;具体为:数据迁移工具首先分析数据源并根据配置文件读取数据源,如果出现异常则原始数据迁移单元退出,否则读取正确则将数据源数据迁移到本系统中,生成特定格式的临时文件,同时生成数据格式信息文件,最终以本系统自定义格式的临时文件保存;
数据压缩生成单元,用于将临时保存的数据进行压缩处理生成压缩数据文件,同时生成指定数量的索引,然后将生成的数据录入到本系统中;具体为:数据压缩工具分析迁移过来的临时数据,如果出现异常则原始数据迁移单元退出,否则读取配置信息设置索引信息,进行压缩处理生成压缩数据文件,分析数据信息生成索引文件,进行数据的压缩处理生成压缩数据文件,至此数据压缩过程完成;
数据检索单元,用于当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,然后分析请求的SQL语句,最后将请求的具体消息发送到数据引擎模块;具体为:解析配置文件设置系统运行环境,初始化服务器模块,包括内存申请辅助线程创建,循环等待连接并接受命令,当有命令时则接收连接并继续执行,否则继续循环等待,当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,分析请求的SQL语句并创建查询线程,查询线程最后将请求的具体消息发送到数据引擎模块,数据搜索引擎部分,响应查询语句消息并分析数据结构信息文件和索引文件,根据索引文件定位数据记录位置,然后检索数据文件并将检索的数据返回到查询线程;
数据恢复单元,用于将指定的数据文件恢复为其他系统定义的数据文件或者其他类型数据库表,提供特定的恢复工具;具体为:数据恢复工具读取压缩文件系统中的数据文件,如果出现异常则恢复工具退出,正常情况程序继续执行,读取配置信息获取恢复中心地址表结构以及恢复参数信息,将压缩后的数据文件解压并保存到特定的数据结构中,将解压后的数据结构发送到恢复中心,将解压过程的日志写入到日志系统。
2.一种数据压缩存储快速检索文件的方法,其特征在于:
原始数据迁移,系统分析数据源并将数据源数据迁移到本系统中,以本系统自定义格式的临时文件保存;
具体步骤为,步骤S102:数据迁移工具首先分析数据源并根据配置文件读取数据源,步骤S103:如果出现异常则迁移系统退出,否则执行下一步,步骤S104:读取正确则将数据源数据迁移到本系统中,步骤S105:生成特定格式的临时文件,同时生成数据格式信息文件,最终以本系统自定义格式的临时文件保存;
数据压缩生成,将临时保存的数据进行压缩处理生成压缩数据文件,同时生成指定数量的索引,然后将生成的数据录入到本系统中;
具体步骤为,步骤S202:数据压缩工具分析迁移过来的临时数据,步骤S203:如果出现异常则迁移系统退出,否则执行下一步,步骤S204:读取配置信息设置索引信息,步骤S205:进行压缩处理生成压缩数据文件,步骤S206:分析数据信息生成索引文件,步骤S207:进行数据的压缩处理生成压缩数据文件,至此数据压缩过程完成;
数据检索,当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,然后分析请求的SQL语句,最后将请求的具体消息发送到数据引擎模块;
具体步骤为,步骤S302:解析配置文件设置系统运行环境,步骤S303:初始化服务器模块,包括内存申请辅助线程创建,步骤S304:循环等待连接并接受命令,步骤S305:当有命令时则接收连接并继续执行,否则继续循环等待,步骤S306:当客户端连接本服务器并进行数据检索请求时,服务器首先验证用户权限,步骤S307:分析请求的SQL语句并创建查询线程,步骤S308:查询线程最后将请求的具体消息发送到数据引擎模块,数据搜索引擎部分,响应查询语句消息并分析数据结构信息文件和索引文件,根据索引文件定位数据记录位置,然后检索数据文件并将检索的数据返回到查询线程;
数据恢复,将指定的数据文件恢复为其他系统定义的数据文件或者其他类型数据库表,提供特定的恢复工具;
具体步骤为,步骤S402:数据恢复工具读取压缩文件系统中的数据文件,步骤S403:如果出现异常则恢复工具退出,正常情况程序继续执行,步骤S404:读取配置信息获取恢复中心地址表结构以及恢复参数信息,步骤S405:将压缩后的数据文件解压并保存到特定的数据结构中,步骤S406:将解压后的数据结构发送到恢复中心,步骤S407:将解压过程的日志写入到日志系统。
CN201010180814XA 2010-05-24 2010-05-24 数据压缩快速检索文件系统及其方法 Expired - Fee Related CN101853287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010180814XA CN101853287B (zh) 2010-05-24 2010-05-24 数据压缩快速检索文件系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010180814XA CN101853287B (zh) 2010-05-24 2010-05-24 数据压缩快速检索文件系统及其方法

Publications (2)

Publication Number Publication Date
CN101853287A CN101853287A (zh) 2010-10-06
CN101853287B true CN101853287B (zh) 2012-09-05

Family

ID=42804779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010180814XA Expired - Fee Related CN101853287B (zh) 2010-05-24 2010-05-24 数据压缩快速检索文件系统及其方法

Country Status (1)

Country Link
CN (1) CN101853287B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718538A (zh) * 2016-01-18 2016-06-29 中国科学院计算技术研究所 一种分布式文件系统的自适应压缩方法及系统

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004758A (zh) * 2010-10-26 2011-04-06 东莞市步步高教育电子产品有限公司 一种手持学习设备外部搜索装置及其方法
WO2013065199A1 (ja) * 2011-11-04 2013-05-10 富士通株式会社 照合制御プログラム、照合制御装置および照合制御方法
CN102609439A (zh) * 2011-12-23 2012-07-25 浙江大学 一种高维环境中模糊数据的概率窗口查询方法
CN103778203B (zh) * 2014-01-13 2018-01-19 中国人民解放军91655部队 一种网络管理数据无损压缩存储与检索的方法与系统
CN104331421A (zh) * 2014-10-14 2015-02-04 安徽四创电子股份有限公司 一种大数据的高效处理方法及系统
CN104460449A (zh) * 2014-11-24 2015-03-25 成都中远信电子科技有限公司 一种便携式数据记录器的记录方法
CN105302915B (zh) * 2015-12-23 2019-04-09 美林数据技术股份有限公司 基于内存计算的高性能数据处理系统
CN105938489A (zh) * 2016-04-14 2016-09-14 北京思特奇信息技术股份有限公司 一种压缩详单的存储和展示方法及系统
AU2017252566B2 (en) * 2016-04-22 2022-01-27 Sgph, Llc System and method for enhancing data handling in a network environment
US9558077B1 (en) 2016-06-16 2017-01-31 International Business Machines Corporation Relational database recovery
US10268543B2 (en) * 2017-01-27 2019-04-23 Hewlett Packard Enterprise Development Lp Online volume repair
CN107247639A (zh) * 2017-05-03 2017-10-13 上海动联信息技术股份有限公司 一种mysql数据库高效备份方法
CN107153717A (zh) * 2017-06-14 2017-09-12 成都三零凯天通信实业有限公司 通过浏览器从数据库导出百万级记录到表格的方法及系统
CN107357854A (zh) * 2017-06-28 2017-11-17 光大环境科技(中国)有限公司 数据存储的方法、装置及计算机存储介质
CN107622094A (zh) * 2017-08-30 2018-01-23 苏州朗动网络科技有限公司 一种基于搜索引擎的大批量数据导出系统和方法
CN108563535B (zh) * 2018-04-27 2021-12-24 四川巧夺天工信息安全智能设备有限公司 一种对MySQL数据库全库的恢复方法
CN112269905B (zh) * 2020-11-06 2023-07-21 湖南快乐阳光互动娱乐传媒有限公司 一种提高系统数据查询能力的方法及系统
CN112506989A (zh) * 2020-11-20 2021-03-16 南京英诺森软件科技有限公司 一种基于文件格式的数据检索系统
CN114780023A (zh) * 2022-03-29 2022-07-22 北京柏睿数据技术股份有限公司 一种数据文件的快速存取方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211013A (zh) * 1997-09-10 1999-03-17 富士通株式会社 文件信息存储、检索装置和方法及其程序的记录媒体
CN1434661A (zh) * 2003-01-30 2003-08-06 武汉奥发科技工程有限公司 一种gps/手机定位多级监控、移动监控的方法
CN1612252A (zh) * 2003-10-31 2005-05-04 浙江中控技术股份有限公司 实时数据在线压缩与解压缩方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008069125A1 (ja) * 2006-12-08 2008-06-12 Nec Corporation データ管理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211013A (zh) * 1997-09-10 1999-03-17 富士通株式会社 文件信息存储、检索装置和方法及其程序的记录媒体
CN1434661A (zh) * 2003-01-30 2003-08-06 武汉奥发科技工程有限公司 一种gps/手机定位多级监控、移动监控的方法
CN1612252A (zh) * 2003-10-31 2005-05-04 浙江中控技术股份有限公司 实时数据在线压缩与解压缩方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718538A (zh) * 2016-01-18 2016-06-29 中国科学院计算技术研究所 一种分布式文件系统的自适应压缩方法及系统
CN105718538B (zh) * 2016-01-18 2019-05-14 中国科学院计算技术研究所 一种分布式文件系统的自适应压缩方法及系统

Also Published As

Publication number Publication date
CN101853287A (zh) 2010-10-06

Similar Documents

Publication Publication Date Title
CN101853287B (zh) 数据压缩快速检索文件系统及其方法
CN103064933B (zh) 数据查询方法及系统
CN102915374B (zh) 一种控制数据库资源访问的方法、装置及系统
CN104424229B (zh) 一种多维度拆分的计算方法及系统
CN102375837B (zh) 数据采集系统和方法
CN103617287A (zh) 一种分布式环境下的日志管理方法和装置
CN104317800A (zh) 一种海量智能用电数据混合存储系统及方法
CN103942210A (zh) 海量日志信息的处理方法、装置与系统
CN102906751A (zh) 一种数据存储、数据查询的方法及装置
CN101163265A (zh) 基于分布式数据库的彩信日志查询方法与系统
CN103177116A (zh) 一种基于两级索引的分布式日志处理和查询方法
CN1859505B (zh) 话单查询系统及查询方法
CN104639658A (zh) 一种以文件系统挂载访问对象存储的实现方法
US11625412B2 (en) Storing data items and identifying stored data items
CN112698953A (zh) 一种基于微服务的电网智能运检平台
CN101141370A (zh) 基于网格服务的电力企业实时数据处理方法
CN107025222A (zh) 一种分布式日志采集方法及装置
CN101646140B (zh) 消息日志处理方法和系统
CN103823807A (zh) 一种去除重复数据的方法、装置及系统
CN111258978A (zh) 一种数据存储的方法
CN103440302B (zh) 实时数据交换的方法和系统
WO2017000592A1 (zh) 数据处理方法、装置及系统
CN103778258A (zh) 一种数据库数据的发送、接收方法、客户端、服务器
CN105872731A (zh) 数据处理的方法和装置
CN105095224A (zh) 一种在移动通信网络中进行olap分析的方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20200524