CN106021579A - 一种历史数据库的压缩方法 - Google Patents

一种历史数据库的压缩方法 Download PDF

Info

Publication number
CN106021579A
CN106021579A CN201610382696.8A CN201610382696A CN106021579A CN 106021579 A CN106021579 A CN 106021579A CN 201610382696 A CN201610382696 A CN 201610382696A CN 106021579 A CN106021579 A CN 106021579A
Authority
CN
China
Prior art keywords
data
compression
line segment
error
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610382696.8A
Other languages
English (en)
Other versions
CN106021579B (zh
Inventor
张迎
金舒
薛亮
周金国
董胜刚
戴宏斌
白忠贺
杨荣昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Original Assignee
NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd filed Critical NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Priority to CN201610382696.8A priority Critical patent/CN106021579B/zh
Publication of CN106021579A publication Critical patent/CN106021579A/zh
Application granted granted Critical
Publication of CN106021579B publication Critical patent/CN106021579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种历史数据库的压缩方法,其特征在于,包括如下步骤:步骤1、将行式数据库转化为列式数据库,具体为:1a)分表;1b)拼装;步骤2、进行分段线性拟合有损压缩;步骤3、整理数据文件;步骤4、进行数据文件的无损压缩并整理索引,组成完整的两级压缩后的列式数据库。针对现有数据库的特点,分两级压缩,先采取分段线性拟合的有损压缩的方式,后采取数字字典的无损压缩方式,将数据压缩并节省所占用的空间,以满足现代综合监控系统对保存的历史数据的时间长度越来越久的要求,并将误差保持在一定的误差精度范围内。

Description

一种历史数据库的压缩方法
技术领域
本发明涉及一种历史数据库的压缩方法。
背景技术
现代综合监控系统的数据测点的并发量规模越来越大,数据采集的频率要求越来越高,在很多应用场景需要存储海量并发、高频捕捉的时序数据,每天需要存储的原始数据规模可以达到上百G,故需要对数据进行压缩存储。
系统对历史数据的压缩一般采用有损数据压缩算法和无损压缩算法。通用的有损数据压缩算法分为3类:信号变换法、矢量量化法、以及分段线性法。分段线性法实现简单,比较适合历史数据的压缩,主要有:矩形波串法(box car,BC)和向后倾斜(backwardslope,DS)算法、旋转门(swing door trending,SDT)。而通用的无损压缩算法有霍夫曼(Huffman)编码、行程编码和字典编码等压缩算法。
目前,综合监控系统的实时数据采集与缓存都是行式的,并且历史数据库的设计也主要是行式数据库,现在一般的历史数据库的设计都含有损压缩和无损压缩两级数据压缩,常见的是旋转门有损压缩+字典编码无损压缩。其存在下述不足:
第一、行式数据库的压缩效率不高,越来越难以适应和满足综合监控系统对历史数据库数据压缩存储的需求。
第二、旋转门压缩算法作为线性拟合的一种算法,具有效率高、压缩比高、误差可控制的优点。但是该算法结构还是相对有些复杂,代码实现难度比最小二乘法拟合的代码实现难度要小,但是还是有一定难度。
发明内容
针对上述问题,本发明提供一种历史数据库的压缩方法,针对现有数据库的特点,分两级压缩,先采取分段线性拟合的有损压缩的方式,后采取数字字典的无损压缩方式,将数据压缩并节省所占用的空间,以满足现代综合监控系统对保存的历史数据的时间长度越来越久的要求,并将误差保持在一定的误差精度范围内。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种历史数据库的压缩方法,其特征在于,包括如下步骤:
步骤1、将行式数据库转化为列式数据库,具体为:
1a)分表:将原有包含若干个测点数据的一个数据库表,分成若干个数据库表,其中,每个数据库表中仅含有单个测点的数据,且数据项是按照原有时间顺序排列;
1b)拼装:假设分表后获得M行数据,每行数据具有W个字段,则将M行数据按照次序整合为一行,其中,先按照次序存储M行数据的第一个字段,最后按照次序存储M行数据的第W个字段,获得列式数据库;
步骤2、进行分段线性拟合有损压缩;
步骤3、整理数据文件保持各个列式数据文件的一致性;
步骤4、进行数据文件的无损压缩并整理索引,组成完整的两级压缩后的列式数据库。
优选,步骤2中,设时间片为Tp,对应的数据片为P1,P2…Pn,数据片的起止两点为P1和Pn,误差上限为δ,则分段线性拟合的过程是采用四点三段或三点两段分割法来分割并拟合P1,P2…Pn组成数据片段PS,具体为:
1a)四点三段分割法:将数据片的起止两点P1与Pn连接成线段L后,L左右两侧的误差最大点分别为Pj,Pk两点,如果Pj和Pk到L的距离误差ΔPj和ΔPk中至少有一个超过误差上限δ,则根据P1,Pj,Pk,Pn四点将数据分割成PS1=P1…Pj,PS2=Pj…Pk,PS3=Pk…Pn三个子数据片段;
如果Pj和Pk到L的距离误差均未超过误差上限δ,则线段L为P1…Pn的拟合线段;
1b)若所有数据点均在L的一侧,则为三点两段分割法:
将数据片的起止两点P1与Pn连接成线段L后,所有数据点均在L的一侧且误差最大点为Pj点,若Pj到L的距离误差ΔPj超过误差上限δ,则根据P1,Pj,Pn三点将数据分割成PS1=P1…Pj,PS2=Pj…Pn两个子数据片段;
如果Pj到L的距离误差未超过误差上限δ,则线段L为P1…Pn的拟合线段;
2)将分割好的子数据片段PS1,PS2,PS3,按照步骤1a)或1b)的方法递归继续分割并作线段拟合,直至各个子数据片段均完成线段拟合;
3)将时间片Tp按上述分割方法分割的各级子数据片段完成的拟合线段按时间顺序拼接成拟合折线,与下一个时间片Tp’用同样方法拟合的折线按照时间顺序拼接,依次类推,实现单测点数据的全时域的分段线性压缩。
优选,步骤3中,将经过分段线性拟合压缩的数据按照长字串的形式存入数据库的同一条记录的相应字段中,如果字段的数据类型为整型或浮点型数值类型,则将该字段拆分为对应的基准值、偏移值步长与偏移值文件三个字段,其中:
基准值字段设定为原分表中一个初始值或者一个计算平均值的标准值;
偏移值步长字段中保存数据的要求的精度并使得计算出的偏移值均为整型;
该文件的文件名在字段偏移值文件中保存。
本发明的有益效果是:
本发明的两级压缩方法,分段线性拟合压缩是有损压缩,该压缩方法采用分治法的原理,该原理简单易操作,通过递归的形式可以层层分解为子问题便于理解,代码实现起来也更加方便。列式数据压缩,将文件索引与数据文件分离,追求同类数据压缩率的最大化。将数据压缩并节省所占用的空间,以满足现代综合监控系统对保存的历史数据的时间长度越来越久的要求,并将误差保持在一定的误差精度范围内。
附图说明
图1是本发明一种历史数据库的压缩方法的流程图;
图2是本发明四点三段及判别方法的示意图;
图3是本发明列式数据库索引表字段的示意图。
具体实施方式
下面结合附图和具体的实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
一种历史数据库的压缩方法,如图1所示,包括如下步骤:
步骤1、将行式数据库转化为列式数据库,数据库行转列的方法各有不同,但是基本的思想是将原有的行式数据库看作一个M行N列的表格,将此表格旋转90度做行列的转换,形成一个N行M列的表格。然而,实际转换成适合压缩的列式数据库时,操作上有一些问题,主要问题是分表和一般数据库的列数的限制;
1a)分表:将原有包含若干个测点数据的一个数据库表(table),分成若干个数据库表,其中,每个数据库表中仅含有单个测点的数据,且数据项是按照原有时间顺序排列。
可以将单测点的数据分表按照时间间隔再次分表,最后的每一个分表仅包含单个测点的一个确定时间片段的顺序数据,而准确的测点ID与时间片段的信息将在该数据库分表的表名中按固定格式体现。
1b)拼装:假设分表后获得M行数据,每行数据具有W个字段,则将M行数据按照次序整合为一行,其中,先按照次序存储M行数据的第一个字段,最后按照次序存储M行数据的第W个字段,获得列式数据库。
突破一般数据库列数的限制的方法,分表后的M行数据先按照次序整合拼装到一行,如分表中含有M行和三个字段,这三个字段分别是“时间戳”、“数值”、“数据品质”字段:则先按次序存储M个“时间戳”字段,“时间戳”字段后按次序存储M个“数值”字段,“数值”字段后按次序存储M个“数据品质”等字段内容。
将所有数据按次序分别“拼装”到一个长的字串中,以TEXT或者BLOG格式存入一个值字段,而M个长整数也以字串形式。拼装的方式可以是直接拼装的方式完成,也可以通过XML文件“转拼装”方式或其他的方式实现。
步骤2、进行分段线性拟合有损压缩。
优选,步骤2中,设时间片为Tp,对应的数据片为P1,P2…Pn,数据片的起止两点为P1和Pn,误差上限为δ。时间片(Tp)的选择可以是根据固定时间长度(如若干分钟、若干小时或若干天的数据)选择,也可以是根据固定数据的数量(如固定若干数据点相对应的时间片)选择。
拟合的线段应当满足条件:当且仅当若干时间点的数据相对拟合线段的误差在给定的误差上限δ范围以内时,这些若干时间点的数据拟合成一条线段。这条线段的时间范围,就是这些数据段(Td)的起止时间,根据数据段(Td)的起止时间可得拟合线段的两个端点。
如图2所示,分段线性拟合的过程是采用四点三段或三点两段分割法来分割并拟合P1,P2…Pn组成数据片段PS,具体为:
1a)四点三段分割法:将数据片的起止两点P1与Pn连接成线段L后,L左右两侧的误差最大点分别为Pj,Pk两点,如果Pj和Pk到L的距离误差ΔPj和ΔPk中至少有一个超过误差上限δ(ΔPj>δ且ΔPk>δ,或者ΔPj>δ且Pk<δ,或者ΔPj<δ且ΔPk>δ),则根据P1,Pj,Pk,Pn四点将数据分割成PS1=P1…Pj,PS2=Pj…Pk,PS3=Pk…Pn三个子数据片段;
如果Pj和Pk到L的距离误差均未超过误差上限δ,则线段L为P1…Pn的拟合线段;
1b)若所有数据点均在L的一侧(即Pj和Pk中的一个不存在),则为三点两段分割法:
将数据片的起止两点P1与Pn连接成线段L后,所有数据点均在L的一侧且误差最大点为Pj点,若Pj到L的距离误差ΔPj超过误差上限δ,则根据P1,Pj,Pn三点将数据分割成PS1=P1…Pj,PS2=Pj…Pn两个子数据片段;
如果Pj到L的距离误差未超过误差上限δ,则线段L为P1…Pn的拟合线段;
判断Pj和Pk是否存在的方法:使用“到角”的概念,即L到L’(L’是P1与Pj或Pk的连线)的逆时针夹角α,计算到角α正切值tanα,如果tanα值为正,则Pi在线L的左侧,如果tanα值为负,则Pi在线L的右侧。tanα值可以根据L与L’的斜率计算而得。如果线L的斜率为K1,线L’的斜率为K2,则根据到角公式tanα=(K2-K1)/(1+K1*K2)计算而得。
2)将分割好的子数据片段PS1,PS2,PS3,按照步骤1a)或1b)的方法递归继续分割并作线段拟合,直至各个子数据片段均完成线段拟合;
3)将时间片Tp按上述分割方法分割的各级子数据片段完成的拟合线段按时间顺序拼接成拟合折线,与下一个时间片Tp’用同样方法拟合的折线按照时间顺序拼接,依次类推,实现单测点数据的全时域的分段线性压缩。针对不同测点数据,用同样的方法压缩,可将数据库的所有测点的数据压缩。
将特定测点的一个时间片Tp内的数据取出做本分段线性拟合,若干个拟合线段连接实现对时间片(Tp)的线性拟合,且保证该时间片内的所有数据到线性拟合的折线的距离误差均不超过误差上限δ。
步骤3、整理数据文件保持各个列式数据文件的一致性:采用基准值与偏移量重新组织数据,并将基准值与偏移单位作为索引的一部分保存,同时将偏移值保存在列式数据文件中。这样,可以保持列式数据库的数据简洁,提高下一步无损压缩的效率。另一方面,由于上一步的分段线性拟合中剔除了原始数据中的若干数据,则需将所有相关的列式数据文件(列式时间戳偏移文件、列式数值偏移文件)中的相关数据剔除,保持数据的一致性。
分段线性拟合完成后的数据需要采用基准+偏移的方式,计算组织成为新的以整型为主的数据文件,以便于对数据文件进行无损压缩。将经过分段线性拟合压缩的数据按照长字串的形式存入数据库的同一条记录的相应字段中。
如果字段“数值”中的数据类型为整型,浮点型等数值类型,则将字段“数值”拆分成对应的“基准值”,“偏移值步长”与“偏移值文件”三个字段,“基准值”字段可设定为原分表中一个初始值或者一个计算平均值等合理的标准值,字段“偏移值步长”中保存数据的要求的精度并确保计算出的“偏移值”均为整型,将原分表中“数值”字段中的所有数据(M’个数据)按照“基准值”和“偏移值步长”计算成相应的M’个“偏移值”数据(整型),将每个“偏移值”按照4字节整型的格式依次存入二进制VDAT(数值数据)文件,该文件的文件名应在字段“偏移值文件”中保存;
比如,将经过分段线性拟合压缩的数据按照长字串的形式存入上述“时间戳”、“数值”、“数据品质”等数据库的同一条记录的相应字段中,同时,M行N列的行式数据库的分表,经过上述压缩后成为一条数据库记录,“时间戳”、“数值”、“数据品质”等字段中存有M’个数值(M’=经分段线性压缩后的数据个数),可以将这些字段内的内容转存成相应的DAT(数据)文件,以便于对这些DAT(数据)文件使用无损压缩方法进行再次压缩。
如图3所示,字段“时间戳”,拆分成“基准时间”、“偏移时间单位”和“偏移时间文件”三个字段,“基准时间”字段存原分表中的数据初始时间,字段“偏移时间单位”中可选择合适时间单位(毫秒,秒,分钟等),将原分表中“时间戳”字段中的所有数据(M’个数据)按照“基准时间”和“偏移时间单位”计算成相应的M’个“偏移时间”数据,将每个“偏移时间”按照4字节整型格式依次存入二进制TSDAT(时间戳数据)文件,该文件的文件名应在字段“偏移时间文件”中保存。
同时,“数据品质”等其他字段中保存的M’个数据,根据需要按照占用固定比特数或固定字节数的格式依次存入相应的DAT(数据)文件,并且,该文件的文件名应在相应的字段中保存。
将分表中转存为数据文件的字段扩充为“基准”、“偏移单位”和“偏移量文件”等字段,将整理好的新数据文件的地址存入“偏移量文件”字段;对“时间戳”字段也扩充为“基准时间”、“时间偏移单位”和“时间偏移量文件”等字段,将时间偏移数据文件的地址存入“时间偏移量文件”字段。
步骤4、进行数据文件的无损压缩并整理索引,组成完整的两级压缩后的列式数据库:对整理完成的各个数据文件进行无损压缩,可采用任何数据编码算法(如LZ系列字典编码算法,Huffmann编码算法或行程编码算法等)对其进行压缩。
由于M行N列的行式数据库的分表,经过分段线性拟合压缩后成为一条数据库记录,该条记录可以视为组成列式数据库的DAT(数据)文件的索引,将所有分表中经过分段线性拟合压缩后的记录,全部集中在一个完整的列式数据库索引表中,该索引表的字段,除了包含原始行式数据库表的“测点ID”、“测点名称”等关于测点基本信息的字段以外,还包含“时间戳”、“数值”或“数据品质”等字段拆分而得的若干字段,此外还需要增加“开始时间”与“结束时间”两个字段,如图3所示。
所有DAT(数据)文件,以及整理完成的索引表,组成完整的两级压缩的列式数据库。
本发明的两级压缩方法,分段线性拟合压缩是有损压缩,该压缩方法采用分治法的原理,该原理简单易操作,通过递归的形式可以层层分解为子问题便于理解,代码实现起来也更加方便。列式数据压缩,将文件索引与数据文件分离,追求同类数据压缩率的最大化。将数据压缩并节省所占用的空间,以满足现代综合监控系统对保存的历史数据的时间长度越来越久的要求,并将误差保持在一定的误差精度范围内。
本发明中的“四点三段”(或“三点两段”)分段线性拟合的方法采用递归分解问题的办法,无论是在算法思想上还是算法结构上都还要简单,代码实现的难度更小,效率上与旋转门算法相比在总体上看处于相当水平。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或者等效流程变换,或者直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种历史数据库的压缩方法,其特征在于,包括如下步骤:
步骤1、将行式数据库转化为列式数据库,具体为:
1a)分表:将原有包含若干个测点数据的一个数据库表,分成若干个数据库表,其中,每个数据库表中仅含有单个测点的数据,且数据项是按照原有时间顺序排列;
1b)拼装:假设分表后获得M行数据,每行数据具有W个字段,则将M行数据按照次序整合为一行,其中,先按照次序存储M行数据的第一个字段,最后按照次序存储M行数据的第W个字段,获得列式数据库;
步骤2、进行分段线性拟合有损压缩;
步骤3、整理数据文件保持各个列式数据文件的一致性;
步骤4、进行数据文件的无损压缩并整理索引,组成完整的两级压缩后的列式数据库。
2.根据权利要求1所述的一种历史数据库的压缩方法,其特征在于,步骤2中,设时间片为Tp,对应的数据片为P1,P2…Pn,数据片的起止两点为P1和Pn,误差上限为δ,则分段线性拟合的过程是采用四点三段或三点两段分割法来分割并拟合P1,P2…Pn组成数据片段PS,具体为:
1a)四点三段分割法:将数据片的起止两点P1与Pn连接成线段L后,L左右两侧的误差最大点分别为Pj,Pk两点,如果Pj和Pk到L的距离误差ΔPj和ΔPk中至少有一个超过误差上限δ,则根据P1,Pj,Pk,Pn四点将数据分割成PS1=P1…Pj,PS2=Pj…Pk,PS3=Pk…Pn三个子数据片段;
如果Pj和Pk到L的距离误差均未超过误差上限δ,则线段L为P1…Pn的拟合线段;
1b)若所有数据点均在L的一侧,则为三点两段分割法:
将数据片的起止两点P1与Pn连接成线段L后,所有数据点均在L的一侧且误差最大点为Pj点,若Pj到L的距离误差ΔPj超过误差上限δ,则根据P1,Pj,Pn三点将数据分割成PS1=P1…Pj,PS2=Pj…Pn两个子数据片段;
如果Pj到L的距离误差未超过误差上限δ,则线段L为P1…Pn的拟合线段;
2)将分割好的子数据片段PS1,PS2,PS3,按照步骤1a)或1b)的方法递归继续分割并作线段拟合,直至各个子数据片段均完成线段拟合;
3)将时间片Tp按上述分割方法分割的各级子数据片段完成的拟合线段按时间顺序拼接成拟合折线,与下一个时间片Tp’用同样方法拟合的折线按照时间顺序拼接,依次类推,实现单测点数据的全时域的分段线性压缩。
3.根据权利要求1所述的一种历史数据库的压缩方法,其特征在于,步骤3中,将经过分段线性拟合压缩的数据按照长字串的形式存入数据库的同一条记录的相应字段中,如果字段的数据类型为整型或浮点型数值类型,则将该字段拆分为对应的基准值、偏移值步长与偏移值文件三个字段,其中:
基准值字段设定为原分表中一个初始值或者一个计算平均值的标准值;
偏移值步长字段中保存数据的要求的精度并使得计算出的偏移值均为整型;
该文件的文件名在字段偏移值文件中保存。
4.根据权利要求1所述的一种历史数据库的压缩方法,其特征在于,步骤4中,对整理完成的各个数据文件进行无损压缩,其中,索引表的字段增加“开始时间”与“结束时间”两个字段。
5.根据权利要求4所述的一种历史数据库的压缩方法,其特征在于,无损压缩采用LZ系列字典编码算法。
6.根据权利要求4所述的一种历史数据库的压缩方法,其特征在于,无损压缩采用Huffmann编码算法或行程编码算法。
CN201610382696.8A 2016-06-01 2016-06-01 一种历史数据库的压缩方法 Active CN106021579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610382696.8A CN106021579B (zh) 2016-06-01 2016-06-01 一种历史数据库的压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610382696.8A CN106021579B (zh) 2016-06-01 2016-06-01 一种历史数据库的压缩方法

Publications (2)

Publication Number Publication Date
CN106021579A true CN106021579A (zh) 2016-10-12
CN106021579B CN106021579B (zh) 2019-11-08

Family

ID=57091868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610382696.8A Active CN106021579B (zh) 2016-06-01 2016-06-01 一种历史数据库的压缩方法

Country Status (1)

Country Link
CN (1) CN106021579B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147398A (zh) * 2017-05-03 2017-09-08 兰州空间技术物理研究所 利用样条函数进行有损压缩的方法和系统
CN108628968A (zh) * 2018-04-24 2018-10-09 哈尔滨汽轮机厂有限责任公司 一种汽轮机测点历史数据库建立方法
CN109542059A (zh) * 2018-11-19 2019-03-29 国核自仪系统工程有限公司 历史数据压缩装置和方法
CN111680012A (zh) * 2020-06-12 2020-09-18 吉林省电力科学研究院有限公司 一种用于供热系统监控数据的数据压缩方法
CN113450807A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置
CN114040028A (zh) * 2021-10-29 2022-02-11 深圳智慧林网络科技有限公司 一种基于三种模式的数据压缩方法和数据解压方法
CN114040027A (zh) * 2021-10-29 2022-02-11 深圳智慧林网络科技有限公司 一种基于双模式的数据压缩方法、装置和数据解压方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000605A (zh) * 2006-01-09 2007-07-18 中国科学院自动化研究所 一种过程工业历史数据智能两级压缩方法
CN101241508A (zh) * 2007-08-01 2008-08-13 金立 结构化数据序列的压缩方法
CN103136202A (zh) * 2011-11-22 2013-06-05 上海麦杰科技股份有限公司 实时数据库中动态预测有损压缩及解压的方法
CN103914449A (zh) * 2012-12-29 2014-07-09 上海可鲁系统软件有限公司 一种多源时间序列数据压缩存储方法
CN104077309A (zh) * 2013-03-28 2014-10-01 日电(中国)有限公司 一种对时序序列进行降维处理的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000605A (zh) * 2006-01-09 2007-07-18 中国科学院自动化研究所 一种过程工业历史数据智能两级压缩方法
CN101241508A (zh) * 2007-08-01 2008-08-13 金立 结构化数据序列的压缩方法
CN103136202A (zh) * 2011-11-22 2013-06-05 上海麦杰科技股份有限公司 实时数据库中动态预测有损压缩及解压的方法
CN103914449A (zh) * 2012-12-29 2014-07-09 上海可鲁系统软件有限公司 一种多源时间序列数据压缩存储方法
CN104077309A (zh) * 2013-03-28 2014-10-01 日电(中国)有限公司 一种对时序序列进行降维处理的方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147398A (zh) * 2017-05-03 2017-09-08 兰州空间技术物理研究所 利用样条函数进行有损压缩的方法和系统
CN108628968A (zh) * 2018-04-24 2018-10-09 哈尔滨汽轮机厂有限责任公司 一种汽轮机测点历史数据库建立方法
CN108628968B (zh) * 2018-04-24 2022-06-21 哈尔滨汽轮机厂有限责任公司 一种汽轮机测点历史数据库建立方法
CN109542059A (zh) * 2018-11-19 2019-03-29 国核自仪系统工程有限公司 历史数据压缩装置和方法
CN109542059B (zh) * 2018-11-19 2022-04-01 国核自仪系统工程有限公司 历史数据压缩装置和方法
CN113450807A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置
CN113450807B (zh) * 2020-03-25 2023-03-17 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置
CN111680012A (zh) * 2020-06-12 2020-09-18 吉林省电力科学研究院有限公司 一种用于供热系统监控数据的数据压缩方法
CN114040028A (zh) * 2021-10-29 2022-02-11 深圳智慧林网络科技有限公司 一种基于三种模式的数据压缩方法和数据解压方法
CN114040027A (zh) * 2021-10-29 2022-02-11 深圳智慧林网络科技有限公司 一种基于双模式的数据压缩方法、装置和数据解压方法
CN114040028B (zh) * 2021-10-29 2023-11-24 深圳智慧林网络科技有限公司 一种基于三种模式的数据压缩方法和数据解压方法
CN114040027B (zh) * 2021-10-29 2023-11-24 深圳智慧林网络科技有限公司 一种基于双模式的数据压缩方法、装置和数据解压方法

Also Published As

Publication number Publication date
CN106021579B (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN106021579A (zh) 一种历史数据库的压缩方法
US8838551B2 (en) Multi-level database compression
US8189912B2 (en) Efficient histogram storage
US9645736B2 (en) Processing time series data from multiple sensors
CN108197226A (zh) Mptc账户状态树以及mptc区块链快速检索方法
US20140085115A1 (en) Data compression using dictionary encoding
CN108108394B (zh) Apfs文件系统的压缩文件恢复方法及存储介质
US20190095461A1 (en) Columnar database compression
CN102436465A (zh) 一种在轨航天器遥测数据压缩存储与快速查询方法
US10489160B2 (en) General purpose data compression using SIMD engine
CN105144157A (zh) 用于压缩数据库中的数据的系统和方法
US9236881B2 (en) Compression of bitmaps and values
US9665590B2 (en) Bitmap compression for fast searches and updates
US7836099B2 (en) Mail compression scheme with individual message decompressability
EP2611036A2 (en) Compression of small strings
CN102084594B (zh) 用于处理数字数据的方法
Yao et al. HRCM: an efficient hybrid referential compression method for genomic big data
CN100568284C (zh) 计算机图形数据编码装置、解码装置、编码和解码方法
CN114665884A (zh) 时序数据库自适应有损压缩方法、系统及介质
US9998142B1 (en) Techniques for invariant-reference compression
CN116192154B (zh) 数据压缩及数据解压方法、装置、电子设备、芯片
CN115640597B (zh) 一种面向区块链低存储开销的审计数据有效性验证方法
KR102497634B1 (ko) 문자 빈도 기반 서열 재정렬을 통한 fastq 데이터 압축 방법 및 장치
CN112665886B (zh) 一种大型旋转机械振动测量高频原始数据的数据转换方法
CN107026652B (zh) 基于分区的正整数序列压缩方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 210032 Jiangsu province Nanjing city Pukou high tech Zone Huidalu No. 9

Applicant after: Nanjing Guodian Nanzi 710086 Automation Co. Ltd.

Address before: 210032 Jiangsu province Nanjing city Pukou high tech Zone Huidalu No. 9

Applicant before: Nanjing Guodian Nanzi Meizhuo Control System Co.,Ltd.

GR01 Patent grant
GR01 Patent grant