CN109684328A - 一种高维时序数据压缩存储方法 - Google Patents
一种高维时序数据压缩存储方法 Download PDFInfo
- Publication number
- CN109684328A CN109684328A CN201811508645.0A CN201811508645A CN109684328A CN 109684328 A CN109684328 A CN 109684328A CN 201811508645 A CN201811508645 A CN 201811508645A CN 109684328 A CN109684328 A CN 109684328A
- Authority
- CN
- China
- Prior art keywords
- data
- max
- section
- time series
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种高维时序数据压缩存储方法,属于计算机软件设计与实现技术领域。本发明根据时序数据的维数和每维数据压缩后的数据点数,对输入的时序数据进行线性扫描。在扫描的过程中,采用区间合并的方法对每一分量数据点进行合并。将合并后的所有分量区间的开始时间和结束时间标签提取出来,进行全局排序,并根据排序后的时间标签重新生成时序数据。最后将生成的时序数据存入关系数据库中。本发明可应用于各类工业控制系统时序数据的压缩存储,适用于数据流量大、采样种类多的情况,可较好地保留原数据的特征,实时性好,压缩比高,实用性强,压缩后的结果可以在关系数据库中存储。
Description
技术领域
本发明属于计算机软件设计与实现技术领域,具体涉及一种高维时序数据压缩存储方法。
背景技术
为了实现状态监测、故障预警和诊断,车辆传动装置内部安装了大量传感器。在传动装置车载试验过程中,这些传感器采集的数据将持续不断的发送到上位机电脑中。以车辆转向加速试验为例,采集到的数据包括档位及方向、发动机转速、发动机回水温度、风扇转速等多达40个参数变量。以每秒10次的采样速率计算,装置持续运转一个小时会收集到72000条数据记录。在装置长时间运转过程中,会生成总量巨大的数据,如果简单的将所有的数据都保存下来,将占用大量的物理存储空间,且难以检索和使用。
实际观察采样数据会发现,大量的试验数据中存在较多的冗余数据,这是因为设备在运转过程中,某一部件的局部状态经常处于一个稳定状态。例如在高频采样的数据中,“档位及方向”在一段时间内会出现大量的重复数据。从业务角度考虑,工程人员很难从高维海量的时序数据中观察到有用的信息,业务人员更多希望看到数据所展现出来的趋势,以及系统运行过程中是否存在异常数据。采集的数据在较小范围内的变化往往不是用户关心的,用户经常关注的是某些变化剧烈的数据点。因此实际应用中,采集的数据保存时允许有一定的误差。另外,目前众多的应用系统基于关系数据库构建,考虑到使用习惯、迁移成本等问题,目前还无法在短期内实现从关系数据库到海量存储系统的改造工作。因此,如何基于关系数据库实现海量高维时序数据的压缩存储是目前急需解决的问题之一。
目前虽然存在多种压缩方法,例如旋转门压缩法、稳态阈值法、线性外插法等,但是大多数都是一维数据的有损压缩方法,不能直接对二维、三维或者更多维数据进行压缩;其次,压缩算法复杂性高,大批量数据的处理需要较长的时间和计算资源;更为重要的一点,压缩后的数据无法直接在关系数据库中存储和查询,不利于后续业务应用的构建。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何解决现有压缩方法无法高效对高维数据进行压缩及在已有关系数据库中存储的问题。
(二)技术方案
为了解决上述技术问题,本发明提供了一种
(三)有益效果
本发明根据时序数据的维数和每维数据压缩后的数据点数,对输入的时序数据进行线性扫描。在扫描的过程中,采用区间合并的方法对每一分量数据点进行合并。将合并后的所有分量区间的开始时间和结束时间标签提取出来,进行全局排序,并根据排序后的时间标签重新生成时序数据。最后将生成的时序数据存入关系数据库中。本发明可应用于各类工业控制系统时序数据的压缩存储,适用于数据流量大、采样种类多的情况,可较好地保留原数据的特征,实时性好,压缩比高,实用性强,压缩后的结果可以在关系数据库中存储。
附图说明
图1是本发明的方法流程图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明提供了一种传动装置试验产生的高维时序数据压缩存储方法,参见表1,传动装置试验部分数据由Fan,Cb,C1,C2,C3,CL,CH,CR,C3L和CHL共10个分量构成,Time表示时间序列。从中可以看到数据在t1~t14这个区间内所有分量保持不变,从t15开始,除Fan之外,其他分量都发生了变化,从t19开始,只有C1和C2发生了变化。因此采用区间压缩的方法不仅可以保持数据的特征和趋势,也能够减少数据的存储量。
表1
参见图1,介绍本发明对数据进行压缩的各个操作步骤:
步骤1:设置10维时序数据每一分量的压缩点数分别为CP(DFan)=4,CP(DCb)=8,CP(DC1)=8,CP(DC2)=8,CP(DC3)=8,CP(DCL)=8,CP(DCH)=8,CP(DCR)=8,CP(DC3L)=8,CP(DCHL)=8。取k值为4,则相应的压缩梯度Grad(Di)设置为Grad(DFan)=16,Grad(DCb)=32,Grad(DC1)=32,Grad(DC2)=32,Grad(DC3)=32,Grad(DCL)=32,Grad(DCH)=32,Grad(DCR)=32,Grad(DC3L)=32,Grad(DCHL)=32。压缩点数的设置与用户的经验相关,如果用户已知某个分量的数据稳定性比较好,且对应用的使用产生的影响较小,则可以减少压缩点数,反之增应该增加压缩点数。压缩点数的设置会影响最后压缩后生成的时序数据总量。
步骤2:将Di的最大值Max(Di)和最小值Min(Di)分别设置为第一个数据点的值;例如Max(DC1)=Min(DC1)=0.25。
步骤3:为每一分量Di初始化一个区间列表RL(Di),用于存储分量Di已经压缩过的数据区间,列表中的每个元素是一个元组<ts,te,vmax,vmin,vavg,n>,其中ts和te分别表示区间的开始时间标签和结束时间标签,vmax,vmin和vavg分别表示区间内数据点的最大值、最小值和平均值,n表示区间内数据点的个数;初始时RL(DC1)={}。
步骤4:顺序读入时序数据,对任意时刻t采样到的D维时序数据,分别对每一分量dit进行处理,采用区段合并的方法将每个分量数据压缩为一个区段列表RL(Di)。
步骤4中,分量Di在t时刻的数据dit进行数据区段压缩方法,包括以下步骤:
步骤41:比较dit与Max(Di)和Min(Di)的关系,若Dit小于Min(Di),则将Min(Di)设置为dit,若dit大于Max(Di),则将Max(Di)设置为dit;
步骤42:取RL(Di)中最后一个区间元素Rl=<ts,te,vmax,vmin,vavg,n>,若vmin≤dit≤vmax,则更新Rl为<ts,te,vmax,vmin,(vavg*n+dit)/(n+1),n+1>;否则创建一个新的区间Rn=<t,t,dit,dit,dit,1>,并添加到区间列表RL(Di)的尾部;
步骤43:检查RL(Di)中元素的个数,如果超过了指定的压缩点数CP(Di),对RL(Di)中区间进行区间合并。
步骤43中进行分量数据区间合并方法,包括以下步骤:
步骤431:计算R(Di)=Max(Di)-Min(Di),将R(Di)分为Grad(Di)个区间,每个区间的大小为R(Di)/Grad(Di);
步骤432:顺序扫描RL(Di)中的元组,检查任意相邻的两个元组Rl=<ts,te,vmax,vmin,vavg,n>和Rr=<t's,t'e,v'max,v'min,v'avg,n'>,根据vmax,vmin,v'max,v'min判断是否属于相同的分量区间,如果是,则将Rl和Rr合并为同一个区间,合并后的区间设置为Rlr=<Min(ts,t's),Max(te,t'e),Max(vmax,v'max),Min(vmin,v'min),(vavg×n+v'avg×n'),n+n'>;
步骤433:检查RL(Di)中元素的个数,如果仍然超过了指定的压缩点数CP(Di),则将Grad(Di)设置为Grad(Di)/2;然后返回步骤431直至所有分离已处理。
以图1中分量C1为例,Grad(DC1)=32。开始时R(DC1)=Max(DC1)-Min(DC1)=0,将R(DC1)分为32个区间,每个区间Rj的大小为0。读入第一条数据时,直接新建一个数据区间,RL(DC1)={<1,1,0.25,0.25,0.25,1>}。读入第二条数据时,由于C1的分量为0.25,在RL(DC1)最后一个区间范围内,则将该数据点直接合并到最后一个区间,RL(DC1)={<1,2,0.25,0.25,0.25,2>}。以此类推,读入第14条数据后,RL(DC1)={<1,14,0.25,0.25,0.25,14>。但是当读入第15条数据后,Max(DC1)更新为0.25,Min(DC1)更新为0。由于0不在RL(DC1)最后一个区间范围内,因此新建一个区间,RL(DC1)={<1,14,0.25,0.25,0.25,14>,<15,15,0,0,0,1>}。依次类推,当到达所有输入数据结束位置时,RL(DC1)={<1,14,0.25,0.25,0.25,14>,<15,18,0,0,0,4>,<19,33,0.7,0.7,0.7,5>}。由于在整个过程中RL(DC1)中的区间数量都小于CP(DC1)=8,因此没有发生区间合并。假设CP(DC1)=2,k=1,则在第三个区间加入到RL(DC1)中时,会引发一次区间合并,此时R(DC1)=Max(DC1)-Min(DC1)=0.7,分量的区段大小RC1=0.7/2=0.35。<1,14,0.25,0.25,0.25,14>,<15,18,0,0,0,4>同属于第一个区段,<19,33,0.7,0.7,0.7,5>属于第二个区段。区段合并之后的结果为RL(DC1)={<1,18,0.25,0,0.194,18>,<19,33,0.7,0.7,0.7,5>}。假设CP(DC1)=8,k=4,则合并之后的区间列表分别为:
RL(DFan)={<1,33,0,0,0,33>}
RL(DCb)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DC1)={<1,14,0.25,0.25,0.25,14>,<15,18,0,0,0,4>,<19,33,0.7,0.7,0.7,5>}
RL(DC2)={<1,14,0.25,0.25,0.25,14>,<15,18,0,0,0,4>,<19,33,0.7,0.7,0.7,5>}
RL(DC3)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DCL)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DCH)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DCR)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DC3L)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
RL(DCHL)={<1,14,0.25,0.25,0.25,14>,<15,33,0,0,0,9>}
步骤5:对所有分量Di的区间列表RL(Di),取其所有元组的时间标签,并将其放入到同一时间队列TL中;本例中TL={1,33,14,15,18,19}。
步骤6:对TL中的时间标签按照升序进行排序;本例中排序后的结果为TL={1,14,15,18,19,33}.
步骤7:顺序扫描TL中的每一个时间标签t,根据所有分量的区间列表RL(Di)重新生成分量数据;步骤7中时序数据重新生成方法,其具体过程为:对每一分量Di的区间列表RL(Di),取t所在区间的四元组<ts,te,vmax,vmin,vavg,n>,输出Di在t时刻的数据值vavg。本例中的生成结果如表2所示。
表2
Time | Fan | Cb | C1 | C2 | C3 | CL | CH | CR | C3L | CHL |
1 | 0 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 |
14 | 0 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 | 2.5 |
15 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
18 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
19 | 0 | 0 | 0.01 | 0.07 | 0 | 0 | 0 | 0 | 0 | 0 |
33 | 0 | 0 | 0.01 | 0.07 | 0 | 0 | 0 | 0 | 0 | 0 |
步骤8:将新生成的时序数据保存到关系数据库中。由于生成的数据仍为二维关系表,因此可以使用目前流行的数据库,例如Oracle,MySql和Sql Server等关系数据库存储。数据的检索仍然可以按照时间和实际值进行操作。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (8)
1.一种高维时序数据压缩存储方法,其特征在于,包括以下步骤:
步骤1:设置D维时序数据每一分量Di的压缩点数CP(Di),并将压缩梯度Grad(Di)设置为CP(Di)×2k(k=1,2,3,...);
步骤2:将Di的最大值Max(Di)和最小值Min(Di)分别设置为第一个数据点的值;
步骤3:为每一分量Di初始化一个区间列表RL(Di),用于存储分量Di已经压缩过的数据区间,列表中的每个元素是一个元组<ts,te,vmax,vmin,vavg,n>,其中ts和te分别表示区间的开始时间标签和结束时间标签,vmax,vmin和vavg分别表示区间内数据点的最大值、最小值和平均值,n表示区间内数据点的个数;
步骤4:顺序读入时序数据,对任意时刻t采样到的D维时序数据,分别对每一分量dit进行处理,采用区段合并的方法将每个分量数据压缩为一个区段列表RL(Di);
步骤5:对所有分量Di的区间列表RL(Di),取其所有元组的时间标签,并将其放入到同一时间队列TL中;
步骤6:对TL中的时间标签按照升序进行排序;
步骤7:顺序扫描TL中的每一个时间标签t,根据所有分量的区间列表RL(Di)重新生成分量数据;
步骤8:将新生成的时序数据保存到关系数据库中。
2.如权利要求1所述的方法,其特征在于,步骤4中,分量Di在t时刻的数据dit进行数据区段压缩方法,包括以下步骤:
步骤41:比较dit与Max(Di)和Min(Di)的关系,若Dit小于Min(Di),则将Min(Di)设置为dit,若dit大于Max(Di),则将Max(Di)设置为dit;
步骤42:取RL(Di)中最后一个区间元素Rl=<ts,te,vmax,vmin,vavg,n>,若vmin≤dit≤vmax,则更新Rl为<ts,te,vmax,vmin,(vavg*n+dit)/(n+1),n+1>;否则创建一个新的区间Rn=<t,t,dit,dit,dit,1>,并添加到区间列表RL(Di)的尾部;
步骤43:检查RL(Di)中元素的个数,如果超过了指定的压缩点数CP(Di),对RL(Di)中区间进行区间合并。
3.如权利要求2所述的方法,其特征在于,步骤43中进行分量数据区间合并方法,包括以下步骤:
步骤431:计算R(Di)=Max(Di)-Min(Di),将R(Di)分为Grad(Di)个区间,每个区间的大小为R(Di)/Grad(Di);
步骤432:顺序扫描RL(Di)中的元组,检查任意相邻的两个元组Rl=<ts,te,vmax,vmin,vavg,n>和Rr=<t's,t'e,v'max,v'min,v'avg,n'>,根据vmax,vmin,v'max,v'min判断是否属于相同的分量区间,如果是,则将Rl和Rr合并为同一个区间,合并后的区间设置为Rlr=<Min(ts,t's),Max(te,t'e),Max(vmax,v'max),Min(vmin,v'min),(vavg×n+v'avg×n'),n+n'>;
步骤433:检查RL(Di)中元素的个数,如果仍然超过了指定的压缩点数CP(Di),则将Grad(Di)设置为Grad(Di)/2;然后返回步骤431。
4.如权利要求1所述的方法,其特征在于,步骤7中时序数据重新生成方法,其具体过程为:对每一分量Di的区间列表RL(Di),取t所在区间的四元组<ts,te,vmax,vmin,vavg,n>,输出Di在t时刻的数据值vavg。
5.如权利要求1所述的方法,其特征在于,步骤1中,按照以下原则进行压缩点数的设置:如果用户已知某个分量的数据稳定性越好,且对应用的使用产生的影响越小,则压缩点数越少,反之增加压缩点数。
6.如权利要求1至5中任一项所述的方法,其特征在于,步骤8中,所述数据库为Oracle。
7.如权利要求1至5中任一项所述的方法,其特征在于,步骤8中,所述数据库为MySql。
8.如权利要求1至5中任一项所述的方法,其特征在于,步骤8中,所述数据库为SqlServer。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811508645.0A CN109684328B (zh) | 2018-12-11 | 2018-12-11 | 一种高维时序数据压缩存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811508645.0A CN109684328B (zh) | 2018-12-11 | 2018-12-11 | 一种高维时序数据压缩存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109684328A true CN109684328A (zh) | 2019-04-26 |
CN109684328B CN109684328B (zh) | 2020-06-16 |
Family
ID=66187485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811508645.0A Active CN109684328B (zh) | 2018-12-11 | 2018-12-11 | 一种高维时序数据压缩存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109684328B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111966648A (zh) * | 2020-07-29 | 2020-11-20 | 国机智能技术研究院有限公司 | 一种工业数据的处理方法和电子设备 |
CN112308233A (zh) * | 2019-08-02 | 2021-02-02 | 伊姆西Ip控股有限责任公司 | 用于处理数据的方法、设备和计算机程序产品 |
CN112486927A (zh) * | 2019-09-11 | 2021-03-12 | epro 股份有限公司 | 机器健康数据的压缩 |
CN114726379A (zh) * | 2022-06-13 | 2022-07-08 | 西安热工研究院有限公司 | 基于时序数据库样本存储特征的自适应压缩方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007140820A (ja) * | 2005-11-17 | 2007-06-07 | Dainippon Printing Co Ltd | レンダリング用テクスチャデータの作成方法 |
US20090299975A1 (en) * | 2004-06-23 | 2009-12-03 | Coifman Ronald R | System and method for document analysis, processing and information extraction |
CN102427369A (zh) * | 2011-10-19 | 2012-04-25 | 广东电网公司电力科学研究院 | 生产型时序数据的实时全息无损压缩方法 |
CN105718603A (zh) * | 2016-03-31 | 2016-06-29 | 北京理工大学 | 一种基于蜡烛图的时序数据可视化方法及装置 |
CN106548412A (zh) * | 2016-09-21 | 2017-03-29 | 广西电网有限责任公司电力科学研究院 | 一种变电站在线监测时序数据的高效压缩存储方法 |
CN108197181A (zh) * | 2017-12-25 | 2018-06-22 | 广州亦云信息技术股份有限公司 | 一种时序数据的压缩存储方法、电子设备及存储介质 |
CN108470068A (zh) * | 2018-03-29 | 2018-08-31 | 重庆大学 | 一种时序键值型工业过程数据的摘要索引生成方法 |
CN108595553A (zh) * | 2018-04-10 | 2018-09-28 | 红云红河烟草(集团)有限责任公司 | 一种基于关系型数据库的工业数采时序数据压缩存储和解压查询方法 |
-
2018
- 2018-12-11 CN CN201811508645.0A patent/CN109684328B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090299975A1 (en) * | 2004-06-23 | 2009-12-03 | Coifman Ronald R | System and method for document analysis, processing and information extraction |
JP2007140820A (ja) * | 2005-11-17 | 2007-06-07 | Dainippon Printing Co Ltd | レンダリング用テクスチャデータの作成方法 |
CN102427369A (zh) * | 2011-10-19 | 2012-04-25 | 广东电网公司电力科学研究院 | 生产型时序数据的实时全息无损压缩方法 |
CN105718603A (zh) * | 2016-03-31 | 2016-06-29 | 北京理工大学 | 一种基于蜡烛图的时序数据可视化方法及装置 |
CN106548412A (zh) * | 2016-09-21 | 2017-03-29 | 广西电网有限责任公司电力科学研究院 | 一种变电站在线监测时序数据的高效压缩存储方法 |
CN108197181A (zh) * | 2017-12-25 | 2018-06-22 | 广州亦云信息技术股份有限公司 | 一种时序数据的压缩存储方法、电子设备及存储介质 |
CN108470068A (zh) * | 2018-03-29 | 2018-08-31 | 重庆大学 | 一种时序键值型工业过程数据的摘要索引生成方法 |
CN108595553A (zh) * | 2018-04-10 | 2018-09-28 | 红云红河烟草(集团)有限责任公司 | 一种基于关系型数据库的工业数采时序数据压缩存储和解压查询方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308233A (zh) * | 2019-08-02 | 2021-02-02 | 伊姆西Ip控股有限责任公司 | 用于处理数据的方法、设备和计算机程序产品 |
CN112486927A (zh) * | 2019-09-11 | 2021-03-12 | epro 股份有限公司 | 机器健康数据的压缩 |
CN111966648A (zh) * | 2020-07-29 | 2020-11-20 | 国机智能技术研究院有限公司 | 一种工业数据的处理方法和电子设备 |
CN111966648B (zh) * | 2020-07-29 | 2023-09-08 | 国机智能科技有限公司 | 一种工业数据的处理方法和电子设备 |
CN114726379A (zh) * | 2022-06-13 | 2022-07-08 | 西安热工研究院有限公司 | 基于时序数据库样本存储特征的自适应压缩方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109684328B (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109684328A (zh) | 一种高维时序数据压缩存储方法 | |
CN108140040B (zh) | 存储器中数据库的选择性数据压缩 | |
CN103366015B (zh) | 一种基于Hadoop的OLAP数据存储与查询方法 | |
CN107368517A (zh) | 一种大数据流查询的方法及设备 | |
JP5847578B2 (ja) | 個別にアクセス可能なデータユニットの記憶の取り扱い方法 | |
US20170154057A1 (en) | Efficient consolidation of high-volume metrics | |
US20170068675A1 (en) | Method and system for adapting a database kernel using machine learning | |
CN103150260B (zh) | 重复数据删除方法和装置 | |
CN109656958B (zh) | 数据查询方法以及系统 | |
CN104504116B (zh) | 一种实时数据库的存储方法 | |
CN102073712B (zh) | 基于动态变化帧的过程数据全息归档和反演方法 | |
CN103488709A (zh) | 一种索引建立方法及系统、检索方法及系统 | |
CN107506260A (zh) | 一种动态分块数据库增量备份方法 | |
CN109325062B (zh) | 一种基于分布式计算的数据依赖挖掘方法及系统 | |
US9275068B2 (en) | De-duplication deployment planning | |
CN109062936B (zh) | 一种数据查询方法、计算机可读存储介质及终端设备 | |
WO2022151829A1 (zh) | 一种基于动态网格划分的时序数据趋势特征提取方法 | |
WO2019114754A1 (zh) | 一种列式存储下多时间序列的连接查询方法及系统 | |
US10430383B1 (en) | Efficiently estimating data compression ratio of ad-hoc set of files in protection storage filesystem with stream segmentation and data deduplication | |
US10176231B2 (en) | Estimating most frequent values for a data set | |
CN110674211A (zh) | 一种Oracle数据库AWR报告的自动解析方法和设备 | |
WO2015168988A1 (zh) | 一种数据索引创建方法、装置及计算机存储介质 | |
WO2020098579A1 (zh) | 一种数据处理的方法及系统 | |
CN109344163B (zh) | 一种数据校验方法、装置和计算机可读介质 | |
CN104731716A (zh) | 一种数据存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |