CN103414476B - 一种生产能耗实时数据压缩方法 - Google Patents

一种生产能耗实时数据压缩方法 Download PDF

Info

Publication number
CN103414476B
CN103414476B CN201310345102.2A CN201310345102A CN103414476B CN 103414476 B CN103414476 B CN 103414476B CN 201310345102 A CN201310345102 A CN 201310345102A CN 103414476 B CN103414476 B CN 103414476B
Authority
CN
China
Prior art keywords
data
moment
formula
energy consumption
increment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310345102.2A
Other languages
English (en)
Other versions
CN103414476A (zh
Inventor
浦铁成
牛国成
邢吉生
白晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JILIN AUTOMATION TECHNOLOGY RESEARCH CENTER
Beihua University
Original Assignee
JILIN AUTOMATION TECHNOLOGY RESEARCH CENTER
Beihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JILIN AUTOMATION TECHNOLOGY RESEARCH CENTER, Beihua University filed Critical JILIN AUTOMATION TECHNOLOGY RESEARCH CENTER
Priority to CN201310345102.2A priority Critical patent/CN103414476B/zh
Publication of CN103414476A publication Critical patent/CN103414476A/zh
Application granted granted Critical
Publication of CN103414476B publication Critical patent/CN103414476B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明是一种生产能耗实时数据压缩方法,其特点是,包括的步骤有:读入n个连续时刻数据y(k);计算各个时刻数据的增量Δy(k);利用最小二乘算法对各个时刻数据增量Δy(k)进行拟合;得到各个时刻估计值计算各个时刻估计偏差ε(k)等;直到n<5,保存y(1),Δy(2)...Δy(n)。能够在保证高压缩率的前提下,保留了更多的数据信息,提高了数据的恢复精度,具有科学合理,用途广泛,数据传输效率高等优点。

Description

一种生产能耗实时数据压缩方法
技术领域
本发明涉及实时数据压缩技术领域,是一种生产能耗实时数据压缩方法。
背景技术
实时数据库在企业生产控制管理系统中得到广泛应用,由于采集时间短,数据增长速度快,占用大量存储空间。因此对实时数据库中的数据必须进行压缩存储。目前常用的实时数据压缩方法是美国OSI公司提出的旋转门方法以及各种改进方法。这些方法都是根据当前数据以及压缩阀值构成一个区域,通过判断下一个数据是否在该区域内来决定是否保存该数据点。这些方法没有考虑数据之间的内在关联。而实时数据库中的数据多是在较短的时间间隔内连续采样得到的,因此这些数据可以被看作某一物理量的一组时间序列。数据之间存在较强的时间相关性。如果能够找到各数据点之间的相关性,并利用这种相关性来估计下一时刻数据,就可以减少所需保存的数据点数,从而达到压缩的效果。
目前,中国发明专利公开号CN1786939A,名称为“实时数据压缩方法”,提出压缩过程分成四步:第一步初始化字典;第二步读入数据;第三步相邻数据相减获得差值;第四步采用LZW算法对差值压缩。该方法没有对差值数据进行自回归分析,以减少待压缩的数据量,故压缩效果有限。中国发明专利公开号CN102437854A,名称为“一种高压缩比的工业实时数据压缩方法”,提出一次读入n个数据点,采用最小二乘拟合方法拟合直线方程,依据数据点与拟合直线方程的距离是否小于给定限值来决定该点是否保存。这种方法的缺点是没有考虑数据之间的时间相关性,简单的采用直线拟合无法达到最佳的拟合效果,因此压缩效果有限。
发明内容
针对现有的实时数据压缩方法的不足,并基于1.生产能耗数据描述了企业在生产过程中水、电、气等各种能源消耗情况,其特点是单调递增;2.实时数据库中的数据是某一特定物理量连续采样得到的,采样时间多为数秒或数分钟,各采样数据之间存在着很强的时间相关性,可以按照时间序列进行分析;3.根据所采集到的生产能耗数据建立其自回归模型,利用该模型提出一种实时数据压缩方法。
本发明的目的是,提供一种压缩率高,数据信息量大,数据恢复精度高,科学合理,用途广泛,数据传输效率高的生产能耗实时数据压缩方法。
实现本发明目的所采取的技术方案是:一种生产能耗实时数据压缩方法,其特征是,它包括以下步骤:
(a)读入n个连续时刻数据y(k),k=1,2...n,5≤n≤100,保存y(1);
(b)计算各个时刻数据的增量Δy(k),即
Δy(k)=y(k)-y(k-1),k=2,3...n(1)
(c)利用最小二乘算法对各个时刻数据增量Δy(k)进行拟合,如下式所示
Δy(k)=aΔy(k-1)+bΔy(k-2),k=4,5...n(2)
式中a,b为拟合参数,记作θ(a,b),其最佳估计值记作
(d)将得到的最佳估计值带入公式(2)中,得到各个时刻估计值
(e)计算各个时刻估计偏差ε(k),即
&epsiv; ( k ) = | &Delta; y ( k ) - &Delta; y ^ ( k ) | , k = 4 , 5... n - - - ( 3 )
(f)如果某时刻估计偏差ε(k)大于给定的压缩阀值ε0,压缩阀值ε0为数据压缩时允许的数据最大变化范围,即不满足如下公式(4),
ε(k)≤ε0,k=4,5...n(4)
且ε(i)为所有不满足公式(4)的估计偏差中最大者,即
ε(i)=max(ε(k)),ε(k)>ε0,k=4,5...n,i=4,5...n(5)
如果i≤4,那么令n=4,否则令n=i-1,返回(c)重新执行;
(g)如果各个时刻估计偏差ε(k)都满足公式(4),那么保存第1个和第2个增量以及
(h)重复(a)至(g),直到n<5,保存y(1),Δy(2)...Δy(n)。
本发明的一种用于生产能耗实时数据的压缩方法,能够在保证高压缩率的前提下,保留了更多的数据信息,提高了数据的恢复精度,具有科学合理,用途广泛,数据传输效率高等优点。
附图说明
图1某生产设备用电能耗原始数据1002个点。
图2一种用于生产能耗实时数据的压缩方法的流程图。
图3估计偏差绝对值存在大于给定压缩阀值的点,舍弃估计偏差绝对值最大的点及其后所有点,重新拟合。
图4估计偏差绝对值存在大于给定压缩阀值的点,估计偏差绝对值最大的点序数小于等于4,舍弃第5个点至第13个点,对第1个点至第4个点重新拟合。
图5所有估计偏差都小于给定压缩阀值,保存第1个、第2个数据增量及最佳估计值。
具体实施方式
下面利用附图和实施例对本发明作进一步描述。
参照图1——图5,本发明一种生产能耗实时数据压缩方法,具体实施步骤如下:
(a)读入n个连续时刻数据,n=13,保存y(1);
(b)按照公式(1)Δy(k)=y(k)-y(k-1),计算各个时刻数据的增量Δy(k),k=2,3...n;
(c)依据公式(2)对12个增量值Δy(k)进行最小二乘拟合,
Δy(k)=aΔy(k-1)+bΔy(k-2),k=4,5...n
利用最小二乘估计方法对各个时刻数据增量Δy(k)进行拟合,得到参数θ(a,b)的最佳估计值
(d)将得到的最佳估计值带入公式(2)中,得到各个时刻估计值
(e)计算各个时刻估计偏差ε(k),即
&epsiv; ( k ) = | &Delta; y ( k ) - &Delta; y ^ ( k ) | , k = 4 , 5... n
(f)如图3所示,第7、第11和第13点估计偏差大于给定压缩阀值0.5,其中第11点估计偏差绝对值最大,舍弃掉第11、第12和第13点,返回(c)步骤,对第1到第10点重新拟合。
如图4所示,如果估计偏差绝对值最大的点序数小于4,那么舍弃第5个点至第13个点,返回(c)步骤,对第1个点到第4个点重新拟合。
(g)如果各个时刻估计偏差都小于给定压缩阀值,那么保存第1个增量和第2个增量以及
(h)重复(a)至(g),直到n<5,保存y(1),Δy(2)...Δy(n)。
在不同压缩阀值下,本方法对图1所示的某生产设备用电能耗数据1002个数据点进行压缩,压缩效果如表1所示。
表1在不同压缩阀值下本方法的压缩效果比较

Claims (1)

1.一种生产能耗实时数据压缩方法,其特征是,它包括以下步骤:
(a)读入n个连续时刻数据y(k),k=1,2...n,5≤n≤100,保存y(1);
(b)计算各个时刻数据的增量Δy(k),即
Δy(k)=y(k)-y(k-1),k=2,3...n(1)
(c)利用最小二乘算法对各个时刻数据增量Δy(k)进行拟合,按公式(2)
Δy(k)=aΔy(k-1)+bΔy(k-2),k=4,5...n(2)
式中a,b为拟合参数,记作θ(a,b),其最佳估计值记作
(d)将得到的最佳估计值带入公式(2)中,得到各个时刻估计值
(e)计算各个时刻估计偏差ε(k),即
&epsiv; ( k ) = | &Delta; y ( k ) - &Delta; y ^ ( k ) | , k = 4 , 5 ... n - - - ( 3 )
(f)如果某时刻估计偏差ε(k)大于给定的压缩阀值ε0,压缩阀值ε0为数据压缩时允许的数据最大变化范围,即不满足公式(4),
ε(k)≤ε0,k=4,5...n(4)
且ε(i)为所有不满足公式(4)的估计偏差中最大者,即
ε(i)=max(ε(k)),ε(k)>ε0,k=4,5...n,i=4,5...n(5)
如果i≤4,那么令n=4,否则令n=i-1,返回(c)重新执行;
(g)如果各个时刻估计偏差ε(k)都满足公式(4),那么,保存第1个和第2个增量以及
(h)重复(a)至(g),直到n<5,保存y(1),Δy(2)...Δy(n)。
CN201310345102.2A 2013-08-09 2013-08-09 一种生产能耗实时数据压缩方法 Expired - Fee Related CN103414476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310345102.2A CN103414476B (zh) 2013-08-09 2013-08-09 一种生产能耗实时数据压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310345102.2A CN103414476B (zh) 2013-08-09 2013-08-09 一种生产能耗实时数据压缩方法

Publications (2)

Publication Number Publication Date
CN103414476A CN103414476A (zh) 2013-11-27
CN103414476B true CN103414476B (zh) 2016-05-25

Family

ID=49607466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310345102.2A Expired - Fee Related CN103414476B (zh) 2013-08-09 2013-08-09 一种生产能耗实时数据压缩方法

Country Status (1)

Country Link
CN (1) CN103414476B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103795420B (zh) * 2014-02-10 2017-04-05 南京邮电大学 一种基于分段的sbr多属性数据压缩方法
CN109088851B (zh) * 2018-06-22 2021-08-13 杭州海兴电力科技股份有限公司 用电信息采集的数据压缩方法
CN110727648B (zh) * 2019-10-11 2023-08-15 西安文理学院 一种工业设备的高效数据压缩方法及数据服务器
CN113258934A (zh) * 2021-06-24 2021-08-13 北京海兰信数据科技股份有限公司 一种数据压缩方法、系统及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2309243A1 (en) * 2009-10-02 2011-04-13 Hitec Luxembourg S. A. Method and apparatus for determining void volume for a particulate material
CN102736558A (zh) * 2011-04-07 2012-10-17 姚晓栋 基于时间序列算法的数控机床热误差实时补偿建模方法
CN103033833A (zh) * 2012-12-13 2013-04-10 中国航天科工信息技术研究院 一种修正对流层延迟误差的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2309243A1 (en) * 2009-10-02 2011-04-13 Hitec Luxembourg S. A. Method and apparatus for determining void volume for a particulate material
CN102736558A (zh) * 2011-04-07 2012-10-17 姚晓栋 基于时间序列算法的数控机床热误差实时补偿建模方法
CN103033833A (zh) * 2012-12-13 2013-04-10 中国航天科工信息技术研究院 一种修正对流层延迟误差的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中国石油消费量增长趋势分析;池启水,;《资源科学》;20070930;第29卷(第5期);全文 *
基于DEA的选矿生产过程能耗分析;浦铁成等,;《冶金自动化》;20120731;第36卷(第4期);全文 *

Also Published As

Publication number Publication date
CN103414476A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN103414476B (zh) 一种生产能耗实时数据压缩方法
CN103674001B (zh) 一种基于增强自适应时频峰值滤波的光纤陀螺去噪方法
CN102930172A (zh) 一种基于emd的海浪多尺度特征及波动参数的提取方法
CN103020423A (zh) 基于copula函数获取风电场出力相关特性的方法
CN105301558A (zh) 一种基于蓝牙位置指纹的室内定位方法
CN103199983A (zh) 侧信道能量分析中的n阶局域能量模型及其应用
CN107038292A (zh) 一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法
CN103870709A (zh) 一种水泵水轮机全特性曲线的构造方法
CN103824270A (zh) 一种快速的离散三维点云滤波方法
CN101650429A (zh) 低信噪比水下目标信号的混沌特征参数提取方法
CN103926578B (zh) 一种室内环境的线性特征提取方法
CN104038249A (zh) 周期长码直扩信号伪随机码估计方法
CN104899435A (zh) 计及零注入约束的电力系统动态状态估计方法
CN104199006A (zh) 一种基于多假设联合分布滤波器的随机集跟踪方法
CN104751470A (zh) 一种图像快速匹配方法
CN102143111B (zh) 一种双极性混沌键控通信系统解调方法
Chen et al. Predicting the economic loss of typhoon by case base reasoning and fuzzy theory
CN104102853A (zh) 一种利用灰色原理改进的边坡位移分形预测方法
CN102832967A (zh) 一种超宽带脉冲信号检测方法
CN104849546A (zh) 一种民航飞机散射信号多普勒频率估计方法
CN104469795A (zh) 基于领域搜索的FARIMA模型Hurst参数估计方法
CN106251238A (zh) 风电场建模序列离散化步长的选取及模型误差分析方法
CN102542064B (zh) 基于Surfacelet变换的动态纹理检索方法
CN105306066B (zh) 基于泰勒级数估计的油井数据无损压缩方法
CN103245376B (zh) 一种弱信号目标检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160525

Termination date: 20180809

CF01 Termination of patent right due to non-payment of annual fee