CN102298630B - 一种基于线型的过程数据有损压缩方法 - Google Patents

一种基于线型的过程数据有损压缩方法 Download PDF

Info

Publication number
CN102298630B
CN102298630B CN 201110252901 CN201110252901A CN102298630B CN 102298630 B CN102298630 B CN 102298630B CN 201110252901 CN201110252901 CN 201110252901 CN 201110252901 A CN201110252901 A CN 201110252901A CN 102298630 B CN102298630 B CN 102298630B
Authority
CN
China
Prior art keywords
match
data
compression
fitting function
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110252901
Other languages
English (en)
Other versions
CN102298630A (zh
Inventor
刘孟觉
梁奕
刘佳宝
方俊
陈天皓
张�浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Original Assignee
Nari Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nari Technology Co Ltd filed Critical Nari Technology Co Ltd
Priority to CN 201110252901 priority Critical patent/CN102298630B/zh
Publication of CN102298630A publication Critical patent/CN102298630A/zh
Application granted granted Critical
Publication of CN102298630B publication Critical patent/CN102298630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种基于线型的过程数据有损压缩方法,其特征在于,包括以下步骤:1)定义三种变化的数据趋势线型:直线型、抛物线型、反抛物线型作为可选的拟合函数;2)根据实际数据的变化趋势在运行时动态地调整拟合函数的表达式的形式。本发明不采用单一的拟合方式,而是综合三种拟合方式,所以存储的事件数比传统算法存储的事件数少,即压缩率比较大。

Description

一种基于线型的过程数据有损压缩方法
技术领域
本发明涉及一种数据处理方法,特别涉及一种监控系统中实时数据动态有损压缩方法,属于自动化监控技术领域。
背景技术
目前监控系统中实时数据压缩方法的主要可分为三类,即分段线性方法、矢量量化方法和信号变换方法。分段线性方法包括矩形波串法(boxcar)、后向斜率法(backward slope)、旋转门趋势化方法(SDT)和分段线性在线趋势化方法(PLOT),尽管这些方法压缩比不如信号变换方法高,但其优点是算法简单、代码执行速度快,已经在过程工业中得到广泛使用。矢量量化方法需要花很多时间计算码本,且码本不具有通用性,即一个数据集的码本不能用于别的数据集,由于计算量太大,矢量量化方法不适合过程数据在线压缩。信号变换方法很多,如傅立叶变换、小波变换等,虽然小波变换方法目前还存在一些实际技术问题需要解决,但长期以来傅立叶变换一直是信号处理的主要手段,但它只能获得信号的整个频谱,而很难得到信号的局部特征,不能充分刻画时变、非平稳信号的特征,同时在数据的有损压缩阈值难以控制,再加上有很多实际的问题有待解决,所以实际使用并不多。
在传统的线性压缩算法中,一般都是仅仅采用直线来刻画某一段待压缩空间内的数据,无论这段空间内的数据的具体趋势如何,都是一成不变的用直线来进行逼近拟合,而不忽略具体的数据特点。本项目组中,在分析了有关数据后发现,待压缩的数据在某一段压缩空间内,往往不只是单一的成直线型变化趋势,数据还有其他形式的变化趋势,比如类似抛物线形式的,如果这时仍然只是采用直线趋势来拟合这一段数据,不仅压缩率不高而且误差很大。所以可以根据压缩点的动态变化趋势线型选择合适的压缩方式来增大压缩比。
在传统的数据压缩中,往往只采用单一的压缩方式,一般忽略实时数据本身的特点,本项目的算法主要思想就是在对数据进行压缩时,充分考虑数据本身的变化趋势,并针对于此采用不同的方式进行压缩。
发明内容
本发明所要解决的技术问题是如何在最短的时间实现监控系统中实时数据压缩的高压缩率,也就是:
1)压缩比高,根据实时数据趋势的线型,采用自适应算法能发挥最大的压缩比;
2)压缩速度快,算法简单,计算量少。
为解决上述技术问题,本发明提供一种基于线型的过程数据有损压缩方法,其特征在于,包括以下步骤:
1)定义三种变化的数据趋势线型:直线型、抛物线型、反抛物线型作为可选的拟合函数;
2)根据实际数据的变化趋势,在运行时动态地调整拟合函数的表达式的形式。
前述的基于线型的过程数据有损压缩算法,其特征在于:在所述步骤2)中,具体步骤为:
21)对于每一个过程数据,分别使用三种变化趋势线型进行压缩,记录相关参数,直到三种变化趋势线型都不能继续压缩为止;
22)保留压缩率最大的拟合函数作为最终的压缩结果,记录压缩点的时间点、拟合值、拟合曲线参数;
23)进行新一轮的压缩。
前述的基于线型的过程数据有损压缩算法,其特征在于:在所述步骤1)中,拟合函数为
yt=utt    (1)
其中,yt是过程数据的值关于时间的函数,εt是噪音函数,ut=kta是关于时间t的函数,a是t的幂指数,k为t的系数,用于控制拟合曲线的形状,如果a>1则ut为抛物线,此时可以取a=2;如果1>a>0,则ut是反抛物线,此时可以取a=0.5;常规条件下取a=1则为ut=kt直线。
前述的基于线型的过程数据有损压缩算法,其特征在于:在所述步骤21)中,
1)根据实际需要,分别取ut=kta中a=2、1、0.5,则对应抛物线、反抛物线、直线三种不同线型的拟合曲线,对于第1个数据点,用所有的曲线形状的拟合函数去拟合它,在正常情况下所有的曲线都能顺利地拟合,所有的拟合函数继续第二个数据点的压缩;
2)第二个数据点到来时,将第一个数据点的通过的拟合函数去拟合第二个数据点,保证压缩误差在预定控制的范围内,如果拟合函数是直线函数则不能进行拟合,所以直线函数放弃,再依次用上一轮通过的点去拟合第二个数据点,将满足压缩误差条件的拟合函数继续保留,不满足的拟合函数舍去;
3)按照上述过程依次拟合接下来的数据点,至只剩下最后一个满足压缩误差条件的拟合函数停止;
4)用步骤3)仅剩下的拟合函数拟合下一个数据点,如果还能拟合就继续下一个点,否则就结束本轮压缩,记录相关参数以便还原,继续下一轮的压缩。
本发明的原理是:
在工业生产监控系统中,实时数据的变化一般有不同的趋势,所以本发明针对于这些不同的变化趋势采用相应拟合压缩方式。在分析了监控系统实时数据后,在一段待压缩的数据段内,大体上有如下几种变化趋势:直线型,抛物线型,反抛物线型。
其中直线型代表平稳变化,即相邻的两个实时数据差值始终保持不变;抛物线型代表变化逐渐增大,即相邻的两个实时数据之间的差值越来越大;反抛物线型逐渐减小,即相邻的两个实时数据之间的差值越来越小。
本发明所用的算法结构简单,实现的c语言函数简单,这样在程序运行实现起来,计算量比较少使得计算速度快,程序运行快。
传统的算法针对以上三种情况只是采用相同的方式如直线型进行拟合,如果要求算法能够取得更好的压缩效果,必须能根据实际数据的变化趋势在运行时动态的调整拟合函数的表达式的形式。在本发明中,假设拟合函数是
yt=utt  (1)
其中,yt是过程数据的值关于时间的函数,εt是噪音函数,ut=kta是关于时间t的函数(a是t的幂指数,k为t的系数),用于控制拟合曲线的形状,如果a>1则ut为抛物线,此时可以取a=2;如果1>a>0,则ut是反抛物线,此时可以取a=0.5;常规条件下取a=1则为ut=kt直线。
1、在压缩时,对于直线型趋势的数据,本发明和传统算法一样都用直线来进行拟合;
2、对于抛物线型ut=kt2,k>0的数据,假设成这一趋势的过程数据点为y1,y2,y3…yi…yn,且此时y1到yn符合函数式(1),所以yi的坐标(ti,kti 2+b)其中k>0,k、b为系数,如果用本发明的抛物线来拟合,则y1,y2,y3…yi…yn只需保存为一个事件即可,如果采用传统的算法,如直线来拟合,当在压缩完y1,y2,y3…yi点,下一个待压缩的点为yi,此时斜率
K y 0 y i = ( y i - y 0 ) / ( t i - t 0 ) = k ( t i - t 0 ) ( t i + t 0 ) / ( t i - t 0 ) = k ( t i - t 0 )
K y i + 1 y i = ( y i + 1 - y i ) / ( t i + 1 - t i ) = k ( t i + 1 - t i ) ( t i + 1 + t i ) / ( t i + 1 - t i ) = k ( t i + 1 - t i )
所以 K y i + 1 y i - K y 0 y i = k ( t i + 1 - t 0 ) ≠ 0 > 0 , 如此时在压缩完yi,直线的斜率已经不能再增大了,那么采用直线拟合必须进行新一轮的压缩,所以传统算法存储的时间数至少两个或者两个以上的事件。
3、对于抛物线型ut=kt2,k<0的数据,假设成这一趋势的点为y1,y2,y3…yi…yn,且此时y1到yn符合函数式(1),所以yi的坐标(ti,kti 2+b)其中k<0,那么如果用本发明的抛物线来拟合,则y1,y2,y3…yi…yn只需保存为一个事件即可,如果采用传统的算法,比如直线来拟合,当在压缩完y1,y2,y3…yi点,下一个待压缩的点为yi+1,此时斜率
K y 0 y i = ( y i - y 0 ) / ( t i - t 0 ) = k ( t i - t 0 ) ( t i + t 0 ) / ( t i - t 0 ) = k ( t i - t 0 )
K y i + 1 y i = ( y i + 1 - y i ) / ( t i + 1 - t i ) = k ( t i + 1 - t i ) ( t i + 1 + t i ) / ( t i + 1 - t i ) = k ( t i + 1 - t i )
所以 K y i + 1 y i - K y 0 y i = k ( t i + 1 - t 0 ) &NotEqual; 0 < 0 , 如此时在压缩完yi,直线的斜率已经不能再减小了,那么采用直线拟合必须进行新一轮的压缩,所以传统算法存储的时间数至少两个或者两个以上的事件。
综上所述,本发明的基于线型的过程数据有损压缩算法不采用单一的拟合方式,而是综合三种拟合方式,所以存储的事件数比传统算法存储的事件数少,即压缩率比较大。
附图说明
图1为本发明的数据压缩基本流程图;
图2为本发明的解压缩程序流程图;
图3为本发明的函数间的关系图;
图4为本发明的算法示意图。
具体实施方式
本发明的实际算法中为了控制压缩的阈值即压缩误差,仍然用上下两对曲线控制每一轮的压缩,如图4所示,以数据点1为起始点。在垂直方向上距离数据点1为E的地方有两个支点。每个元素对应两个连接支点和过程数据的直线或曲线,把这两个直线或曲线看成两扇虚拟的以支点为轴的“门”。具体包括以下步骤:
1)根据实际需要,可以分别取a=2,1,0.5,则对应着三种不同线型的拟合曲线(抛物线、反抛物线、直线)。对于第一个过程数据点,用所有的曲线形状去拟合它,在正常情况下所有的曲线都能顺利地拟合,所有的拟合函数继续第二个数据点的压缩;
2)第二个数据点到来时,将通过第一个数据点的拟合函数去拟合,保证压缩误差在预定控制的范围内。如图4,如果拟合函数是直线函数不能进行拟合了,所以直线函数放弃,再依次用上一轮通过的点去拟合第二点,将满足压缩误差条件的拟合函数继续保留,不满足的拟合函数舍去。
3)按照上述过程依次拟合下面的点,至只剩下最后一个数据点满足压缩误差条件的拟合函数停止;
4)用步骤3)仅剩下的拟合函数拟合下一个过程数据点,如果还能拟合就继续下一个点,否则就结束本轮压缩,记录相关参数以便还原,继续下一轮的压缩。
在数据还原时,根据在压缩算法中每一轮的压缩所记录的事件的信息,包括压缩点的时间点、压缩点的拟合值、压缩点的拟合曲线参数,然后再利用函数将原来的点还原出来。
以上已以较佳实施例公开了本发明,然其并非用以限制本发明,凡采用等同替换或者等效变换方式所获得的技术方案,均落在本发明的保护范围之内。

Claims (2)

1.一种基于线型的过程数据有损压缩方法,其特征在于,包括以下步骤:
1)定义三种变化的数据趋势线型:直线型、抛物线型、反抛物线型作为可选的拟合函数,所述拟合函数为yt=utt;其中,yt是过程数据的值关于时间的函数,εt是噪音函数,ut=kta是关于时间t的函数,a是t的幂指数,k为t的系数,用于控制拟合曲线的形状;如果a>1则ut为抛物线;如果1>a>0,则ut是反抛物线;常规条件下取a=1则为ut=kt直线;
2)根据实际数据的变化趋势,在运行时动态地调整拟合函数的表达式的形式,具体步骤为:
21)对于每一个过程数据,分别使用三种变化趋势线型进行压缩,记录相关参数,直到三种变化趋势线型都不能继续压缩为止;
22)保留压缩率最大的拟合函数作为最终的压缩结果,记录压缩点的时间点、拟合值、拟合曲线参数;
23)进行新一轮的压缩。
2.根据权利要求1所述的基于线型的过程数据有损压缩方法,其特征在于:在所述步骤21)中,
1)根据实际需要,分别取ut=kta中a=2、1、0.5,则对应抛物线、直线、反抛物线三种不同线型的拟合曲线,对于第1个数据点,用所有的曲线形状的拟合函数去拟合,在正常情况下所有的曲线都能顺利地拟合,所有的拟合函数继续第二个数据点的压缩;
2)第二个数据点到来时,用通过第一个数据点的拟合函数去拟合第二个数据点,保证压缩误差在预定控制的范围内,如果拟合函数是直线函数则不能进行拟合,所以直线函数放弃,再依次用上一轮通过的拟合函数的点去拟合第二个数据点,将满足压缩误差条件的拟合函数继续保留,不满足的拟合函数舍去;
3)按照上述过程依次拟合接下来的数据点,至只剩下最后一个满足压缩误差条件的拟合函数停止;
4)用步骤3)仅剩下的拟合函数拟合下一个数据点,如果还能拟合就继续下一个点,否则就结束本轮压缩,记录相关参数以便还原,继续下一轮的压缩。
CN 201110252901 2011-08-30 2011-08-30 一种基于线型的过程数据有损压缩方法 Active CN102298630B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110252901 CN102298630B (zh) 2011-08-30 2011-08-30 一种基于线型的过程数据有损压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110252901 CN102298630B (zh) 2011-08-30 2011-08-30 一种基于线型的过程数据有损压缩方法

Publications (2)

Publication Number Publication Date
CN102298630A CN102298630A (zh) 2011-12-28
CN102298630B true CN102298630B (zh) 2013-04-10

Family

ID=45359044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110252901 Active CN102298630B (zh) 2011-08-30 2011-08-30 一种基于线型的过程数据有损压缩方法

Country Status (1)

Country Link
CN (1) CN102298630B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102545909B (zh) * 2011-12-19 2014-07-09 河海大学 贪婪式智能拟合有损数据压缩方法
CN106033448A (zh) * 2015-03-17 2016-10-19 阿里巴巴集团控股有限公司 Html页面压缩方法及装置
CN111143755B (zh) * 2019-12-19 2023-06-27 中科芯集成电路有限公司 热敏电阻数据优化方法、装置和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6760487B1 (en) * 1999-04-22 2004-07-06 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Estimated spectrum adaptive postfilter and the iterative prepost filtering algirighms
CN100435136C (zh) * 2006-06-21 2008-11-19 浙江中控软件技术有限公司 一种基于最小二乘线性拟合的实时数据压缩方法

Also Published As

Publication number Publication date
CN102298630A (zh) 2011-12-28

Similar Documents

Publication Publication Date Title
CN106685478B (zh) 基于信号时频图像信息提取的跳频信号参数估计方法
CN110045419A (zh) 一种感知器残差自编码网络地震资料去噪方法
CN110826791A (zh) 一种基于长短时记忆神经网络的混合风功率预测方法
CN102298630B (zh) 一种基于线型的过程数据有损压缩方法
CN101916433B (zh) 基于偏微分方程的强噪声污染图像的去噪方法
CN102594360B (zh) 一种计算机数据压缩方法及装置
CN106487358A (zh) 一种基于统计线性回归的最大相关熵容积卡尔曼滤波方法
CN107124394A (zh) 一种电力通信网络安全态势预测方法和系统
CN102346745A (zh) 单词的用户行为数的预测方法和装置
CN105427264A (zh) 一种基于群稀疏系数估计的图像重构方法
CN104123591A (zh) 基于智能网格分类和模糊神经网络的天然气负荷预测方法
CN105760213A (zh) 云环境下虚拟机资源利用率的预警系统及方法
CN103136239A (zh) 一种基于张量重建的交通数据丢失恢复方法
CN103809439B (zh) 一种适用于遥操作系统控制参数的递阶辨识方法
CN113193556A (zh) 基于概率预测模型的短期风电功率预测方法
CN102098058A (zh) 时序数据实时高效线性压缩与解压缩方法
CN107038297A (zh) 全球能源互联网运行特性仿真的自适应变步长积分方法
CN112764686A (zh) 一种基于数据压缩的大数据处理系统节能方法
CN109040047A (zh) 示功图数据压缩、传输方法及装置
CN105046062A (zh) 一种改进的自适应噪声集合经验模态分解处理方法
CN110083487A (zh) 一种基于数据局部性的引用数据块碎片消除方法及系统
CN117090758A (zh) 一种空压机节能控制方法及系统
CN102545909B (zh) 贪婪式智能拟合有损数据压缩方法
CN105023021A (zh) 一种基于主方向模板的特征匹配方法
CN102064796B (zh) 一种简化的具有负系数的加权重复伪中值滤波方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NARI NANJING CONTROL SYSTEM LTD.

Effective date: 20141203

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20141203

Address after: High road high tech Development Zone Nanjing city Jiangsu province 210061 No. 20

Patentee after: NARI Technology Development Co., Ltd.

Patentee after: SGCC NARI Nanjing Control System Co., Ltd.

Address before: High road high tech Development Zone Nanjing city Jiangsu province 210061 No. 20

Patentee before: NARI Technology Development Co., Ltd.