CN103888144A - 基于信息熵优选的自适应数据预测编码算法 - Google Patents

基于信息熵优选的自适应数据预测编码算法 Download PDF

Info

Publication number
CN103888144A
CN103888144A CN201410076886.8A CN201410076886A CN103888144A CN 103888144 A CN103888144 A CN 103888144A CN 201410076886 A CN201410076886 A CN 201410076886A CN 103888144 A CN103888144 A CN 103888144A
Authority
CN
China
Prior art keywords
data
mrow
difference
value
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410076886.8A
Other languages
English (en)
Other versions
CN103888144B (zh
Inventor
沈龙强
黄宏强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wide Mining Network Technology (shanghai) Co Ltd
Original Assignee
SHANGHAI ZHILIAN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHILIAN TECHNOLOGY Co Ltd filed Critical SHANGHAI ZHILIAN TECHNOLOGY Co Ltd
Priority to CN201410076886.8A priority Critical patent/CN103888144B/zh
Publication of CN103888144A publication Critical patent/CN103888144A/zh
Application granted granted Critical
Publication of CN103888144B publication Critical patent/CN103888144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了基于信息熵优选的自适应数据预测编码算法,包括如下步骤:1)采集到N个数据点;2)对N个数据点进行数据熵判别选择最优预测算法;3)通过选择的算法对下一个数据点进行预测;4)判断预测值与实际值是否相差过大;获取一个新的数据点后,计算m阶差分值,与预测的差分值进行比较,看其差值是否超过限值;如果是,则再接收N-1个数据点,与和预测相差过大的一个数据点组合成N点数据,重复步骤2);否则,进行步骤5);5)判断是否接收完成所有数据;如果是进行步骤6),否则重复步骤3);6)后续处理包括对数据二次压缩,压缩完成之后,将数据进行存储或者直接发送出去。

Description

基于信息熵优选的自适应数据预测编码算法
技术领域
本发明涉及预测编码算法领域,具体地说,特别涉及到一种基于信息熵优选的自适应数据预测编码算法。
背景技术
无线传感器网络(WSN)的主要任务是采集多种传感器信号,通过无线的方式将数据发送到空间距离较远的接收端。多个传感器节点产生大量的数据,如果不进行处理直接发送,会消耗大量的能量。而能源问题是限制无线传感器网络长时间运转的一个瓶颈。因此,对数据进行压缩处理,减小传输量,对无线传感器网络具有重要意义。
预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号,然后对实际值和预测值的差(预测误差)进行编码。例如,线性预测编码(LPC)是主要用于音频信号处理与语音处理中,根据线性预测模型的信息用压缩形式表示数字语音信号谱包络的工具。
差分编码是传感器网络数据传输中的常用编码方式。现有技术中,有减少无线传感器网络节点信号冗余的方法(CN101719812B),对采集的数据进行一阶差分处理,再进行Huffman编码;基于熵判别的最优差分编码的LZW压缩方法(CN102710263A),计算多次差分之后的数据熵,对数据熵最小的差分阶数进行LZW编码进一步压缩。
上述方法的缺陷在于:无法通过预测编码结果来自适应调整预测模型。
发明内容
本发明的实际目的在于提供一种基于信息熵优选的自适应数据预测编码算法,通过最优熵判别选择差分编码中最优的编码方式,并对数据进行预测,根据预测结果自适应调整差分编码方式,实现对变化趋势复杂的传感器数据进行高效率的压缩。
本发明所解决的技术问题可以采用以下技术方案来实现:
基于信息熵优选的自适应数据预测编码算法,包括如下步骤:
1)首先采集N个数据点;
2)对N个数据点进行数据熵判别选择最优预测算法。
对N个数据点计算m阶差分值(m<N,初始m=0),此时N个数据变为m个初始值(0阶初始值、1阶初始值...m-1阶初始值)和N-m个差分值。再按照数据熵计算公式计算m阶差分之后,由初始值和差分值组成的N个数据信息熵:
H ( x m ) = &Sigma; k - 1 N k p ( x m k ( k ) ) &CenterDot; log 2 p ( x m k ( k ) )
其中,为第m次差分之后的数据中不重复的数据,
Figure BDA0000472523030000023
为其概率;再计算m+1阶差分值以及信息熵H(xm+1),当满足H(xm+1)>H(xm)时,说明进一步差分计算已不能减小信息熵,此时取第m阶差分为N个数据点的最佳压缩算法;否则m增加1,计算下一阶差分,直至满足条件或者m=N-1(此时取N-1阶差分)。将当前差分阶和参数作为关键帧存入数据流。
3)通过选择的算法对下一个数据点进行预测。
通过步骤2),说明当前数据变化趋势通过m阶差分进行压缩效果最佳(即m-1阶曲线拟合此N个数据误差最小),因此用m阶差分给出预测数据。具体的预测方法是:计算N-m个m阶差分数据的平均值,将此平均值作为下一个数据的m阶差分的预测值。
4)判断预测值与实际值是否相差过大;
获取一个新的数据点后,计算m阶差分值,与预测的差分值进行比较,看其差值是否超过限值;如果是,则再接收N-1个数据点,与和预测相差过大的一个数据点组合成N点数据,重复步骤2);否则,进行步骤5);
5)判断是否接收完成所有数据;如果是进行步骤6),否则重复步骤3);
6)后续处理包括对数据二次压缩,例如Huffman编码、LZW编码等,压缩完成之后,将数据进行存储或者直接发送出去。
与现有技术相比,本发明的有益效果如下:
1.通过预测数据与新的数据进行比较,将结果作为反馈,自适应地选择数据压缩算法,使传感器网络不同的变化趋势的数据都能获得较高的压缩率。
2.通过对数据逐个或者逐帧进行预测、反馈和适应并通过关键帧调整编码方式,只需要固定数量的时间和空间消耗就可以实现压缩和解压,是一种在线算法。
3.对差分编码压缩后的数据,适合于LZW等压缩算法,二次压缩友好,配合二次压缩,可得到更高的数据压缩效率。
附图说明
图1为本发明的算法流程图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
温度传感器监控冷藏箱温度,在运输过程中由于冷藏箱的打开和关闭,有一个近似线性的上升和下降,后续又保持基本稳定。
在冷藏箱中,温度基本保持不变,取一阶差分预测能达到最佳的效果。在冷藏箱打开和关闭过程中,温度曲线变化大致为线性,取二阶差分预测效果最佳。温度恢复稳定之后,又采用一阶差分进行预测。
例如,采集到的一组温度数据如下,先大致为线性变化,后面趋于稳定。
时间 温度 一阶差分 二阶差分 预测数据
1:00 0 NA NA NA
1:04 1.1 1.1 NA NA
1:02 2.1 1.0 -0.1 NA
1:03 3.0 0.9 -0.1 NA
1:04 3.9 0.9 0 NA
1:05 5.0 1.1 0.2 NA
1:06 5.1 0.1 -1 0
1:07 4.9 -0.2 NA NA
1:08 5.0 0.1 NA NA
1:09 5.1 0.1 NA NA
1:10 5.2 0.1 NA NA
1:11 5.1 -0.1 NA NA
1:12 4.9 -0.2 NA 0.1/6
1:13 5.0 0.1 NA -0.1/6
1:14 5.2 0.2 NA 0.2/6
如上表所示,前6个数据大致为线性变化,经过熵判别,采用二阶差分记录数量最小;在第7个数据处,计算第五个二阶差分为-1,而前4个二阶差分的平均值为0,即预测下一个二阶差分值为0,与实际计算值相差过大。重新取六个数据,进行熵判别,发现一阶差分熵最小,因此从第7个数据起采用一阶差分记录。每接收一个新的数据,计算前六个一阶差分值的均值作为预测数据,并计算新的数据的一阶差分值,进行比较,二者的差值很小。
压缩后的数据为:#2,0,1.1,-0.1,-0.1,0,0.2#1,-0.2,0.1,0.1,0.1,-0.1,-0.2,-0.2,0.1,0.2。
由此可见,两种不同变化趋势的数据,经过预测数据与实际计算数据进行比较,自适应地调整数据压缩采用的差分阶数,能够达到最优的压缩效果。由于计算差分在数学上等价于用多项式曲线去拟合数据变化趋势,对于绝大多数变化趋势的数据,进行分段拟合能够得到很好地效果。此外,对压缩得到的数据可以进行二次压缩,如Huffman编码、LZW(Lempel-Ziv-Welch)编码,得到更高的压缩率。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (1)

1.基于信息熵优选的自适应数据预测编码算法,其特征在于,包括如下步骤:
1)采集到N个数据点;
2)对N个数据点进行数据熵判别选择最优预测算法;
对N个数据点计算m阶差分值,此时N个数据变为m个初始值和N-m个差分值;再按照数据熵计算公式计算m阶差分之后,由初始值和差分值组成的N个数据信息熵:
H ( x m ) = &Sigma; k - 1 N k p ( x m k ( k ) ) &CenterDot; log 2 p ( x m k ( k ) )
其中,
Figure FDA0000472523020000012
为第m次差分之后的数据中不重复的数据,
Figure FDA0000472523020000013
为其概率;再计算m+1阶差分值以及信息熵H(xm+1),当满足H(xm+1)>H(xm)时,说明进一步差分计算已不能减小信息熵,此时取第m阶差分为N个数据点的最佳压缩算法;否则m增加1,计算下一阶差分,直至满足条件或者m=N-1;将当前差分阶和参数作为关键帧存入数据流;
3)通过选择的算法对下一个数据点进行预测;
通过步骤2),说明当前数据变化趋势通过m阶差分进行压缩效果最佳,因此用m阶差分给出预测数据。具体的预测方法是:计算N-m个m阶差分数据的平均值,将此平均值作为下一个数据的m阶差分的预测值;
4)判断预测值与实际值是否相差过大;
获取一个新的数据点后,计算m阶差分值,与预测的差分值进行比较,看其差值是否超过限值;如果是,则再接收N-1个数据点,与和预测相差过大的一个数据点组合成N点数据,重复步骤2);否则,进行步骤5);
5)判断是否接收完成所有数据;如果是进行步骤6),否则重复步骤3);
6)后续处理包括对数据二次压缩,压缩完成之后,将数据进行存储或者直接发送出去。
CN201410076886.8A 2014-03-04 2014-03-04 基于信息熵优选的自适应数据预测编码算法 Active CN103888144B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410076886.8A CN103888144B (zh) 2014-03-04 2014-03-04 基于信息熵优选的自适应数据预测编码算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410076886.8A CN103888144B (zh) 2014-03-04 2014-03-04 基于信息熵优选的自适应数据预测编码算法

Publications (2)

Publication Number Publication Date
CN103888144A true CN103888144A (zh) 2014-06-25
CN103888144B CN103888144B (zh) 2017-07-21

Family

ID=50956883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410076886.8A Active CN103888144B (zh) 2014-03-04 2014-03-04 基于信息熵优选的自适应数据预测编码算法

Country Status (1)

Country Link
CN (1) CN103888144B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104244012A (zh) * 2014-10-14 2014-12-24 重庆真测科技股份有限公司 一种ct数据压缩方法
CN106549672A (zh) * 2016-10-31 2017-03-29 合肥移顺信息技术有限公司 一种加速度传感器的三轴数据压缩方法
CN107979378A (zh) * 2017-12-14 2018-05-01 深圳Tcl新技术有限公司 惯性数据压缩方法、服务器及计算机可读存储介质
CN110311687A (zh) * 2019-07-09 2019-10-08 南京天数智芯科技有限公司 一种基于集成算法的时序数据无损压缩方法
CN111308147A (zh) * 2019-12-09 2020-06-19 电子科技大学 一种基于信息熵的数据采集装置
CN111836045A (zh) * 2020-06-02 2020-10-27 广东省建筑科学研究院集团股份有限公司 一种桥梁健康监测传感器数据的无损压缩方法
CN114969060A (zh) * 2022-08-01 2022-08-30 浙江木链物联网科技有限公司 一种工业设备时序数据压缩存储方法、装置
CN117743280A (zh) * 2024-02-21 2024-03-22 盈客通天下科技(大连)有限公司 一种公路桥梁施工数据智能管理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811114B (zh) * 2012-07-12 2015-05-20 中国电子科技集团公司第二十八研究所 一种采用帧间编码的字符型通信报文压缩方法
CN103501438B (zh) * 2013-09-18 2016-06-29 浙江大学 一种基于主成分分析的内容自适应图像压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘新等: "基于信息熵编码的改进图像编码方法研究", 《信息技术与信息化》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104244012B (zh) * 2014-10-14 2017-08-04 重庆真测科技股份有限公司 一种ct数据压缩方法
CN104244012A (zh) * 2014-10-14 2014-12-24 重庆真测科技股份有限公司 一种ct数据压缩方法
CN106549672A (zh) * 2016-10-31 2017-03-29 合肥移顺信息技术有限公司 一种加速度传感器的三轴数据压缩方法
CN106549672B (zh) * 2016-10-31 2019-07-12 合肥移顺信息技术有限公司 一种加速度传感器的三轴数据压缩方法
CN107979378A (zh) * 2017-12-14 2018-05-01 深圳Tcl新技术有限公司 惯性数据压缩方法、服务器及计算机可读存储介质
CN110311687B (zh) * 2019-07-09 2022-10-04 上海天数智芯半导体有限公司 一种基于集成算法的时序数据无损压缩方法
CN110311687A (zh) * 2019-07-09 2019-10-08 南京天数智芯科技有限公司 一种基于集成算法的时序数据无损压缩方法
CN111308147A (zh) * 2019-12-09 2020-06-19 电子科技大学 一种基于信息熵的数据采集装置
CN111308147B (zh) * 2019-12-09 2021-06-04 电子科技大学 一种基于信息熵的数据采集装置
CN111836045A (zh) * 2020-06-02 2020-10-27 广东省建筑科学研究院集团股份有限公司 一种桥梁健康监测传感器数据的无损压缩方法
CN114969060A (zh) * 2022-08-01 2022-08-30 浙江木链物联网科技有限公司 一种工业设备时序数据压缩存储方法、装置
CN114969060B (zh) * 2022-08-01 2022-11-04 浙江木链物联网科技有限公司 一种工业设备时序数据压缩存储方法、装置
CN117743280A (zh) * 2024-02-21 2024-03-22 盈客通天下科技(大连)有限公司 一种公路桥梁施工数据智能管理方法
CN117743280B (zh) * 2024-02-21 2024-04-23 盈客通天下科技(大连)有限公司 一种公路桥梁施工数据智能管理方法

Also Published As

Publication number Publication date
CN103888144B (zh) 2017-07-21

Similar Documents

Publication Publication Date Title
CN103888144B (zh) 基于信息熵优选的自适应数据预测编码算法
Al-Qurabat et al. Two tier data reduction technique for reducing data transmission in IoT sensors
Mao et al. On the capacity of a communication system with energy harvesting and a limited battery
US8819523B2 (en) Adaptive controller for a configurable audio coding system
Sabag et al. The feedback capacity of the binary erasure channel with a no-consecutive-ones input constraint
Winkelbauer et al. Rate-information-optimal Gaussian channel output compression
EP3913808A1 (en) Split gain shape vector coding
CN102164019B (zh) 信道状态信息压缩的方法及装置
CN105743611A (zh) 一种基于稀疏字典的无线传感器网络缺失数据重构方法
Liu et al. Efficient integer coefficient search for compute-and-forward
Xuan et al. Deep joint source-channel coding for transmission of correlated sources over awgn channels
US7679536B2 (en) Method and apparatus for constructing efficient slepian-wolf codes with mismatched decoding
Leinonen et al. Distributed variable-rate quantized compressed sensing in wireless sensor networks
CN108934029B (zh) 面向感知大数据重建的加速分布式优化算法
CN111836045A (zh) 一种桥梁健康监测传感器数据的无损压缩方法
Zhao et al. Compression with actions
Lewandowsky et al. Discrete channel estimation by integer passing in information bottleneck graphs
Zhang et al. An adaptive distributed source coding design for distributed learning
Sun et al. Intersensor collaboration in distributed quantization networks
CN103929275B (zh) 具有无标度特性的分布式sf‑lt码编码方法
CN104540147B (zh) 一种协作压缩感知量化转发方法
CN102098057B (zh) 一种量化编解码方法和装置
CN110636517B (zh) 一种采用卷积长短期记忆的在线链路质量预测方法
CN106572093A (zh) 一种无线传感器阵列数据压缩方法及系统
Abou Saleh et al. Power-constrained bandwidth-reduction source-channel mappings for fading channels

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: GUANGCAI NETWORK TECHNOLOGY (SHANGHAI) CO., LTD.

Free format text: FORMER OWNER: SHANGHAI ZHILIAN TECHNOLOGY CO., LTD.

Effective date: 20140828

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201111 MINHANG, SHANGHAI TO: 200131 PUDONG NEW AREA, SHANGHAI

TA01 Transfer of patent application right

Effective date of registration: 20140828

Address after: 200131 Shanghai China (Shanghai) free trade test zone, No. 118, Beijing Road, five layers, 130 parts

Applicant after: Wide mining network technology (Shanghai) Co., Ltd.

Address before: 201111 D532 room, third building, 2118 Guanghua Road, Shanghai, Minhang District five, China

Applicant before: SHANGHAI ZHILIAN TECHNOLOGY CO., LTD.

GR01 Patent grant