CN102571101A - 输电线路故障行波数据压缩方法 - Google Patents

输电线路故障行波数据压缩方法 Download PDF

Info

Publication number
CN102571101A
CN102571101A CN2011104159460A CN201110415946A CN102571101A CN 102571101 A CN102571101 A CN 102571101A CN 2011104159460 A CN2011104159460 A CN 2011104159460A CN 201110415946 A CN201110415946 A CN 201110415946A CN 102571101 A CN102571101 A CN 102571101A
Authority
CN
China
Prior art keywords
data
difference
compression
sequence
transmission line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104159460A
Other languages
English (en)
Inventor
黄松
邢铀
孔武
陈钦柱
姚冬
王思捷
全业生
余阳
钱冠军
张国清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Sunshine Power Science & Technology Co Ltd
HAINAN POWER TECHNOLOGY RESEARCH INSTITUTE
Original Assignee
Wuhan Sunshine Power Science & Technology Co Ltd
HAINAN POWER TECHNOLOGY RESEARCH INSTITUTE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Sunshine Power Science & Technology Co Ltd, HAINAN POWER TECHNOLOGY RESEARCH INSTITUTE filed Critical Wuhan Sunshine Power Science & Technology Co Ltd
Priority to CN2011104159460A priority Critical patent/CN102571101A/zh
Publication of CN102571101A publication Critical patent/CN102571101A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种输电线路故障行波数据压缩方法。所述方法包括:获取原始数据序列相邻数据间的差分序列,保存差值补码的16进制形式;根据差分序列的特性分成8类符号串,得到它们的概率值即冗余数据量;对数据使用前缀码的方式按类进行变长编码把符号串的特征信息表现在编码的最前面,尽可能避免保存冗余信息;获得压缩比的计算公式。本发明提供的对连续曲线的数据利用差分和前缀码方式进行变长压缩的方法可实现对用16进制表示的大型数据文本的无损压缩,提高压缩效率,节省大量的存储资源,而且算法简单易于实现。

Description

输电线路故障行波数据压缩方法
技术领域
本发明涉及对大量数据进行编码处理以达到数据压缩存储的技术领域,尤其涉及利用曲线的连续特性对其16进制数据文本进行差分和变长编码的数据压缩方法。
背景技术
随着计算机技术的快速发展,各种系统数据量越来越大,给信息存储特别是网络传输带来诸多的困难,已成为有效获取和使用信息的瓶颈。为了节省信息的存储空间和提高信息的传输效率,必须对大量的实际数据进行压缩。
数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度,达到增大数据密度,最终使数据的存储空间减少的技术。数据压缩就是将字符串的一种表示方式转换为另一种表示方式,新的表示方式包含相同的信息量,但是长度比原来的方式尽可能的短。压缩的理论基础是信息论,从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。
数据压缩跟编码技术联系紧密,压缩的实质就是根据数据的内在联系将数据从一种编码映射为另一种编码。数据压缩按压缩的失真度分为无损压缩与有损压缩。无损压缩技术主要有哈夫曼(Huffman)编码、算术(Arithmetiic)编码、游程编码(RLE)、LZ编码。
数据压缩主要应用于两个方面:(1)传输。通过压缩发送端的原始数据,并在接受端将压缩数据解码恢复,这样可有效地减少传输时间,增加信道带宽。(2)存储。在存储时压缩原始数据,而在使用时解压,这将大量减小存储介质的存储量。
发明内容
本发明要解决的技术问题是对连续曲线的16进制数据文本进行编码压缩,能够实现无损压缩,获得的压缩比小于0.25,达到显著减小存储介质存储量的目的。
为解决上述技术问题,本发明提供一种输电线路故障行波数据压缩方法,所述方法利用曲线的连续特性对16进制数据文本进行连续差分获得用补码的16进制表示的差分序列,将差分序列中的符号串分成8类分别用3位前缀码标识,然后对各类符号串进行变长编码以减少数据存储量。
一种输电线路故障行波数据压缩方法,包括以下步骤:获取原始数据序列相邻数据间的差分序列,保存差值补码的16进制形式;根据差分序列的特性分成8类符号串,得到它们的概率值;对数据使用前缀码的方式按类进行变长编码把符号串的特征信息表现在编码的最前面;获得压缩比的计算公式。
进一步地,利用曲线的连续特性获得的差分序列数值集中在-2、-1、0、1、2之间,而用差值补码的16进制表示的数据主要含有000X,FFFX,0000,0001,0002,FFFE,FFFF,很容易的将所有数据分成8类进行编码,不用穷举数据中所有可能的信号避免了多次遍历数据文本,与现有的文本压缩算法相比简单易于实现。在存储和传输过程中若中间某一位发生误码至多影响一个数据的解码,对后续数据的解码没有影响可靠性高。在源数据中出现概率越高的符号即0000,0001,0002,FFFE,FFFF,相应码字长度越短共3位;出现概率越小的符号即XXXX型,相应码子长度越长共19位,从而达到用尽可能少的码符号来表示源数据,达到压缩的效果,提高压缩率。
附图说明
图1是本发明输电线路故障行波数据压缩方法的步骤流程图;
图2是本发明的分类编码图。
具体实施步骤
请参阅图1,图1是本发明一种输电线路故障行波数据压缩方法的步骤流程图。
所述压缩方法包括以下步骤:
步骤S-1,获取原始数据序列相邻数据间的差分序列,保存差值补码的16进制形式。
在本步骤中,截取一条曲线上连续的150个点,组成一个数据序列s(i),i=1,2,......,150,数据序列为:
s(150)=003D 003E 0040 003E 003D 003E 003E 003D 0040 0040 0042 0042
0041 0041 0043 0043 0043 0047 0047 0046 0049 004B 004A 0049 0048 004A
004C 004E 004E 004F 0050 0051 004F 0050 0050 0053 0050 0051 0052 0052
0052 0052 0050 0051 0054 0051 0050 0052 0051 0051 0052 0050 004F 004F
0051 0050 004F 004E 004A 004B 004C 004B 004E 004A 004B 004B 004C 004B
0049 004A 004A 004A 004A 0049 004B 004B 004B 004B 004C 004B 004D 004B
004C 004E 004D 004B 004E 004E 004E 004E 004D 004E 004F 0050 004F 0051
004F 0050 004F 0051 0051 0050 004E 004F 004D 0051 0052 0051 0050 004F
004E 004E 004E 004B 004F 004C 004F 004F 004D 004D 004D 004B 004C 004D
004B 004C 004A 004C 004C 004E 004E 004C 004E 004D 004D 004E 004E 004F
0050 0051 0050 0051 0052 0052 0053 0053 0053 0054 0055 0056
求相邻数据间的差值序列,默认最初的数据s(0)为0,那么第一个数据s(1)便是第一个差值:
d(1)=s(1),d(2)=s(2)-s(1),d(3)=s(3)-s(2),......,d(150)=s(150)-s(N149),保存差值补码的16进制形式,差分序列为:
d(150)=003D 0001 0002 FFFE FFFF 0001 0000 FFFF 0003 0000 0002 0000
FFFF 0000 0002 0000 0000 0004 0000 FFFF 0003 0002 FFFF FFFF FFFF 0002
0002 0002 0000 0001 0001 0001 FFFE 0001 0000 0003 FFFD 0001 0001 0000
0000 0000 FFFE 0001 0003 FFFD FFFF 0002 FFFF 0000 0001 FFFE FFFF 0000
0002 FFFF FFFF FFFF FFFC 0001 0001 FFFF 0003 FFFC 0001 0000 0001 FFFF
FFFE 0001 0000 0000 0000 FFFF 0002 0000 0000 0000 0001 FFFF 0002 FFFE
0001 0002 FFFF FFFE 0003 0000 0000 0000 FFFF 0001 0001 0001 FFFF 0002
FFFE 0001 FFFF 0002 0000 FFFF FFFE 0001 FFFE 0004 0001 FFFF FFFF FFFF
FFFF 0000 0000 FFFD 0004 FFFD 0003 0000 FFFE 0000 0000 FFFE 0001 0001
FFFE 0001 FFFE 0002 0000 0002 0000 FFFE 0002 FFFF 0000 0001 0000 0001
0001 0001 FFFF 0001 0001 0000 0001 0000 0000 0001 0001 0001
获得差分序列d(i)后仅通过加法计算就可以恢复原来的数据,差值的数据与原始数据的位数相同,则每个s(i)和d(i)的建立和恢复都是可逆的,那么:
s(1)=d(1),s(2)=d(2)+s(1),s(3)=d(3)+s(2),......,s(150)=d(150)+s(149)。
步骤S-2,根据差分序列的特性分成8类符号串,得到它们的概率值即冗余数据量。
在本步骤中,由于曲线的连续特性,选取的连续150个点的16进制数据中99.3%的相邻数据间的差值集中在-2、-1、0、1、2之间。对这样的用补码的16进制形式保存的差分序列,可以将其符号串分成8类。符号串中主要含有000X,FFFX,0000,0001,0002,FFFE,FFFF,它们的概率分别为:
P 0000 = 37 150 , P 0001 = 36 150 , P 0002 = 17 150 , PFFFE = 15 150 , PFFFF = 28 150
P 000 X = 10 150 , PFFFX = 6 150 , PXXXX = 1 150 .
步骤S-3,确定各类16进制符号串对应的前缀码。
在本步骤中,8种情况可以用3位二进制数表示,则0000,0001,0002,FFFE,FFFF,000X,FFFX的前缀码分别为000,001,010,011,100,101,110,符号串XXXX的前缀码为111。把这些前缀码统称为TAG段。
步骤S-4,对数据按类进行变长编码,请参阅图2。把符号串的特征信息表现在编码的最前面,尽可能的避免保存冗余信息。
在本步骤中,编码包含TAG段和数据段:
  TAG段   数据段
对8类符号串进行分类编码:
第1类,0000编码为000仅包含TAG段共3位;
  000   代表0000,不用发送数据位
第2类,0001编码为001仅包含TAG段共3位;
  001   代表0001,不用发送数据位
第3类,0002编码为010仅包含TAG段共3位;
  010   代表0002,不用发送数据位
第4类,FFFE编码为011仅包含TAG段共3位7;
  011   代表FFFE,不用发送数据位
第5类,FFFF编码为100仅包含TAG段共3位;
  100   代表FFFF,不用发送数据位
第6类,000X编码为101加4位二进制数据共7位;
  101   000X除去000后剩下的4位二进制编码
第7类,FFFX编码为110加4位二进制数据共7位;
  110   FFFX除去000后剩下的4位二进制编码
第8类,XXXX编码为111加16位二进制数据共19位。
  111   原16位二进制编码
在变长编码中,若码字长度严格按照所对应符号出现概率的大小逆序排列,则其平均长度为最小,数据中0002,0001,0000,FFFF,FFFE占得比例最大为88.7%,码字长度最短仅有3位;其次是000X,FFFX所占比例为10.7%,码字长度共7位;XXXX型数据在150个数据中占的比例最小为0.6%,而码字长度最长共19为,所以上述编码方式符合两者之间的逆序排列,码子平均长度最小,提高了压缩效率,而且算法简单易于实现。
步骤S-5,获得压缩比的计算公式。
在本步骤中,根据各类符号串的概率和编码长度,所截取曲线的连续150个点组成的数据序列的压缩比:P=0.22083,节省了大量的存储空间。

Claims (8)

1.一种输电线路故障行波数据压缩方法,其特征在于,包括以下步骤:
步骤S-1,获取原始数据序列相邻数据间的差分序列,保存差值补码的16进制形式;
步骤S-2,根据差分序列的特性分成8类符号串,得到它们的概率值即冗余数据量;
步骤S-3,确定各类16进制符号串对应的前缀码;
步骤S-4,对数据按类进行变长编码把符号串的特征信息表现在编码的最前面,尽可能的避免保存冗余信息;
步骤S-5,获得压缩比的计算公式。
2.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于获取原始数据的差值序列:一个数据序列s(i),i=1,2,......,N可以用相邻数据间的差值序列表达出来,默认最初的数据s(0)为0,那么第一个数据s(1)便是第一个差值:
d(1)=s(1),d(2)=s(2)-s(1),d(3)=s(3)-s(2),......,d(N)=s(N)-s(N-1)。
3.如权利要求2所述的输电线路故障行波数据压缩方法,其特征在于获得差分序列d(i)后仅通过加法计算就可以恢复原来的数据,差值的数据与原始数据的位数相同,则每个s(i)和d(i)的建立和恢复都是可逆的,令s(0)=0那么:
s(1)=d(1),s(2)=d(2)+s(1),s(3)=d(3)+s(2),......,s(N)=d(N)+s(N-1)。
4.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于根据差分序列的特性分成8类符号串,得到它们的概率值:由于曲线的连续特性,95%以上的相邻数据间的差值集中在-2、-1、0、1、2之间,对这样的用补码的16进制形式保存的差分序列,95%以上的符号串为000X,FFFX,0000,0001,0002,FFFE,FFFF,它们的概率分别为:p000X,pFFFX,p0000,p0001,p0002,pFFFE,pFFFF,而不符合以上7种情况的符号串记为XXXX,概率为PXXXX。
5.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于对8类16进制符号串设计它们对应的前缀码:8种情况可以用3位二进制数表示,则0000,0001,0002,FFFE,FFFF,000X,FFFX的前缀码分别为000,001,010,011,100,101,110,符号串XXXX的前缀码为111,把这些前缀码统称为TAG段。
6.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于对差分序列中的所有数据按类进行变长编码:编码包含TAG段和数据,符号串000X,FFFX编码为TAG段和剩下的4位二进制编码共7位;符号串0002,0001,0000,FFFF,FFFE编码仅为TAG段共3位;符号串XXXX其编码为TAG段和本身的16位二进制编码共19位。
7.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于对差分序列中的所有数据按类进行变长编码:在变长编码中,若码字长度严格按照所对应符号出现概率的大小逆序排列,则其平均长度为最小,数据中0002,0001,0000,FFFF,FFFE占的比例最大而码字长度最短;其次是000X,FFFX;XXXX型符号串在所有数据中占的比例最小码字长度最长,所以上述编码方式码子平均长度最小,达到了最大压缩效率。
8.如权利要求1所述的输电线路故障行波数据压缩方法,其特征在于简单快速的获得压缩比的计算公式:根据各类符号串的概率和编码长度计算压缩比P,
P = ( p 000 X + pFFFX ) * 7 + ( p 0000 + p 0001 + p 0002 + pFFFE + pFFFF ) * 3 + pelse * 19 16 .
CN2011104159460A 2011-12-12 2011-12-12 输电线路故障行波数据压缩方法 Pending CN102571101A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104159460A CN102571101A (zh) 2011-12-12 2011-12-12 输电线路故障行波数据压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104159460A CN102571101A (zh) 2011-12-12 2011-12-12 输电线路故障行波数据压缩方法

Publications (1)

Publication Number Publication Date
CN102571101A true CN102571101A (zh) 2012-07-11

Family

ID=46415678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104159460A Pending CN102571101A (zh) 2011-12-12 2011-12-12 输电线路故障行波数据压缩方法

Country Status (1)

Country Link
CN (1) CN102571101A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556849A (zh) * 2013-07-05 2016-05-04 萨热姆通讯能源电信简易股份有限公司 用于通过电量计提供压缩数据的方法
CN110198171A (zh) * 2018-03-15 2019-09-03 腾讯科技(深圳)有限公司 数据压缩方法、装置、计算机可读介质及电子设备
CN110545106A (zh) * 2019-08-06 2019-12-06 清华大学 时序数据的编码方法及装置
CN110943797B (zh) * 2019-12-18 2021-06-22 北京邮电大学 一种sdh网络中的数据压缩方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010003527A1 (en) * 1999-12-09 2001-06-14 Kabushiki Kaisha Toshiba Data compression system, data decompression system, supervisory control system and computer-readable storage medium
CN102263560A (zh) * 2010-05-28 2011-11-30 富士通株式会社 差分编码方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010003527A1 (en) * 1999-12-09 2001-06-14 Kabushiki Kaisha Toshiba Data compression system, data decompression system, supervisory control system and computer-readable storage medium
CN102263560A (zh) * 2010-05-28 2011-11-30 富士通株式会社 差分编码方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANTHONY J. DOS REIS: "《汇编语言与计算机体系结构——使用C++和Java》", 31 January 2006 *
毕研秋: "电力系统数据压缩的算法研究及通信网络仿真", 《中国博士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556849A (zh) * 2013-07-05 2016-05-04 萨热姆通讯能源电信简易股份有限公司 用于通过电量计提供压缩数据的方法
CN105556849B (zh) * 2013-07-05 2019-01-04 萨热姆通讯能源电信简易股份有限公司 用于通过电量计提供压缩数据的方法
CN110198171A (zh) * 2018-03-15 2019-09-03 腾讯科技(深圳)有限公司 数据压缩方法、装置、计算机可读介质及电子设备
CN110198171B (zh) * 2018-03-15 2022-04-12 腾讯科技(深圳)有限公司 数据压缩方法、装置、计算机可读介质及电子设备
CN110545106A (zh) * 2019-08-06 2019-12-06 清华大学 时序数据的编码方法及装置
CN110545106B (zh) * 2019-08-06 2020-07-17 清华大学 时序数据的编码方法及装置
CN110943797B (zh) * 2019-12-18 2021-06-22 北京邮电大学 一种sdh网络中的数据压缩方法

Similar Documents

Publication Publication Date Title
CN103858433B (zh) 分层熵编码及解码
CN103236847B (zh) 基于多层哈希结构与游程编码的数据无损压缩方法
CN105207678B (zh) 一种改进型lz4压缩算法的硬件实现系统
CN105656604A (zh) 一种比特交织极化编码调制方法及装置
CN102970043B (zh) 一种基于gzip的压缩硬件系统及其加速方法
CN112953550B (zh) 数据压缩的方法、电子设备及存储介质
CN102138282B (zh) 减小复杂性的ldpc解码器
CN104219019A (zh) 编码方法及编码设备
CN103248367B (zh) 码流数据的编码、解码方法和装置
EP2455853A2 (en) Data compression method
CN102811114B (zh) 一种采用帧间编码的字符型通信报文压缩方法
CN108810553B (zh) 一种基于稀疏化处理的移动节点监测数据序列压缩方法
US20090201180A1 (en) Compression for deflate algorithm
CN105024702A (zh) 一种面向科学计算的浮点型数据无损压缩方法
US20110128167A1 (en) Unicode-compatible dictionary compression
CN113094346A (zh) 基于时间序列的大数据编解码方法及装置
CN102571101A (zh) 输电线路故障行波数据压缩方法
Spiegel et al. A comparative experimental study of lossless compression algorithms for enhancing energy efficiency in smart meters
CN103546161A (zh) 基于二进制位处理的无损压缩方法
CN104410424A (zh) 嵌入式设备内存数据的快速无损压缩方法
CN116016606A (zh) 一种基于智慧云的污水处理运维数据高效管理系统
CN104125475A (zh) 一种多维量子数据压缩、解压缩方法及装置
Safieh et al. Efficient VLSI architecture for the parallel dictionary LZW data compression algorithm
Mahmood et al. An Efficient 6 bit Encoding Scheme for Printable Characters by table look up
CN117040539B (zh) 一种基于m叉树和lzw算法的石油测井数据压缩方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120711