CN114726926B - 一种用于拉普拉斯信源的自适应变长编码方法 - Google Patents

一种用于拉普拉斯信源的自适应变长编码方法 Download PDF

Info

Publication number
CN114726926B
CN114726926B CN202210324798.XA CN202210324798A CN114726926B CN 114726926 B CN114726926 B CN 114726926B CN 202210324798 A CN202210324798 A CN 202210324798A CN 114726926 B CN114726926 B CN 114726926B
Authority
CN
China
Prior art keywords
coding
variable length
source
suffix
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210324798.XA
Other languages
English (en)
Other versions
CN114726926A (zh
Inventor
朱策
张凡
姜泽宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210324798.XA priority Critical patent/CN114726926B/zh
Publication of CN114726926A publication Critical patent/CN114726926A/zh
Application granted granted Critical
Publication of CN114726926B publication Critical patent/CN114726926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明属于编码技术领域,具体涉及一种用于拉普拉斯信源的自适应变长编码方法。本发明包含两个部分:自适应参数m的计算以及变长编码的构造。自适应参数m计算由拉普拉斯分布参数以及量化步长决定,由此可以确定最符合该信源分布的变长编码码字。变长编码的构造由自适应参数m决定,由前缀部分和后缀部分组成,该变长编码构造方法区别于任何一种现有的变长编码,是一种编码效率接近最佳码的编码方式。本发明能够适应任意拉普拉斯分布并具有良好的压缩效率。

Description

一种用于拉普拉斯信源的自适应变长编码方法
技术领域
本发明属于编码技术领域,具体涉及一种用于拉普拉斯信源的自适应变长编码方法。
背景技术
拉普拉斯分布信源广泛存在于编码中,如量化残差、小波变换高频系数都服从拉普拉斯分布。
Figure GDA0004093909640000011
任何均值为μ的拉普拉斯信源都可以通过移位来使该信源关于0对称分布。
Figure GDA0004093909640000012
一般来说,对信源进行量化在传输或存储能节约相应的资源消耗。当使用量化步长Qstep,得到0均值拉普拉斯信源量化系数并映射到非负整数后的概率分布如下所示:
Figure GDA0004093909640000013
其中
Figure GDA0004093909640000014
对于符合上式分布的信源,目前没有针对该概率分布的除哈夫曼编码以外的高效率变长编码方式。
拉普拉斯信源量化系数的概率分布f(c)在c=0时与c≠0时不属于同一解析式,故考虑其f(c)的等价分布如下
Figure GDA0004093909640000015
其中k为任意的正整数,规定上式中c=-0时,c+1=+0。
现有的变长编码方法包括:哈夫曼编码、一元编码、哥伦布编码、指数哥伦布编码、哥伦布rice编码。
文献“Huffman D A.A method for the construction of minimum-redundancycodes[J].Proceedings of the IRE,1952,40(9):1098-1101.”提出的哈夫曼编码:哈夫曼编码是任何信源的最佳变长编码,其核心思想即为给概率大的符号分配较短码字,给概率小的符号分配较长码字,从而使得平均码长最短。哈夫曼编码的构造时先挑选出概率最小的两个符号,合并这两个符号为一个集合,以这两个符号的概率和代表集合的概率,在集合内通过符号“0”和“1”来区分这两个符号,重复该操作直至只有所有的符号合并到一个集合。图1为哈夫曼编码树构造过程。
哈夫曼编码为最佳变长码,但是出于其编码和解码的复杂性,以及哈夫曼树需要额外的比特进行存储和传输,实际的编码应用中很少使用哈夫曼编码。故以下讨论均不涉及哈夫曼编码。
一元编码:对于符号集合X={x1,x2,x3,…},符号x1对应的码字为x1个“0”紧接一个1。一元编码也称为逗号编码。
文献“Golomb S.Run-length encodings(corresp.)[J].IEEE transactions oninformation theory,1966,12(3):399-401.”提出的哥伦布编码是对几何分布信源分布参数
Figure GDA0004093909640000021
时的补充,几何分布如下所示
f(x)=(1-ρ)ρx
哥伦布编码由前缀部分和后缀部分组成。考虑下式,哥伦布编码即是用前缀部分表示xq,使用后缀部分表示xr,其中m为参数。表1为哥伦布编码不同m对应的码字:
x=m·xq+xr
表1哥伦布编码不同m对应的码字
Figure GDA0004093909640000022
Figure GDA0004093909640000031
文献“Taubman D,Marcellin M.JPEG2000 image compression fundamentals,standards and practice:image compression fundamentals,standards and practice[M].Springer Science&
Business Media,2012”提出的一种内容自适应的哥伦布编码的参数m的计算方式为:
Figure GDA0004093909640000032
Figure GDA0004093909640000033
其中E[X]为信源的期望。
文献“Teuhola J.A compression method for clustered bit-vectors[J].Information processing letters,1978,7(6):308-311.”提出的指数哥伦布编码是变长编码的一种,具有很好的结构性。指数哥伦布编码由前缀和后缀组成,前缀和后缀都依赖于指数哥伦布编码的阶数k,如表2所示,用于表示非负整数N的k阶指数哥伦布码可由下列步骤生成:
1.将数字N由二进制形式写出,去掉最低的k个比特位,之后加1;
2.计算留下的比特数,将此数减1,即是需要增加的前缀0的个数。
3.将步骤1中去掉的最低k个比特位不会比特串尾部。
表2k阶指数哥伦布编码的码字
Figure GDA0004093909640000034
文献“Gallager R,Van Voorhis D.Optimal source codes for geometricallydistributed integer alphabets(corresp.)[J].IEEE Transactions on Informationtheory,1975,21(2):228-230.”提出的哥伦布Rice编码为哥伦布编码的简化,即当m为2的整数次幂的哥伦布编码。
现有的变长编码方式,虽然能够完成对拉普拉斯信源的编码,但其都不能完全符合拉普拉斯信源的特点,故除哈夫曼编码外其编码效率都不如本文提出的变长编码方法。虽然哈夫曼编码为最佳变长编码,但是其编码和解码都更加复杂,并且哈夫曼树需要更多的比特来传输和存储。
发明内容
本发明提供了一种对于拉普拉斯信源的内容自适应的变长编码方式,本发明从拉普拉斯信源分布出发,构造了一种具有自适应特性且符合信源分布特点的变长码字,优于现有的除哈夫曼编码以外的变长编码方法。
本发明的技术方案如下:
一种用于拉普拉斯信源的自适应变长编码方法,其特征在于,包括以下步骤:
S1、输入待编码的拉普拉斯信源,定义符号集合为X={x1,x2,x3,…};
S2、估计拉普拉斯信源的参数
Figure GDA0004093909640000041
/>
Figure GDA0004093909640000042
其中median{}表示获得集合X={x1,x2,x3,…}的中位数;
Figure GDA0004093909640000043
则将信源集合X的所有符号减去/>
Figure GDA0004093909640000044
使得信源关于0对称;若/>
Figure GDA0004093909640000045
则不对信源集合X操作。得到信源符号集合X′={x′1,x′2,x′3,…},计算信源X′的分布参数/>
Figure GDA0004093909640000046
Figure GDA0004093909640000047
其中n为符号集合X′的数目;
S3、对符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…},量化的公式为:
ci=x′i/Qstep
S4、将属于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
Figure GDA0004093909640000051
其中i=1,2,3…n;
S5、计算编码自适应参数m:
Figure GDA0004093909640000052
其中,
Figure GDA0004093909640000056
表示下取整;
S6、根据编码自适应参数m计算码字后缀参数ka和kb
Figure GDA0004093909640000055
ka=kb+1
S7、对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合;
S8、计算ci,q和ci,r
ci,q=c′i/m
ci,r=c′i%m
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n;
S9、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成:
前缀部分:由ci,q个0后紧接一个1组成;
后缀部分:定义参数
Figure GDA0004093909640000053
判断c′i=0是否成立,若是,则令suffixCount=suffixCount-1,同时定义/>
Figure GDA0004093909640000054
从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix;否则,c′i=0不成立,则定义/>
Figure GDA0004093909640000061
从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix。
本发明的有益效果:
本发明根据信源的概率分布推导得出,相对于其他变长编码方式,本发明构造的码字集合更加适合信源服从的拉普拉斯概率分布,具有更高的编码效率。
本发明中的编码自适应参数m由信源分布参数b和量化步长Qstep决定,本发明能够根据不同信源分布来得到最优变长编码码字集合,达到节省比特提高编码效率的目的。
附图说明
图1是哈夫曼编码树构造过程;
图2是本发明提出的对于拉普拉斯信源的自适应变长编码的构造方法框图;
图3是本发明方法中计算码字的算法框图。
具体实施方式
下面结合附图,详细说明本发明的技术方案。
本发明提出的自适应变长编码方法的思路为:因为符号集合{c}的分布呈现和几何分布的相似性,直接对符号集合{c}应用哥伦布编码求得哥伦布编码中的参数m,最后当m≠2p-1,p∈N+时合并c=-0和c=+0时的码字用以表示c=0,既可得到本发明提出的变长编码方法。本发明实际上是对哥伦布编码在拉普拉斯信源上的改进,最终得到的码字集合区别于哥伦布编码码字集合,并且,相对于哥伦布编码,新得到的变长编码码字具有更高的压缩效率。
以下为本发明的逻辑推导:
考虑量化系数c为下式所示,将对c的编码由对商部分cq的前缀以及对余数部分cr后缀组成。其中cq的概率密度函数由fCq(cq)表示,cr的概率密度函数由
Figure GDA0004093909640000062
表示。
c=m·cq+cr
通过改变m的取值,使得一元编码为cq的最优码字。一元编码为cq的最优码字的充分条件即为下式:
Figure GDA0004093909640000071
求解上述不等式即可得到m需要满足的关系为:
Figure GDA0004093909640000072
Figure GDA0004093909640000073
代入上式,即可得到m的计算公式:/>
Figure GDA0004093909640000074
其中b为拉普拉斯分布参数,一般根据样本进行参数估计得到的
Figure GDA0004093909640000075
替代。根据m得到,写出符号集合C={-0,+0,1,2,3,…}的哥伦布码字集合为表3所示:
表3哥伦布码字集合
Figure GDA0004093909640000076
当m≠2p-1,p∈N+时合并c=-0和c=+0时的码字以表示符号c=0,则可得到表4所示的码字集合,即本发明提出的变长编码码字集合。
表4变长编码码字集合
Figure GDA0004093909640000077
Figure GDA0004093909640000081
图2展示的本发明提出的对于拉普拉斯信源的自适应变长编码的构造方法框图,图3展示图2中的“计算得到ci 对应的码字”,即步骤F、G、H、I对应的算法框图:
A、进行编码的拉普拉斯信源,其符号集合X={x1,x2,x3,…}。
B、拉普拉斯信源,估计其参数
Figure GDA0004093909640000082
若/>
Figure GDA0004093909640000083
则将信源集合X的所有符号减去/>
Figure GDA0004093909640000084
使得信源关于0对称;若/>
Figure GDA0004093909640000085
则不对信源集合X操作。得到信源符号集合X′={x′1,x′2,x′3,…}。。计算信源X′的分布参数/>
Figure GDA0004093909640000086
C、符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…}。量化的公式为:
ci=x′i/Qstep
D、于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
Figure GDA0004093909640000087
其中i=1,2,3…n。
E、编码自适应参数m。m的计算方式如下:
Figure GDA0004093909640000088
其中,
Figure GDA0004093909640000089
表示下取整。
F、根据编码自适应参数m计算码字后缀参数ka和kb:
Figure GDA0004093909640000098
ka=kb+1
G、由于不同m对应的码字计算方式不同,需要先对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合。
计算ci,q和ci,r,ci,q和ci,r均为自然数。
Figure GDA0004093909640000091
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n。
H、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成
前缀部分:由ci,q个0紧接一个1组成;
后缀部分:由suffixCount个二进制位表示的数值suffix,其中
Figure GDA0004093909640000092
其中,当c′i=0时,将suffixCount减1。
Figure GDA0004093909640000093
/>
步骤B中的参数
Figure GDA0004093909640000094
的估计方式为:
Figure GDA0004093909640000095
其中median{}表示获得集合X={x1,x2,x3,…}的中位数。参数
Figure GDA0004093909640000096
的估计方式为:
Figure GDA0004093909640000097
其中n为符号集合X′的数目。
步骤I得到的是编码系数集合C′对应的码字集合,表二为不同m时编码系数集合对应的码字集合。
下面结合仿真结论证明本发明的有效性:
将本发明公开的自适应变长编码方法应用在SUVC增强层编码时,本发明相对于0阶指数格伦布获得了平均5.13%(Y-PSNR)、5.11%(U-PSNR)、5.14%(V-PSNR)的BD-rate节省,如表5所示:
表5
Figure GDA0004093909640000101
/>

Claims (1)

1.一种用于拉普拉斯信源的自适应变长编码方法,其特征在于,包括以下步骤:
S1、输入待编码的拉普拉斯信源,定义符号集合为X={x1,x2,x3,…};
S2、估计拉普拉斯信源的参数
Figure FDA0004082595920000011
Figure FDA0004082595920000012
其中median{}表示获得集合X={x1,x2,z3,…}的中位数;
Figure FDA0004082595920000013
则将信源集合X的所有符号减去/>
Figure FDA0004082595920000014
使得信源关于0对称;若/>
Figure FDA0004082595920000015
则不对信源集合X操作;得到信源符号集合X′={x′1,x′2,x′3,…},计算信源X′的分布参数/>
Figure FDA0004082595920000016
Figure FDA0004082595920000017
其中n为符号集合X′的数目;
S3、对符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…},量化的公式为:
ci=x′i/Qstep
S4、将属于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
Figure FDA0004082595920000018
其中i=1,2,3…n;
S5、计算编码自适应参数m:
Figure FDA0004082595920000019
其中,
Figure FDA00040825959200000110
表示下取整;
S6、根据编码自适应参数m计算码字后缀参数ka和kb
Figure FDA00040825959200000111
ka=kb+1
S7、对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合;
S8、计算ci,q和ci,r
ci,q=c′i/m
ci,r=c′i%m
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n;
S9、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成:
前缀部分:由ci,q个0后紧接一个1组成;
后缀部分:定义参数
Figure FDA0004082595920000021
判断c′i=0是否成立,若是,则令suffixCount=suffixCount-1,同时定义/>
Figure FDA0004082595920000022
从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix;否则,c′i=0不成立,则定义/>
Figure FDA0004082595920000023
从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix。/>
CN202210324798.XA 2022-03-30 2022-03-30 一种用于拉普拉斯信源的自适应变长编码方法 Active CN114726926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210324798.XA CN114726926B (zh) 2022-03-30 2022-03-30 一种用于拉普拉斯信源的自适应变长编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210324798.XA CN114726926B (zh) 2022-03-30 2022-03-30 一种用于拉普拉斯信源的自适应变长编码方法

Publications (2)

Publication Number Publication Date
CN114726926A CN114726926A (zh) 2022-07-08
CN114726926B true CN114726926B (zh) 2023-03-31

Family

ID=82240028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210324798.XA Active CN114726926B (zh) 2022-03-30 2022-03-30 一种用于拉普拉斯信源的自适应变长编码方法

Country Status (1)

Country Link
CN (1) CN114726926B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115529357B (zh) * 2022-11-24 2023-03-03 武汉惠强新能源材料科技有限公司 基于mes互通互联生产数据的更新异常匹配方法
CN117411947B (zh) * 2023-12-15 2024-02-23 安徽中科大国祯信息科技有限责任公司 基于云边协同的水务数据快速传输方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060098733A1 (en) * 2004-11-08 2006-05-11 Kabushiki Kaisha Toshiba Variable-length coding device and method of the same
CN100394693C (zh) * 2005-01-21 2008-06-11 华中科技大学 一种变长码的编码和解码方法
US8509555B2 (en) * 2008-03-12 2013-08-13 The Boeing Company Error-resilient entropy coding for partial embedding and fine grain scalability
JP7139897B2 (ja) * 2018-11-07 2022-09-21 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム
MX2021014754A (es) * 2019-06-17 2022-01-18 Electronics & Telecommunications Res Inst Metodo y aparato de filtrado en bucle adaptativo.
CN113766247B (zh) * 2019-06-25 2023-07-25 北京大学 环路滤波的方法与装置
JP2021078008A (ja) * 2019-11-08 2021-05-20 キヤノン株式会社 画像処理装置、画像処理方法及び撮像装置

Also Published As

Publication number Publication date
CN114726926A (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN114726926B (zh) 一种用于拉普拉斯信源的自适应变长编码方法
JP4057595B2 (ja) 変換係数を算術符号化、復号化するための方法と装置および対応するコンピュータプログラムと対応するコンピュータによる読み出し可能な記憶媒体
KR101737294B1 (ko) 심볼 압축을 수반하는 데이터의 소스 코딩 및 디코딩을 위한 방법들 및 디바이스들
US7845571B2 (en) Data compression
US20070279261A1 (en) Method and apparatus for lossless run-length data encoding
US7907068B2 (en) FIFO radix coder for electrical computers and digital data processing systems
CN102238387A (zh) 一种视频熵编码、熵解码方法、装置及介质
US8933826B2 (en) Encoder apparatus, decoder apparatus and method
CN112398484B (zh) 一种编码方法及相关设备
JP5383301B2 (ja) 符号化方法、記憶装置及び復号化方法
WO2021031877A1 (zh) 图像编解码的方法、装置和芯片
CN108810553B (zh) 一种基于稀疏化处理的移动节点监测数据序列压缩方法
CN112968706B (zh) 数据压缩方法、fpga芯片及fpga在线升级方法
WO2009009602A1 (en) Data coding/decoding for electrical computers and digital data processing systems
Akhtar et al. Optimized run length coding for jpeg image compression used in space research program of IST
KR20100009032A (ko) 데이터 무손실 압축 방법
US20220329258A1 (en) Data compression method and apparatus, and computer readable storage medium
KR20160100496A (ko) 바이너리 클러스터를 이용한 허프만 부호화 효율화 방법 및 그 장치
Jagadeesh et al. An approach for image compression using adaptive Huffman coding
KR100462789B1 (ko) 이진 산술 부호화를 이용한 다중 부호 데이터 압축 방법및 장치
CN111274950A (zh) 特征向量数据编解码方法及服务器和终端
JP6707045B2 (ja) 二値算術復号器および二値算術復号装置
JPH0629861A (ja) データ圧縮方法
Chen et al. Highly efficient entropy coding of multilevel images using a modified arithmetic code
JP2004128619A (ja) 符号化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant