CN114726926B - 一种用于拉普拉斯信源的自适应变长编码方法 - Google Patents
一种用于拉普拉斯信源的自适应变长编码方法 Download PDFInfo
- Publication number
- CN114726926B CN114726926B CN202210324798.XA CN202210324798A CN114726926B CN 114726926 B CN114726926 B CN 114726926B CN 202210324798 A CN202210324798 A CN 202210324798A CN 114726926 B CN114726926 B CN 114726926B
- Authority
- CN
- China
- Prior art keywords
- coding
- variable length
- source
- suffix
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/04—Protocols for data compression, e.g. ROHC
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明属于编码技术领域,具体涉及一种用于拉普拉斯信源的自适应变长编码方法。本发明包含两个部分:自适应参数m的计算以及变长编码的构造。自适应参数m计算由拉普拉斯分布参数以及量化步长决定,由此可以确定最符合该信源分布的变长编码码字。变长编码的构造由自适应参数m决定,由前缀部分和后缀部分组成,该变长编码构造方法区别于任何一种现有的变长编码,是一种编码效率接近最佳码的编码方式。本发明能够适应任意拉普拉斯分布并具有良好的压缩效率。
Description
技术领域
本发明属于编码技术领域,具体涉及一种用于拉普拉斯信源的自适应变长编码方法。
背景技术
拉普拉斯分布信源广泛存在于编码中,如量化残差、小波变换高频系数都服从拉普拉斯分布。
任何均值为μ的拉普拉斯信源都可以通过移位来使该信源关于0对称分布。
一般来说,对信源进行量化在传输或存储能节约相应的资源消耗。当使用量化步长Qstep,得到0均值拉普拉斯信源量化系数并映射到非负整数后的概率分布如下所示:
其中
对于符合上式分布的信源,目前没有针对该概率分布的除哈夫曼编码以外的高效率变长编码方式。
拉普拉斯信源量化系数的概率分布f(c)在c=0时与c≠0时不属于同一解析式,故考虑其f(c)的等价分布如下
其中k为任意的正整数,规定上式中c=-0时,c+1=+0。
现有的变长编码方法包括:哈夫曼编码、一元编码、哥伦布编码、指数哥伦布编码、哥伦布rice编码。
文献“Huffman D A.A method for the construction of minimum-redundancycodes[J].Proceedings of the IRE,1952,40(9):1098-1101.”提出的哈夫曼编码:哈夫曼编码是任何信源的最佳变长编码,其核心思想即为给概率大的符号分配较短码字,给概率小的符号分配较长码字,从而使得平均码长最短。哈夫曼编码的构造时先挑选出概率最小的两个符号,合并这两个符号为一个集合,以这两个符号的概率和代表集合的概率,在集合内通过符号“0”和“1”来区分这两个符号,重复该操作直至只有所有的符号合并到一个集合。图1为哈夫曼编码树构造过程。
哈夫曼编码为最佳变长码,但是出于其编码和解码的复杂性,以及哈夫曼树需要额外的比特进行存储和传输,实际的编码应用中很少使用哈夫曼编码。故以下讨论均不涉及哈夫曼编码。
一元编码:对于符号集合X={x1,x2,x3,…},符号x1对应的码字为x1个“0”紧接一个1。一元编码也称为逗号编码。
文献“Golomb S.Run-length encodings(corresp.)[J].IEEE transactions oninformation theory,1966,12(3):399-401.”提出的哥伦布编码是对几何分布信源分布参数时的补充,几何分布如下所示
f(x)=(1-ρ)ρx
哥伦布编码由前缀部分和后缀部分组成。考虑下式,哥伦布编码即是用前缀部分表示xq,使用后缀部分表示xr,其中m为参数。表1为哥伦布编码不同m对应的码字:
x=m·xq+xr
表1哥伦布编码不同m对应的码字
文献“Taubman D,Marcellin M.JPEG2000 image compression fundamentals,standards and practice:image compression fundamentals,standards and practice[M].Springer Science&
Business Media,2012”提出的一种内容自适应的哥伦布编码的参数m的计算方式为:
其中E[X]为信源的期望。
文献“Teuhola J.A compression method for clustered bit-vectors[J].Information processing letters,1978,7(6):308-311.”提出的指数哥伦布编码是变长编码的一种,具有很好的结构性。指数哥伦布编码由前缀和后缀组成,前缀和后缀都依赖于指数哥伦布编码的阶数k,如表2所示,用于表示非负整数N的k阶指数哥伦布码可由下列步骤生成:
1.将数字N由二进制形式写出,去掉最低的k个比特位,之后加1;
2.计算留下的比特数,将此数减1,即是需要增加的前缀0的个数。
3.将步骤1中去掉的最低k个比特位不会比特串尾部。
表2k阶指数哥伦布编码的码字
文献“Gallager R,Van Voorhis D.Optimal source codes for geometricallydistributed integer alphabets(corresp.)[J].IEEE Transactions on Informationtheory,1975,21(2):228-230.”提出的哥伦布Rice编码为哥伦布编码的简化,即当m为2的整数次幂的哥伦布编码。
现有的变长编码方式,虽然能够完成对拉普拉斯信源的编码,但其都不能完全符合拉普拉斯信源的特点,故除哈夫曼编码外其编码效率都不如本文提出的变长编码方法。虽然哈夫曼编码为最佳变长编码,但是其编码和解码都更加复杂,并且哈夫曼树需要更多的比特来传输和存储。
发明内容
本发明提供了一种对于拉普拉斯信源的内容自适应的变长编码方式,本发明从拉普拉斯信源分布出发,构造了一种具有自适应特性且符合信源分布特点的变长码字,优于现有的除哈夫曼编码以外的变长编码方法。
本发明的技术方案如下:
一种用于拉普拉斯信源的自适应变长编码方法,其特征在于,包括以下步骤:
S1、输入待编码的拉普拉斯信源,定义符号集合为X={x1,x2,x3,…};
其中median{}表示获得集合X={x1,x2,x3,…}的中位数;
其中n为符号集合X′的数目;
S3、对符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…},量化的公式为:
ci=x′i/Qstep
S4、将属于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
其中i=1,2,3…n;
S5、计算编码自适应参数m:
S6、根据编码自适应参数m计算码字后缀参数ka和kb:
ka=kb+1
S7、对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合;
S8、计算ci,q和ci,r:
ci,q=c′i/m
ci,r=c′i%m
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n;
S9、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成:
前缀部分:由ci,q个0后紧接一个1组成;
后缀部分:定义参数判断c′i=0是否成立,若是,则令suffixCount=suffixCount-1,同时定义/>从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix;否则,c′i=0不成立,则定义/>从而得到后缀部分为,由sffixCount个二进制位表示的数值suffix。
本发明的有益效果:
本发明根据信源的概率分布推导得出,相对于其他变长编码方式,本发明构造的码字集合更加适合信源服从的拉普拉斯概率分布,具有更高的编码效率。
本发明中的编码自适应参数m由信源分布参数b和量化步长Qstep决定,本发明能够根据不同信源分布来得到最优变长编码码字集合,达到节省比特提高编码效率的目的。
附图说明
图1是哈夫曼编码树构造过程;
图2是本发明提出的对于拉普拉斯信源的自适应变长编码的构造方法框图;
图3是本发明方法中计算码字的算法框图。
具体实施方式
下面结合附图,详细说明本发明的技术方案。
本发明提出的自适应变长编码方法的思路为:因为符号集合{c}的分布呈现和几何分布的相似性,直接对符号集合{c}应用哥伦布编码求得哥伦布编码中的参数m,最后当m≠2p-1,p∈N+时合并c=-0和c=+0时的码字用以表示c=0,既可得到本发明提出的变长编码方法。本发明实际上是对哥伦布编码在拉普拉斯信源上的改进,最终得到的码字集合区别于哥伦布编码码字集合,并且,相对于哥伦布编码,新得到的变长编码码字具有更高的压缩效率。
以下为本发明的逻辑推导:
c=m·cq+cr
通过改变m的取值,使得一元编码为cq的最优码字。一元编码为cq的最优码字的充分条件即为下式:
求解上述不等式即可得到m需要满足的关系为:
表3哥伦布码字集合
当m≠2p-1,p∈N+时合并c=-0和c=+0时的码字以表示符号c=0,则可得到表4所示的码字集合,即本发明提出的变长编码码字集合。
表4变长编码码字集合
图2展示的本发明提出的对于拉普拉斯信源的自适应变长编码的构造方法框图,图3展示图2中的“计算得到ci ′对应的码字”,即步骤F、G、H、I对应的算法框图:
A、进行编码的拉普拉斯信源,其符号集合X={x1,x2,x3,…}。
C、符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…}。量化的公式为:
ci=x′i/Qstep
D、于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
其中i=1,2,3…n。
E、编码自适应参数m。m的计算方式如下:
F、根据编码自适应参数m计算码字后缀参数ka和kb:
ka=kb+1
G、由于不同m对应的码字计算方式不同,需要先对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合。
计算ci,q和ci,r,ci,q和ci,r均为自然数。
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n。
H、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成
前缀部分:由ci,q个0紧接一个1组成;
后缀部分:由suffixCount个二进制位表示的数值suffix,其中
其中,当c′i=0时,将suffixCount减1。
其中n为符号集合X′的数目。
步骤I得到的是编码系数集合C′对应的码字集合,表二为不同m时编码系数集合对应的码字集合。
下面结合仿真结论证明本发明的有效性:
将本发明公开的自适应变长编码方法应用在SUVC增强层编码时,本发明相对于0阶指数格伦布获得了平均5.13%(Y-PSNR)、5.11%(U-PSNR)、5.14%(V-PSNR)的BD-rate节省,如表5所示:
表5
Claims (1)
1.一种用于拉普拉斯信源的自适应变长编码方法,其特征在于,包括以下步骤:
S1、输入待编码的拉普拉斯信源,定义符号集合为X={x1,x2,x3,…};
其中median{}表示获得集合X={x1,x2,z3,…}的中位数;
其中n为符号集合X′的数目;
S3、对符号集合X′进行量化,量化步长为Qstep,得到量化系数集合C={c1,c2,c3,…},量化的公式为:
ci=x′i/Qstep
S4、将属于整数集合的量化系数集合C映射到正整数,得到编码系数集合C′={c′1,c′2,c′3,…}
其中i=1,2,3…n;
S5、计算编码自适应参数m:
S6、根据编码自适应参数m计算码字后缀参数ka和kb:
ka=kb+1
S7、对编码系数c′i进行处理:当m≠2p-1,p∈N+,且当c′i≠0时,将c′i加1,其中N+为正整数集合;
S8、计算ci,q和ci,r:
ci,q=c′i/m
ci,r=c′i%m
其中“%”表示取余运算,“/”表示除法运算,其中i=1,2,3…n;
S9、计算编码系数c′i对应的变长编码码字,码字由前缀部分和后缀部分组成:
前缀部分:由ci,q个0后紧接一个1组成;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324798.XA CN114726926B (zh) | 2022-03-30 | 2022-03-30 | 一种用于拉普拉斯信源的自适应变长编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324798.XA CN114726926B (zh) | 2022-03-30 | 2022-03-30 | 一种用于拉普拉斯信源的自适应变长编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114726926A CN114726926A (zh) | 2022-07-08 |
CN114726926B true CN114726926B (zh) | 2023-03-31 |
Family
ID=82240028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210324798.XA Active CN114726926B (zh) | 2022-03-30 | 2022-03-30 | 一种用于拉普拉斯信源的自适应变长编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114726926B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115529357B (zh) * | 2022-11-24 | 2023-03-03 | 武汉惠强新能源材料科技有限公司 | 基于mes互通互联生产数据的更新异常匹配方法 |
CN117411947B (zh) * | 2023-12-15 | 2024-02-23 | 安徽中科大国祯信息科技有限责任公司 | 基于云边协同的水务数据快速传输方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060098733A1 (en) * | 2004-11-08 | 2006-05-11 | Kabushiki Kaisha Toshiba | Variable-length coding device and method of the same |
CN100394693C (zh) * | 2005-01-21 | 2008-06-11 | 华中科技大学 | 一种变长码的编码和解码方法 |
US8509555B2 (en) * | 2008-03-12 | 2013-08-13 | The Boeing Company | Error-resilient entropy coding for partial embedding and fine grain scalability |
JP7139897B2 (ja) * | 2018-11-07 | 2022-09-21 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム |
MX2021014754A (es) * | 2019-06-17 | 2022-01-18 | Electronics & Telecommunications Res Inst | Metodo y aparato de filtrado en bucle adaptativo. |
CN113766247B (zh) * | 2019-06-25 | 2023-07-25 | 北京大学 | 环路滤波的方法与装置 |
JP2021078008A (ja) * | 2019-11-08 | 2021-05-20 | キヤノン株式会社 | 画像処理装置、画像処理方法及び撮像装置 |
-
2022
- 2022-03-30 CN CN202210324798.XA patent/CN114726926B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114726926A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114726926B (zh) | 一种用于拉普拉斯信源的自适应变长编码方法 | |
JP4057595B2 (ja) | 変換係数を算術符号化、復号化するための方法と装置および対応するコンピュータプログラムと対応するコンピュータによる読み出し可能な記憶媒体 | |
KR101737294B1 (ko) | 심볼 압축을 수반하는 데이터의 소스 코딩 및 디코딩을 위한 방법들 및 디바이스들 | |
US7845571B2 (en) | Data compression | |
US20070279261A1 (en) | Method and apparatus for lossless run-length data encoding | |
US7907068B2 (en) | FIFO radix coder for electrical computers and digital data processing systems | |
CN102238387A (zh) | 一种视频熵编码、熵解码方法、装置及介质 | |
US8933826B2 (en) | Encoder apparatus, decoder apparatus and method | |
CN112398484B (zh) | 一种编码方法及相关设备 | |
JP5383301B2 (ja) | 符号化方法、記憶装置及び復号化方法 | |
WO2021031877A1 (zh) | 图像编解码的方法、装置和芯片 | |
CN108810553B (zh) | 一种基于稀疏化处理的移动节点监测数据序列压缩方法 | |
CN112968706B (zh) | 数据压缩方法、fpga芯片及fpga在线升级方法 | |
WO2009009602A1 (en) | Data coding/decoding for electrical computers and digital data processing systems | |
Akhtar et al. | Optimized run length coding for jpeg image compression used in space research program of IST | |
KR20100009032A (ko) | 데이터 무손실 압축 방법 | |
US20220329258A1 (en) | Data compression method and apparatus, and computer readable storage medium | |
KR20160100496A (ko) | 바이너리 클러스터를 이용한 허프만 부호화 효율화 방법 및 그 장치 | |
Jagadeesh et al. | An approach for image compression using adaptive Huffman coding | |
KR100462789B1 (ko) | 이진 산술 부호화를 이용한 다중 부호 데이터 압축 방법및 장치 | |
CN111274950A (zh) | 特征向量数据编解码方法及服务器和终端 | |
JP6707045B2 (ja) | 二値算術復号器および二値算術復号装置 | |
JPH0629861A (ja) | データ圧縮方法 | |
Chen et al. | Highly efficient entropy coding of multilevel images using a modified arithmetic code | |
JP2004128619A (ja) | 符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |