CN118118033A - 基于语义信源的算术编译码方法及相关设备 - Google Patents
基于语义信源的算术编译码方法及相关设备 Download PDFInfo
- Publication number
- CN118118033A CN118118033A CN202410090179.8A CN202410090179A CN118118033A CN 118118033 A CN118118033 A CN 118118033A CN 202410090179 A CN202410090179 A CN 202410090179A CN 118118033 A CN118118033 A CN 118118033A
- Authority
- CN
- China
- Prior art keywords
- sequence
- synonymous
- symbol
- target
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000007906 compression Methods 0.000 abstract description 14
- 230000006835 compression Effects 0.000 abstract description 12
- 230000005540 biological transmission Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 238000013475 authorization Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Abstract
本公开提供了一种基于语义信源的算术编译码方法及相关设备,包括:获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号;针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集;利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列;获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。本公开实现了在保证信源压缩的编码效率的同时,实现了信源数据的语义信息无失真传输。
Description
技术领域
本公开涉及编译码领域,尤其涉及一种基于语义信源的算术编译码方法及相关设备。
背景技术
信源编码是保证通信系统有效性的重要组成部分,其作用是利用无失真或限失真的信源编码方法,对信源数据进行压缩。算术编码是无失真信源编码中的一种常用且重要的编码方法,在编码序列足够长的情况下,算术编码能够使压缩编码的效率逼近经典香农信息论中的无失真信源压缩的极限。现有算术编码中,如果仅保证语义信息不失真的情况下,压缩效率较低。
有鉴于此,如何在保证语义信息不失真的同时,提高压缩效率,成为了一个重要的研究问题。
发明内容
有鉴于此,本公开的目的在于提出一种基于语义信源的算术编译码方法及相关设备,用以解决或部分解决上述问题。
基于上述目的,本公开的第一方面提供了一种基于语义信源的算术编译码方法,应用于编码器,所述方法包括:
获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号;
针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集;
利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列;
获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。
基于上述目的,本公开的第二方面提供了一种基于语义信源的算术编译码方法,应用于译码器,所述方法包括:
接收编码器发送的序列长度及编码结果序列,获取语义信源的预设译码区间及预设语法符号;
利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,其中所述重建同义子集的数量与所述序列长度相同;
针对每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的目标重建语法符号;
将每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
基于同一发明构思,本公开的第三方面提出了一种基于语义信源的算术编译码装置,设置于编码器,包括:
数据获取模块,被配置为获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号;
目标同义子集确定模块,被配置为针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集;
编码结果序列确定模块,被配置为利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列;
数据发送模块,被配置为获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。
基于同一发明构思,本公开的第四方面提出了一种基于语义信源的算术编译码装置,设置于译码器,包括:
编码结果序列接收模块,被配置为接收编码器发送的序列长度及编码结果序列,获取语义信源的预设译码区间及预设语法符号;
重建同义子集确定模块,被配置为利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,其中所述重建同义子集的数量与所述序列长度相同;
目标重建语法符号确定模块,被配置为针对每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的目标重建语法符号;
重建语法符号序列确定模块,被配置为将每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
基于同一发明构思,本公开的第五方面提出了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的基于语义信源的算术编译码方法。
基于同一发明构思,本公开的第六方面提出了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的基于语义信源的算术编译码方法。
基于同一发明构思,本公开的第七方面提出了计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得所述计算机执行如上所述的基于语义信源的算术编译码方法。
从上述可以看出,本公开提出一种基于语义信源的算术编译码方法及相关设备,获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号。针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集,以供后续对每个语法符号对应的预先构建的目标同义子集进行编码。利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列,实现了在信源压缩过程中针对语义信息进行压缩,同时采用算术编码算法提高了数据压缩效率。获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行解码处理,得到重建语法符号序列,保证了重建语法符号序列与原始待编码序列的语义信息相同,实现了语义信息的无失真传输。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A为本公开实施例的基于语义信源的算术编译码方法的流程图;
图1B为本公开实施例的目标编码区间的选取过程的流程图;
图1C为本公开实施例的待编码语法符号序列满足第一预设条件时,确定编码结果序列的流程图;
图2A为本公开另一实施例的基于语义信源的算术编译码方法的流程图;
图2B为本公开另一实施例的预设语法符号满足第二预设条件时,确定重建同义子集的流程图;
图3A为本公开另一实施例的划分同义子集的示意图;
图3B为本公开另一实施例的原始边缘纹理及重建边缘纹理的示意图;
图4为本公开实施例的基于语义信源的算术编译码装置的结构框图;
图5为本公开另一实施例的基于语义信源的算术编译码装置的结构框图;
图6为本公开实施例的电子设备的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
基于上述描述,本实施例提出了一种基于语义信源的算术编译码方法,如图1A所示,应用于编码器,所述方法包括:
步骤101,获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号。
具体实施时,对语义信源的编码区间进行初始化,将初始化的编码区间作为预设编码区间。所述预设编码区间可以看作为语义信源包含的任意信源序列的编码结果的一个集合。获取待编码语法符号序列,所述待编码语法符号序列中包含至少一个语法符号。
示例性地,所述预设编码区间为[0,1),则语义信源包含的任意信源序列都可以映射到[0,1)中的小数区间内。
步骤102,针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集。
具体实施时,每个语法符号均为语义信源中包含的语法符号,可预先对每个语法符号确定其对应的同义子集,并将所述语法符号及同义子集的关系进行关联存储。针对每个语法符号,从关联存储的语法符号及同义子集中确定每个语法符号对应的目标同义子集。
步骤103,利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列。
具体实施时,算术编码是无失真信源编码中的一种常用且重要的编码方法,其基本思路是在设定的编码区间当中,依据待编码符号的概率比值划分子区间,并根据当前的待编码符号选择特定子区间作为新的编码区间,以此基于递归划分子区间的方式,将待编码序列唯一地映射到一个子区间当中,并将能够表示这一子区间中任意数值的最短二进制序列作为压缩结果。
利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到编码结果序列。
步骤104,获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。
具体实施时,遍历所述待编码语法符号序列,得到所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器。译码器对所述编码结果序列进行解码处理,得到长度为所述序列长度的重建语法符号序列,所述重建语法符号序列的语义信息与所述待编码语法符号序列的语义信息相同。
通过上述方案,获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号。针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集,以供后续对每个语法符号对应的预先构建的目标同义子集进行编码。利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列,实现了在信源压缩过程中针对语义信息进行压缩,同时采用算术编码算法提高了数据压缩效率。将所述编码结果序列发送至译码器,以供译码器对所述编码结果序列进行解码处理,得到重建语法符号序列,保证了重建语法符号序列与原始待编码序列的语义信息相同,实现了语义信息的无失真传输。
在一些实施例中,步骤102具体包括:
步骤1021,获取所述语法符号的目标符号信息,从预先构建的与所述语法符号关联的所有初始同义子集中选取与目标符号信息对应的初始同义子集,作为所述语法符号对应的目标同义子集。
具体实施时,每个语法符号包含目标符号信息,且每个语法符号与至少一个初始同义子集相关联。针对每个语法符号,根据目标符号信息从关联的所有初始同义子集中确定与目标符号信息对应的初始同义子集,作为所述语法符号对应的目标同义子集。
所述初始同义子集的构建过程具体包括:
步骤A,针对每个语法符号,获取所述语法符号对应的多个预设符号信息及每个预设符号信息对应的语义信息;
步骤B,根据所述语义信息对多个所述预设符号信息进行划分,将同一语义信息对应的全部预设符号信息划分至同一集合内,得到至少一个初始同义子集;其中,多个预设符号信息中包含所述目标符号信息。
具体实施时,每个语法符号对应有多个预设符号信息,每个预设符号信息对应语义信息,任意两个预设符号信息对应的语义信息可能相同也可能不同,任意两个语法符号信息对应的多个预设符号信息可能相同也可能不同。
针对每个语法符号,根据语义信息对所述语法符号对应的全部预设符号信息进行划分,将相同语义信息的预设语法符号划分至同一集合,得到至少一个初始同义子集。
所述多个预设语法符号信息中包含所述目标符号信息,将所述目标符号信息对应的初始同义子集作为目标同义子集。
示例性地,语法符号为u1,u1对应的预设符号信息为1、2、3、4、5、6、7,u1对应的目标符号信息为3,根据语义信息将所述预设符号信息进行划分,得到u1对应的初始同义子集为同义子集A、同义子集B及同义子集C,同义子集A中包含的预设符号信息为1、2,同义子集B中包含的预设符号信息为3、4,同义子集C中包含的预设符号信息为5、6、7。根据u1对应的目标符号信息,则选取同义子集B为目标同义子集。
在一些实施例中,步骤103具体包括:
步骤1031,针对每个语法符号,对所述语法符号关联的每个所述初始同义子集对应的每个预设符号信息的概率值进行加和处理,得到每个所述初始同义子集的概率值。
具体实施时,针对每个语法符号对应的任意一个初始同义子集,所述初始同义子集的概率值的计算过程,具体包括:
获取所述初始同义子集对应的预设符号信息,确定每个预设符号信息的概率值,并获取预设符号信息的数量。
若所述预设符号信息的数量为一个,则将所述预设符号信息的概率值作为初始同义子集对应的目标概率值。
若所述预设符号信息的数量为多个,将所述初始同义子集对应的每个预设符号信息的概率值进行加和处理,得到所述初始同义子集对应的目标概率值。
示例性地,初始同义子集A,所述初始同义子集A中包含的所述预设符号信息为1、2、3,对应的概率值分别为0.1、0.2、0.1,则所述初始同义子集A对应的目标概率值为0.4。
在一些实施例中,在考虑相关性的基础上,所述初始同义子集的概率还可根据条件概率进行计算,即对于第一排列顺序中除第一顺位的语法符号外的其他顺位的语法符号,其他顺位的语法符号对应的初始同义子集的概率值在计算时,需以已经完成编码的前一个或多个语法符号对应的目标同义子集作为条件确定所述初始同义子集对应的预设符号信息的概率值,将所述初始同义子集对应的预设符号信息的概率值进行加和处理,得到所述初始同义子集的概率值。
示例性地,所述语义信源为一阶马尔可夫信源,根据条件概率进行计算指对于第一排列顺序中除第一顺位的语法符号外的其他顺位的语法符号,其他顺位的语法符号对应的初始同义子集的概率值在计算时,需确定前一顺位的语法符号对应的目标同义子集,以所述前一顺位的语法符号对应的目标同义子集作为条件确定所述初始同义子集对应的预设符号信息的概率值,将所述初始同义子集对应的预设符号信息的概率值进行加和处理,得到所述初始同义子集的概率值。
所述初始同义子集对应的预设符号信息的概率值需要考虑一阶马尔可夫特性,此时所述初始同义子集的概率值利用公式表示为:
其中,为已编码的同义子集,m为语法符号的数量,i为第一排列顺序中的第i顺位,/>为第i顺位的第k个初始同义子集,/>为第i顺位的语法符号对应第k个初始同义子集中所有预设符号信息的序号的集合,ui,n为第i顺位的第n个预设符号信息的概率值。
另一示例,所述语义信源为二阶马尔可夫信源,根据条件概率进行计算指对于第一排列顺序中第二顺位的语法符号对应的初始同义子集的概率值在计算时,需确定第一顺位的语法符号对应的目标同义子集,以所述第一顺位的语法符号对应的目标同义子集作为条件确定所述初始同义子集对应的预设符号信息的概率值,将所述初始同义子集对应的预设符号信息的概率值进行加和处理,得到所述初始同义子集的概率值。
对于第一排列顺序中除第一顺位、第二顺位的语法符号外的其他顺位的语法符号,其他顺位的语法符号对应的初始同义子集的概率值在计算时,需确定前两个顺位的语法符号对应的目标同义子集,以所述前两个顺位的语法符号对应的目标同义子集作为条件确定所述初始同义子集对应的预设符号信息的概率值,将所述初始同义子集对应的预设符号信息的概率值进行加和处理,得到所述初始同义子集的概率值。
所述初始同义子集对应的预设符号信息的概率值需要考虑二阶马尔可夫特性,此时所述初始同义子集的概率值利用公式表示为:
在一些实施例中,初始同义子集的概率可以作为头信息传输给译码器一端。或者,编译码器可以将初始同义子集以提前协定的先验信息的形式在编译码器中进行同步,以避免概率信息占用编码结果序列长度,使压缩效率降低。或者,初始同义子集的概率可以通过自适应概率估计的方式获得,在这种情况下,不需要传输初始同义子集概率,或以提前协定的先验信息的形式在编译码器中同步,只需要在编译码器双方处采用相同的自适应概率估计方法。
步骤1032,获取待编码语法符号序列中的全部语法符号的第一排列顺序,根据所述第一排列顺序、每个语法符号对应的目标同义子集及每个语法符号关联的所有初始同义子集的概率值,利用算术编码算法从所述预设编码区间中选取目标编码区间。
步骤1033,在所述目标编码区间中确定最短二进制序列,将所述最短二进制序列作为待编码语法符号序列对应的编码结果序列。
具体实施时,获取每个初始同义子集包含的每个预设符号信息的概率值,其中所述每个预设符号信息的概率值的确定方式包括下列至少之一:通过统计方式确定、通过先验概率方式、通过查表法确定。
示例性地,通过查表法确定为预先计算每个符号信息的概率值,将所述符号信息及所述概率值进行关联存储至数据库中,在所述数据库中存储形式为表格。根据预设符号信息,从所述数据库中查找得到所述预设符号信息对应的概率值。
根据所述目标同义子集包含的每个预设符号信息的概率值,确定所述目标同义子集的目标概率值。
获取待编码语法符号序列中的全部语法符号的第一排列顺序,依据所述第一排列顺序、每个语法符号对应的目标同义子集及所述每个语法符号关联的所有初始同义子集的概率值,利用算术编码算法从所述预设编码区间中选取目标编码区间。
在所述目标编码区间中确定最短二进制序列,所述最短二进制序列为能够表征所述目标编码区间中数值的最短的二进制编码序列,将所述最短二进制序列作为编码结果序列。所述最短二进制序列对应的码字在所述目标编码区间内。
在一些实施例中,若预设编码区间为[0,1),最短二进制序列为码字对应的二进制小数序列,其满足的关系如下:
c=b1·2-1+b2·2-2+…bl·2-l;
其中,b为最短二进制序列,其中b=(b1,b2,…,bl),c为码字,l为最短二进制序列的长度。
在一些实施例中,步骤1032具体包括:
步骤10321,将所述预设编码区间作为候选编码区间,将所述第一排列顺序中的第一顺位作为目标顺位,对所述预设编码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
步骤1032A,在所述候选编码区间中,根据目标顺位的语法符号对应的全部初始同义子集的概率值,对所述候选编码区间进行划分,得到每个初始同义子集对应的至少一个初始编码区间;
步骤1032B,将至少一个初始编码区间中与目标顺位的语法符号对应的目标同义子集对应的初始编码区间,作为更新的候选编码区间,按照所述第一排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
步骤1032C,直至按照所述第一排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
步骤1032D,将经过至少一轮迭代操作后的候选编码区间作为所述目标编码区间。
具体实施时,将所述预设编码区间作为候选编码区间,将所述第一排列顺序中的第一顺位作为目标顺位,对所述预设编码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
在候选编码区间中,依据目标顺位的语法符号对应的目标同义子集选取对应的区间,作为更新的候选编码区间,将所述第一排列顺序中目标顺位的下一顺位作为下一轮迭代的目标顺位,直至按照所述第一排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作。将经过至少一轮迭代操作后的候选编码区间作为所述目标编码区间。
具体地,更新的候选编码区间的确定过程如下:
获取目标顺位的语法符号对应的全部初始同义子集的概率值,其中全部初始同义子集的概率和为1。利用所述概率值对所述候选编码区间进行划分,得到每个初始同义子集对应的至少一个初始编码区间,每个初始编码区间与所述初始同义子集的概率值一一对应。根据所述目标顺位的语法符号对应的目标同义子集从至少一个初始编码区间选取所述目标同义子集对应的初始编码区间作为更新的候选编码区间。
示例性地,目标顺位的语法符号为u1,获取u1对应的全部初始同义子集为同义子集A、同义子集B、同义子集C,所述同义子集A的概率值为0.2、所述同义子集B的概率值为0.3、所述同义子集C的概率值为0.5,根据目标顺位的语法符号对应的全部初始同义子集的概率值,对所述候选编码区间进行划分,得到同义子集A对应的初始编码区间占所述候选编码区间的0.2、同义子集B对应的初始编码区间占所述候选编码区间的0.3、同义子集C对应的初始编码区间占所述候选编码区间的0.5。获取目标顺位的语法符号对应的目标同义子集为B,则将同义子集B对应的初始编码区间作为更新的候选编码区间。
示例性地,预设编码区间为[L0,H0),第一排列顺序为(u1,u2,u3),将u1作为目标顺位,根据u1对应的目标同义子集在[L0,H0)选取对应的区间作为更新的候选编码区间[L1,H1)。将u2作为目标顺位,根据u2对应的目标同义子集在[L1,H1)选取对应的区间作为更新的候选编码区间[L2,H2)。将u3作为目标顺位,根据u3对应的目标同义子集在[L2,H2)选取对应的区间作为更新的候选编码区间[L3,H3)。所述目标顺位不存在下一顺位,退出迭代操作,将[L3,H3)作为所述目标编码区间。
另一示例,预设编码区间为[L0,H0),目标编码区间为[Lm,Hm),b为最短二进制序列,ui为第i顺位的语法符号,为第i顺位的语法符号对应的目标同义子集。确定每一顺位的语法符号对应的目标同义子集,利用算术编码算法从所述预设编码区间中根据每一顺位的目标同义子集选取目标编码区间,选取过程的示意图如图1B所示。
在一些实施例中,在确定更新的候选编码区间后,为保证计算精度,可对更新的候选编码区间进行放大处理。
所述放大处理的方法为,设更新的候选编码区间为[Li,Hi),选择一个数值s满足Li-ε<s≤Li和s<Hi,并将[Li,Hi)的区间更新为[α(Li-s),α(Hi-s)),其中,ε为一个较小的数值,表示数值s的取值应接近于Li。α为放大倍数,其取值范围应为大于等于1且能使更新后的区间符合计算精度的特定数值。
在一些实施例中,步骤103具体包括:
步骤103A,获取待编码语法符号序列中的全部语法符号的排列顺序。
步骤103B,利用算术编码算法及所述预设编码区间,根据所述排列顺序依次对每个语法符号对应的同义子集进行编码处理,得到每个语法符号对应的编码子序列。
步骤103C,对所有编码子序列按照所述排列顺序进行整合处理,得到待编码语法符号序列对应的编码结果序列。
具体实施时,编码结果序列不必在编码完成之后进行转换,即可以在编码的过程中逐步输出部分的二进制子序列,以使得在编码过程结束后,合并所有的二进制子序列作为完整的编码结果。
在一些实施例中,在步骤103之前,还包括:
判断所述待编码语法符号序列是否满足第一预设条件,所述第一预设条件包括:待编码语法符号序列中任意两个语法符号对应的多个预设符号信息相同、任意两个语法符号对应的初始同义子集相同、且任意两个语法符号对应的初始同义子集的概率值相同。
若确定所述待编码语法符号序列满足所述第一预设条件,如图1C所示,步骤103具体包括:
步骤103a,根据每个语法符号对应的目标同义子集构建目标同义子集序列。
步骤103b,利用算术编码算法及所述预设编码区间,对所述目标同义子集序列进行编码处理,得到待编码语法符号序列对应的编码结果序列。
具体实施时,编码器还可直接同义子集序列进行编码处理。当待编码语法符号序列满足所述第一预设条件时,根据每个语法符号对应的目标同义子集构建目标同义子集序列,利用算术编码算法及所述预设编码区间,对所述目标同义子集序列进行编码处理,得到待编码语法符号序列对应的编码结果序列。
示例性地,待编码语法符号序列包括语法符号A及语法符号B,所述语法符号A对应的预设符号信息为1、2、3,所述语法符号B对应的预设符号信息为1、2、3。此时任意两个语法符号对应的多个预设符号信息相同。所述语法符号A对应的初始同义子集a包含的预设符号信息为1、3,语法符号A对应的初始同义子集b包含的预设符号信息为2,所述语法符号B对应的初始同义子集a包含的预设符号信息为1、3,语法符号B对应的初始同义子集b包含的预设符号信息为2,此时任意两个语法符号对应的初始同义子集相同。语法符号A对应的初始同义子集a对应的概率值为0.3,语法符号A对应的初始同义子集b对应的概率值为0.2,语法符号B对应的初始同义子集a对应的概率值为0.3,语法符号B对应的初始同义子集b对应的概率值为0.2,此时任意两个语法符号对应的初始同义子集的概率值相同。
即待编码语法符号序列满足第一预设条件,确定每个语法符号对应的目标同义子集构建目标同义子集序列,即语法符号A对应的目标同义子集为a,语法符号B对应的目标同义子集为b,构建目标同义子集序列。利用算术编码算法及所述预设编码区间,对所述目标同义子集序列进行编码处理,得到待编码语法符号序列对应的编码结果序列。
通过上述方案,针对待编码语法符号序列,在满足待编码语法符号序列中任意两个语法符号对应的多个预设符号信息相同、任意两个语法符号对应的初始同义子集相同、且任意两个语法符号对应的初始同义子集的概率值相同的条件下,在保证重建语法符号序列与编码端的语法符号序列满足语义无失真条件下,相比于基于香农信息论的算术编码获得更高的压缩效率,并进一步简化语义信源算术编译码算法的实现难度。
本公开另一实施例提出了一种基于语义信源的算术编译码方法,如图2A所示,应用于译码器,所述方法包括:
步骤201,接收编码器发送的序列长度及编码结果序列,获取语义信源的预设译码区间及预设语法符号。
具体实施时,接收到编码器发送的序列长度即编码结果序列,确定语义信源包含的预设语法符号及预设译码区间。与编码过程中的初始编码区间相对应,初始译码区间可以看作任意待解码二进制序列对应码字的一个集合。
步骤202,利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,其中所述重建同义子集的数量与所述序列长度相同。
具体实施时,基于算术译码算法及预设译码区间,对接收到的编码结果序列进行译码处理,得到所述编码结果序列对应的至少一个重建同义子集,所述重建同义子集的数量与序列长度相同,所述重建同义子集对应的语义信息与编码时目标同义子集对应的语义信息相同。
步骤203,针对每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的目标重建语法符号。
具体实施时,对于每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的至少一个初始重建语法符号。
获取所述初始重建语法符号的数量,若所述初始重建语法符号的数量为一个,则将所述初始重建语法符号作为目标重建语法符号。若所述初始重建语法符号的数量为多个,则在所述初始重建语法符号中任意选取或按一定规则选取一个初始重建语法符号作为目标重建语法符号。其中,按一定规则选取一个初始重建语法符号作为目标重建语法符号包括通过预先设定的先验概率值确定目标重建语法符号、或根据重建同义子集对应的语义信息的相关背景知识确定目标重建语法符号、或通过训练完成的神经网络模型确定目标重建语法符号,其中所述神经网络模型的输入为多个重建同义子集、输出为目标重建语法符号。
步骤204,将每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
具体实施时,获取重建同义子集的排列顺序,确定每个重建同义子集对应的目标重建语法符号,根据所述重建同义子集的排列顺序对所述每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
在一些实施例中,步骤202具体包括:
步骤2021,对所述编码结果序列进行转换处理,得到目标码字。
具体实施时,在预设译码区间中,编码结果序列与码字一一对应,因此对编码结果序列进行转换处理,得到目标码字。
在一些实施例中,所述预设译码区间为[0,1)时,可根据所述编码结果序列与码字间的关系,根据编码结果序列计算得到对应的码字。所述关系通过公式表示为:
c=b1·2-1+b2·2-2+…bl·2-l。
步骤2022,根据所述序列长度构建重建符号序列,所述重建符号序列中的元素数量与所述序列长度相同。
步骤2023,确定所述重建符号序列中元素的第二排列顺序。
步骤2024,针对重建符号序列中的每个元素,获取所述元素对应的至少一个初始重建同义子集及每个初始重建同义子集的概率值。
步骤2025,根据所述第二排列顺序、每个元素对应的每个初始重建同义子集的概率值及所述目标码字,利用算术译码算法从所述预设译码区间中确定每个元素对应的目标译码区间。
步骤2026,针对每个元素,根据所述目标译码区间及所有初始重建同义子集确定所述元素对应的重建同义子集。
具体实施时,根据所述序列长度构建重建符号序列,所述重建符号序列中的元素数量与所述序列长度相同,确定所述重建符号序列中元素的第二排列顺序,针对重建符号序列中的每个元素,获取所述元素对应的至少一个初始重建同义子集及每个初始重建同义子集的概率值。
所述元素对应的至少一个初始重建同义子集及每个初始重建同义子集的概率值可由编码器发送至译码器,也可由提前协定的先验信息中获取,或采用自适应概率估计的方式获得。
根据所述第二排列顺序、每个元素对应的每个初始重建同义子集的概率值及所述目标码字,利用算术译码算法从所述预设译码区间中确定每个元素对应的目标译码区间。针对每个元素,根据所述目标译码区间及所有初始重建同义子集确定所述元素对应的重建同义子集。
在一些实施例中,步骤2025具体包括:
步骤20251,将所述预设译码区间作为候选译码区间,将所述第二排列顺序中的第一顺位作为目标顺位,对所述预设译码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
步骤2025A,根据目标顺位的元素对应的每个初始重建同义子集的概率值对所述候选译码区间进行划分,得到至少一个初始译码区间,其中所述初始译码区间与所述初始重建同义子集的概率值一一对应;
步骤2025B,从多个初始译码区间中选取包含所述目标码字的初始译码区间作为目标顺位的元素对应的目标译码区间,将所述目标译码区间作为更新的候选译码区间,按照所述第二排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
步骤2025C,直至按照所述第二排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
步骤2025D,得到每个元素对应的目标译码区间。
具体实施时,将所述预设译码区间作为候选译码区间,将所述第二排列顺序中的第一顺位作为目标顺位,对所述预设译码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
根据目标顺位的元素对应的每个初始重建同义子集的概率值对所述候选译码区间进行划分,得到至少一个初始译码区间,每个初始译码区间与所述初始重建同义子集的概率值一一对应,进而所述初始译码区间与所述初始重建同义子集一一对应。
从多个初始译码区间中选取包含所述目标码字的初始译码区间作为目标顺位的元素对应的目标译码区间,将所述目标译码区间作为更新的候选译码区间,按照所述第二排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位,直至按照所述第二排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作,得到每个元素对应的目标译码区间。
示例性地,初始译码区间为[L0,H0),第二排列顺序为(u1,u2),将u1作为目标顺位,获取u1对应的每个初始重建同义子集为重建同义子集A、重建同义子集B、重建同义子集C,获取u1对应的每个初始重建同义子集的概率值,即重建同义子集A的概率值为0.2、重建同义子集B的概率值为0.6、重建同义子集C的概率值为0.2,对[L0,H0)进行划分,得到三个初始译码区间,确定包含所述目标码字的初始译码区间为重建同义子集B对应的初始译码区间,将重建同义子集B对应的初始译码区间作为更新后的候选译码区间[L1,H1)。
将u2作为目标顺位,获取u2对应的每个初始重建同义子集为重建同义子集D、重建同义子集E,获取u2对应的每个初始重建同义子集的概率值,即重建同义子集D的概率值为0.1、重建同义子集E的概率值为0.9,对[L1,H1)进行划分,得到两个初始译码区间,确定包含所述目标码字的初始译码区间为重建同义子集E对应的初始译码区间,将重建同义子集E对应的初始译码区间作为更新后的候选译码区间[L2,H2)。所述目标顺位不存在下一顺位,退出迭代操作,将[L2,H2)作为所述目标译码区间。
在一些实施例中,在步骤102之前,还包括:
判断所述预设语法符号是否满足第二预设条件,所述第二预设条件,为任意两个预设语法符号对应的多个预设符号信息相同、任意两个预设语法符号对应的初始同义子集的划分方式相同、且任意两个预设语法符号对应的初始同义子集的第三概率值相同。
若确定所述预设语法符号满足所述第二预设条件,如图2B所示,步骤202包括:
步骤202A,利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到重建同义子集序列,其中所述重建同义子集序列中包含多个重建同义子集。
具体实施时,若所述预设语法符号中任意两个预设语法符号对应的多个预设符号信息相同、任意两个预设语法符号对应的初始同义子集的划分方式相同、且任意两个预设语法符号对应的初始同义子集的第三概率值相同。此时,直接利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,即可得到重建同义子集序列。
在一些实施例中,在步骤205C之前,还包括:
对每个所述候选译码区间进行归一化处理,对所述目标码字进行归一化处理。后续根据目标顺位的元素对应的每个初始重建同义子集的概率值对归一化后的候选译码区间进行划分,得到至少一个初始译码区间。从多个初始译码区间中选取包含所述归一化后的目标码字的初始译码区间作为目标顺位的元素对应的目标译码区间。
通过上述方案,通过对候选译码区间进行归一化,避免了候选译码区间递归深度过高、计算精度不足导致的译码错误等问题。
基于同一发明构思,本公开的另一实施例示出了一种针对自然图像的边缘纹理图信源的语义信源的算术编译码结果,具体包括:
作为语义信源的自然图像的边缘纹理图来自公开数据集BIPEDv2d,每个边缘纹理图是分辨率为720*1280的01黑白图,其中黑色表示图像中的非边缘纹理部分(物体和背景),数值为0,白色表示图像中的边缘纹理部分(物体与物体、物体与背景之间的边界),数值为1。
为进行语义信源无失真压缩,本实施例以互不重叠的2*2图像块作为1个语法符号,其对应16个预设符号信息,取值范围为1,2,3,…,16,其中,每个预设符号信息对应一个2*2的图像块类型。在编码过程中,每个语法符号都满足具有相同的可能取值范围、同义映射方法,以及相同的同义子集概率的条件,根据语义信息划分得到的同义子集如图3A所示。根据纹理形式(即语义信息),可以将这16个预设符号信息分为11个同义子集,其中,同义子集表示右上(左下)方向纹理,包含3个预设符号信息,同义子集表示左上(右下)方向纹理,包含4个预设符号信息,其他同义子集各包含1个预设符号信息。在译码过程中,同义规则选用随机选择方式,从同义子集中随机选取一个预设符号信息进行输出。
图3B为实施例对应的原始边缘纹理与重建边缘纹理的效果对比与压缩效果展示图。其中,原始边缘纹理与重建边缘纹理都在原图中以深色边框显实,来呈现重建边缘纹理的语义准确性。
由图可知,通过计算可知,当使用标准算术编码时,该示例中的边缘纹理可以压缩到L=205990bit,而当采用本申请公开的语义信源算术编码方法时,该示例中的边缘纹理图可以压缩到Lg=204003bit,相对节省1987bit。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种基于语义信源的算术编译码装置。
参考图4,图4为实施例的基于语义信源的算术编译码装置,设置于编码器,包括:
数据获取模块401,被配置为获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号;
目标同义子集确定模块402,被配置为针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集;
编码结果序列确定模块403,被配置为利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列;
数据发送模块404,被配置为获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。
在一些实施例中,所述目标同义子集确定模块402被配置为:
获取所述语法符号的目标符号信息,从预先构建的与所述语法符号关联的所有初始同义子集中选取与目标符号信息对应的初始同义子集,作为所述语法符号对应的目标同义子集;
所述初始同义子集的构建过程包括:
针对每个语法符号,获取所述语法符号对应的多个预设符号信息及每个预设符号信息对应的语义信息;
根据所述语义信息对多个所述预设符号信息进行划分,将同一语义信息对应的全部预设符号信息划分至同一集合内,得到至少一个初始同义子集;其中,多个预设符号信息中包含所述目标符号信息。
在一些实施例中,所述编码结果序列确定模块403具体包括:
概率值确定单元,被配置为针对每个语法符号,对所述语法符号关联的每个所述初始同义子集对应的每个预设符号信息的概率值进行加和处理,得到每个所述初始同义子集的概率值;
目标编码区间确定单元,被配置为获取待编码语法符号序列中的全部语法符号的第一排列顺序,根据所述第一排列顺序、每个语法符号对应的目标同义子集及每个语法符号关联的所有初始同义子集的概率值,利用算术编码算法从所述预设编码区间中选取目标编码区间;
编码结果序列确定单元,被配置为在所述目标编码区间中确定最短二进制序列,将所述最短二进制序列作为待编码语法符号序列对应的编码结果序列。
在一些实施例中,所述目标编码区间确定单元具体被配置为:
将所述预设编码区间作为候选编码区间,将所述第一排列顺序中的第一顺位作为目标顺位,对所述预设编码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
在所述候选编码区间中,根据目标顺位的语法符号对应的全部初始同义子集的概率值,对所述候选编码区间进行划分,得到每个初始同义子集对应的至少一个初始编码区间;
将至少一个初始编码区间中与目标顺位的语法符号对应的所述目标同义子集对应的初始编码区间,作为更新的候选编码区间,按照所述第一排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
直至按照所述第一排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
将经过至少一轮迭代操作后的候选编码区间作为所述目标编码区间。
在一些实施例中,所述装置还包括条件判断模块,所述条件判断模块具体被配置为判断所述待编码语法符号序列是否满足第一预设条件;所述第一预设条件包括:待编码语法符号序列中任意两个语法符号对应的多个预设符号信息相同、任意两个语法符号对应的初始同义子集相同、且任意两个语法符号对应的初始同义子集的概率值相同。
若确定所述待编码语法符号序列满足所述第一预设条件,所述编码结果序列确定模块具体被配置为:
根据每个语法符号对应的目标同义子集构建目标同义子集序列;
利用算术编码算法及所述预设编码区间,对所述目标同义子集序列进行编码处理,得到待编码语法符号序列对应的编码结果序列。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种基于语义信源的算术编译码装置。
参考图5,图5为实施例的基于语义信源的算术编译码装置,设置于译码器,包括:
编码结果序列接收模块501,被配置为接收编码器发送的序列长度及编码结果序列,获取语义信源的预设译码区间及预设语法符号;
重建同义子集确定模块502,被配置为利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,其中所述重建同义子集的数量与所述序列长度相同;
目标重建语法符号确定模块503,被配置为针对每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的目标重建语法符号;
重建语法符号序列确定模块504,被配置为将每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
在一些实施例中,所述重建同义子集确定模块502具体包括:
目标码字确定单元,被配置为对所述编码结果序列进行转换处理,得到目标码字;
重建符号序列构建单元,被配置为根据所述序列长度构建重建符号序列,所述重建符号序列中的元素数量与所述序列长度相同;
排列顺序确定单元,被配置为确定所述重建符号序列中元素的第二排列顺序;
概率值确定单元,被配置为针对重建符号序列中的每个元素,获取所述元素对应的至少一个初始重建同义子集及每个初始重建同义子集的概率值;
目标译码区间确定单元,被配置为根据所述第二排列顺序、每个元素对应的每个初始重建同义子集的概率值及所述目标码字,利用算术译码算法从所述预设译码区间中确定每个元素对应的目标译码区间;
重建同义子集确定单元,被配置为针对每个元素,根据所述目标译码区间及所有初始重建同义子集确定所述元素对应的重建同义子集。
在一些实施例中,所述目标译码区间确定单元被配置为:
将所述预设译码区间作为候选译码区间,将所述第二排列顺序中的第一顺位作为目标顺位,对所述预设译码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
根据目标顺位的元素对应的每个初始重建同义子集的概率值对所述候选译码区间进行划分,得到至少一个初始译码区间,其中所述初始译码区间与所述初始重建同义子集的概率值一一对应;
从多个初始译码区间中选取包含所述目标码字的初始译码区间作为目标顺位的元素对应的目标译码区间,将所述目标译码区间作为更新的候选译码区间,按照所述第二排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
直至按照所述第二排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
得到每个元素对应的目标译码区间。
在一些实施例中,所述装置还包括条件判断模块,所述条件判断模块被配置为:判断所述预设语法符号是否满足第二预设条件;所述第二预设条件,为任意两个预设语法符号对应的多个预设符号信息相同、任意两个预设语法符号对应的初始同义子集的划分方式相同、且任意两个预设语法符号对应的初始同义子集的第三概率值相同。
若确定所述预设语法符号满足所述第二预设条件,所述重建同义子集确定模块具体被配置为:
利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到重建同义子集序列,其中所述重建同义子集序列中包含多个重建同义子集。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本公开时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的基于语义信源的算术编译码方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的基于语义信源的算术编译码方法。
图6示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的基于语义信源的算术编译码方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的基于语义信源的算术编译码方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的基于语义信源的算术编译码方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
可以理解的是,在使用本公开中各个实施例的技术方案之前,均会通过恰当的方式对所涉及的个人信息的类型、使用范围、使用场景等告知用户,并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确的提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主的选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定的实现方式,响应于接受到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其他满足相关法律法规的方式也可应用于本公开的实现方式中。
基于同一构思,与上述任意实施例方法相对应的,本申请还提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得所述计算机执行如上任一实施例所述的基于语义信源的算术编译码方法,具有相应的方法实施例的有益效果,在此不再赘述。
可以理解的是,在使用本公开中各个实施例的技术方案之前,均会通过恰当的方式对所涉及的个人信息的类型、使用范围、使用场景等告知用户,并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确的提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主的选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定的实现方式,响应于接受到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其他满足相关法律法规的方式也可应用于本公开的实现方式中。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种基于语义信源的算术编译码方法,其特征在于,应用于编码器,包括:
获取语义信源的预设编码区间及待编码语法符号序列,其中所述待编码语法符号序列中包含至少一个语法符号;
针对每个语法符号,确定与每个语法符号对应的预先构建的目标同义子集;
利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列;
获取所述待编码语法符号序列的序列长度,将所述序列长度及所述编码结果序列发送至译码器,以供译码器基于所述序列长度对所述编码结果序列进行译码处理,得到重建语法符号序列。
2.根据权利要求1所述的方法,其特征在于,所述确定与每个语法符号对应的预先构建的目标同义子集,具体包括:
获取所述语法符号的目标符号信息,从预先构建的与所述语法符号关联的所有初始同义子集中选取与目标符号信息对应的初始同义子集,作为所述语法符号对应的目标同义子集;
所述初始同义子集的构建过程包括:
针对每个语法符号,获取所述语法符号对应的多个预设符号信息及每个预设符号信息对应的语义信息;
根据所述语义信息对多个所述预设符号信息进行划分,将同一语义信息对应的全部预设符号信息划分至同一集合内,得到至少一个初始同义子集;其中,多个预设符号信息中包含所述目标符号信息。
3.根据权利要求2所述的方法,其特征在于,所述利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,得到待编码语法符号序列对应的编码结果序列,包括:
针对每个语法符号,对所述语法符号关联的每个所述初始同义子集对应的每个预设符号信息的概率值进行加和处理,得到每个所述初始同义子集的概率值;
获取待编码语法符号序列中的全部语法符号的第一排列顺序,根据所述第一排列顺序、每个语法符号对应的目标同义子集及每个语法符号关联的所有初始同义子集的概率值,利用算术编码算法从所述预设编码区间中选取目标编码区间;
在所述目标编码区间中确定最短二进制序列,将所述最短二进制序列作为待编码语法符号序列对应的编码结果序列。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一排列顺序、每个语法符号对应的目标同义子集及每个语法符号关联的所有初始同义子集的概率值,利用算术编码算法从所述预设编码区间中选取目标编码区间,包括:
将所述预设编码区间作为候选编码区间,将所述第一排列顺序中的第一顺位作为目标顺位,对所述预设编码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
在所述候选编码区间中,根据目标顺位的语法符号对应的全部初始同义子集的概率值,对所述候选编码区间进行划分,得到每个初始同义子集对应的至少一个初始编码区间;
将至少一个初始编码区间中与目标顺位的语法符号对应的目标同义子集对应的初始编码区间,作为更新的候选编码区间,按照所述第一排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
直至按照所述第一排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
将经过至少一轮迭代操作后的候选编码区间作为所述目标编码区间。
5.根据权利要求1所述的方法,其特征在于,在利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理之前,还包括:
判断所述待编码语法符号序列是否满足第一预设条件,其中,所述第一预设条件包括:待编码语法符号序列中任意两个语法符号对应的多个预设符号信息相同、任意两个语法符号对应的初始同义子集相同、且任意两个语法符号对应的初始同义子集的概率值相同;
若确定所述待编码语法符号序列满足所述第一预设条件,则所述利用算术编码算法及所述预设编码区间,对每个语法符号对应的目标同义子集进行编码处理,包括:
根据每个语法符号对应的目标同义子集构建目标同义子集序列;
利用算术编码算法及所述预设编码区间,对所述目标同义子集序列进行编码处理,得到待编码语法符号序列对应的编码结果序列。
6.一种基于语义信源的算术编译码方法,其特征在于,应用于译码器,包括:
接收编码器发送的序列长度及编码结果序列,获取语义信源的预设译码区间及预设语法符号;
利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,其中所述重建同义子集的数量与所述序列长度相同;
针对每个重建同义子集,确定所述重建同义子集对应的语义信息,根据所述语义信息从所述预设语法符号中选取与重建同义子集对应的目标重建语法符号;
将每个重建同义子集对应的目标重建语法符号进行排列,得到重建语法符号序列。
7.根据权利要求6所述的方法,其特征在于,所述利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到至少一个重建同义子集,包括:
对所述编码结果序列进行转换处理,得到目标码字;
根据所述序列长度构建重建符号序列,所述重建符号序列中的元素数量与所述序列长度相同;
确定所述重建符号序列中元素的第二排列顺序;
针对重建符号序列中的每个元素,获取所述元素对应的至少一个初始重建同义子集及每个初始重建同义子集的概率值;
根据所述第二排列顺序、每个元素对应的每个初始重建同义子集的概率值及所述目标码字,利用算术译码算法从所述预设译码区间中确定每个元素对应的目标译码区间;
针对每个元素,根据所述目标译码区间及所有初始重建同义子集确定所述元素对应的重建同义子集。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第二排列顺序、每个元素对应的每个初始重建同义子集的概率值及所述目标码字,利用算术译码算法从所述预设译码区间中确定每个元素对应的目标译码区间,包括:
将所述预设译码区间作为候选译码区间,将所述第二排列顺序中的第一顺位作为目标顺位,对所述预设译码区间进行至少一轮迭代操作,每一轮迭代操作执行如下:
根据目标顺位的元素对应的每个初始重建同义子集的概率值对所述候选译码区间进行划分,得到至少一个初始译码区间,其中所述初始译码区间与所述初始重建同义子集的概率值一一对应;
从多个初始译码区间中选取包含所述目标码字的初始译码区间作为目标顺位的元素对应的目标译码区间,将所述目标译码区间作为更新的候选译码区间,按照所述第二排列顺序将所述目标顺位的下一顺位作为下一轮迭代的目标顺位;
直至按照所述第二排列顺序,所述目标顺位不存在下一顺位,则退出迭代操作;
得到每个元素对应的目标译码区间。
9.根据权利要求7所述的方法,其特征在于,在利用算术译码算法及所述预设译码区间,根据所述编码结果序列进行译码处理,得到重建同义子集之前,还包括:
判断所述预设语法符号是否满足第二预设条件,其中所述第二预设条件,为任意两个预设语法符号对应的多个预设符号信息相同、任意两个预设语法符号对应的初始同义子集的划分方式相同、且任意两个预设语法符号对应的初始同义子集的第三概率值相同;
若确定所述预设语法符号满足所述第二预设条件,则所述利用算术译码算法及所述预设译码区间,根据所述编码结果序列进行译码处理,得到重建同义子集,包括:
利用算术译码算法及所述预设译码区间,对所述编码结果序列进行译码处理,得到重建同义子集序列,其中所述重建同义子集序列中包含多个重建同义子集。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至5任意一项所述的基于语义信源的算术编译码方法或权利要求6至9任意一项所述的基于语义信源的算术编译码方法。
Publications (1)
Publication Number | Publication Date |
---|---|
CN118118033A true CN118118033A (zh) | 2024-05-31 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI587640B (zh) | 用於音訊/視訊樣本向量之錐型向量量化檢索/解檢索之方法及裝置 | |
CN110019865B (zh) | 海量图片处理方法、装置、电子设备及存储介质 | |
CN113473149A (zh) | 用于无线图像传输的语义信道联合编码方法及装置 | |
WO2021130754A1 (en) | Systems and methods of data compression | |
CN112995199B (zh) | 数据编解码方法、装置、传输系统、终端设备及存储介质 | |
US20140015698A1 (en) | System and method for fixed rate entropy coded scalar quantization | |
CN106537914A (zh) | 通过限制的进位运算来执行算术编译的方法和设备 | |
CN112886971A (zh) | 一种信源信道联合极化的消息传递方法及装置 | |
CN118118033A (zh) | 基于语义信源的算术编译码方法及相关设备 | |
CN113794479B (zh) | 极化调节卷积码的生成方法及相关设备 | |
CN107645665B (zh) | 一种WebP熵编码的方法及装置 | |
CN109474826B (zh) | 图片压缩方法、装置、电子设备及存储介质 | |
CN113595563B (zh) | 一种ldpc译码的方法、装置、设备及存储介质 | |
US10340946B2 (en) | Encoders, decoders, and methods | |
CN113922947A (zh) | 一种基于加权概率模型的自适应对称编码方法以及系统 | |
CN112332861B (zh) | 一种优化误比特率性能的极化码构造方法及装置 | |
CN115811318B (zh) | polar码编码方法、装置、通信设备、存储介质 | |
CN114499751B (zh) | 基于极化aloha的列表增强译码方法和装置 | |
US10469877B1 (en) | Systems and methods for reduced complexity entropy coding | |
CN118174737A (zh) | 基于语义的哈夫曼编码方法、译码方法及相关设备 | |
KR20230040702A (ko) | 극 부호를 이용하는 복호화를 위한 복호 위치 제어 정보 생성 방법 및 장치 | |
CN118174734A (zh) | 语义信道的编码与译码方法及电子设备 | |
CN114024551A (zh) | 数据无损压缩方法、系统、电子设备及介质 | |
CN117938177A (zh) | 并行译码验证方法、装置、电子设备及存储介质 | |
CN115833848A (zh) | 译码确定方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |