CN1193848A - 自适应编码方法 - Google Patents

自适应编码方法 Download PDF

Info

Publication number
CN1193848A
CN1193848A CN98105752A CN98105752A CN1193848A CN 1193848 A CN1193848 A CN 1193848A CN 98105752 A CN98105752 A CN 98105752A CN 98105752 A CN98105752 A CN 98105752A CN 1193848 A CN1193848 A CN 1193848A
Authority
CN
China
Prior art keywords
prepotent
value
mentioned
occurrence frequency
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98105752A
Other languages
English (en)
Other versions
CN1096752C (zh
Inventor
木村智广
柳谷太一
小野文孝
吉田雅之
上野几朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1193848A publication Critical patent/CN1193848A/zh
Application granted granted Critical
Publication of CN1096752C publication Critical patent/CN1096752C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

在现有的无记忆信息源数据的概率推测方法中存在推测概率误差大、编码效率低的问题。本自适应编码方法包括:对输入数据算出优势符号或劣势符号的出现频度的第4步骤(508)、(510);将在第4步算出的出现频度的出现次数累积值与规定值进行比较、当出现次数累积值达到规定值时、将上述的优势符号或劣势符号的出现频度减半的第5步骤(511);和对数据信号使优势符号和劣势符号与数线上的规定的区域对应并将该数线上的坐标作为代码字输出的第6步骤(513)。

Description

自适应编码方法
本发明涉及信息的编码,特别是涉及用于熵编码的概率推算的自适应编码方法。
众所周知,在用平均信息量、算术编码、译码等算出熵时,有必要推算需要先编码后译码的信号的概率。在算术编码和译码中,通过高精度的的概率推算可以大大地压缩数据。因此,希望概率推算能适应优先的信号概率的变化。
在过去已知的美国专利(USP5025258)中,公开了使适应编码和译码信号的概率推算的程度最佳的技术。对于上述先有的技术,根据图1、图2进行详细地说明。
图1示出使先有的的熵编码器101简化了的方框图,图中,输入数据符号s(k),将这些数据符号S(K)编码成数据流a(i),而且,经传送媒体102将将这些数据符号S(K)向远处的熵译码器103传送。熵译码器103为了得到接收机的数据流,经传送媒体将其作为传送来的符号s(k)的复制品进行译码。符号s(k)包含元素(0,…,s-1),即,
式1
           S(k)∈(0,…,S-1)
这样,符号可以以所希望的多值或2值给出。
因此,在该例中,编码器101包含算术编码器单元104、字符串抽出器105、自适应概率推算器106和线路接口107。符号s(k)和概率推算p(k)送给算术编码器单元104,在此,使用众所周知的方法来产出编码了的数据流。这样的算术编码器单元在本技术领域内是众所周知的。在题为‘具有算术编码的黑白图象的压缩’(Compressing of Black-White Image withArithmetic Coing)的1981年6月发行的IEEE Transaction onCommunications VOL.cos-29.P858-867的文献中,此外,在有关用于将具有2值元素的符号编码/译码的算术编码器/译码器的1986年12月30日发行的美国专利(USP4,636,490号)、在有关用于将具有更多值元素的符号编码/译码的算术编码器/译码器的1987年6月发行的Communications of theACM第30卷、第6号、P.520-540的题为‘用于数据压缩的算术编码’(Arithmatic coding for data Compression)的文献等中都公开了。线路接口107对已编码的数据流a(i)进行接口,并送往传送媒体102,该传送媒体102依次将其送给远处的译码器103。因此,线路接口107包括一个合适装置,用于将数据流的格式转换成传送媒体102所用的符号格式,作为熟知的可能传送媒体的例子,有T-传送干线、ISDN综合业务数字网、局域网等。这样的线路接口在该领域内也是众所周知的。
字符串抽出器105得到接收符号s(k)的字符串,在这里即为
式2
           C(K)∈(0,…,C-1)
即,字符串抽出器105生成以前面供给的符号为基础的符号s(k)用的的独特的字符串(即状态)。例如,若以图象压缩系统为例,符号s(k)表示应被编码的当前象素的颜色,字符串C(K)是由如上所述的前面的象素颜色决定的。例如,与同一线上的当前象素相邻的前一个象素(P)的颜色和当前象素的前一条线上前面象素(A)的颜色被用来作成适用于2值的符号s(k)的字符串。这样一来,若象素P和象素A都是白色则c(k)为0,若象素P是白色、象素A是黑色则c(k)为1,若象素P是黑色、象素A是白色则c(k)为2,若象素P和象素A都是黑色则c(k)为3。在美国专利(USP4,636,490)中,示出使用2进制的另一种字符串抽出器(状态作成器)。该技术圈内的人大概都知道,这样的2进制字符串抽出器是为了得到适用于多值的字符串而扩充出来的。将已抽出并表示出来的字符串c(k)供给自适应概率推测器106。
为了作成输入信号
式3
           S(k)∈(0,…,S-1)
和相关字符串
式4
           C(k)∈(0,…,C-1)
用的概率推测值
式5
而使用自适应概率推测器106。因此,自适应概率推测器106将具有S次元和C次元的矩阵(ns,c)保持到最后。在此,矩阵ns,c的各元素是字符串c中产生符号s的累积,即“计数”,s和c是识别矩阵中的ns,c的位置的虚拟下标。通过计算机或数字信号处理器的适当编程可以容易地实现自适应概率推测器106。但是,在实用上比较优秀的方式是做成大规模集成电路(VLSL)的半导体芯片。
图2的流程图示出自适应概率推测器106中的各部分的动作,通过使向应编码符号的推测概率的自适应速度最佳化来作成高精度的概率推测值。自适应概率推测器106的动作从开始步骤201开始。在下一个动作方框202中,对应使k=0和
式6
        ns,c=Ns,c
的所有的
式7
        S∈(0,…,S-1)
式8
        C∈(0,…,C-1)
进行ns,c的计数的初始化。这里ns,c是某一给定值。操作方框203得到新的字符串c(k)。显然,新字符串和前面得到的字符串是一样的。在下一个动作方框204中,得到相对于所有的
式9
        S∈(0,…,S-1)
得到的字符串c(k)的计数和2。即,
式10 z = Σ s = 0 s = s - 1 ns , c ( k )
动作方框205由自适应概率推测器106(图1)输出向算术编码器单元104(图1)顺序供给的概率推测值。因该概率推测值是最初执行的值,故只以从初始条件得到的字符串c(k)为基础。在下一次执行中,概率推测是以字符串c(k)产生符号s(k)的计数和即累计为基础的。这样一来,在步骤205输出概率推测值。即,
式11 P ^ 0 ( K ) = N 0 C ( K ) / Z
式12 P ^ S - 1 ( K ) = N - S - 1 , C ( K ) / Z
在动作方框206中得到编码后的符号s(k)。在动作方框27中,使得到的符号s(k)和字符串c(k)的计数增加1。即,
式13
        NS(K),C(K)
在动作方框208中,得到参数已规定好的集合的至少第1特性和至少第2特性。在该例中,参数已规定好的集合的各元素是与被编码的接收符号的字符串对应的累积,即计数的函数。即,参数规定的集合是将对字符串c(k)产生符号s(k)进行累积后的出现次数,即是,n0,c(k),…,ns-1,c(k)。在该例中,至少第1特性是对字符串累积了的出现次数的最小值。即,
式14
        MIN=MINIMUN{N0,C(K),…,Ns-1,C(K)}
在该例中,至少第2特性是对字符串累积了的出现次数的最大值。即,
式15
        MAX=MAXIMUN{N,C(K),…,Ns-1,C(K)}
条件分支点209为了判断至少第1特性是否大于或等于至少第1阈值、即
式16
        MIN≥T1
或判断至少第2特性是否大于或等于至少第2阈值、即
式17
        MAX≥T2
而进行测试。
至少第1特性(MIN)的使用,重要的是使自适应概率推测器106(图1)的自适应程度最佳化成为可能。在该例中通过使用上述MIN即至少第1特性和8即小阈值T1解决了这一问题。这样一来,已往为了满足条件
          MIN≥T1
对字符串c(k)的各可能的信号发生、即(0,…,S-1)必须至少产生8次。其结果,使用至少第1特性MIN和第一阈值T1=8作成理想地适合推测的实际概率值的自适应速度。因没有解释限制该例的范围,所以,若以2进制应用的1/2推测概率为例,则累积的发生在大约使字符串c(k)参照
式19
        δ+δ=16
次之后进行调整。对于1/4的推测概率,则在大约使字符串c(k)参照
式20
        δ+24δ=32
次之后再调整累积的发生。这样一来,自适应速度相对比推测值大(不小)的概率值较快,相对比推测值小的概率值则必然慢。自适应速度的调整在步骤209和210中示出。
该例中的MAX即至少第2特性与至少第2阈值T2有关,用于防止在字符串c(k)的符号s(k)发生的累积中产生溢出。只要推测概率不是异常小的值,MAX就不是需要进行参数调整的特性。作为一个例子,T2的值是2048。这就意味着使用了参数集合的另外的特性。例如,取代MAX而使用在步骤204中得到的和Z。
这样一来,只要满足条件式
式22
       MIN≥T1
式23
       MAX≥T2
的任一个就返回步骤209,在动作方框210中进行在字符串c(k)中已累积了的符号元素的调整。自适应速度的调整通过与作为调整原因的步骤209有关的步骤210来实现,例如,相对所有的
式24
       S∈=(0,…,S-1)
通过由进行了字符串c(k)累积的发生的下式集合了的所谓减半来决定已表示的累计、即计数,
式25
       NS,C(K)=(NS,C(K)+1)/2
以往,当满足式MINT1和式MAXT2中的任何一个条件时,计数是用相同的方法调整的,但对某种适用情况,分别对上述条件去调整计数也许更方便。一旦计数被调整,就有必要注意这是已累积的发生的表示。该累积了的发生的调整从属于将概率推测保持在字符串c(k)中的更新的发生中。如上所述,通过对按MINT1产生的已累积的发生进行调整,自适应程度与推测的实际概率很吻合。即,对根据MAXT2产生的、在字符串c(k)中已累积了符号s(k)的发生所进行的调整,在推测出非常小的概率值的稀有情况下,保护了可能的算术溢出条件。
此后,在条件分支点211,为了判断符号s(k)是不是编码/译码的最后的符号而进行测试。通常应编码的符号的个数是已知的。假如不知道,则将符号个数的表示供给自适应概率推测器106。若步骤211的测试结果是YES,则自适应概率推测器106各部分的动作经END步骤212而告结束。若步骤211的测试结果是NO,则控制返回步骤203,反复进行从步骤203到211的有关动作直到步骤211的结果变成YES为止。
再回到步骤209,若测试结果是NO,则控制跳到步骤211,以便判断符号s(k)是不是应编码/译码的最后的符号。若步骤211的测试结果是YES,则自适应概率推测器106各部分的动作经END步骤212而告结束。若步骤211的测试结果是NO,作成在步骤213中加1的增量指数K,则控制返回步骤203,反复进行从步骤203到211的有关动作直到步骤211的结果变成YES为止。
以往,译码器103包含线路接口108、算术译码器单元109、字符串抽出器110和自适应概率推测器111。线路接口108执行与线路接口107相反的功能,为了得到数据流s(i),使用已知的方法对输入信号进行反格式转换。算术译码器单元109执行与算术译码器单元104相反的功能。因此,将接收的数据流a(i)和来自适应概率推测器111的概率推测供给算术译码器单元109,在此,使用已知的方法来得到符号s(k)。在本技术领域内这样的算术译码器单元是众所周知的。这在前面引用过的题为‘具有算术编码的黑白图象的压缩’(Compressing of Black-White Image with ArithmeticCoing)的文献、适用于2值的美国专利(USP4,633,490)、和适用多值的题为‘用于数据压缩的算术编码’(Arithmatic coding for dataCompression)的文献中都有叙述。字符串抽出器110的结构和动作都和105相同,故省略其说明。同样,因111和106一样,故省略其说明。
在以往的无记忆信息源数据的概率推测方法中,为了回避计数值变成最大值的计数的行溢出,无条件地将计数值减少一半,所以,推测概率误差大,存在编码效率低的问题。
本发明就是为了解决上述问题而提出的,其目的在于减小编码方法的推测概率误差、提高编码效率。
在本发明第1方面的自适应编码方法中,包括:
输入编码对象的数据、对该输入的数据求出劣势符号的出现概率的第1步骤(502);
对输入数据的符号判断它是优势符号还是劣势符号的第2步骤(504);
根据第2步(504)的判断结果求出与输入数据对应的数线上的区域的第3步骤(505),(509);
对输入数据算出优势符号或劣势符号的出现频度的第4步骤(508),(510);
将在第4步作为出现频度算出的出现频度的出现次数累积值与规定值进行比较、当出现次数累积值达到规定值时、将出现频度减半的第5步骤(511);和
对数据信号使优势符号和劣势符号与数线上的规定的区域对应并将该数线上的坐标作为代码输出的第6步骤(513)。
在本发明第2方面的自适应编码方法中,在第4步算出出现次数累积值,作为劣势符号的出现频度(N LPS)和劣势符号与优势符号出现频度的和值(N TOTAL),在第1步计算出现次数累积值(N LPS,NTOTAL)并求出符号的出现概率。
在本发明第3方面的自适应编码方法中,在第4步算出出现次数累积值,作为劣势符号的出现频度(N LPS)和优势符号的出现频度(N MPS),在第1步计算出现次数累积值(N LPS,N MPS)并求出符号的出现概率。
在本发明第4方面的自适应编码方法中,将第4步骤设在第1步骤和第2步骤之间。
在本发明第5方面的自适应编码方法中,在第4步的优势符号出现频度算出时,当优势符号的N MPS值不满T2时,进行优势符号出现频度的算出。
在本发明第6方面的自适应编码方法中,在第5步的优势符号或劣势符号的出现频度减半时,当优势符号的N MPS值大于T2且N·LPS大于1时,进行优势符号或劣势符号出现频度的减半。
在本发明第7方面的自适应编码方法中,在第4步的优势符号出现频度算出时,当优势符号的N MPS值不满T3、或优势符号的N MPS值不满T2且劣势符号的N LPS值不满T4时,进行优势符号出现频度的算出。
在本发明第8方面的自适应编码方法中,在第5步的优势符号或劣势符号的出现频度减半时,当优势符号的N MPS值大于T3小于T2且劣势符号的N LPS大于T4时,或者优势符号N MPS大于T2且劣势符号N LPS大于1时,进行优势符号或劣势符号出现频度的减半处理。
图1是示出先有的编码—译码装置的结构的图。
图2是示出先有的自适应概率推测器的处理的图。
图3是示出实施形态1的编码效率的图。
图4是示出实施形态1的编码处理的图。
图5是示出实施形态1的重正化处理的图。
图6是示出实施形态1的校正MPS处理的图。
图7是示出实施形态1校正LPS处理的图。
图8是示出实施形态1的计数检验处理的图。
图9是示出实施形态2的编码处理的图。
图10是示出实施形态2的校正MPS处理的图。
图11是示出实施形态2校正LPS处理的图。
图12是示出实施形态2的计数检验处理的图。
图13是示出实施形态2的编码效率的图。
图14是示出实施形态3的编码处理的图。
图15是示出实施形态3的编码效率的图。
图16是示出实施形态4的校正MPS处理的图。
图17是示出实施形态4的计数检验处理的图。
图18是说明实施形态4的推测概率的图。
图19是说明实施形态4的推测概率的图。
图20是示出实施形态4的编码效率的图。
图21是示出实施形态5的编码效率的图。
图22是表示编码状态迁移的图。
图23是表示编码状态迁移的图。
图24是表示编码状态迁移的图。
图25是示出实施形态6的状态迁移的图。
图26是示出实施形态6的校正MPS处理的图。
图27是示出实施形态6的计数检验处理的图。
图28是示出实施形态6的编码效率的图。
图29是示出实施形态7的编码处理的图。
图30是示出实施形态7的编码效率的图。
图31是示出实施形态8的校正MPS处理的图。
图32是示出实施形态8的计数检验处理的图。
图33是示出实施形态8的编码效率的图。
图34是示出实施形态9的编码效率的图。
图35是示出实施形态10的校正MPS处理的图。
图36是示出实施形态10的计数检验处理的图。
图37是示出实施形态10的编码效率的图。
图38是示出实施例的图象处理装置的图。
图39是示出实施例的图象处理装置的应用例的图。
实施形态1
作为本实施形态编码的一个例子,作为对2值数据的熵编码器、示出使用算术编码时的编码处理顺序。再有,将优势符号区域配置在下方,将代码作为有效区域的下部边界值坐标进行编码。这时,运算精度截止到2进制的16位,将整数部作为代码输出。
此外,在本实施形态1中,就图1的先有技术中的自适应概率推测器106和算术编码单元104的处理进行说明。在本实施形态中还使用了图1编码器的其它的结构,因这是大家所熟知的,故说明从略。在此,需要事先讲明的是,在其它本实施形态中也使用了图1编码器的其它的结构,这也是大家所熟知的。
此外,本说明所用的变量如下。
C是代码值,A是区域幅值,AL是LPS区域幅值,MPS是优势符号值,LPS是劣势符号值(1-MPS),S是数据值,N0是数据0的出现频度(计数),N1是数据1的出现频度(计数),N LPS是min(N0,N1)(相当MIN),N MPS是max(N0,N1)(相当MAX),P是劣势符号的出现概率,LEN是代码长度(2进制位数)。
此外,在编码处理顺序说明中,变量N MPS与先有例的变量MAX、NLPS与先有例的变量MIN对应。当优势符号值MPS为0时,变量N MPS与N0对应,当优势符号值MPS为1时,变量N MPS与N1对应。当优势符号值MPS为0时,变量N LPS与N1对应,当优势符号值MPS为1时,变量N LPS与N0对应。
进而还有,处理顺序中的常数如下。
T1是N LPS的计数最大值、(第1阈值)
T2是N MPS的计数最大值、(第2阈值)
本实施形态中的编码处理顺序根据下面的图4、图5、图6、图7和图8进行。
图4是根据图1的自适应概率推测器106和算术编码器单元104的处理示出2值数据的算术编码的处理顺序的流程图。在该流程图中,S500进行优势符号值MPS、劣势符号值LPS、数据0,1的出现频度N0、N1的计算。S501进行代码值C、区域幅值A和代码长度LEN的初始化。S502得到数据值S并算出劣势符号的出现概率P、作为N LPS/(N0+N1)。S503将劣势符号的出现概率P与整个区域幅值A相乘并算出与劣势符号对应的区域幅值AL。S504判断数据值S是否优势符号。若S504判定是YES,S505则将区域幅值A更新为与优势符号对应的区域幅值(A-AL),但因优势符号是下方配置故代码值C不予更新。若更新的区域幅值A小于0.5,S506则通过S507的重正化调用进行对区域幅值A和代码值C的2次幂倍乘的归一化处理,直到A达到0.5以上。
S508通过调用MPS校正对优势符号值的出现频度进行计数。此外,若S504的判断是N0,则在S508将与下方优势符号对应的区域幅值(A-AL)和区域下部边界值的符号值C相加,而且将区域幅值A更新为与劣势符号对应的区域幅值AL,这时,因区域幅值A必定比0.5小,故通过重正化调用进行对区域幅值A和代码值C的2次幂倍乘的归一化处理,直到A达到0.5以上。S510通过调用LPS校正对劣势符号值的出现频度进行计数。若在S511通过调用计数检验如果在S508、S510已更新的出现频度的计数值在规定数以上,则数据0的出现频度(计数值)N0和数据1的出现频度(计数值)N1同时减半。
再有,在这里,作为一个例子,当通过LPS校正处理(或MLS校正处理)中的计数得到计数最大值的的常数T1(或T2)的值是2的m次幂时,为了实现m位的2进制计数,一般,在m位的计数中若用2的m次幂表示则产生位溢出而变为0,但出现频度不可能是0,所以,在概率推测计算(S502)时如作为2的m次幂进行处理是不会发生不合适的。或者,也可以这样进行处理,使计数值始终比实际频度小1这样来计数(初始值为0),在概率推测计算(S502)时对各计数值分别加1。无论哪种情况,在减半处理中,对已经位溢出的计数都必须将计数值作为T1/2(或T2/2)进行更新。只是,当在计数时可以不考虑位溢出时,才可以不受此限制而象以往那样进行减半处理。
S512判断处理的数据S是否最后的数据,若不是,则从S502返回S511的处理。S513在编码的后处理中将代码值C的小数点(精度FLUSHBIT=16)后的16位乘以2的16次方后再输出整数部,对代码长度LEN将其加16作为总代码长度。总之,在数字信号(数据信号)编码时,对出现概率高的优势符号和出现概率低的劣势符号,根据前面符号在数线上的范围(Al-t)和劣势符号在数线上的指定范围(AL),使其与数线上的指定范围对应,将该数线上的坐标作为代码输出。再有,该编码的一般内容在特开平8-34434中有详细记载。
图5是算术编码变量的归化处理的重正化(RENOMALIZE)的处理程序,同时根据其操作次数对算术编码长度(LEN)进行计数。S520将区域幅值A和代码值C乘以2并使编码长度LEN加1。在S521中,若区域幅值A小于0.5则反复执行S520的处理直到该值大于0.5。在此,每当区域幅值A和代码值C乘2时,代码从小数部向整数部输出1位。
图6是对优势符号的出现频度进行计数的MPS校正(UPDATEMPS)的处理程序。S540使优势符号值MPS的出现频度的计数N MPS加1。
图7是对劣势符号的出现频度进行计数的LPS校正(UPDATELPS)的处理程序。S560使劣势符号值LPS出现频度的计数N LPS加1。在S561中,若已更新的劣势符号的出现频度N LPS比优势符号的出现频度NMPS大,则通过S562将优势符号值MPS和劣势符号值LPS掉换过来,即互相交换。
图8是当已更新的出现频度的计数在规定值之上时使之减半的计数检验(COUNTCHECK)的处理程序。在S580中,判断劣势符号的出现频度NLPS是否在设定值T1之上,在S581中,判断优符号的出现频度N MPS是否在设定值T2之上,通过S582,例如,使劣势符号和优势符号的出现频度N LPS、N MPS分别加1后再进行乘1/2的减半处理。这里,在加1之后再乘1/2是为了不使出现频度变成0。
再有,上面说明过的处理程序是在假定1个字符串(single context)情况下进行说明的,当处理多个字符串(multi context)时,在S502中与数据值S同时得到字符串CX,将下面的变量与作为指示该变量的表格对应起来即可。
例如,将MPS(CX)作为优势符号值,将LPS(CX)作为劣势符号值(1-MPS(CX)),将N0(CX)作为数据0的出现频度(计数),将N1(CX)作为数据1的出现频度(计数),将N LPS(CX)作为min(N0(CX),N1(CX))(相当第1特性MIN),将N MPS(CX)作为max(N0(CX),N1(CX))(相当第2特性MAX)。
而且,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件设定为T1=2,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。其结果示于图3。
在上面的说明中,对优势符号的值MPS设定变量(对多个字符串是表格)再算出编码效率(图3),但是,因为即使出现频度是相同的数还是进行乘法运算型编码,所以,通过分配固定的数据值作为优势符号,只产生因丢失位误差引起的代码长度的损失。这里,虽然在图7的S562中掉换了优势符号值,但在出现频度为相同数的时刻不将优势符号值作为固定数据值,将它们看成是有区别的。再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适合使用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同数对的各计数和预测值,可以容易地使之对应起来。
进而,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高概率推测精度和编码效率都不会产生任何有效的影响。再有,在实施形态1中,常数T1、T2可以使用指定的值。
实施形态2
对于图9,说明其对图4处理程序的变更。S590相对S500来说,是将出现频度计数作为劣势符号的出现频度N LPS和劣势符号及优势符号出现频度的和N TOTAL,N LPS和N TOTAL的初始值是1,2。S591是根据在S501的出现频度求劣势符号的概率P,将算式的分母作为从N MPS及N LPS的和求得的N TOTAL。
对于图10,说明其对图6处理程序的变更。S600相对图6的S540来说,是将优势符号出现频度N MPS的计数作为劣势符号及优势符号出现频度的和N TOTAL的计数。
对于图11,说明其对图7处理程序的变更。S610相对图7的S560来说,增加了劣势符号及优势符号出现频度的和N TOTAL的计数处理。此外,S611判断劣势符号出现频度N LPS的2倍是否比劣势符号及优势符号出现频度的和N TOTAL大,即N LPS是否超过N TOTAL的一半,若超过了,则在S562中将优势符号值MPS和劣势符号值LPS对换。
对于图12,说明其对图8处理程序的变更。S620、S621相对图8的S581、S582来说,变成根据优势符号出现频度的计数N MPS进行劣势符号及优势符号出现频度的和N TOTAL的判定(S620)和计数(S621)处理。
本实施形态2和实施形态1一样,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件设定为T1=2,T2=8,使数据的出现频度P0变化,分别将数据长度作为100000,用单个字符串进行编码。其结果示于图13。
实施例
到此为止,在上述实施形态1和实施形态2中,已就在熵编码器中使用算术编码、为了算出该代码长度而增加了必要的最小限处理的情况进行了说明。在同一图中,算术编码部的处理是S501、S503、S505~S507及S509的处理。所谓能够将概率推测部和算术编码部分离就意味着可以将作为一个例子已说明过的算术编码部替换为其它的熵编码。此外,对下面所有的实施形态也可以进行同样的解释。此外,作为整个处理的流程,就使用算术编码和为了评估性能而算出代码长度的情况进行说明,但是,由于只利用对译码也可以共同参照的信息,所以在编码时可以完全再现已经进行了概率推测的值。
实施形态3
在本实施形态3中,和实施形态1、2一样示出对2值数据使用算术编码时的编码处理程序。编码处理程序中的变量和常数与实施形态1、2中的变量和常数是一样的。
图14示出本实施形态3的编码处理程序。
再有,在本实施形态3的图14的编码处理中,与实施形态1、2的特征不同之处在于,将S511移到S503和S504之间,其余的处理内容没有改变。
计数检验511将劣势符号出现频度N LPS的值与规定值T1进行比较,当N LPS大于T1时使数据1的出现频度N1的值减半。此外,计数检验511将优势符号出现频度N MPS的值与规定值T2进行比较,当N MPS大于T2时使数据的出现频度N2的值减半。
这时,实施形态1、2是在劣势符号的出现频度和优势符号出现频度达到T1和T2之后、即在概率推测之前进行减半处理的,与此相比较,对于在概率推测之后进行减半处理的本实施形态3,因计数值的组合(状态)总数较多,故可以谋求提高编码效率。
例如,在先有的形态中,因为将计数值更新为其一半,所以,例如优势符号和劣势符号的合计以及劣势符号的各计数值为(8,1)、(8,2)中任何一个时,在更新为(4,1)之后其推测的概率都变成1/4。
在本实施形态中,若将概率推测后的各计数值更新为其一半,在上述例子中,便将推测概率区分为1/8、2/8,因能够将概率值分得较细故提高了编码效率。
在此,将表示编码效率提高的结果示于图15。在图15中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态1一样设定为T1=2,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
进而,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对提高概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态3中,常数T1、T2可以使用指定的值。
实施形态4
在本实施形态4中,和实施形态1、2一样示出对2值数据使用算术编码时的编码处理程序。处理程序中的变量和常数与实施形态1、2中的变量和常数是一样的。
图16示出本实施形态4的处理程序。
在本实施形态4的图16中,与实施形态1的MPS校正的详细流程图(图6)不同之处在于,在S541中只有当优势符号的N MPS小于计数最大值即常数T2时才进行计数。
在本实施形态4的图17中,与实施形态1的计数检验的详细流程图(图8)不同之处在于,将S581替换成S583,当优势符号的频度N MPS大于常数值T2、且作为追加条件当N LPS大于1时,进行S582的减半处理。
在此,因为在S582中只有当优势符号的出现频度N MPS是计数最大值即常数值T2、且当劣势符号的出现频度N LPS是1时,才待机执行S582的减半处理。所以,在S541中优势符号的出现频度有时会变成T2,这时不进行计数。
这时,与象实施形态1那样在劣势符号或优势符号的出现频度达到最大值之后无条件地进行减半处理的情况(图18)相比,在(N MPS=T2,NLPS=1)的情况下对优势符号的出现不进行计数处理、且待机进行减半处理(图19),这样可以减小相对不考虑计数最大值可以无限计数的理想情况而言的推测概率的误差。
例如,过去,在更新计数值后特别是当劣势符号的计数值为1时,概率推测误差变大,编码效率降低。
因此,在本实施形态中,当劣势符号的计数值是1时不执行减半更新也不改变计数,所以,概率推测误差较小,可以提高编码效率。
在这里,将表示提高实施形态4的编码效率的结果示于图20。在图20中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态1一样设定为T1=2,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
通过停止出现频度的计数,使劣势符号的概率在优势符号和劣势符号合计的最大值的倒数(1/T2)附近,因此提高了编码效率,虽然因概率不到该值推测误差会变大故编码效率降低,但与不停止出现频度的计数的情况相比,编码效率还是提高了。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对提高概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态4中,常数T1、T2可以使用指定的值。
实施形态5
在本实施形态5中,和实施形态1、2一样示出对2值数据使用算术编码时的编码处理程序。编码处理程序中的变量和常数与实施形态1、2中的变量和常数是一样的。
本实施形态5中的编码处理程序是将实施形态4中的图16、图17用于实施形态1的图4而构成的。
在该结构中,因只有当优势符号的出现频度是计数最大值即常数T2、且劣势符号的出现频度是1时才待机执行减半处理,故这时的概率值1/T2相对实施形态1是增加了。
在此,将表示提高编码效率的结果示于图21。在图21中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态1一样设定为T1=2,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态5中,常数T1、T2可以使用指定的值。
实施例
下面,就以上说明的实施形态1~5的作用效果进行说明。
在实施形态3(图15)、实施形态4(图20)和实施形态5(图21)中,示出了T1=2、T2=8时的编码效率。这时的状态迁移可由图22来说明。图中,虚线包围的状态是实施形态3中当在出现符号的计数之后进行减半处理时概率推测所用的状态。实线包围的状态是实施形态3及实施形态4中当在计数之前进行减半处理时概率推测所用的状态。在实施形态5中,在实施形态1的状态上再加上(N0=8,N1=1)及(N0=1,N1=8)。无论哪种都表示出除只在初始迁移过程中存在的状态之外的可能迁移的状态,例如,(N0=0,N1=1)只有在初始状态中才能得到。(N0=8,N1=2)及(N0=2,N1=8)在实施形态4和实施形态5中,只有当在(N0=8,N1=1)及(N0=1,N1=8)下不进行优势符号出现的计数时,才被使用。状态数在计数后进行减半处理(虚线包围部分)时变成13(实施形态1)或15(实施形态5),在计数前进行减半处理(实线包围的部分)时变成25(实施形态3)或27(实施形态4),计数前进行减半处理可以得到更多的状态数。
此外,例如当常数T1不一样时,按照实施形态1、实施形态3、实施形态4、实施形态5的顺序,当T1=8,T2=8(图23)时是40、47、47、42,当T1=4、T2=8(图24)时成为28、38、38、30。
进而,当区别优势符号时,围起来的方框中的N0、N1只增加相同的状态数。这表示从图中可以区别,引起出现频度向相同数的状态迁移究竟是因数据值0出现的迁移(纵方向)还是数据值1出现的迁移(横方向)。在由它们示出的例子中,因为作为熵编码器使用了利用乘法运算的算术编码,故可以将有效区域的大小等分。但是,由于在为了减轻运算负担而采用加法运算型算术编码时,将有效区域的大小分成固定值和其余部分进行分配,所以,这时通过对出现概率高的优势符号分配较大的区域来提高编码效率。
若用3位2进制计数器对出现频度进行计数,当设定8作为计数最大值T2时会产生位溢出,但若因出现频度不可能为0而作为8的代用进行解释,则不用扩展计数器的位数,仍旧使用3位计数器就可以实现。此外,通过在存储器上对各字符串设定出现频度,对读出的值进行了计数处理、减半处理的运算之后再次写入,在实际装配上可以减少运算器的数目。
实施形态6
在实施形态4及实施形态5中已示出,即使当优势符号的出现频度变为T2,若劣势符号的出现频度是1则不进行减半处理,由此,可以提高编码效率。在本实施形态6中,作为一个例子,考虑在实施形态4基础上进而引入2个常数、增加优势符号在T3之上和劣势符号的出现频度在T4以下两种状态的情况。图25是T1=4、T2=1、T3=8、T4=2时的状态迁移图。优势符号的出现频度N MPS在T3以下的状态与已经说明过的实施形态4是一样的,下面,算出(N TOTAL=T2,N LPS=1)时待机进行减半处理情况下的性能。
再有,T3是N TOTAL(或N MPS)的中间值。T4是N LPS的中间值。此外,设T3是第3阈值,T4是第4阈值。
图26、27示出本实施形态6的编码处理程序。
在本实施形态6的图26中,与实施形态4的图16不同之处在于,当S542中优势符号的出现频度N MPS不到常数值T3、或S543中优势符号的出现频度N MPS不到计数最大值即常数值T2且劣势符号的出现频度N LPS不到常数值T4时,在S540中对优势符号的出现频度N MPS进行计数。
在本实施形态6的图27中,与实施形态4的图17不同之处在于,将S583替换成S584和S585,当在S584中优势符号的出现频度N MPS在常数值T3之上又不到常数值T2且劣势符号的出现频度N LPS在常数值T4以上、或在S585中优势符号的出现频度N MPS在计数最大值即常数值T2之上且劣势符号的出现频度N LPS大于1时,在S582中进行减半处理。
表示该实施形态的编码效率提高的结果示于图28。在图28中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件对实施形态1进行了扩展,设定为T1=8(T1没有实质上的意义),T2=10,T3=8,T4=2,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对从本质上提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态6中,常数T1、T2、T3、T4可以使用指定的值。
实施形态7
在到此为止已说明过的实施形态中,有关常数T2或常数T3的变量是作为优势符号的出现频度N MPS来说明的。在下面的实施形态中,将优势符号和劣势符号出现频度的和作为其变量。
在本实施形态7中,就其相对实施形态3的变更进行说明,这一变更是将优势符号出现频度的计数作为优势符号和劣势符号的出现频度之和的计数的编码处理程序的变更。
图29示出本实施形态7的编码处理程序。
图29的编码处理程序与实施形态3的关系一样,将调用计数检验S511移到S503和S504之间。其余处理程序不变。
表示该实施形态的编码效率提高的结果示于图30。在图30中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态4一样,设定为T1=4,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高本发明(实施形态)中的概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态7中,常数T1、T2可以使用指定的值。
实施形态8
在本实施形态8中,就其相对实施形态4的变更进行说明,这一变更是将优势符号出现频度的计数作为优势符号和劣势符号的出现频度之和的计数时的编码处理程序的变更。
图31、32示出本实施形态8的处理程序。
图31的编码处理程序与实施形态1和实施形态3的关系一样,追加S630的判断程序,若优势符号和劣势符号出现频度的和N TOTAL达到T2,则不进行出现频度的计数。
图32的编码处理程序与实施形态1和实施形态3的关系一样,改变了S640的判断,若优势符号和劣势符号出现频度的和N TOTAL在T2之上、且劣势符号的出现频度N LPS大于1,则进行出现频度的减半处理。
表示该实施形态的编码效率提高的结果示于图33。在图33中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,上述模拟的常数条件与实施形态2一样,设定为T1=4,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高本发明(实施形态)中的概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态8中,常数T1、T2可以使用指定的值。
实施形态9
在本实施形态9中,就其相对实施形态5的变更进行说明,这一变更是将优势符号出现频度的计数作为优势符号和劣势符号的出现频度之和的计数时的编码处理程序的变更。
本实施形态9的编码处理程序是根据实施形态1的图5、实施形态2的图9、图11、实施形态8的图31、图32、使实施形态8中的图29回到实施形态2的图9的结构。
表示该实施形态的编码效率提高的结果示于图34。在图34中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态4一样,设定为T1=4,T2=8,使数据的出现概率P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高本发明(实施形态)中的概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态9中,常数T1、T2可以使用指定的值。
实施形态10
在本实施形态10中,就其相对实施形态6的变更进行说明,这一变更是将优势符号出现频度的计数作为优势符号和劣势符号的出现频度之和的计数时的编码处理程序的变更。
图35、36示出本实施形态10的处理程序。
在本实施形态10的图35中,与实施形态6的不同之处在于,当S650中优势符号和劣势符号的出现频度之和N TOTAL不到常数值T3时、或S651中优势符号和劣势符号的出现频度之和N TOTAL不到计数最大值即常数值T2且劣势符号的出现频度N LPS不到常数值T4时,在S652中对优势符号和劣势符号的出现频度之和N TOTAL进行计数。
在本实施形态10的图36中,与实施形态6的不同之处在于,当在S600中优势符号和劣势符号的出现频度之和N TOTAL在常数值T3之上又不到常数值T2且劣势符号的出现频度N LPS在常数值T4以上、或在S661中优势符号和劣势符号的出现频度之和N TOTAL在计数最大值即常数值T2之上且劣势符号的出现频度N LPS大于1时,在S662中进行减半处理。
表示该编码效率提高的结果示于图37。在图37中,假定数据的出现概率p0是固定的,从设定的出现概率得到的熵H(p0),通过模拟得到代码长度LEN,从H(p0)和LEN算出编码效率E=H(p0)/LEN。此外,模拟的常数条件与实施形态8一样,设定为T1=4(T1没有实质上的意义),T2=10,T3=8,T4=2,使数据的出现频度P0变化,分别将数据长度作为100000,用单个字符串进行编码。
再有,对算术编码部,将整数部也作为有限精度对待,在将代码以N位、例如8位(1字节)为单位向外部输出时,可以忽略顺次溢出的已输出的位,即使是这样的结构,不管为此所必须进行的进位传送处理的控制方法如何,对提高概率推测精度和编码效率都不会产生任何有效的影响。
此外,该算术编码部将优势符号配置在劣势符号的下位,但也可以是上位配置。对给定的2值数据,在算术编码部中适用2值算术编码,但当给出多值数据时也适用于将其更换为多值算术编码。各计数和预测值对单个字符串使用的是1对,但对多个字符串,通过使用与字符串总数相同对数的各计数和预测值,可以容易地使之对应起来。
此外,不管如何去执行从最终符号值到最小有效位数的修正处理和末尾连续代码位0的省略处理,对从本质上提高本发明(实施形态)中的概率推测精度和编码效率都不会产生任何有效的影响。
再有,在实施形态8中,常数T1、T2、T3、T4可以使用指定的值。
实施例
在以上的实施形态7到实施形态10中,在对优势符号和劣势符号的出现频度之和N TOTAL进行计数的情况下,当在(N TOTAL=T2,NLPS=1)时,不进行优势符号的计数处理而进行劣势符号出现的计数并执行减半处理时,有时,会出现(N TOTAL=T2+1,N LPS=1)的情况,作为一个例子,在计数器和存储器不能确保足够的精度和容量的情况下,也可以只对劣势符号进行计数并使(N TOTAL=T2,N LPS=2)。
再有,如果优势符号的出现频度、或优势符号和劣势符号的出现频度之和为T2、且劣势符号的出现频度为1,则待机进行减半处理,并且不进行优势符号的计数,这时,因劣势符号的出现频度必须大于2才能进行减半处理,故即使例如直接将各计数值对半分也能保证更新的计数值不为0。此外,减半值的算式也可以不完全相同,对于特定值、例如偶数、奇数等、或对于最小值条件下的减半、最大值条件下的减半,也可以使用另外的算式。
总之,本实施例的编码方法具有:抽出供给信号的字符串的步骤;在供给信号源和字符串的信号后用于作成该供给信号的概率推测的自适应概率推测步骤;在供给信号源来的信号并进行概率推测的响应之后用于作成所供给信号的已编码的改订版的熵编码步骤;对已编码了的改订版进行接口处理后作为向传送媒体的输出的步骤,自适应概率推测步骤在根据无记忆信息源数据的出现频度推测概率时,根据当对某字符串的计数值成为最大值时更小频度的计数值是偶数还是奇数,在分别加上预先设定的值之后再进行减半处理。
此外,在具有抽出供给信号的字符串的步骤、在供给信号源和字符串的信号后用于作成该供给信号的概率推测的自适应概率推测步骤、在供给信号源来的信号并进行概率推测的响应之后用于作成所供给信号的已编码的改订版的进行熵编码步骤和对已编码了的改订版进行接口处理后作为向传送媒体的输出的步骤的编码方法中,上述自适应概率推测步骤在根据无记忆信息源数据的出现频度推测概率时,在当对某字符串的计数值成为最大值时较小频度的计数值是1时,不进行计数值的减半处理,停止对该字符串的全频度的计数处理直到较小频度的计数值变成2为止,将分别从该停止状态下的值中求出的概率作为各推测概率值。
在具有抽出供给信号的字符串的步骤、在供给来自信号源和字符串的信号后用于作成该供给信号的概率推测的自适应概率推测步骤、在供给信号源来的信号并进行概率推测的响应之后用于作成所供给信号的已编码的改订版的熵编码步骤和对已编码了的改订版进行接口处理后作为向传送媒体的输出的步骤的编码方法中,上述自适应概率推测步骤在根据无记忆信息源数据的出现频度推测概率时,当对某字符串的计数值成为最大值时,将对该字符串的计数值一律原封不动地不进行减半处理,在根据较小频度的计数值分别加上预先设定的值之后再进行减半处理。
实施例
图38是表示具有上述实施形态1到实施形态10的自适应编码方法的图象处理装置的结构例的斜视图。
在图38中,图象处理装置60包括显示器61、键盘62、鼠标63、鼠标板64、主机65和小型盘装置100。
该实施例的图象处理装置例如如图38所示那样,从小型盘装置100(例如,是以CD-ROM、FD、MO·PD或ZIP等作为媒体的盘装置)输入已编码了的图象信息并进行译码,将译码后的图象信息送到主机65,并在显示器61上进行显示。该实施例的图象处理装置对显示器61显示的图象信息进行编码,再输出到小型盘装置100中。此外,该实施例的图象处理装置在将图象信息编码后通过未图示的线路传送图象信息。但是,该实施例的图象处理装置的结构不必限于图38所示的个人计算机或工作站的结构,也可以是使用了其它部件的任何结构形式。例如,也可以用视盘机装入输入装置代替小型盘装置100,也可以通过从网络输入图象数据去代替图象信息。此外,输入的数据可以是模拟形式的数据、也可以的数字形式的数据。
此外,本实施例的图象处理装置可以如图38所示那样是独立存在的装置,也可以如图39所示那样是打印机66、扫描仪68、传真装置69、显示装置(例如显示器61)和存储装置(例如,小型盘装置100)等外围设备。
即,本实施例的图象处理装置是具有在上述实施形态1~10中已叙述过的自适应编码方法的电子仪器。
此外,本实施例的编码装置可以独立存在的框体,也可以作为其它视频摄影机、测量仪器和计算机等的主板或电路板的一部分、或作为半导体芯片而存在。此外,在图39中虽未示出,也可以通过局域网与图39所示的各装置连接、以互相传送编码信息的形式出现。此外,也可以使用ISDN(综合业务数字网)等宽带网络、以发送和接收编码信息的形式出现。
进而,也可以使用有线-无线通信、公用-专用线路、电-光信号等通信网络、以发送和接收编码信息的形式出现。
如上所述,在本实施形态1-7中,将符号的出现频度和预测值作为变量或数组存储起来是为了,在只通过各数据值的计数从最多的出现频度中判断预测值时,必须事先决定当出现频度是相同的数时将哪个值作为预测值。此外,在出现概率的运算中有效位数小等情况下,在对取值进行粗略近似时,通过使前一个预测值与出现概率大的一方对应去逼近现在数据的出现倾向,因此,与固定预测值的情况相比提高了编码效率。
因为本发明的自适应编码方法是由以上处理步骤构成的,所以,推测概率误差小,可以提高编码效率。

Claims (8)

1、一种自适应编码方法,其特征在于,包括:
输入编码对象的数据、对该输入的数据求出符号的出现概率的第1步骤;
对上述输入数据的符号判断它是优势符号还是劣势符号的第2步骤;
根据上述第2步的判断结果求出与输入数据对应的数线上的区域的第3步骤;
对上述输入数据算出优势符号或劣势符号的出现频度的第4步骤;
将在上述第4步作为出现频度算出的出现次数累积值与规定值(阈值)进行比较、当上述出现次数累积值达到上述规定值(阈值)时、将上述出现频度减半的第5步骤;和
对上述数据信号使上述优势符号和上述劣势符号与数线上的规定的区域对应并将该数线上的坐标作为代码字输出的第6步骤。
2、权利要求1记载的自适应编码方法,其特征在于,在上述第4步算出出现次数累积值作为劣势符号的出现频度(N LPS)和优势符号的出频度(N MPS),并算出出现次数累积值作为劣势符号与优势符号出现频度的和值(N TOTAL),
在上述第1步根据上述出现次数累积值(N LPS,N TOTAL)进行计算并求出符号的出现概率。
3、权利要求1记载的自适应编码方法,其特征在于,在上述第4步算出出现次数累积值,作为劣势符号的出现频度(N LPS)和优势符号的出现频度(N MPS),
在上述第1步根据上述出现次数累积值(N LPS,N MPS)进行计算并求出符号的出现概率。
4、权利要求1记载的自适应编码方法,其特征在于,将上述第4步骤设在上述第1步骤和上述第2步骤之间。
5、权利要求1记载的自适应编码方法,其特征在于,在上述第4步的优势符号出现频度的算出时,当优势符号的N MPS值不满T2时,进行上述优势符号出现频度的算出。
6、权利要求1记载的自适应编码方法,其特征在于,在上述第5步的优势符号或劣势符号的出现频度减半时,
当优势符号的N MPS值大于T2且N LPS大于1时,进行优势符号或劣势符号出现频度的减半。
7、权利要求1记载的自适应编码方法,其特征在于,在上述第4步的优势符号出现频度的算出时,当优势符号的N MPS值不满T3、或优势符号的N MPS值不满T2且劣势符号的N LPS值不满T4时,进行优势符号出现频度的算出。
8、权利要求1记载的自适应编码方法,其特征在于,在上述第5步的优势符号或劣势符号的出现频度减半时,当优势符号的N MPS值大于T3小于T2且劣势符号的N LPS大于T4时,或者当优势符号的N  MPS值大于T2且劣势符号的N LPS大于1时,进行优势符号或劣势符号出现频度的减半处理。
CN98105752A 1997-03-14 1998-03-10 自适应编码方法 Expired - Fee Related CN1096752C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP06070497A JP3367370B2 (ja) 1997-03-14 1997-03-14 適応符号化方法
JP60704/97 1997-03-14

Publications (2)

Publication Number Publication Date
CN1193848A true CN1193848A (zh) 1998-09-23
CN1096752C CN1096752C (zh) 2002-12-18

Family

ID=13149954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98105752A Expired - Fee Related CN1096752C (zh) 1997-03-14 1998-03-10 自适应编码方法

Country Status (6)

Country Link
US (1) US6075471A (zh)
JP (1) JP3367370B2 (zh)
KR (1) KR100263503B1 (zh)
CN (1) CN1096752C (zh)
DK (1) DK176874B1 (zh)
TW (1) TW429690B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6677868B2 (en) * 2001-03-16 2004-01-13 Sharp Laboratories Of America, Inc. Entropy coding with adaptive syntax to replace high probability symbols with lower probabilities symbols
EP1322117A1 (fr) * 2001-12-06 2003-06-25 Koninklijke Philips Electronics N.V. Dispositif de codage/décodage arithmétique
JP3801501B2 (ja) * 2001-12-18 2006-07-26 三菱電機株式会社 符号化装置及び復号装置及び符号化・復号装置及び符号化方法及び復号方法及び符号化・復号方法及びプログラム
DK2326013T3 (da) * 2002-05-02 2013-12-02 Fraunhofer Ges Forschung Fremgangsmåde og arrangement til aritmetisk indkodning og dekodning med anvendelse af flere tabeller
JP3853710B2 (ja) * 2002-07-15 2006-12-06 Necアクセステクニカ株式会社 ディジタル画像符号化装置およびディジタル画像符号化方法
JP4240283B2 (ja) 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
US6900748B2 (en) * 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7659839B2 (en) * 2007-08-15 2010-02-09 Ternarylogic Llc Methods and systems for modifying the statistical distribution of symbols in a coded message
US7379608B2 (en) * 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
US7599435B2 (en) 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
US7586924B2 (en) 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
US7463781B2 (en) * 2004-04-14 2008-12-09 Lsi Corporation Low overhead context intializations for arithmetic video codecs
US7283073B2 (en) * 2005-12-19 2007-10-16 Primax Electronics Ltd. System for speeding up the arithmetic coding processing and method thereof
WO2008075663A1 (ja) * 2006-12-21 2008-06-26 Ajinomoto Co., Inc. 大腸癌の評価方法、ならびに大腸癌評価装置、大腸癌評価方法、大腸癌評価システム、大腸癌評価プログラムおよび記録媒体
US20100295713A1 (en) * 2007-04-18 2010-11-25 Mitsubishi Electric Corporation Coding apparatus, decoding apparatus, code transforming apparatus, and program
EP2491554B1 (en) 2009-10-20 2014-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
JP5773502B2 (ja) 2010-01-12 2015-09-02 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム
JP5041060B2 (ja) * 2010-12-27 2012-10-03 ソニー株式会社 符号化装置及び符号化方法
JP5041062B2 (ja) * 2010-12-27 2012-10-03 ソニー株式会社 復号装置及び復号方法
JP5041061B2 (ja) * 2010-12-27 2012-10-03 ソニー株式会社 復号装置及び復号方法
JP5062320B2 (ja) * 2010-12-27 2012-10-31 ソニー株式会社 符号化装置及び符号化方法
JP5057497B2 (ja) * 2012-06-22 2012-10-24 ソニー株式会社 復号装置及び復号方法
JP5057494B2 (ja) * 2012-06-22 2012-10-24 ソニー株式会社 符号化装置及び符号化方法
JP5057495B2 (ja) * 2012-06-22 2012-10-24 ソニー株式会社 復号装置及び復号方法
JP5057498B2 (ja) * 2012-06-22 2012-10-24 ソニー株式会社 復号装置及び復号方法
JP5057496B2 (ja) * 2012-06-22 2012-10-24 ソニー株式会社 符号化装置及び符号化方法
GB2595002B (en) * 2020-05-16 2022-06-15 Maymask 171 Ltd Lossless compression of sorted data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL86993A (en) * 1988-07-05 1991-07-18 Ibm Israel Method of generating a compressed representation of a source data string
JPH0834432B2 (ja) * 1989-01-31 1996-03-29 三菱電機株式会社 符号化装置及び符号化方法
JPH0834434B2 (ja) * 1990-02-26 1996-03-29 三菱電機株式会社 符号化装置及び符号化方法
US5357250A (en) * 1992-11-20 1994-10-18 International Business Machines Corporation Adaptive computation of symbol probabilities in n-ary strings
US5587710A (en) * 1995-03-24 1996-12-24 National Semiconductor Corporation Syntax based arithmetic coder and decoder

Also Published As

Publication number Publication date
DK176874B1 (da) 2010-02-08
KR100263503B1 (ko) 2000-08-01
KR19980080047A (ko) 1998-11-25
US6075471A (en) 2000-06-13
JPH10256917A (ja) 1998-09-25
TW429690B (en) 2001-04-11
CN1096752C (zh) 2002-12-18
DK33698A (da) 1998-09-15
JP3367370B2 (ja) 2003-01-14

Similar Documents

Publication Publication Date Title
CN1096752C (zh) 自适应编码方法
CN1168010C (zh) 信息处理设备和方法
CN1177482C (zh) 编码方法,解码方法,编码装置以及解码装置
CN1207894C (zh) 数据隐藏和抽取方法、系统和电路
CN1265627C (zh) 图像数据处理方法和图像数据处理电路
CN1187716C (zh) 用于编码和解码关键字数据的装置和方法
CN1379366A (zh) 图像处理装置和方法
CN1268135C (zh) 编码方法、编码装置和记录媒体、以及解码方法、解码装置和记录媒体
CN1586042A (zh) 可变长编码方法以及可变长译码方法
CN1099766C (zh) 数据压缩方法、数据复原方法及信息处理装置
CN1299560A (zh) 图像编码方法、图像编码译码方法、图像编码装置或图像记录再生装置
CN1993976A (zh) 利用熵编码的彩色图像数据的无损压缩
CN1424849A (zh) 图像处理装置、图像处理方法、程序以及存储介质
CN1252646C (zh) 图像处理方法和图像处理装置
CN1835548A (zh) 解码装置、解码方法及其程序产品
CN1076933C (zh) 图像编码装置及方法
CN1153468C (zh) 编码装置、译码装置和编码、译码方法以及图象处理装置
CN1518350A (zh) 帧数据修正量输出装置、修正装置和方法、显示装置
CN1226039A (zh) 指数计算装置和解码装置
CN1838776A (zh) 解码装置、逆量化方法及其程序
CN1163076C (zh) 图像编码装置和图像编码方法及图像解码装置和图像解码方法
CN1314208C (zh) 可扩展标记语言数据流压缩器及其压缩方法
CN1946181A (zh) 图像处理、压缩、解压缩、传输、发送、接收装置和方法及其程序以及显示装置
CN1115054C (zh) 图像信号编码、解码装置及方法
CN1741392A (zh) 对数据进行编码和译码的方法和装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20021218

Termination date: 20150310

EXPY Termination of patent right or utility model