CN102474601B - 未编码语法的自适应概率更新的方法和装置 - Google Patents

未编码语法的自适应概率更新的方法和装置 Download PDF

Info

Publication number
CN102474601B
CN102474601B CN201080029305.5A CN201080029305A CN102474601B CN 102474601 B CN102474601 B CN 102474601B CN 201080029305 A CN201080029305 A CN 201080029305A CN 102474601 B CN102474601 B CN 102474601B
Authority
CN
China
Prior art keywords
uncoded
grammer
code element
block
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080029305.5A
Other languages
English (en)
Other versions
CN102474601A (zh
Inventor
J.索尔
郭力伟
尹鹏
郑云飞
吕小安
许茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN102474601A publication Critical patent/CN102474601A/zh
Application granted granted Critical
Publication of CN102474601B publication Critical patent/CN102474601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供了一种装置。所述装置包括用于编码至少一个块的画面数据的编码器(100)。所述编码器(100)将概率更新处理应用于与块相关联的未编码的码元和未编码的语法中的至少一个。

Description

未编码语法的自适应概率更新的方法和装置
相关申请的交叉引用
本申请要求提交于2009年6月29日的美国临时申请序列号NO.61/221,201号(代理人卷号PU090074)的权益,其整体通过参考合并于此。
技术领域
本原理大体上涉及视频编码和解码,并且更具体地,涉及未编码语法的自适应概率更新的方法和装置。
背景技术
概率估计在算术编码中起到重要的角色。一般的方法是使用有限状态机估计概率。大概来讲,遭遇(encounter)一类给定的码元的0(或1)使得机器转换到指定值1的更低(或相应的更高)概率的新的状态,然后其被用于编码来自相同的类的下一码元。状态机还具有允许将各个编码参数的预计算值附加到每个概率状态的益处。
国际标准化组织/国际电工委员会(ISO/IEC)移动图像专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟,电信分部(ITU-T)H.264建议(下文中“MPEG-4AVC标准”)假设通过一组十分有限的代表值可以代表每个上下文模型的估计概率。
MPEG-4 AVC标准采用基于上下文的自适应二进制算术编码(CABAC)框架来编码语法。CABAC通过以下步骤来实现良好的压缩性能:(a)根据元素的上下文选择每个语法元素的概率模型;(b)基于局部统计自适应概率估计;以及(c)使用算术编码。只有在编码了每个码元之后才更新概率估计。
对于CABAC,通过以下递归公式为LPS(最小概率码元)推导出64个代表性概率值p∈[0.01875,0.5]:
对于所有的σ=1,2,...63,pσ=α·pσ-1,其中并且p0=0.5,N=64。
在编码了每个码元之后更新概率估计。α和基数N的选择是重要的。该选择代表对快速自适应的期望和对足够稳定和准确估计的需要之间的折中。在MPEG-4 AVC标准中,基本的编码单元是码片(slice)。这限制了概率自适应使得其不能超过整个码片编码处理的持续时间。
MPEG-4 AVC标准采用SKIP/Direct模式,其假设诸如模式/运动或系数信息(或其它信息)之类的某些语法可以从已经可用的解码信息中推断,所以根本无需编码语法。然而,在一些情况下,发现这可能在将来编码对应的语法时造成某些损坏。一个原因可能是由于概率估计处理的局限性。一种可能性是概率收敛太慢或估计非常不稳定。
发明内容
本原理解决了现有技术的这些和其它缺陷及缺点,本原理针对未编码语法的自适应概率更新的方法和装置。
根据本原理的一个方面,提供了一种装置。所述装置包括用于编码至少一个块的画面数据的编码器。所述编码器向与块相关联的未编码码元和未编码语法中的至少一个应用概率更新处理。
根据本原理的另一个方面,提供了一种视频编码器中的方法。所述方法包括编码至少一个块的画面数据。所述编码步骤包括向与块相关联的未编码码元和未编码语法中的至少一个应用概率更新处理。
根据本原理的另外一个方面,提供了一种装置。所述装置包括用于解码至少一个块的画面数据的解码器。所述解码器向与块相关联的未编码码元和未编码语法中的至少一个应用概率更新处理。
根据本原理的另外一个方面,提供了一种视频解码器中的方法。所述方法包括解码至少一个块的画面数据。所述解码器包括向块相关联的未编码码元和未编码语法中的至少一个应用概率更新处理。
连同附图来阅读示例性实施例的以下具体描述,本原理的这些和其它方面、特征和优点将变得明显。
附图说明
根据以下示例性附图可以更好地了解本原理,附图中:
图1是根据本原理的实施例可以应用本原理的示例性视频编码器的框图;
图2是根据本原理的实施例可以应用本原理的示例性视频解码器的框图;
图3是在普通编码处理中更新输入码元的概率的方法的流程图;
图4是在普通解码处理中更新输入码元的概率的方法的流程图;
图5是根据本原理的实施例在不编码或不解码码元的情况下更新输入码元的概率的示例方法的流程图;
图6是根据本原理的实施例在编码器处对未编码语法执行自适应概率更新的示例性方法的流程图;
图7是根据本原理的实施例在解码器处对未编码语法执行自适应概率更新的示例性方法的流程图;
图8是根据本原理的实施例在编码器处对未编码语法执行自适应概率更新的另一种示例性方法的流程图;以及
图9是根据本原理的实施例在解码器处对未编码语法执行自适应概率更新的另一种示例性方法的流程图。
具体实施方式
本原理针对未编码语法的自适应概率更新的方法和装置。
本描述说明本原理。因此,将认识到:本领域技术人员将能够设计出体现本原理并被包括在本原理的精神和范围内的各种布置,尽管在这里没有明确地描述或示出所述布置。
在此叙述的所有示例和条件性语言意欲用于教导的目的以便帮助读者理解本原理以及由(多个)发明人贡献的以促进现有技术的构思,并且应该被解释为不限于这种具体叙述的示例和条件。
另外,在这里叙述本原理的原理、方面和实施例及其特定示例的所有陈述意欲包括其结构和功能等效物。另外,意图是:这样的等效物包括当前已知的等效物以及将来开发的等效物二者,即所开发的执行相同功能的任何元件,而不论其结构如何。
因此,例如,本领域技术人员将认识到:在此呈现的框图表示体现本原理的说明性电路的概念性视图。类似地,将认识到:任何流程图示(flow chart)、流程图(flowdiagram)、状态转换图、伪代码等表示实质上可以表示在计算机可读介质中并因此由计算机或处理器执行的各种处理,而不管是否明确地示出这样的计算机或处理器。
可以通过使用专用硬件以及与适当的软件相关联的能够执行软件的硬件来提供图中示出的各种元件的功能。当利用处理器来提供所述功能时,可以利用单个专用处理器、利用单个共享处理器、或者利用其中一些可被共享的多个独立处理器来提供所述功能。另外,术语“处理器”或“控制器”的明确使用不应该被解释为排他性地指代能够执行软件的硬件,而是可以隐含地包括,而不限于,数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)、和非易失性存储装置。
还可以包括其它传统的和/或定制的硬件。类似地,图中示出的任何开关只是概念性的。它们的功能可以通过程序逻辑的运行、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至手动地来执行,如从上下文更具体地理解的那样,可以由实施者选择具体技术。
在其权利要求中,被表示为用于执行指定功能的部件的任何元件意欲包含执行那个功能的任何方式,例如包括:a)执行那个功能的电路元件的组合或者b)与适当电路相组合的任何形式的软件,所述软件因此包括固件或微代码等,所述适当电路用于执行该软件以执行所述功能。由这种权利要求限定的本原理在于如下事实,即,以权利要求所要求的方式将由所叙述的各种部件提供的功能组合和集合到一起。因此认为可以提供那些功能的任何部件与在此示出的那些部件等效。
在本说明书中引用的本原理的“一个实施例”或“实施例”及其其它变型,是指连同所述实施例描述的特定特征、结构、特性等被包括在本原理的至少一个实施例中。因此,在说明书各处出现的短语“在一个实施例中”或“在实施例中”及其任何其它变型的出现不一定都指代相同的实施例。
应当认识到,以下“/”,“和/或”,以及“...中的至少一个”中的任一个的使用,例如在“A/B”,“A和/或B”,以及“A和B中至少一个”的情况中,意欲包括仅仅对于第一个列出的选项(A)的选择、仅仅对于第二个列出的选项(B)的选择、或者对于两个选项(A和B)的选择。作为另一示例,“A,B,和/或C”,以及“A,B和C中至少一个”的情况中,这种措辞意欲包括仅仅对于第一个列出的选项(A)的选择、仅仅对于第二个列出的选项(B)的选择、仅仅对于第三个列出的选项(C)的选择、仅仅对于第一个和第二个列出的选项(A和B)的选择、仅仅对于第一个和第三个列出的选项(A和C)的选择、仅仅对于第二个和第三个列出的选项(B和C)的选择、或者对于全部三个选项(A和B和C)的选择。如本领域和相关领域普通技术人员容易认识到的,这可以被扩展用于很多列出的项目。
此外,还应当认识到,尽管在这里关于MPEG-4 AVC标准描述本原理的一个或多个实施例,但是本原理不仅仅限于该标准,并且因此可以关于其它视频编码标准、建议及其扩展使用本原理,包括使用适配统计的算术编码或任何其它熵编码方法的MPEG-4 AVC标准的扩展,同时保持本原理的精神。
如在此使用的,“高级语法”指代在宏块层之上分层级驻留的比特率中出现的语法。例如,在此使用的高级语法,可以指代,但不限于,在码片首标级、补充增强信息级(SEI)、画面参数集(PPS)级、序列参数集(SPS)级以及网络抽象层(NAL)单元首标级的语法。
此外,如在此使用的,词“画面”和“图像”互换地使用并且指代静态图像或者来自视频序列的画面。如已知的,画面可以是帧或场。
另外,如在此使用的,词“发信号通知”指代向对应的解码器指示什么事。例如,编码器可以发信号通知一组码元和/或语法中的特定的一个以便使解码器知晓哪个特定码元和/或语法的相应概率在编码器一侧得到更新。以这样的方式,相同的码元和/或语法可以类似和/或相应地和/或互补地在编码器一侧和解码器一侧进行。因此,例如,编码器可以向解码器传送特定码元和/或语法使得解码器可以使用和/或识别相同的特定码元和/或语法(以上与涉及显式标记(indicia)的显式方法对应)或者,如果解码器已经具有了特定码元和/或语法以及其它,那么可以使用信令(而不进行传送)以便简单地允许解码器知晓并选择特定码元和/或语法(以上与涉及隐式标记的隐式方法对应)。通过避免传送任何实际码元和/或语法,可以实现比特的节约。将要认识到可以以各种方式完成信令。例如,可以使用一个或多个语法元素、标志等来将信息发信号通知给对应的解码器。
转到图1,以参考数字100大体上指示了根据本原理的实施例的可以应用本原理的示例性视频编码器。
视频编码器100包括帧排序缓冲器110,其具有与组合器185的非反相输入端信号通信的输出端。组合器185的输出端与变换器和量化器125的第一输入端信号通信地连接。变换器和量化器125的输出端与熵编码器145的第一输入端和逆变换器和逆量化器150的第一输入端信号通信地连接。熵编码器145的输出端与组合器190的第一非反相输入端信号通信地连接。组合器190的输出端与输出缓冲器135的第一输入端信号通信地连接。
编码器控制器105的第一输出端与帧排序缓冲器110的第二输入端、逆变换器和逆量化器150的第二输入端、画面类型判断模块115的输入端、宏块类型(MB类型)判断模块120的输入端、帧内预测模块160的第二输入端、去块滤波器165的第二输入端、运动补偿器170的第一输入端、运动估计器175的第一输入端、以及参考画面缓冲器180的第二输入端信号通信地连接。
编码器控制器105的第二输出端与补充增强信息(SEI)插入器130的第一输入端、变换器和量化器125的第二输入端、熵编码器145的第二输入端、输出缓冲器135的第二输入端、以及序列参数集(SPS)和画面参数集(PPS)插入器140的输入端信号通信地连接。
画面类型判断模块115的第一输出端与帧排序缓冲器110的第三输入端信号通信地连接。画面类型判断模块115的第二输出端与宏块类型判断模块120的第二输入端信号通信地连接。
序列参数集(SPS)和画面参数集(PPS)插入器140的输出端与组合器190的第三非反相输入端信号通信地连接。
逆量化器和逆变换器150的输出端与组合器119的第一非反相输入端信号通信地连接。组合器119的输出端与帧内预测模块160的第一输入端以及去块滤波器165的第一输入端信号通信地连接。去块滤波器165的输出端与参考画面缓冲器180的第一输入端信号通信地连接。参考画面缓冲器180的输出端与运动估计器175的第二输入端信号通信地连接。运动估计器175的第一输出端与运动补偿器170的第二输入端信号通信地连接。运动估计器175的第二输出端与熵编码器145的第三输入端信号通信地连接。
运动补偿器170的输出端与开关197的第一输入端信号通信地连接。帧内预测模块160的输出端与开关197的第二输入端信号通信地连接。宏块类型判断模块120的输出端与开关197的第三输入端信号通信地连接。开关197的第三输入端确定开关的“数据”输入(相比较于控制输入端,即,第三输入端)是由运动补偿器170提供还是由帧内预测模块160提供。开关197的输出端与组合器119的第二非反相输入端以及组合器185的反向输入端信号通信地连接。
帧排序缓冲器110和编码器控制器105的输入端可以用作编码器100的输入端,用于接收输入画面101。此外,补充增强信息(SEI)插入器130的输入端可以用作编码器100的输入端,用于接收元数据。输出缓冲器135的输出端可以用作编码器100的输出端,用于输出比特流。
转到图2,以参考数字200大体上指示了根据本原理的实施例的可以应用本原理的示例性视频解码器。
视频解码器200包括输入缓冲器210,其具有与熵解码器245的第一输入端信号通信地连接的输出端。熵解码器245的第一输出端与逆变换器和逆量化器250的第一输入端信号通信地连接。逆变换器和逆量化器250的输出端与组合器225的第二非反相输入端信号通信地连接。组合器225的输出端与去块滤波器265的第二输入端和帧内预测模块260的第一输入端信号通信地连接。去块滤波器265的第二输出端与参考画面缓冲器280的第一输入端信号通信地连接。参考画面缓冲器280的输出端与运动补偿器270的第二输入端信号通信地连接。
熵解码器245的第二输出端与运动补偿器270的第三输入端和去块滤波器265的第一输入端信号通信地连接。熵解码器245的第三输出端与解码器控制器205的输入端信号通信地连接。解码器控制器205的第一输出端与熵解码器245的第二输入端信号通信地连接。解码器控制器205的第二输出端与逆变换器和逆量化器250的第二输入端信号通信地连接。解码器控制器205的第三输出端与去块滤波器265的第三输入端信号通信地连接。解码器控制器205的第四输出端与帧内预测模块260的第二输入端、运动补偿器270的第一输入端,以及参考画面缓冲器280的第二输入端信号通信地连接。
运动补偿器270的输出端与开关297的第一输入端信号通信地连接。帧内预测模块260的输出端与开关297的第二输入端信号通信地连接。开关297的输出端与组合器225的第一非反相输入端信号通信地连接。
输入缓冲器210的输入端可以用作解码器200的输入端,用于接收输入比特流。去块滤波器265的第一输出端可以用作解码器200的输出端,用于对输出画面进行输出。
如以上注意的,MPEG-4 AVC标准采用SKIP/Direct模式,其假设可以从已经可用的解码信息中推断出某些语法,从而根本无需编码语法。然而,在一些情况下,发现这可能在将来编码对应的语法时造成一些损坏。在至少一个实施例中,即便当语法/码元未被编码时也更新给定语法/码元的概率估计(例如,对于给定码片中的任何宏块/块)来解决以上问题。
在一个实施例中,将本原理应用于MPEG-4 AVC标准的SKIP模式和Direct模式。尽管在SKIP模式中典型地不编码模式、运动和系数语法,在Direct模式中典型地不编码模式和运动语法,但在该实施例中,仍然更新这些未编码的语法元素的概率。
转到图3,通过参考数字300大体上指示正常(传统)编码处理中的更新输入码元的概率的方法。方法300包括将控制传递给功能块310的开始块305。功能块310接收输入码元,并且传递控制到功能块315。功能块315算术地编码输入码元,并且传递控制到功能块320。功能块320更新输入码元的概率,并且传递控制到结束块399。
转到图4,通过参考数字400大体上指示正常(传统)解码处理中的更新输入码元的概率的方法。方法400包括开始块405,其传递控制到功能块410。功能块410接收包括输入码元的输入比特流,并且传递控制到功能块415。功能块415算术地解码输入码元,并且传递控制到功能块420。功能块420更新输入码元的概率,并且传递控制到结束块499。
转到图5,通过参考数字500大体上指示了根据本原理的实施例的在不编码或不解码码元的情况下更新输入码元的概率的示例性方法。方法500包括开始块505,其传递控制到功能块510。功能块510接收输入码元,并且传递控制到功能块515。功能块515更新输入码元的概率,并且传递控制到结束块599。将要认识到可以在编码器和/或解码器中执行方法500。
在一个实施例中,本原理可以应用于残差系数的有效性等级(significancelevel)的编码处理。系数的有效性指示该系数是零还是非零。编码非零系数的等级。通常,在指示每个残差系数的有效性的有效性地图(significance map)中编码系数有效性。实施有效性地图的一种方法采用以下步骤:如果一组系数具有至少一个有效系数,那么使用右端上下文(right context)算术编码“1”。此后,将该组划分成两个子集。对于每个子集,也编码用于指示该子集是否具有至少一个有效系数的“1”或“0”。重复这个处理直至发送了整个有效性地图。注意到如果为组编码“0”,那么这意味着所有系数为零,并且因此,无需进一步对该组分区。此外,注意到,可以将不同的码元概率应用于每个组大小,并且此外,对于每个组大小,可以取决于在该组在有效性地图内的位置来应用概率。
给出这个示例,在一个实施例中,可以以下方式应用本原理。假定将组编码为“1”,使得在该组中存在至少一个有效系数,并且因此,将该组分区。另外,假定该组的第一子集具有等于零的所有系数,因此算术编码用于该子集的码元“0”。然后,显然地第二子集具有有效系数,这是因为在该组中存在至少一个非零系数并且在第一子集中未发现至少一个非零系数。结果,无需为第二子集编码“1”,这是因为在这个特定情况下解码器可以推论出码元值“1”。然而,在没有编码这个码元的情况下,编码器和解码器二者均可更新码元的概率,这是因为该值对于二者是已知的。这个更新处理有助于提供更加准确的概率估计,并且因此,提供更好的编码效率。
在另一个实施例中,在SKIP/Direct模式中不对所有未编码的语法应用概率更新处理。相反,可以显式地识别将要应用本原理的语法/码元。可替换地,可以隐式地推导在编码处理期间是否需要将本原理应用于某些未编码的语法。
在一个实施例中,对于显式编码,可以使用例如一个或多个高级语法元素(例如,码片首标、SEI消息、PPS、SPS、NAL单元首标、等等)来指定将要应用本原理的未编码的码元/语法。
在另一实施例中,基于以下的一个或多个因素来隐式地推导是否需要将本原理应用于未编码的码元/语法:对应的概率的收敛速度;当前块/宏块的位置(如果当前块/宏块在码片开始处,那么不应用本原理;如果当前块/宏块在码片的结尾处,那么应用本原理),相同码元的时空相邻块的概率状态,已经编码的码元和/或语法的数目(例如,对于块、宏块、码片、画面、视频序列等等),以及对于特定语法元素已经编码了特定码元的次数,等等。
语法
表1示出了根据本原理的实施例的序列参数集(SPS)的自适应概率更新的示例性语法。表2示出了根据本原理的实施例的码片首标的自适应概率更新的示例性语法。
adaptive_probability_update_present_flag:
adaptive_probability_update_present_flag等于0零意味着对序列中的未编码的语法的概率上下文不执行自适应更新;adaptive_probability_update_present_flag等于1意味着对序列中的全部或部分未编码的语法的概率上下文执行自适应更新。
numberupdated_probability_context:number_updated_probability_context指定自适应更新概率上下文的未编码的语法的数目。
index_updated_probability_context:index_updated_probability_context指定阵列中的每个元素的概率上下文索引。每个索引与在某些情况下可以不被编码的语法相关联。
adaptive_probability_update_flag:adaptive_probability_update_flag等于0意味着对码片中的未编码的语法的概率上下文不执行自适应更新;
adaptive_probability_uPdate_flag等于1意味着对码片中的全部或部分未编码的语法的概率上下文执行自适应更新。
表1
seq_parameter_set_rbsp(){ 描述符
...
adaptive_probability_update_present_flag u(1)
if(adaptive_probability_update_present_flag==1)
{
number_updated_probability_context ue(v)
for(i=0;i<number_updated_probability_context;i++)
index_updated_probability_context[i] ue(v)
}
...
}
表2
slice_header(){ 描述符
...
adaptive_probability_update_flag u(1)
...
}
转到图6,通过参考数字600大体上指示了根据本原理的实施例的在编码器中执行未编码的语法的自适应概率更新的示例性方法。方法600包括开始块605,其传递控制到功能块610。功能块610执行预测模式选择,并且传递控制到循环限制块615。循环限制块615开始对用于编码一个块的所有相关联的语法进行循环,并且传递控制到判断块620。判断块620确定当前语法是否是未编码的语法。如果是,那么将控制传递到功能块625。否则,将控制传递到功能块635。
功能块625执行概率上下文更新,并且传递控制到循环限制块630。循环限制块630结束所有相关联的语法的循环,并且传递控制到结束块699。
功能块635执行算术编码,并且传递控制到功能块640。功能块640执行概率上下文更新,并且传递控制到循环限制块640。
转到图7,通过参考数字700大体上指示了根据本原理的实施例的在解码器中执行未编码的语法的自适应概率更新的示例性方法。方法700包括开始块,其传递控制到循环限制块710。循环限制块710开始对用于解码一个块的所有相关联的语法进行循环,并且将控制传递给判断块715。判断块715确定当前语法是否是未编码的语法。如果是,那么将控制传递到功能块720。否则,将控制传递到功能块740。
功能块720基于其它解码的语法推断未编码的语法,并且传递控制到功能块725。功能块725执行概率上下文更新,并且传递控制到循环限制块730。
循环限制块730结束对所有相关联的语法的循环,并且传递控制到功能块735。功能块735解码一个块,并且传递控制到结束块799。
功能块740执行算术解码,并且传递控制到功能块745。功能块745执行概率上下文更新,并且传递控制到循环限制块730。
转到图8,通过参考数字800大体上指示根据本原理的实施例的在编码器处执行未编码的语法的自适应概率更新的另一种示例性方法。方法800包括开始块805,其传递控制到功能块810。功能块810执行预测模式选择,并且传递控制到循环限制块815。循环限制块815开始所有相关联的语法的循环,并且传递控制到判断块820。判断块820确定是否存在任何未编码的语法。如果是,那么传递控制到功能块825。否则,将控制传递到功能块840。
功能块825检查概率上下文更新条件,并且传递控制到判断块830,所述概率上下文更新条件基于以下中的至少一个因素:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态、以及在序列/画面/码片/块级处的显式或隐式指示。判断块830确定是否满足了概率上下文更新条件。如果是,那么将控制传递到功能块835。否则,将控制传递到循环限制块850。
功能块835执行概率上下文更新,并且传递控制到循环限制块850。循环限制块850结束循环,并且传递控制到结束块899。
功能块840执行算术编码,并且传递控制到功能块845。功能块845执行概率上下文更新,并且传递控制到循环限制块850。
转到图9,通过参考数字900大体上指示根据本原理的实施例的在解码器中执行未编码的语法的自适应概率更新的另一种示例性方法。方法900包括开始块905,其传递控制到循环限制块910。循环限制块910开始对用于解码一个块的所有相关联的语法进行循环,并且传递控制到判断块915。判断块915确定是否存在任何未编码的语法。如果是,那么将控制传递到功能块920。否则,将控制传递到功能块940。
功能块920基于其它解码的语法推断未编码的语法,并且传递控制到功能块925。功能块925检查概率上下文更新条件,并且传递控制到判断块930,所述概率上下文更新条件基于以下中的至少一个因素:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经解码的语法的数目、已经解码的码元的数目、多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态、以及在序列/画面/码片/块级处的显式或隐式指示。判断块930确定是否满足概率上下文更新条件。如果是,那么将控制传递到功能块935。否则将控制传递到循环限制块950。
功能块935执行概率上下文更新,并且传递控制到循环限制块950。
循环限制块950结束循环,并且传递控制到功能块955。功能块955解码一个块,并且传递控制到结束块999。
功能块940执行算术解码,并且传递控制到功能块945。功能块945执行概率上下文更新,并且传递控制到循环限制块950。
现在将给出本发明的许多附带优点/特点中的一些的描述,其中的一些已经在上面提到过。例如,一个优点/特点在于一种具有编码至少一个块的画面数据的编码器的装置。所述编码器将概率更新处理应用于与所述块相关联的未编码的码元和未编码的语法中的至少一个。
另一个优点/特点在于一种具有如上描述的编码器的装置,其中,关于与所述至少一个块有关的多个未编码的码元和未编码的语法有选择地应用概率更新处理。
又一个优点/特点在于一种具有所述编码器的装置,其中如上所述关于与所述至少一个块有关的多个未编码的码元和未编码的语法有选择地应用概率更新处理,其中,显式地发信号通知选择的未编码的码元和选择的未编码的语法中的至少一个。
另一个优点/特点在于一种具有所述编码器的装置,其中如上所述关于与所述至少一个块有关的多个未编码的码元和未编码的语法有选择地应用概率更新处理,其中,隐式地发信号通知选择的未编码的码元和选择的未编码的语法中的至少一个。
此外,另一个优点/特点在于一种具有所述编码器的装置,其中如上所述关于与至少一个块有关的多个未编码的码元和未编码的语法有选择地应用概率更新处理,其中,响应于以下中的至少一个因素对是否向与块有关的多个未编码的码元和未编码的语法中特定的一个应用概率更新处理进行选择:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、以及多个未编码的码元和未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态。
另外,另一个优点/特点在于具有所述编码器的装置,其中如上所述关于与至少一个块有关的多个未编码的码元和未编码的语法有选择地应用概率更新处理,其中,响应于对于特定语法已经编码了特定码元多少次,对是否向与块有关的多个未编码的语法和未编码的码元中的特定码元应用概率更新处理进行选择。
另外,另一优点/特点在于一种具有如上所述的编码器的装置,其中,将概率更新处理应用于序列级、画面级、码片级、和块级。
另外,另一优点/特点在于一种具有如上所述的编码器的装置,其中,显式地或者隐式地发信号通知是否通过编码器已经应用了概率更新处理和是否在解码器处应用概率更新处理中的至少一个的指示。
相关领域普通技术人员基于在此教导可以容易地确定本原理的这些和其它特点和优点。应该了解的是可以以各种形式的硬件、软件、固件、专用处理器、或其结合实施本原理的教导。
最优选地,作为硬件和软件的组合来实现本原理的教导。此外,可以作为在程序存储单元上有形地体现的应用程序来实现所述软件。所述应用程序可以被上载到包括任何适当架构的机器并由其执行。优选地,在具有诸如一个或多个中央处理单元(“CPU”)、随机存取存储器(“RAM”)和输入/输出(“I/O”)接口之类的硬件的计算机平台上实现所述机器。该计算机平台还可以包括操作系统和微指令代码。在此描述的各种处理和功能可以是可由CPU执行的微指令代码的一部分或应用程序一部分或者它们的任何组合。此外,诸如附加的数据存储单元和打印单元之类的各种其它外围单元可以连接到该计算机平台。
还应当理解,因为优选地用软件来实现在附图中示出的一些组成系统组件和方法,所以这些系统组件或处理功能块之间的实际连接可能根据本原理被编程的方式而不同。给出这里的教导,相关领域的普通技术人员将能够想到本原理的这些和类似的实现或配置。
尽管在这里参照附图描述了说明性实施例,但是应当理解,本原理不限于那些精确的实施例,并且相关领域的普通技术人员可以在其中进行各种改变和修改,而不背离本原理的范围或精神。所有这样的改变和修改都意欲被包括在如所附权利要求阐述的本原理的范围内。

Claims (22)

1.一种编码装置,包括:
用于编码至少一个块的画面数据的编码器,其中,所述编码器基于已经编码的与所述至少一个块有关的码元和/或语法的数目、相同码元的时空相邻块的概率状态、对应的概率的收敛速度、当前块/宏块的位置、以及对于特定语法元素已经编码了特定码元的次数中的至少一个,有选择地将概率更新处理应用于在SKIP/Direct模式下与所述块相关联的但是未编码的码元和/或语法中的至少一个,
其中在编码其他码元和/或语法中更新所述概率。
2.如权利要求1所述的装置,其中,显式地发信号通知选择的未编码的码元和/或选择的未编码的语法中的至少一个。
3.如权利要求1所述的装置,其中,隐式地确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
4.如权利要求1所述的装置,其中,响应于以下中的至少一个因素对是否向与块有关的多个未编码的码元和/或未编码的语法中特定的一个应用概率更新处理进行选择:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、以及多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态。
5.如权利要求1所述的装置,其中,响应于对特定语法已经编码了特定码元多少次,对是否向与块有关的多个未编码的语法和/或未编码的码元中的特定码元应用概率更新处理进行选择。
6.一种在视频编码器中的方法,包括:
编码至少一个块的画面数据,其中,所述编码步骤包括基于已经编码的与所述至少一个块有关的码元和/或语法的数目、相同码元的时空相邻块的概率状态、对应的概率的收敛速度、当前块/宏块的位置、以及对于特定语法元素已经编码了特定码元的次数中的至少一个,有选择地将概率更新处理应用于在SKIP/Direct模式下与所述块相关联的但是未编码的码元和/或语法中的至少一个,
其中在编码其他码元和/或语法中更新所述概率。
7.如权利要求6所述的方法,其中,显式地发信号通知选择的未编码的码元和/或选择的未编码的语法中的至少一个。
8.如权利要求6所述的方法,其中,隐式地确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
9.如权利要求6所述的方法,其中,响应于以下中的至少一个因素对是否向与块有关的多个未编码的码元和/或未编码的语法中特定的一个应用概率更新处理进行选择:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、以及多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和/或时间邻域中的至少一个的概率状态。
10.如权利要求6所述的方法,其中,响应于对特定语法已经编码了特定码元多少次,对是否向与块有关的多个未编码的语法和/或未编码的码元中的特定码元应用概率更新处理进行选择。
11.一种解码装置,包括:
用于解码至少一个块的画面数据的解码器,其中,所述解码器基于已经编码的与所述至少一个块有关的码元和/或语法的数目、相同码元的时空相邻块的概率状态、对应的概率的收敛速度、当前块/宏块的位置、以及对于特定语法元素已经编码了特定码元的次数中的至少一个,有选择地将概率更新处理应用于在SKIP/Direct模式下与所述块相关联的但是未编码的码元和/或语法中的至少一个,
其中在编码其他码元和/或语法中更新所述概率。
12.如权利要求11所述的装置,其中,所述解码器接收用于识别选择的未编码的码元和/或选择的未编码的语法中的至少一个的显式标记,并且从所述显式标记中确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
13.如权利要求11所述的装置,其中,所述解码器接收用于识别选择的未编码的码元和/或选择的未编码的语法中的至少一个的隐式标记,并且从所述隐式标记中确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
14.如权利要求11所述的装置,其中,响应于以下中的至少一个因素对是否向与块有关的多个未编码的码元和/或未编码的语法中特定的一个应用概率更新处理进行选择:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、以及多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态。
15.如权利要求11所述的装置,其中,响应于对特定语法已经编码了特定码元多少次,对是否向与块有关的多个未编码的语法和/或未编码的码元中的特定码元应用概率更新处理进行选择。
16.如权利要求11所述的装置,其中,在序列级、画面级、码片级、和/或块级上应用概率更新处理。
17.如权利要求11所述的装置,其中,从与之有关的显式标记或隐式标记中确定是否已经通过编码器应用了概率更新处理和是否要在解码器处应用概率更新处理中的至少一个。
18.一种视频解码器中的方法,包括:
解码至少一个块的画面数据,其中,所述解码器基于已经编码的与所述至少一个块有关的码元和/或语法的数目、相同码元的时空相邻块的概率状态、对应的概率的收敛速度、当前块/宏块的位置、以及对于特定语法元素已经编码了特定码元的次数中的至少一个,有选择地将概率更新处理应用于在SKIP/Direct模式下与块相关联的但是未编码的码元和/或语法中的至少一个,
其中在编码其他码元和/或语法中更新所述概率。
19.如权利要求18所述的方法,还包括:
接收用于识别选择的未编码的码元和/或选择的未编码的语法中的至少一个的显式标记;以及
从所述显式标记中确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
20.如权利要求18所述的方法,还包括:
接收用于识别选择的未编码的码元和/或选择的未编码的语法中的至少一个的隐式标记;以及
从所述隐式标记中确定选择的未编码的码元和/或选择的未编码的语法中的至少一个。
21.如权利要求18所述的方法,其中,响应于以下中的至少一个因素对是否向与块有关的多个未编码的码元和/或未编码的语法中特定的一个应用概率更新处理进行选择:系数有效性地图中对应的系数有效性代表的位置、码片或画面中块的位置、对应的概率的收敛速度、已经编码的语法的数目、已经编码的码元的数目、以及多个未编码的码元和/或未编码的语法中的特定一个关于块的空间邻域和时间邻域中的至少一个的概率状态(725,925)。
22.如权利要求18所述的方法,其中,响应于对特定语法已经编码了特定码元多少次,对是否向与块有关的多个未编码的语法和/或未编码的码元中的特定码元应用概率更新处理进行选择。
CN201080029305.5A 2009-06-29 2010-06-29 未编码语法的自适应概率更新的方法和装置 Active CN102474601B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22120109P 2009-06-29 2009-06-29
US61/221,201 2009-06-29
PCT/US2010/001861 WO2011008243A1 (en) 2009-06-29 2010-06-29 Methods and apparatus for adaptive probability update for non-coded syntax

Publications (2)

Publication Number Publication Date
CN102474601A CN102474601A (zh) 2012-05-23
CN102474601B true CN102474601B (zh) 2017-06-23

Family

ID=42799661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080029305.5A Active CN102474601B (zh) 2009-06-29 2010-06-29 未编码语法的自适应概率更新的方法和装置

Country Status (6)

Country Link
US (1) US9615108B2 (zh)
EP (1) EP2449781B1 (zh)
JP (1) JP5702377B2 (zh)
KR (1) KR101773009B1 (zh)
CN (1) CN102474601B (zh)
WO (1) WO2011008243A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718149B2 (en) 2009-10-29 2014-05-06 Panasonic Corporation Image coding method and image decoding method
US20130223528A1 (en) * 2010-11-15 2013-08-29 Electronics And Telecommunications Research Institute Method and apparatus for parallel entropy encoding/decoding
US9001883B2 (en) 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
JP6080405B2 (ja) * 2012-06-29 2017-02-15 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
GB2543844B (en) * 2015-11-01 2018-01-03 Gurulogic Microsystems Oy Encoders, decoders and methods
EP3244610A1 (en) 2016-05-12 2017-11-15 Thomson Licensing Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to video data
US11182639B2 (en) 2017-04-16 2021-11-23 Facebook, Inc. Systems and methods for provisioning content
WO2021010687A1 (ko) * 2019-07-12 2021-01-21 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US20230254511A1 (en) * 2022-02-04 2023-08-10 Tencent America LLC Block-level window size update for arithmetic coding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100495931C (zh) * 2002-04-26 2009-06-03 株式会社Ntt都科摩 信号编码及译码方法、信号编码及译码装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0303661B1 (pt) 2002-03-27 2016-09-27 Matsushita Electric Indusrial Co Ltd método e dispositivo de codificação de comprimento variável e meio de armazenamento
JP4197345B2 (ja) 2002-03-27 2008-12-17 パナソニック株式会社 可変長復号化方法、記憶媒体、及び可変長復号化装置
JP3807342B2 (ja) * 2002-04-25 2006-08-09 三菱電機株式会社 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
JP2003319391A (ja) 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP3491001B1 (ja) 2002-04-26 2004-01-26 株式会社エヌ・ティ・ティ・ドコモ 信号符号化方法、信号復号方法、信号符号化装置、信号復号装置、信号符号化プログラム、及び、信号復号プログラム
JP4767992B2 (ja) 2002-06-06 2011-09-07 パナソニック株式会社 可変長符号化方法および可変長復号化方法
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
EP1836858A1 (en) * 2005-01-14 2007-09-26 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
US8446954B2 (en) * 2005-09-27 2013-05-21 Qualcomm Incorporated Mode selection techniques for multimedia coding
KR101356733B1 (ko) * 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
US8139875B2 (en) * 2007-06-28 2012-03-20 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US8566515B2 (en) * 2009-01-12 2013-10-22 Maxim Integrated Products, Inc. Memory subsystem

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100495931C (zh) * 2002-04-26 2009-06-03 株式会社Ntt都科摩 信号编码及译码方法、信号编码及译码装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard;Detlev Marpev ,etc.;《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》;20030731;第13卷(第7期);摘要、正文第II部分的B和C子部分以及第III部分 *

Also Published As

Publication number Publication date
KR20120093067A (ko) 2012-08-22
EP2449781B1 (en) 2016-12-28
US9615108B2 (en) 2017-04-04
WO2011008243A1 (en) 2011-01-20
EP2449781A1 (en) 2012-05-09
CN102474601A (zh) 2012-05-23
JP5702377B2 (ja) 2015-04-15
KR101773009B1 (ko) 2017-08-30
US20120177129A1 (en) 2012-07-12
JP2012532560A (ja) 2012-12-13

Similar Documents

Publication Publication Date Title
CN102474601B (zh) 未编码语法的自适应概率更新的方法和装置
CN102474602B (zh) 用于使用自适应树选择来对二进制集进行视频编解码的方法和装置
CN105959697B (zh) 变换单元内的多符号位隐藏
CN102484706B (zh) 使用自适应几何划分进行视频编码和解码的方法及装置
CN102308578A (zh) 视频编码和解码中用于变换选择的方法和装置
CN108419084A (zh) 改进熵编码和解码的方法及装置
CN102473315B (zh) 再次使用树结构编码和解码二元集的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190131

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190131

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right