CN103947205A - 帧内模式译码中的参考模式选择 - Google Patents
帧内模式译码中的参考模式选择 Download PDFInfo
- Publication number
- CN103947205A CN103947205A CN201280056960.9A CN201280056960A CN103947205A CN 103947205 A CN103947205 A CN 103947205A CN 201280056960 A CN201280056960 A CN 201280056960A CN 103947205 A CN103947205 A CN 103947205A
- Authority
- CN
- China
- Prior art keywords
- pattern
- intra prediction
- probable
- estimation
- actual intra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
视频译码器可对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式,且基于所述第一及第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。可通过响应于所述第一最可能模式及所述第二最可能模式两者为不同的角度预测模式而选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计来确定所述实际帧内预测模式的所述估计。可使用所述实际帧内预测模式的所述估计加上差信息来识别用以译码所述当前视频块的所述实际帧内预测模式。
Description
本申请案主张2011年11月18日申请的美国临时申请案61/561,803及2011年11月18日申请的美国临时申请案61/561,819的权益,所述两个美国临时申请案中的每一者的全部内容以引用的方式并入本文。
技术领域
本发明涉及视频译码,且更明确地说,涉及用信号通知用于经译码视频数据的帧内预测模式。
背景技术
数字视频能力可并入到广泛范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及其类似者。数字视频装置实施视频压缩技术(例如,由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)所定义的标准及这些标准的扩展中所描述的视频压缩技术),以较有效地发射及接收数字视频信息。
视频压缩技术执行空间预测及/或时间预测,以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,一视频帧或切片可分割成多个视频块。每个视频块可被进一步分割。使用相对于相邻视频块的空间预测来对经帧内译码(I)帧或切片中的视频块进行编码。经帧间译码(P或B)帧或切片中的视频块可使用相对于相同帧或切片中的相邻宏块或译码单元的空间预测或相对于其它参考帧的时间预测。
发明内容
大体来说,本发明描述用于用信号通知经译码视频数据的译码特性且处理经译码视频数据的译码特性的信令的技术,且更明确地说,本发明描述用于在视频数据的经编码位流中用信号通知帧内预测模式且处理帧内预测模式的信令的技术。在视频译码中,可从先前经译码图片的视频块预测(即,帧间预测)或可从同一图片的已经译码视频块预测(即,帧内预测)当前正译码(编码或解码)的视频数据块。当视频块是经帧内预测时,与明确地用信号通知实际帧内预测模式相对,有时将帧内预测模式用信号通知为估计的实际帧内预测模式与实际帧内预测模式之间的差。假设所述实际帧内预测模式通常接近于所述估计帧内预测模式,则使用可变长度译码(VLC)技术,可使用相对较少的位用信号通知所述实际帧内预测模式。在一些情况下,本发明的技术可通过在一些译码情形中确定较接近于实际帧内预测模式的估计帧内预测模式而改善用信号通知用以帧内译码视频数据块的帧内预测模式的效率。
在一个实例中,一种用于译码视频数据的方法包含:对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。确定所述实际帧内预测模式的所述估计包含响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;以及响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
在另一实例中,一种用于译码视频数据的装置包含视频译码器,所述视频译码器经配置以:对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。所述视频译码器经配置以通过以下操作确定所述实际帧内预测模式的所述估计:响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;以及响应于所述第一最可能模式及所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
在另一实例中,一种用于译码视频数据的设备包含:用于对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式的装置;以及用于基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式确定用以译码所述当前视频块的实际帧内预测模式的估计的装置。所述用于确定所述实际帧内预测模式的所述估计的装置包含用于响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式而选择所述第一最可能模式作为所述实际帧内预测模式的所述估计的装置,及用于响应于所述第一最可能模式及所述第二最可能模式两者为不同的角度预测模式而选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计的装置。
在另一实例中,一种计算机可读存储媒体存储指令,所述指令可操作以致使一或多个处理器:对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。所述指令致使所述一或多个处理器通过以下操作确定所述实际帧内预测模式的所述估计:响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;以及响应于所述第一最可能模式及所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
随附图式及以下描述中陈述一或多个实例的细节。其它特征、目标及优点将从所述描述及图式以及权利要求书而显而易见。
附图说明
图1是说明可利用本发明的技术的实例视频编码及解码系统的框图。
图2是说明可实施用于译码指示帧内预测模式的信息的技术的视频编码器的实例的框图。
图3A展示帧内预测模式的实例。
图3B及3C展示最可能帧内预测模式及估计的实际帧内预测模式的实例。
图4展示可用以确定用于当前块的最可能模式的当前块及相邻块的实例。
图5是说明可实施用于解码指示帧内预测模式的信息的技术的视频解码器的实例的框图。
图6是描绘根据本发明的技术的用信号通知帧内预测模式的实例方法的流程图。
具体实施方式
大体来说,本发明描述用于用信号通知经译码视频数据的译码特性且处理经译码视频数据的译码特性的信令的技术,且更明确地说,本发明描述用于在视频数据的经编码位流中用信号通知帧内预测模式且处理帧内预测模式的信令的技术。在视频译码中,可从先前经译码图片的视频块预测(即,帧间预测)或可从同一图片的已经译码视频块预测(即,帧内预测)当前正译码(例如,编码或解码)的视频数据块。当视频块是经帧内预测时,与明确地用信号通知实际帧内预测模式相对,有时将帧内预测模式用信号通知为参考模式(本发明中还称为实际帧内预测模式的估计)与实际帧内预测模式之间的差。如下文将更详细地解释,不同帧内预测模式大体对应于不同预测角度,但某些模式被视为非角度的。
假设所述实际帧内预测模式通常接近于所述估计帧内预测模式,则使用可变长度译码(VLC)技术,可使用相对较少的位用信号通知所述实际帧内预测模式。在一些情况下,本发明的技术可通过在一些译码情形中确定较接近于实际帧内预测模式的估计帧内预测模式而改善用信号通知用以帧内译码视频数据块的帧内预测模式的效率。
可基于用于当前块的最可能帧内预测模式确定所述块的估计帧内预测模式。这些最可能帧内预测模式有时可在本发明中简称为最可能模式。如下文将更详细地解释,可至少部分地基于已经译码的相邻块的帧内预测模式选择用于当前视频块的最可能模式。举例来说,当前块可具有对应于用以译码当前块上方的块的帧内预测模式及用以译码当前块左方的块的帧内预测模式的两个最可能模式。假设视频块是以光栅扫描次序(例如,从左到右及从上到下)经译码,则在当前块上方及在当前块左方的视频块将在当前块之前译码,且因此,那些块的帧内预测模式在译码当前块之前已为视频译码器所知。当前块还可具有也是基于相邻块确定或以某一其它方式确定的额外最可能模式(例如,第三最可能模式、第四最可能模式,等)。
假设两个最可能模式,当所述最可能帧内预测模式中的一者是用于当前块的实际帧内预测模式时,则可使用两位码字用信号通知所述实际帧内预测模式以指示所述块是使用最可能模式中的一者译码。举例来说,码字“00”可用以用信号通知用于所述块的实际帧内预测模式是第一最可能模式,且码字“01”可用以用信号通知用于所述块的实际帧内预测模式是第二最可能模式。如果使用两个以上最可能模式,则在一些情况下,可使用额外位用于用信号通知哪一最可能模式为实际模式。
在其中选择使用的模式(还称为实际模式或所选模式)不同于最可能模式中的一者的情况下,则可直接用信号通知或可使用实际模式与实际模式的估计之间的差分信息用信号通知所述实际模式。在这些情况下,可使用如下码字用信号通知实际帧内预测模式,所述码字以“1”开始以区分所述码字与用于最可能模式的码字。以上实例为其中可使用最可能模式来用信号通知视频块的帧内预测模式的许多译码结构中的一者。本发明的技术不限于用于利用最可能模式的任何一个特定结构。
当将帧内预测模式用信号通知为估计模式与实际模式之间的差时,可在经编码位流中作为码字将所述差信息从视频编码器用信号通知到视频解码器。举例来说,所述码字可为对应于实际模式的估计与实际模式之间的顺序模式次序差的可变长度码字。如果使用可变长度码字,则可例如将较短码字指派给较频繁出现的差,而将较长码字指派给较不频繁出现的差。较频繁出现的差可例如为较短差,而较不频繁出现的差为较长距离。因此,当实际帧内预测模式的估计接近于实际预测时较之于当实际帧内预测模式的估计远离实际帧内预测模式时通常使用较少位来用信号通知差信息。如下文的实例中将更详细地解释,两个帧内预测模式之间的距离可大体视为其顺序模式次序的差的绝对值。因此,具有顺序模式次序3及15的模式可视为比具有顺序模式次序8及6的模式相隔远。
根据当前技术,当最可能模式集合中的两个模式为角度模式时(即,与非角度相对),估计模式确定为两个最可能模式的角度的均值或中值。然而,在一些情况下,此估计模式可能并不那么接近(例如根据顺序模式次序)于用于当前视频块的实际模式。因此,使用最可能模式中的一者作为实际模式的估计而非使用两个最可能模式的均值或中值可能更准确。举例来说,如果边缘存在于相邻块中,则最可能模式可能极其精确地传达信息。边缘可能从最可能模式中的一者移位一个或两个角度,但所述边缘不太可能移位到两个最可能模式的中间角度,当两个最可能模式的角度量相差大时尤其如此。换句话说,如果两个最可能模式具有相对较大的角度差,则基于那些两个最可能模式的均值或中值的估计可能以高于所需频率的频率将较短码字指派给不太可能为实际模式的模式,这可降低译码效率。本发明大体描述用于通过将两个最可能模式中的一者选择为实际帧内预测模式的估计而确定实际帧内预测模式的估计的技术。
可例如结合差信息使用实际帧内预测模式的估计来识别用以译码视频数据块的实际帧内预测模式。因此,如果视频编码器及视频解码器两者经配置以确定用于实际帧内预测模式的相同估计,则仅需要在经编码位流中传达实际帧内预测模式的估计与实际帧内预测模式之间的差以使视频解码器确定用以译码视频数据块的帧内预测模式。
图1是说明可利用根据本发明的技术的用于译码表示用于视频数据块的帧内预测模式的语法数据的技术的实例视频编码及解码系统10的框图。如图1中所示,系统10包含经由通信信道16将经编码视频传输到目的地装置14的源装置12。源装置12及目的地装置14可包括广泛范围的装置中的任一者。在一些情况下,源装置12及目的地装置14可包括无线通信装置,例如无线手持机、所谓的蜂窝式或卫星无线电电话,或可经由通信信道16传达视频信息的任何无线装置,在所述情况下,通信信道16为无线的。
然而,关注表示用于视频数据块的帧内预测模式的语法数据的译码的本发明的技术未必限于无线应用或设定。举例来说,这些技术可应用于空中电视广播、有线电视传输、卫星电视传输、因特网视频传输、编码到存储媒体上的经编码数字视频,或其它情形。因此,通信信道16可包括适合于传输经编码视频数据的无线或有线媒体的任何组合。此外,通信频道16既定表示视频编码装置可发送数据到视频解码装置的许多方式中的仅一者。举例来说,在系统10的其它配置中,源装置12可产生经编码视频以供目的地装置14解码且将所述经编码视频存储在存储媒体或文件服务器上,使得所述经编码视频可由目的地装置14在需要时存取。
在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调器(调制解调器)22及发射器24。目的地装置14包含接收器26、调制解调器28、视频解码器30及显示装置32。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成显示装置。视频编码器20及视频解码器30可经类似地配置以执行本发明的技术。举例来说,视频编码器20及视频解码器30可经配置以使用相同技术确定最可能模式及估计模式,使得不需要在经编码视频位流中明确地用信号通知最可能模式及估计模式。
图1的所说明系统10只是一个实例。可通过任何数字视频编码及/或解码装置来执行用于译码表示用于视频数据块的帧内预测模式的语法数据的技术。尽管本发明的技术大体上由视频编码装置来执行,但所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)执行。此外,本发明的技术还可由视频预处理器执行。源装置12及目的地装置14仅为源装置12在其中产生经译码视频数据以供发射到目的地装置14的此些译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播以例如用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可包括视频俘获装置,例如摄像机、含有先前所俘获视频的视频档案及/或来自视频内容提供者的视频馈送。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,则源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。在每一情况下,可由视频编码器20编码所捕获、预先捕获或计算机产生的视频。经编码视频信息可接着由调制解调器22根据通信标准进行调制,且经由发射器24发射到目的地装置14。调制解调器22可包含各种混合器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计用于发射数据的电路,包含放大器、滤波器及一或多个天线。
目的地装置14的接收器26经由信道16接受信息,且调制解调器28对所述信息进行解调。再次,视频编码过程可实施本文所述的技术中的一或多者以译码表示用于视频数据块的帧内预测模式的语法数据。经由信道16传达的信息可包含由视频编码器20定义的语法信息,所述语法信息还由视频解码器30使用,包含描述宏块及其它经译码单元(例如GOP)的特性及/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道16可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线,或无线与有线媒体的任何组合。通信频道16可形成分组网络(例如局域网、广域网或全球网络,例如因特网)的部分。通信信道16大体上表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不同通信媒体的集合,包含有线或无线媒体的任何合适的组合。通信信道16可包含路由器、交换器、基站或可以用于促进从源装置12到目的地装置14的通信的任何其它装备。
视频编码器20及视频解码器30可根据视频压缩标准(例如ITU-T H.264标准,替代地称作MPEG-4,第10部分,高级视频译码(AVC))操作。然而,本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2及ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器单元或其它硬件及软件以处置对共同数据流或单独数据流中的音频或视频两者的编码。如果适用,则多路复用器-多路分用器单元可符合ITUH.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
ITU-T H.264/MPEG-4(AVC)标准是作为被称为联合视频组(JVT)的集体伙伴的产品由ITU-T视频译码专家组(VCEG)连同ISO/IEC移动图片专家组(MPEG)一起制定的。在一些方面中,本发明中描述的技术可应用到大体符合H.264标准的装置。H.264标准描述于ITU-T研究组的日期为2005年3月的“ITU-T推荐书H.264,用于通用视听服务的高级视频译码”(ITU-T Recommendation H.264,Advanced Video Coding for genericaudiovisual services)中,其在本文中可称为H.264标准或H.264规范或H.264/AVC标准或规范。联合视频组(JVT)持续致力于扩展H.264/MPEG-4AVC。
视频编码器20及视频解码器30各自可实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中的任一者可集成为相应相机、计算机、移动装置、订户装置、广播装置、机顶盒、服务器或其类似者中的组合式编码器/解码器(编解码器)的部分。
视频序列通常包括一系列视频帧。图片群组(GOP)一股来说包括一系列一或多个视频帧。GOP可在GOP的标头、GOP的一或多个帧的标头或其它地方中包含语法数据,其描述GOP中包含的帧的数目。每一帧可包含描述相应帧的编码模式的帧语法数据。视频编码器20通常对个别视频帧内的视频块进行操作以便编码视频数据。视频块可对应于宏块或宏块的分区。视频块可具有固定或变化的大小,且可根据指定的译码标准而大小不同。每一视频帧可包含多个切片。每一切片可包含多个宏块,所述宏块可布置成分区(还称为子块)。
作为一实例,ITU-T H.264标准支持各种块大小的帧内预测(例如用于明度分量的16乘16、8乘8或4乘4及用于色度分量的8x8),以及各种块大小的帧间预测,例如用于明度分量的16x16、16x8、8x16、8x8、8x4、4x8及4x4及用于色度分量的对应缩放大小。在本发明中,“NxN”及“N乘N”可互换使用来指在垂直及水平尺寸方面的块的像素尺寸,例如,16x16像素或16乘16像素。一股来说,16x16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,NxN块大体上在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行及列。此外,块未必需要在水平方向与垂直方向上具有相同数目的像素。举例来说,块可包括NxM像素,其中M未必等于N。小于16x16的块大小在ITU-TH.264中可被称为16x16宏块的分区。
视频块可包括像素域中的像素数据块或变换域中的变换系数块(例如在将例如离散余弦变换(DCT)、整数变换、小波变换或在概念上类似的变换等变换应用到表示经译码视频块与预测性视频块之间的像素差的残余视频块数据之后)。在一些情况下,视频块可包括变换域中的经量化变换系数块。
较小视频块可提供更佳分辨率,且可用于视频帧的包含高等级细节的位置。一股来说,可将宏块及有时称为子块的各种分区视为视频块。此外,可将切片视为多个视频块,例如宏块及/或子块。每一切片可为视频帧的可独立解码的单元。或者,帧本身可为可解码单元,或帧的其它部分可被定义为可解码单元。术语“经译码单元”可指视频帧的任何可独立解码的单元,例如完整帧、帧的切片、图片群组(GOP)(还称为序列),或根据适用译码技术定义的另一可独立解码的单元。
当前正在致力于研发当前被称作高效率视频译码(HEVC)的新的视频译码标准。所述新兴HEVC标准还可被称作H.265。所述标准化努力是基于被称作HEVC测试模型(HM)地视频译码装置的模型。所述HM假设视频译码装置优于根据例如ITU-T H.264/AVC的装置的若干能力。举例来说,H.264提供9种帧内编码模式,而HM提供多达33种帧内预测模式,例如,基于经帧内预测译码的块的大小。称为“HEVC工作草案9”或“WD9”的HEVC标准的近期草案描述于布洛斯(Bross)等人的文档JCTVC-K1003“高效率视频译码(HEVC)文本规格草案9(High efficiency video coding(HEVC)text specification draft9)”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第11次会议:中国上海,2012年10月10日到19日)中,其从2012年11月13日起可从以下链接下载:http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v7.zip。
HM将视频数据块称为译码单元(CU)。位流内的语法数据可定义最大译码单元(LCU),其是根据像素数目的最大译码单元。总的来说,CU具有类似于根据H.264译码的宏块的用途,只是CU并不具有大小区别。因而,一个CU可分裂成若干子CU。一股来说,本发明中提到CU可指图片的最大译码单元或LCU的子CU。LCU可分裂成若干子CU,且每一子CU可分裂成若干子CU。位流的语法数据可定义LCU可以分裂的最大次数,这被称作CU深度。因此,位流还可定义最小译码单元(SCU)。本发明还使用术语“块”来指CU、预测单元(PU)或变换单元(TU)中的任一者。
LCU可与四叉树数据结构相关联。一股来说,四叉树数据结构包含每个CU一个节点,其中根节点对应于LCU。如果一个CU分裂成4个子CU,则对应于CU的节点包含4个叶节点,其中的每一者对应于所述子CU中的一者。四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其指示对应于所述节点的CU是否分裂成子CU。CU的语法元素可递归地定义,且可取决于CU是否分裂成子CU。
未分裂的CU可包含一或多个预测单元(PU)。一股来说,PU表示对应CU的全部或一部分,且包含用于检索PU的参考样本的数据。举例来说,当PU经帧内预测模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的运动向量的数据。举例来说,定义运动向量的数据可描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧及/或运动向量的参考列表(例如,列表0或列表1)。举例来说,定义PU的CU的数据还可描述CU到一或多个PU的分割。分割模式可在CU未经译码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。
具有一或多个PU的CU还可包含一或多个变换单元(TU)。在使用PU的预测之后,视频编码器可计算用于对应于PU的CU的部分的残余值。一组残余值可经变换、扫描及量化以定义一组变换系数。TU定义包含变换系数的数据结构。TU不必限于PU的大小。因而,TU可大于或小于相同CU的对应PU。在一些实例中,TU的最大大小可对应于对应CU的大小。
根据本发明的技术,视频编码器20可使用帧内预测模式编码编码特定视频数据块,且提供指示用以编码所述块的所选(即,实际)帧内预测模式的信息。除P帧或P切片及B帧或B切片之外,视频编码器20还可使用帧内预测模式帧内预测编码任何类型的帧或切片的块,例如I帧或I切片。当视频编码器20确定应对块进行帧内预测模式编码时,视频编码器20可执行速率-失真分析以选择最适当的帧内预测模式。举例来说,视频编码器20可计算一或多个帧内预测模式的速率-失真值,且选择具有可接受速率-失真特性的模式中的一者。
视频编码器20还可经配置以确定所述块的编码上下文。所述上下文可包含所述块的各种特性,例如块的大小,其可根据以下各者来确定:像素尺寸;预测单元(PU)类型,例如在HEVC的实例中,2Nx2N、Nx2N、2NxN、NxN;短距离帧内预测(SDIP)类型,例如2NxN/2、N/2x2N、2Nx1、1x2N;在H.264的实例中的宏块类型;所述块的译码单元(CU)深度;或视频数据块的大小的其它度量单位。在一些实例中,可基于例如译码模式(用于上方相邻块、左方相邻块、左上方相邻块、右上方相邻块或其它相邻块)等信息确定所述上下文。在一些实例中,所述上下文可包含用于一或多个块的帧内预测模式以及用于正被编码的当前块的大小信息两者。
在任何情况下,视频编码器20可包含配置数据,所述配置数据将用于块的上下文映射到用于当前块的各种译码特性。举例来说,基于用于所述块的上下文,配置数据可指示一或多个最可能帧内预测模式及/或一或多个可变长度码(VLC)表。如上文所介绍,VLC表可将码字映射到差值。举例来说,所述差值可为实际模式与估计模式之间的顺序模式次序差。
在一些实例中,视频编码器20可经配置而基于上下文以最可能模式开始分析以选择帧内预测模式。在一些实例中,当最可能模式实现合适的速率-失真特性时,视频编码器20可选择所述最可能模式。在其它实例中,视频编码器20不需要以最可能模式开始选择过程。
在进行帧内预测性或帧间预测性译码以产生预测性数据及残余数据之后,且在进行任何变换(例如,用于H.264/AVC中的4x4或8x8整数变换,或离散余弦变换DCT)以产生变换系数之后,可执行变换系数的量化。量化大体上是指其中变换系数经量化以可能减少表示系数所用的数据量的过程。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间被舍去到m位值,其中n大于m。
在量化之后,可例如根据内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法来执行对经量化数据的熵译码。经配置用于熵译码的处理单元或另一处理单元可执行其它处理功能,例如经量化系数的零延行长度译码及/或语法信息的产生,所述语法信息例如是经译码块模式(CBP)值、宏块类型、译码模式、经译码单元的最大宏块大小(例如,帧、切片、宏块或序列)或其类似者。
视频解码器30最终例如从调制解调器28及接收器26、从文件服务器、从存储媒体或以某一其它方式接收经编码视频数据。根据本发明的技术,视频解码器30可接收表示识别用以编码视频数据块的帧内预测模式的语法元素的码字。视频解码器30可经配置而以实质上类似于视频编码器20的方式确定用于块的译码上下文。此外,视频解码器30可包含与视频编码器20类似的配置数据,例如用于基于相邻块的模式确定最可能模式的信息。视频解码器30可以类似于视频编码器20的方式确定实际帧内预测模式的估计。即,视频解码器30可经配置以应用与由视频编码器20使用的过程相同或类似的过程来确定最可能模式及实际帧内预测模式的估计。以此方式,视频解码器30与视频编码器20确定相同的最可能模式及实际帧内预测模式的相同估计。基于所接收码字,视频解码器30可接着确定估计帧内预测模式与实际帧内预测模式之间的差。因而,基于码字及估计帧内预测模式,视频解码器30可确定实际帧内预测模式。在一个实例中,视频解码器30对码字所指示的差值与估计帧内预测模式所指示的值进行求和以产生指示用于待解码的当前块的实际帧内预测模式的值。
视频编码器20及视频解码器30各自可实施为可适用的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20及视频解码器30中的每一者可包括在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为组合式视频编码器/解码器(编解码器)的部分。包含视频编码器20及/或视频解码器30的设备可包括集成电路、微处理器及/或无线通信装置,例如蜂窝式电话。
图2是说明可实施用于译码指示帧内预测模式的信息的技术的视频编码器20的实例的框图。视频编码器20可对视频帧内的视频块执行帧内及帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻接帧内的视频中的时间冗余。帧内预测模式(I模式)可指若干基于空间的压缩模式中的任一者,且帧间预测模式(例如单向预测(P模式)或双向预测(B模式))可指若干基于时间的压缩模式中的任一者。
如图2中所示,视频编码器20接收待编码视频帧内的当前视频块。在图2的实例中,视频编码器20包含运动补偿单元44、运动估计单元42、存储器64、求和器50、变换处理单元52、量化单元54,及熵译码单元56。为了视频块重建,视频编码器20还包含逆量化单元58、逆变换处理单元60,及求和器62。还可包含例如解块滤波器、样本自适应偏移滤波器及自适应环路滤波器等一或多个环路滤波器(图2中未展示)以对经重建视频块进行滤波。必要时,一或多个环路滤波器将通常对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可划分成多个视频块。运动估计单元42及运动补偿单元44可相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间压缩。帧内预测单元46可相对于与待译码块相同的帧或切片中的一或多个相邻块执行对所接收视频块的帧内预测性译码以提供空间压缩。
模式选择单元40例如基于误差结果且基于包含经译码当前块的帧或切片的帧或切片类型来选择所述译码模式中的一者(帧内或帧间),且向求和器50提供所得帧内或帧间译码块以产生残余块数据,且向求和器62提供所述所得帧内或帧间译码块以重建经编码块以供用于参考帧或参考切片中。一股来说,帧内预测涉及相对于相邻经先前译码块中的像素样本预测当前块,而帧间预测涉及运动估计及运动补偿以在时间上预测当前块。
运动估计单元42及运动补偿单元44表示视频编码器20的帧间预测元件。运动估计单元42与运动补偿单元44可高度集成,但出于概念目的分开加以说明。运动估计为产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示预测性参考帧(或其它经译码单元)内的预测性块相对于当前帧(或其它经译码单元)内的正被译码的当前块的位移。预测性块是被发现在像素差方面与待译码块紧密匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。运动向量还可指示宏块的分区的位移。运动补偿可涉及基于通过运动估计确定的运动向量提取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。
运动估计单元42通过将视频块与存储器64中的参考帧的视频块比较来计算经帧间译码帧的视频块的运动向量。运动补偿单元44还可内插参考帧(例如I帧或P帧)的子整数像素。作为实例,ITU H.264及HEVC标准描述两个参考图片列表的使用:列表0,其包含显示次序先于正被编码的当前帧的参考帧;以及列表1,其包含显示次序晚于正被编码的当前帧的参考帧。因此,可根据这些列表来组织存储在存储器64中的数据。
运动估计单元42将来自存储器64的一或多个参考帧的块与当前帧(例如P帧或B帧)的待编码块比较。当存储器64中的参考帧包含用于子整数像素的值时,由运动估计单元42计算的运动向量可指参考帧的子整数像素位置。如果子整数像素位置的值都未存储在存储器64中,则运动估计单元42及/或运动补偿单元44还可经配置以计算存储在存储器64中的参考帧的子整数像素位置的值。运动估计单元42将计算出来的运动向量发送到熵译码单元56及运动补偿单元44。由运动向量识别的参考帧块可被称为预测性块。运动补偿单元44可基于帧间预测性块计算预测数据。
作为如上文所描述由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可对当前块进行帧内预测。明确地说,帧内预测单元46可确定用来编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可例如在单独的编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测单元46(或在一些实例中为模式选择单元40)可从测试模式中选择适当帧内预测模式来使用。举例来说,帧内预测单元46可使用速率-失真分析计算用于各种经测试帧内预测模式的速率-失真值,且从经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率失真分析大体上确定经编码块与经编码以产生所述经编码块的原始未编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(即,位数目)。帧内预测单元46可依据用于各种经编码块的失真及速率计算比率,以确定哪个帧内预测模式对于所述块展现最佳或合乎需要的速率-失真值。
本发明的技术可应用于例如HEVC等编码标准及技术。在一些实例中,例如在HEVC中,可用帧内预测模式的数目可取决于正译码的块(例如,HEVC中的“译码单元”或“CU”)的大小。对于每一帧内预测模式,可指派模式索引。图3A展示可与HEVC一起使用的帧内预测模式及对应模式索引的实例。图3A的箭头表示预测方向,且数字表示模式索引。图3A中所示的模式索引不应认为对应于用于其它图中的任何参考数字。
如图3B及3C的实例中所示,每一模式还可具有不同于模式索引的顺序模式次序。一股来说,存在两种帧内预测模式:(1)角度模式,其中沿着某一方向执行帧内预测,及(2)非角度模式,例如DC及平面预测。当最可能模式集合中的两个模式皆为角度模式时,根据当前已知技术,实际模式的估计可为那一角度的均值或中值,如图3B及3C的实例中所示。本发明描述用于确定实际帧内预测模式的估计的新技术。
图3B展示最可能模式集合中的两个模式的实例。图3B的模式以两个不同方式标记。不在圆圈中的数字对应于帧内预测模式索引。举例来说,帧内预测模式索引可对应于预期一模式将用于译码的频繁程度,但不必需要任何此类相关性。在圆圈中的数字表示顺序模式次序。顺序模式排序对应于模式的基于其预测角度的排序。在顺序模式排序中,举例来说,具有顺序模式次序6的模式的角度介于具有顺序模式次序5的模式的角度与具有顺序模式次序7的模式的角度之间。在图3B的实例中,两个最可能模式为具有模式索引11及13的帧内预测模式。举例来说,这两个最可能模式可对应于用以译码两个相邻块的模式。
根据现有技术,基于两个最可能模式的实际帧内预测模式的估计可为两个最可能模式的顺序模式次序的均值或中值。因而,在图3B的实例中,根据现有技术,实际帧内预测模式的估计可为帧内预测模式12,因为顺序模式次序4为顺序模式次序6与顺序模式次序2的均值。然而,根据本发明的技术,两个最可能模式中的一者而非均值或中值可选择为实际帧内预测模式的估计。因而,根据本发明的技术,实际帧内预测模式的估计可为帧内预测模式11或帧内预测模式13而非帧内预测模式12。下文将更详细地论述用于选择帧内预测模式11及帧内预测模式13中的哪一者用作实际帧内预测模式的估计的技术。
图3C展示替代现有技术的实例,其可用于在最可能模式集合中的两个最可能模式相隔远(即,具有大角度差)时确定实际帧内预测模式的估计。在图3C的实例中,两个最可能模式为具有模式索引13及16的帧内预测模式。根据一个现有技术,当两个最可能模式之间的角度大时,可确定所述两个最可能模式的均值或中值,且实际帧内预测模式的估计可为调整90度的均值或中值(例如,图3C的实例中的模式17,其从模式10旋转90度)。或者,可确定一个最可能模式与另一最可能模式的镜像方向之间的均值或中值。然而,根据本发明的技术,实际帧内预测模式的估计可为最可能模式中的一者,即使当最可能模式相隔远时也是这样。因而,在图3C的实例,实际帧内预测模式的估计可为帧内预测模式16或帧内预测模式13而非帧内预测模式17。下文将更详细地论述用于选择帧内预测模式16及帧内预测模式13中的哪一者用作实际帧内预测模式的估计的技术。
图3B及3C中的最可能模式可对应于已经译码相邻块的模式。图3B及3C既定表示两个实例,且已出于解释的目的而随机选择这些实例中的特定最可能模式。根据本发明的技术,图3B或3C中所示的任何两个模式可潜在地为最可能模式。
下文表1展示CU大小与可用以编码所述大小的CU的帧内预测模式的数目之间的潜在对应性的一个实例。如可通过表1的实例看到,8x8、16x16及32x32CU可使用图3A中所示的35个帧内预测模式,而4x4及64x64CU使用帧内预测模式的较小集合。
表1
译码单元大小 | 帧内预测模式的数目 |
4x4 | 18 |
8x8 | 35 |
16x16 | 35 |
32x32 | 35 |
64x64 | 4 |
在任何情况下,在选择了用于一块的帧内预测模式之后,帧内预测单元46可将指示用于所述块的所选帧内预测模式的信息提供到熵译码单元56。熵译码单元56可根据本发明的技术编码指示实际帧内预测模式的信息。举例来说,视频编码器20可在经编码位流中用信号通知识别用于当前块的实际帧内预测模式与实际帧内预测模式的估计之间的差的差信息。如上文所解释,可基于速率-失真分析确定实际帧内预测,同时可基于上下文信息(例如用以译码已经译码相邻块的模式)确定最可能帧内预测模式。
根据本发明的技术,帧内预测单元46可根据一或多个不同准则基于最可能模式确定实际模式的估计。可基于从与一或多个相邻块相关联的数据导出的上下文(例如用以译码相邻块的模式及/或相邻块的大小)确定最可能模式。
图4展示可用以确定用于当前块的最可能模式的当前块及相邻块的实例。块402表示当前正译码的块的实例。块404表示左上方相邻块的实例。块406表示上部相邻块的实例。块408表示右上方相邻块的实例,且块410表示左方相邻块的实例。假设所述块正以从左到右且从上到下的光栅扫描次序进行译码,则块404、块406、块408及块410在译码块402之前进行译码。因此,这些相邻块的译码模式在译码块402之前已知。块404、块406、块408及块410中的任一者以及未展示的其它已经译码的相邻块可用以确定用于块402的最可能模式。
出于实例的目的,假设块406及块410用以确定用于块402的最可能模式。此外,假设块402具有三个最可能模式。在其中块406与块410是使用相同角度模式译码的情况下,则所述三个最可能模式可为用以译码块406及块410的角度模式以及邻近所述模式的两个角度模式。在其中块406与块410是使用不同角度模式译码的情况下,则那些角度模式中的每一者可用作最可能模式,且第三最可能模式可选自非角度模式中的一者(例如平面或DC)。在其中块406与块410是使用角度模式译码且另一者是使用非角度模式译码的情况下,则角度模式及非角度模式两者皆可用作最可能模式,且第三最可能模式可被选择为与已经用作最可能模式的所述非角度模式不同的非角度模式或可被选择为一些其它模式。这些实例仅表示视频编码器20及视频解码器30可确定最可能模式的许多方式中的几种方式。
如上文所描述,在确定最可能模式之后,帧内预测单元46可产生指示用于正译码块的实际帧内预测模式是否为所述最可能模式中的一者的一或多个语法元素。如果实际帧内预测模式不为所述最可能帧内预测模式中的一者,则帧内预测单元46可基于所述最可能模式确定实际模式的估计,且产生指示实际帧内预测模式与实际帧内预测模式的估计之间的差的语法元素。在其中视频编码器20经配置以确定两个以上最可能模式(例如在上文参考图4所描述的实例中为三个最可能模式)的情况下,视频编码器20可使用少于全部的最可能模式确定实际预测的估计。作为一个实例,视频编码器20可使用对应于两个相邻块的模式的两个最可能模式但不使用第三最可能模式来确定实际帧内预测模式的估计。
根据本发明的技术,当一个最可能模式为角度预测模式且另一最可能模式为非角度预测模式时,则帧内预测单元46可通过使用所述角度最可能模式作为实际帧内预测模式的估计而确定实际帧内预测模式的估计。
当两个最可能模式都是角度预测模式时,实际模式的估计可为所述最可能模式中的一者。在其中第一最可能模式及第二最可能模式两者都是角度模式但不为相同模式的情况下,则与使用两个最可能模式的均值或中值作为实际帧内预测模式的估计相对,帧内预测单元46可选择所述两个最可能模式中的一者作为实际模式的估计。举例来说,当两个相邻块两者具有角度模式但为不同角度模式时可出现此情况。在其中相邻块具有相同角度模式的情况下,则所述角度模式可为最可能模式中的一者,且如果实际帧内预测模式不用以译码所述块,则帧内预测单元46可使用所述角度模式作为实际帧内预测模式的估计。
为在第一最可能模式与第二最可能模式为不同角度模式的情况下选择使用哪一最可能模式作为实际模式的估计,可使用以下技术中的一或多者。在一个实例中,帧内预测单元46可选择预测角度较接近于垂直角度的最可能模式(例如,图3B及3C中的帧内预测模式0)作为实际帧内预测模式的估计。在另一实例中,帧内预测单元46可选择不在垂直角度(例如模式0)与水平角度(例如,图3B及3C中的帧内预测模式1)之间的最可能模式作为实际帧内预测模式的估计。换句话说,如果两个最可能模式中的一者为在帧内预测模式0与帧内预测模式1之间的帧内预测模式,则帧内预测单元46可经配置以选择不在帧内预测模式0与帧内预测模式1之间的最可能帧内预测模式中的一者作为实际帧内预测模式的估计。
在其它实例中,帧内预测单元46可选择最可能模式中的一者作为实际帧内预测模式的估计且用信号通知所述选择。哪一最可能模式为实际模式的估计的信令可例如包含在码字中,使得所述码字识别实际模式的估计及实际模式的估计与实际模式之间的差两者。
在一个实例中,帧内预测单元46可选择具有较小帧内模式数目的最可能模式作为实际帧内预测模式的估计。举例来说,参考图3B,帧内预测模式0可比模式1更优选。或者,可使用顺序模式排序、单独优选排序或某一其它排序。
在一个实例中,帧内预测单元46可选择基于相邻块的信息的最可能模式作为实际帧内预测模式的估计。举例来说,帧内预测单元46可检查左上方块的帧内预测模式,且接着选取较接近于左上方块的帧内预测模式的最可能模式作为实际模式的估计。举例来说,如果上部相邻块及左方相邻块用以确定最可能模式,则左上方块可在此情形中用于选择使用哪一最可能模式作为实际模式的估计。使用图4作为一实例,如果块406及块410的模式用作最可能模式,则块404的帧内预测模式可用以确定块406及块410中的哪一者将用作实际帧内预测模式的估计。明确地说,在一个实例中,基于顺序模式次序在数字上最接近于块404的模式的块406或410的模式被选择作为实际帧内预测模式的估计。
在一个实例中,帧内预测单元46可选择基于最可能模式块信息的最可能模式作为实际帧内预测模式的估计。举例来说,如果一个最可能模式来自上部相邻块且一个最可能模式来自左方相邻块,则帧内预测单元46可选择属于具有与当前块类似的大小的块的最可能模式作为实际模式的估计。除这些准则之外或替代这些准则,还可使用PU深度、帧间/帧内模式或某一其它类型的块信息。
根据本发明的额外技术,视频编码器20可使用两个最可能模式确定估计的实际帧内预测模式作为估计的实际帧内预测模式。举例来说,视频编码器20可通过使用到最可能模式中的一者的最短距离(如通过顺序模式次序来测量)计算帧内预测模式的差。可基于经排序距离指派码字,其中较短码字通常用于较小距离。使用此类技术,若干模式可能具有相同距离。因此,本发明描述用于在具有相同距离的模式之间进行区分的技术。举例来说,所述技术可基于优选最可能模式、优选预测方向,及/或相邻块信息。在此上下文中,“优选”是指视频编码器为用信号通知帧内预测模式的目的而选择特定最可能模式或特定预测方向时的优选,且未必等于提供最佳译码性能的最可能模式或预测方向。
作为一实例,假设最可能模式0为相对于最可能模式1的优选模式,最可能模式与实际模式之间的距离可如下排序:MPM0_+1、MPM0_-1、MPM1_+1、MPM1_-1、MPM0_+2、MPM0_-2、MPM1_+2、MPM1_-2等,其中MPM0对应于第一最可能模式且MPM1对应于第二最可能模式。MPM0_+1表示从第一最可能模式+1(基于顺序模式次序)的距离,且MPM_-1表示从第一最可能模式-1的距离。或者,经排序距离可为MPM0_-1、MPM0_+1、MPM1_-1、MPM1_+1、MPM0_-2、MPM0_+2、MPM1_-2、MPM1_+2,等。这些排序次序仅表示许多可能排序次序中的两者。这些排序次序大体对应于指派给从最小码字到最长码字的每一距离的码字的长度。因而,对于上文展示的第一排序次序,MPM0_+1可具有最短码字,而MPM1_-2具有较长码字。在上文展示的第二排序次序中,MPM0_1可具有最短码字。
在例如使用帧内预测或帧间预测来预测当前块之后,视频编码器20可通过从正被译码的原始视频块减去由运动补偿单元44或帧内预测单元46计算的预测数据来形成残余视频块。求和器50表示可执行此减法运算的组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换等变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行其它变换,例如通过H.264标准定义的变换,其概念上类似于DCT。还可使用小波变换、整数变换、子带变换或其它类型的变换。在任何情况下,变换处理单元52向残余块应用所述变换,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域,例如频域。量化单元54对残余变换系数进行量化以进一步降低位速率。量化过程可减少与变换系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。
在量化之后,熵译码单元56对经量化的变换系数进行熵译码。举例来说,熵译码单元56可执行内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码技术。在熵译码单元56的熵译码之后,可将经编码视频发射到另一装置,或将所述视频存档用于稍后发射或检索。在上下文自适应二进制算术编码(CABAC)的情况下,上下文可基于相邻块及/或块大小。
在一些情况下,熵译码单元56或视频编码器20的另一单元可经配置以除如上文所描述的熵译码及帧内预测模式的译码之外还执行其它译码功能。举例来说,熵译码单元56可经配置以确定用于块及分区的经译码块模式(CBP)值。而且,在一些情况下,熵译码单元56可对宏块或其分区中的系数执行延行长度译码。明确地说,熵译码单元56可应用Z形扫描或其它扫描图案来扫描宏块或分区中的变换系数且编码成串的零以用于进一步压缩。熵译码单元56还可用适当语法元素建构标头信息以用于在经编码视频位流中发射。
逆量化单元58及逆变换处理单元60分别应用逆量化及逆变换以在像素域中重建残余块,例如以供稍后用作参考块。运动补偿单元44可通过将残余块相加到参考帧存储器64的帧中的一者的预测性块中来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重建的残余块以计算子整数像素值用于运动估计。求和器62将经重建的残余块相加到由运动补偿单元44产生的运动补偿预测块以产生经重建视频块用于存储在存储器64中。经重构视频块可由运动估计单元42及运动补偿单元44使用作为参考块以对后续视频帧中的块进行帧间译码。
以此方式,视频编码器20表示经配置以进行以下操作的视频解码器的一个实例:对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式;以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。视频编码器20可通过以下操作确定实际帧内预测模式的估计:响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式而选择所述第一最可能模式为所述实际帧内预测模式的所述估计;以及响应于所述第一最可能模式及所述第二最可能模式两者皆为角度预测模式而选择所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测的所述估计。
图5是说明解码经编码视频序列的视频解码器30的实例的框图。在图5的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、存储器82及求和器80。在一些实例中,视频解码器30可执行大体上与关于视频编码器20(图2)描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据。运动补偿单元72可使用在位流中接收的运动向量来识别存储器82中的参考帧中的预测块。帧内预测单元74可使用在位流中接收的帧内预测模式以从空间邻近的块形成预测块。
在本发明中的技术的实例中,熵解码单元70接收表示帧内预测模式的码字以用来解码经编码视频数据块。所述码字可映射到差值,且所述差值可识别估计的实际帧内预测模式与实际帧内预测模式之间的差。帧内预测单元74可例如基于经编码块的左方相邻及上方相邻块的帧内预测模式及/或所述经编码块的大小而确定所述经编码块的上下文。基于所述上下文,帧内预测单元74可确定一或多个最可能帧内预测模式以用来解码所述块。基于所述最可能模式,帧内预测单元74可确定用于所述经编码块的估计的实际帧内预测模式。基于所述估计的实际帧内预测模式及在经编码位流中用信号通知的差值,帧内预测单元74可确定用以编码所述经编码块的实际帧内预测模式。
帧内预测单元74可使用帧内预测模式的指示来帧内预测所述经编码块,例如使用相邻的先前经解码块的像素。对于其中所述块是经帧间预测模式编码的实例,运动补偿单元72可接收定义运动向量的信息以及指示预测方向及参考图片索引的信息以便检索用于所述经编码块的经运动补偿的预测数据。在任何情况下,运动补偿单元72或帧内预测单元74可将定义预测块的信息提供到求和器80。
帧内预测单元74可大体实施如上文参考图2的帧内预测单元46所描述的用于确定最可能模式及估计的实际帧内预测模式的相同技术。举例来说,以类似于上文所描述的方式的方式,帧内预测单元74可基于已经解码的相邻块而确定用于正解码的视频块的最可能模式。在确定最可能模式之后,帧内预测单元74可剖析指示用于正译码块的实际帧内预测模式是否为所述最可能模式中的一者的语法元素。如果实际帧内预测模式不为所述最可能帧内预测模式中的一者,则帧内预测单元74可基于所述最可能模式确定实际模式的估计,且剖析指示实际帧内预测模式与实际帧内预测模式的估计之间的差的语法。举例来说,视频解码器30可在经编码视频位流中接收差信息,且基于所述差信息及实际帧内预测模式的估计而确定用于当前视频块的实际帧内预测模式。
根据本发明的技术,当一个最可能模式为角度预测模式且另一最可能模式为非角度预测模式时,则帧内预测单元74可通过使用所述角度最可能模式作为实际帧内预测模式的估计而确定实际帧内预测模式的估计。
当两个最可能模式都是角度预测模式时,实际模式的估计可为所述最可能模式中的一者。在其中第一最可能模式与第二最可能为相同帧内预测模式的情况下,则帧内预测单元72可使用所述帧内预测模式作为实际帧内预测模式的估计。在其中第一最可能模式及第二最可能模式两者都是角度模式但不为相同模式的情况下,则与使用两个最可能模式的均值或中值作为实际帧内预测模式的估计相对,帧内预测单元72可选择所述两个最可能模式中的一者作为实际模式的估计。
为在第一最可能模式与第二最可能模式为不同角度模式的情况下选择使用哪一最可能模式作为实际帧内预测模式的估计,可使用以下技术中的一或多者。在一个实例中,帧内预测单元72可选择预测角度较接近于垂直角度的最可能模式(例如,图3B及3C中的帧内预测模式0)作为实际帧内预测模式的估计。在另一实例中,帧内预测单元72可选择不在垂直角度与水平角度(例如,图3B及3C中的帧内预测模式1)之间的最可能模式作为实际帧内预测模式的估计。换句话说,如果两个最可能模式中的一者为在帧内预测模式0与帧内预测模式1之间的帧内预测模式,则帧内预测单元72可经配置以选择不在帧内预测模式0与帧内预测模式1之间的最可能帧内预测模式中的一者作为实际帧内预测模式的估计。
在其它实例中,帧内预测单元72可选择最可能模式中的一者作为实际帧内预测模式的估计且用信号通知所述选择。哪一最可能模式为实际模式的估计的信令可例如包含在码字中,使得所述码字识别实际模式的估计及实际模式的估计与实际模式之间的差两者。
在一个实例中,帧内预测单元72可选择具有较小帧内模式数目的最可能模式作为实际帧内预测模式的估计。举例来说,参考图3B,帧内预测模式0可比模式1更优选。或者,可使用顺序模式排序、单独优选排序或某一其它排序。
在一个实例中,帧内预测单元72可选择基于相邻块的信息的最可能模式作为实际帧内预测模式的估计。举例来说,帧内预测单元72可检查左上方块的帧内预测模式,且接着选取较接近于左上方块的帧内预测模式的最可能模式作为实际模式的估计。举例来说,如果上部相邻块及左方相邻块用以确定最可能模式,则左上方块可在此情形中用于选择使用哪一最可能模式作为实际模式的估计。使用图4作为一实例,如果块406及块410的模式用作最可能模式,则块404的帧内预测模式可用以确定块406及块410中的哪一者将用作实际帧内预测模式的估计。
在一个实例中,帧内预测单元72可选择基于最可能模式块信息的最可能模式作为实际帧内预测模式的估计。举例来说,如果一个最可能模式来自上部相邻块且一个最可能模式来自左方相邻块,则帧内预测单元72可选择属于大小与当前块的大小相同或类似的块的最可能模式作为实际模式的估计。举例来说,如果当前正译码的块为16x16块,且两个相邻块分别为4x4及8x8块,则8x8块的模式可选择作为实际帧内预测模式的估计,因为8x8块在大小上较接近于正译码块。除这些准则之外或替代这些准则,还可使用PU深度、帧间/帧内模式或某一其它类型的块信息。举例来说,当在两个最可能模式之间选择时,与PU深度与正译码块相同或最接近的块相关联的最可能模式可选择作为实际帧内预测模式的估计。
根据本发明的额外技术,帧内预测单元72可使用两个最可能模式确定估计的实际帧内预测模式作为估计的实际帧内预测模式。举例来说,帧内预测单元72可通过使用到最可能模式的最短距离计算帧内预测模式的差。可基于经排序距离指派码字,其中较短码字通常用于较小距离。使用此类技术,若干模式可能具有相同距离。因此,本发明描述用于在具有相同距离的模式之间进行区分的技术。举例来说,所述技术可基于优选最可能模式、优选预测方向,及/或相邻块信息。
逆量化单元76将在位流中提供且由熵解码单元70解码的经量化块系数逆量化,即解量化。逆量化过程可包含例如如由H.264解码标准所定义或如由HEVC测试模型所执行的常规过程。所述逆量化过程还可包含使用由编码器20针对每一宏块所计算的量化参数QPY来确定量化的程度,且同样确定应应用的逆量化程度。
逆变换单元58对变换系数应用逆变换,例如逆DCT、逆整数变换或概念地类似的逆变换过程,以便产生像素域中的残余块。运动补偿单元72产生经运动补偿块,有可能基于内插滤波器执行内插。用于将用于以子像素精确度进行运动估计的内插滤波器的识别符可包含在语法元素中。运动补偿单元72可使用由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元72可根据所接收的语法信息而确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
运动补偿单元72使用语法信息中的一些来确定用以编码经编码视频序列的帧的块的大小、描述经编码视频序列的帧或切片的每一块如何分割的分区信息、指示每一分区如何经编码的模式、每一经帧间编码块或分区的一或多个参考帧(及参考帧列表),及用以解码经编码视频序列的其它信息。
求和器80将残余块与由运动补偿单元72或帧内预测单元74产生的对应预测性块求和以形成经解码块。必要时,解块滤波器还可应用于对经解码块进行滤波以便移除成块假影。接着将经解码视频块存储在存储器82中,存储器82提供用于后续运动补偿的参考块且还产生经解码视频用于呈现在显示装置(例如图1的显示装置32)上。
以此方式,视频解码器30表示经配置以进行以下操作的视频解码器的一个实例:对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式;以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计。视频解码器30可通过以下操作确定实际帧内预测模式的估计:响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式而选择所述第一最可能模式为所述实际帧内预测模式的所述估计;以及响应于所述第一最可能模式及所述第二最可能模式两者皆为角度预测模式而选择所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测的所述估计。
图6是描绘根据本发明的技术的用信号通知帧内预测模式的实例方法的流程图。将参考通用视频译码器解释图6的技术,所述通用视频译码器可为视频编码器或视频解码器,例如视频编码器20及视频解码器30。
视频译码器可对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式(602)。所述第一及第二最可能帧内预测模式可例如选择作为指派给邻近于待译码当前块的上部相邻块的帧内预测模式及指派给邻近于待译码当前块的左方相邻块的模式。如果第一最可能模式及第二最可能模式中的一者为角度模式且一者为非角度模式(604,是),则视频译码器可选择为角度模式的最可能模式作为当前视频块的实际帧内预测模式的估计(606)。如果第一最可能模式与第二最可能模式两者皆为角度模式(604,否)且相同(608,是),则视频译码器可选择所述模式作为实际帧内预测模式的估计(610)。如果第一最可能模式及第二最可能模式两者皆为角度模式(604,否)但不相同(608,否),则视频译码器可选择第一最可能模式及第二最可能模式中的一者作为实际帧内预测的估计(612)。在此情况下,视频译码器可使用上文所描述的技术中的一或多者来选择第一最可能模式与第二最可能模式中的哪一者用作实际帧内预测模式的估计。
在图6的视频译码器为视频编码器的情况下,则视频译码器可确定实际帧内预测模式的所确定估计与用以译码视频数据块的实际帧内预测模式之间的差,且将所述差的指示包含在经编码视频数据的位流中。在图6的视频译码器为视频解码器的情况下,视频译码器可在经编码视频数据的位流中接收实际帧内预测模式的估计与实际帧内预测模式之间的差的指示,且使用所述差信息及实际帧内预测模式的所确定估计来确定用以译码视频数据块的实际帧内预测模式。
参考图6描述的视频译码器还可确定两个以上最可能帧内预测模式,但出于此实例的目的,实际帧内预测模式的估计可选择为第一最可能帧内预测模式及第二最帧内预测可能模式中的一者。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果用软件实施,则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的任何媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)有形计算机可读存储媒体,其是非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或任何其它可用来存储指令或数据结构的形式的所需程序代码且可由计算机存取的媒体。而且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文所述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或并入在组合式编解码器中。而且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。确切地说,如上文所描述,各种单元可配合合适的软件及/或固件组合在编解码器硬件单元中,或通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。
Claims (32)
1.一种用于译码视频数据的方法,所述方法包括:
对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;
基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计,其中确定所述实际帧内预测模式的所述估计包括:
响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;
响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
2.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计包括:
确定所述第一最可能模式及所述第二最可能中的哪一者为角度较接近于垂直角度的最可能模式;以及,
选择所述角度较接近于所述垂直角度的所述最可能模式作为所述实际帧内预测模式的所述估计。
3.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所述第二最可能模式中的不在垂直角度与水平角度之间的那一者。
4.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计包括用信号通知所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测模式的所述估计。
5.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所述第二最可能模式中的具有较小帧内模式数目的那一者作为所述实际帧内预测模式的所述估计。
6.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计是至少部分基于一或多个相邻的信息块。
7.根据权利要求1所述的方法,其中选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所述第二最可能模式中的与在大小上较接近于所述当前视频块的视频数据块相关联的那一者。
8.根据权利要求1所述的方法,其中所述方法由视频解码器执行,且所述方法进一步包括:
接收差信息;以及
基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块的实际帧内预测模式。
9.根据权利要求8所述的方法,其进一步包括:
使用所述实际帧内预测模式产生经重建视频块。
10.根据权利要求1所述的方法,其中所述方法由视频编码器执行,且所述方法进一步包括:
在经编码位流中用信号通知差信息,其中所述差信息识别用于所述当前块的实际帧内预测模式与所述实际帧内预测模式的所述估计之间的差。
11.一种用于译码视频数据的装置,所述装置包括:
视频译码器,其经配置以:
对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;
基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计,其中确定所述实际帧内预测模式的所述估计包括:
响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;
响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
12.根据权利要求11所述的装置,其中所述视频译码器经配置以通过确定所述第一最可能模式及所述第二最可能中的哪一者为角度较接近于垂直角度的最可能模式及选择所述角度较接近于所述垂直角度的所述最可能模式作为所述实际帧内预测模式的所述估计而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
13.根据权利要求11所述的装置,其中所述视频译码器经配置以通过选择所述第一最可能模式及所述第二最可能模式中的哪一者不在垂直角度与水平角度之间而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
14.根据权利要求11所述的装置,其中所述视频译码器经配置以通过用信号通知所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测模式的所述估计而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
15.根据权利要求11所述的装置,其中所述视频译码器经配置以通过选择所述第一最可能模式及所述第二最可能模式中的具有较小帧内模式数目的那一者作为所述实际帧内预测模式的所述估计而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
16.根据权利要求11所述的装置,其中所述视频译码器经配置以至少部分基于一或多个相邻的信息块选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
17.根据权利要求11所述的装置,其中所述视频译码器经配置以通过选择所述第一最可能模式及所述第二最可能模式中的与在大小上较接近于所述当前视频块的视频数据块相关联的那一者而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
18.根据权利要求11所述的装置,其中所述视频译码器为视频解码器,且其中所述视频译码器进一步经配置以:
接收差信息;以及
基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块的实际帧内预测模式。
19.根据权利要求18所述的装置,其中所述视频译码器进一步经配置以:
使用所述实际帧内预测模式产生经重建视频块。
20.根据权利要求18所述的装置,其中所述视频译码器包括视频编码器,且其中所述视频译码器进一步经配置以:
在经编码位流中用信号通知差信息,其中所述差信息识别用于所述当前块的实际帧内预测模式与所述实际帧内预测模式的所述估计之间的差。
21.根据权利要求11所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;以及,
无线通信装置,其包含所述视频译码器。
22.一种用于译码视频数据的设备,所述设备包括:
用于对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式的装置;
用于基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式确定用以译码所述当前视频块的实际帧内预测模式的估计的装置,其中所述用于确定所述实际帧内预测模式的所述估计的装置包括:
用于响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式而选择所述第一最可能模式作为所述实际帧内预测模式的所述估计的装置;
用于响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式而选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计的装置。
23.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括:
用于确定所述第一最可能模式及所述第二最可能中的哪一者为角度较接近于垂直角度的最可能模式的装置;以及,
用于选择所述角度较接近于所述垂直角度的所述最可能模式作为所述实际帧内预测模式的所述估计的装置。
24.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所述第一最可能模式及所述第二最可能模式中的不在垂直角度与水平角度之间的那一者的装置。
25.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于用信号通知所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测模式的所述估计的装置。
26.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所述第一最可能模式及所述第二最可能模式中的具有较小帧内模式数目的那一者作为所述实际帧内预测模式的所述估计的装置。
27.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置至少部分基于一或多个相邻的信息块选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计。
28.根据权利要求22所述的设备,其中所述用于选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所述第一最可能模式及所述第二最可能模式中的与在大小上较接近于所述当前视频块的视频数据块相关联的那一者的装置。
29.根据权利要求22所述的设备,其中所述设备包括视频解码器,且其中所述设备进一步包括:
用于接收差信息的装置;以及
用于基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块的实际帧内预测模式的装置。
30.根据权利要求29所述的设备,其进一步包括:
用于使用所述实际帧内预测模式产生经重建视频块的装置。
31.根据权利要求22所述的设备,其中所述设备包括视频编码器,且其中所述设备进一步包括:
用于在经编码位流中用信号通知差信息的装置,其中所述差信息识别用于所述当前块的实际帧内预测模式与所述实际帧内预测模式的所述估计之间的差。
32.一种存储指令的计算机可读存储媒体,所述指令可操作以致使一或多个处理器:
对于当前视频块,确定第一最可能帧内预测模式及第二最可能帧内预测模式;
基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式,确定用以译码所述当前视频块的实际帧内预测模式的估计,其中所述指令致使所述一或多个处理器通过以下操作确定所述实际帧内预测模式的所述估计:
响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预测模式,选择所述第一最可能模式作为所述实际帧内预测模式的所述估计;
响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式,选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161561803P | 2011-11-18 | 2011-11-18 | |
US201161561819P | 2011-11-18 | 2011-11-18 | |
US61/561,803 | 2011-11-18 | ||
US61/561,819 | 2011-11-18 | ||
US13/678,334 | 2012-11-15 | ||
US13/678,334 US9628789B2 (en) | 2011-11-18 | 2012-11-15 | Reference mode selection in intra mode coding |
PCT/US2012/065532 WO2013074935A1 (en) | 2011-11-18 | 2012-11-16 | Reference mode selection in intra mode coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103947205A true CN103947205A (zh) | 2014-07-23 |
CN103947205B CN103947205B (zh) | 2017-09-22 |
Family
ID=48426919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280056960.9A Active CN103947205B (zh) | 2011-11-18 | 2012-11-16 | 帧内模式译码中的参考模式选择 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9628789B2 (zh) |
EP (1) | EP2781094B1 (zh) |
JP (1) | JP5866453B2 (zh) |
KR (1) | KR101632130B1 (zh) |
CN (1) | CN103947205B (zh) |
WO (1) | WO2013074935A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109792520A (zh) * | 2016-09-30 | 2019-05-21 | 交互数字Vc控股公司 | 用于利用自适应帧内最可能模式的全向视频译码的方法和装置 |
CN111373750A (zh) * | 2017-10-24 | 2020-07-03 | 韦勒斯标准与技术协会公司 | 视频信号处理方法和装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101507344B1 (ko) * | 2009-08-21 | 2015-03-31 | 에스케이 텔레콤주식회사 | 가변 길이 부호를 이용한 인트라 예측모드 부호화 방법과 장치, 및 이를 위한기록 매체 |
WO2014190468A1 (en) | 2013-05-27 | 2014-12-04 | Microsoft Corporation | Video encoder for images |
EP3120556B1 (en) | 2014-03-17 | 2021-01-13 | Microsoft Technology Licensing, LLC | Encoder-side decisions for screen content encoding |
CN106416254B (zh) | 2015-02-06 | 2019-08-02 | 微软技术许可有限责任公司 | 在媒体编码期间跳过评估阶段 |
US10038917B2 (en) * | 2015-06-12 | 2018-07-31 | Microsoft Technology Licensing, Llc | Search strategies for intra-picture prediction modes |
US10136132B2 (en) | 2015-07-21 | 2018-11-20 | Microsoft Technology Licensing, Llc | Adaptive skip or zero block detection combined with transform size decision |
EP3442232A4 (en) | 2016-04-06 | 2019-12-04 | KT Corporation | METHOD AND APPARATUS FOR PROCESSING VIDEO SIGNAL |
US10721489B2 (en) * | 2016-09-06 | 2020-07-21 | Qualcomm Incorporated | Geometry-based priority for the construction of candidate lists |
WO2018066863A1 (ko) * | 2016-10-04 | 2018-04-12 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
US10694202B2 (en) * | 2016-12-01 | 2020-06-23 | Qualcomm Incorporated | Indication of bilateral filter usage in video coding |
EP3399754A1 (en) * | 2017-05-04 | 2018-11-07 | Thomson Licensing | Method and apparatus for most probable mode (mpm) reordering for intra prediction |
WO2019023200A1 (en) * | 2017-07-24 | 2019-01-31 | Arris Enterprises Llc | INTRA-MODE JVET CODING |
WO2020002641A1 (en) | 2018-06-29 | 2020-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Extended reference intra-picture prediction |
KR20210027486A (ko) * | 2018-08-27 | 2021-03-10 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인트라 예측 방법 및 장치 |
US11405638B2 (en) * | 2019-03-17 | 2022-08-02 | Tencent America LLC | Method and apparatus for video coding by determining intra prediction direction based on coded information of neighboring blocks |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070036215A1 (en) * | 2003-03-03 | 2007-02-15 | Feng Pan | Fast mode decision algorithm for intra prediction for advanced video coding |
EP1796395A2 (en) * | 2005-12-12 | 2007-06-13 | Samsung Electronics Co., Ltd. | Method and device for intra prediction coding and decoding of images |
CN101087424A (zh) * | 2002-05-28 | 2007-12-12 | 夏普株式会社 | 图像内预测模式估计、通信和组织的方法和系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI103003B1 (fi) * | 1997-06-13 | 1999-03-31 | Nokia Mobile Phones Ltd | Suodatusmenetelmä, suodatin ja matkaviestinpääte |
JP2001027986A (ja) * | 1999-05-10 | 2001-01-30 | Canon Inc | データ処理装置及び処理部選択方法 |
US7386048B2 (en) | 2002-05-28 | 2008-06-10 | Sharp Laboratories Of America, Inc. | Methods and systems for image intra-prediction mode organization |
US7289674B2 (en) * | 2002-06-11 | 2007-10-30 | Nokia Corporation | Spatial prediction based intra coding |
EP1995967A4 (en) * | 2006-03-16 | 2009-11-11 | Huawei Tech Co Ltd | METHOD AND APPARATUS FOR ADAPTIVE QUANTIFICATION IN AN ENCODING PROCEDURE |
CN107105257B (zh) * | 2007-06-29 | 2020-08-28 | 威勒斯媒体国际有限公司 | 图像编码装置、图像编码方法、图像译码装置、图像译码方法 |
US8879637B2 (en) | 2008-10-06 | 2014-11-04 | Lg Electronics Inc. | Method and an apparatus for processing a video signal by which coding efficiency of a video signal can be raised by using a mixed prediction mode in predicting different macroblock sizes |
US8611435B2 (en) * | 2008-12-22 | 2013-12-17 | Qualcomm, Incorporated | Combined scheme for interpolation filtering, in-loop filtering and post-loop filtering in video coding |
US9288494B2 (en) | 2009-02-06 | 2016-03-15 | Thomson Licensing | Methods and apparatus for implicit and semi-implicit intra mode signaling for video encoders and decoders |
WO2011031332A1 (en) | 2009-09-14 | 2011-03-17 | Thomson Licensing | Methods and apparatus for efficient video encoding and decoding of intra prediction mode |
KR101772459B1 (ko) | 2010-05-17 | 2017-08-30 | 엘지전자 주식회사 | 신규한 인트라 예측 모드 |
US20110317757A1 (en) | 2010-06-25 | 2011-12-29 | Qualcomm Incorporated | Intra prediction mode signaling for finer spatial prediction directions |
US9025661B2 (en) | 2010-10-01 | 2015-05-05 | Qualcomm Incorporated | Indicating intra-prediction mode selection for video coding |
-
2012
- 2012-11-15 US US13/678,334 patent/US9628789B2/en not_active Expired - Fee Related
- 2012-11-16 EP EP12795961.7A patent/EP2781094B1/en active Active
- 2012-11-16 WO PCT/US2012/065532 patent/WO2013074935A1/en active Application Filing
- 2012-11-16 JP JP2014542495A patent/JP5866453B2/ja not_active Expired - Fee Related
- 2012-11-16 CN CN201280056960.9A patent/CN103947205B/zh active Active
- 2012-11-16 KR KR1020147016425A patent/KR101632130B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101087424A (zh) * | 2002-05-28 | 2007-12-12 | 夏普株式会社 | 图像内预测模式估计、通信和组织的方法和系统 |
US20070036215A1 (en) * | 2003-03-03 | 2007-02-15 | Feng Pan | Fast mode decision algorithm for intra prediction for advanced video coding |
EP1796395A2 (en) * | 2005-12-12 | 2007-06-13 | Samsung Electronics Co., Ltd. | Method and device for intra prediction coding and decoding of images |
Non-Patent Citations (2)
Title |
---|
JINHO LEE ET AL: "Intra-Mixture Prediction Mode and Enhanced Most Probable Mode Estimation for Intra Coding in H.264/AVC", 《2009 FIFTH INTERNATIONAL JOINT CONFERENCE ON INC,IMS AND IDC》 * |
ROBERT COHEN 等: "Non-CE6: Coding of luma intra prediction modes that are not in the MPM set", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109792520A (zh) * | 2016-09-30 | 2019-05-21 | 交互数字Vc控股公司 | 用于利用自适应帧内最可能模式的全向视频译码的方法和装置 |
CN109792520B (zh) * | 2016-09-30 | 2023-06-06 | 交互数字麦迪逊专利控股公司 | 用于利用自适应帧内最可能模式的全向视频译码的方法和装置 |
CN111373750A (zh) * | 2017-10-24 | 2020-07-03 | 韦勒斯标准与技术协会公司 | 视频信号处理方法和装置 |
US11743495B2 (en) | 2017-10-24 | 2023-08-29 | Samsung Electronics Co., Ltd. | Video signal processing method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
EP2781094A1 (en) | 2014-09-24 |
US9628789B2 (en) | 2017-04-18 |
KR101632130B1 (ko) | 2016-06-20 |
JP5866453B2 (ja) | 2016-02-17 |
US20130128964A1 (en) | 2013-05-23 |
EP2781094B1 (en) | 2018-07-11 |
JP2015502093A (ja) | 2015-01-19 |
KR20140092405A (ko) | 2014-07-23 |
CN103947205B (zh) | 2017-09-22 |
WO2013074935A1 (en) | 2013-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103947205A (zh) | 帧内模式译码中的参考模式选择 | |
CN103891279B (zh) | 用于帧内预测译码的最大概率变换 | |
CN103299621B (zh) | 用于视频译码中的一般化p/b帧的参考图片列表构造 | |
CN103931182B (zh) | 帧内预测视频译码中的非正方形变换 | |
CN103026709B (zh) | 用于视频译码的帧间预测模式和参考图片列表索引的译码 | |
CN104221378B (zh) | 在视频译码中用于量化矩阵的均匀粒度 | |
CN104756499B (zh) | 用于视频译码的方法、设备及计算机可读存储媒体 | |
CN104272742B (zh) | 加权预测参数译码 | |
CN104604224B (zh) | 可缩放视频译码中的变换基底调整 | |
CN104429072B (zh) | 自适应差域空间和时间参考重构及平滑 | |
CN103141100A (zh) | 用于视频译码的帧内平滑滤波器 | |
CN103140877A (zh) | 使用帧内预测的视频译码 | |
CN103202016A (zh) | 用于视频译码的自适应运动向量分辨率信令 | |
CN103597832A (zh) | 用于使用相邻模式的视频译码的增强的帧内预测模式信令 | |
CN103181169A (zh) | 使用联合上下文模型对系数进行熵译码 | |
CN104221380A (zh) | 用于并行运动估计的共同空间候选块 | |
CN105075259A (zh) | 用于视频译码预测的存储器减少 | |
CN103262533A (zh) | 指示用于视频译码的帧内预测模式选择 | |
CN104737537A (zh) | 用于可缩放视频译码的加权预测模式 | |
CN103797801A (zh) | 视频译码中的非正方形变换单元和预测单元 | |
CN104704843A (zh) | 视频性质的指示 | |
CN103999465A (zh) | 自适应性重叠块运动补偿 | |
CN104205829A (zh) | 合并信令及环路滤波器开/关信令 | |
CN104247420A (zh) | 转换系数译码 | |
CN104221374A (zh) | 在视频译码中分群经旁路译码语法元素 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |