CN103947207A - 用于图片分割方案的统一设计 - Google Patents
用于图片分割方案的统一设计 Download PDFInfo
- Publication number
- CN103947207A CN103947207A CN201280053106.7A CN201280053106A CN103947207A CN 103947207 A CN103947207 A CN 103947207A CN 201280053106 A CN201280053106 A CN 201280053106A CN 103947207 A CN103947207 A CN 103947207A
- Authority
- CN
- China
- Prior art keywords
- syntactic element
- decoding
- section
- picture
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013461 design Methods 0.000 title description 5
- 238000000638 solvent extraction Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 58
- 238000004891 communication Methods 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 54
- 238000006243 chemical reaction Methods 0.000 description 31
- 230000008569 process Effects 0.000 description 30
- 238000013139 quantization Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 12
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 8
- 210000003484 anatomy Anatomy 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000003825 pressing Methods 0.000 description 4
- 230000008054 signal transmission Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000010304 firing Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Forging (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
一种视频译码器可控制跨越图片内的切片边界的图片内预测。在一个实例中,第一语法元素可控制是否进行针对图片的切片的跨越切片边界的图片内预测。如果针对图片而启用跨越切片边界的图片内预测,那么第二语法元素可针对个别切片而控制是否针对所述切片启用跨越切片边界的图片内预测。
Description
本申请案主张2011年10月26日申请的第61/551,862号美国临时申请案的权利,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
可将数字视频能力并入于广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及其类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)界定的标准和此类标准的扩展中所描述的那些视频压缩技术,以更有效地发射和接收数字视频信息。
视频压缩技术执行空间预测和/或时间预测以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,可将视频帧或切片分割为若干视频块。可对每一视频块进行进一步分割。使用相对于邻近视频块的空间预测来对经帧内译码(I)的帧或切片中的视频块进行编码。经帧间译码(P或B)的帧或切片中的视频块可使用相对于同一帧或切片中的邻近宏块的空间预测或相对于其它参考帧的时间预测。
发明内容
本发明描述一种用于控制跨越图片内的切片边界的图片内预测的技术。在一个实例中,第一语法元素可控制是否进行针对图片的切片的跨越切片边界的图片内预测。如果针对图片而启用跨越切片边界的图片内预测,那么第二语法元素可针对个别切片而控制是否针对所述切片启用跨越切片边界的图片内预测。
在一个实例中,一种译码视频数据的方法包含:译码第一图片的第一语法元素,其中第一语法元素的第一值指示针对第一图片的切片允许跨越切片的图片内预测;和,基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。
在另一实例中,一种用于译码视频数据的装置包含:视频译码器,其经配置以:译码第一图片的第一语法元素的第一实例,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。
在另一实例中,一种用于译码视频数据的装置包含:用于译码第一图片的第一语法元素的装置,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和用于基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元的装置。
在另一实例中,一种计算机可读存储媒体存储指令,所述指令在执行时致使一或多个处理器进行以下动作:译码第一图片的第一语法元素,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和,基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。
在附图和以下描述中陈述一或多个实例的细节。其它特征、目标和优势将从描述和附图和从权利要求书中显而易见。
附图说明
图1为说明可利用本发明中描述的技术的实例视频编码和解码系统的框图。
图2A和2B为说明应用到最大译码单元(LCU)的四分树分割的实例的概念图。
图3为说明在将图片分割为多个瓦片时的实例译码次序的概念图。
图4为说明波前平行处理的概念图。
图5为说明可实施本发明中描述的技术的视频编码器的实例的框图。
图6为说明视频解码器的实例的框图,视频解码器对经编码的视频序列解码。
图7为描绘根据本发明中描述的技术的实例方法的流程图。
图8为描绘根据本发明中描述的技术的实例方法的流程图。
具体实施方式
为了解码经预测图片,视频解码器顺序地解码所述图片的若干部分或平行地解码所述图片的多个部分。可存在至少四个不同的图片分割方案来创建所述图片的若干部分。这些分割方案包含切片、熵切片、瓦片和波前平行处理(WPP)。每一分割方案可提供特定优点和缺点,使得一些分割方案可较为一些译码情况所需要,而其它分割方案可较为其它译码情况所需要。在一些实例中,可一起使用不同分割方案中的两者或两者以上。
对图片进行解码常常涉及图片内预测。图片内预测一般意味解码图片的一个译码单元(CU)依赖于与同一图片的第二CU相关的至少一条信息。图片内预测可包含帧内预测,其中基于同一图片中的另一CU来预测CU。然而,图片内预测还可包含帧间预测,其中基于不同图片的第二CU来预测第一图片的第一CU。即使第一CU和第二CU来自不同的图片,但第一CU仍可依赖于第一图片中另一CU的信息。作为一个实例,可使用运动向量预测值来译码第一CU,所述运动向量预测值是基于第一图片中的另一CU的运动向量来确定的。
本发明还将论述允许跨越切片边界、跨越瓦片边界或跨越其它此类边界的图片内预测的概念。一般而言,当使用基于第二切片(其为与第一切片相同的图片的部分)的CU而确定的某条信息来预测第一切片的CU时,发生跨越切片边界的图片内预测。类似地,当使用基于第二瓦片(其为与第一瓦片相同的图片的部分)的CU而确定的某条信息来预测第一瓦片的CU时,发生跨越瓦片边界的图片内预测。如上文所论述,跨越切片边界或跨越瓦片边界的图片内预测可指帧内预测或帧间预测。
按照惯例,切片与解码单元无关,所述解码单元为图片的部分且包含多个CU。切片内的CU中的每一者可按光栅扫描次序(例如,从右到左和从上到下)来经解码。按照惯例,并未跨越切片边界来预测切片内的CU。然而,如下文将更详细论述,本发明引入独立切片,其中可跨越切片边界来预测切片的CU。
熵切片可类似于切片。然而,可跨越切片边界来预测熵切片内的CU。按照惯例,熵切片还在其切片标头结构方面与规则切片不同。熵切片可使用存在于规则切片标头中的字段的子集,同时从按解码次序在熵切片之前的主要切片标头继承遗漏的字段。为指示熵切片应从主要切片标头继承遗漏的字段,可使用在本发明中称作lightweight_slice_flag的语法元素。举例来说,当将此语法元素设定为等于1时,熵切片从主要切片标头继承遗漏的字段。
可将瓦片视为图片内的矩形区域,但瓦片还可假定其它形状。切片可跨越瓦片边界,或可将切片局限于仅存在于瓦片内。为解码瓦片,视频解码器可改变其解码CU的次序,使得视频解码器按光栅扫描次序来解码瓦片内的CU。每一瓦片可包含多个切片。在一些实例中,一个切片跨越瓦片边界是可能的,在此情况下切片可存在于多个瓦片中。此外,如果两个或两个以上瓦片经独立译码,那么可平行处理两个或两个以上瓦片。如果解码一个瓦片并不依赖于第二瓦片中所含的任何信息,那么可将两瓦片视为经独立译码。
WPP为可借以将图片划分为“若干波”或“若干波前”的技术,所述“波”或“波前”为图片内若干行CU的集合。图片可具有R行CU且可经分割为N个波或波前,使得,对于每一值X(0<=X<=N),具有R%N==X的波属于同一集合(其中,“%”对应于模数运算符)。以此方式,视频解码器可平行解码图片的波集合中的每一者。举例来说,可将图片划分为若干行,且可按交错方式来用波前值识别若干行中的每一者。举例来说,可分别将第一到第三行识别为波前值0到2。接着将第四行识别为波前值0,将第五行识别为波前值1,将第六行识别为波前值2,诸如此类。
切片标头可将对应切片的入口点用信号发送为波前或瓦片。举例来说,切片标头可包含指示切片进入所述切片跨越的任何瓦片之处的地址。作为另一实例,切片标头可包含切片跨越的波前的地址。切片和熵切片可经囊封于其自身的相应网络抽象层(NAL)单元内。因为切片和熵切片囊封于其自身的相应NAL单元内,所以视频编码器可不需要在所有情况下均用信号发送切片或熵切片的入口点。因此,如下文更详细描述,根据本发明的技术,当切片或熵切片不跨越瓦片或波边界时,可移除入口点的信令,此可导致位节省。
当前,这些分割方案中的每一者要求视频编码器不同地用信号发送信息,使得视频解码器知道在图片的视频编码器侧使用的特定分割方案。如本发明中使用,图片一般指包含切片、熵切片、瓦片或波、或切片、熵切片、瓦片和/或波的某一组合的视频单元。尽管一般将图片视为对应于视频数据的一个全帧,但在一些实例中,图片包含少于全帧的视频数据。当本发明指图片时,可假定图片的CU全部对应于共同时间实例。
本发明的技术可涉及可统一用信号发送这些不同分割方案的信息的方式中的至少一些的技术或语法。举例来说,本发明的技术可采用瓦片与波之间的类似性来提供此类统一。应注意,这些技术可未必完全统一视频编码器用信号发送这些不同分割方案的信息的方式。然而,即使某程度的统一可导致视频编码器需要用信号发送的位的数目的减少,且可导致视频编码器和视频解码器的复杂性的降低。
除了统一之外,本发明的技术可在解码使用这些分割方案而预测的图片时处理潜在的限制。举例来说,对于当前熵切片,如果母切片(即,熵切片从其继承未用信号发送的字段的切片)丢失,或另一熵切片(针对其允许跨越两熵切片的图片内预测)丢失,那么当前熵切片变得无用,这是因为不存在足够的信息来解码熵切片。作为另一实例,分别用信号发送的瓦片和WPP可囊封于不同切片中,且这些不同切片中的每一者可包含完整的切片标头。针对每个瓦片和WPP的完整切片标头的此类信令可为带宽的不必要消耗,这是因为发射切片标头一次可为足够的。可存在例如依赖于切片类型的CABAC初始化参数等其它缺陷,其中切片类型可在熵切片需要继承切片类型的情况下不可用,因此使得难以剖析此类熵切片的切片标头。此外,在当前切片标头信令中,将切片的开始地址埋于切片标头中,然而,可需要对开始地址的方便接入以供视频解码器检测新的经译码图片的开始。
在本发明的技术中,用于瓦片的序列参数集(SPS)和图片参数集(PPS)语法元素可与WD8中所陈述的当前技术相同。对于WPP,可将语法元素entropy_coding_synchro改变为包含在PPS语法元素中的1位旗标。当entropy_coding_synchro的值为0时,不调用用于上下文变量的特定同步过程。然而,如果entropy_coding_synchro的值为1,那么可调用用于上下文变量的特定同步过程。举例来说,可使一个波前子流与上方行中的第二最大译码单元(LCU)的末端同步。下文描述此同步的实例。
除了WPP和瓦片PPS语法元素的改变之外,本发明还描述“short_slice_header_enabled_flag”语法元素和“dependent_slice_enabled_flag”语法元素,所述两者可为PPS语法的部分。如下文将关于表2和表3而说明,PPS中的short_slice_header_enabled_flag可指示切片标头中“slice_id”语法元素和“short_slice_header_flag”语法元素的存在。如下文还将关于表2和表3而说明,PPS中的“dependent_slice_enabled_flag”语法元素可指示切片标头中“slice_boundary_independence_flag”语法元素的存在。大体而言,本发明中描述的技术改变切片标头语法以支持较短切片标头,并指示允许或不允许用于解码的跨越切片的图片内预测的能力。
“short_slicc_headcr_flag”语法元素指示切片应从另一切片或可能从PPS或SPS继承遗漏的字段。可使用“short_slice_header_flag”语法元素,不管此语法元素所指的切片为矩形切片还是熵切片。如上文所论述,切片或熵切片可形成瓦片或波的部分或包含瓦片或波的全部或部分。
当切片的short_slice_header_flag为真(例如,具有值1)时,视频解码器确定此切片包含短切片标头,且此短切片标头的所有遗漏的字段应从全切片标头或从SPS或PPS或其任何组合继承。全切片标头可为按解码次序在当前切片之前的最近全切片标头。
根据本发明的技术,全切片标头和短切片标头可为可独立剖析的。换句话说,短切片标头可包含足够的语法元素以允许视频解码器继承标头的遗漏字段。举例来说,短切片标头可包含切片开始地址,且还包含切片ID、short_slice_header_flag、slice_boundary_independence_flag、CABAC初始化参数和切片量化参数(QP)。slice_boundary_independence_flag可为引入到切片标头中的新旗标,其用以用信号发送用于解码的跨越切片的图片内预测是允许(当值为0时)还是不允许(当值为1时)。在一些实例中,切片开始地址可在短切片标头的开始处,而非被埋于标头中。所有其它切片标头语法元素可仅存在于全切片标头中。
本发明的技术进一步描述tile_boundary_independence_idc语法元素。当此语法元素等于1时,视频解码器辨识所有瓦片为可独立解码的。换句话说,为解码一个瓦片,视频解码器不需要依赖于解码任何其它瓦片。如上文所指示,一个瓦片可包含多个切片。当tile_boundary_independence_idc语法元素为1时,其意味瓦片内没有切片可从瓦片外部的任何切片预测。而且,在一些实例中,使一个切片包含一个以上瓦片是可能的。当tile_boundary_independence_idc语法元素为1时,其意味瓦片内没有切片延伸超出瓦片的边界。此外,当tile_boundary_independence_idc语法元素为1时,视频解码器可配置其自身以平行解码所述瓦片,这是因为每一瓦片是可独立解码的。
通过此设计,规则切片(即,母切片)、短切片(具有短切片标头的切片)、熵切片、波前和瓦片可彼此协调支持。在此框架中,瓦片仅确定LCU解码次序。当需要可独立解码的瓦片时,将所述瓦片中的每一者嵌入于可独立解码的切片中。同样地,将每一WPP波囊封于可独立解码的切片内。在此情况下,不需要用于瓦片或WPP波的入口点的信令,这是因为切片不跨越波或瓦片边界。仅通过由将slice_boundary_independence_flag设定为等于0而允许用于解码操作的图片内预测来支持熵切片。
根据本发明的技术,波前子流基于其开始LCU地址来排序,使得波前子流处于其中未使用平行解码的解码器可解码位流的次序中。换句话说,LCU位流次序是按照LCU图片扫描次序(LCU光栅扫描),其保留了位流因果关系。
除了统一不同的图片分割方案之外,本发明还可改进上文提及的其它问题。举例来说,根据本发明的技术,在切片标头中,切片开始地址向前移动。对于另一实例,CABAC初始化参数(cabac_init_idc)的存在不再取决于slice_type,slice_type不存在于短切片标头中,且因此短切片标头自身可被剖析。
图1为说明可利用用于表示视频数据块的帧内预测模式的译码语法数据的技术的实例视频编码与解码系统10的框图。如图1中所示,系统10包含源装置12,源装置12经由通信信道16将经编码视频发射到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一者。在一些情况下,源装置12和目的地装置14可包括无线通信装置,例如无线手机、所谓的蜂窝式或卫星无线电电话,或可在通信信道16上(在此情况下,通信信道16为无线的)传送视频信息的任何无线装置。
然而,本发明的技术(其涉及表示视频数据块的帧内预测模式的语法数据的译码)未必限于无线应用或设定。举例来说,这些技术可适用于空中电视广播、有线电视发射、卫星电视发射、因特网视频发射、经编码到存储媒体上的经编码的数字视频,或其它情况。因此,通信信道16可包括适合于发射经编码的视频数据的无线媒体或有线媒体的任何组合。此外,通信信道16既定表示许多方式中的仅一个方式,视频编码装置可按此方式来将数据发射到视频解码装置。举例来说,在系统10的其它配置中,源装置12可产生用于由目的地装置14解码的经编码视频,且将经编码视频存储在存储媒体或文件服务器上,使得经编码视频可根据需要而由目的地装置14存取。
在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调器(调制解调器)22和发射器24。目的地装置14包含接收器26、调制解调器28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于表示视频数据块的帧内预测模式的译码语法数据的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部摄像机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成显示装置。
图1的所说明系统10仅为一个实例。可通过任何数字视频编码和/或解码装置来执行用于表示视频数据块的帧内预测模式的译码语法数据的技术。虽然一般通过视频编码装置来执行本发明的技术,但还可通过视频编码器/解码器(通常被称为“编码解码器(CODEC)”)来执行所述技术。此外,还可通过视频预处理器来执行本发明的技术。源装置12和目的地装置14仅为此类译码装置的实例,其中源装置12产生用于发射到目的地装置14的经译码视频数据。在一些实例中,装置12、14可以实质上对称的方式操作以使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,例如用于视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置(例如,视频摄像机)、含有先前俘获的视频的视频存档、和/或来自视频内容提供者的视频馈送。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频、或直播视频(live video)、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18为视频摄像机,那么源装置12和目的地装置14可形成所谓的摄像机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可适用于无线和/或有线应用。在每一情况下,可由视频编码器20来编码经俘获的、经预先俘获的或计算机产生的视频。经编码的视频信息可接着由调制解调器22根据通信标准来调制,且经由发射器24而发射到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或经设计用于信号调制的其它组件。发射器24可包含经设计用于发射数据的电路,包含放大器、滤波器和一或多个天线。
目的地装置14的接收器26经由信道16接收信息,且调制解调器28解调所述信息。此外,视频编码过程可将本文所述的技术中的一或多者实施到表示视频数据块的帧内预测模式的译码语法数据。经由信道16传送的信息可包含由视频编码器20界定的语法信息,所述语法信息还由视频解码器30使用,所述语法信息包含描述宏块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码的视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道16可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线、或无线与有线媒体的任何组合。通信信道16可形成例如局域网、广域网或例如因特网的全球网络的基于包的网络的部分。通信信道16一般表示用于将视频数据从源装置12发射到目的地装置14的任何合适通信媒体、或不同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含可用于促进从源装置12到目的地装置14的通信的路由器、交换器、基站或任何其它设备。
此外,图1仅为示范性的,且本发明的技术可适用于不必在编码与解码装置之间包含任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据可从局部存储器检索、经由网络流式传输或类似者。编码装置可编码数据并将数据存储到存储器,和/或解码装置可从存储器检索并解码数据。在许多情况下,编码和解码通过彼此未通信但仅编码数据到存储器和/或从存储器检索并解码数据的无关装置来执行。
视频编码器20和视频解码器30可根据视频压缩标准(例如,目前在开发中的高效视频译码(HEVC)标准)而操作,且可符合HEVC测试模型(HM)。HEVC标准的一个草案(称作“HEVC工作草案4”或“WD4”)描述于ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC)的文档“高效视频译码文本规范草案4(High-Efficiency Video Coding text specification draft4)”中(第6次会议:Torino、IT,2011年7月14-22日),所述文档特此以全文引用的方式并入。HEVC标准的近期草案(称作“HEVC工作草案8”或“WD8”)描述于Bross等人的文档JCTVC-J1003中,题为“高效视频译码(HEVC)文本规范草案8(High efficiency video coding(HEVC)textspecification draft8)”,ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第10次会议:Stockholm、SE,2012年7月11-20日,所述草案从2012年10月17日起可从http://phenix.int-evry.rr/jct/doc_end_user/documents/l0_Stockholm/wgl1/JCTVC-J1003-v8.zip下载,且所述草案以全文引用的方式并入本文中。
或者,视频编码器20和视频解码器30可根据例如ITU-T H.264标准或者被称作MPEG-4第10部分(高级视频译码(AVC)等其它专属或工业标准或此类标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2和ITU-TH.263。尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的MUX-DEMUX(多路复用-解多路复用)单元或其它硬件和软件,以处置对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可经实施为多种合适编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,其任一者可作为经组合的编码器/解码器(CODEC)的部分而集成在相应摄像机、计算机、移动装置、订户装置、广播装置、机顶盒、服务器或类似装置中。
视频序列通常包含一系列视频帧。图片群组(GOP)一般包括一系列一或多个视频帧。GOP可在GOP的标头、GOP的一或多个帧的标头中或在别处包含描述包含在GOP中的帧数目的语法数据。每一帧可包含描述相应帧的编码模式的帧语法数据。视频编码器20通常对个别视频帧内的视频块进行操作,以便编码视频数据。视频块可对应于宏块或宏块的分区。所述视频块可具有固定的或变化的大小,且可根据指定的译码标准而大小不同。每一视频帧可包含多个切片。每一切片可包含多个宏块,所述宏块可布置成若干分区,所述分区还被称作子块。
作为实例,ITU-T H.264标准支持各种块大小(例如,针对明度分量的16乘16、8乘8或4乘4,和针对色度分量的8×8)的帧内预测,以及各种块大小(例如,针对明度分量的16×16、16×8、8×16、8×8、8×4、4×8和4×4,和针对色度分量的对应缩放的大小)的帧间预测。在本发明中,“N×N”与“N乘N”可互换地使用以指所述块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16块将在垂直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成若干行及若干列。此外,所述块未必需要在水平方向中与在垂直方向中具有相同数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。小于16×16的块大小可被称作ITU-T H.264中的16×16宏块的分区。
视频块可包括像素域中的像素数据的块,或(例如)在对表示经译码的视频块与预测性视频块之间的像素差的残余视频块数据应用例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换等变换之后的在变换域中的变换系数的块。在一些情况下,视频块可包括变换域中的经量化的变换系数的块。
较小视频块可提供较好分辨率,且可用于包含高细节水平的视频帧的定位。一般而言,可将宏块和各种分区(有时称作子块)视为视频块。另外,可将切片视为多个视频块,例如宏块和/或子块。每一切片可为视频帧的可独立解码单元。或者,帧自身可为可解码单元,或可将帧的其它部分定义为可解码单元。术语“经译码单元”可指例如整个帧、帧的切片、图片群组(GOP)(也称作序列)等视频帧的任何可独立解码单元、或根据适用译码技术定义的另一可独立解码单元。
如上文所介绍,当前正努力开发新的视频译码标准,当前称作HEVC。新兴的HEVC标准还可称作H.265。标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的模型。HM假设视频译码装置具有优于根据(例如)ITU-T H.264/AVC的装置的若干能力。举例来说,尽管H.264提供九个帧内预测模式,但HM(例如)基于正帧内预测译码的块的大小而提供多达三十三个帧内预测模式。
HM指作为译码单元(CU)的视频数据块。位流内的语法数据可界定最大译码单元(LCU),LCU就像素数目来说是最大译码单元。大体而言,除了CU不具有大小区别之外,CU的用途类似于H.264的宏块。因此,CU可分裂为若干子CU。大体而言,本发明中对CU的引用可指图片的最大译码单元或LCU的子CU。LCU可分裂为若干子CU,且每一子CU可分裂为若干子CU。位流的语法数据可界定LCU可分裂的最大次数,称作CU深度。因此,位流还可界定最小译码单元(SCU)。本发明还使用术语“块”来指CU、预测单元(PU)或变换单元(TU)中的任一者。
LCU可与四分树数据结构相关联。大体而言,四分树数据结构每个CU包含一个节点,其中根节点对应于LCU。如果将CU分裂为四个子CU,那么对应于CU的节点包含四个叶节点,每一叶节点对应于子CU中的一者。四分树数据结构中的每一节点可为对应CU提供语法数据。举例来说,四分树中的节点可包含分裂旗标,其指示是否将对应于节点的CU分裂为若干子CU。可递归地界定用于CU的语法元素,且其可取决于CU是否分裂为若干子CU。
未分裂的CU可包含一或多个预测单元(PU)。大体而言,PU表示对应CU的全部或一部分,且包含用于检索PU的参考样本的数据。举例来说,当PU以帧内预测模式编码时,所述PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU以帧间模式编码时,所述PU可包含界定PU的运动向量的数据。界定运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考帧,和/或运动向量的参考列表(例如,列表0或列表1)。界定PU的CU的数据还可描述(例如)CU到一或多个PU的分割。分割模式可在CU是未经译码或是经帧内预测模式编码或是经帧间预测模式编码之间而不同。
具有一或多个PU的CU还可包含一或多个TU。在使用PU进行预测之后,视频编码器可计算CU的对应于PU的部分的残余值。可对残余值集合进行变换、扫描和量化以界定变换系数集合。TU界定包含变换系数的数据结构。TU未必限于PU的大小。因此,TU可能大于或小于相同CU的对应PU。在一些实例中,TU的最大大小可对应于对应CU的大小。
图2A和2B为说明实例四分树250和对应LCU272的概念图。图2A描绘实例四分树250,其包含按阶层方式布置的节点。四分树(例如四分树250)中的每一节点可为无子代的叶节点或具有四个子节点。在图2A的实例中,四分树250包含根节点252。根节点252具有四个子节点,其包含叶节点256A-256C(叶节点256)和节点254。因为节点254并非叶节点,所以节点254包含四个子节点,自此实例中为叶节点258A-258D(叶节点258)。
四分树250可包含描述对应LCU(在此示例中例如为LCU272)的特性的数据。举例来说,四分树250可通过其结构来描述LCU到子CU的分裂。假定LCU272具有2N×2N的大小。在此实例中,LCU272具有四个子CU276A-276C(子CU276)和274,每一者大小为N×N。子CU274进一步分裂为四个子CU278A-278D(子CU278),每一者大小为N/2×N/2。在此实例中,四分树250的结构对应于LCU272的分裂。即,根节点252对应于LCU272,根节点256对应于子CU276,节点254对应于子CU274,且叶节点258对应于子CU278。
四分树250的节点的数据可描述对应于节点上CU是否分裂。如果CU分裂,那么四个额外节点可存在于四分树250中。在一些实例中,可类似于以下伪代码来实施四分树的节点:
split_flag值可为表示对应于当前节点的CU是否分裂的一位值。如果CU未分裂,那么split_flag值可为“0”,而如果CU分裂,那么split_flag值可为“1”。关于四分树250的实例,分裂旗标值的阵列可为101000000。
在一些实例中,子CU276和子CU278中的每一者可使用相同帧内预测模式来经帧内预测编码。因此,视频编码器122可提供在根节点252中的帧内预测模式的指示。此外,子CU的特定大小可具有用于特定帧内预测模式的多个可能变换。视频编码器122可提供供根节点252中的此类子CU使用的变换的指示。举例来说,大小为N/2×N/2的子CU可具有多个可能可用变换。视频编码器122可用信号发送所述变换以用于根节点252中。因此,视频解码器128可基于在根节点252中用信号发送的帧内预测模式和在根节点252中用信号发送的变换而确定应用到子CU278的变换。
因而,根据本发明的技术,视频编码器122不需要用信号发送变换以应用到叶节点256和叶节点258中的子CU276和子CU278,但可代替地仅用信号发送帧内预测模式,且在一些实例中,用信号发送变换以应用到根节点252中的特定大小的子CU。以此方式,这些技术可减少针对LCU(例如LCU272)的每一子CU的信令变换功能的开销成本。
在一些实例中,用于子CU276和/或子CU278的帧内预测模式可不同于用于LCU272的帧内预测模式。视频编码器122和视频解码器130可经配置有以下功能:将在根节点252处用信号发送的帧内预测模式映射到用于子CU276和/或子CU278的可用帧内预测模式。所述功能可提供可用于LCU272的帧内预测模式到用于子CU276和/或子CU278的帧内预测模式的许多对一映射。
在某些HEVC设计中,切片可通过以下操作而提供可独立解码的单元:停用取决于来自其它切片的译码元素的上下文(例如剖析操作),在每一切片的开始处复位基于上下文的自适应二进制算术译码(CABAC)状态,及停用跨越切片和瓦片边界的图片内预测(包含用于解码的跨越切片的运动向量(MV)预测、帧内模式预测、像素预测)。切片一般包含整数个CU。
熵切片可通过以下操作而提供可独立剖析的单元:停用跨越切片的上下文元素的使用,及复位在每一熵切片的开始处的CABAC状态,同时允许用于解码的跨越切片的图片内预测。熵切片还在其切片标头结构方面与规则切片不同。举例来说,熵切片可使用存在于规则切片标头中的字段的子集,同时从按解码次序在熵切片之前的主要切片标头继承遗漏的字段。熵切片可通过其切片标头中的语法元素来识别。举例来说,熵切片可使切片标头语法元素lightweight_slice_flag等于1。
瓦片可提供用信号发送LCU的经改变解码次序的机制。除了LCU排序之外,瓦片可通过停用跨越瓦片的图片内预测和上下文元素的使用而提供独立编码与解码能力。
瓦片一般描述将图片分别分割为若干列和行的垂直和水平边界。举例来说,这些边界可以与切片边界相同的方式来破坏译码相依性(例如,与帧内预测、运动向量预测、剖析等相关联的相依性)。由相交的列和行边界产生的区域(例如矩形区域)称作瓦片(因此用于技术整体的名称)。每一瓦片可含有整数个LCU。LCU可在每一瓦片内按光栅扫描次序而经处理,且瓦片自身可在图片内按光栅扫描次序而经处理。切片边界可由编码器引入,且无需与瓦片边界一致。举例来说,瓦片可含有一个以上切片,且切片可含有一个以上瓦片。当切片在一个以上瓦片中含有LCU时,含有LCU的瓦片可为邻接的。如果T+1中的第一LCU按发射次序紧跟着T中的最后LCU,那么认为瓦片T和T+1为邻接的。此外,瓦片一般允许列和行边界被指定有和没有统一的间隔。
图3为说明针对图片300的实例树块译码次序的概念图,所述图片300分割为多个瓦片302A、302B、302C、302D、302E和302F(统称为“瓦片302”)。图片300中的每一方形块表示与树块相关联的像素块。厚的虚线指示实例瓦片边界。不同类型的交叉影线对应于不同的切片。像素块中的树木指示针对图片300的按瓦片译码次序的对应树块(LCU)的位置。如图3的实例中所说明,瓦片302A中的树块被首先译码,接着是瓦片302B中的树块,接着是瓦片302C中的树块,接着是瓦片302D中的树块,接着是瓦片302E中的树块,接着是瓦片302F中的树块。在瓦片302中的每一者内,根据光栅扫描次序来译码树块。
波前平行处理(WPP)可提供可经平行剖析及解码(例如,半独立)的多个子流,无需限制跨越用于波的子流(若干行LCU)的图片内预测和上下文元素的使用。在每一波的开始后,可基于在解码N>1个LCU后的LCU的上部行的CABAC状态来初始化CABAC状态。
图4为说明波前平行处理的概念图。如上文所述,可将图片分割为像素块,每一像素块与树块相关联。图4将与树块相关联的像素块说明为白色方块的栅格。图片包含树块行450A-450E(统称为“树块行450”)。
第一线程可为树块行450A中的译码树块。同时,其它线程可为树块行450B、450C和450D中的译码树块。在图4的实例中,第一线程当前正在译码树块452A,第二线程当前正在译码树块452B,第三线程当前正在译码树块452C,且第四线程当前正在译码树块452D。本发明可将树块452A、452B、452C和452D统称为“当前树块452”。因为视频译码器可在直接较高行的两个以上树块已被译码后开始译码树块行,所以当前树块452彼此水平位移两个树块的宽度。
在图4的实例中,线程可使用来自厚灰色箭头所指示的树块的数据来执行当前树块452中的CU的帧内预测或帧间预测。线程还可使用来自一或多个参考帧的数据来执行CU的帧间预测。为译码给定的树块,线程可基于与先前译码的树块相关联的信息来选择一或多个CABAC上下文。线程可使用一或多个CABAC上下文来对与给定树块的第一CU相关联的语法元素执行CABAC译码。如果给定树块并非一行的最左树块,那么线程可基于与给定树块左边的树块的最后CU相关联的信息来选择一或多个CABAC上下文。如果给定树块为一行的最左树块,那么线程可基于与给定树块右边的上方且相隔两树块的树块的最后CU相关联的信息来选择一或多个CABAC上下文。线程可使用来自薄黑色箭头所指示的树块的最后CU的数据来选择用于当前树块452的第一CU的CABAC上下文。
切片、熵切片、瓦片和WPP为用于将图片分割为不同区域且产生表示不同区域的经译码位的图片分割机制的全部实例。用于切片和熵切片的不同区域的经译码位可被囊封到单独网络抽象层(NAL)单元中,且因此未必需要用信号发送入口点。用于瓦片和波的不同区域的经译码位可被囊封到相同NAL单元中(如果未被进一步分裂为不同切片),且可在切片标头中用信号发送一个切片中的入口点。
个别NAL单元常常在经由网络的传输期间在其自身的包(即,一个包一个NAL)中输送。对于熵切片,如果相关联的切片(具有熵切片必须从其获得遗漏的切片标头语法元素的全切片标头)丢失,或另一熵切片(针对其允许跨越两熵切片的图片内预测)丢失,那么熵切片不能被适当地解码。
为了实现不同的瓦片或波被分开输送,瓦片和波一般被囊封到各自包含全切片标头的不同切片中。当传输环境无差错时,传输同一切片标头一次以上可使用不必要的位,且因此潜在地降低译码效率。另外,CABAC初始化参数(例如,cabac_init_idc)的存在取决于参数slice_type,参数slice_type不存在于短切片标头中,因此潜在地使得短切片标头不能被剖析。另外,在当前设计中,切片开始地址可深深地埋入切片标头中,在许多应用情况下,这可阻碍方便接入此参数以用于解码器检测新的经译码图片的开始。
用于瓦片的所有SPS和图片语法元素可包含在SPS语法和PPS语法中。如下文将更详细描述,对于WPP,语法元素entropy_coding_synchro可为包含在PPS语法中的1位旗标。当此旗标设定为真时,波前子流可与上方行中的第二最大译码单元的末端同步。
除了上述用于瓦片和WPP的SPS和PPS语法改变之外,本发明将两个新旗标引入到PPS语法中。语法元素“short_slice_header_cnabled_flag”控制切片语法元素slice_id和short_slice_header_flag的存在,且语法元素“dependent_slice_enabled_flag”控制语法元素“slice_boundary_independence_flag”的存在。根据本发明的技术,改变切片标头语法以支持短切片标头,并具有允许或不允许用于解码的跨越切片的图片内预测的能力。短切片标头一般指短于全切片标头切片标头。
现有lightweight_slice_flag可用short_slice_header_flag来替换,short_slice_header_flag用信号发送短切片标头是否用于所述切片。举例来说,如果使用短切片标头(例如,当旗标等于1时),未包含在短切片标头中的所有其它切片标头语法元素和切片标头语法结构可从全切片标头继承,例如在按解码次序的使用短切片标头的切片之前的切片的全切片标头。在一些实施方案中,具有全或短切片标头的所有切片可确保切片的可独立剖析性。
本发明还引入新的语法元素(slice_boundary_independence_flag)到切片标头中,所述语法元素用于针对所述特定切片而用信号发送用于解码的跨越切片的图片内预测是允许(例如,当值为0时)还是不允许(例如,当值为1时)。PPS中dependent_slice_enabled_flag的值可确定slice_boundary_independence_flag在切片标头中的存在。举例来说,对于图片,dependent_slice_enabled_flag的值可指示不允许跨越图片的切片的图片内预测。对于此类图片,图片中无切片使用在图片的不同切片中发现的信息来预测,且因此,用于此类图片的切片标头不需要包含“dependent_slice_enabled_flag”语法元素。
然而,在其它图片中,dependent_slice_enabled_flag的值可指示允许跨越图片的切片的图片内预测。当dependent_slice_enabled_flag指示允许跨越图片的切片的图片内预测时,切片可在切片标头中包含“slice_boundary_independence_flag。切片标头中slice_boundary_independence_flag的值可指示是否允许针对所述切片的跨越切片边界的图片内预测。因此,即使针对图片的切片而启用跨越边界的图片内预测,但仍可针对图片中的一些切片而停用跨越边界的图片内预测。
短切片标头可含有切片开始地址,且可含有切片ID、hort_slice_header_flag、slice_boundary_independency_flag、CABAC初始化参数和切片QP。举例来说,额外切片标头语法元素和语法结构仅可存在于全切片标头中。对于具有短切片标头的切片,当仅启用独立剖析特征(即,熵切片特征)时,即当slice_boundary_indepenency_flag等于0时,不包含切片QP。当启用波前平行处理特征时(即,entropy_coding_synchro等于1),短切片标头可(例如)不包含CABAC初始化参数。
母切片可包括同一经译码图片的具有slice_id的相同值的一或多个切片(还称作子切片)。母切片的沿着其边界的性质可优于其子切片的性质。母切片可提供独立的可剖析性和可解码性,意味跨越母切片边界的所有图片内预测可为不允许的。因此,当子切片允许跨越其切片边界的图片内预测时,可仅在其母切片的边界内运行图片内预测。
当tile_boundary_independence_idc等于1时,其可用信号发送所有瓦片的可独立解码性,在此情况下,可将每一瓦片编码为具有等于1的slice_boundary_independence_flag的一个可独立解码的切片。这可提供给解码器预先知道以配置其自身用于瓦片的可能平行/独立处理的能力。然而,tile_boundary_independence_idc可仅为指示,这是因为可独立解码的切片边界不允许跨越所有瓦片边界的图片内预测。
通过此设计,规则切片(即,母切片)、短切片(具有短切片标头的切片)、熵切片、波前和瓦片可彼此协调支持。在此框架中,在一些实例中,瓦片可仅确定LCU解码次序。当需要可独立解码的瓦片时,可将所述瓦片中的每一者嵌入于可独立解码的切片中。每一WPP波可囊封于切片内。可不需要用于瓦片或WPP波动入口点的信令。可仅通过由将slice_boundary_independence_flag设定为等于0而允许用于解码操作的图片内预测来支持熵切片。
波前切片可基于其开始LCU地址来排序。举例来说,所述波前切片可按照未使用平行解码的解码器可解码位流的次序。换句话说,在一些实例中,LCU处理次序可仅取决于瓦片。
本发明的技术可用以统一不同图片分割方案中的一些且可改进译码性能。根据本发明中所描述的技术,切片开始地址可为切片标头中的第一语法元素。另外,CABAC初始化参数(cabac_init_idc)的可不需要取决于slice_type,slice_type不存在于短切片标头中,且因此短切片标头自身可被剖析。
下文表1展示根据本发明的技术的瓦片的SPS语法。视频编码器20表示经配置以根据表1而产生SPS语法的视频译码器的实例,且视频解码器30表示经配置以根据表1而剖析PPS语法的视频解码器的实例。
下文表2展示根据本发明的技术的瓦片的PPS语法。视频编码器20表示经配置以根据表2而产生PPS语法的视频译码器的实例,且视频解码器30表示经配置以根据表2而剖析PPS语法的视频解码器的实例。如在下文表2中可见,“dependent_slice_enabled_flag”语法元素存在于PPS语法中。
对于WPP,语法元素“entropy__coding_synchro”可为包含在PPS语法中的1位旗标。语法元素“entropy_coding_synchro”可指定是否调用用于上下文变量的特定同步过程。举例来说,如果将“entropy_coding_synchro”设定为一,那么可调用用于上下文变量的特定同步过程。语法元素entropy_coding_synchro还可指定在CU的解码之前是否调用用于上下文变量的特定记忆过程,其中x0等于(1<<log2MaxCUSize)*(entropy_coding_synchro),且y0%(1<<log2MaxCUSize)等于0。
另外,可将两旗标short_slice_header_enabled_flag和dependent_slice_enabled_flag)添加到PPS语法。这两个旗标可指定语法元素slice_id、short_slice_header_flag和slice_boundary_independence_flag在切片标头中的存在。举例来说,如果short_slice_header_enabled_flag或dependent_slice_enabled_flag等于1,那么slice_id语法元素可存在于切片标头中。否则,slice_id语法元素可不存在于切片标头中。另外,举例来说,如果short_slice_header_enabled_flag等于1,那么short_slice_header_flag可存在于切片标头中。否则,short_slice_header_flag可不存在于切片标头中。另外,如果dependent_slice_enabled_flag等于1,那么slice_boundary_independence_flag可存在于切片标头中。否则,slice_boundary_iridependence_flag可不存在于切片标头中。
下文表3展示根据本发明的技术的切片标头语法。视频编码器20表示经配置以根据表3而产生切片标头语法的视频译码器的实例,且视频解码器30表示经配置以根据表3而剖析切片标头语法的视频解码器的实例。如在下文表3中可见,“slice_boundary_independence_flag”语法元素存在于切片标头中,且取决于“dependent_slice_enabled_flag”语法元素。另外,如从下文表3可见,语法元素“slice_address”位于切片标头语法的开始处,且位于“dependent_slice_enabled_flag”语法元素之前。
语法元素“parameter slice_id”可识别与切片相关联的母切片。每一母切片可具有在经译码图片的母切片集合内的独特的slice_id值。如果不存在,那么slice_id的值可为未指定的。母切片可由具有slice_id的相同值的相同经译码图片的一或多个切片组成。short_slice_header_flag等于0且slice_boundary_independency_flag等于1的切片自身可为母切片。如果存在,那么母切片的slice_id的值可不同于同一经译码图片的另一母切片的slice_id。对于属于一个母切片的所有切片,当short_slice_header_flag等于1时不存在的切片标头语法元素和切片标头语法结构中的每一者可为相同的。
如果图片的一个母切片的所有切片具有等于1的short_slice_header_flag,那么当语法元素“short_slice_header_flag”设定为1时不存在的切片标头语法元素和切片标头语法结构中的每一者可针对图片的所有切片为相同的。
如果参数short_slice_header_flag设定为1,那么其可指定针对短切片标头来说,仅存在切片标头语法元素的子集且不存在切片标头语法结构。值0可指定存在所有切片标头语法元素和切片标头语法结构。当不存在时,可推断short_slice_header_flag的值等于0。
对于一个经译码图片,可存在具有等于0的short_slice_header_flag的至少一个切片。如果参数slice_boundary_independence_flag等于1,那么其可指示所有邻近树块不包含于相同切片内,这是因为被解码的树块被标记为不可用,且当解码切片中的第一树块时可调用熵解码器的初始化过程。如果参数slice_boundary_independence_flag等于0,那么其可指示树块的可用性不受此切片的边界影响。当不存在时,可推断参数slice_boundary_independence_flag等于1。在替代实例中,在slice_boundary_independence_flag的上述语义中描述的“树块”的所有实例可用“经译码块”替换。
在一些实例中,如果参数entropy_coding_synchro等于1,那么可应用以下各项中的一或多者:
-短切片标头不含有切片开始地址,且导出切片开始地址。第一切片具有等于0的切片开始地址。第二切片具有等于一个LCU行中的LCU的数目的切片开始地址。第二切片具有等于一个LCU行中的LCU的数目的两倍的切片开始地址,诸如此类。
-短切片标头不含有切片ID,且通过按解码次序使具有全切片标头的每一切片增加一来导出切片ID值。
-短切片标头不含有slice_boundary_independency_flag,且将所述值推断为等于1。
以下内容描述针对树块地址的可用性的实例导出过程。对此过程的输入可为树块地址tbAddr。此过程的输出可为树块tbAddr的可用性。当调用所述过程时可确定可用性的含义。可将树块标记为可用,除非以下条件中的一者为真,在此情况下可将树块标记为不可用:
-tbAddr<0
-tbAddr>CurrTbAddr
-地址tbAddr的树块属于与地址CurrTbAddr的树块不同的母切片
-地址tbAddr的树块属于不同的切片,且含有地址CurrTbAddr的树块的切片具有等于1的slice_boundary_independence_flag。
在一些实例中,在针对树块地址的可用性的上述导出过程中的“树块”的所有实例(包含标题)可用“经译码块”替换。
返回参看图1,视频编码器20可使用帧内预测模式编码来编码视频数据的特定块,且提供指示用以编码所述块的选定帧内预测模式的信息。除了P帧或P切片和B帧或B切片之外,视频编码器20可使用帧内预测模式(例如,I帧或I切片)来帧内预测编码任何类型的帧或切片的若干块。当视频编码器20确定块硬被帧内预测模式编码时,视频编码器20可执行速率失真分析以选择最适当的帧内预测模式。举例来说,视频编码器20可计算一或多个帧内预测模式的速率失真值,且选择具有可接受速率失真特性的模式中的一者。
视频编码器20还可经配置以确定所述块的编码上下文。上下文可包含块的各种特性,例如:块的大小,其可在像素尺寸方面来确定;预测单元(PU)类型,例如在HEVC的实例中为2N×2N、N×2N、2N×N、N×N;短距离帧内预测(SDIP)类型,例如2N×N/2、N/2×2N、2N×1、1×2N;H.264的实例中的宏块类型;所述块的CU深度;或针对视频数据块的大小的其它测量。在一些实例中,上下文可对应于上方邻近块、左邻近块、左上邻近块、右上邻近块或其它邻近块的帧内预测模式中的任一者或全部。在一些实例中,上下文可包含用于一或多个块的帧内预测模式以及用于正被编码的当前块的大小信息两者。
在任何情况下,视频编码器20可包含将块的上下文映射到当前块的各种译码特性的配置数据。举例来说,基于块的上下文,配置数据可指示一或多个最可能的帧内预测模式。在一些实例中,视频编码器20可经配置以基于所述上下文而开始针对具有最可能模式的帧内预测模式的选择的分析。在一些实例中,当最可能模式实现合适的速率失真特性时,视频编码器20可选择最可能模式。在其它实例中,视频编码器20不需要开始选择具有最可能模式的过程。
在用以产生预测性数据和残余数据的帧内预测性或帧间预测性译码之后,且在用以产生变换系数的任何变换(例如,H.264/AVC中所使用的4×4或8×8整数变换或离散余弦变换DCT)之后,可执行对变换系数的量化。量化一般指将变换系数量化以可能地减少用于表示系数的数据量的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位值降值舍位到m位值,其中n大于m。
在量化之后,可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法来执行经量化数据的熵译码。经配置用于熵译码的处理单元或另一处理单元可执行其它处理功能,例如,经量化系数的零行程长度译码和/或语法信息的产生,所述语法信息例如经译码的块样式(CBP)值、宏块类型、译码模式、经译码单元(例如,帧、切片、宏块或序列)的最大宏块大小或类似者。
视频解码器30可(例如)最终从调制解调器28和接收器26接收经编码视频数据。根据本发明的技术,视频解码器30可接收表示用以编码视频数据块的帧内预测模式的经编码数据。视频解码器30可经配置以按实质上类似于视频编码器20的方式来确定所述块的译码上下文。此外,视频解码器30可包含类似于视频编码器20的配置数据,例如最可能模式的指示、帧内预测模式索引表和用于每一译码上下文的VLC表等。
视频编码器20和视频解码器30可在运动补偿期间使用本发明中所述的一或多个内插滤波技术。视频编码器20和视频解码器30可各自实施为多种合适编码器或解码器电路中的任一者(在适用时),例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中,其任一者可集成为组合式视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的设备可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
图5为说明视频编码器20的实例的框图。视频编码器20为经配置以遵照上文的表1、表2和表3而产生语法元素的视频编码器的实例。视频编码器20可对视频帧内的块执行帧内和帧间译码,包含宏块或宏块的分区或子分区。帧内译码依赖于空间预测以减小或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减小或移除视频序列的相邻帧内的视频中的时间冗余。帧内预测模式(I模式)可指若干基于空间的压缩模式中的任一者,且例如单向预测(P模式)或双向预测(B模式)的帧间模式可指若干基于时间的压缩模式中的任一者。虽然图5中描绘用于模式间编码的组件,但应理解,视频编码器20可进一步包含用于帧内预测模式编码的组件。然而,为了简洁性和清晰性而并未说明此类组件。
如图5中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图5的实例中,视频编码器20包含运动补偿单元44、运动估计单元42、存储器64、求和器50、变换处理单元52、量化单元54和熵译码单元56。对于视频块重建,视频编码器20还包含逆量化单元58、逆变换处理单元60和求和器62。还可包括解块滤波器(图5中未展示)以将块边界滤波,以从经重建的视频移除块效应假影。在需要时,解块滤波器通常对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待经译码的视频帧或切片。可将所述帧或切片划分成多个视频块。运动估计单元42和运动补偿单元44相对于一或多个参考帧中的一或多个块执行对所接收的视频块的帧间预测性译码以提供时间压缩。帧内预测单元46可相对于与待经译码的块在相同的帧或切片中的一或多个邻近块而执行对所接收的视频块的帧内预测性译码以提供空间预测。
模式选择单元40可(例如)基于错误结果且基于包含正被译码的当前块的帧或切片的帧或切片类型而选择译码模式中的一者(帧内或帧间),且将所得帧内或帧间经译码块提供到求和器50以产生残余块数据且提供到求和器62以重建经编码块以供用于参考帧或参考切片中。大体而言,帧内预测涉及相对于邻近先前经译码块来预测当前块,而帧间预测涉及运动估计和运动补偿以在时间上预测当前块。
运动估计单元42和运动补偿单元44表示视频编码器20的帧间预测元件。运动估计单元42与运动补偿单元44可高度集成,但为概念目的而分开说明。运动估计是产生估计视频块的运动的运动向量的过程。运动向量(例如)可指示预测性参考帧(或其它经译码单元)内的预测性块相对于当前帧(或其它经译码单元)内正被译码的当前块的位移。预测性块是经发现在像素差方面密切地匹配待译码的块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。运动向量还可指示宏块的分区的位移。运动补偿可涉及基于运动估计所确定的运动向量来获取或产生预测性块。此外,在一些实例中,运动估计单元42和运动补偿单元44可为功能上集成的。
运动估计单元42通过比较视频块与参考帧存储装置64中的参考帧的视频块而计算帧间译码的帧的视频块的运动向量。运动补偿单元44还可内插参考帧(例如,I帧或P帧)的子整数像素。作为实例,ITU H.264标准描述两列表:列表0,其包含具有比被编码的当前帧早的显示次序的参考帧;以及列表1,其包含具有比被编码的当前帧迟的显示次序的参考帧。因此,可根据这些列表来组织存储在参考帧存储装置64中的数据。
运动估计单元42比较来自参考帧存储装置64的一或多个参考帧的块与当前帧(例如,P帧或B帧)的待经编码的块。当参考帧存储装置64中的参考帧包含用于子整数像素的值时,由运动估计单元42计算的运动向量可指参考帧的子整数像素位置。如果没有子整数像素位置的值存储在参考帧存储装置64中,那么运动估计单元42和/或运动补偿单元44还可经配置以计算存储在参考帧存储装置64中的参考帧的子整数像素位置的值。运动估计单元42将所计算的运动向量发送到熵译码单元56和运动补偿单元44。由运动向量识别的参考帧块可称作预测性块。运动补偿单元44可基于帧间预测性块来计算预测数据。
如上所述,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代,帧内预测单元46可帧内预测当前块。明确地说,帧内预测单元46可确定用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从所测试的模式中选择待使用的适当帧内预测模式。举例来说,帧内预测单元46可使用对各种经测试的帧内预测模式的速率-失真分析而计算速率-失真值,且在经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析一般确定经编码块与经编码以产生经编码块的原始未经编码块之间的失真(或误差)的量以及用以产生经编码块的位速率(即,位数目)。帧内预测单元46可根据失真和速率来计算各种经编码块的比率以确定哪一帧内预测模式展现所述块的最佳速率-失真值。在任何情况下,在对于块选择帧内预测模式之后,帧内预测单元46可将指示所述块的选定帧内预测模式的信息提供到熵译码单元56。熵译码单元56可根据本发明的技术而编码指示所述选定帧内预测模式的信息。
在预测当前块后(例如,使用帧内预测或帧间预测),视频编码器20可通过从正经译码的原始视频块减去通过运动补偿单元44或帧内预测单元46所计算的预测数据来形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换的变换应用到残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换,例如由H.264标准所界定的那些变换。还可使用小波变换、整数变换、子带变换或其它类型的变换。在任何情况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域(例如,频域)。量化单元54量化残余变换系数以进一步减小位率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数而修改量化程度。
在量化之后,熵译码单元56对经量化的变换系数熵译码。举例来说,熵译码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC),或另一熵译码技术。在通过熵译码单元56进行熵译码之后,可将经编码视频发射到另一装置或加以存档以用于稍后发射或检索。在上下文自适应二进制算术译码的情况下,上下文可基于邻近块和/或块大小。
在一些情况下,熵译码单元56或视频编码器20的另一单元可经配置以执行除了如上所述的帧内预测模式的熵译码和译码之外的其它译码功能。举例来说,熵译码单元56可经配置以确定所述块和分区的经译码块样式(CBP)值。而且,在一些情况下,熵译码单元56可执行宏块或其分区中的系数的行程长度译码。具体来说,熵译码单元56可应用曲折(zig-zag)扫描或其它扫描样式以扫描宏块或分区中的变换系数,且编码零的行程以用于进一步压缩。熵译码单元56还可用适当的语法元素建构标头信息以用于在经编码视频位流中进行发射。
逆量化单元58和逆变换处理单元60分别应用逆量化和逆变换以在像素域中重建残余块(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考帧存储装置64的帧中的一者的预测性块来计算参考块。运动补偿单元44还可对所述经重建的残余块应用一或多个内插滤波器以计算用于在运动估计中使用的子整数像素值。求和器62将经重建的残余块加到由运动补偿单元44所产生的运动补偿预测块以产生经重建的视频块以供存储于参考帧存储装置64中。经重建的视频块可由运动估计单元42和运动补偿单元44用作用于对后续视频帧中的块进行帧间译码的参考块。
视频编码器20可以分数像素(或子像素)精度来执行运动估计。当视频编码器20使用分数像素运动估计时,视频编码器20可使用本发明中所描述的内插操作而以子像素分辨率(例如,子像素或分数像素值)来产生数据。换句话说,将内插运算用以计算在整数像素位置之间的位置处的值。位于整数像素位置之间的距离一半处的子像素位置可称作半像素位置,位于整数像素位置与半像素位置之间的距离一半处的子像素位置可称作四分之一像素位置,位于整数像素位置(或半像素位置)与四分之一像素位置之间的距离一半处的子像素位置可称作八分之一像素位置,等等。
视频编码器20表示经配置根据上文的表1、表2和表3而产生语法的视频编码器的实例。举例来说,视频编码器20表示经配置以译码第一图片的第一语法元素的第一实例的视频编码器的实例。第一语法元素可为PPS的部分。第一语法元素的第一值可指示针对第一图片的切片允许跨越切片的图片内预测。当允许跨越切片边界的图片内预测时,视频编码器20可基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。响应于第一语法元素指示允许跨越切片的图片内预测,视频编码器20可译码指示允许跨越切片的图片内预测的第二语法元素。第二语法元素可为切片标头的部分,且第二语法元素在切片标头中的存在可取决于第一语法元素的第一值。视频编码器20还可译码第二图片的第一语法元素的第二实例。第一语法元素的第二值可指示针对第二图片的切片不允许跨越切片的图片内预测。
图6为说明视频解码器30的实例的框图,视频解码器30解码经编码的视频序列。视频解码器30为经配置以产生遵照上文的表1、表2和表3而剖析语法元素的视频编码器的实例。在图6的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、记忆体82和求和器80。在一些实例中,视频解码器30可执行一般与关于视频编码器20(图5)所描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量而产生预测数据。
运动补偿单元72可使用位流中所接收的运动向量来识别参考帧存储装置82中的参考帧中的预测块。帧内预测单元74可使用在位流中所接收的帧内预测模式以从空间上相邻的块形成预测块。
熵解码单元70可接收表示用以解码视频数据的经编码块的帧内预测模式的数据。熵解码单元70可(例如)基于经编码块的左边邻近和顶部邻近块的帧内预测模式和/或经编码块的大小来确定经编码块的上下文。基于上下文,熵解码单元70可确定用以解码所述块的一或多个最可能帧内预测模式。
帧内预测单元74可使用帧内预测模式的指示来帧内预测经编码块,例如使用邻近的先前解码块的像素。举例来说,在块经帧间预测模式编码的情况下,运动补偿单元72可接收界定运动向量的信息,以便检索经编码块的运动补偿预测数据。在任何情况下,运动补偿单元72或帧内预测单元74可提供界定预测块的信息给求和器80。
逆量化单元76逆量化(即,解量化)提供于位流中且由熵解码单元70解码的经量化块系数。逆量化过程可包含常规过程,例如,如H.264解码标准所界定或如HEVC测试模型所执行的过程。逆量化过程还可包含使用由编码器20计算的量化参数QPY来用于每一宏块以确定量化程度且(同样地)应应用的逆量化程度。
逆变换处理单元58将逆变换(例如,逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数,以便在像素域中产生残余块。运动补偿单元72产生经运动补偿的块,可能执行基于内插滤波器的内插。待用于具有子像素精度的运动估计的内插滤波器的识别符可包含在语法元素中。运动补偿单元72可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元72可根据所接收的语法信息来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
运动补偿单元72使用以下各项中的一些:语法信息,其用以确定用以编码经编码视频序列的帧的块大小;分区信息,其描述分割经编码视频序列的帧或切片的每一块的方式;指示编码每一分区的方式的模式;用于每一帧间编码的块或分区的一或多个参考帧(或参考帧列表);以及用以解码经编码视频序列的其它信息。
求和器80对残余块与运动补偿单元72或帧内预测单元74所产生的对应预测块求和以形成经解码块。如果需要的话,还可应用解块滤波器以对经解码块进行滤波,以便移除块效应假影。接着将经解码的视频块存储于参考帧存储装置82中,参考帧存储装置82提供用于后续运动补偿的参考块且还产生用于在显示装置(例如,图1的装置32)上呈现的经解码视频。
以此方式,视频解码器30可经配置以接收视频数据且剖析视频数据的PPS语法,以确定针对切片存在短切片标头或是全切片标头。举例来说,剖析可包含确定识别是否启用短切片标头的旗标的值。响应于存在短切片标头,视频解码器30可识别来自全切片标头的其它切片标头语法元素和其它切片标头语法结构,其中全切片标头与按解码次序在切片之前的切片相关联。短切片标头可包含切片开始地址、切片ID、短切片标头启用旗标、切片边界独立性旗标、CABAC初始化参数和切片QP中的一或多者。切片边界独立性旗标可用信号发送是否允许用于解码的跨越切片的图片内预测。
视频解码器30还可经配置以接收视频数据且剖析视频数据的PPS语法,以确定针对切片是否存在切片边界独立性旗标。剖析可包含确定用于相依切片启用旗标的值。
视频解码器30表示经配置根据上文的表1、表2和表3而剖析语法的视频编码器的实例。举例来说,视频解码器30表示经配置以译码第一图片的第一语法元素的第一实例的视频解码器的实例。第一语法元素可为PPS的部分。第一语法元素的第一值可指示针对第一图片的切片允许跨越切片的图片内预测。当允许跨越切片边界的图片内预测时,视频解码器30可基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。响应于第一语法元素指示允许跨越切片的图片内预测,视频解码器30可译码指示允许跨越切片的图片内预测的第二语法元素。第二语法元素可为切片标头的部分,且第二语法元素在切片标头中的存在可取决于第一语法元素的第一值。视频解码器30还可译码第二图片的第一语法元素的第二实例。第一语法元素的第二值可指示针对第二图片的切片不允许跨越切片的图片内预测。
在一些实例中,参考视频解码器30描述的各种解码技术也可由视频编码器20来实施。举例来说,作为视频编码过程的部分,视频编码器20可解码经编码视频。
图7为说明根据本发明的技术的解码视频数据的实例方法的流程图。举例来说,关于图1和4的视频解码器30来描述图5的方法,但所述方法还可由其它类型的视频解码器来实施。
视频解码器30可接收视频数据(150)。在所接收视频数据中,视频解码器30可剖析视频数据的参数集以确定当前图片是否分割为波或瓦片(152)。当确定当前图片分割为波或瓦片时,视频解码器30可确定是否准许交叉分割预测(154)。如果不准许交叉分割预测(154,否),那么视频解码器30可平行解码波或瓦片(156)。如果准许交叉分割预测(154,是),那么视频解码器30可确定当前切片到其它分区的入口点(158)。
图8为说明根据本发明的技术的译码视频数据的实例方法的流程图。举例来说,关于一般视频译码器来描述图5的方法。一般视频译码器可(例如)为图1和4的视频解码器30的视频解码器,或可为例如图1和3的视频编码器20的视频编码器,但所述方法还可用其它类型的视频译码器来实施。
视频译码器确定是否允许跨越图片的切片的图片内预测(162)。作为确定不允许跨越图片的切片的图片内预测的部分,视频译码器可译码语法元素。如果视频译码器为视频编码器,那么译码语法元素可包含产生语法元素,且将所述语法元素设定为指示不允许跨越图片中的切片边界的图片内预测的值。如果视频译码器为视频解码器,那么视频解码器可通过剖析语法元素且确定将所述语法元素设定为指示不允许跨越图片中的切片边界的图片内预测的值来译码语法元素。所述语法元素不管通过视频编码器产生或是通过视频解码器剖析,均可为PPS的部分。
如果不允许跨越图片的切片的图片内预测(162,否),那么在一些实例中,视频译码器独立地译码图片的切片(164)。以如上所述的类似方式,作为确定不允许跨越图片的切片的图片内预测的部分,视频译码器可译码语法元素。如果视频译码器为视频编码器,那么译码语法元素可包含产生语法元素,且将所述语法元素设定为指示允许跨越图片中的切片边界的图片内预测的值。如果视频译码器为视频解码器,那么视频解码器可通过剖析语法元素且确定将所述语法元素设定为指示允许跨越图片中的切片边界的图片内预测的值来译码语法元素。因此,对于语法元素的第一实例(例如,与第一图片相关联),第一值可指示允许跨越切片边界的图片内预测,而对于语法元素的第二实例(例如,与第二图片相关联),语法元素的第二值可指示不允许跨越切片边界的图片内预测。
在运行跨越图片的切片边界的图片内预测的实例中(162,是),视频译码器可确定针对特定切片是否允许跨越所述切片的边界的图片内预测(166)。作为确定允许跨越特定切片的边界的图片内预测的部分,视频译码器可译码第二语法元素。如果视频译码器为视频编码器,那么译码第二语法元素可包含产生第二语法元素以包括在经编码位流中,且将第二语法元素设定为指示不允许跨越切片的边界的图片内预测的值,或将第二语法元素设定为指示允许跨越切片的边界的图片内预测的值。如果视频译码器为视频解码器,那么视频解码器可通过以下操作来译码第二语法元素:剖析第二语法元素,且确定将第二语法元素设定为指示不允许跨越切片的边界的图片内预测的值,或将第二语法元素设定为指示允许跨越切片的边界的图片内预测的值。所述第二语法元素不管是通过视频编码器产生或是通过视频解码器剖析,均可为切片标头的部分,且第二语法元素在切片标头中的存在可取决于PPS中的第一语法元素。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体而传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪储存器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,任何连接可适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或无线技术(例如,红外线、无线电和微波)而从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤电缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是有关非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常磁性地再生数据,而光盘通过激光光学地再生数据。以上各者的组合还应包含于计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因此,本文中所使用的术语“处理器”可指上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编码解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于多种装置或设备中,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片集)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求通过不同硬件单元来实现。而是,如上文所描述,各种单元可组合于编码解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合适合软件和/或固件来提供。
已描述各种实例。这些及其它实例是在随附权利要求书的范围内。
Claims (29)
1.一种译码视频数据的方法,所述方法包括:
译码第一图片的第一语法元素,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和
基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。
2.根据权利要求1所述的方法,其进一步包括:
响应于所述第一语法元素指示允许跨越切片的图片内预测,译码指示允许跨越切片的图片内预测的第二语法元素,其中所述第二语法元素为切片标头的部分。
3.根据权利要求2所述的方法,其中所述第二语法元素在所述切片标头中的存在取决于所述第一语法元素的所述第一值。
4.根据权利要求2所述的方法,其进一步包括:
译码切片的开始地址,其中所述切片的所述开始地址定位于所述切片标头中所述第二语法元素之前。
5.根据权利要求1所述的方法,其中所述第一语法元素为图片参数集PPS的部分。
6.根据权利要求1所述的方法,其中译码所述第一语法元素包括译码所述第一语法元素的第一实例,所述方法进一步包括:
译码第二图片的所述第一语法元素的第二实例,其中所述第一语法元素的所述第二实例的第二值指示针对所述第二图片的切片不允许跨越切片的图片内预测。
7.根据权利要求6所述的方法,其进一步包括:
独立地译码所述第二图片的所述切片。
8.根据权利要求1所述的方法,其中译码所述第一语法元素包括编码所述第一语法元素,其中编码所述第一语法元素包括产生具有所述第一值的所述第一语法元素。
9.根据权利要求1所述的方法,其中译码所述第一语法元素包括解码所述第一语法元素,其中解码所述第一语法元素包括剖析所述第一语法元素以确定所述第一值。
10.一种用于译码视频数据的装置,所述装置包括:
视频译码器,其经配置以:
译码第一图片的第一语法元素的第一实例,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和
基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元。
11.根据权利要求10所述的装置,其中所述视频译码器经进一步配置以:
响应于所述第一语法元素指示允许跨越切片的图片内预测,译码指示允许跨越切片的图片内预测的第二语法元素,其中所述第二语法元素为切片标头的部分。
12.根据权利要求11所述的装置,其中所述第二语法元素在所述切片标头中的存在取决于所述第一语法元素的所述第一值。
13.根据权利要求11所述的装置,其中所述视频译码器经进一步配置以:
译码切片的开始地址,其中所述切片的所述开始地址定位于所述切片标头中所述第二语法元素之前。
14.根据权利要求10所述的装置,其中所述第一语法元素为图片参数集PPS的部分。
15.根据权利要求9所述的装置,其中所述视频译码器经进一步配置以:
译码第二图片的所述第一语法元素的第二实例,其中所述第一语法元素的第二值指示针对所述第二图片的切片不允许跨越切片的图片内预测。
16.根据权利要求15所述的装置,其中所述视频译码器经进一步配置以:独立地译码所述第二图片的所述切片。
17.根据权利要求10所述的装置,其中所述视频译码器包括视频编码器,且其中所述视频译码器经进一步配置以产生具有所述第一值的所述第一语法元素。
18.根据权利要求10所述的装置,其中所述视频译码器包括视频解码器,且其中所述视频译码器经进一步配置以剖析所述第一语法元素以确定所述第一值。
19.根据权利要求10所述的装置,其中所述装置包括以下各项中的至少一者:
集成电路;
微处理器;和
无线通信装置,其包含所述视频译码器。
20.一种用于译码视频数据的装置,所述装置包括:
用于译码第一图片的第一语法元素的装置,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测;和
用于基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元的装置。
21.根据权利要求20所述的装置,进一步包括:
用于响应于所述第一语法元素指示允许跨越切片的图片内预测而译码指示允许跨越切片的图片内预测的第二语法元素的装置,其中所述第二语法元素为切片标头的部分。
22.根据权利要求21所述的装置,其中所述第二语法元素在所述切片标头中的存在取决于所述第一语法元素的所述第一值。
23.根据权利要求21所述的装置,进一步包括:
用于译码切片的开始地址的装置,其中所述切片的所述开始地址定位于所述切片标头中所述第二语法元素之前。
24.根据权利要求20所述的装置,其中所述第一语法元素为图片参数集PPS的部分。
25.根据权利要求20所述的装置,其中所述用于译码所述第一语法元素的装置包括用于译码所述第一语法元素的第一实例的装置,所述装置进一步包括:
用于译码第二图片的所述第一语法元素的第二实例的装置,其中所述第一语法元素的所述第二实例的第二值指示针对所述第二图片的切片不允许跨越切片的图片内预测。
26.根据权利要求25所述的装置,进一步包括:
用于独立地译码所述第二图片的所述切片的装置。
27.根据权利要求20所述的装置,其中所述用于译码所述第一语法元素的装置包括用于编码所述第一语法元素的装置,其中所述用于编码所述第一语法元素的装置包括用于产生具有所述第一值的所述第一语法元素的装置。
28.根据权利要求20所述的装置,其中所述用于译码所述第一语法元素的装置包括用于解码所述第一语法元素的装置,其中所述用于解码所述第一语法元素的装置包括用于剖析所述第一语法元素以确定所述第一值的装置。
29.一种存储指令的计算机可读存储媒体,所述指令在执行时致使一或多个处理器进行以下动作:
译码第一图片的第一语法元素的第一实例,其中所述第一语法元素的第一值指示针对所述第一图片的切片允许跨越切片的图片内预测,其中所述第一语法元素为图片参数集PPS的部分;
响应于所述第一语法元素指示允许跨越切片的图片内预测,译码指示允许跨越切片的图片内预测的第二语法元素,其中所述第二语法元素为切片标头的部分,其中所述第二语法元素在所述切片标头中的存在取决于所述第一语法元素的所述第一值;
对于所述第一图片,基于第二切片的第二译码单元的信息来译码第一切片的第一译码单元;和
译码第二图片的所述第一语法元素的第二实例,其中所述第一语法元素的所述第二实例的第二值指示针对所述第二图片的切片不允许跨越切片的图片内预测。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161551862P | 2011-10-26 | 2011-10-26 | |
US61/551,862 | 2011-10-26 | ||
US13/660,635 | 2012-10-25 | ||
US13/660,635 US9247258B2 (en) | 2011-10-26 | 2012-10-25 | Unified design for picture partitioning schemes |
PCT/US2012/062166 WO2013063425A1 (en) | 2011-10-26 | 2012-10-26 | Unified design for picture partitioning schemes |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103947207A true CN103947207A (zh) | 2014-07-23 |
CN103947207B CN103947207B (zh) | 2017-09-15 |
Family
ID=47178947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280053106.7A Active CN103947207B (zh) | 2011-10-26 | 2012-10-26 | 用于图片分割方案的统一设计 |
Country Status (17)
Country | Link |
---|---|
US (1) | US9247258B2 (zh) |
EP (2) | EP2772050A1 (zh) |
JP (1) | JP5882487B2 (zh) |
KR (1) | KR101613858B1 (zh) |
CN (1) | CN103947207B (zh) |
AU (2) | AU2012328617A1 (zh) |
BR (1) | BR112014010046B1 (zh) |
CA (1) | CA2852792C (zh) |
DK (1) | DK3340626T3 (zh) |
ES (1) | ES2841424T3 (zh) |
HU (1) | HUE051181T2 (zh) |
IL (1) | IL232002A (zh) |
IN (1) | IN2014CN03134A (zh) |
MY (1) | MY168318A (zh) |
SG (1) | SG11201401424WA (zh) |
WO (1) | WO2013063425A1 (zh) |
ZA (1) | ZA201403808B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108737841A (zh) * | 2017-04-21 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 编码单元深度确定方法及装置 |
WO2021170132A1 (en) * | 2020-02-28 | 2021-09-02 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods simplifying signalling slice header syntax elements |
WO2021185311A1 (en) * | 2020-03-20 | 2021-09-23 | Mediatek Inc. | Method and apparatus for signaling tile and slice partition information in image and video coding |
US11405649B2 (en) | 2020-02-18 | 2022-08-02 | Mediatek Inc. | Specifying slice chunks of a slice within a tile |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8767824B2 (en) * | 2011-07-11 | 2014-07-01 | Sharp Kabushiki Kaisha | Video decoder parallelization for tiles |
AU2012294053B2 (en) | 2011-08-11 | 2016-07-07 | Sun Patent Trust | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
CN104160701B (zh) | 2012-01-27 | 2017-06-30 | 太阳专利托管公司 | 图像编码方法、图像解码方法、图像编码装置、及图像解码装置 |
EP2811742A4 (en) | 2012-02-04 | 2015-09-02 | Lg Electronics Inc | VIDEO CODING METHOD, VIDEO DECODING METHOD AND DEVICE THEREFOR |
TWI752680B (zh) | 2012-04-13 | 2022-01-11 | 美商Ge影像壓縮有限公司 | 用以自資料串流重構圖像的解碼器及方法、用以將圖像編碼入資料串流的編碼器及方法、與相關電腦程式及機器可存取媒體 |
CN115442623B (zh) | 2012-06-29 | 2024-08-23 | Ge视频压缩有限责任公司 | 解码视频数据流的方法、存储介质、编码器、解码器 |
US9621905B2 (en) * | 2012-06-29 | 2017-04-11 | Qualcomm Incorporated | Tiles and wavefront parallel processing |
WO2014050030A1 (ja) | 2012-09-26 | 2014-04-03 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
RU2616185C2 (ru) * | 2013-01-18 | 2017-04-13 | Кэнон Кабусики Кайся | Способ, устройство и компьютерная программа для инкапсуляции сегментированных синхронизированных мультимедийных данных |
EP3008896B1 (en) | 2013-07-15 | 2021-03-31 | Sony Corporation | Extensions of motion-constrained tile sets sei message for interactivity |
JP6242139B2 (ja) * | 2013-10-02 | 2017-12-06 | ルネサスエレクトロニクス株式会社 | 動画像復号処理装置およびその動作方法 |
JP6692087B2 (ja) * | 2013-12-27 | 2020-05-13 | サン パテント トラスト | 配信方法、およびシステム |
MX2021015798A (es) | 2014-06-20 | 2023-03-07 | Sony Corp | Dispositivo y metodo de codificacion de imagen, y dispositivo y metodo de decodificacion de imagen. |
MX2016015022A (es) | 2014-08-07 | 2018-03-12 | Sonic Ip Inc | Sistemas y metodos para proteger corrientes de bits elementales que incorporan tejas codificadas independientemente. |
CN105874800B (zh) * | 2014-09-17 | 2019-05-10 | 联发科技股份有限公司 | 句法解析装置和句法解析方法 |
GB2539211A (en) * | 2015-06-08 | 2016-12-14 | Canon Kk | Enhanced coding and decoding using intra block copy mode |
US10382793B2 (en) * | 2015-06-23 | 2019-08-13 | Integrated Device Technology, Inc. | Apparatuses and methods for performing information extraction and insertion on bitstreams |
CN113115036A (zh) * | 2015-11-24 | 2021-07-13 | 三星电子株式会社 | 视频解码方法和设备及其编码方法和设备 |
US10841602B2 (en) * | 2018-07-16 | 2020-11-17 | Tencent America LLC | Hierarchical tiles |
US10375416B1 (en) * | 2018-09-05 | 2019-08-06 | Tencent America LLC | Segment types in video coding |
CN109413487A (zh) * | 2018-11-07 | 2019-03-01 | 成都索贝数码科技股份有限公司 | 一种基于对象存储分片转码/合成视频文件后闪拼的方法 |
AU2018278915A1 (en) * | 2018-12-12 | 2020-07-02 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a transformed block of video samples |
CN113767624A (zh) * | 2019-03-08 | 2021-12-07 | 瑞典爱立信有限公司 | 提供相关/独立分区编码/解码的方法和有关装置 |
CN113906744A (zh) * | 2019-03-15 | 2022-01-07 | 北京达佳互联信息技术有限公司 | 视频编解码中无损编解码的信令 |
CN118138754A (zh) | 2019-06-14 | 2024-06-04 | 北京字节跳动网络技术有限公司 | 处理视频单元边界和虚拟边界 |
WO2020249124A1 (en) | 2019-06-14 | 2020-12-17 | Beijing Bytedance Network Technology Co., Ltd. | Handling video unit boundaries and virtual boundaries based on color format |
CN112970251A (zh) | 2019-08-20 | 2021-06-15 | 株式会社 Xris | 用于对图像信号进行编码/解码的方法及其装置 |
KR102707780B1 (ko) | 2019-09-18 | 2024-09-20 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 적응형 루프 필터의 2-파트 시그널링 |
EP4018652A4 (en) | 2019-09-22 | 2022-11-02 | Beijing Bytedance Network Technology Co., Ltd. | FILLING METHOD IN AN ADAPTIVE LOOP FILTER |
JP7326600B2 (ja) | 2019-09-27 | 2023-08-15 | 北京字節跳動網絡技術有限公司 | 異なるビデオユニット間の適応ループフィルタリング |
EP4029263A4 (en) | 2019-10-10 | 2022-12-07 | Beijing Bytedance Network Technology Co., Ltd. | FILLING PROCEDURE AT UNAVAILABLE SAMPLING POINTS IN AN ADAPTIVE LOOP FILTERING |
KR102707834B1 (ko) | 2019-10-29 | 2024-09-19 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 루마 차이를 이용한 크로스 컴포넌트 적응적 루프 필터 |
BR112022011466A2 (pt) | 2019-12-11 | 2022-08-23 | Beijing Bytedance Network Tech Co Ltd | Método de processamento de dados de vídeo, aparelho para processamento de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório |
JP7475908B2 (ja) * | 2020-03-17 | 2024-04-30 | シャープ株式会社 | 予測画像生成装置、動画像復号装置及び動画像符号化装置 |
CN116325728A (zh) | 2020-06-30 | 2023-06-23 | 抖音视界有限公司 | 自适应环路滤波的边界位置 |
WO2023118280A1 (en) * | 2021-12-21 | 2023-06-29 | Interdigital Vc Holdings France, Sas | Gdr interaction with template based tools in intra slice |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1593065A (zh) * | 2001-11-27 | 2005-03-09 | 诺基亚有限公司 | 其中图像被分成条带的前景和背景的视频编码与解码 |
CN1595990A (zh) * | 2004-07-02 | 2005-03-16 | 上海广电(集团)有限公司中央研究院 | 基于图像切片结构的帧场自适应编码方法 |
US20060078209A1 (en) * | 2004-10-12 | 2006-04-13 | Canon Kabushiki Kaisha | Image coding apparatusa and method |
US20080089405A1 (en) * | 2004-10-12 | 2008-04-17 | Suk Hee Cho | Method and Apparatus for Encoding and Decoding Multi-View Video Using Image Stitching |
CN101389021A (zh) * | 2007-09-14 | 2009-03-18 | 华为技术有限公司 | 视频编解码方法及装置 |
CN101873494A (zh) * | 2010-04-30 | 2010-10-27 | 南京邮电大学 | 基于切片级别的视频传输中动态交织的方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7075991B1 (en) | 1993-01-18 | 2006-07-11 | Sony Corporation | Apparatus for encoding and decoding header data in picture signal transmission |
JP2001086002A (ja) * | 1999-09-17 | 2001-03-30 | Sanyo Electric Co Ltd | データ符号化装置 |
JP2004193897A (ja) * | 2002-12-10 | 2004-07-08 | Ntt Docomo Inc | 動画像符号化方法、動画像復号化方法、動画像符号化装置、動画像復号化装置、及びこれらを実行するためのプログラム |
US7924921B2 (en) | 2003-09-07 | 2011-04-12 | Microsoft Corporation | Signaling coding and display options in entry point headers |
US20090310686A1 (en) | 2008-06-17 | 2009-12-17 | Do-hyoung Kim | Distributed decoding device of sequential parallel processing scheme and method for the same |
US9467699B2 (en) * | 2008-12-03 | 2016-10-11 | Hfi Innovation Inc. | Method for performing parallel coding with ordered entropy slices, and associated apparatus |
SG173007A1 (en) * | 2009-01-15 | 2011-08-29 | Agency Science Tech & Res | Image encoding methods, image decoding methods, image encoding apparatuses, and image decoding apparatuses |
JP5344238B2 (ja) | 2009-07-31 | 2013-11-20 | ソニー株式会社 | 画像符号化装置および方法、記録媒体、並びにプログラム |
US8995527B2 (en) | 2010-02-19 | 2015-03-31 | Qualcomm Incorporated | Block type signalling in video coding |
JP2012028863A (ja) * | 2010-07-20 | 2012-02-09 | Hitachi Kokusai Electric Inc | 動画像符号化装置 |
US9325999B2 (en) * | 2011-03-10 | 2016-04-26 | Sharp Kabushiki Kaisha | Video decoder for slices |
US9872015B2 (en) * | 2011-04-21 | 2018-01-16 | Hfi Innovation Inc. | Method and apparatus for improved in-loop filtering |
US8767824B2 (en) * | 2011-07-11 | 2014-07-01 | Sharp Kabushiki Kaisha | Video decoder parallelization for tiles |
KR101649207B1 (ko) * | 2011-08-31 | 2016-08-19 | 노키아 테크놀로지스 오와이 | 멀티뷰 비디오 코딩 및 디코딩을 위한 방법, 장치 및 컴퓨터 프로그램 |
ES2844148T3 (es) * | 2011-09-19 | 2021-07-21 | Sun Patent Trust | Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes |
-
2012
- 2012-10-25 US US13/660,635 patent/US9247258B2/en active Active
- 2012-10-26 BR BR112014010046-2A patent/BR112014010046B1/pt active IP Right Grant
- 2012-10-26 AU AU2012328617A patent/AU2012328617A1/en not_active Abandoned
- 2012-10-26 MY MYPI2014700883A patent/MY168318A/en unknown
- 2012-10-26 HU HUE17200197A patent/HUE051181T2/hu unknown
- 2012-10-26 CA CA2852792A patent/CA2852792C/en active Active
- 2012-10-26 JP JP2014539053A patent/JP5882487B2/ja active Active
- 2012-10-26 IN IN3134CHN2014 patent/IN2014CN03134A/en unknown
- 2012-10-26 EP EP12787262.0A patent/EP2772050A1/en not_active Ceased
- 2012-10-26 CN CN201280053106.7A patent/CN103947207B/zh active Active
- 2012-10-26 EP EP17200197.6A patent/EP3340626B1/en active Active
- 2012-10-26 WO PCT/US2012/062166 patent/WO2013063425A1/en active Application Filing
- 2012-10-26 SG SG11201401424WA patent/SG11201401424WA/en unknown
- 2012-10-26 KR KR1020147013953A patent/KR101613858B1/ko active IP Right Grant
- 2012-10-26 DK DK17200197.6T patent/DK3340626T3/da active
- 2012-10-26 ES ES17200197T patent/ES2841424T3/es active Active
-
2014
- 2014-04-08 IL IL232002A patent/IL232002A/en active IP Right Grant
- 2014-05-23 ZA ZA2014/03808A patent/ZA201403808B/en unknown
-
2016
- 2016-03-11 AU AU2016201602A patent/AU2016201602B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1593065A (zh) * | 2001-11-27 | 2005-03-09 | 诺基亚有限公司 | 其中图像被分成条带的前景和背景的视频编码与解码 |
CN1595990A (zh) * | 2004-07-02 | 2005-03-16 | 上海广电(集团)有限公司中央研究院 | 基于图像切片结构的帧场自适应编码方法 |
US20060078209A1 (en) * | 2004-10-12 | 2006-04-13 | Canon Kabushiki Kaisha | Image coding apparatusa and method |
US20080089405A1 (en) * | 2004-10-12 | 2008-04-17 | Suk Hee Cho | Method and Apparatus for Encoding and Decoding Multi-View Video Using Image Stitching |
CN101389021A (zh) * | 2007-09-14 | 2009-03-18 | 华为技术有限公司 | 视频编解码方法及装置 |
CN101873494A (zh) * | 2010-04-30 | 2010-10-27 | 南京邮电大学 | 基于切片级别的视频传输中动态交织的方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108737841A (zh) * | 2017-04-21 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 编码单元深度确定方法及装置 |
US10841583B2 (en) | 2017-04-21 | 2020-11-17 | Tencent Technology (Shenzhen) Company Limited | Coding unit depth determining method and apparatus |
US11405649B2 (en) | 2020-02-18 | 2022-08-02 | Mediatek Inc. | Specifying slice chunks of a slice within a tile |
TWI785502B (zh) * | 2020-02-18 | 2022-12-01 | 聯發科技股份有限公司 | 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 |
WO2021170132A1 (en) * | 2020-02-28 | 2021-09-02 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods simplifying signalling slice header syntax elements |
US11729391B2 (en) | 2020-02-28 | 2023-08-15 | Huawei Technologies Co., Ltd. | Encoder, a decoder and corresponding methods simplifying signaling slice header syntax elements |
WO2021185311A1 (en) * | 2020-03-20 | 2021-09-23 | Mediatek Inc. | Method and apparatus for signaling tile and slice partition information in image and video coding |
Also Published As
Publication number | Publication date |
---|---|
WO2013063425A1 (en) | 2013-05-02 |
JP5882487B2 (ja) | 2016-03-09 |
BR112014010046A8 (pt) | 2017-06-20 |
IL232002A0 (en) | 2014-05-28 |
SG11201401424WA (en) | 2014-05-29 |
IL232002A (en) | 2017-08-31 |
KR101613858B1 (ko) | 2016-04-29 |
BR112014010046A2 (pt) | 2017-06-13 |
KR20140088575A (ko) | 2014-07-10 |
JP2014534737A (ja) | 2014-12-18 |
CA2852792A1 (en) | 2013-05-02 |
EP3340626B1 (en) | 2020-09-30 |
AU2016201602B2 (en) | 2017-06-01 |
AU2016201602A1 (en) | 2016-04-07 |
US20130107952A1 (en) | 2013-05-02 |
MY168318A (en) | 2018-10-30 |
RU2014120983A (ru) | 2015-12-10 |
US9247258B2 (en) | 2016-01-26 |
CA2852792C (en) | 2017-02-28 |
EP2772050A1 (en) | 2014-09-03 |
HUE051181T2 (hu) | 2021-03-01 |
IN2014CN03134A (zh) | 2015-07-03 |
AU2012328617A1 (en) | 2014-05-08 |
ES2841424T3 (es) | 2021-07-08 |
EP3340626A1 (en) | 2018-06-27 |
ZA201403808B (en) | 2017-01-25 |
BR112014010046B1 (pt) | 2022-05-10 |
DK3340626T3 (da) | 2020-12-14 |
CN103947207B (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103947207A (zh) | 用于图片分割方案的统一设计 | |
CN103190147B (zh) | 用于视频译码的语法元素的联合译码方法及设备 | |
JP6396439B2 (ja) | 残差差分パルスコード変調(dpcm)拡張ならびに変換スキップ、回転、および走査との調和 | |
CN104221374A (zh) | 在视频译码中分群经旁路译码语法元素 | |
US11539982B2 (en) | Merge estimation region for multi-type-tree block structure | |
CN103959785A (zh) | 在视频译码中用于色度分量的变换单位分割 | |
CN103797801A (zh) | 视频译码中的非正方形变换单元和预测单元 | |
CN104205829A (zh) | 合并信令及环路滤波器开/关信令 | |
CN104081777A (zh) | 用于视频译码的残余四叉树(rqt)译码 | |
CN103975596A (zh) | 用于视频译码的瓦片的分组 | |
CN104685875A (zh) | 用于视频译码中的4:2:2样本格式的帧内译码 | |
CN104365106A (zh) | 发信用于视频译码的长期参考图片的数据 | |
CN104054347A (zh) | 在视频译码中波前平行处理的使用的指示 | |
CN103959775A (zh) | 帧内模式视频译码 | |
CN103891279A (zh) | 用于帧内预测译码的最大概率变换 | |
CN104412591A (zh) | 用于差域帧内预测的帧内模式扩展 | |
CN104221380A (zh) | 用于并行运动估计的共同空间候选块 | |
CN104040900A (zh) | 用于上下文自适应二进制算术译码的上下文数目缩减 | |
CN103718551A (zh) | 在视频译码中用信号发出图片大小 | |
CN103931182A (zh) | 帧内预测视频译码中的非正方形变换 | |
CN103563378A (zh) | 存储器高效的上下文建模 | |
CN103621082A (zh) | 视频译码中的量化 | |
CN104704843A (zh) | 视频性质的指示 | |
CN104704833A (zh) | 多视图或3维视频译码中的高级视图间残差预测 | |
CN104247421A (zh) | 用于系数扫描的系数群及系数译码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1196196 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1196196 Country of ref document: HK |