CN103329530A - 视频译码中的子切片 - Google Patents

视频译码中的子切片 Download PDF

Info

Publication number
CN103329530A
CN103329530A CN2012800060707A CN201280006070A CN103329530A CN 103329530 A CN103329530 A CN 103329530A CN 2012800060707 A CN2012800060707 A CN 2012800060707A CN 201280006070 A CN201280006070 A CN 201280006070A CN 103329530 A CN103329530 A CN 103329530A
Authority
CN
China
Prior art keywords
section
son
deciphering
son section
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012800060707A
Other languages
English (en)
Other versions
CN103329530B (zh
Inventor
穆罕默德·蔡德·科班
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103329530A publication Critical patent/CN103329530A/zh
Application granted granted Critical
Publication of CN103329530B publication Critical patent/CN103329530B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

一种视频编码器将图片的切片分割为多个子切片。当所述视频编码器编码所述切片时,所述视频编码器产生经译码切片,其包含对应于所述子切片的经译码子切片。所述子切片中的每一者可独立于所述子切片中的每一另一者来剖析且可独立于所述子切片中的每一另一者来重构。因此,一种视频解码器可并行地剖析所述子切片中的两者或两者以上,且并行地解码所述子切片中的两者或两者以上。

Description

视频译码中的子切片
相关申请案的交叉参考
本申请案主张2011年1月26日申请的第61/436,560号美国临时申请案以及2011年3月8日申请的第61/450,473号美国临时申请案的权益,所述申请案的整个内容以引用的方式并入本文中。
技术领域
本发明涉及用于编码和解码视频数据的技术。
背景技术
数字视频能力可并入到较宽范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置等。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)界定的标准和所述标准的扩展部分中所描述的那些视频压缩技术,以更有效地发射和接收数字视频信息。
视频压缩技术执行空间预测和/或时间预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将一视频帧或切片分割成若干块。可进一步分割每一块。使用相对于相邻块的空间预测来编码经帧内译码(I)帧或切片中的块。经帧间译码(P或B)的帧或切片中的块可相对于同一帧或切片中的相邻块使用空间预测,或相对于其它参考帧使用时间预测。
发明内容
本发明的技术大体上涉及编码和解码视频数据。更具体地说,一种视频编码器将图片的切片分割为多个子切片。此外,所述视频编码器产生经译码切片。经译码切片包含对应于子切片的经译码子切片。子切片中的每一者可独立于子切片中的每一另一者来剖析且可独立于子切片中的每一另一者来重构。相应地,一种视频解码器可并行剖析子切片中的两者或两者以上,且并行解码所述子切片中的两者或两者以上。子切片的使用可实现图片的较多分区,其可用比等效数目的切片少的位来独立剖析且重构。
在一个实例中,本发明描述一种用于编码视频数据的方法。所述方法包括编码所述视频数据中的图片的切片以形成经译码切片。将所述切片分割为多个子切片。所述经译码切片包含对应于所述子切片的经译码子切片。所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构。所述方法还包括产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
在另一实例中,本发明描述一种解码视频数据的方法。所述方法包括接收经译码切片。所述经译码切片为所述视频数据中的图片的切片的经编码形式。所述切片包含第一子切片和第二子切片。所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片。编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析,且可独立于彼此而重构。所述方法还包括并行剖析所述第一和第二子切片。此外,所述方法包括在剖析所述第一和第二子切片之后,并行重构所述第一和第二子切片。
在另一实例中,本发明描述一种包括一个或一个以上处理器的视频编码设备,所述一个或一个以上处理器经配置以编码所述视频数据中的图片的切片以形成经译码切片。将所述切片分割为多个子切片。所述经译码切片包含对应于所述子切片的经译码子切片。所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构。所述一个或一个以上处理器还经配置以产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
在另一实例中,本发明描述一种包括一个或一个以上处理器的视频解码设备,所述一个或一个以上处理器经配置以接收经译码切片。所述经译码切片为所述视频数据中的图片的切片的经编码形式。所述切片包含第一子切片和第二子切片。所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片。编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析,且可独立于彼此而重构。所述一个或一个以上处理器还经配置以并行剖析所述第一和第二子切片。另外,所述一个或一个以上处理器经配置以在剖析所述第一和第二子切片之后,并行解码所述第一和第二子切片。
在另一实例中,本发明描述一种视频编码设备,其包括用于编码所述视频数据中的图片的切片以形成经译码切片的装置。将所述切片分割为多个子切片。所述经译码切片包含对应于所述子切片的经译码子切片。所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构。所述视频编码设备还包括用于产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置的装置。
在另一实例中,本发明描述一种视频解码设备,其包括用于接收经译码切片的装置。所述经译码切片为所述视频数据中的图片的切片的经编码形式。所述切片包含第一子切片和第二子切片。所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片。编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析,且可独立于彼此而重构。所述视频解码设备还包括用于并行剖析所述第一和第二子切片的装置。另外,所述视频解码设备包括用于在剖析所述第一和第二子切片之后并行重构所述第一和第二子切片的装置。
在另一实例中,本发明描述一种计算机程序产品,其包括一个或一个以上计算机存储媒体,所述一个或一个以上计算机存储媒体存储计算机可执行指令,所述计算机可执行指令配置一个或一个以上处理器以编码所述视频数据中的图片的切片以形成经译码切片。将所述切片分割为多个子切片。所述经译码切片包含对应于所述子切片的经译码子切片。所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构。所述计算机可执行指令还配置所述一个或一个以上处理器以产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
在另一实例中,本发明描述一种计算机程序产品,其包括一个或一个以上计算机存储媒体,所述一个或一个以上计算机存储媒体存储计算机可执行指令,所述计算机可执行指令配置一个或一个以上处理器以接收经译码切片。所述经译码切片为所述视频数据中的图片的切片的经编码形式。所述切片包含第一子切片和第二子切片。所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片。编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析,且可独立于彼此而重构。所述计算机可执行指令还配置一个或一个以上处理器以并行剖析所述第一和第二子切片。所述计算机可执行指令还配置一个或一个以上处理器以在剖析所述第一和第二子切片之后,并行重构所述第一和第二子切片。
本发明的一个或一个以上方面的细节在附图和以下描述中陈述。本发明中所描述的技术的其它特征、目标和优点将从所述描述和图式且从所附权利要求书中显而易见。
附图说明
图1是说明实例视频译码系统的框图。
图2是说明视频编码器的实例配置的框图。
图3是说明视频解码器的实例配置的框图。
图4是说明由视频编码器执行以产生经译码图片的实例操作的流程图。
图5是说明由视频解码器执行的实例操作的流程图。
图6是说明分割为切片和子切片的实例图片的概念图。
具体实施方式
附图说明实例。由附图中的参考编号指示的元件对应于由以下描述中的参考编号指示的元件。在本发明中,具有以序数词(例如,“第一”、“第二”、“第三”等等)开始的名称的元件不一定暗示所述元件具有特定次序。相反,此等序数词仅用以指代相同或类似类型的不同元件。
本发明的技术通常涉及编码和解码视频数据。更具体地说,视频编码器将图片分割为一个或一个以上切片,且将一个或一个以上切片分割为多个子切片。此外,视频编码器编码所述切片以形成经译码切片。作为产生经译码切片的部分,视频编码器编码子切片以产生经译码子切片。可独立于所述子切片中的每一另一者来剖析且可独立于所述子切片中的每一另一者来重构所述子切片中的每一者。子切片的使用可实现图片的较多分区,与等效数目的切片相比,可用较少的位来独立地剖析和重构所述分区。
视频编码器可输出包含经译码切片的位流。因为可独立地剖析子切片,所以视频解码器可并行剖析子切片中的两者或两者以上。当视频解码器剖析子切片时,视频编码器可从位流提取与子切片相关联的语法元素。在一些例子中,剖析子切片可涉及执行一个或一个以上熵解码操作。如果视频解码器能够在不使用通过提取与第二子切片相关联的语法元素而获得的数据的情况下提取与第一子切片相关联的语法元素,那么视频解码器可独立于第二子切片来剖析第一子切片,且反之亦然。
因为可独立地重构子切片,所以视频解码器可并行重构子切片。当视频解码器重构子切片时,视频解码器可使用与所述子切片相关联的语法元素来确定子切片的像素值。如果视频解码器能够在不使用通过重构第二子切片而获得的数据的情况下重构第一子切片,那么可独立于第二子切片来重构第一子切片,且反之亦然。作为一个实例,视频解码器经配置以独立于其它子切片对每一子切片内的块进行帧内解码,即不将来自其它子切片中的块的信息用于帧内预测解码和重构。
图1是说明可利用本发明中所述的技术的实例视频译码系统10的框图。在本发明中,术语“视频译码”可指代视频编码和视频解码。如图1中所示,视频译码系统10包含源装置12和目的地装置14。源装置12产生经编码视频数据。因此,源装置12可为视频编码设备。目的地装置14可在稍后时间解码经编码视频数据。因此,目的地装置14可为视频解码设备。源装置12和目的地装置14可包括较宽范围的装置或设备中的任一者,包含桌上型计算机、笔记本型(即,膝上型)计算机、服务器计算机、机架安装式计算机、平板计算机、机顶盒、移动电话、电话手持机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置、车载计算机,或能够编码和/或解码视频数据的计算装置类型。
目的地装置14可经由通信信道16接收经编码视频数据。通信信道16可包括能够将经编码视频数据从源装置12移到目的地装置14的媒体或装置。在一个实例中,通信信道16可包括使源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。源装置12或另一装置可根据通信标准(例如无线通信协议)来调制经编码视频数据。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理传输线。通信信道16可形成例如局域网、广域网或例如因特网等全球网络的基于包的网络的部分。通信信道16可包含可用于促进经编码视频数据从源装置12到目的地装置14的通信的路由器、交换器、基站或任何其它设备。
在一些实例中,源装置12和目的地装置14可为无线通信而配备。然而,本发明的技术不一定限于无线应用或设定。相反,所述技术可应用于支持多种多媒体应用(例如空中电视广播、有线电视发射、卫星电视发射、流式视频发射(例如经由因特网))中的任一者的视频译码,用于存储在数据存储媒体上的数字视频的编码,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,源装置12和目的地装置14可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
此外,在一些实例中,源装置12可将经编码视频数据输出到存储系统32。类似地,目的地装置14可存取存储在存储系统32上的经编码视频数据。在各种实例中,存储系统32可包含各种分布式或本地存取数据存储媒体。数据存储媒体的实例类型包含但不限于硬盘驱动器、蓝光光盘、DVD、CD-ROM、固态存储器单元、易失性或非易失性存储器,或适合存储经编码视频数据的其它数字存储媒体。
在一些实例中,存储系统32可包括可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储系统32存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、文件传送协议(FTP)服务器、网络附接存储(NAS)装置,或本地磁盘驱动器。目的地装置14可通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,数字订户线(DSL)、光纤、同轴电缆等),或两者的组合,其适合存取存储在文件服务器上的经编码视频数据。经编码视频数据从存储系统32的发射可为流式发射、下载发射或两者的组合。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些实例中,输出接口22还可包含调制器/解调器(调制解调器)和/或发射器。视频源18将视频数据提供给视频编码器20。在各种实例中,视频源18可包括用于提供视频数据的各种类型的装置和/或系统。举例来说,视频源18可包括视频捕获装置,例如摄像机。在另一实例中,视频源18可包括含有先前捕获的视频的视频档案。在又一实例中,视频源18可包括视频馈送接口,其从视频内容提供者接收视频。在又一实例中,视频源18可包括用于产生计算机图形数据的计算机图形系统。
如下文详细描述,视频编码器20可编码由视频源18提供的视频数据。在一些实例中,源装置12可经由输出接口22将经编码视频数据直接发射到目的地装置14。此外,在一些实例中,存储系统32可存储经编码视频数据,以供目的地装置14或其它装置稍后存取。
本发明还可通常涉及视频编码器20将某些信息“用信号通知”给另一装置,例如视频解码器30。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各个经编码部分相关联来用信号通知信息。语法元素可为位流中的数据元素。就是说,视频编码器20可通过将某些语法元素存储到视频数据的各个经编码部分来“用信号通知”数据。在一些情况下,此些语法元素在由视频解码器30接收和解码之前可经编码和存储(例如,存储到存储系统32)。因此,术语“用信号通知”可大体上指代用以解码经压缩视频数据的语法或其它数据的通信。此通信可实时或近实时地发生。或者,此通信可在一时间跨度上发生,例如可在编码时将语法元素存储到媒体时发生,视频解码器30接着可在存储到此媒体之后的某一时间检索所述语法元素。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30和显示装置34。在一些实例中,输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28从通信信道16和/或存储系统32接收经编码视频数据。视频解码器30解码由输入接口28接收的经编码视频数据。目的地装置14可再现经解码视频数据,以供在显示装置34上显示。
显示装置34可与目的地装置14集成或可在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置,且还可经配置以与外部显示装置介接。在各种实例中,显示装置34可包括各种类型的显示装置。举例来说,显示装置34可包括液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
尽管图1中未展示,但视频编码器20和视频解码器30可与音频编码器和解码器集成,且可包括适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频与视频两者的编码。在一些实例中,如果适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为多种合适电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件来实施时,装置可将用于所述软件的指令存储在合适的非暂时计算机可读媒体中,且使用一个或一个以上处理器来在硬件中执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一个或一个以上编码器或解码器中,其中的任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
视频编码器20和视频解码器30可根据视频压缩标准来操作,例如目前在开发的高效视频译码(HEVC)标准,且可符合HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可根据其它专有或行业标准来操作,例如ITU-T H.264标准,或者称为MPEG-4,部分10,高级视频译码(AVC),或此些标准的扩展。对标准的实例扩展包含对H.264/AVC标准的可按比例缩放视频译码(SVC)和多视图视频译码(MVC)扩展。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。本发明的技术不限于任何特定译码标准。
如上文简要提到,视频编码器20编码视频数据。视频数据可包括一个或一个以上图片序列。图片中的每一者为形成视频的部分的静止图像。在一些例子中,图片可称为视频“帧”。当视频编码器20编码视频数据时,视频编码器20可产生位流。位流包含形成经译码图片和相关联数据的表示的位序列。经译码图片为图片的经译码表示。
为了产生位流,视频编码器20可对视频数据中的图片序列执行编码操作。当视频编码器20对图片序列执行编码操作时,视频编码器20可产生一系列经译码图片和相关联数据。另外,视频编码器20可产生含有适用于所述图片序列的参数的序列参数集合。此外,视频编码器20可产生含有适用于作为整体的图片的参数的图片参数集合(PPS)。
为了产生经译码图片,视频编码器20可将图片分割为一个或一个以上树块。树块为视频数据的二维(2D)块。在一些例子中,树块也可称为最大译码单元(LCU)。HEVC的树块可广泛类似于先前标准(例如H.264/AVC)的宏块。然而,树块不一定限于特定大小,且可包含一个或一个以上译码单元(CU)。视频编码器20可使用四叉树分割来将每一树块分割为一个或一个以上CU,因此名为“树块”。如下文所述,视频编码器20可使用帧内预测或帧间预测来编码树块的未经分割CU。经译码CU为呈CU的经编码形式的CU。
在一些实例中,视频编码器20可将图片分割为多个切片。所述切片中的每一者可包含整数数目个CU。在一些例子中,切片包括整数数目个树块。在其它例子中,切片的边界可在树块内。在一些实例中,视频编码器20可基于切片的以字节计的大小或根据切片中的树块的数目来确定切片边界。
作为对图片执行编码操作的一部分,视频编码器20可对图片的每一切片执行编码操作。对切片的编码操作可产生与所述切片相关联的经编码数据。与切片相关联的经编码数据可称为“经译码切片”。经译码切片可包含切片标头和切片数据。切片标头可含有关于所述切片的语法元素。根据本发明的实例,切片数据可包含一系列经译码子切片。当经译码切片包含一个或一个以上经译码子切片时,经译码切片的切片标头可包含旗标,其指示经译码切片的切片数据中存在一个或一个以上经译码子切片。
作为对切片执行编码操作的一部分,视频编码器20可将切片分割为多个子切片。换句话说,视频编码器20可在切片的子切片之间划分切片的CU。切片的没有两个子切片包含相同CU。因此,给定CU可整个包含在单个子切片内。并且,单个子切片可包含多个CU。在一些实例中,子切片可包含彼此邻近布置在图片内的多个连续CU。视频编码器20可对子切片执行编码操作,以产生与子切片中的每一者相关联的经编码数据。与子切片相关联的经编码数据在本发明中可称为“经译码子切片”。
经译码子切片可包含子切片标头和子切片数据。子切片标头可含有关于所述子切片的语法元素。举例来说,子切片标头可识别对应子切片的第一CU,以便指定图片的CU中的哪些与对应子切片相关联。在一些实例中,子切片标头可指定经译码子切片的大小或下一经译码子切片的开始地址。在另一实例中,子切片标头可包含上下文自适应二进制算术译码(CABAC)初始化状态码(cabac_init_idc)。CABAC初始化状态码可将子切片熵译码初始化为前一子切片的状态或唯一状态,例如对于切片中的第一译码单元。在此实例中,如果子切片标头不包含CABAC初始化开始码,那么子切片可从对应切片标头继承CABAC初始化开始码。在另一实例中,子切片标头可包含子切片的量化参数(QP)或差量QP值。在此实例中,如果子切片标头不包含QP或差量QP值,那么子切片可继承对应切片标头所指定的QP或差量QP值。子切片标头可指定CABAC初始化开始码和QP或差量QP值中的任一者、两者或两者都不。在其它实例中,子切片标头可包含处理和/或解码子切片中有用的其它信息。子切片标头可指定子切片中的第一CU,以便指定来自图片的哪些CU与子切片相关联。在一些实例中,子切片标头可仅指定识别子切片在规则切片内的位置所必需的信息。子切片数据可包含一个或一个以上经译码树块。视频编码器20可对经译码子切片中的数据执行一个或一个以上熵编码操作。
如下文详细描述,视频编码器20可对子切片执行编码操作,使得可独立剖析且独立解码每一子切片。举例来说,可独立于来自其它子切片的信息而重构每一子切片中的块。因为可独立地剖析子切片,所以视频解码器30可在不使用通过剖析其它子切片中的任一者而获得的数据的情况下剖析子切片。因为可例如通过在具有来自同一子切片的信息而不具有来自其它子切片的信息的情况下进行帧内解码来独立地重构子切片,所以视频解码器30可在不使用通过重构其它子切片中的任一者而获得的数据的情况下重构子切片。
视频编码器20可产生信息以用信号通知经译码子切片在经译码切片内的位置。因此,视频解码器30可能够并行剖析子切片,且并行重构子切片。并行剖析子切片和并行重构子切片可减少剖析子切片和重构子切片所需的时间量,且可准许使用并行计算资源。
由视频编码器20产生的位流包含一系列网络抽象层(NAL)单元。NAL单元中的每一者可为含有NAL单元中的数据类型的指示的语法结构以及含有所述数据的字节。举例来说,NAL单元可含有表示序列参数集合、图片参数集合、经译码切片、补充增强信息(SEI)、存取单元定界符、填充物数据或另一类型的数据的数据。本发明可将含有经译码切片的NAL单元称为经译码切片NAL单元。
位流中的每一经译码切片NAL单元含有一经译码切片。经译码切片包含经译码切片标头和切片数据。切片数据可包含经译码子切片。经译码子切片中的每一者可包含经译码子切片标头和子切片数据。子切片数据可包含经译码树块。经译码树块可包含一个或一个以上经译码CU。
因此,经译码切片可如下布置:
|sliceHeader|SS_header_0|SS_data_0|SS_header_l|SS_data_l|........|sliceHeader.....
在以上实例中,sliceHeader指代规则切片标头。在经译码切片内,每一子切片(SS)可包含子切片标头(SS_header),其包含关于相应子切片的大小的信息,或下一子切片在规则切片中的开始地址。如上文所示,每一规则切片可包含多个子切片0,1,...n,且对于每一子切片包含子切片标头(例如,SS_header_0、SS_header_l、…SS_header_n)以及子切片数据(例如,SS_data_0、SS_data_l、…SS_data_n)。
此子切片标头信息可使解码器能够定位每一子切片在规则切片内的位置,以用于子切片数据的并行处理和熵解码。连同大小或开始地址信息,可在每一SS_header中用信号通知CABAC上下文初始化idc(cabac_init_idc)。作为大小或开始地址信令的替代方案,可使用开始码来定位子切片在规则切片内的位置。
作为替代方案,与位流中的经译码子切片的位置有关的一些或所有子切片信息可在切片标头内“预先”用信号通知,或在切片标头之后(即,在切片标头的结尾)立即用信号通知。在此情况下,切片数据可布置如下:
|sliceHeader||SS_size0|SS_size1|…|SS_sizeN||SS_data_0|SS_data1|...|....|sliceHeader...
切片可包含切片标头,其包含通常与切片标头相关联的信息,以及指示每一子切片在规则切片内的大小或位置的信息。如上文所示,切片标头(sliceHeader)可包含指示每一子切片(SS_size0、SS_size1、…SS_sizeN)的大小(例如,以字节计)的大小信息。在切片标头之后,切片数据可包含子切片数据(SS_data_0、SS_data_1、…SS_data_N)。如上文所示,下一规则切片的切片标头出现在前一规则切片的结尾处。
如果存在cabac_init_idc,那么其存储在SS_data字段中。在SS_size字段中,可通过将0字节SS大小插入在切片标头的结尾处来用信号通知存在于规则切片中的子切片的数目。对SS_size字段的数目进行计数直到0字节SS大小字段可提供规则切片中的子切片的数目。在其它实例中,可在切片标头之后立即用信号通知规则切片中的子切片的数目。
当视频解码器30接收到由视频编码器20产生的位流时,视频解码器30可对所述位流执行剖析操作。当视频解码器30执行剖析操作时,视频解码器30可从位流提取与子切片相关联的语法元素。与子切片相关联的语法元素可包含与子切片中的CU相关联的语法元素。CU的语法元素可包含与CU相关联的变换系数块。在一些例子中,通过提取与子切片相关联的语法元素而进行的剖析可涉及对对应经译码子切片中的数据执行一个或一个以上熵解码操作。因此,剖析可通常包含熵解码。
因为子切片可独立剖析,所以视频解码器30可能够并行对图片的每一不同子切片中的数据执行剖析操作(以及相关联的熵解码操作)。举例来说,可在不使用来自图片的任何其它子切片的信息的情况下,对子切片执行熵解码操作。因为视频解码器30能够并行对子切片执行剖析操作,所以视频解码器30可能够在比视频解码器30依序对子切片执行剖析操作少的时间内对子切片执行剖析操作。
此外,视频解码器30可执行重构操作,其使用与子切片相关联的语法元素来重构对应子切片中的CU的像素值。因为视频编码器20产生了子切片,使得可独立地重构子切片,所以视频解码器30可能够并行对不同子切片执行重构操作。举例来说,如果切片包含第一子切片和第二子切片,第一子切片包含第一组一个或一个以上CU,且第二子切片包含第二组一个或一个以上CU,那么视频解码器30可能够并行对对应于第一和第二组CU的CU执行重构操作。因为视频解码器30能够并行对子切片执行重构操作,所以视频解码器30可能够在比视频解码器30依序重构子切片少的时间内重构子切片。
通过将切片分割为子切片,视频编码器20可增加图片的可独立剖析和重构的分区的数目。当存在较大数目的可独立剖析和重构的分区时,视频解码器30可使用并行计算资源在比存在较少可独立剖析和重构的分区时少的时间内完全重构图片。将图片分割为额外切片还可增加图片的可独立剖析和重构的分区的数目。然而,仅将图片分割为切片(与将切片分割为子切片相对)可产生包含比将切片分割为子切片多的位的位流,如本文所述。
这可至少部分地归因于切片标头的大小。每一切片标头可包含相对较大数目的语法元素。用于相邻切片的切片标头可包含具有相同值的语法元素。因此,如果视频编码器20将仅将图片分割为切片(而不将切片分割为子切片),那么切片标头中的每一者将重复相同值,从而增加位流中的位的数目。相反,子切片标头可包含相对较小数目的语法元素,因为子切片共同的语法元素可存在于对应的切片标头中,且从子切片标头省略。
此外,HEVC可要求视频编码器20所产生的位流针对每一切片包含单独的NAL单元。每一NAL单元包含一标头,这增加了位流中的位的数目。相反,单个经译码切片NAL单元可含有多个经译码子切片。因此,图片的可独立剖析和独立重构的分区的数目可增加,而不增加NAL单元的数目,且不增加与NAL单元的标头相关联的位。
如上文所提到,可独立剖析子切片,且可独立重构子切片。因此,对于视频编码器20和视频解码器30来说,包含用于确定相邻单元是否可用于剖析和重构的不同逻辑可为不必要的。因此,视频编码器20和视频解码器30可比子切片可独立剖析或子切片可独立重构(但不是两者)的情况简单。以此方式,使用子切片可提供独立地供应图片的可独立剖析和重构的分区的高效方式。
图2是说明经配置以实施本发明的技术的视频编码器20的配置的实例的框图。出于阐释的目的提供图2,且不应将其视为限制如本发明中广泛阐释和描述的技术。出于阐释的目的,本发明在HEVC译码的上下文中描述视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
在图2的实例中,视频编码器20包含多个功能组件。视频编码器20的功能组件包含预测模块100、残余产生模块102、变换模块104、量化模块106、逆量化模块108、逆变换模块110、重构模块112以及经解码图片缓冲器114,以及熵编码模块116。预测模块100包含运动估计模块122、运动补偿模块124以及帧内预测模块126。
在其它实例中,视频编码器20可包含较多、较少或不同功能组件。举例来说,视频编码器20可包含解块滤波器以对重构模块112的输出进行滤波,以将成块假象从经重构视频中去除。此外,运动估计模块122和运动补偿模块124可高度集成,但在图2的实例中出于阐释的目的而分开表示。
视频编码器20可接收视频数据。在各种实例中,视频编码器20可从各种来源接收视频数据。举例来说,视频编码器20可从视频源18(图1)或另一来源接收视频数据。视频数据可表示图片序列。为了编码视频数据,视频编码器20可对每一图片序列执行编码操作。作为对图片序列执行编码操作的一部分,视频编码器20可对图片序列内的每一图片执行编码操作。作为对图片执行编码操作的一部分,视频编码器20可对图片中的每一切片执行编码操作。当视频编码器20对切片执行编码操作时,视频编码器20产生经译码切片。经译码切片为呈其经编码形式的切片。经译码切片可包含切片标头和切片数据。切片标头可含有与所述切片相关联的语法元素。
作为对切片执行编码操作的一部分,预测模块100可将切片分割为多个子切片。视频解码器30可用切片标头中的旗标来用信号通知规则切片中子切片数据的存在。视频编码器20可对子切片中的每一者执行编码操作。当视频编码器20对子切片执行编码操作时,视频编码器20产生经译码子切片。经译码子切片可为呈其经编码形式的子切片。在本发明中,如果经译码子切片为呈其经编码形式的子切片,那么可将经译码子切片称为对应于子切片。经译码切片的切片数据可包含多个经译码子切片。经译码子切片可包含子切片标头和子切片数据。子切片标头含有与所述子切片相关联的语法元素。
在各种实例中,预测模块100可以各种方式将切片分割为多个子切片。举例来说,预测模块100可将切片分割为子切片,使得子切片中的每一者具有相等数目的树块。在另一实例中,预测模块100可基于先前编码的图片中的运动等级将切片分割为不同数目的子切片。在一些实例中,预测模块100可使用如用以将图片分割为切片的类似技术将切片分割为子切片。
作为对子切片执行编码操作的一部分,视频编码器20可对子切片中的树块执行编码操作。当视频编码器20对树块执行编码操作时,视频编码器20可产生经译码树块。经译码树块可包括表示树块的经编码版本的数据。换句话说,经译码树块可为呈其经编码形式的树块。
作为对树块执行编码操作的一部分,预测模块100可对树块执行四叉树分割,以将树块分为逐渐变小的CU。举例来说,预测模块100可将树块分割为四个相等大小的子CU,将子CU中的一者或一者以上分割为四个相等大小的子子CU,依此类推。
CU的大小的范围可从8x8像素至多达具有最大64x64像素或以上的树块的大小。在本发明中,“NxN”与“N乘N”可互换使用,以指代依据垂直和水平尺寸的视频块的像素尺寸,例如16x16像素或16乘16像素。一般来说,16x16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样地,NxN块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。
作为对树块执行编码操作的一部分,预测模块100可产生树块的分层四叉树数据结构。举例来说,树块可对应于四叉树数据结构的根节点。如果预测模块100将树块分割为四个子CU,那么根节点在四叉树数据结构中具有四个子节点。子节点中的每一者对应于子CU中的一者。如果预测模块100将子CU中的一者分割为四个子子CU,那么对应于子CU的节点可具有四个子节点,其中的每一者对应于子子CU中的一者。
四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,指示对应于所述节点的CU是否被分割(即分裂)为四个子CU。CU的语法元素可递归地界定,且可取决于CU是否分裂为子CU。未经分割的CU可对应于四叉树数据结构中的叶节点。四叉树数据结构中的叶节点可称为“译码节点”。经译码树块可包含基于对应树块的四叉树数据结构的数据。经译码树块为呈其经编码形式的树块。当经译码树块为呈其经编码形式的树块时,经译码树块对应于树块。
视频编码器20可对树块的每一未经分割CU执行编码操作。当视频编码器20对未经分割CU执行编码操作时,视频编码器20产生表示未经分割CU的经编码版本的数据。
作为对CU执行编码操作的一部分,运动估计模块122和运动补偿模块124可对CU执行帧间预测。换句话说,运动估计模块122和运动补偿模块124可基于参考图片的经解码样本而不是含有CU的图片来产生CU的预测数据。帧间预测可提供时间压缩。
为了对CU执行帧间预测,运动估计模块122可将CU分割为一个或一个以上预测单元(PU)。视频编码器20和视频解码器30可支持各种PU大小。假定特定CU的大小为2Nx2N,视频编码器20和视频解码器30可支持2Nx2N或NxN的PU大小,以及2Nx2N、2NxN、Nx2N、NxN、2NxnU、nLx2N、nRx2N或类似的对称PU大小的帧间预测。视频编码器20和视频解码器30还可支持2NxnU、2NxnD、nLx2N和nRx2N的PU大小的不对称分割。在一些实例中,运动估计模块122可沿不以直角与CU的边相会的边界将CU分割为PU。
运动估计模块122可执行关于CU的每一PU的运动估计操作。当运动估计模块122执行关于PU的运动估计操作时,运动估计模块122可产生PU的一个或一个以上运动向量。举例来说,切片可为I切片、P切片或B切片。运动估计模块122和运动补偿模块124可依据CU是在I切片中、P切片中还是B切片中来对CU的PU执行不同操作。在I切片中,所有CU均经帧内预测。因此,如果CU在I切片中,那么运动估计模块122和运动补偿模块124不对CU执行帧间预测。
如果CU在P切片中,那么含有所述CU的图片与称为“列表0”的参考图片列表相关联。列表0中的参考图片中的每一者含有可以解码次序用于后续图片的帧间预测的样本。当运动估计模块122执行关于P切片中的PU的运动估计操作时,运动估计模块122搜索列表0中的参考图片,以寻找PU的参考样本。PU的参考样本可为一组像素值,例如像素块,其最接近地对应于PU的像素值。运动估计模块122可使用多种度量来确定参考图片中的一组像素值对应于PU的像素值的接近程度。举例来说,运动估计模块122可通过绝对差和(SAD)、平方差和(SSD)或其它不同度量来确定参考图片中的一组像素值对应于PU的像素值的接近程度。
在识别P切片中的CU的PU的参考样本之后,运动估计模块122可产生:参考索引,其指示列表0中含有参考样本的参考图片;以及运动向量,其指示PU与参考样本之间的空间移位。在各种实例中,运动估计模块122可根据不同的精确度来产生运动向量。举例来说,运动估计模块122可在四分之一像素精度、八分之一像素精度或其它分数像素精度下产生运动向量。在分数像素精度的情况下,可从参考图片中的整数位置像素值内插参考像素值。运动估计模块122可将PU的运动信息输出到熵编码模块116和运动补偿模块124。PU的运动信息可包含PU的参考索引和运动向量。运动补偿模块124可使用CU的PU的运动信息来识别和检索PU的参考样本。运动补偿模块124可接着使用PU的参考样本的像素值来产生CU的预测数据。
如果CU在B切片中,那么含有所述CU的图片可与称为“列表0”和“列表1”的两个参考图片列表相关联。列表0中的参考图片中的每一者含有可以解码次序用于后续图片的帧间预测的样本。列表1中的参考图片在解码次序中出现在图片之前,但在呈现次序中出现在所述图片之后。在一些实例中,含有B切片的图片可与作为列表0与列表1的组合的列表组合相关联。
此外,如果CU在B切片中,那么运动估计模块122可对CU的PU执行单向预测或双向预测。当运动估计模块122对PU执行单向预测时,运动估计模块122可搜索列表1的参考图片以寻找PU的参考样本。运动估计模块122可接着产生:参考索引,其指示列表1中含有参考样本的参考图片;以及运动向量,其指示PU与参考样本之间的空间移位。运动估计模块122可将CU的PU的运动信息输出到熵编码模块116和运动补偿模块124。PU的运动信息可包含PU的参考索引、预测方向指示符和运动向量。预测方向指示符可指示参考索引是指示列表0还是列表1中的参考图片。运动补偿模块124可使用CU的PU的运动信息来识别和检索PU的参考样本。运动补偿模块124可接着使用PU的参考样本的像素值来产生CU的预测数据。
当运动估计模块122对PU执行双向预测时,运动估计模块122可搜索列表0中的参考图片以寻找PU的参考样本,且还可搜索列表1中的参考图片以寻找PU的另一参考样本。运动估计模块122可接着产生:参考索引,其指示列表0和列表1中含有参考样本的参考图片;以及运动向量,其指示参考样本与PU之间的空间移位。运动估计模块122可将PU的运动信息输出到熵编码模块116和运动补偿模块124。PU的运动信息可包含PU的参考索引和运动向量。运动补偿模块124可使用运动信息来识别和检索PU的参考样本。运动补偿模块124可接着从CU的PU的参考样本中的像素值内插CU的预测数据的像素值。
在一些例子中,运动估计模块122不将PU的完整一组运动信息输出到熵编码模块116。而是,运动估计模块122可参考另一PU的运动信息来用信号通知PU的运动信息。举例来说,运动估计模块122可确定PU的运动信息是否充分类似于相邻PU的运动信息。在此实例中,运动估计模块122可在CU的四叉树节点中指示向视频解码器30指示PU具有与相邻PU相同的运动信息的值。在另一实例中,运动估计模块122可在与CU相关联的四叉树节点中识别相邻PU和运动向量差(MVD)。运动向量差指示PU的运动向量与所指示的相邻PU的运动向量之间的差。视频解码器30可使用所指示的相邻PU的运动向量以及运动向量差来预测PU的运动向量。
通过在用信号通知第二PU的运动信息时参考第一PU的运动信息,视频编码器20可能够使用较少的位来用信号通知第二PU的运动信息。然而,这样做可阻碍视频解码器30并行地产生第一PU和第二PU的预测数据。举例来说,在视频解码器30能够预测第二PU的运动信息之前,视频解码器30将必须解码第一PU的运动信息。为了确保视频解码器30能够并行重构子切片,运动估计模块122不产生PU的运动信息,其指代在PU的子切片外部的PU的运动信息。换句话说,不准许跨越子切片边界的运动向量预测。因此,运动估计模块122可用信号通知子切片中的经帧间预测CU的PU的运动信息,使得子切片的经帧间预测CU的PU的运动信息的预测不取决于子切片外部的PU的运动信息。
作为对CU执行编码操作的一部分,帧内预测模块126可对CU执行帧内预测。换句话说,帧内预测模块126可基于其它CU的经解码像素值来产生CU的预测数据。帧内预测可提供空间压缩。
为了对CU执行帧内预测,帧内预测模块126可使用多种帧内预测模式来产生CU的多组预测数据。当帧内预测模块126使用帧内预测模式来产生CU的一组预测数据时,帧内预测模块126可在与帧内预测模式相关联的方向和/或梯度上越过CU扩展来自相邻CU的像素值。相邻CU可在CU的上方、右上方、左上方或左侧,假定CU和树块的从左到右、从上到下的编码次序。帧内预测模块126可依据CU的大小使用各种数目的帧内预测模式,例如33个定向帧内预测模式。
帧内预测模块126可以图片的每一子切片可在无来自图片的任一其它子切片的信息的情况下帧内解码的方式产生CU的预测数据。为了确保每一子切片均可在无来自图片的任何其它子切片的信息的情况下帧内解码,如果相邻CU在与CU相同的子切片中,那么帧内预测模块126可仅使用来自相邻CU的像素值。换句话说,帧内预测模块126可不使用来自一个子切片的像素值来产生不同子切片中的CU的预测数据。这可确保视频解码器30能够并行重构子切片,因为视频解码器30不需要从特定子切片外部的CU获得像素值以便对特定子切片中的CU执行帧内预测。以此方式,帧内预测模块126可编码子切片,使得子切片的经帧内预测CU的预测数据的产生不取决于任何其它子切片中的CU的像素值。举例来说,第一CU可与第二CU相邻,但第一CU和第二CU在不同的子切片中。在此实例中,帧内预测模块126在执行帧内预测以产生第二CU的预测数据时可不使用第一CU的像素值。
帧内预测模块126可为CU选择若干组预测数据中的一者。在各种实例中,帧内预测模块126可以各种方式为CU选择预测数据集合。举例来说,帧内预测模块126可通过计算预测数据集合的失真率且选择具有最低失真率的预测数据集合来为CU选择预测数据集合。
预测模块100可从由运动补偿模块124为CU产生的预测数据或由帧内预测模块126为CU产生的预测数据当中为CU选择预测数据。在一些实例中,预测模块100基于预测数据集合中的误差(即失真)为CU选择预测数据。
如果预测模块100选择由帧内预测模块126产生的预测数据,那么预测模块100可用信号通知曾用以产生预测数据的帧内预测模式,即选定帧内预测模式。预测模块100可以各种方式用信号通知选定帧内预测模式。举例来说,选定帧内预测模式可能与相邻CU的帧内预测模式相同。换句话说,相邻CU的帧内预测模式可为当前CU的最可能模式。因此,预测模块100可产生语法元素以指示选定帧内预测模式与相邻CU的帧内预测模式相同。
虽然以此方式用信号通知选定帧内预测模式可减少用信号通知当前CU的帧内预测模式所需的位的数目,但以此方式用信号通知选定帧内预测模式可能引入当前CU与相邻CU之间的依赖性。举例来说,视频解码器30在重构当前CU之前可能需要重构相邻CU,因为视频解码器30将需要存取相邻CU的帧内预测模式,以便确定当前CU的帧内预测模式。
因为视频编码器20产生位流,使得子切片可独立地重构,因此不准许跨越子切片边界的此依赖性。因此,如果相邻CU在与当前CU不同的子切片中,那么预测模块100不产生指示视频解码器30将基于相邻CU的帧内预测模式来预测当前CU的帧内预测模式的语法元素。换句话说,对于图片的每一子切片,视频编码器20可编码所述子切片,使得子切片的每一经帧内预测CU的帧内预测模式的预测不取决于子切片中的任何另一者中的CU的帧内预测模式。以此方式,视频解码器30可预测子切片中的每一经帧内预测CU的帧内预测模式,而不存取子切片中的任何另一者中的CU的帧内预测模式信息。然而,如果相邻CU与当前CU在同一子切片中,那么预测模块100可产生指示视频解码器30将基于相邻CU的帧内预测模式来预测当前CU的帧内预测模式的语法元素。
在预测模块100为CU选择预测数据之后,残余产生模块102可通过将CU的选定预测数据从CU的像素值减去来产生CU的残余数据。CU的残余数据可包含对应于CU中的像素的不同像素分量的2D残余块。举例来说,残余数据可包含对应于CU的预测数据中的像素的亮度分量与CU的原始像素中的像素的亮度分量之间的差的残余块。另外,CU的残余数据可包含对应于CU的预测数据中的像素的色度分量与CU的原始像素的色度分量之间的差的残余块。
CU可具有一个或一个以上变换单元(TU)。CU的每一TU可对应于CU的残余数据的不同部分。CU的TU的大小可或可不基于CU的PU的大小。在一些实例中,可使用被称为“残余四叉树”(RQT)的四叉树结构来将CU再分为较小的单元。TU可对应于RQT的节点。
变换模块104可通过将变换应用于对应于未经分割TU的残余数据来产生CU的每一未经分割TU的一个或一个以上变换系数块。变换系数块中的每一者可为2D系数矩阵。在各种实例中,变换模块104可将各种变换应用于对应于TU的残余数据。举例来说,变换模块可应用离散余弦变换(DCT)、定向变换或概念上类似的变换。
在变换模块104产生TU的变换系数块之后,量化模块106可量化变换系数块中的系数。量化一般指代将变换系数块中的系数量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位值向下舍入到m位值,其中n大于m。
逆量化模块108和逆变换模块110可分别将逆量化和逆变换应用于变换系数块,以从变换系数块重构残余数据。重构模块112可将经重构的残余数据与由运动补偿模块124或帧内预测模块126产生的预测数据相加,以产生经重构视频块以供存储在经解码图片缓冲器114中。运动估计模块122和运动补偿模块124可使用含有经重构视频块的参考图片来对后续图片的CU执行帧间预测。另外,帧内预测模块126可使用当前图片的CU的经重构像素值来执行帧内预测。
熵编码模块116可从视频编码器20的其它功能组件接收数据。举例来说,熵编码模块116可从量化模块106接收变换系数块,且可从预测模块100接收语法元素。当熵编码模块116接收到数据时,熵编码模块116可执行一个或一个以上熵编码操作以产生经熵编码的数据。举例来说,视频编码器20可对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率间隔分割熵(PIPE)译码操作,或另一类型的熵编码操作。
作为对数据执行熵编码操作的一部分,熵编码模块116选择上下文模型。如果熵编码模块116正执行CABAC操作,则上下文模型可指示特定二进位的概率的估计。上下文建模可提供当前符号的已经在当前符号的邻域中译码的给定符号的条件概率的估计。在CABAC的上下文中,术语“二进位”用以指代语法元素的经二进制化版本的位。如果熵编码模块116正执行CAVLC操作,那么上下文模型可将系数映射到对应的码字。可构造CAVLC中的码字,使得相对较短的码对应于概率较大的符号,而相对较长的码对应于概率较小的符号。适当上下文模型的选择可影响熵编码操作的译码效率。
在一些例子中,熵编码模块116可基于通过对其它数据集合执行熵编码操作而产生的信息为数据选择上下文模型。举例来说,与相邻TU相关联的残余数据可能将含有类似的像素值。因此,相邻TU的变换系数块可能将含有类似的变换系数。因此,相邻变换系数块中的二进位的概率可能将类似。因此,熵编码模块116可使用关于第一变换系数块中的二进位的概率的信息来为熵编码第二相邻变换系数块选择上下文模型。
虽然基于通过对其它数据集合执行熵编码操作而产生的信息为特定数据集合选择上下文模型可增加特定数据集合的译码效率,但以此方式选择上下文模型可阻碍特定数据集合与其它数据集合并行被熵解码且因此被剖析。相反,视频解码器30在对特定数据集合执行熵解码之前,将必须对其它数据集合执行熵解码。
为了确保视频解码器30能够并行对不同经译码子切片中的数据执行熵解码操作,熵编码模块116不基于通过对其它子切片中的数据集合执行熵编码操作而产生的信息为子切片内的数据选择上下文模型。换句话说,对于每一经译码子切片,熵编码模块116可使用一个或一个以上上下文模型来对经译码子切片中的数据执行熵编码操作,其中并不基于在对经译码子切片的其它子切片中的数据进行熵编码操作期间产生的信息而选择上下文模型中的任何一者。举例来说,熵编码模块116可在对子切片的第一CU的第一变换系数块执行熵编码操作时选择默认上下文模型。然而,在此实例中,熵编码模块116可基于通过对第一变换系数块执行熵编码操作而产生的信息选择第一CU的第二变换系数块的上下文模型。在另一实例中,经译码子切片的子切片标头或子切片数据可包含语法元素,其指定用以对经译码子切片的子切片数据中的数据执行熵解码操作的上下文模型。在此实例中,子切片标头可指定CABAC上下文初始化idc中的上下文模型。在一些例子中,不同经译码子切片的子切片标头可指定不同上下文模型。在一些实例中,CABAC译码将在每一子切片的开头复位,从而准许多个子切片的并行化CABAC解码。
熵编码模块116输出包含一系列NAL单元的位流。如上文所述,NAL单元中的每一者可为含有NAL单元中的数据类型的指示的语法结构以及含有所述数据的字节。位流中的每一经译码切片NAL单元含有一经译码切片。经译码切片包含切片标头和切片数据。切片数据可包含经译码子切片。
在一些实例中,切片标头指示经译码子切片的进入点。进入点中的每一者可指定对应经译码子切片的字节偏移。如下文所述,视频解码器30可能够使用进入点来识别经译码子切片在切片数据内的位置。在一些例子中,切片标头还可指示子切片的数目。在其它例子中,子切片的数目可紧接切片标头之后指示。在一些实例中,切片数据包含分离经译码子切片的开始码。如下文所述,视频解码器30可能够通过扫描经过切片数据从而寻找开始码来识别经译码子切片的位置。
经译码子切片中的每一者可包含经译码子切片标头和子切片数据。子切片数据可包含经译码树块。经译码树块可包含一个或一个以上经译码CU。每一经译码CU可包含一个或一个以上经熵编码变换系数块。
图3是说明视频解码器30的实例配置的框图。出于阐释的目的提供图3,且图3不限制如本发明中广泛示范和描述的技术。出于阐释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
在图3的实例中,视频解码器30包含多个功能组件。视频解码器30的功能组件包含熵解码模块150、预测模块152、逆量化模块154、逆变换模块156、重构模块158以及经解码图片缓冲器160。预测模块152包含运动补偿模块162和帧内预测模块164。在一些实例中,视频解码器30可执行大体上与相对于图2的视频编码器20所描述的编码遍次互逆的解码遍次。在其它实例中,视频解码器30可包含较多、较少或不同的功能组件。举例来说,视频解码器30可包含解块滤波器以对重构模块158的输出进行滤波,以将成块假象从经重构视频中去除。
视频解码器30可接收包括经编码视频数据的位流。当视频解码器30接收到位流时,熵解码模块150对位流执行剖析操作。剖析操作可包含位流的熵解码。由于对位流执行剖析操作,熵解码模块150可从位流提取语法元素。语法元素可包含经熵解码的变换系数块。预测模块152、逆量化模块154、逆变换模块156和重构模块158可执行重构操作,其使用语法元素来产生经解码视频数据。
如上文所论述,位流可包括一系列NAL单元。位流的NAL单元可包含序列参数集合NAL单元、图片参数集合NAL单元、SEI NAL单元等等。作为对位流执行剖析操作的一部分,熵解码模块150可执行剖析操作,其从序列参数集合NAL单元提取并熵解码序列参数集合,从图片参数集合NAL单元提取并熵解码图片参数集合,从SEI NAL单元提取并熵解码SEI数据,等等。序列参数集合为含有应用于零或零个以上整个经译码视频序列的语法元素的语法结构。图片参数集合为含有应用于零或零个以上整个经译码图片的语法元素的语法结构。与给定图片相关联的图片参数集合可包含识别与给定图片相关联的序列参数集合的语法元素。
另外,位流的NAL单元可包含经译码切片NAL单元。作为对位流执行剖析操作的一部分,熵解码模块150可执行剖析操作,其从经译码切片NAL单元提取并熵解码经译码切片。经译码切片中的每一者可包含切片标头和切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有所述切片的图片相关联的图片参数集合的语法元素。熵解码模块150可对经译码切片标头执行熵解码操作(例如CAVLC解码操作)以恢复切片标头。
作为执行剖析操作以提取并熵解码子切片的一部分,熵解码模块150可执行剖析操作以从经译码切片的切片数据提取经译码子切片。在各种实例中,熵解码模块150可以各种方式从切片数据提取经译码子切片。举例来说,在一些实例中,切片标头可包含位置信令数据,熵解码模块150可使用位置信令数据来识别经译码子切片在切片数据内的位置。在一些例子中,位置信令数据在切片标头内或在切片标头的结尾处。在各种实例中,切片标头可包含各种类型的位置信令数据。举例来说,切片标头可指示经译码子切片的进入点。进入点中的每一者可指定对应经译码子切片的字节偏移。在此实例中,进入点可指定特定经译码子切片在切片数据的字节128处开始,另一进入点可指定另一经译码子切片在切片数据的字节256处开始,等等。在其它例子中,将位置信令数据交错到经译码子切片之间的切片数据中。
在其它实例中,切片数据可包含经译码切片中的经译码子切片中的每一者的开始码。开始码可为分离经译码子切片的值。熵解码模块150可扫描通过切片数据,寻找开始码。当熵解码模块150在切片数据中找到开始码时,熵解码模块150已找到经译码子切片在切片数据内的位置。举例来说,开始码中的每一者可具有二进制值0101010。在此实例中,熵解码模块150可扫描通过切片数据,识别二进制值0101010的出现,且因此识别经译码子切片在切片数据内的位置。
在从切片数据提取经译码子切片之后,熵解码模块150可执行剖析操作,其从经译码子切片提取经译码子切片标头和子切片数据。如上文所论述,子切片标头可包含与对应子切片相关联的语法元素。子切片标头可包含比切片标头少的语法元素。因此,子切片标头在本文中可称为“轻量”标头。熵解码模块150可对经译码子切片标头执行熵解码操作(例如CAVLC解码操作)以恢复子切片标头。
在从经译码子切片提取子切片数据之后,熵解码模块150可从子切片数据提取经译码树块。熵解码模块150可接着从经译码树块提取经译码CU。熵解码模块150可执行剖析操作,其从经译码CU提取语法元素。所提取的语法元素可包含经熵编码的变换系数块。熵解码模块150可接着对语法元素执行熵解码操作。举例来说,熵解码模块150可对变换系数块执行CABAC操作。
当熵解码模块150对一数据集合执行熵解码操作时,熵解码模块150可选择上下文模型。在其中熵解码模块150使用CABAC的实例中,上下文模型可指示特定二进位的概率。在其中熵解码模块150使用CAVLC的实例中,上下文模型可指示码字与对应数据之间的映射。熵解码模块150可接着使用选定上下文模型来对所述数据集合执行熵解码操作。
当熵解码模块150对子切片执行剖析操作时,熵解码模块150可不基于通过对另一子切片的数据执行剖析操作而产生的信息来选择用于对对应经译码子切片的数据(例如,子切片标头、CU标头、变换系数块等)执行熵解码操作的上下文模型。然而,熵解码模块150可基于通过对同一经译码子切片的其它数据执行剖析操作而产生的信息来选择用于对经译码子切片的数据执行熵解码操作的上下文模型。以此方式,可独立于切片的每一其它子切片来剖析切片的每一子切片。明确地说,可参考来自其它子切片的信息来熵解码每一经译码子切片中的数据,例如以用于上下文建模或其它。因为切片的每一子切片可独立剖析,因此熵解码模块150可能够并行对不同经译码子切片中的数据执行剖析操作。
举例来说,经译码切片可包含第一经译码子切片和第二经译码子切片。在此实例中,熵解码模块150不需要对第一经译码子切片中的数据执行熵解码操作,以便选择上下文模型来用于熵解码第二经译码子切片中的数据,且反之亦然。换句话说,熵解码模块150可使用一个或一个以上上下文模型来熵解码第一经译码子切片中的数据,其中编码第一经译码子切片,使得用以熵解码第一经译码子切片中的数据的一个或一个以上上下文模型的选择不取决于来自第二经译码子切片的信息。同样地,熵解码模块150可使用一个或一个以上上下文模型来熵解码第二经译码子切片,其中编码第二经译码子切片,使得用以熵解码第二经译码子切片的一个或一个以上上下文模型的选择不取决于来自第一经译码子切片的信息。
在熵解码模块150对未经分割CU执行剖析操作之后,视频解码器30可对未经分割CU执行重构操作。为了对未经分割CU执行重构操作,视频解码器30可在CU的残余四叉树的每一级处,对CU的每一TU执行重构操作。通过对CU的每一TU执行重构操作,视频解码器30可重构CU的残余数据。
作为对未经分割TU执行重构操作的一部分,逆量化模块154可逆量化(即去量化)与TU相关联的变换系数块。逆量化模块154可以与针对HEVC所提出或由H.264解码标准所界定的逆量化过程类似的方式来逆量化变换系数块。逆量化模块154可使用由视频编码器20为变换系数块的CU计算的量化参数QPY来确定量化程度,且同样地,确定逆量化模块154所应用的逆量化程度。
在逆量化模块154逆量化变换系数块之后,逆变换模块156可产生与变换系数块相关联的TU的残余数据。逆变换模块156可至少部分地通过将逆变换应用于变换系数块来产生TU的残余数据。举例来说,逆变换模块156可将逆DCT、逆整数变换、逆卡洛变换(Karhunen-Loeve transform,KLT)、逆旋转变换、逆定向变换或另一逆变换应用于变换系数块。在一些实例中,逆变换模块156可基于来自视频编码器20的信令来确定应用于变换系数块的逆变换。在此些实例中,逆变换模块156可基于与变换系数块相关联的树块的四叉树的根节点处的用信号通知的变换来确定逆变换。在其它实例中,逆变换模块156可从一个或一个以上译码特性(例如块大小、译码模式等)推断逆变换。在一些实例中,逆变换模块156可应用级联逆变换。
如果使用帧间预测来编码了CU,那么运动补偿模块162可执行运动补偿以产生CU的预测数据。运动补偿模块162可使用CU的PU的运动信息来识别PU的参考样本。PU的参考样本可在与PU不同的时间图片中。PU的运动信息可包含运动向量、参考图片索引和预测方向。运动补偿模块162可接着使用PU的参考样本来产生CU的预测数据。在一些例子中,特定子切片中的PU的参考样本可或可不与特定子切片位于同一位置。
在一些实例中运动补偿模块162可基于与CU相邻的CU的PU的运动信息来预测CU的PU的运动信息。因为视频编码器20编码子切片,使得子切片可独立重构,所以运动补偿模块162不需要存取给定CU的子切片外部的任何PU的运动信息以便预测给定CU的PU的运动信息。举例来说,运动补偿模块162可预测子切片的经帧间预测CU的PU的运动信息,其中编码子切片以使得子切片中的经帧间预测CU的PU的运动信息的预测不取决于其它子切片中的PU的运动信息。在本发明中,如果视频编码器20使用帧间预测来编码CU,那么CU为经帧间预测CU。
在一些实例中,运动补偿模块162可通过执行基于内插滤波器的内插来细化CU的预测数据。待用于具有子像素精度的运动补偿的内插滤波器的识别符可包含于语法元素中。运动补偿模块162在CU的预测数据的产生期间使用视频编码器20所使用的相同内插滤波器来计算参考块的子整数像素的经内插值。运动补偿模块162可根据所接收的语法信息来确定视频编码器20所使用的内插滤波器,且使用所述内插滤波器来产生预测数据。
如果使用帧内预测来编码CU,那么帧内预测模块164可执行帧内预测以产生CU的预测数据。举例来说,帧内预测模块164可基于位流中的语法元素来确定CU的帧内预测模式。位流可包含帧内预测模块164可用以预测CU的帧内预测模式的语法元素。在一些例子中,语法元素可指示帧内预测模块164将使用另一CU的帧内预测模式来预测CU的帧内预测模式。举例来说,CU的帧内预测模式与相邻CU的帧内预测模式相同可为可能的。换句话说,相邻CU的帧内预测模式可为当前CU的最可能模式。因此,在此实例中,位流可包含小语法元素,其指示CU的帧内预测模式与相邻CU的帧内预测模式相同。因为子切片可独立重构,因此语法元素不指示帧内预测模块164将使用另一子切片中的CU的帧内预测模式来预测CU的帧内预测模式。
帧内预测模块164可接着使用帧内预测模式来基于空间相邻CU的像素值产生CU的预测数据(例如,所预测像素值)。因为视频编码器20编码子切片,使得子切片可独立重构,所以帧内预测模块164不需要存取给定CU的子切片外的任何CU的像素值以便产生给定CU的预测数据。举例来说,帧内预测模块164可产生子切片中的每一经帧内预测CU的预测数据,其中编码对应的经译码子切片,使得子切片中的经帧内预测CU的预测数据的产生不取决于其它子切片中的CU的像素值。在本发明中,如果视频编码器20使用帧内预测来编码CU,那么CU为经帧内预测CU。因此,对于给定子切片内的CU的帧内预测和重构,视频解码器30不使用来自另一子切片的空间参考样本。以此方式,可对每一子切片独立地执行剖析操作和重构操作,从而促进切片的并行化剖析和重构操作。
重构模块158可使用CU的残余数据和CU的预测数据(即,帧内预测数据或帧间预测数据,如适用)来重构CU的像素值。在一些实例中,视频解码器30可应用解块滤波器来将成块假象从切片或图片的经重构像素值滤波器去除。经解码图片缓冲器160可存储视频数据的图片的经解码像素值。经解码图片缓冲器160可提供参考图片以用于后续的运动补偿、帧内预测和在显示装置(例如图1的显示装置34)上呈现。
图4是说明由视频编码器20执行以产生经译码图片的实例操作200的流程图。在视频编码器20开始操作200之后,视频编码器20可将图片分割为一个或一个以上切片(202)。视频编码器20可接着将切片中的每一者分割为一个或一个以上子切片(204)。在将切片分割为子切片之后,视频编码器20可通过编码图片的切片来产生经译码切片(206)。经译码切片的产生(206)可包含子切片数据的帧间和/或帧内预测译码以及子切片数据的熵译码。当视频编码器20通过编码图片的切片而产生经译码切片时,经译码切片可包括对应于切片的子切片的经译码子切片。视频编码器20可产生经译码子切片,使得可独立于其它子切片来剖析和重构子切片中的每一者。
视频编码器20可产生信息以用信号通知经译码子切片在经译码切片内的位置(208)。如上文所述,视频编码器20可以各种方式用信号通知经译码子切片的位置。举例来说,视频编码器20可通过将位置信令数据包含在经译码切片的切片标头中来用信号通知经译码子切片的位置,以从经译码切片提取经译码子切片。在此实例中,位置信令数据可指示经译码子切片的开始字节位置、经译码子切片的字节大小,或视频解码器30可用以识别经译码子切片在经译码切片内的位置的其它数据。在另一实例中,视频编码器20可通过经译码子切片的切片数据开始码中的信令来用信号通知经译码子切片在经译码切片内的位置。在一些实例中,视频编码器20可使指示子切片大小或子切片开始字节位置的信息与子切片数据交错。
图5是说明由视频解码器30执行的实例操作250的流程图。在视频解码器30开始操作250之后,视频解码器30接收由视频编码器20产生的位流(252)。位流可包括一系列NAL单元。NAL单元可包含一个或一个以上经译码切片NAL单元。经译码切片NAL单元可含有对应于不同切片的经译码切片。
响应于接收到经译码切片NAL单元,视频解码器30可并行对两个或两个以上子切片执行剖析操作(254)。为了对子切片执行剖析操作,视频解码器30可从经译码切片NAL单元中所含有的经译码切片的切片数据提取对应的经译码子切片。视频解码器30可接着从经译码子切片提取与子切片相关联的语法元素。为了从经译码子切片提取与子切片相关联的语法元素,视频解码器30可对经译码子切片中的数据执行一个或一个以上熵解码操作。
在一些实例中,视频解码器30可使用经译码切片的切片标头中的位置信令数据来从经译码切片的切片数据提取经译码子切片。在此些实例中,位置信令数据可指示经译码子切片的开始字节位置、经译码子切片的字节大小,或视频解码器30可用以识别经译码子切片在经译码切片的切片数据内的位置的其它数据。在其它实例中,切片数据可包含指示经译码子切片的开始点的开始码。在此些实例中,视频解码器30可识别开始码在切片数据内的位置,且基于开始码在切片数据内的位置而从切片数据提取经译码子切片。
此外,在对经译码切片NAL单元中的子切片中的两者或两者以上执行剖析操作之后,视频解码器30可并行地对子切片中的两者或两者以上执行重构操作(256)。通过对子切片执行重构操作,视频解码器30可从与对应子切片相关联的语法元素重构子切片中的树块的像素值。
图6是说明分割为切片和子切片的图片300的概念图。图片300的水平中点附近较暗的线302指示图片300的切片304与切片306之间的边界。在图6的实例中,图片300内的单元可对应于树块。切片304和切片306的具有不同交叉影线的区段可对应于切片304和306的不同子切片。
将认识到,取决于实施例,本文所述的方法中的任一者的某些动作或事件可以不同序列执行,可相加、合并或完全忽视(例如,不是所有的所描述动作或事件均对方法的实践来说是必要的)。此外,在某些实施例中,可例如通过多线程处理、中断处理或多个处理器同时(而不是循序地)执行动作或事件。
所属领域的技术人员将认识到,结合本文所揭示的方法、系统和设备而描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、由处理器执行的计算机软件或两者的组合。为清楚说明硬件与软件的这种可互换性,上文已大致关于其功能性而描述了各种说明性组件、块、模块、电路及步骤。将所述功能性实施为硬件还是软件取决于特定应用及强加于整个系统的设计约束。所属领域的技术人员可针对每一特定应用以不同方式来实施所描述的功能性,但所述实施方案决定不应被解释为会导致脱离本发明的范围。
而且,可使用经设计以执行本文所描述的功能的例如通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等电子装置或电路来实施或执行本文所揭示的实施例。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、一个或一个以上微处理器与DSP核心的联合,或任何其它此配置。
结合本文中所揭示的实施例而描述的方法或算法的步骤可直接包含于硬件中、由处理器执行的软件模块中或所述两者的组合中。软件模块可驻存在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸式磁盘、CD-ROM,或此项技术中已知的任何其它形式的存储媒体中。示范性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。存储媒体可形成计算机程序产品的一部分。处理器及存储媒体可驻存在ASIC中。ASIC可驻存在用户终端中。在替代方案中,处理器和存储媒体可作为离散组件驻存在用户终端中。

Claims (52)

1.一种用于编码视频数据的方法,所述方法包括:
编码所述视频数据中的图片的切片以形成经译码切片,其中将所述切片分割为多个子切片,其中所述经译码切片包含对应于所述子切片的经译码子切片,且其中所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构;以及
产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
2.根据权利要求1所述的方法,其中产生所述信息以用信号通知所述位置包括产生信息以用信号通知所述经译码子切片的开始字节位置或字节大小。
3.根据权利要求2所述的方法,其中产生所述信息以用信号通知所述位置包括产生信息以用信号通知所述经译码切片的切片标头内的所述字节位置或所述字节大小。
4.根据权利要求1所述的方法,其中产生所述信息以用信号通知所述位置包括产生信息以用信号通知所述经译码切片的切片数据中的所述经译码子切片的开始码。
5.根据权利要求1所述的方法,其中所述经译码切片包括切片标头,且所述经译码子切片包含子切片标头,所述子切片标头中的每一者包含比所述切片标头少的语法元素。
6.根据权利要求1所述的方法,其进一步包括产生含有所述经译码切片的经译码切片网络抽象层NAL单元。
7.根据权利要求1所述的方法,
其中所述子切片中的每一者可在不使用来自所述图片的任何其它子切片的信息的情况下熵解码,且
其中所述子切片中的每一者可在无来自所述图片的任何其它子切片的信息的情况下帧内解码。
8.根据权利要求7所述的方法,其进一步包括针对所述经译码子切片中的每一者,使用一个或一个以上上下文模型来对所述经译码子切片中的数据执行熵编码操作,其中不基于在对所述经译码子切片中的其它子切片中的数据的熵编码操作期间产生的信息来选择所述上下文模型中的任一者。
9.根据权利要求1所述的方法,
其中所述切片为所述图片的第一切片;且
其中所述方法进一步包括:
将所述图片分割为所述第一切片和第二切片;以及
将所述第一切片分割为所述多个子切片。
10.根据权利要求1所述的方法,其进一步包括针对所述多个子切片中的每一子切片,编码所述子切片,使得所述子切片的经帧内预测译码单元CU的预测数据的产生不取决于所述子切片中的任一其它子切片中的CU的像素值。
11.根据权利要求1所述的方法,其进一步包括针对所述多个子切片中的每一子切片,编码所述子切片,使得所述子切片的每一经帧内预测CU的帧内预测模式的预测不取决于所述子切片中的任一其它子切片中的CU的帧内预测模式。
12.根据权利要求1所述的方法,其进一步包括针对所述多个子切片中的每一子切片,用信号通知所述子切片中的经帧间预测CU的预测单元PU的运动信息,使得所述子切片的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述子切片外的PU的运动信息。
13.一种解码视频数据的方法,其包括:
接收经译码切片,所述经译码切片为所述视频数据中的图片的切片的经编码形式,所述切片包含第一子切片和第二子切片,所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片,其中编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析且可独立于彼此而重构;
并行地剖析所述第一和第二子切片;以及
在剖析所述第一和第二子切片之后,并行地重构所述第一和第二子切片。
14.根据权利要求13所述的方法,其中剖析所述第一和第二子切片包括使用所述经译码切片的切片标头中的位置信令数据来从所述经译码切片提取所述第一和第二经译码子切片。
15.根据权利要求14所述的方法,其中所述位置信令数据指示所述第一和第二经译码子切片的开始字节位置或字节大小。
16.根据权利要求13所述的方法,
其中所述经译码切片包含切片标头和切片数据,所述切片数据包含所述第一和第二经译码子切片,且包含指示所述第一和第二经译码子切片的开始点的开始码;且
其中所述方法进一步包括:
识别所述开始码在所述切片数据内的位置;以及
基于所述开始码在所述切片数据内的所述位置,从所述切片数据提取所述第一和第二经译码子切片。
17.根据权利要求13所述的方法,其中所述经译码切片包含切片标头和切片数据,所述切片数据包含所述第一和第二经译码子切片,所述第一经译码子切片包含第一子切片标头,所述第二经译码子切片包含第二子切片标头,所述第一和第二子切片标头两者均包含比所述切片标头少的语法元素。
18.根据权利要求13所述的方法,其中接收所述经译码切片包括接收含有所述经译码切片的经译码切片网络抽象层NAL单元。
19.根据权利要求13所述的方法,其中剖析所述第一和第二子切片包括:
从所述经译码切片提取所述第一和第二经译码子切片;
对所述第一经译码子切片中的数据执行熵解码操作;以及
对所述第二经译码子切片中的数据执行熵解码操作。
20.根据权利要求19所述的方法,
其中对所述第一经译码子切片中的所述数据执行所述熵解码操作包括使用一个或一个以上上下文模型来熵解码所述第一经译码子切片中的所述数据,其中编码所述第一经译码子切片,使得用以熵解码所述第一经译码子切片中的所述数据的所述一个或一个以上上下文模型的选择不取决于来自所述第二经译码子切片的信息;且
其中对所述第二经译码子切片中的所述数据执行所述熵解码操作包括使用一个或一个以上上下文模型来熵解码所述第二经译码子切片中的所述数据,其中编码所述第二经译码子切片,使得用以熵解码所述第二经译码子切片中的所述数据的所述一个或一个以上上下文模型的选择不取决于来自所述第一经译码子切片的信息。
21.根据权利要求20所述的方法,
其中对所述第一经译码子切片中的所述数据执行所述熵解码操作包括对所述第一经译码子切片中的所述数据执行上下文自适应二进制算术译码CABAC操作;且
其中对所述第二经译码子切片中的所述数据执行所述熵解码操作包括对所述第二经译码子切片中的所述数据执行所述CABAC操作。
22.根据权利要求13所述的方法,其中重构所述第一和第二子切片包括:
产生所述第一子切片中的每一经帧内预测译码单元CU的预测数据,其中编码所述第一经译码子切片,使得所述第一子切片中的所述经帧内预测CU的所述预测数据的产生不取决于所述第二子切片中的CU的像素值;以及
产生所述第二子切片中的每一经帧内预测CU的预测数据,其中编码所述第二经译码子切片,使得所述第二子切片中的所述经帧内预测CU的所述预测数据的产生不取决于所述第一子切片中的CU的像素值。
23.根据权利要求13所述的方法,其中重构所述第一和第二子切片包括:
在不存取所述图片的任何其它子切片中的CU的帧内预测模式信息的情况下,预测所述第一子切片中的每一经帧内预测CU的帧内预测模式;以及
在不存取所述图片的任何其它子切片中的CU的帧内预测模式信息的情况下,预测所述第二子切片中的每一经帧内预测CU的帧内预测模式。
24.根据权利要求13所述的方法,其中重构所述第一和第二子切片包括:
预测所述第一子切片中的经帧间预测CU的预测单元PU的运动信息,其中编码所述第一经译码子切片,使得所述第一子切片中的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述第二子切片中的PU的运动信息;以及
预测所述第二子切片中的经帧间预测CU的PU的运动信息,其中编码所述第二经译码子切片,使得所述第二子切片中的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述第一子切片中的PU的运动信息。
25.一种包括一个或一个以上处理器的视频编码设备,所述一个或一个以上处理器经配置以:
编码视频数据中的图片的切片以形成经译码切片,其中将所述切片分割为多个子切片,其中所述经译码切片包含对应于所述子切片的经译码子切片,其中所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构;以及
产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
26.根据权利要求25所述的视频编码设备,其中所述一个或一个以上处理器经配置以通过产生信息以用信号通知所述经译码子切片的开始字节位置或字节大小来产生所述信息以用信号通知所述经译码子切片的所述位置。
27.根据权利要求26所述的视频编码设备,其中所述一个或一个以上处理器经配置以通过产生信息以用信号通知所述切片的切片标头内的所述字节位置或字节大小来产生所述信息以用信号通知所述经译码子切片的所述位置。
28.根据权利要求25所述的视频编码设备,其中所述一个或一个以上处理器经配置以通过产生信息以用信号通知所述经译码切片的切片数据中的所述经译码子切片的开始码来产生所述信息以用信号通知所述经译码子切片的所述位置。
29.根据权利要求25所述的视频编码设备,其中所述经译码切片包括切片标头,且所述经译码子切片包含子切片标头,所述子切片标头中的每一者包含比所述切片标头少的语法元素。
30.根据权利要求25所述的视频编码设备,其中所述一个或一个以上处理器经配置以产生含有所述经译码切片的经译码切片网络抽象层NAL单元。
31.根据权利要求25所述的视频编码设备,
其中所述子切片中的每一者可在不使用来自所述图片的任何其它子切片的信息的情况下熵解码,且
其中所述子切片中的每一者可在无来自所述图片的任何其它子切片的信息的情况下帧内解码。
32.根据权利要求25所述的视频编码设备,其中针对所述经译码子切片中的每一者,所述一个或一个以上处理器经配置以使用一个或一个以上上下文模型来对所述经译码子切片中的数据执行熵编码操作,其中不基于在对所述经译码子切片中的其它子切片中的数据的熵编码操作期间产生的信息来选择所述上下文模型中的任一者。
33.根据权利要求25所述的视频编码设备,
其中所述切片为所述图片的第一切片;且
其中所述一个或一个以上处理器进一步经配置以:
将所述图片分割为所述第一切片和第二切片;以及
将所述第一切片分割为所述多个子切片。
34.根据权利要求25所述的视频编码设备,其中针对所述多个子切片中的每一子切片,所述一个或一个以上处理器经配置以编码所述子切片,使得所述子切片的经帧内预测译码单元CU的预测数据的产生不取决于所述子切片中的任一其它子切片中的CU的像素值。
35.根据权利要求25所述的视频编码设备,其中针对所述多个子切片中的每一子切片,所述一个或一个以上处理器经配置以编码所述子切片,使得所述子切片的每一经帧内预测CU的帧内预测模式的预测不取决于所述子切片中的任一其它子切片中的CU的帧内预测模式。
36.根据权利要求25所述的视频编码设备,其中针对所述多个子切片中的每一子切片,所述一个或一个以上处理器经配置以用信号通知所述子切片中的经帧间预测CU的预测单元PU的运动信息,使得所述子切片的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述子切片外的PU的运动信息。
37.一种包括一个或一个以上处理器的视频解码设备,所述一个或一个以上处理器经配置以:
接收经译码切片,所述经译码切片为视频数据中的图片的切片的经编码形式,所述切片包含第一子切片和第二子切片,所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片,其中编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析且可独立于彼此而重构;
并行地剖析所述第一和第二子切片;以及
在剖析所述第一和第二子切片之后,并行地解码所述第一和第二子切片。
38.根据权利要求37所述的视频解码设备,其中所述一个或一个以上处理器经配置以使用所述经译码切片的切片标头中的位置信令数据来从所述经译码切片提取所述第一和第二经译码子切片。
39.根据权利要求38所述的视频解码设备,其中所述位置信令数据指示所述第一和第二经译码子切片的开始字节位置或字节大小。
40.根据权利要求37所述的视频解码设备,
其中所述经译码切片包含切片标头和切片数据,所述切片数据包含所述第一和第二经译码子切片,且包含指示所述第一和第二经译码子切片的开始点的开始码;且
其中所述一个或一个以上处理器经配置以:
识别所述开始码在所述切片数据内的位置;以及
基于所述开始码在所述切片数据内的所述位置,从所述切片数据提取所述第一和第二经译码子切片。
41.根据权利要求37所述的视频解码设备,其中所述经译码切片包含切片标头和切片数据,所述切片数据包含所述第一和第二经译码子切片,所述第一经译码子切片包含第一子切片标头,所述第二经译码子切片包含第二子切片标头,所述第一和第二子切片标头两者均包含比所述切片标头少的语法元素。
42.根据权利要求37所述的视频解码设备,其中所述一个或一个以上处理器经配置以接收含有所述经译码切片的经译码切片网络抽象层NAL单元。
43.根据权利要求37所述的视频解码设备,其中所述一个或一个以上处理器经配置以:
从所述经译码切片提取所述第一和第二经译码子切片;
对所述第一经译码子切片中的数据执行熵解码操作;以及
对所述第二经译码子切片中的数据执行熵解码操作。
44.根据权利要求43所述的视频解码设备,
其中为了对所述第一经译码子切片中的所述数据执行所述熵解码操作,所述一个或一个以上处理器使用一个或一个以上上下文模型来熵解码所述第一经译码子切片中的所述数据,其中编码所述第一经译码子切片,使得用以熵解码所述第一经译码子切片中的所述数据的所述一个或一个以上上下文模型的选择不取决于来自所述第二经译码子切片的信息;且
其中为了对所述第二经译码子切片中的所述数据执行所述熵解码操作,所述一个或一个以上处理器使用一个或一个以上上下文模型来熵解码所述第二经译码子切片中的所述数据,其中编码所述第二经译码子切片,使得用以熵解码所述第二经译码子切片中的所述数据的所述一个或一个以上上下文模型的选择不取决于来自所述第一经译码子切片的信息。
45.根据权利要求44所述的视频解码设备,
其中为了对所述第一经译码子切片中的所述数据执行所述熵解码操作,所述一个或一个以上处理器对所述第一经译码子切片中的所述数据执行上下文自适应二进制算术译码CABAC操作;且
其中为了对所述第二经译码子切片中的所述数据执行所述熵解码操作,所述一个或一个以上处理器对所述第二经译码子切片中的所述数据执行所述CABAC操作。
46.根据权利要求37所述的视频解码设备,其中为了重构所述第一和第二子切片,所述一个或一个以上处理器:
产生所述第一子切片中的每一经帧内预测译码单元CU的预测数据,其中编码所述第一经译码子切片,使得所述第一子切片中的所述经帧内预测CU的所述预测数据的产生不取决于所述第二子切片中的CU的像素值;以及
产生所述第二子切片中的每一经帧内预测CU的预测数据,其中编码所述第二经译码子切片,使得所述第二子切片中的所述经帧内预测CU的所述预测数据的产生不取决于所述第一子切片中的CU的像素值。
47.根据权利要求37所述的视频解码设备,其中为了重构所述第一和第二子切片,所述一个或一个以上处理器:
在不存取所述图片的任何其它子切片中的CU的帧内预测模式信息的情况下,预测所述第一子切片中的每一经帧内预测CU的帧内预测模式;以及
在不存取所述图片的任何其它子切片中的CU的帧内预测模式信息的情况下,预测所述第二子切片中的每一经帧内预测CU的帧内预测模式。
48.根据权利要求37所述的视频解码设备,其中为了重构所述第一和第二子切片,所述一个或一个以上处理器:
预测所述第一子切片中的经帧间预测CU的预测单元PU的运动信息,其中编码所述第一经译码子切片,使得所述第一子切片中的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述第二子切片中的PU的运动信息;以及
预测所述第二子切片中的经帧间预测CU的PU的运动信息,其中编码所述第二经译码子切片,使得所述第二子切片中的所述经帧间预测CU的所述PU的所述运动信息的预测不取决于所述第一子切片中的PU的运动信息。
49.一种视频编码设备,其包括:
用于编码视频数据中的图片的切片以形成经译码切片的装置,其中将所述切片分割为多个子切片,其中所述经译码切片包含对应于所述子切片的经译码子切片,且其中所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构;以及
用于产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置的装置。
50.一种视频解码设备,其包括:
用于接收经译码切片的装置,所述经译码切片为视频数据中的图片的切片的经编码形式,所述切片包含第一子切片和第二子切片,所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片,其中编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析且可独立于彼此而重构;
用于并行地剖析所述第一和第二子切片的装置;以及
用于在剖析所述第一和第二子切片之后并行地重构所述第一和第二子切片的装置。
51.一种计算机程序产品,其包括一个或一个以上计算机存储媒体,所述一个或一个以上计算机存储媒体存储计算机可执行指令,所述计算机可执行指令配置一个或一个以上处理器以:
编码视频数据中的图片的切片以形成经译码切片,其中将所述切片分割为多个子切片,其中所述经译码切片包含对应于所述子切片的经译码子切片,且其中所述子切片中的每一者可独立于所述子切片中的每一另一者而剖析,且所述子切片中的每一者可独立于所述子切片中的每一另一者而重构;以及
产生信息以用信号通知所述经译码子切片在所述经译码切片内的位置。
52.一种计算机程序产品,其包括一个或一个以上计算机存储媒体,所述一个或一个以上计算机存储媒体存储计算机可执行指令,所述计算机可执行指令配置一个或一个以上处理器以:
接收经译码切片,所述经译码切片为视频数据中的图片的切片的经编码形式,所述切片包含第一子切片和第二子切片,所述经译码切片包括分别对应于所述第一子切片和所述第二子切片的第一经译码子切片和第二经译码子切片,其中编码所述第一和第二经译码子切片,使得所述第一和第二子切片可独立于彼此而剖析,且可独立于彼此而重构;
并行地剖析所述第一和第二子切片;以及
在剖析所述第一和第二子切片之后,并行地重构所述第一和第二子切片。
CN201280006070.7A 2011-01-26 2012-01-25 视频译码中的子切片 Expired - Fee Related CN103329530B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161436560P 2011-01-26 2011-01-26
US61/436,560 2011-01-26
US201161450473P 2011-03-08 2011-03-08
US61/450,473 2011-03-08
US13/357,386 US9215473B2 (en) 2011-01-26 2012-01-24 Sub-slices in video coding
US13/357,386 2012-01-24
PCT/US2012/022591 WO2012103247A1 (en) 2011-01-26 2012-01-25 Sub-slices in video coding

Publications (2)

Publication Number Publication Date
CN103329530A true CN103329530A (zh) 2013-09-25
CN103329530B CN103329530B (zh) 2017-09-08

Family

ID=46544157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280006070.7A Expired - Fee Related CN103329530B (zh) 2011-01-26 2012-01-25 视频译码中的子切片

Country Status (6)

Country Link
US (1) US9215473B2 (zh)
EP (3) EP4336834A3 (zh)
JP (1) JP5770311B2 (zh)
KR (1) KR101625724B1 (zh)
CN (1) CN103329530B (zh)
WO (1) WO2012103247A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
CN105900446A (zh) * 2014-01-17 2016-08-24 索尼公司 通信装置、通信数据生成方法和通信数据处理方法
CN106464924A (zh) * 2014-06-25 2017-02-22 高通股份有限公司 多层视频译码
CN113826146A (zh) * 2019-05-23 2021-12-21 谷歌有限责任公司 自回归视频生成神经网络

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100809301B1 (ko) * 2006-07-20 2008-03-04 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
US9888817B2 (en) 2014-12-17 2018-02-13 Omachron Intellectual Property Inc. Surface cleaning apparatus
US9131033B2 (en) 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
JP6327435B2 (ja) * 2011-03-03 2018-05-23 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置、及び、画像復号装置
US20120268551A1 (en) * 2011-04-19 2012-10-25 Ben Wu Image Interaction Device, Interactive Image Operating System, and Interactive Image Operating Method thereof
US11647197B2 (en) 2011-06-30 2023-05-09 Velos Media, Llc Context initialization based on slice header flag and slice type
US9060173B2 (en) * 2011-06-30 2015-06-16 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
US9338465B2 (en) * 2011-06-30 2016-05-10 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
US8767824B2 (en) 2011-07-11 2014-07-01 Sharp Kabushiki Kaisha Video decoder parallelization for tiles
US10165285B2 (en) * 2011-09-30 2018-12-25 Avago Technologies International Sales Pte. Limited Video coding tree sub-block splitting
US9077998B2 (en) 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units
US9124895B2 (en) 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
KR102331361B1 (ko) 2011-12-29 2021-12-01 엘지전자 주식회사 비디오 인코딩 및 디코딩 방법과 이를 이용하는 장치
US9955178B2 (en) 2012-03-22 2018-04-24 Lg Electronics Inc. Method for encoding and decoding tiles and wavefront parallel processing and apparatus using same
US9338451B2 (en) 2012-04-12 2016-05-10 Qualcomm Incorporated Common spatial candidate blocks for parallel motion estimation
CN108337526B (zh) 2012-04-13 2020-10-30 Ge视频压缩有限责任公司 一种低延迟图像编码解码方法、设备及计算机可读介质
US9161004B2 (en) 2012-04-25 2015-10-13 Qualcomm Incorporated Identifying parameter sets in video files
US20130343465A1 (en) * 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
BR122020007914B1 (pt) * 2012-06-29 2023-03-07 Ge Video Compression, Llc Fluxo contínuo de dados de vídeo, entidade de rede para receber o fluxo contínuo de dados de vídeo e método para decodificar o fluxo contínuo de dados recebido
US9635369B2 (en) * 2012-07-02 2017-04-25 Qualcomm Incorporated Video parameter set including HRD parameters
SG11201500943PA (en) * 2012-08-08 2015-03-30 Univ Singapore System and method for enabling user control of live video stream(s)
SG11201500612PA (en) 2012-08-09 2015-04-29 Panasonic Ip Corp America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
GB2513303B (en) * 2013-04-16 2017-06-07 Canon Kk Method and device for partitioning an image
CN105393532B (zh) 2013-07-22 2019-04-19 索尼公司 信息处理设备和方法
US9774881B2 (en) 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) * 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
KR102123620B1 (ko) * 2014-11-14 2020-06-26 엘지전자 주식회사 대용량 병렬 처리를 위해 비디오 신호를 엔트로피 인코딩 또는 엔트로피 디코딩하는 방법 및 장치
CN104811729B (zh) * 2015-04-23 2017-11-10 湖南大目信息科技有限公司 一种视频多参考帧编码方法
US11233998B2 (en) 2015-05-29 2022-01-25 Qualcomm Incorporated Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design
US9794574B2 (en) * 2016-01-11 2017-10-17 Google Inc. Adaptive tile data size coding for video and image compression
KR102535168B1 (ko) 2016-05-26 2023-05-30 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 상호작용을 하는 클라이언트를 위한 파노라마 비디오 브로드캐스트 스트리밍
KR20190033771A (ko) * 2017-09-22 2019-04-01 삼성전자주식회사 영상 인코딩 장치, 영상 디코딩 장치, 영상 인코딩 방법 및 영상 디코딩 방법
US11711530B2 (en) 2018-06-21 2023-07-25 Telefonaktiebolaget Lm Ericsson (Publ) Tile shuffling for 360 degree video decoding
CN112640455A (zh) * 2018-06-21 2021-04-09 瑞典爱立信有限公司 视频编码中具有子图块的图块分区
US11013384B2 (en) 2018-08-13 2021-05-25 Omachron Intellectual Property Inc. Cyclonic air treatment member and surface cleaning apparatus including the same
US11192122B2 (en) 2018-08-13 2021-12-07 Omachron Intellectual Property Inc. Cyclonic air treatment member and surface cleaning apparatus including the same
US11006799B2 (en) 2018-08-13 2021-05-18 Omachron Intellectual Property Inc. Cyclonic air treatment member and surface cleaning apparatus including the same
KR102629907B1 (ko) 2018-10-02 2024-01-30 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 타일 그룹 id에 기초한 화상들의 인코딩 및 디코딩
CN113767624A (zh) * 2019-03-08 2021-12-07 瑞典爱立信有限公司 提供相关/独立分区编码/解码的方法和有关装置
JP2022537767A (ja) * 2019-06-20 2022-08-29 エックスリス、コーポレーション 映像信号の符号化/復号化方法及びそのための装置
WO2021052491A1 (en) 2019-09-19 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Deriving reference sample positions in video coding
JP7324940B2 (ja) 2019-09-19 2023-08-10 北京字節跳動網絡技術有限公司 ビデオコーディングにおけるスケーリングウインドウ
WO2021063418A1 (en) 2019-10-05 2021-04-08 Beijing Bytedance Network Technology Co., Ltd. Level-based signaling of video coding tools
EP4029262A4 (en) 2019-10-12 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. PREDICTIVE TYPE SIGNALING IN VIDEO ENCODING
MX2022004200A (es) 2019-10-13 2022-05-02 Beijing Bytedance Network Tech Co Ltd Interaccion entre remuestreo de imagen de referencia y herramientas de codificacion de video.
JP2023508427A (ja) * 2019-12-27 2023-03-02 北京字節跳動網絡技術有限公司 ビデオピクチャヘッダ内でのスライスタイプのシグナリング
CN115211121A (zh) 2020-01-02 2022-10-18 Lg电子株式会社 Ph nal单元编码相关图像解码方法及其装置
CN115280781A (zh) 2020-01-02 2022-11-01 Lg电子株式会社 图像解码方法及其装置
AU2020418309B2 (en) * 2020-01-02 2024-04-04 Lg Electronics Inc. Image decoding method and apparatus for coding image information including picture header

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009119888A1 (en) * 2008-03-28 2009-10-01 Sharp Kabushiki Kaisha Methods, devices and systems for parallel video encoding and decoding
EP2216994A2 (en) * 2009-02-05 2010-08-11 Sony Corporation System and method for image processing

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5471248A (en) 1992-11-13 1995-11-28 National Semiconductor Corporation System for tile coding of moving images
AU5632394A (en) 1993-03-05 1994-09-08 Sony Corporation Apparatus and method for reproducing a prediction-encoded video signal
US5532744A (en) 1994-08-22 1996-07-02 Philips Electronics North America Corporation Method and apparatus for decoding digital video using parallel processing
JP2003174650A (ja) 2001-09-27 2003-06-20 Canon Inc 画像符号化装置、可変長符号化装置、制御装置およびそれらの方法
US6919826B1 (en) 2003-12-19 2005-07-19 Sun Microsystems, Inc. Systems and methods for efficient and compact encoding
US7595743B1 (en) 2005-10-26 2009-09-29 Lsi Corporation System and method for reducing storage requirements for content adaptive binary arithmetic coding
KR100943912B1 (ko) * 2006-01-12 2010-03-03 엘지전자 주식회사 다시점 비디오의 처리 방법 및 장치
KR100959536B1 (ko) 2006-03-30 2010-05-27 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
US8699583B2 (en) 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
CA2657267C (en) 2006-07-13 2013-07-16 Qualcomm Incorporated Video coding with fine granularity scalability using cycle-aligned fragments
US8218908B2 (en) 2006-11-02 2012-07-10 Canon Kabushiki Kaisha Mixed content image compression with two edge data representations
WO2008117963A1 (en) 2007-03-23 2008-10-02 Lg Electronics Inc. A method and an apparatus for decoding/encoding a video signal
PT3758381T (pt) 2007-04-12 2021-04-13 Dolby Int Ab Disposição em mosaico na codificação e descodificação de vídeo
US8619874B2 (en) 2007-04-13 2013-12-31 Apple Inc. Method and system for video encoding and decoding
EP2149262A4 (en) 2007-04-25 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
CA2722204C (en) 2008-04-25 2016-08-09 Thomas Schierl Flexible sub-stream referencing within a transport data stream
WO2010050157A1 (en) 2008-10-30 2010-05-06 Thomson Licensing Image encoding apparatus, image encoding method, and image encoding program
US9047217B2 (en) * 2009-08-27 2015-06-02 Cleversafe, Inc. Nested distributed storage unit and applications thereof
FR2951896A1 (fr) 2009-10-23 2011-04-29 France Telecom Procede d'encapsulation de sous-flux de donnees, procede de desencapsulation et programmes d'ordinateur correspondants
US20120075436A1 (en) 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
IL210169A0 (en) * 2010-12-22 2011-03-31 Yehuda Binder System and method for routing-based internet security
US9060174B2 (en) 2010-12-28 2015-06-16 Fish Dive, Inc. Method and system for selectively breaking prediction in video coding
US9325999B2 (en) 2011-03-10 2016-04-26 Sharp Kabushiki Kaisha Video decoder for slices
US9124895B2 (en) 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US9077998B2 (en) 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009119888A1 (en) * 2008-03-28 2009-10-01 Sharp Kabushiki Kaisha Methods, devices and systems for parallel video encoding and decoding
EP2216994A2 (en) * 2009-02-05 2010-08-11 Sony Corporation System and method for image processing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HOROWITZ M ET AL: "Generalized slices", 《GENERALIZED SLICES》 *
KIRAN MISRA ET AL: "Lightweight slicing for entropy coding", 《4. JCT-VC MEETING; 95.MPEG MEETING》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
CN105900446A (zh) * 2014-01-17 2016-08-24 索尼公司 通信装置、通信数据生成方法和通信数据处理方法
CN105900446B (zh) * 2014-01-17 2019-11-05 索尼公司 通信装置、通信数据生成方法和通信数据处理方法
US10820024B2 (en) 2014-01-17 2020-10-27 Saturn Licensing Llc Communication apparatus, communication data generation method, and communication data processing method
US11284135B2 (en) 2014-01-17 2022-03-22 Saturn Licensing Llc Communication apparatus, communication data generation method, and communication data processing method
CN106464924A (zh) * 2014-06-25 2017-02-22 高通股份有限公司 多层视频译码
CN106464924B (zh) * 2014-06-25 2019-07-09 高通股份有限公司 解码多层视频数据的方法、装置及计算机可读媒体
CN113826146A (zh) * 2019-05-23 2021-12-21 谷歌有限责任公司 自回归视频生成神经网络

Also Published As

Publication number Publication date
US20120189049A1 (en) 2012-07-26
EP3565250A8 (en) 2019-12-25
EP2668782A1 (en) 2013-12-04
KR20130119488A (ko) 2013-10-31
CN103329530B (zh) 2017-09-08
EP4336834A3 (en) 2024-04-10
EP4336834A2 (en) 2024-03-13
WO2012103247A1 (en) 2012-08-02
JP5770311B2 (ja) 2015-08-26
EP3565250B1 (en) 2023-12-13
EP3565250C0 (en) 2023-12-13
JP2014510440A (ja) 2014-04-24
US9215473B2 (en) 2015-12-15
EP3565250A1 (en) 2019-11-06
KR101625724B1 (ko) 2016-06-13

Similar Documents

Publication Publication Date Title
CN103329530A (zh) 视频译码中的子切片
CN113727101B (zh) 编码器、解码器及对应帧间预测方法
KR102240141B1 (ko) 이미지 예측 방법 및 장치
CA2898154C (en) Method and apparatus for video encoding for each spatial sub-area, and method and apparatus for video decoding for each spatial sub-area
CN103621095A (zh) 用于视频译码中的帧内预测的边界像素填补
CN104205830A (zh) 用于在视频译码中的参考索引译码的旁路二进制位
CN103959781A (zh) 填补经译码切片nal单元中的片段
CN104094605A (zh) B切片中的预测单元限于单向帧间预测
TR201906900T4 (tr) Dilim parçaları için entropi kod çözme usulü.
CN103891281A (zh) 检测用于视频译码的相邻视频单元的可用性
CN104160704A (zh) B切片中的预测单元限于单向帧间预测
CN103299627A (zh) 视频译码中的帧分裂
CN103202016A (zh) 用于视频译码的自适应运动向量分辨率信令
CN104040900A (zh) 用于上下文自适应二进制算术译码的上下文数目缩减
CN104137542A (zh) 用于变换系数译码的上下文导出中的基于扫描的滑动窗
CN103621086A (zh) 视频译码中的最后有效变换系数在扫描次序中的位置的导出
CN103988505A (zh) 在视频数据的波前并行处理中的受约束参考图片集合
CN103299621A (zh) 用于视频译码中的一般化p/b帧的参考图片列表构造
CN104704843A (zh) 视频性质的指示
CN103797802A (zh) 用于视频译码中的短距离帧内预测的线缓冲器减少
CN104322071A (zh) 参数集译码
KR20240040131A (ko) 비디오 픽처 예측 방법 및 장치
CN104081778A (zh) 并行运动估计范围大小的隐含推导
US11601667B2 (en) Inter prediction method and related apparatus
RU2575412C2 (ru) Заполнение краевых пикселов неинформативными символами для внутреннего предсказания при кодировании видеосигнала

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170908

Termination date: 20190125

CF01 Termination of patent right due to non-payment of annual fee