CN106416245A - 用于块内复制的系统和方法 - Google Patents

用于块内复制的系统和方法 Download PDF

Info

Publication number
CN106416245A
CN106416245A CN201580030892.2A CN201580030892A CN106416245A CN 106416245 A CN106416245 A CN 106416245A CN 201580030892 A CN201580030892 A CN 201580030892A CN 106416245 A CN106416245 A CN 106416245A
Authority
CN
China
Prior art keywords
prediction
picture
video data
block
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580030892.2A
Other languages
English (en)
Other versions
CN106416245B (zh
Inventor
庞超
克里希纳坎斯·拉帕卡
李想
霍埃尔·索赖·罗哈斯
谢成郑
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN106416245A publication Critical patent/CN106416245A/zh
Application granted granted Critical
Publication of CN106416245B publication Critical patent/CN106416245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Abstract

本发明提供了用于对视频数据进行编码和解码的技术和系统。举例来说,对视频数据进行编码的方法包含在编码器处获得视频数据,并且确定使用块内复制预测在视频数据上执行图片内预测,以产生多个经编码视频图片。所述方法还包含使用块内复制预测在视频数据上执行图片内预测,并且响应于确定使用块内复制预测在视频数据上执行图片内预测而针对多个经编码视频图片停用图片间双向预测或图片间单向预测中的至少一个。所述方法还包含根据所执行的块内复制预测基于接收到的视频数据产生多个经编码视频图片。

Description

用于块内复制的系统和方法
技术领域
本发明大体上涉及视频译码,且更确切地说涉及用于块内复制的技术和系统。
背景技术
许多装置和系统允许视频数据得到处理并且输出用于消耗。数字视频数据包含大量数据以满足消费者和视频提供商的需求。举例来说,视频数据的消费者希望视频具有最佳的质量以及高保真度、分辨率、帧率等等。因此,需要满足这些需求的大量视频数据给处理和存储视频数据的通信网络和装置造成了负担。
各种视频译码技术可用于压缩视频数据。根据一或多个视频译码标准执行视频译码。举例来说,视频译码标准包含高效视频译码(HEVC)、高级视频译码(AVC)、移动图片专家组(MPEG)译码或类似物。视频译码通常使用预测方法(例如,帧间预测、帧内预测、或类似物),这些预测方法利用存在于视频图像或序列中的冗余。视频译码技术的重要目标是使用较低位速率将视频数据压缩成表格,同时避免或最小化视频质量的降级。随着不断演进的视频服务变得可供使用,需要具有更好的译码效率的编码技术。
发明内容
在一些实施例中,描述用于执行块内复制的技术和系统。在一些实例中,当启用块内复制预测时可以在一或多个预测技术上施加某些限制。举例来说,当执行块内复制预测技术时可以停用一或多个预测技术。在另一个实例中,当预测块大小小于或等于块大小时可以停用一或多个预测技术。本文中描述了用于控制预测技术的使用的其它实例。
在一些实施例中,描述用于选择性地确定用于块内复制预测技术的参考块的技术和系统。举例来说,在执行块内复制预测时用于选择使用的参考块的技术可以确定从被视为用于块内复制预测的块中排除使用双向预测编码的块。本文中描述了其它实例以用于选择性地确定在执行块内复制预测时使用的参考块。
通过根据本文中论述的各个方面和特征执行块内复制技术,减小了存储器带宽和/或大小需求。
一个发明性方面在于编码视频数据以产生多个经编码视频图片的方法。所述方法包含在编码器处获得视频数据,并且使用块内复制预测确定在视频数据上执行图片内预测,以产生多个经编码视频图片。所述方法还包含使用块内复制预测在视频数据上执行图片内预测,并且响应于确定使用块内复制预测在视频数据上执行图片内预测而停用用于多个经编码视频图片的图片间双向预测或图片间单向预测中的至少一个。所述方法还包含根据执行的块内复制预测基于接收到的视频数据产生多个经编码视频图片。
另一发明性方面是用于编码视频数据的设备。所述设备包含:存储器,其经配置以存储视频数据;以及处理器,其经配置以获得视频数据,确定使用块内复制预测在视频数据上执行图片内预测,以产生多个经编码视频图片,并且使用块内复制预测在视频数据上执行图片内预测。处理器还经配置以响应于确定使用块内复制预测在视频数据上执行图片内预测,停用用于所述多个经编码视频图片的图片间双向预测或图片间单向预测中的至少一个。处理器还经配置以根据所执行的块内复制预测基于视频数据产生多个经编码视频图片。
另一发明性方面是具有存储在其上的指令的编码器的计算机可读媒体,在由处理器执行所述指令时使得所述处理器执行编码视频数据的方法以产生多个经编码视频图片。所述方法包含获得视频数据,确定使用块内复制预测在视频数据上执行图片内预测以产生多个经编码视频图片,并且使用块内复制预测在视频数据上执行图片内预测。所述方法还包含响应于确定使用块内复制预测在视频数据上执行图片内预测,停用用于所述多个经编码视频图片的图片间双向预测或图片间单向预测中的至少一个。所述方法还包含根据执行的块内复制预测基于视频数据产生多个经编码视频图片。
另一发明性方面在于解码视频数据以产生多个经解码视频图片的方法。所述方法包含在视频位流中接收使用多个可选预测模式编码的经编码的视频数据。多个预测模式包含图片间单向预测模式、图片间双向预测模式和图片内块内复制模式。所述方法还包含在视频位流中接收针对经编码的视频数据的部分停用图片间双向预测的指示。所述方法还包含基于所述指示从多个预测模式中确定预测模式以用于预测经编码的视频数据的部分的预测单元,并且根据所确定的预测模式解码经编码的视频数据的部分的预测单元。
另一发明性方面是用于解码视频数据的设备。所述设备包含存储器,所述存储器经配置以存储在视频位流中接收的并且通过多个预测模式编码的经编码的视频数据。多个预测模式包含图片间单向预测模式、图片间双向预测模式和图片内块内复制模式。所述设备进一步包含处理器,所述处理器经配置以从存储器中获得经编码的视频数据,并且在视频位流中接收针对经编码的视频数据的部分停用图片间双向预测的指示。所述处理器还经配置以基于所述指示从多个预测模式中确定预测模式以用于预测经编码的视频数据的部分的预测单元。所述处理器还经配置以根据所确定的预测模式解码经编码的视频数据的部分的预测单元。
另一发明性方面是具有存储在其上的指令的解码器的计算机可读媒体,在由处理器执行所述指令时使得所述处理器执行解码视频数据的方法以产生多个经解码视频图片。所述方法包含在视频位流中接收使用多个预测模式编码的经编码视频。多个预测模式包含图片间单向预测模式、图片间双向预测模式和图片内块内复制模式。所述方法还包含在视频位流中接收图片间双向预测针对经编码的视频数据的部分停用的指示,基于所述指示从多个预测模式中确定预测模式以用于预测经编码的视频数据的部分的预测单元,并且根据所确定的预测模式解码经编码的视频数据的部分的预测单元。
本发明内容并非意图识别所主张的标的物的关键特征或基本特征,也并非意图单独用于确定所主张的标的物的范围。标的物应参考此专利的整个说明书的适当部分、任何或所有图式以及每一权利要求来理解。
在参考以下说明书、权利要求书以及附图之后,前述内容连同其它特征和实施例将变得更显而易见。
附图说明
下文将参考以下图式详细描述本发明的说明性实施例:
图1是根据一些实施例说明编码装置和解码装置的实例的方块图。
图2是说明块内复制过程的方块图。
图3是说明具有分散块向量的块内复制过程的方块图。
图4是说明具有在多个单元片上分散的块向量的块内复制过程的方块图。
图5说明编码视频数据的过程的实施例。
图6说明解码视频数据的过程的实施例。
图7说明编码视频数据的过程的实施例。
图8是根据一些实施例说明实例视频编码器的方块图。
图9是根据一些实施例说明实例视频解码器的方块图。
具体实施方式
下文提供了本发明的某些方面和实施例。如所属领域的技术人员所显而易见的,这些方面和实施例中的一些可以独立地应用并且它们中的一些可以组合应用。在以下描述中,出于说明的目的,阐述特定细节以便提供对本发明的实施例的透彻理解。然而,将显而易见的是,可在无这些特定细节的情况下实践各种实施例。图式和描述并不意图为限制性的。
以下描述仅提供示例性实施例,且并不意图限制本发明的范围、适用性或配置。实际上,示例性实施例的以下描述将为所属领域的技术人员提供用于实施示例性实施例的启发性描述。应理解,在不脱离如在所附权利要求书中所阐述的本发明的精神和范围的情况下,可对元件的功能和布置进行各种改变。
在以下描述中给出具体细节以提供对实施例的透彻理解。然而,所属领域的一般技术人员应理解,所述实施例可在没有这些特定细节的情况下实践。举例来说,电路、系统、网络、过程和其它组件可以方块图形式示出为组件以免以不必要的细节混淆实施例。在其它情况下,可以在没有不必要的细节的情况下展示众所周知的电路、过程、算法、结构以及技术以免混淆实施例。
并且,应注意,个体实施例可描述为经描绘为流程图、作业图、数据流图、结构图或方块图的过程。虽然流程图可将操作描述为顺序过程,但许多操作可并行或同时执行。另外,操作的顺序可以重新布置。过程在其操作完成时终止,但是可以具有不包含在图中的额外步骤。过程可对应于方法、函数、过程、子例程、子程序等。当过程对应于函数时,过程的终止可对应于函数返回到调用函数或主函数。
术语“计算机可读媒体”包含但不限于便携式或非便携式存储装置、光学存储装置以及能够存储、包含或运载指令和/或数据的各种其它媒体。计算机可读媒体可包含非暂时性媒体,在非暂时性媒体中可以存储数据,并且非暂时性媒体并不包含无线地或在有线连接上传播的载波和/或暂时性电子信号。非暂时性媒体的实例可包含(但不限于)磁盘或磁带、光学存储媒体,例如光盘(CD)或数字通用光盘(DVD)、快闪存储器、存储器或存储器装置。计算机可读媒体可具有存储在其上的可表示过程、函数、子程序、程序、例程、子例程、模块、软件包、类别的代码和/或机器可执行指令,或指令、数据结构或程序语句的任何组合。代码段可以通过传递和/或接收信息、数据、自变量、参数或存储器内容而耦合到另一代码段或硬件电路。信息、自变量、参数、数据等可经由包含存储器共享、消息传递、令牌传递、网络传输或类似物的任何合适的手段传递、转发或传输。
此外,实施例可以由硬件、软件、固件、中间件、微码、硬件描述语言或其任何组合来实施。当以软件、固件、中间件或微码实施时,用以执行必要任务的程序代码或代码段(例如,计算机程序产品)可存储在计算机可读或机器可读媒体中。处理器可以执行必要任务。
本文中描述了使用视频编码器和解码器的视频译码的若干系统和方法。举例来说,一或多个系统和方法涉及不可用层、层集合和操作点的处理,以及多层视频译码中的代表格式参数的限制。
随着更多装置和系统为消费者提供消耗数字视频数据的能力,对于高效视频译码技术的需要变得更加重要。需要视频译码以减少处理存在于数字视频数据中的大量数据所必需的存储和传输需要。各种视频译码技术可用于使用较低位速率将视频数据压缩成表格同时维持高视频质量。
图1是说明包含编码装置104和解码装置112的系统100的实例的方块图。编码装置104可以是源装置的一部分,并且解码装置112可以是接收装置的一部分。源装置和/或接收装置可以包含电子装置,例如,移动或静止电话手持机(例如,智能电话、蜂窝式电话或类似物)、桌上型计算机、膝上型计算机或笔记本电脑、平板计算机、机顶盒、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或任何其它合适的电子装置。在一些实例中,源装置和接收装置可以包含一或多个无线收发器以用于无线通信。本文中描述的译码技术适用于各种多媒体应用中的视频译码,包含串流视频传输(例如,在互联网上)、电视广播或传输、数字视频的编码以用于存储在数据存储媒体上、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统100可以支持单向或双向视频传输,以支持例如视频会议、视频流式传输、视频重放、视频广播游戏和/或视频电话的应用。
编码装置104(或编码器)可用于使用视频译码标准或协议对视频数据进行编码以产生经编码视频位流。视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-TH.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264(也称为ISO/IEC MPEG-4 AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。更为新近的视频译码标准、高效视频译码(HEVC)已经由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合协作小组(JCT-VC)完成。HEVC的各种扩展应对多层视频译码并且也是由JCT-VC研发出来的,包含HEVC的多视图扩展(被称作MV-HEVC)以及HEVC的可缩放扩展(被称作SHVC)或任何其它合适的译码协议。HEVC草案规范可得自:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1003-v1.zip。MV-HEVC的工作草案可得自:http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/8_Valencia/wg11/JCT3V-H1002-v5.zip。SHVC的工作草案得自:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1008-v2.zip。
本文中描述的许多实施例使用HEVC标准或其扩展来描述实例。然而,本文中描述的技术和系统也可以适用于其它译码标准,例如,AVC、MPEG、其扩展或其它合适的译码标准。相应地,虽然本文中描述的技术和系统可以参考特定视频译码标准描述,但是所属领域的一般技术人员将理解描述不应解释为仅适用于特定标准。
视频源102可以将视频数据提供到编码装置104。视频源102可以是源装置的一部分,或者除了源装置外的装置的一部分。视频源102可以包含视频捕获装置(例如,摄像机、相机电话、视频电话或类似物)、包含存储的视频的视频存档、提供视频数据的视频服务器或内容提供商、从视频服务器或内容提供商接收视频的视频馈送接口、用于产生计算机图形视频数据的计算机图形系统、此类来源的组合或任何其它合适的视频源。
来自视频源102的视频数据可以包含一或多个输入图片或帧。图片或帧是视频的一部分的静态图像。编码装置104的编码器引擎106(或编码器)对视频数据进行编码以产生经编码视频位流。举例来说,HEVC位流可以包含被称作网络抽象层(NAL)单元的一系列数据单元。在HEVC标准中存在两类NAL单元,包含视频译码层(VCL)NAL单元和非VCL NAL单元。VCL NAL单元包含经译码的图片数据的一个切片或切片段(下文描述),非VCL NAL单元包含涉及多个经译码图片的控制信息。经译码的图片和对应于经译码的图片的非VCL NAL单元(如果存在)被称作存取单元(AU)。
NAL单元可以包含形成视频数据的经译码表示的一系列位,例如,视频中的图片的经译码的表示。编码器引擎106通过将每个图片分割成多个切片来产生经译码表示。切片不依赖于其它切片使得切片中的信息得到译码而无需依赖于来自相同图片内的其它切片的数据。切片包含一或多个切片段,包含独立的切片段,并且如果存在的话,包含取决于先前切片段的一或多个依赖性切片段。切片随后被分割成亮度样本和色度样本的译码树块(CTB)。亮度样本的CTB和色度样本的一或多个CTB连同样本的语法一起被称作译码树单元(CTU)。CTU是用于HEVC编码的基础处理单元。CTU可以被分成不同大小的多个译码单元(CU)。CU包含被称作译码块(CB)的亮度和色度样本阵列。
亮度和色度CB可以进一步分成预测块(PB)。PB是使用用于帧间预测的相同运动参数的亮度或色度分量的样本的块。亮度PB和一或多个色度PB连同相关联的语法形成预测单元(PU)。一组运动参数在位流中用信号发送用于每个PU并且用于亮度PB和一或多个色度PB的帧间预测。CB也可以被分割成一或多个变换块(TB)。TB表示色彩分量的样本的正方块,在TB上面相同二维变换适用于译码预测残余信号。变换单元(TU)表示亮度和色度样本的TB以及对应的语法元素。
CU的大小对应于译码节点的大小,且形状为正方形。举例来说,CU的大小可以是8×8个样本、16×16个样本、32x32个样本、64x64个样本,或高达对应的CTU的大小的任何其它适当大小。本文中使用短语“N×N”指代就垂直和水平尺寸而言的视频块的像素尺寸(例如,8像素x8像素)。块中的像素可以按行和列布置。在一些实施例中,块可以在水平方向上不具有与在垂直方向上相同数目的像素。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU经帧内预测模式编码或是经帧间预测模式编码之间有所不同。PU可分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据CTU分割成一或多个TU。TU可为正方形或非正方形形状。
根据HEVC标准,使用变换单元(TU)执行变换。TU可以针对不同CU发生改变。TU可以基于给定CU内的PU的大小得大小设定。TU可与PU大小相同或小于PU。在一些实例中,对应于CU的残余样本可使用被称为“残余四叉树”(RQT)的四叉树结构细分成较小单元。RQT的叶节点可以对应于TU。可以对与TU相关联的像素差值进行变换以产生变换系数。变换系数可随后通过编码器引擎106进行量化。
一旦视频数据的图片被分割成CU,则编码器引擎106使用预测模式预测每个PU。随后从原始视频数据中减去预测以获得残余(下文描述)。对于每个CU,预测模式可以在位流内部使用语法数据用信号发送。预测模式可以包含帧内预测(或图片内预测)或帧间预测(或图片间预测)。使用帧内预测,每个PU是从相同图片中的相邻图像数据中预测的,方法是使用例如DC预测以寻找PU的平均值、使用平面预测以使规划表面与PU适配、使用方向预测以从相邻数据中进行推断,或者使用任何其它合适类型的预测。使用帧间预测,每个PU是使用运动补偿预测从一或多个参考图片中的图像数据预测的(在当前图片按输出顺序之前或之后)。举例来说,可以在CU层级处作出是否使用图片间或图片内预测对图片区域进行译码的决策。
帧间预测使用单向预测,每个预测块使用最多一个运动补偿预测信号,并且产生P个预测单元。帧间预测使用双向预测,每个预测块使用最多两个运动补偿预测信号,并且产生B个预测单元。
PU可以包含涉及预测过程的数据。举例来说,当PU使用帧内预测编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU使用帧间预测编码时,PU可以包含定义PU的运动向量的数据。举例来说,定义PU的运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
编码器104可随后执行变换和量化。举例来说,在预测之后,编码器引擎106可以计算对应于PU的残余值。残余值可以包括像素差值。在预测执行之后可能剩余的任何残余数据是使用块变换进行变换的,所述块变换可以基于离散余弦变换、离散正弦变换、整数变换、小波变换或其它合适的变换功能。在一些情况下,一或多个块变换(例如,大小32x32、16x16、8x8、4x4或类似物)可以应用于每个CU中的残余数据。在一些实施例中,TU可以用于通过编码器引擎106实施的变换和量化过程。具有一或多个PU的给定CU还可包含一或多个TU。如下文中进一步描述,残余值可以使用块变换变换成变换系数,且随后可以使用TU进行量化和扫描以产生用于熵译码的串行变换系数。
在一些实施例中在使用CU的PU的帧内预测或帧间预测译码之后,编码器引擎106可以计算针对CU的TU的残余数据。PU可以包括空间域(或像素域)中的像素数据。TU可包括在块变换的应用之后的变换域中的系数。如前文所述,残余数据可以对应于在未经编码图片的像素与对应于PU的预测值之间的像素差值。编码器引擎106可以形成包含CU的残余数据的TU,并且可随后变换TU以产生用于CU的变换系数。
编码器引擎106可以执行变换系数的量化。量化提供进一步压缩,方法是对变换系数进行量化以减小用于表示系数的数据的数量。举例来说,量化可以减小与系数中的一些或全部相关联的位深度。在一个例子中,可在量化期间将具有n位值的系数向下舍入到m位值,其中n大于m。
一旦执行量化,经译码位流包含经量化变换系数、预测信息(例如,预测模式、运动向量或类似物)、分割信息和任何其它合适的数据,例如,其它语法数据。经译码位流的不同元素可随后通过编码器引擎106得到熵编码。在一些实例中,编码器引擎106可利用预定义扫描顺序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在一些实例中,编码器引擎106可以执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,编码器引擎106可对一维向量进行熵编码。举例来说,编码器引擎106可以使用上下文适应性可变长度译码、上下文自适应二进制算术译码、基于语法的上下文自适应二进制算术译码、概率区间分割熵译码或另一合适的熵编码技术。
如先前描述,HEVC位流包含一组NAL单元。形成经译码视频位流的位的序列存在于VCL NAL单元中。除其它信息之外,非VCL NAL单元可以包含具有涉及经编码视频位流的高层级信息的参数集。举例来说,参数集可以包含视频参数集(VPS)、序列参数集(SPS)和图片参数集(PPS)。参数集的目标是位速率效率、错误恢复性且提供系统层接口。每一切片参考单个激活的PPS、SPS和VPS以存取解码装置112可以用于解码切片的信息。标识符(ID)可以经译码用于每个参数集,包含VPS ID、SPS ID和PPS ID。SPS包含SPS ID和VPS ID。PPS包含PPS ID和SPS ID。每一切片标头包含PPS ID。使用ID,可以针对给定切片识别激活的参数集。
PPS包含应用于给定图片中的全部切片的信息。因为这一点,图片中的全部切片指代相同PPS。不同图片中的切片也可以指代相同PPS。SPS包含适用于相同经译码视频序列或位流中的所有图片的信息。经译码视频序列是一系列存取单元,这些存取单元开始于随机存取点图片(例如,瞬时解码参考(IDR)图片或断链存取(BLA)图片,或其它适当的随机存取点图片)并且包含全部存取单元直到下一随机存取点图片而不包含下一随机存取点图片(或位流的端部)。SPS中的信息并不通常在经译码视频序列内在图片之间发生改变。经译码视频序列中的所有图片使用相同SPS。VPS包含适用于经译码视频序列或位流中的所有层的信息。VPS包含具有适用于整个经译码的视频序列的语法元素的语法结构。在一些实施例中,VPS、SPS或PPS可以与经编码位流一起带内传输。在一些实施例中,VPS、SPS或PPS与包含经译码视频数据的NAL单元相比可以在单独传输中带外传输。
编码装置104的输出端110可以在通信链路120上将构成经编码的视频数据的NAL单元发送到接收装置的解码装置112。解码装置112的输入端114可以接收NAL单元。通信链路120可以包含使用无线网络、有线网络或有线和无线网络的组合传输的信号。无线网络可以包含任何无线接口或无线接口的组合并且可以包含任何合适的无线网络(例如,互联网或其它广域网、基于数据包的网络、WiFiTM、射频(RF)、UWB、WiFi-Direct、蜂窝、长期演进(LTE)、WiMaxTM或类似物)。有线网络可以包含任何有线接口(例如,纤维、以太网、电力线以太网、同轴电缆上的以太网、数字信号线(DSL)或类似物)。有线和/或无线网络可以使用各种设备实施,例如,基站、路由器、存取点、桥接、网关、开关或类似物。经编码视频数据可根据通信标准(例如,无线通信协议)加以调制,且传输到接收装置。
在一些实例中,编码装置104可以在存储装置108中存储经编码的视频数据。输出端110可以从编码器引擎106或从输出端110取回经编码的视频数据。存储装置108可以包含多种分布式或本地存取的数据存储媒体中的任何一种。举例来说,存储装置108可以包含硬盘驱动器、存储盘、快闪存储器易失性或非易失性存储器或用于存储经编码的视频数据的任何其它合适的数字存储媒体。
输入端114接收经编码的视频数据并且可以将视频数据提供到解码器引擎116或到存储装置118以用于稍后供解码器引擎116使用。解码器引擎116可以通过熵解码(例如,使用熵解码器)对经编码的视频数据进行解码并且提取构成经编码的视频数据的经译码视频序列的元素。解码器引擎116可随后重新按比例缩放并且在经编码的视频数据上执行逆变换。残余随后传递到解码器引擎116的预测级。解码器引擎116随后预测像素块(例如,PU)。在一些实例中,预测被添加到逆变换的输出。
解码装置112可以输出经解码视频到视频目的地装置112,所述视频目的地装置可以包含显示器或其它输出装置以用于将经解码视频数据显示给内容的消费者。在一些方面,视频目的地装置122可以是包含解码装置112的接收装置的一部分。在一些方面,视频目的地装置122可以是除了的接收装置的单独装置的一部分。
在一些实施例中,视频编码装置104和/或视频解码装置112可以相应地与音频编码装置和音频解码装置集成。视频编码装置104和/或视频解码装置112还可以包含实施上文所述的译码技术所必需的其它硬件或软件,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码装置104和视频解码装置112可以集成为相应的装置中的组合编码器/解码器(编码解码器)的一部分。下文参考图8描述具有编码装置104的具体细节的实例。下文参考图9描述具有解码装置112的具体细节的实例。
如上文所指出,HEVC标准的扩展包含多视图视频译码扩展(被称作MV-HEVC)和可缩放视频译码扩展(被称作SHVC)。MV-HEVC和SHVC扩展共享分层译码的概念,其中经编码视频位流中包含不同层。经译码视频序列中的每个层通过唯一层识别符(ID)寻址。层ID可以存在于NAL单元的标头中以识别NAL单元与之相关联的层。在MV-HEVC中,不同层通常表示视频位流中的同一场景的不同视图。在SHVC中,提供表示不同空间分辨率(或图片分辨率)或不同重构保真度的视频位流的不同可缩放层。可缩放层可以包含基础层(具有层ID=0)和一或多个增强层(具有ID=1、2……n)。基础层可以符合HEVC的第一版本的简档,并且表示在位流中可供使用的最低层。与基础层相比,增强层具有增大的空间分辨率、时间分辨率或帧率和/或重构保真度(或质量)。增强层是阶层式组织的并且可以(或可以不)取决于较低层。在一些实例中,不同层可以使用单个标准编码解码器译码(例如,全部层使用HEVC、SHVC或其它译码标准进行编码)。在一些实例中,可使用多标准编解码器对不同层进行译码。举例来说,基础层可以使用AVC进行译码,而一或多个增强层可以使用HEVC标准的SHVC和/或MV-HEVC扩展进行译码。
如先前描述,各种预测模式可以用于视频译码过程,包含帧内预测。一种形式的帧内预测包含块内复制。块内复制包含于HEVC范围扩展工作草案文本(JCTVC-P1005)中。使用图像帧或图片中的冗余,块内复制执行块匹配以预测样本的块(例如,CU、PU或其它译码块)作为从图像帧的相邻区域中的样本的经重构块的移位。通过从内容的重复模式中移除冗余,块内复制预测改进译码效率。
本文中描述的技术和系统涉及改进存储器带宽效率、限制最差情况存储器存取和块内复制的其它方面。本文档中的方面和方法适用于HEVC及其扩展,例如,屏幕内容译码或其它扩展。举例来说,译码工具可以实施用于译码屏幕内容材料,例如,文本和运动的图形。另外,可以提供改进屏幕内容的译码效率的技术。译码效率的显著改进可以通过利用屏幕内容的特性通过各种译码工具获得。举例来说,可能的高位深度(大于8位)的一些方面的支持、高色度采样格式(包含4:4:4和4:2:2)以及其它改进。
本文中描述的块内复制工具使得能够从非相邻样本中进行空间预测但是在当前图片内。举例来说,图2说明其中块内复制用于预测当前译码单元202的经译码图片200。当前译码单元202是使用块向量206从经译码图片200的已经解码的预测块204中预测的(在环路内滤波之前)。环路内滤波可以包含环路内去阻断滤波和样本自适应偏移(SAO)。在解码器中,预测值被添加到残余而不含任何插值。举例来说,块向量206可以作为整数值用信号发送。在块向量预测之后,块向量差异是使用运动向量差译码方法编码的,例如在HEVC标准中所规定的。使得在CU和PU层级处能够进行块内复制。对于PU层级块内复制,针对全部CU大小支持2NxN和NX2N PU分割。另外,当CU是最小CU时,支持N×N PU分割。
与传统的帧内预测模式相反,块内复制(IBC)允许来自非相邻样本的空间预测。这些非相邻样本可以来自在相同图片内已经解码的样本中任何一个(在环路内滤波之前)并且通过块向量用信号发送。当使用IBC时这些非相邻样本的存储器存取增大总体存储器带宽。举例来说,通过提取空间预测样本(未在高速缓存/本地存储器中)至少部分造成增大的读取存取。应注意在传统的帧内模式中,使用的相邻样本仅是上方样本的1行和左侧样本的1列并且可能放置到高速缓存中。相比之下,当使用IBC时,全部先前编码/解码的样本可用作参考单元。为了支持增大数目的可供使用的样本,系统支持额外的存储器使用。部分由于IBC空间预测的未经滤波样本以及滤波后的重构的样本的存储造成增大的写入存取以用于未来图片的输出/时间预测。
HEVC标准定义最差情况带宽要求。上文所述的增大带宽在一些情况下可以大于HEVC最差情况带宽要求。增大的带宽给IBC技术的实施造成负担,并且使得难以重新安排HEVC核心用途以支持屏幕内容扩展或支持IBC的HEVC扩展。
此外,用于IBC的较大搜索范围可以引起分散块向量分布,引起可能造成极其困难的实施的带宽和性能系统负载。如图3中的实例中所示,有可能的是具有CU的IBC块向量的分布可以是分散的。潜在地这可以引起从外部存储器(DDR)中提取样本的需要,因为并非全部的预测样本都是在高速缓存中可供使用的。为了适配高速缓存区域内的全部预测块需要系统具有极其大的高速缓存,这是昂贵的并且在低功率设计中是不可行的。这大幅度地影响了系统带宽、性能和成本。此类块向量分布随着搜索范围的增大是更加可能的。
较大搜索范围可以引起跨越单元片的块向量分布引起对并行度的严重性能影响。如在图4的实例中所示,有可能的是具有CU的IBC块向量的分布可以是跨越多个单元片分散的。
对于低延迟P译码,确证的是通过现有IBC设计,块和/或运动向量的最差情况数目可以高于HEVC(用于CU、CTB或其它译码单元或块)的运动向量的最差情况数目。这是由于用于最小CU大小的支持NxN。块和/或运动向量的高数目为可能的数目的负载强加了额外的负担。
基于线的IBC包含与传统的IBC相比的具有更细粒度的分割,包含和线一样小的分割。基于线的IBC可以增大运动向量的数目使其大于现有HEVC设计。较高的运动向量将引起增大的样本提取由此增大带宽。
使用切片可以显著帮助错误恢复。帧内切片可以是自给自足的并且可以独立解码。然而,IBC可引入相对于影响其错误恢复能力的另一切片的I切片依赖性。
除其它缺点之外,鉴于上述缺点在本文中论述了块内复制的各个方面。所论述的特征中的每一个可以与一或多个其它解决方案单独地或共同地工作。所论述的方法、系统和方面适用于IBC,但是也可以适用于其它译码工具,例如,具有高带宽和高速缓存需要,例如,1-D词典、选项板或其它译码工具。
在启用IBC时的双向预测限制
在HEVC中,8×8像素块双向预测表示最差情况带宽要求。有益的是全部HEVC扩展也遵循相同最差情况带宽要求。因此,为了减少存储器读存取并且将带宽保持在HEVC最差情况要求的限制内,下文论述了当启用IBC时对双向预测的限制。
在一些实施例中,作为启用IBC的结果,停用帧间双向预测。举例来说,响应于对应于通过IBC的帧内预测的状态,可以停用帧间双向预测。因此,通过IBC,有效地从帧间双向预测到帧内预测减小了对系统资源的需求,例如,存储器带宽。
在一些实施例中,可能需要一或多个额外的状况以停用帧间双向预测。因为与较大预测块相比较小预测块需要更多系统资源,例如,存储器带宽,所以预测块大小可以是停用帧间双向预测的额外的要求。举例来说,在一些实施例中,作为启用IBC并且预测块大小小于或等于预定义大小的结果,停用帧间双向预测。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。
在一些实施例中,旗标可用于规定或指示双向预测是否停用或因此IBC的启用。在一些实施例中,旗标指示是否应用对双向预测的限制,例如,在各种数据构建层级中的任何一个处。举例来说,旗标可以指示限制应用到一或多个序列、图片、切片或其它数据单元。旗标可以在以下参数集中的一或多者处用信号发送:VPS、SPS、PPS、视频可用信息(VUI)、切片标头或它们的相应的扩展。
在一些实施例中,使用以下或等效的序列参数集原始字节序列有效负载(RBSP)语法。在此实施例中,停用双向预测,因为预测块大小小于或等于8×8(例如,基于JCTVC-P1005_v4)。
在一些实施例中,使用以下或等效的SPS语义:
intra_block_copy_restriction_enabled_flag等于1规定当在解码过程用于帧内预测期间使用IBC时启用双向预测的限制。
intra_block_copy_restriction_enabled_flag等于0规定基于IBC的使用的双向预测的限制未被应用。当不存在时,intra_block_copy_enabled_flag的值可推断为等于0。
解码过程
规定list0、list1或双向预测是否用于当前预测单元的inter_pred_idc[x0][y0]的值是根据表1导出的。
表1-到帧间预测模式的姓名相关性
在JCTVC-T1005中,自适应运动向量分辨率(AMVR)特征是使用用信号发送的旗标“use_integer_mv_flag”启用的。旗标的语义如下。
use_integer_mv_flag等于1规定用于帧间预测的运动向量的分辨率。当不存在时,use_integer_mv_flag的值可推断为等于motion_vector_resolution_control_idc。
use_integer_mv_flag为非零规定当前切片中的亮度运动向量的分辨率被认为是整数像素。因此,针对切片中的全部亮度样本可以不需要分数内插。当不需要分数内插时,内插所需要的额外的样本未加载且因此最差情况存储器带宽减小,并且可能低于HEVC最差情况。
在一些实施例中,由于IBC使用并且进一步由于use_integer_mv_flag的状态针对预定块大小的帧间图片停用单向预测和双向预测中的至少一个。这引起带宽使用停留在HEVC最差情况带宽要求的限制内。
在一些实施例中,停用双向预测的条件包含启用IBC、use_integer_mv_flag为零,并且预测块小于(或小于或等于)预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。在一个实例中,除IBC启用且use_integer_mv_flag为零之外,由于预测块大小小于或等于8×8大小或另一大小,可以针对预测块停用双向预测。
在一些实施例中,停用单向预测的条件包含启用IBC、use_integer_mv_flag为零,并且预测块小于(或小于或等于)预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。在一个实例中,由于IBC启用且use_integer_mv_flag为零,对于大小小于或等于8×8大小或另一大小的预测块停用帧间单向预测。
在一些实施例中,停用单向预测和双向预测的条件包含启用IBC,use_integer_mv_flag为零,并且预测块小于(或小于或等于)预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。在一个实例中,由于IBC启用且use_integer_mv_flag为零,针对大小小于或等于16×16大小或另一大小的预测块停用帧间单向预测和双向预测。
在一些实施例中,如果双向预测块是来自相同参考块的双向预测,那么并不应用本文中所论述的预测的停用,使得预测的运动向量指代相同参考块并且是相同的。举例来说,单向预测和/或双向预测的停用可具有对它们的应用的又一条件-触发停用的双向预测块不是从相同参考块中预测的,使得预测的运动向量指代相同参考块并且是相同的。
图5说明通过IBC编码视频数据并且使双向预测和/或单向预测选择性地停用的过程500的实施例。实施过程500以产生多个经编码视频图片。在一些方面,过程500可通过例如图1中所示的编码装置104的计算装置或设备执行。举例来说,计算装置或设备可以包含编码器或处理器、微处理器、微型计算机或经配置以执行过程500的步骤的编码器的其它组件。
过程500被说明为逻辑流程图,其操作表示可以在硬件、计算机指令或其组合中实施的一系列操作。在计算机指令的情形下,操作表示存储在一或多个计算机可读存储媒体上的计算机可执行指令,这些计算机可执行指令在由一或多个处理器执行时实施所叙述的操作。一般而言,计算机可执行指令包含例程、程序、对象、组件、数据结构以及执行特定功能或实施特定数据类型的类似物。描述操作的顺序并不意图解释为限制,且任何数目的所描述操作可以按任何顺序组合和/或并行以实施所述过程。
另外,过程500可以在配置有可执行指令的一或多个计算机系统的控制下执行并且可以实施为在一或多个处理器上通过硬件或其组合共同地执行的译码(例如,可执行指令、一或多个计算机程序或一或多个应用)。如上文所指出,译码可存储在计算机可读或机器可读存储媒体上,例如,呈包括可通过一或多个处理器执行的多个指令的计算机程序的形式。计算机可读或机器可读存储媒体可以是非暂时性的。
在502处,编码视频数据的过程500包含在编码器处获得视频数据。在一些实施例中,编码器经配置以在视频数据上执行图片间单向预测以产生多个P预测单元,以在视频数据上执行图片间双向预测以产生多个B预测单元,并且使用块内复制预测在视频数据上执行图片内预测,以对预测单元进行编码。当执行时,图片间单向预测可以例如产生多个P预测单元。当执行时,图片间双向预测可以例如产生多个B预测单元。当执行时,图片内预测使用块内复制预测以产生例如多个I预测单元。
在504处,过程500包含确定使用块内复制预测在视频数据上执行图片内预测以产生多个经编码视频图片。确定可以例如响应于指示块内复制模式的状态。在一些实施例中,用信号发送旗标是针对解码器产生的,其中用信号发送旗标指示块内复制模式。例如,用于用信号发送旗标的1的值可以指示执行块内复制模式。在另一个实例中,用于用信号发送旗标的0的值可以指示并未执行块内复制模式。
在506处,过程500包含使用块内复制预测在视频数据上执行图片内预测。举例来说,图片内预测可以根据编码器的编程状态使用块内复制预测执行。块内复制预测过程可以包含本文中其它地方所论述的块内复制过程的方面。
在508处,过程500包含响应于确定使用块内复制预测在视频数据上执行图片内预测,针对多个经编码视频图片停用图片间双向预测或图片间单向预测中的至少一个。在一些实施例中,图片内预测和停用响应于用信号发送旗标执行。在一些实施例中,响应于用信号发送旗标,停用图片间双向预测性能和图片间单向预测性能这两者。预测的停用可以包含多个方面或可以响应于本文中其它地方所论述的其它因素。
在510处,过程500包含使用例如本文中其它地方所论述的过程的方面,基于接收到的视频根据块内复制预测产生多个经编码视频图片。举例来说,经编码视频图片可以使用块内复制预测在视频数据上产生。
在一些实施例中,过程500包含本文中论述的其它方面。举例来说,在一些实施例中,过程500包含在视频数据上执行图片间单向预测以产生多个P预测单元。在一些实施例中,过程500包含确定预测单元大小,其中执行图片间双向预测或单向预测是响应于以下两者的组合针对多个经编码视频图片停用的:确定使用块内复制预测在视频数据上执行图片内预测以及预测单元大小小于阈值。在一些实施例中,在过程500中,响应于所述组合针对多个经编码视频图片停用图片间双向预测和图片间单向预测。
在一些实施例中,编码器进一步具有自适应运动向量分辨率(AMVR),并且过程500还包含确定预测单元大小,其中响应于以下各者中的全部的组合针对多个经编码视频图片停用图片间双向预测或图片间单向预测:确定使用块内复制预测在视频数据上执行图片内预测、预测单元大小小于阈值,以及接收AMVR停用的指示。组合可进一步包含具有不同参考单元和不同运动向量中的至少一个的帧间预测双向预测。响应于所述组合可以针对多个经编码视频图片停用图片间双向预测和图片间单向预测。组合可进一步包含具有不同参考单元和不同运动向量中的至少一个的帧间预测双向预测。
图6说明通过IBC解码视频数据并且使双向预测和/或单向预测选择性地停用的过程600的实施例。实施过程600以解码多个经编码视频图片。在一些方面,过程600可通过例如图1中所示的解码装置112的计算装置或设备执行。举例来说,计算装置或设备可以包含解码器或处理器、微处理器、微型计算机或经配置以执行过程600的步骤的解码器的其它组件。
过程600被说明为逻辑流程图,其操作表示可以在硬件、计算机指令或其组合中实施的一系列操作。在计算机指令的情形下,操作表示存储在一或多个计算机可读存储媒体上的计算机可执行指令,这些计算机可执行指令在由一或多个处理器执行时实施所叙述的操作。一般而言,计算机可执行指令包含例程、程序、对象、组件、数据结构以及执行特定功能或实施特定数据类型的类似物。描述操作的顺序并不意图解释为限制,且任何数目的所描述操作可以按任何顺序组合和/或并行以实施所述过程。
另外,过程600可以在配置有可执行指令的一或多个计算机系统的控制下执行并且可以实施为在一或多个处理器上通过硬件或其组合共同地执行的译码(例如,可执行指令、一或多个计算机程序或一或多个应用)。如上文所指出,译码可存储在计算机可读或机器可读存储媒体上,例如,呈包括可通过一或多个处理器执行的多个指令的计算机程序的形式。计算机可读或机器可读存储媒体可以是非暂时性的。
在602处,解码视频数据的过程600包含在视频流中接收使用多个预测模式编码的经编码的视频数据。可以在解码器处接收视频数据。多个预测模式包括图片间单向预测模式、图片间双向预测模式和图片内块内复制模式。在图片间单向预测模式中,解码器经配置以根据单向预测解码,例如,如本文中其它地方所论述的。在图片间双向预测模式中,解码器经配置以根据双向预测解码,例如,如本文中其它地方所论述的。在图片内块内复制模式中,解码器经配置以根据块内复制预测解码,例如,如本文中其它地方所论述的。
在604处,过程600包含在视频位流中接收指示针对经编码的视频数据的部分图片间双向预测停用或图片间双向预测限制启用。举例来说,所述指示可以是在指示图片间双向预测停用或图片间双向预测限制启用的状态中的信令旗标。举例来说,用于信令旗标的1的值可以指示图片间双向预测限制启用或图片间双向预测停用。在另一个实例中,用于信令旗标的0的值可以指示图片间双向预测限制启用或图片间双向预测停用。
在606处,过程600包含基于所述指示从多个预测模式中确定预测模式以用于预测经编码的视频数据的部分的预测单元。在一些实施例中,经编码的视频数据的部分包含多个图片,例如,图片序列。此外,在608处,过程600包含根据所确定的预测模式解码经编码的视频数据的部分的预测单元,使用例如本文中其它地方所论述的过程的方面。
在一些实施例中,过程600包含本文中论述的其它方面。举例来说,响应于所述指示,过程600可以包含排除图片间双向预测预测模式而不用于预测经编码的视频数据的部分的预测单元。
针对IBC的参考样本限制
为了使HEVC最差情况带宽要求保持不变,由于IBC的使用,限制可以额外地或替代地应用到参考样本。
在一些实施例中,本文中所论述的参考样本的限制造成受限制的预测块不可用作参考样本使用。在一些实施例中,对应的替代参考样本由预定义填补方案产生并且可以用于预测。
举例来说,替代参考样本可以通过水平或垂直填补从相邻样本中产生,在此情况下来自一或多个相邻样本的数据得到复制以产生替代参考样本。替代地,替代参考样本可以通过等于预定义值的数据产生。举例来说,预定义值等于2<<(B-1),其中B是样本的位深。
在一些实施例中,当启用IBC时,用于IBC的来自具有双向预测的预测块的潜在参考样本被排除或是不合格的而无法用作参考样本。在一些实施例中,当启用IBC时,用于IBC的来自具有双向预测的预测块的潜在参考样本被排除或是不合格的而无法用作参考样本,这是由于预测块大小小于或等于预定义大小的进一步的条件。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。在一些实施例中,当启用IBC时,用于IBC的来自具有帧间模式预测的预测块的潜在参考样本被排除或是不合格的而无法用作参考样本。
在一些实施例中,当启用IBC时,用于IBC的来自具有帧间模式预测的预测块的潜在参考样本被排除或是不合格的而无法用作参考样本,前提是预测块大小小于或等于预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。
在一些实施例中,当启用IBC时,用于IBC的来自通过双向预测模式(例如,基于JCTVC-P1005_v4)预测的预测块的潜在参考样本被排除或是不合格的而无法用作参考样本。
在一些实施例中,本文中所论述的参考样本的限制基于例如CTU中的参考样本的模式和/或块大小应用在所述CTU层级处。举例来说,如果在特定CTU内使用IBC并且如果块大小小于8×8像素,那么本文中所论述的参考样本的限制中的一或多个可以适用于整个特定CTU。
在一些实施例中,本文中所论述的参考样本的限制适用于当前CTU外部的CTU并且不适用于当前CTU。在一些实施例中,本文中所论述的参考样本的限制适用于当前和下一左侧CTU外部的CTU,但是不应用于当前和下一左侧CTU。
在一些实施例中,本文中所论述的参考样本的限制的应用在use_integer_mv_flag旗标为零上调节。相应地,如果use_integer_mv_flag为零,那么可以应用限制,并且如果use_integer_mv_flag不为零,那么不可以应用限制。
在一些实施例中,当启用IBC时,用于IBC的来自具有带双向预测的至少一个预测块的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本。在另一个实例中,当启用IBC时,用于IBC的来自具有的带双向预测的预测样本的数目大于阈值的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本。举例来说,阈值可以是250、500、1000、5000个样本,或任何其它合适的数目的预测样本。
在一些实施例中,当启用IBC时,用于IBC的来自具有带双向预测的至少一个预测块的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本,前提是预测块大小小于或等于预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。
在一些实施例中,当启用IBC时,用于IBC的来自具有带双向预测的预测样本的数目大于阈值的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本,前提是它们的大小小于或等于预定义大小。举例来说,阈值数目可以是250、500、1000、5000个样本,或任何其它合适的数目的预测样本。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。
在一些实施例中,当启用IBC时,用于IBC的来自具有用于内插的至少一个预测块的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本。在另一个实例中,当启用IBC时,用于IBC的来自具有用于内插的预测样本的数目大于阈值的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本。举例来说,阈值可以是250、500、1000、5000个样本,或任何其它合适的数目的预测样本。
在一些实施例中,当启用IBC时,用于IBC的来自具有用于内插的至少一个预测块的CTU的潜在参考样本被排除或是不合格的而无法用作参考样本,前提是预测块大小小于或等于预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。
在一些实施例中,当启用IBC时,用于IBC的来自具有用于内插的预测样本的数目大于阈值的CTU的潜在参考样本被排除或是不合格的而无法作为参考样本,前提是它们的大小小于或等于预定义大小。举例来说,预定义大小可以是4×4像素、4×8像素、8×4像素、8×8像素、8×16像素、16×16像素、32×32像素或另一大小。举例来说,阈值可以是250、500、1000、5000个样本,或任何其它合适的数目的预测样本。
在一些实施例中,上文所述的参考样本的限制类似地适用于作为内插样本的潜在参考样本。
在一些实施例中,如果双向预测块是来自相同参考块的双向预测,那么不应用本文中所论述的参考样本的限制,使得预测的运动向量指代相同参考块并且是相同的。举例来说,单向预测和/或双向预测的停用可具有对它们的应用的又一条件-触发限制的应用的双向预测块不是从相同参考块中预测的,使得预测的运动向量指代相同参考块并且是相同的。
在下文中论述了用于B切片的具有局部搜索区域的基于JCTVC-P1005_v4的实例规范文本。本文中论述的实施例符合实例规范文本。
解码过程
描述了块内复制预测模式中的块向量分量的导出过程。本文中论述的实施例符合导出过程。
此过程的输入是:
相对于当前图片的左上方亮度样本的当前亮度译码块的左上方样本的亮度位置(xCb,yCb),以及
规定当前亮度译码块的大小的变量log2CbSize。
此过程的输出是块向量bvIntra的(nCbS)x(nCbX)阵列[可被称为单个向量]。
如下导出变量nCbS、nPbSw和nPbSh:
nCbS=1<<log2CbSize (8-25)
nPbSw=nCbS/(PartMode==PART_2Nx2N||PartMode==PART_2NxN?1:2)(8-25)
nPbSh=nCbS/(PartMode==PART_2Nx2N||PartMode==PART_Nx2N?1:2)(8-25)
变量BvpIntra[compIdx]规定块向量预测符。水平块向量分量被分配compIdx=0并且垂直块向量分量被分配compIdx=1。
取决于PartMode,如下导出变量numPartitions:
如果PartMode等于PART_2Nx2N,那么numPartitions被设置成等于1。
否则的话,如果PartMode等于PART_2NxN或PART_Nx2N,那么numPartitions被设置成等于2。
否则的话(PartMode等于PART_NxN),numPartitions被设置成等于4。
对于前进超过值0..(numPartitions-1)的变量blkIdx,块向量bvIntra的阵列通过以下排序步骤导出:
变量blkInc被设置成等于(PartMode==PART_2NxN?2:1)。
变量xPb被设置成等于xCb+nPbSw*(blkIdx*blkInc%2)。
变量yPb被设置成等于yCb+nPbSh*(blkIdx/2)
对于前进超过值0..1的变量compIdx,应用以下排序步骤:
取决于此过程已经针对当前译码树单元调用的次数,以下适用:
如果此过程针对当前译码树单元首次调用,那么bvIntra[xPb][yPb][compIdx]如下导出:
bvIntra[xPb][yPb][0]=BvdIntra[xPb][yPb][0]-nCbS (8-25)
bvIntra[xPb][yPb][1]=BvdIntra[xPb][yPb][1] (8-25)
否则的话,bvIntra[xPb][yPb][compIdx]如下导出:
bvIntra[xPb][yPb][0]=BvdIntra[xPb][yPb][0]+BvpIntra[0] (8-25)
bvIntra[xPb][yPb][1]=BvdIntra[xPb][yPb][1]+BvpIntra[1] (8-25)
BvpIntra[compIdx]的值被更新成等于bvIntra[xPb][yPb][compIdx]。
为了稍后在解码过程中调用的变量的导出过程中的使用,对于x=0..nPbSw-1和y=0..nPbSh-1进行以下赋值:
bvIntra[xPb+x][yPb+y][compIdx]=bvIntra[xPb][yPb][compIdx] (8-25)
位流一致性的要求是以下全部条件为真实的:
-bvIntra[xPb][yPb][0]的值将大于或等于-(xPb%CtbSizeY+64)。
-bvIntra[xPb][yPb][1]的值将大于或等于-(yPb%CtbSizeY)。
-当用于z扫描顺序块可用性的导出过程被调用且(xCurr,yCurr)被设置成等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)被设置成等于(xPb+bvIntra[xPb][yPb][0],yPb+bvIntra[xPb][yPb][1])作为输入时,输出将等于TRUE。
-当用于z扫描顺序块可用性的导出过程被调用且(xCurr,yCurr)被设置成等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)被设置成等于(xPb+bvIntra[xPb][yPb][0]+nPbSw-1,yPb+bvIntra[xPb][yPb][1]+nPbSh-1)作为输入时,输出将等于TRUE。
-以下条件中的一或两个将是真实的:
-bvIntra[xPb][yPb][0]+nPbSw<=0
-bvIntra[xPb][yPb][1]+nPbSh<=0
-Inter_pred_idc[x][y]将等于0或1,其中x=xPb+BvIntra[xPb][yPb][0].xPb+BvIntra[xPb][yPb][0]+(1<<log2CbSize)-1,y=yPb+BvIntra[xPb][yPb][1]..y0+BvIntra[xPb][yPb][1]+(1<<log2CbSize)-1;
基于图片类型/切片类型/分割大小的自适应搜索区域
为了改进高速缓存使用且减小高速缓存遗漏(否则的话,将由于IBC块向量和帧间运动向量出现),可以在块向量范围上施加一些约束条件。
块向量范围约束条件可以单独地施加或组合施加。在块向量范围约束条件中,关注区域并不受限并且可以例如是CU、CTB、最大译码单元(LCU)、切片、单元片或一组CU、CTU、CTB、LCU、切片或单元片。
在一些实施例中,搜索区域是基于图片类型、切片类型和分割大小中的一或多个确定的。另外,语法元素可用于规定用于每个对应的图片类型、切片类型和分割大小的搜索区域。
作为一个实例,如果当前切片是B切片,那么用于IBC块的搜索区域可以被限制为是当前CTB的局部区域。在一些实施例中,由于当前切片为B切片,所以搜索区域被限制到当前CTB和邻近左侧CTB中的因果邻域。
在一些实施例中,搜索区域的大小、形状或位置通过语法元素规定。在一些实施例中,举例来说,语法元素是在VPS、SPS、PPS、VUI、切片标头或CU标头处的位流中用信号发送的。
在一些实施例中,在位流中经译码的一系列块向量基于图片类型、切片类型和分割大小中的一或多个受到限制。另外,语法元素可用于规定用于每个对应的图片类型、切片类型和分割大小的最大块向量范围。举例来说,在一些实施例中,一或多个语法元素可用于规定对于CRA、BLA和IDR图片类型,最大块向量范围相应地等于100、500和1000像素。类似地,一或多个语法元素用于规定用于I切片、B切片、P切片和GPB切片中的每一个的最大块向量范围,并且一或多个语法元素用于规定用于包含4×4像素、8×8像素、16×16像素、32×32像素和64×64像素的每个分割大小的最大块向量范围。
在一些实施例中,搜索区域和最大块向量范围语法元素可以在以下参数集的一或多个中用信号发送:VPS、SPS、PPS、视频可用信息(VUI)、切片标头或它们的相应的扩展。
在下文中论述了用于B切片的具有局部搜索区域的基于JCTVC-P1005_v4的实例规范文本。本文中论述的实施例符合实例规范文本。
解码过程
描述了块内复制预测模式中的块向量分量的导出过程。
此过程的输入是:
相对于当前图片的左上方亮度样本的当前亮度译码块的左上方样本的亮度位置(xCb,yCb),
规定当前亮度译码块的大小的变量log2CbSize。
此过程的输出是块向量bvIntra的(nCbS)x(nCbX)阵列[可被称为单个向量]。
如下导出变量nCbS、nPbSw和nPbSh:
nCbS=1<<log2CbSize (8-25)
nPbSw=nCbS/(PartMode==PART_2Nx2N||PartMode==PART_2NxN?1:2)(8-25)
nPbSh=nCbS/(PartMode==PART_2Nx2N||PartMode==PART_Nx2N?1:2)(8-25)
变量BvpIntra[compIdx]规定块向量预测符。水平块向量分量被分配compIdx=0并且垂直块向量分量被分配compIdx=1。
取决于PartMode,如下导出变量numPartitions:
-如果PartMode等于PART_2Nx2N,那么numPartitions被设置成等于1。
-否则的话,如果PartMode等于PART_2NxN或PART_Nx2N,那么numPartitions被设置成等于2。
-否则的话(PartMode等于PART_NxN),numPartitions被设置成等于4。
对于前进超过值0..(numPartitions-1)的变量blkIdx,块向量bvIntra的阵列通过以下排序步骤导出:
变量blkInc被设置成等于(PartMode==PART_2NxN?2:1)。
变量xPb被设置成等于xCb+nPbSw*(blkIdx*blkInc%2)。
变量yPb被设置成等于yCb+nPbSh*(blkIdx/2)
对于前进超过值0..1的变量compIdx,应用以下排序步骤:
取决于此过程已经针对当前译码树单元调用的次数,以下适用:
如果此过程针对当前译码树单元首次调用,那么bvIntra[xPb][yPb][compIdx]如下导出:
bvIntra[xPb][yPb][0]=BvdIntra[xPb][yPb][0]-nCbS (8-25)
bvIntra[xPb][yPb][1]=BvdIntra[xPb][yPb][1] (8-25)
否则的话,bvIntra[xPb][yPb][compIdx]如下导出:
bvIntra[xPb][yPb][0]=BvdIntra[xPb][yPb][0]+BvpIntra[0] (8-25)
bvIntra[xPb][yPb][1]=BvdIntra[xPb][yPb][1]+BvpIntra[1] (8-25)
BvpIntra[compIdx]的值被更新成等于bvIntra[xPb][yPb][compIdx]。
为了稍后在解码过程中调用的变量的导出过程中的使用,对于x=0..nPbSw-1和y=0..nPbSh-1进行以下赋值:
bvIntra[xPb+x][yPb+y][compIdx]=bvIntra[xPb][yPb][compIdx] (8-25)
位流一致性的要求是以下全部条件为真实的:
-对于B切片类型,bvIntra[xPb][yPb][0]的值将大于或等于-(xPb%CtbSizeY+64)。
-对于B切片类型,bvIntra[xPb][yPb][1]的值将大于或等于-(yPb%CtbSizeY)。
-当用于z扫描顺序块可用性的导出过程被调用且(xCurr,yCurr)被设置成等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)被设置成等于(xPb+bvIntra[xPb][yPb][0],yPb+bvIntra[xPb][yPb][1])作为输入时,输出将等于TRUE。
-当用于z扫描顺序块可用性的导出过程被调用且(xCurr,yCurr)被设置成等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)被设置成等于(xPb+bvIntra[xPb][yPb][0]+nPbSw-1,yPb+bvIntra[xPb][yPb][1]+nPbSh-1)作为输入时,输出将等于TRUE。
-以下条件中的一或两个将是真实的:
-bvIntra[xPb][yPb][0]+nPbSw<=0
-bvIntra[xPb][yPb][1]+nPbSh<=0
图7说明编码视频数据的过程700的实施例。实施过程700以产生多个经编码视频图片。在一些方面,过程700可通过例如图1中所示的编码装置104的计算装置或设备执行。举例来说,计算装置或设备可以包含编码器或处理器、微处理器、微型计算机或经配置以执行过程700的步骤的编码器的其它组件。
过程700被说明为逻辑流程图,其操作表示可以在硬件、计算机指令或其组合中实施的一系列操作。在计算机指令的情形下,操作表示存储在一或多个计算机可读存储媒体上的计算机可执行指令,这些计算机可执行指令在由一或多个处理器执行时实施所叙述的操作。一般而言,计算机可执行指令包含例程、程序、对象、组件、数据结构以及执行特定功能或实施特定数据类型的类似物。描述操作的顺序并不意图解释为限制,且任何数目的所描述操作可以按任何顺序组合和/或并行以实施所述过程。
另外,过程700可以在配置有可执行指令的一或多个计算机系统的控制下执行并且可以实施为在一或多个处理器上通过硬件或其组合共同地执行的译码(例如,可执行指令、一或多个计算机程序或一或多个应用)。如上文所指出,译码可存储在计算机可读或机器可读存储媒体上,例如,呈包括可通过一或多个处理器执行的多个指令的计算机程序的形式。计算机可读或机器可读存储媒体可以是非暂时性的。
在702处,过程700包含在图片中的一个的块上执行图片内预测以产生预测单元。在一些实施例中,执行图片内预测包含选择用于译码树单元(CTU)的块内复制预测的参考块,其中所述选定参考块是选自多个编码块的,并且其中通过双向预测编码的CTU内的块被排除而不被选择为参考块。执行图片内预测还可以包含在参考块上执行块内复制预测以产生预测单元。
在704处,过程700包含基于执行的图片内预测产生编码预测单元的语法元素。
在一些实施例中,过程700包含本文中论述的其它方面。举例来说,过程700可以包含确定预测单元大小,其中至少部分响应于预测单元大小小于阈值而排除通过双向预测编码的块而不予以选择。在一些实施例中,在过程700中,排除通过帧间预测编码的一或多个块而不予以选择为参考块。举例来说,通过帧间预测编码的一或多个块可以被排除而不予以选择为参考块以用于编码CTU的其它块。在此类实施例中,过程还可以包含确定预测单元大小,其中至少部分响应于预测单元大小小于阈值排除通过帧间预测编码的块而不予以选择。
在一些实施例中,在过程700中,使用填补方案产生替代参考块。在一些实施例中,执行块内复制预测包含使用替代块作为所选定的参考块。
在一些实施例中,过程700包含确定CTU是否具有通过双向预测产生的预测块,其中至少部分响应于CTU具有通过双向预测产生的预测块而排除通过双向预测编码的块而不予以选择。在此类实施例中,过程700还可包含确定通过双向预测产生的用于CTU的预测块的量,并且确定预测单元大小。响应于以下各者中的任何一个可随后排除通过双向预测编码的块而不予以选择:CTU具有通过双向预测产生的大于阈值的预测块的量、预测单元大小为小于阈值;以及CTU具有通过双向预测产生的大于阈值的预测块的量,并且预测单元大小为小于阈值。
在一些实施例中,过程700包含执行自适应运动向量分辨率(AMVR)和确定预测单元大小。在此类实施例中,可以至少部分响应于以下两者的组合排除通过双向预测编码的块而不予以选择:预测单元大小为小于阈值,以及接收AMVR被停用的指示。在一些实施例中,组合进一步包含具有不同参考单元和不同运动向量中的至少一个的帧间预测双向预测。
在一些实施例中,过程700包含确定包括编码块的搜索区域,其中搜索区域至少部分地基于以下各项中的至少一者确定:图片类型、切片类型和分割大小。
关注区域内的块向量的分布的限制
为了改进在使用较大搜索范围时高速缓存使用且减小高速缓存遗漏,可以在块向量范围上施加一些约束条件。
块向量范围约束条件可以单独地施加或组合施加。在块向量范围约束条件中,关注区域并不受限并且可以例如是CU、CTB、最大译码单元(LCU)、切片、单元片或一组CU、CTU、CTB、LCU、切片或单元片。
在一些实施例中,块向量的范围被限制为在关注区域内。举例来说,块向量的范围可以被限制为在当前CU内。在一些实施例中,不同关注区域具有不同块向量范围约束条件。另外,语法元素可用于针对每个关注区域规定块向量范围。
作为一个实例,块向量的范围可以被限制为在单元片内。相应地,用于当前预测单元的预测样本被限制为在相同单元片内。除了其它益处,这种约束有助于高效并行处理。在一些实施例中,块向量的范围被限制为在切片内。相应地,IBC预测被限制为并不跨越切片边界。
在一些实施例中,关注区域内的任何两个块向量的最大差异受到限制。举例来说,如果切片关注区域内的CU具有特定大小的块向量,那么切片内的全部其它块向量被限制在特定大小的预定义范围内。另外,语法元素可用于针对每个关注区域规定任何两个块向量的最大差异。
规范文本和语法
在一些实施例中,块向量范围和最大块向量差异语法元素可以在以下参数集中的一或多个中用信号发送:VPS、SPS、PPS、视频可用信息(VUI)、切片标头或它们的相应的扩展。
在下文中论述了用于B切片的具有局部搜索区域的基于JCTVC-P1005_v4的实例规范文本。本文中论述的实施例符合实例规范文本。
解码过程
变量BvIntra[x0][y0][compIdx]规定待用于块内复制预测模式的向量分量。阵列索引x0、y0规定所考虑的预测块的左上方亮度样本相对于图片的左上方亮度样本的位置(x0,y0)。变量BvdispIntra[x0][y0][compIdx]规定针对位置(x0,y0)(例如,BvIntra[x0][y0][compIdx])和位置(xi,yj)(例如,BvIntra[xi][yj][compIdx])待用于块内复制预测模式的向量分量之间的差异。阵列指数xi、yj规定针对任何i,j的相对于图片的左上方亮度样本的所考虑的预测块的左上方亮度样本的位置(xi,yj),使得位置(xi,yj)和(x0,y0)在相同CTU内。
对于全部的i,j,BvdispIntra[xi][yj][compIdx]将在-128到128范围内(包含性)。水平块向量分量被分配compIdx=0并且垂直块向量分量被分配compIdx=1。
在上述规范中,-128到128的范围(包含性)被用作实例并且范围的实际值可以固定到不同值或用信号发送。
下文示出了实例信令方法。
log2_max_ctu_deltaBV_length_horizontal和log2_max_ctu_deltaBV_length_vertical指示相应地相对于经解码水平和垂直块向量分量,属于相同CTU并且在整数亮度样本单元中可供使用的用于CVS中的所有图片的任何预测单元的相应地经解码水平和垂直块向量分量的最大绝对差值。n的值确证在整数亮度样本移位的单元中块向量分量的差值不在范围-2n到2n-1(包含性)的外部。可以确定范围和推断值。
对于全部i,j,BvdispIntra[xi][yj][compIdx]将在用于水平分量和垂直分量的如通过log2_max_ctu_deltaBV_length_horizontal和log2_max_ctu_deltaBV_length_vertical所规定的范围内。水平块向量分量被分配compIdx=0并且垂直块向量分量被分配compIdx=1。
替代地,范围针对每个compIdx(水平和垂直块向量)以及针对亮度和色度分量可以是不同的。替代地,范围针对每个compIdx(水平和垂直块向量)以及针对亮度和色度分量可以是不同的。
替代地,范围可以作为CTU、切片、单元片等的倍数用信号发送。
log2_max_BV_ctu_length_horizontal和log2_max_BV_ctu_length指示相应地相对于经解码水平和垂直块向量分量,属于相同CTU并且在CTB的单元中可供使用的用于CVS中的所有图片的任何预测单元的相应地经解码水平和垂直块向量分量的最大绝对差值。n的值确证在CTB移位的单元中块向量分量的差值不在范围-N到N(包含性)的外部。
关注区域内的块向量的数目的限制
如上文所论述,IBC可以针对低延迟P情况增大块向量的最差情况数目。至少为了维持与HEVC相同的最差情况复杂性并且还减小系统资源上的负载(例如,以减小多个预测样本负载),一些实施例包含额外的或替代的特征。
举例来说,关注的特定区域内的块向量的数目可以被限制为小于或等于用于特定关注区域的HEVC的最差情况数目的块向量。举例来说,关注区域内的块向量的数目可以被限制为等于或小于如果全部块被译码为用于相同关注区域的Nx2N/2NxN时存在的最差情况数目的块向量。在一些实施例中,IBC模式可以针对非I切片的最小分割(N×N)受限制。
块向量数目约束条件和IBC模式的限制可以单独地或组合施加。在块向量数目约束条件和IBC的限制中,关注区域并不受限并且可以例如是CU、CTB、最大译码单元(LCU)、切片、单元片或一组CU、CTU、CTB、LCU、切片或单元片。
约束I切片
在一些实施例中,块向量的范围可以被限制为在切片内。也就是说,IBC预测并不跨越切片边界。
在一些实施例中,可以用信号发送新切片类型。对于新切片类型,块向量的范围被限制为在切片内。因此,针对新切片类型的切片,IBC预测并不跨越切片边界。
在一些实施例中,旗标可以规定块向量的范围被限制在切片内。由于旗标的状态,IBC预测并不跨越切片边界。举例来说,旗标可以是在以下参数集中的一或多个中用信号发送的:VPS、SPS、PPS、视频可用信息(VUI)、切片标头或它们的相应的扩展。
使用本文中所描述的技术和系统,通过减小的存储器带宽和大小需求执行块内复制技术。因此,存储器带宽效率得到改进,最差情况存储器存取受到限制,并且块内复制的其它方面得到增强。
本文中所论述的译码技术可以在实例视频编码和解码系统(例如,系统100)中实施。系统包含提供经编码视频数据以在稍后时间由目的地装置解码的源装置。具体而言,源装置经由计算机可读媒体将视频数据提供到目的地装置。源装置和目的地装置可包括广泛范围的装置中的任一者,包含台式计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、所谓的“智能”板、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置,或类似物。在一些情况下,源装置和目的地装置可经装备以用于无线通信。
目的地装置可经由计算机可读媒体接收待解码的经编码视频数据。计算机可读媒体可包括能够将经编码视频数据从源装置移动到目的地装置的任何类型的媒体或装置。在一个实例中,计算机可读媒体可包括使源装置能够实时将经编码视频数据直接传输到目的地装置的通信媒体。经编码视频数据可根据通信标准(例如,无线通信协议)加以调制,且传输到目的地装置。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线。通信媒体可能形成基于数据包的网络(例如,局域网、广域网或全球网络,例如互联网)的部分。通信媒体可包含路由器、交换机、基站或可用于促进从源装置到目的地装置的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口输出到存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取数据存储媒体中的任一者,例如,硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置产生的经编码视频的另一中间存储装置。目的地装置可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据和将所述经编码视频数据发射到目的地装置的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接式存储(NAS)装置或本地磁盘驱动器。目的地装置可经由任何标准数据连接(包含因特网连接)来存取经编码的视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的传输可能是流式传输、下载传输或其组合。
本发明的技术不一定限于无线应用或设置。所述技术可以应用于在支持多种多媒体应用中的任一者时的视频译码,例如,空中电视广播、有线电视传输、卫星电视传输、互联网串流视频传输(例如,HTTP动态自适应流式传输(DASH))、被编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频重放、视频广播和/或视频电话的应用。
在一个实例中,源装置包含视频源、视频编码器和输出接口。目的地装置可包含输入接口、视频解码器和显示装置。源装置的视频编码器可经配置以应用本文中所公开的技术。在其它实例中,源装置和目的地装置可包括其它组件或布置。举例来说,源装置可从外部视频源(例如,外部相机)接收视频数据。同样,目的地装置可与外部显示装置介接,而非包含集成显示装置。
以上实例系统仅是一个实例。用于并行处理视频数据的技术可由任何数字视频编码和/或解码装置来执行。尽管本发明的技术一般通过视频编码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可以通过视频预处理器来执行。源装置及目的地装置仅为源装置在其中产生经译码视频数据以供传输到目的地装置的此类译码装置的实例。在一些实例中,源装置和目的地装置可以实质上对称方式操作,使得所述装置中的每一者包含视频编码和解码组件。因此,实例系统可支持视频装置之间的单向或双向视频发射,例如,用于视频串流、视频重放、视频广播或视频电话。
视频源可包含视频捕获装置,例如,摄像机、含有先前所捕获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为再一替代方案,视频源可产生基于计算机图形的数据作为源视频,或实况视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源为摄像机,那么源装置及目的地装置可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。在每一情况下,可由视频编码器编码所捕获、预先捕获或计算机产生的视频。经编码视频信息可随后由输出接口输出到计算机可读媒体上。
如所提及,计算机可读媒体可包含瞬态媒体,例如无线广播或有线网络传输,或存储媒体(即,非暂时性存储媒体),例如硬盘、闪存驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未示出)可从源装置接收经编码视频数据,且(例如)经由网络传输将经编码视频数据提供到目的地装置。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置接收经编码视频数据产生含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体可理解为包含各种形式的一或多个计算机可读媒体。
目的地装置的输入接口从计算机可读媒体接收信息。计算机可读媒体的信息可包含由视频编码器定义的也由视频解码器使用的语法信息,所述语法信息包含描述块和其它经译码单元(例如,图片群组(GOP))的特性和/或处理的语法元素。显示装置向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。已描述本发明的各种实施例。
在图8和图9中相应地示出了编码装置104和解码装置112的具体细节。图8是说明可以实施本发明中描述的技术中的一或多个的实例编码装置104的方块图。举例来说,编码装置104可以产生本文中描述的语法结构(例如,VPS、SPS、PPS的语法结构,或其它语法元素)。编码装置104可以在视频切片内执行视频块的帧内预测和帧间预测译码。如先前描述,帧内译码至少部分依赖于空间预测来减少或去除给定视频帧或图片内的空间冗余。帧间译码至少部分依赖于时间预测来减少或去除视频序列的邻近或周围帧或图片内的时间冗余。帧内模式(I模式)可以指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指若干基于时间的压缩模式中的任一者。
编码装置104包含分割单元35、预测处理单元41、滤波器单元63、图片存储器64、求和器50、变换处理单元52、量化单元54以及熵编码单元56。预测单元41包含运动估计单元42、运动补偿单元44和帧内预测处理单元46。对于视频块重构,编码装置104还包含逆量化单元58、逆变换处理单元60和求和器62。滤波器单元63意图表示一或多个环路滤波器,例如,解块滤波器、自适应环路滤波器(ALF)及样本自适应偏移(SAO)滤波器。尽管在图8中将滤波器单元63示出为环内滤波器,但在其它配置中,可将滤波器单元63实施为环路后滤波器。后处理装置57可以在由编码装置104产生的经编码的视频数据上执行额外处理。本发明的技术在一些情况下可以通过编码装置104实施。然而,在其它情况下,本发明的技术中的一或多个可以通过后处理装置57实施。
如图8中所示,编码装置104接收视频数据,且分割单元35将所述数据分割成视频块。分割还可包含分割成切片、切片段、单元片其它较大单元,以及例如根据LCU和CU的四叉树结构的视频块分割。编码装置104总体上说明对待编码的视频切片内的视频块进行编码的组件。所述切片可划分成多个视频块(并且可能划分成被称作单元片的视频块的集合)。预测处理单元41可以选择多个可能的译码模式中的一个,例如,多个帧内预测译码模式中的一或多个帧间预测译码模式中的一个,以用于基于错误结果的当前视频块(例如,译码速率和失真的层级,或类似物)。预测处理单元41可将所得的经帧内译码或经帧间译码块提供到求和器50以产生残余块数据,且提供到求和器62以重构经编码块以用作参考图片。
预测处理单元41内的帧内预测处理单元46可相对于与待译码的当前块在相同帧或切片中的一或多个相邻块执行当前视频块的帧内预测译码,以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44相对于一或多个参考图片中的一或多个预测性块执行当前视频块的帧间预测性译码以提供时间压缩。
运动估计单元42可经配置以根据用于视频序列的预定模式确定用于视频切片的帧间预测模式。预定模式可将序列中的视频切片标明为P切片、B切片或GPB切片。运动估计单元42及运动补偿单元44可高度集成,但出于概念的目的分别加以说明。运动估计单元42执行的运动估计为产生运动向量的过程,所述过程估计视频块的运动。运动向量例如可指示当前视频帧或图片内的视频块的预测单元(PU)相对于参考图片内的预测性块的位移。
预测性块是被发现在像素差方面与待译码的视频块的PU密切匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中,编码装置104可计算存储在图片存储器64中的参考图片的子整数像素位置的值。举例来说,编码装置104可内插四分之一像素位置、八分之一像素位置或参考图片的其它分数像素位置的值。因此,运动估计单元42可以相对于全像素位置及分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算用于在经帧间译码切片中的视频块的PU的运动向量。参考图片可以选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一者识别存储在图片存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。
通过运动补偿单元44执行的运动补偿可以涉及基于通过运动估计(可能执行对子像素精确度的内插)确定的运动向量获取或产生预测性块。在接收到当前视频块的PU的运动向量后,运动补偿单元44即刻可以在参考图片列表中定位所述运动向量指向的预测性块。编码装置104通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块。像素差值形成用于所述块的残余数据,且可包含亮度及色度差分量两者。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44还可产生与视频块和视频切片相关联的供解码装置112在对视频切片的视频块进行解码时使用的语法元素。
作为如上文所描述的由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测处理单元46可以对当前块进行帧内预测。具体而言,帧内预测处理单元46可确定用于对当前块进行编码的帧内预测模式。在一些实例中,帧内预测处理单元46可(例如)在单独编码遍次期间使用各种帧内预测模式对当前块进行编码,且帧内预测处理单元46可从经测试模式中选择适当帧内预测模式来使用。举例来说,帧内预测处理单元46可使用速率失真分析计算各种经测试帧内预测模式的速率失真值,并在所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析大体上确定经编码块与经编码以产生所述经编码块的原始未编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(即,位数目)。帧内预测处理单元46可以从用于各种经编码块的失真及速率计算比率,以确定哪种帧内预测模式对于所述块来说呈现最佳速率失真值。
在任何情况下,在选择了用于块的帧内预测模式之后,帧内预测处理单元46可将指示用于所述块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可以对指示所选帧内预测模式的信息进行编码。编码装置104可以在所传输的位流中包含用于各种块的编码文本的配置数据定义以及最可能帧内预测模式的指示、帧内预测模式索引表和经修改帧内预测模式索引表以供每种文本使用。位流配置数据可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也被称作码字映射表)。
在预测处理单元41经由帧间预测或帧内预测产生当前视频块的预测性块之后,编码装置104通过从当前视频块减去预测性块来形成残余视频块。残余块中的残余视频数据可包含在一或多个TU中且应用到变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换等变换来将残余视频数据变换成残余变换系数。变换处理单元52可将残余视频数据从像素值域转换到变换域,例如,频域。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步降低位速率。量化过程可减少与系数中的一些系数或全部相关联的位深度。可以通过调整量化参数来修改量化程度。在一些实例中,量化单元54可随后执行对包含经量化变换系数的矩阵的扫描。或者,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码技术。在熵编码单元56进行的熵编码之后,可将经编码位流传输到解码装置112,或将经编码位流存档以供稍后传输或由解码装置112取回。熵编码单元56还可对正被译码的当前视频切片的运动向量及其它语法元素进行熵编码。
逆量化单元58和逆变换处理单元60相应地应用逆量化和逆变换以在像素域中重构残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到在参考图片列表内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构的残余块以计算子整数像素值用于运动估计。求和器62将经重构残余块加到由运动补偿单元44产生的经运动补偿的预测块以产生参考块以用于存储在图片存储器64中。参考块可由运动估计单元42和运动补偿单元44使用作为参考块以对后续视频帧或图片中的块进行帧间预测。
以此方式,图8的编码装置104表示经配置以产生用于经编码视频位流的语法的视频编码器的实例。举例来说,编码装置104可以产生VPS、SPS和PPS参数集,如上文所述。编码装置104可以执行本文中描述的任何技术,包含上文相对于图4、6和8所述的过程。已相对于编码装置104总体上描述了本发明的技术,但是如上文所提及,本发明的技术中的一些也可以通过后处理装置57实施。
图9是说明实例解码装置112的方块图。解码装置112包含熵解码单元80、预测处理单元81、逆量化单元86、逆变换处理单元88、求和器90、滤波器单元91和图片存储器92。预测处理单元81包含运动补偿单元82和帧内预测处理单元84。在一些实例中,解码装置112可执行总体上与关于图8的编码装置104描述的编码遍次互逆的解码遍次。
在解码过程期间,解码装置112接收表示经编码视频切片的视频块和由编码装置104发送的相关联语法元素的经编码视频位流。在一些实施例中,解码装置112可以从编码装置104中接收经编码视频位流。在一些实施例中,解码装置112可以从网络实体79接收经编码视频位流,所述网络实体例如,服务器、媒体感知网络元件(MANE)、视频编辑器/剪接器或经配置以实施上文所述的技术中的一或多个的其它此类装置。网络实体79可包含或可不包含编码装置104。本发明中描述的技术中的一些可以在网络实体79将经编码视频位流传输到解码装置112之前通过网络实体79实施。在一些视频解码系统中,网络实体79和解码装置112可为单独的装置的部分,而在其它情况下,关于网络实体79描述的功能性可由包括解码装置112的相同装置执行。
解码装置112的熵解码单元80对位流进行熵解码以产生经量化的系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测处理单元81。解码装置112可接收视频切片层级和/或视频块层级处的语法元素。熵解码单元80可以处理和解析在例如VPS、SPS和PPS中的一或多个参数集中的固定长度语法元素和可变长度语法元素这两者。
当视频切片经译码为经帧内译码(I)切片时,预测处理单元81的帧内预测处理单元84可基于用信号发送的帧内预测模式及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当将视频帧译码为经帧间译码(即,B、P或GPB)切片时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素而产生当前视频切片的视频块的预测块。可以从参考图片列表内的参考图片中的一者产生预测性块。视频解码器30可以基于存储在图片存储器92中的参考图片使用默认构建技术构建参考帧列表--列表0和列表1。
运动补偿单元82通过解析运动向量及其它语法元素确定用于当前视频切片的视频块的预测信息,并且使用所述预测信息产生用于经解码的当前视频块的预测性块。举例来说,运动补偿单元82可使用参数集中的一或多个语法元素确定用于对视频切片的视频块进行译码的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的一或多个参考图片列表的构建信息、切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态以及用于对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由编码装置104在编码视频块期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在这种情况下,运动补偿单元82可从所接收语法元素确定由视频编码器20使用的内插滤波器并使用所述内插滤波器来产生预测性块。
逆量化单元86将在位流中提供且由熵解码单元80解码的经量化变换系数逆量化,即解量化。逆量化过程可包含使用由视频编码器20针对视频切片中的每个视频块计算的量化参数以确定应施加的量化程度及类似地确定应施加的逆量化程度。逆变换处理单元88将逆变换(例如,逆DCT或其它合适的逆变换)、逆整数变换或概念上相似的逆变换过程应用到所述变换系数以便产生像素域中的残余块。
在运动补偿单元82基于运动向量及其它语法元素产生用于当前视频块的预测性块之后,解码装置112通过将来自逆变换处理单元88的残余块与运动补偿单元82产生的对应预测性块求和来形成经解码视频块。求和器90表示执行此求和运算的一或多个组件。如果需要,还可使用环路滤波器(在译码环路中或在译码环路之后)来使像素转变平滑或者以其它方式改进视频质量。滤波器单元91意图表示一或多个环路滤波器,例如,解块滤波器、自适应环路滤波器(ALF)及样本自适应偏移(SAO)滤波器。尽管在图9中将滤波器单元91示出为环内滤波器,但在其它配置中,可将滤波器单元91实施为环路后滤波器。随后将给定帧或图片中的经解码视频块存储于图片存储器92中,所述图片存储器存储用于随后运动补偿的参考图片。图片存储器92还存储经解码视频以供稍后在显示装置(例如,图1中所示的视频目的地装置122)上呈现。
在上述描述中,参考其具体实施例描述应用的方面,但是所属领域的技术人员将认识到本发明不限于此。因此,虽然已经在本文中详细地描述了应用的说明性实施例,但是应理解本发明概念可以其它方式不同地实施和采用,并且除了现有技术所限制的之外,所附权利要求书意图解释为包含此类变化。上文描述的本发明的各种特征和方面可以单独或共同地使用。另外,实施例可以在本文中描述的那些之外的任何数目的环境和应用中使用而不脱离本说明书的广泛的精神和范围。应将本说明书和图式相应地视为说明性的而非限制性的。出于说明的目的,方法是以特定顺序描述的。应了解在替代实施例中,方法可以按与所描述的相比不同的顺序执行。
在组件被描述为“经配置以”执行特定操作的情况下,可例如通过设计电子电路或其它硬件以执行所述操作、通过编程可编程电子电路(例如,微处理器或其它适合电子电路)以执行所述操作或其任何组合来实现此类配置。
结合本文中所公开的实施例描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件、固件或其组合。为清楚说明硬件与软件的此可互换性,上文已大体上关于其功能性而描述了各种说明性组件、块、模块、电路及步骤。此功能性是实施为硬件还是软件取决于特定应用和强加于整个系统的设计约束。所属领域的技术人员可针对每一特定应用以不同方式来实施所描述的功能性,但此类实施决策不应被解释为会导致脱离本发明的范围。
本文中描述的技术也可以在电子硬件、计算机软件、固件或其任何组合中实施。此类技术可实施于多种装置中的任一者中,例如,通用计算机、无线通信装置手持机或集成电路装置,其具有包含在无线通信装置手持机和其它装置中的应用的多种用途。被描述为模块或组件的任何特征可共同实施于集成逻辑装置中或单独地实施为离散但可互操作的逻辑装置。如果在软件中实施,那么所述技术可至少部分地由包括程序代码的计算机可读数据存储媒体来实现,所述程序代码包含在被执行时实施上文所描述的方法中的一或多者的指令。计算机可读数据存储媒体可形成计算机程序产品的一部分,所述计算机程序产品可包含封装材料。计算机可读媒体可包括存储器或数据存储媒体,例如,随机存取存储器(RAM)(例如,同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、闪存器、磁性或光学数据存储媒体等等。另外或作为替代,所述技术可至少部分地由计算机可读通信媒体来实现,所述计算机可读通信媒体以指令或数据结构的形式携载或传送程序代码且可由计算机存取、读取和/或执行(例如,传播的信号或波)。
程序代码可由处理器执行,所述处理器可包含一或多个处理器,例如,一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。此处理器可经配置以执行本发明中描述的技术中的任一者。通用处理器可为微处理器;但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP和微处理器的组合、多个微处理器、结合DSP核心的一或多个微处理器或任何其它此类配置。因此,如本文中所使用的术语“处理器”可指上述结构中的任一者、上述结构的任何组合,或适合于实施本文中所描述的技术的任何其它结构或设备。此外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码和解码的专用软件模块或硬件模块内或并入组合式视频编码器-解码器(编码解码器)中。

Claims (20)

1.一种对视频数据进行编码以产生多个经编码视频图片的方法,所述方法包括:
在编码器处获得视频数据;
确定使用块内复制预测在所述视频数据上执行图片内预测,以产生多个经编码视频图片;
使用所述块内复制预测在所述视频数据上执行所述图片内预测;
响应于确定使用所述块内复制预测在所述视频数据上执行所述图片内预测,针对所述多个经编码视频图片停用图片间双向预测或图片间单向预测中的至少一个;以及
根据所述所执行的块内复制预测基于所述视频数据产生所述多个经编码视频图片。
2.根据权利要求1所述的方法,其进一步包括在所述视频数据上执行图片间单向预测以产生多个P预测单元。
3.根据权利要求1所述的方法,其进一步包括确定预测单元大小,其中响应于以下两者的组合针对所述多个经编码视频图片停用所述图片间双向预测或帧间预测单向预测:
确定使用所述块内复制预测在所述视频数据上执行所述图片内预测,以及
所述预测单元大小为小于阈值。
4.根据权利要求3所述的方法,其中响应于所述组合针对所述多个经编码视频图片停用所述图片间双向预测和图片间单向预测。
5.根据权利要求1所述的方法,其进一步包括确定预测单元大小,其中响应于以下组合针对所述多个经编码视频图片停用所述图片间双向预测或图片间单向预测:
确定使用所述块内复制预测在所述视频数据上执行所述图片内预测,
所述预测单元大小为小于阈值,以及
自适应运动向量分辨率AMVR被停用。
6.根据权利要求5所述的方法,其中所述组合进一步包含所述帧间预测双向预测具有不同参考单元和不同运动向量中的至少一个。
7.根据权利要求5所述的方法,其中响应于所述组合针对所述多个经编码视频图片停用所述图片间双向预测和图片间单向预测。
8.根据权利要求7所述的方法,其中所述组合进一步包含所述帧间预测双向预测具有不同参考单元和不同运动向量中的至少一个。
9.一种用于对视频数据进行编码的设备,所述设备包括:
存储器,其经配置以存储视频数据;以及
处理器,其经配置以:
获得所述视频数据;
确定使用块内复制预测在所述视频数据上执行图片内预测,以产生多个经编码视频图片;
使用所述块内复制预测在所述视频数据上执行所述图片内预测;
响应于确定使用所述块内复制预测在所述视频数据上执行所述图片内预测,针对所述多个经编码视频图片停用图片间双向预测或图片间单向预测中的至少一个;以及
根据所述所执行的块内复制预测基于所述视频数据产生所述多个经编码视频图片。
10.根据权利要求9所述的设备,其中所述处理器经进一步配置以确定预测单元大小,并且进一步响应于所述预测单元大小小于阈值针对所述多个经编码视频图片停用所述图片间双向预测或图片间单向预测。
11.根据权利要求10所述的设备,其中响应于所述组合针对所述多个经编码视频图片停用所述图片间双向预测和单向预测。
12.根据权利要求9所述的设备,其中所述处理器经进一步配置以执行自适应运动向量分辨率AMVR,并且响应于以下组合针对所述多个经编码视频图片停用所述图片间双向预测或单向预测:
确定使用所述块内复制预测在所述视频数据上执行所述图片内预测,
所述预测单元大小为小于阈值,以及
所述AMVR被停用。
13.根据权利要求12所述的设备,其中响应于所述组合针对所述多个经编码视频图片停用所述图片间双向预测和图片间单向预测。
14.根据权利要求12所述的设备,其中所述组合进一步包含所述帧间预测双向预测具有不同参考单元和不同运动向量中的至少一个。
15.一种对视频数据进行解码以产生多个经解码视频图片的方法,所述方法包括:
在视频位流中接收使用多个预测模式编码的经编码的视频数据,所述多个预测模式包括:
图片间单向预测模式,
图片间双向预测模式,以及
图片内块内复制模式;
在所述视频位流中接收针对所述经编码的视频数据的部分停用图片间双向预测的指示;
基于所述指示从所述多个预测模式中确定预测模式以用于预测所述经编码的视频数据的部分的预测单元;以及
根据所述所确定的预测模式对所述经编码的视频数据的部分的所述预测单元进行解码。
16.根据权利要求15所述的方法,其进一步包括响应于所述指示排除所述图片间双向预测模式而不用于预测所述经编码的视频数据的部分的所述预测单元。
17.根据权利要求15所述的方法,其中所述经编码的视频数据的所述部分包括多个图片。
18.一种用于对视频数据进行解码的设备,所述设备包含:
存储器,其经配置以存储经编码的视频数据,所述经编码的视频数据在视频位流中接收并且通过多个预测模式进行编码,所述多个预测模式包括:
图片间单向预测模式,
图片间双向预测模式,以及
图片内块内复制模式;以及
处理器,其经配置以:
从所述存储器中获得所述经编码的视频数据;
在所述视频位流中接收针对所述经编码的视频数据的部分停用图片间双向预测的指示;
基于所述指示从所述多个预测模式中确定预测模式以用于预测所述经编码的视频数据的部分的预测单元;以及
根据所述所确定的预测模式对所述经编码的视频数据的部分的所述预测单元进行解码。
19.根据权利要求18所述的设备,其中所述处理器进一步经配置以响应于所述指示排除所述图片间双向预测模式而不用于预测所述经编码的视频数据的部分的所述预测单元。
20.根据权利要求18所述的设备,其中所述经编码的视频数据的所述部分包括多个图片。
CN201580030892.2A 2014-06-19 2015-06-19 用于对视频数据进行编码和解码的方法和设备 Active CN106416245B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462014641P 2014-06-19 2014-06-19
US62/014,641 2014-06-19
US201562154399P 2015-04-29 2015-04-29
US62/154,399 2015-04-29
US14/743,176 2015-06-18
US14/743,176 US10327001B2 (en) 2014-06-19 2015-06-18 Systems and methods for intra-block copy
PCT/US2015/036609 WO2015196029A1 (en) 2014-06-19 2015-06-19 Systems and methods for intra-block copy

Publications (2)

Publication Number Publication Date
CN106416245A true CN106416245A (zh) 2017-02-15
CN106416245B CN106416245B (zh) 2019-08-02

Family

ID=54870870

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580030892.2A Active CN106416245B (zh) 2014-06-19 2015-06-19 用于对视频数据进行编码和解码的方法和设备
CN201580031604.5A Active CN106464874B (zh) 2014-06-19 2015-06-19 用于块内复制的系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580031604.5A Active CN106464874B (zh) 2014-06-19 2015-06-19 用于块内复制的系统和方法

Country Status (10)

Country Link
US (2) US10327002B2 (zh)
EP (2) EP3158736B1 (zh)
JP (2) JP6704354B2 (zh)
KR (2) KR102423950B1 (zh)
CN (2) CN106416245B (zh)
BR (2) BR112016029539A2 (zh)
CA (2) CA2952457C (zh)
ES (2) ES2807216T3 (zh)
HU (2) HUE047937T2 (zh)
WO (2) WO2015196030A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110572670A (zh) * 2018-06-05 2019-12-13 北京字节跳动网络技术有限公司 帧内块复制和双向光流的交互
CN111010572A (zh) * 2018-12-04 2020-04-14 北京达佳互联信息技术有限公司 一种视频编码方法和装置及设备
CN111149358A (zh) * 2017-09-21 2020-05-12 华为技术有限公司 仿射帧间预测中子块尺寸推导的限制
WO2020164629A1 (en) * 2019-02-17 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Restriction of applicability for intra block copy mode
WO2020187198A1 (en) * 2019-03-17 2020-09-24 Beijing Bytedance Network Technology Co., Ltd. Prediction refinement based on optical flow
CN113170166A (zh) * 2018-12-30 2021-07-23 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
CN113287303A (zh) * 2019-01-12 2021-08-20 北京字节跳动网络技术有限公司 双向预测约束
US11172196B2 (en) 2018-09-24 2021-11-09 Beijing Bytedance Network Technology Co., Ltd. Bi-prediction with weights in video coding and decoding
US11197007B2 (en) 2018-06-21 2021-12-07 Beijing Bytedance Network Technology Co., Ltd. Sub-block MV inheritance between color components
US11197003B2 (en) 2018-06-21 2021-12-07 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
CN113826390A (zh) * 2019-05-16 2021-12-21 字节跳动有限公司 屏幕内容编解码的帧内块复制
CN115104306A (zh) * 2020-02-24 2022-09-23 高通股份有限公司 在视频译码中共享的信令约束和序列参数集
US11570450B2 (en) 2018-11-06 2023-01-31 Beijing Bytedance Network Technology Co., Ltd. Using inter prediction with geometric partitioning for video processing
US11792421B2 (en) 2018-11-10 2023-10-17 Beijing Bytedance Network Technology Co., Ltd Rounding in pairwise average candidate calculations
US11968377B2 (en) 2018-06-21 2024-04-23 Beijing Bytedance Network Technology Co., Ltd Unified constrains for the merge affine mode and the non-merge affine mode

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10327002B2 (en) 2014-06-19 2019-06-18 Qualcomm Incorporated Systems and methods for intra-block copy
CN105392008B (zh) * 2014-08-22 2018-09-25 中兴通讯股份有限公司 一种预测编、解码方法和相应的编、解码器和电子设备
CN105430417B (zh) * 2014-09-22 2020-02-07 中兴通讯股份有限公司 编码方法、解码方法、装置及电子设备
WO2016165623A1 (en) * 2015-04-13 2016-10-20 Mediatek Inc. Methods of constrained intra block copy for reducing worst case bandwidth in video coding
CN106254878B (zh) * 2015-06-14 2020-06-12 同济大学 一种图像编码及解码方法、图像处理设备
US10516891B2 (en) * 2015-11-20 2019-12-24 Intel Corporation Method and system of reference frame caching for video coding
US9959097B2 (en) 2016-03-09 2018-05-01 Bank Of America Corporation SVN interface system for heterogeneous development environments
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
US10674159B2 (en) 2017-07-28 2020-06-02 Microsoft Technology Licensing, Llc Effective intra encoding for screen data
US11070847B2 (en) * 2017-12-05 2021-07-20 Qualcomm Incorporated Intra-prediction with far neighboring pixels
US10638137B2 (en) 2018-03-07 2020-04-28 Tencent America LLC Method and apparatus for video coding
WO2019234578A1 (en) * 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Asymmetric weighted bi-predictive merges
TWI746994B (zh) 2018-06-19 2021-11-21 大陸商北京字節跳動網絡技術有限公司 用於不同參考列表的不同精確度
US10798376B2 (en) * 2018-07-17 2020-10-06 Tencent America LLC Method and apparatus for video coding
US10375416B1 (en) * 2018-09-05 2019-08-06 Tencent America LLC Segment types in video coding
KR20240005178A (ko) 2018-09-19 2024-01-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 적응적 움직임 벡터 해상도를 가지는 어파인 모드에 대한 구문 재사용
US10848782B2 (en) 2018-09-21 2020-11-24 Tencent America LLC Method and apparatus for video coding
US11172236B2 (en) 2018-09-21 2021-11-09 Tencent America LLC Method and apparatus for video decoding that defines a search range for a reference block indicated by a block vector
US11317099B2 (en) 2018-10-05 2022-04-26 Tencent America LLC Method and apparatus for signaling an offset in video coding for intra block copy and/or inter prediction
KR20200040179A (ko) * 2018-10-08 2020-04-17 에스케이텔레콤 주식회사 현재 픽처 참조 모드를 이용한 예측 방법 및 영상 복호화 장치
US11509919B2 (en) 2018-10-17 2022-11-22 Tencent America Reference sample memory size restrictions for intra block copy
CN111083491A (zh) 2018-10-22 2020-04-28 北京字节跳动网络技术有限公司 细化运动矢量的利用
US11758164B2 (en) 2018-10-23 2023-09-12 Tencent America LLC Method and apparatus for video coding
WO2020094076A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Motion candidates for inter prediction
WO2020098655A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Motion vector storage for inter prediction
CN117319644A (zh) 2018-11-20 2023-12-29 北京字节跳动网络技术有限公司 基于部分位置的差计算
WO2020103934A1 (en) * 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Construction method for inter prediction with geometry partition
US11146805B2 (en) * 2018-11-30 2021-10-12 Tencent America LLC Method and apparatus for video coding
CN109874011B (zh) * 2018-12-28 2020-06-09 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN113261290B (zh) 2018-12-28 2024-03-12 北京字节跳动网络技术有限公司 基于修改历史的运动预测
US10771799B2 (en) * 2019-01-15 2020-09-08 Tencent America LLC Method and apparatus for video coding
US11202089B2 (en) * 2019-01-28 2021-12-14 Tencent America LLC Method and apparatus for determining an inherited affine parameter from an affine model
JP7235877B2 (ja) 2019-01-31 2023-03-08 北京字節跳動網絡技術有限公司 アフィンモード適応型動きベクトル解像度を符号化するためのコンテキスト
US10958904B2 (en) * 2019-02-01 2021-03-23 Tencent America LLC Method and apparatus for video coding
KR20210119981A (ko) * 2019-02-01 2021-10-06 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 조합된 인트라-인터 예측의 확장된 적용
WO2020156545A1 (en) 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Prediction using intra-buffer samples for intra block copy in video coding
WO2020177660A1 (en) 2019-03-01 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Block vector representation for intra block copy in video coding
JP7405861B2 (ja) 2019-03-01 2023-12-26 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーのための方向に基づく予測
JP7284284B2 (ja) 2019-03-04 2023-05-30 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーの実装形態の態様
KR20210131347A (ko) * 2019-03-06 2021-11-02 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크기에 따른 인터 코딩
JP2022521554A (ja) 2019-03-06 2022-04-08 北京字節跳動網絡技術有限公司 変換された片予測候補の利用
CA3131692A1 (en) * 2019-03-09 2020-09-17 Tencent America LLC Determination of block vector for a block in a region of a coding tree block
US11706429B2 (en) * 2019-03-12 2023-07-18 Hyundai Motor Company Method and device for encoding and decoding image involving gradual refresh technique
US20220182604A1 (en) * 2019-03-14 2022-06-09 Sk Telecom Co., Ltd. Video encoding and decoding using intra block copy
US11240516B2 (en) * 2019-03-20 2022-02-01 Tencent America LLC Coding mode signaling for small blocks
EP3989558A4 (en) 2019-06-24 2023-07-12 Lg Electronics Inc. PICTURE ENCODING/DECODING METHOD AND APPARATUS WITH MAXIMUM TRANSFORMATION SIZE LIMITATION FOR A CHROMA COMPONENT ENCODING BLOCK AND BITSTREAM TRANSMISSION METHODS
CN114175645B (zh) 2019-07-06 2024-04-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的虚拟预测缓冲
JP7359934B2 (ja) 2019-07-10 2023-10-11 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーのためのサンプル識別
US11356675B2 (en) 2019-07-11 2022-06-07 Tencent America LLC Method and apparatus for video coding
CN117579816A (zh) 2019-07-11 2024-02-20 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的比特流一致性约束
CN114128258B (zh) * 2019-07-14 2023-12-22 北京字节跳动网络技术有限公司 视频编解码中的变换块尺寸的限制
US11616962B2 (en) 2019-07-15 2023-03-28 Tencent America LLC Method and apparatus for video coding
CN114258674A (zh) 2019-07-19 2022-03-29 Lg 电子株式会社 使用ibc的图像编码/解码方法和装置,以及发送比特流的方法
EP3994886A4 (en) 2019-08-06 2022-12-28 Beijing Bytedance Network Technology Co., Ltd. VIDEO ZONE PARTITION ACCORDING TO COLOR FORMAT
JP7309046B2 (ja) 2019-09-02 2023-07-14 北京字節跳動網絡技術有限公司 カラーフォーマットに基づいたビデオ領域のパーティション
MX2022003122A (es) 2019-09-21 2022-04-06 Beijing Bytedance Network Tech Co Ltd Modo intra basado para croma de restriccion de tama?o.
US11943429B2 (en) * 2020-03-04 2024-03-26 Qualcomm Incorporated Subpicture signaling in video coding
US20230086077A1 (en) * 2021-09-17 2023-03-23 Tencent America LLC Method and apparatus for intra block copy (intrabc) mode coding with search range restrictions

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160704A (zh) * 2012-02-08 2014-11-19 高通股份有限公司 B切片中的预测单元限于单向帧间预测

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101441874B1 (ko) * 2009-08-21 2014-09-25 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
US8897585B2 (en) 2009-11-05 2014-11-25 Telefonaktiebolaget L M Ericsson (Publ) Prediction of pixels in image coding
PL3454561T3 (pl) * 2011-09-14 2020-05-18 Samsung Electronics Co., Ltd. Sposób i urządzenie do kodowania jednostki predykcji (pu) w oparciu o jej rozmiar i odpowiadające urządzenie do dekodowania
MX353235B (es) 2011-09-29 2018-01-08 Sharp Kk Star Dispositivo de decodificación de imágenes, método de decodificación de imágenes y dispositivo de codificación de imágenes.
US9894355B2 (en) 2012-01-19 2018-02-13 Sony Corporation Image processing apparatus and method thereof
US9906786B2 (en) 2012-09-07 2018-02-27 Qualcomm Incorporated Weighted prediction mode for scalable video coding
CN103747258B (zh) 2014-01-27 2015-02-04 中国科学技术大学 一种高性能视频编码标准的加密处理方法
CN105556971B (zh) * 2014-03-04 2019-07-30 微软技术许可有限责任公司 针对帧内块复制预测中的块翻动和跳跃模式的编码器侧判定
US10327002B2 (en) 2014-06-19 2019-06-18 Qualcomm Incorporated Systems and methods for intra-block copy

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160704A (zh) * 2012-02-08 2014-11-19 高通股份有限公司 B切片中的预测单元限于单向帧间预测

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TOMOHIRO IKAI: "Bi-prediction restriction in small PU", 《7TH MEETING: JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *
YOU ZHOU等: "Motion Vector Resolution Control for Screen Content Coding", 《16TH MEETING: JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111149358A (zh) * 2017-09-21 2020-05-12 华为技术有限公司 仿射帧间预测中子块尺寸推导的限制
CN111149358B (zh) * 2017-09-21 2022-06-14 华为技术有限公司 仿射帧间预测中子块尺寸推导的限制
US11202081B2 (en) 2018-06-05 2021-12-14 Beijing Bytedance Network Technology Co., Ltd. Interaction between IBC and BIO
US11831884B2 (en) 2018-06-05 2023-11-28 Beijing Bytedance Network Technology Co., Ltd Interaction between IBC and BIO
CN110572670A (zh) * 2018-06-05 2019-12-13 北京字节跳动网络技术有限公司 帧内块复制和双向光流的交互
US11523123B2 (en) 2018-06-05 2022-12-06 Beijing Bytedance Network Technology Co., Ltd. Interaction between IBC and ATMVP
US11509915B2 (en) 2018-06-05 2022-11-22 Beijing Bytedance Network Technology Co., Ltd. Interaction between IBC and ATMVP
CN110572670B (zh) * 2018-06-05 2022-05-20 北京字节跳动网络技术有限公司 帧内块复制和双向光流的交互
US11659192B2 (en) 2018-06-21 2023-05-23 Beijing Bytedance Network Technology Co., Ltd Sub-block MV inheritance between color components
US11197003B2 (en) 2018-06-21 2021-12-07 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
US11968377B2 (en) 2018-06-21 2024-04-23 Beijing Bytedance Network Technology Co., Ltd Unified constrains for the merge affine mode and the non-merge affine mode
US11895306B2 (en) 2018-06-21 2024-02-06 Beijing Bytedance Network Technology Co., Ltd Component-dependent sub-block dividing
US11197007B2 (en) 2018-06-21 2021-12-07 Beijing Bytedance Network Technology Co., Ltd. Sub-block MV inheritance between color components
US11477463B2 (en) 2018-06-21 2022-10-18 Beijing Bytedance Network Technology Co., Ltd. Component-dependent sub-block dividing
US11172196B2 (en) 2018-09-24 2021-11-09 Beijing Bytedance Network Technology Co., Ltd. Bi-prediction with weights in video coding and decoding
US11202065B2 (en) 2018-09-24 2021-12-14 Beijing Bytedance Network Technology Co., Ltd. Extended merge prediction
US11616945B2 (en) 2018-09-24 2023-03-28 Beijing Bytedance Network Technology Co., Ltd. Simplified history based motion vector prediction
US11570450B2 (en) 2018-11-06 2023-01-31 Beijing Bytedance Network Technology Co., Ltd. Using inter prediction with geometric partitioning for video processing
US11611763B2 (en) 2018-11-06 2023-03-21 Beijing Bytedance Network Technology Co., Ltd. Extensions of inter prediction with geometric partitioning
US11792421B2 (en) 2018-11-10 2023-10-17 Beijing Bytedance Network Technology Co., Ltd Rounding in pairwise average candidate calculations
CN111010572A (zh) * 2018-12-04 2020-04-14 北京达佳互联信息技术有限公司 一种视频编码方法和装置及设备
CN113170166B (zh) * 2018-12-30 2023-06-09 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
CN113170166A (zh) * 2018-12-30 2021-07-23 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
US11956431B2 (en) 2018-12-30 2024-04-09 Beijing Bytedance Network Technology Co., Ltd Conditional application of inter prediction with geometric partitioning in video processing
CN113287303A (zh) * 2019-01-12 2021-08-20 北京字节跳动网络技术有限公司 双向预测约束
WO2020164629A1 (en) * 2019-02-17 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Restriction of applicability for intra block copy mode
US11140412B2 (en) 2019-02-17 2021-10-05 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction for intra block copy (IBC) mode and non-IBC inter mode
US11343529B2 (en) 2019-03-17 2022-05-24 Beijing Bytedance Network Technology Co., Ltd. Calculation of predication refinement based on optical flow
WO2020187198A1 (en) * 2019-03-17 2020-09-24 Beijing Bytedance Network Technology Co., Ltd. Prediction refinement based on optical flow
CN113826390B (zh) * 2019-05-16 2024-03-08 字节跳动有限公司 屏幕内容编解码的帧内块复制
CN113826390A (zh) * 2019-05-16 2021-12-21 字节跳动有限公司 屏幕内容编解码的帧内块复制
CN115104306B (zh) * 2020-02-24 2023-05-30 高通股份有限公司 在视频译码中共享的信令约束和序列参数集
CN115104306A (zh) * 2020-02-24 2022-09-23 高通股份有限公司 在视频译码中共享的信令约束和序列参数集

Also Published As

Publication number Publication date
US10327002B2 (en) 2019-06-18
JP2017522789A (ja) 2017-08-10
ES2807216T3 (es) 2021-02-22
EP3158737A1 (en) 2017-04-26
JP2017522790A (ja) 2017-08-10
CA2952457A1 (en) 2015-12-23
CA2952279A1 (en) 2015-12-23
BR112016029539A2 (pt) 2017-08-22
KR20170019365A (ko) 2017-02-21
JP6704354B2 (ja) 2020-06-03
HUE050093T2 (hu) 2020-11-30
EP3158737B1 (en) 2020-04-22
EP3158736A1 (en) 2017-04-26
CA2952457C (en) 2022-12-13
CN106416245B (zh) 2019-08-02
JP6527891B2 (ja) 2019-06-05
CN106464874A (zh) 2017-02-22
KR102423948B1 (ko) 2022-07-22
WO2015196029A1 (en) 2015-12-23
KR102423950B1 (ko) 2022-07-21
KR20170019364A (ko) 2017-02-21
US10327001B2 (en) 2019-06-18
HUE047937T2 (hu) 2020-05-28
US20150373358A1 (en) 2015-12-24
BR112016029387A2 (pt) 2017-08-22
US20150373357A1 (en) 2015-12-24
BR112016029387B1 (pt) 2024-02-15
CA2952279C (en) 2023-01-03
CN106464874B (zh) 2019-08-02
EP3158736B1 (en) 2019-11-27
ES2774664T3 (es) 2020-07-22
WO2015196030A1 (en) 2015-12-23

Similar Documents

Publication Publication Date Title
CN106464874B (zh) 用于块内复制的系统和方法
CN112740681B (zh) 自适应多重变换译码
CN103828374B (zh) 参考图片信令和经解码图片缓冲器管理
CN105103560B (zh) 用于仅高级语法可缩放视频译码的层间参考图片限制
CN104272746B (zh) 用于视频序列中的随机存取点图片的经解码图片缓冲器处理
CN106664427B (zh) 用于对视频数据进行编码的设备和方法及计算机可读媒体
CN105874797B (zh) 视频数据的编解码方法、装置、设备和存储媒体
CN105191315B (zh) 一种用于对视频信息进行译码的方法和设备
CN113196775A (zh) 用于当前图片参考(cpr)和帧内块复制(ibc)的虚拟搜索区
CN105075258B (zh) 针对具有不同纵横比的空间可缩放性的层间参考图片建构
CN104429082B (zh) 用于视频译码的长期参考图片的信令
TW201926991A (zh) 色度量化參數偏移
CN107660341A (zh) 切片级帧内块复制及其它视频译码改进
EP3959877A1 (en) Adaptation parameter sets (aps) for adaptive loop filter (alf) parameters
CN108353167A (zh) 译码视频数据的正负号信息
CN106464920A (zh) 用于在参数集中用信号表示层集合的信息的系统和方法
CN107852498A (zh) 在视频译码中限制双向预测的方法及系统
CN106464885A (zh) 块自适应颜色空间转换译码
CN105637878A (zh) 在视频译码中用于基于子解码图片缓冲器(sub-dpb)的dpb操作的传信
CN105637881A (zh) 用于视频信息的可缩放译码的装置和方法
CN105052156A (zh) Irap存取单元与位流切换及拼接
CN105379272B (zh) 在vps中用信号通知位速率信息及图片速率信息
CN104956676B (zh) 层间语法预测控制
CN113711595A (zh) 针对帧内预测模式推导的基于块的量化残差域脉冲编解码调制分配
CN105144716A (zh) 层间图片信令及相关过程

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant