CN114391253A - 几何交叉分量滤波 - Google Patents

几何交叉分量滤波 Download PDF

Info

Publication number
CN114391253A
CN114391253A CN202180005290.7A CN202180005290A CN114391253A CN 114391253 A CN114391253 A CN 114391253A CN 202180005290 A CN202180005290 A CN 202180005290A CN 114391253 A CN114391253 A CN 114391253A
Authority
CN
China
Prior art keywords
directionality
computer
video data
edge direction
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180005290.7A
Other languages
English (en)
Inventor
杜祎鑫
赵欣
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent America LLC
Original Assignee
Tencent America LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent America LLC filed Critical Tencent America LLC
Publication of CN114391253A publication Critical patent/CN114391253A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了用于对视频数据进行编码和解码的方法、计算机程序和计算机系统。接收视频数据,并且确定接收的视频数据的样本块的方向性。方向性对应于诸如边缘方向或梯度的描述符。基于确定的方向性应用几何变换。基于所应用的几何变换来对视频数据进行解码。

Description

几何交叉分量滤波
相关申请的交叉引用
本申请要求2020年4月26日在美国专利商标局提交的美国临时专利申请第63/015,586号和2020年10月22日在美国专利商标局提交的美国专利申请第17/077,564号的优先权,这两个专利的全部内容通过引用并入本文中。
技术领域
本公开内容一般地涉及数据处理领域,更具体地涉及视频编码和解码。
背景技术
AOMedia Video 1(AV1)是开放的视频译码格式,其被设计成用于通过因特网进行视频传输。它是由开放媒体联盟(AOMedia)作为VP9的后继者开发的,AOMedia是2015年成立的联盟,包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。AV1项目的许多部分来自联盟成员的先前研究工作。个体贡献者早在几年前就开始了实验性技术平台:Xiph/Mozilla的Daala已于2010年发布代码,Google的实验性VP9演进项目VP10于2014年9月12日宣布,以及Cisco的Thor于2015年8月11日发布。基于VP9的代码库,AV1结合了其他技术,其中一些技术是以这些实验格式开发的。AV1参考编解码器的第一个版本0.1.0于2016年4月7日发布。该联盟于2018年3月28日宣布发布AV1比特流规范,以及基于软件的参考编码器和解码器。2018年6月25日,发布了该规范的验证版本1.0.0。2019年1月8日,发布了该规范的带有勘误表1的验证版本1.0.0。AV1比特流规范包括参考视频编解码器。
发明内容
实施方式涉及用于对视频数据进行译码的方法、系统和计算机可读介质。根据一个方面,提供了用于对视频数据进行译码的方法。该方法可以包括接收视频数据。确定接收到的视频数据的样本块的方向性。方向性对应于描述符,诸如边缘方向或梯度。基于确定的方向性来应用几何变换。基于所应用的几何变换来对视频数据进行解码。
根据另一方面,提供了用于对视频数据进行译码的计算机系统。计算机系统可以包括一个或更多个处理器、一个或更多个计算机可读存储器、一个或更多个计算机可读有形存储装置以及程序指令,所述程序指令存储在一个或更多个存储装置中的至少一个存储装置上以由一个或更多个处理器中的至少一个处理器经由一个或更多个存储器中的至少一个存储器来执行,由此计算机系统能够执行方法。该方法可以包括接收视频数据。确定接收到的视频数据的样本块的方向性。方向性对应于描述符,诸如边缘方向或梯度。基于确定的方向性来应用几何变换。基于所应用的几何变换来对视频数据进行解码。
根据又一方面,提供了用于对视频数据进行译码的计算机可读介质。计算机可读介质可以包括一个或更多个计算机可读存储装置和存储在一个或更多个有形存储装置中的至少一个有形存储装置上的程序指令,程序指令能够由处理器执行。程序指令能够由处理器执行成用于执行方法,该方法可以相应地包括接收视频数据。确定接收到的视频数据的样本块的方向性。方向性对应于描述符,诸如边缘方向或梯度。基于确定的方向性来应用几何变换。基于所应用的几何变换来对视频数据进行解码。
附图说明
根据对要结合附图阅读的说明性实施方式的下列详细描述,这些和其他对象、特征和优点将变得明显。附图的各种特征未按比例绘制,这是为了清楚地图示,以促进本领域技术人员结合具体实施方式的理解。在附图中:
图1示出了根据至少一个实施方式的联网计算机环境;
图2是根据至少一个实施方式的视频数据的示例性边缘方向的图;
图3A和图3B是根据至少一个实施方式的示例性几何变换过程;
图4是根据至少一个实施方式的与一个或更多个梯度方向相对应的样本的示例性二次采样位置的图;
图5是示出根据至少一个实施方式的由基于应用与视频数据的识别的边缘相对应的几何变换来对视频数据进行译码的程序执行的步骤的操作流程图;
图6是根据至少一个实施方式的包括图1中所描绘的计算机系统的说明性云计算环境的框图;
图7是根据至少一个实施方式的图6的说明性云计算环境的功能层的框图;以及
图8是根据至少一个实施方式的图1中描绘的计算机和服务器的内部组件和外部组件的框图。
具体实施方式
本文公开了所要求保护的结构和方法的详细实施方式;然而,可以理解,所公开的实施方式仅仅是对可以以各种形式实施的所要求保护的结构和方法的说明。然而,这些结构和方法可以以许多不同的形式来实施,并且不应被解释为限于本文中阐述的示例性实施方式。相反,提供这些示例性实施方式使得本公开内容将是透彻和完整的并且将向本领域技术人员充分地传达范围。在说明书中,可能省略公知特征和技术的细节,以避免不必要地模糊所呈现的实施方式。
实施方式一般地涉及数据处理领域,更具体地涉及视频编码和解码。此外,以下描述的示例性实施方式提供了如下系统、方法和计算机程序,该系统、方法和计算机程序基于对视频数据内的检测到的边缘应用几何变换来对视频数据进行编码和解码。因此,一些实施方式具有通过允许通过改进视频数据中的边缘检测以改进视频数据的编码和解码来改进计算领域的能力。
如前所述,AOMedia Video 1(AV1)是开放的视频译码格式,其被设计成用于通过因特网进行视频传输。AV1是由开放媒体联盟(AOMedia)作为VP9的后继者开发的,AOMedia是2015年成立的联盟,包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。AV1项目的许多部分来自联盟成员的先前研究工作。个体贡献者早在几年前就开始了实验性技术平台:Xiph/Mozilla的Daala已于2010年发布代码,Google的实验性VP9演进项目VP10于2014年9月12日宣布,以及Cisco的Thor于2015年8月11日发布。基于VP9的代码库,AV1结合了其他技术,其中一些技术是以这些实验格式开发的。AV1参考编解码器的第一个版本0.1.0于2016年4月7日发布。该联盟于2018年3月28日宣布发布AV1比特流规范以及基于软件的参考编码器和解码器。2018年6月25日,发布了该规范的验证版本1.0.0。2019年1月8日,发布了该规范的带有勘误表1的验证版本1.0.0。AV1比特流规范包括参考视频编解码器。
在AV1中,交叉分量滤波方法被定义为如下滤波过程:该滤波过程使用第一颜色分量的重构样本作为输入(例如,Y或Cb或Cr),并且输出被应用于作为第一颜色分量的不同颜色分量的第二颜色分量。然而,在交叉分量滤波(CCF)中,没有考虑样本的方向性,这可能会影响CCF的性能。在ALF中,滤波器系数的几何变换被应用于处理不同的方向性。对于CCF,也可以应用滤波器系数的几何变换,并且这可能有助于改进译码效率。因此,可能有益的是,在训练滤波器系数和执行滤波时考虑样本的方向性、确定样本的方向性并对滤波器系数或位于滤波器支持区域的样本应用几何变换以改进译码效率。
本文参考根据各种实施方式的方法、装置(系统)和计算机可读介质的流程图和/或框图来描述各方面。应当理解,可以通过计算机可读程序指令实现流程图和/或框图中的每个块以及流程图和/或框图中的块的组合。
现在参照图1,联网计算机环境的功能框图示出了视频译码系统100(在下文中称为“系统”),该视频译码系统基于应用与视频数据的识别的边缘相对应的几何变换对视频数据进行编码和/或解码。应当理解,图1仅提供了一种实现方式的图示,而不暗示对可以实现不同实施方式的环境的任何限制。可以基于设计和实现需求对所描绘的环境进行许多修改。
系统100可以包括计算机102和服务器计算机114。计算机102可以经由通信网络110(在下文中称为“网络”)与服务器计算机114通信。计算机102可以包括处理器104和软件程序108,该软件程序存储在数据存储装置106上并且使得能够与用户交互以及与服务器计算机114通信。如以下将参照图8所讨论的,计算机102可以分别包括内部组件800A和外部组件900A,并且服务器计算机114可以分别包括内部组件800B和外部组件900B。计算机102可以是例如移动装置、电话、个人数字助理、上网本、膝上型计算机、平板计算机、台式计算机或能够运行程序、访问网络和访问数据库的任何类型的计算装置。
如以下关于图6和图7所讨论的,服务器计算机114还可以在例如软件即服务(Software as a Service,SaaS)、平台即服务(Platform as a Service,PaaS)或基础设施即服务(Infrastructure as a Service,IaaS)的云计算服务模型中操作。服务器计算机114还可以位于例如私有云、社区云、公共云或混合云的云计算部署模型中。
可以用于基于应用与视频数据的识别的边缘相对应的几何变换对视频数据进行译码的服务器计算机114能够运行可以与数据库112交互的视频译码程序116(在下文中称为“程序”)。下面关于图5更详细地说明视频译码程序方法。在一个实施方式中,计算机102可以作为包括用户接口的输入装置运行,而程序116可以主要在服务器计算机114上运行。在替选实施方式中,程序116可以主要在一个或更多个计算机102上运行,而服务器计算机114可以用于处理和存储由程序116使用的数据。应当注意,程序116可以是独立的程序,或者可以集成到更大的视频译码程序中。
然而,应当注意,在一些实例中,程序116的处理可以在计算机102和服务器计算机114之间以任何比率共享。在另一实施方式中,程序116可以在多于一个计算机、服务器计算机或计算机和服务器计算机的某种组合上运行,例如,多个计算机102通过网络110与单个服务器计算机114进行通信。在另一实施方式中,例如,程序116可以在多个服务器计算机114上运行,所述多个服务器计算机通过网络110与多个客户端计算机进行通信。可替选地,程序可以在网络服务器上运行,该网络服务器通过网络与服务器以及多个客户端计算机进行通信。
网络110可以包括有线连接、无线连接、光纤连接或其某种组合。通常,网络110可以是将支持计算机102与服务器计算机114之间的通信的连接和协议的任何组合。网络110可以包括各种类型的网络,诸如例如局域网(LAN)、诸如因特网的广域网(WAN)、诸如公共交换电话网(PSTN)的电信网络、无线网络、公共交换网络、卫星网络、蜂窝网络(例如,第五代(5G)网络、长期演进(LTE)网络、第三代(3G)网络、码分多址(CDMA)网络等)、公共陆地移动网络(PLMN)、城域网(MAN)、专用网络、自组织网络、内联网、基于光纤的网络等,和/或这些或其他类型的网络的组合。
图1所示的装置和网络的数目和布置被提供作为示例。实际上,可以存在与图1所示的装置和/或网络相比附加的装置和/或网络、更少的装置和/或网络、不同的装置和/或网络、或不同布置的装置和/或网络。此外,图1所示的两个或更多个装置可以在单个装置内实现,或者图1所示的单个装置可以实现为多个分布式装置。附加地或可替选地,系统100的一组装置(例如,一个或更多个装置)可以执行被描述为由系统100的另一组装置执行的一个或更多个功能。
现在参照图2,描绘了示例性边缘方向200的图。边缘可以表示位于视频和图像数据的连续位置处的其中强度值发生突变的样本集。边缘可以具有可以表示沿着边缘的单位向量的方向。边缘可以具有可能与边缘所位于的样本位置相对应的位置。因此,边缘检测可以对应于可以用于确定边缘方向和边缘位置的过程。例如,可以通过确定沿着边缘的梯度来执行边缘检测。梯度可以对应于样本值沿着可能与边缘方向不同的方向的增加或减小。负梯度值可以对应于沿着给定方向变化到较小的样本强度的样本强度,而正梯度值可以对应于沿着给定方向变化到较大的样本强度的样本强度。边缘方向200可以包括例如水平边缘202、垂直边缘204、45度边缘206和135度边缘208。可以理解,给定足够大的样本块大小,可以存在基本上任何角度的边缘。
根据一个或更多个实施方式,可以确定M×N块的方向性,其中M和N是正整数。M和N的示例值可以包括例如2、4和8。该过程的输入可以是M×N样本块,以及输出可以是可以描述当前块的方向性的描述符。在一个实施方式中,边缘方向被选择作为描述符。可以对当前块应用边缘检测过程,并且该过程的输出是边缘方向和边缘位置。在一个实施方式中,基于具有最小误差值的块的方向搜索来确定边缘方向。方向搜索仅在解块滤波器之后对重构的像素进行操作。由于这些像素对于解码器可用,因此方向不需要信令。该搜索在8×8的块上操作,所述8×8的块足够小以充分地处理非直边缘,而足够大以可靠地估计在应用于经量化的图像时的方向。在8×8区域上具有恒定的方向也使滤波器的矢量化更容易。对于每个块,我们通过使量化块与最近的完美方向性块之间的平方差之和(SSD)最小化来确定与块中的模式最匹配的方向。完美方向性块是沿着一个方向上的线的所有像素具有相同值的块。在一个实施方式中,使用Canny边缘检测器执行边缘检测。在一个实施方式中,使用Sobel边缘检测器执行边缘检测。
在一个实施方式中,梯度值被选择作为描述符。首先对当前块应用计算沿着特定方向的梯度值的过程。示例梯度方向包括但不限于水平、垂直和对角线(45度、135度)。在一个实施方式中,在上述提出的方法中,使用CCF的输入颜色分量的M×N块来确定方向性。在一个示例中,当CCF的输入颜色分量是Y分量时,M×N块取自Y分量。在一个示例中,当CCF的输入颜色分量是Cb分量时,M×N块取自Cb分量。在一个示例中,当CCF的输入颜色分量是Cr分量时,M×N块取自Cr分量。
在一个实施方式中,在上述提出的方法中,使用CCF的输出颜色分量的M×N块来确定方向性。在一个示例中,当CCF的输出颜色分量是Y分量时,M×N块取自Y分量。在一个示例中,当CCF的输出颜色分量是Cb分量时,M×N块取自Cb分量。在一个示例中,当CCF的输出颜色分量是Cr分量时,M×N块取自Cr分量。
现在参照图3A,描绘了示例性几何变换过程300A。此外,几何变换过程可以包括一个或更多个预定义旋转302A至302D。根据一个或更多个实施方式,几何变换过程300A可以应用于CCF的滤波过程中。该过程的输入是参照以上与图2相关的实施方式描述的示例中的样本的方向性。基于该方向性,对CCF的滤波器系数或滤波器支持区域中的重构样本进行变换。在一个实施方式中,当通过边缘方向来识别块的方向性时,基于所识别的边缘方向来旋转滤波器系数或滤波器支持区域中的重构样本。在一个实施方式中,目标方向仅包括一个单一方向。在一个示例中,目标方向是水平方向。示出了旋转方案。在当前块的边缘方向为水平时,不执行旋转。在当前块的边缘方向为垂直时,滤波器系数或滤波器支持区域中的样本顺时针旋转90度。在当前块的边缘方向为45度时,滤波器系数或滤波器支持区域中的样本顺时针旋转135度。在当前块的边缘方向为135度时,滤波器系数或滤波器支持区域中的样本顺时针旋转45度。在当前块是平滑区域、即没有检测到边缘时,不执行旋转。
现在参照图3B,描绘了示例性几何变换过程300B。此外,几何变换过程可以包括一个或更多个预定义旋转304A至304B。几何变换过程300B可以包括将相同的变换应用于多个方向。在一个示例中,目标方向是水平和垂直。示出了旋转方案。在当前块的边缘方向为水平时,不执行旋转。在当前块的边缘方向为垂直时,不执行旋转。在当前块的边缘方向为45度时,滤波器系数或滤波器支持区域中的样本顺时针旋转45度。在当前块的边缘方向为135度时,滤波器系数或滤波器支持区域中的样本顺时针旋转45度。在当前块是平滑区域、即没有检测到边缘时,不执行旋转。在一个实施方式中,当CCF扫描当前块内的所有样本时,执行旋转,而不管样本是否位于边缘上。当指明CCF扫描样本时,指的是以下两种情况中的任一种:1)样本经过训练;或者2)CCF的滤波过程。在一个实施方式中,仅当CCF扫描位于当前块内的边缘上的样本时,才执行旋转。当指明CCF扫描样本时,意味着样本经过训练或CCF的滤波。
在一个实施方式中,当梯度值描述块的方向性时,基于梯度值来对滤波器系数或滤波器支持区域中的重构样本进行变换。
在一个实施方式中,可以使用滤波器系数和削波值(clipping value)的几何变换来执行变换。可以应用具有基于块的滤波器适配的自适应环路滤波器(ALF)。对于亮度分量,基于局部梯度的方向和活动性,为每个4×4块选择25个滤波器中的一个滤波器。两种菱形滤波器形状可以用于自适应环路滤波。7×7菱形形状可以应用于亮度分量,以及5×5菱形形状可以应用于色度分量。
对于亮度分量,每个4×4块可以被分类为25类之外的一类。分类索引C可以基于其方向性D和活动性的量化值
Figure BDA0003541237040000081
而导出为
Figure BDA0003541237040000082
为了计算D和
Figure BDA0003541237040000083
首先使用1-D拉普拉斯算子计算水平、垂直和两个对角线方向的梯度:
Figure BDA0003541237040000084
Figure BDA0003541237040000085
Figure BDA0003541237040000086
Figure BDA0003541237040000087
其中,索引i和j指的是4×4块内的左上样本的坐标,以及R(i,j)指示坐标(i,j)处的重构样本。
为了降低块分类的复杂性,应用了二次采样的1-D拉普拉斯算子计算。如下面将关于图4所讨论的,相同的二次采样的位置被用于所有方向的梯度计算。然后,水平方向和垂直方向的梯度的D最大值和最小值可以被设置为:
Figure BDA0003541237040000091
两个对角线方向的梯度的最大值和最小值被设置为:
Figure BDA0003541237040000092
为了得出方向性D的值,将这些值彼此进行比较并与两个阈值t1和t2进行比较。如果
Figure BDA0003541237040000093
并且
Figure BDA0003541237040000094
为真,则D被设置为0。如果
Figure BDA0003541237040000095
并且如果
Figure BDA0003541237040000096
则D被设置为2。如果
Figure BDA0003541237040000097
并且
Figure BDA0003541237040000098
则D被设置为1。如果
Figure BDA0003541237040000099
并且如果
Figure BDA00035412370400000910
则D被设置为4。如果
Figure BDA00035412370400000911
并且如果
Figure BDA00035412370400000912
则D被设置为3。
活动性值A可以被计算为:
Figure BDA00035412370400000913
其中,A还可以量化到0到4的范围,包括0和4,并且量化值被表示为
Figure BDA00035412370400000914
对于图片中的色度分量,可能不需要应用分类方法,即可以针对每个色度分量应用ALF系数的单个集合。
在对每个4×4亮度块进行滤波之前,根据针对该块计算的梯度值,对滤波器系数f(k,l)和相应的滤波器削波值c(k,l)应用诸如旋转或对角翻转和垂直翻转的几何变换。这相当于将这些变换应用于滤波器支持区域中的样本。该构思通过对齐应用了ALF的不同的块的方向性来使这些不同的块更相似。
可以引入包括对角翻转、垂直翻转和旋转的三种几何变换:
对角:fD(k,l)=f(l,k),cD(k,l)=c(l,k)
垂直翻转:fV(k,l)=f(k,K-l-1),cV(k,l)=c(k,K-l-1)
旋转:fR(k,l)=f(K-l-1,k),cR(k,l)=c(K-l-1,k)
其中,K是滤波器的大小,并且0≤k,l≤K-1是系数坐标,使得位置(0,0)在左上角处,并且位置(K-1,K-1)在右下角处。根据针对该块计算的梯度值,将变换应用于滤波器系数f(k,l)和削波值c(k,l)。对于梯度值gd2<gd1并且gh<gv,可能不需要应用变换。对于梯度值gd2<gd1并且gv<gh,可以应用对角变换。对于梯度值gd1<gd2并且gh<gv,可以应用垂直翻转变换。对于梯度值gd1<gd2并且gv<gh,可以应用旋转变换。
在一个实施方式中,块的方向性通过边缘方向和梯度二者来测量,使得CCF的滤波器系数的变换取决于边缘方向和梯度二者。在一个实施方式中,边缘方向确定滤波器系数是否被旋转。在一个实施方式中,梯度确定滤波器系数是否被翻转。
在一个实施方式中,在CCF的训练过程中应用几何变换。该过程的输入是参照以上与图2相关的实施方式描述的示例中的样本的方向性。基于该方向性,对CCF的滤波器系数或滤波器支持区域中的重构样本进行变换。
现在参照图4,描绘了与一个或更多个梯度方向相对应的样本的示例性二次采样位置的图400。二次采样位置可以包括样本302A的与垂直梯度相对应的位置、样本302B的与水平梯度相对应的位置、样本302C的与第一对角梯度相对应的位置以及样本302D的与第二对角梯度相对应的位置。二次采样位置V、H、D1和D2可以分别对应于垂直梯度、水平梯度、第一对角梯度和第二对角梯度。
现在参照图5,描绘了示出用于对视频数据进行译码的方法500的步骤的操作性流程图。在一些实现方式中,图5的一个或更多个过程块可以由计算机102(图1)和服务器计算机114(图1)来执行。在一些实现方式中,图5的一个或更多个过程块可以由与计算机102和服务器计算机114分离或包括计算机102和服务器计算机114的另一设备或设备组来执行。
在502处,方法500包括接收视频数据。
在504处,方法500包括确定接收到的视频数据的样本块的方向性,该方向性对应于描述符。
在506处,方法500包括基于确定的方向性应用几何变换。
在508处,方法500包括基于所应用的几何变换对视频数据进行解码。
可以理解,图5仅提供了一种实现方式的说明,而不暗示对可以实现不同实施方式的方式的任何限制。可以基于设计和实现需求对所描绘的环境进行许多修改。
预先应理解,尽管本公开内容包括关于云计算的详细描述,但是本文中记载的教导的实现方式不限于云计算环境。相反,一些实施方式能够结合现在已知的或以后开发的任何其他类型的计算环境被实现。
云计算是一种服务交付模型,用于实现对可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池的便捷、按需网络接入,所述可配置计算资源可以以最小的管理工作或与服务提供商的交互来快速供应和释放。该云模型可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征如下:
按需自助服务:云消费者可以单方面地自动地根据需要提供计算能力,例如服务器时间和网络存储,而不需要与服务提供商进行人工交互。
广泛的网络接入:可通过网络获得能力,并且通过标准机制来访问,这些标准机制促进异构的瘦客户端平台或胖客户端平台(例如,移动电话、膝上型计算机和PDA)的使用。
资源池化:提供商的计算资源被池化,以使用多租户模型来服务多个消费者,其中不同的物理资源和虚拟资源根据需求被动态地分配和重新分配。存在位置无关的感觉,因为消费者通常不控制或不知道所提供的资源的确切位置,但是可能能够在更高的抽象层次(例如,国家、州或数据中心)指定位置。
快速弹性:可以快速且弹性地提供能力(在某些情况下是自动地)以快速扩展,以及快速释放以快速收缩。对于消费者,可用于提供的能力通常看起来不受限制,并且可以在任何时间以任何数量购买。
测量服务:云系统通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某种抽象层次上利用计量能力来自动控制和优化资源使用。可以管理、控制和报告资源使用,从而为所利用的服务的提供商和消费者二者提供透明度。
服务模型如下:
软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供商的应用。可通过诸如web浏览器(例如,基于web的电子邮件)的瘦客户端接口从各种客户端装置访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储装置、或甚至各个应用功能的底层云基础设施,可能的例外是有限的用户专用应用配置设置。
平台即服务(PaaS):提供给消费者的能力是将使用由提供商支持的编程语言和工具创建的消费者创建或获得的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储装置的底层云基础设施,但可以控制所部署的应用和可能的应用托管环境配置。
基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络以及消费者能够部署和运行任意软件的其他基本计算资源,所述任意软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,但可以控制操作系统、存储、部署的应用,并且可能对选择联网组件(例如,主机防火墙)具有有限控制。
部署模型如下:
私有云:云基础设施只为组织运行。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
社区云:云基础设施由若干组织共享,并且支持有共享关注(例如,任务、安全要求、策略和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
公共云:云基础设施可供一般公众或大型行业团体使用,并且由销售云服务的组织所有。
混合云:云基础设施是两个或更多个云(私有、社区或公共)的组合,这些云仍然是唯一的实体,但是通过实现数据和应用的可移植性的标准化或专有技术(例如,用于云之间的负载平衡的云爆发)绑定在一起。
云计算环境是面向服务的,其焦点在于无状态、低耦合、模块性和语义互操作性。云计算的核心是包括相互连接的节点的网络的基础设施。
参照图6,描绘了说明性云计算环境600。如图所示,云计算环境600包括一个或更多个云计算节点10,由云消费者使用的本地计算装置可以通过所述一个或更多个云计算节点通信,所述本地计算装置诸如例如是个人数字助理(Personal Digital Assistant,PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N。云计算节点10可以彼此通信。它们可以被物理地或虚拟地分组(未示出)到一个或更多个网络中,所述一个或更多个网络例如是如上文描述的私有云、社区云、公共云或混合云、或其组合。这允许云计算环境600提供基础设施即服务、平台即服务和/或软件即服务,云消费者不需要为基础设施即服务、平台即服务和/或软件即服务维护本地计算装置上的资源。应当理解,图6中所示的计算装置54A至54N的类型仅旨在说明,并且云计算节点10和云计算环境600可以通过任何类型的网络和/或网络可寻址连接(例如,使用web浏览器)与任何类型的计算机化装置通信。
参照图7,示出了由云计算环境600(图6)提供的一组功能抽象层700。预先应理解,图7中所示的组件、层和功能仅旨在说明,并且实施方式不限于此。如所描绘的,提供了以下层和相应的功能:
硬件和软件层60包括硬件组件和软件组件。硬件组件的示例包括:主机61;基于RISC(Reduced Instruction Set Computer,精简指令集计算机)架构的服务器62;服务器63;刀片式服务器64;存储装置65;以及网络和联网组件66。在一些实施方式中,软件组件包括网络应用服务器软件67和数据库软件68。
虚拟化层70提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器71;虚拟存储72;包括虚拟专用网的虚拟网络73;虚拟应用和操作系统74;以及虚拟客户端75。
在一个示例中,管理层80可以提供以下描述的功能。资源供应81提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价82提供了在云计算环境中利用资源时的成本查询、以及对这些资源的消耗的帐单或发票。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户83为消费者和系统管理员提供对云计算环境的访问。服务级别管理84提供云计算资源分配和管理,使得满足所需的服务级别。服务级别协议(Service LevelAgreement,SLA)规划和实现85为根据SLA预期未来需求的云计算资源提供预先安排和采购。
工作负载层90提供了可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括:地图和导航91;软件开发和生命周期管理92;虚拟课堂教学交付93;数据分析处理94;交易处理95;以及视频译码96。视频译码96可以应用与视频数据的已识别的边缘相对应的几何变换。
图8是根据说明性实施方式的图1中描绘的计算机102、114的内部组件和外部组件的框图。应当理解,图8仅提供了一种实现方式的图示,而不暗示对于可以实现不同实施方式的环境的任何限制。可以基于设计和实现需求对所描绘的环境进行许多修改。
计算机102(图1)和服务器计算机114(图1)可以包括图4所示的内部组件800A、800B和外部组件900A、900B的相应集合。内部组件800的集合中的每一个包括:一个或更多个总线826上的一个或更多个处理器820、一个或更多个计算机可读RAM 822和一个或更多个计算机可读ROM824;一个或更多个操作系统828;以及一个或更多个计算机可读有形存储装置830。
处理器820以硬件、固件或硬件与软件的组合来实现。处理器820是中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)或其他类型的处理组件。在一些实现方式中,处理器820包括能够被编程以执行功能的一个或更多个处理器。总线826包括允许内部组件800A、800B之间的通信的组件。
一个或更多个操作系统828、软件程序108(图1)和服务器计算机114(图1)上的视频译码程序116(图1)被存储在相应的计算机可读有形存储装置830中的一个或更多个上,以由相应的处理器820中的一个或更多个经由相应的RAM 822(其通常包括高速缓冲存储器)中的一个或更多个来执行。在图8所示的实施方式中,计算机可读有形存储装置830中的每一个是内部硬盘驱动的磁盘存储装置。可替选地,计算机可读有形存储装置830中的每一个是半导体存储装置,诸如ROM 824、EPROM、闪存、光盘、磁光盘、固态盘、致密盘(CD)、数字多功能盘(DVD)、软盘、盒式磁带、磁带和/或能够存储计算机程序和数字信息的其他类型的非暂态计算机可读有形存储装置。
内部组件800A、800B的每个集合还包括R/W驱动或接口832,以从诸如CD-ROM、DVD、记忆棒、磁带、磁盘、光盘或半导体存储装置的一个或更多个便携式计算机可读有形存储装置936读取和向其写入。诸如软件程序108(图1)和视频译码程序116(图1)的软件程序可以被存储在相应的便携式计算机可读有形存储装置936中的一个或更多个上,可以经由相应的R/W驱动或接口832读取,以及可以加载到相应的硬盘驱动830中。
内部组件800A、800B的每个集合还包括网络适配器或接口836,诸如TCP/IP适配器卡、无线Wi-Fi接口卡、或3G、4G或5G无线接口卡或其他有线或无线通信链路。软件程序108(图1)和服务器计算机114(图1)上的视频译码程序116(图1)可以经由网络(例如,因特网、局域网或其他广域网)和相应的网络适配器或接口836从外部计算机下载到计算机102(图1)和服务器计算机114。软件程序108和服务器计算机114上的视频译码程序116从网络适配器或接口836加载到相应的硬盘驱动830中。网络可以包括铜线、光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。
外部组件900A、900B的集合中的每一个可以包括计算机显示显示器920、键盘930和计算机鼠标934。外部组件900A、900B还可以包括触摸屏、虚拟键盘、触摸板、定点设备和其他人机接口设备。内部组件800A、800B的集合中的每一个还包括与计算机显示显示器920、键盘930和计算机鼠标934进行接口的装置驱动器840。装置驱动器840、R/W驱动或接口832以及网络适配器或接口836包括硬件和软件(存储在存储装置830和/或ROM 824中)。
一些实施方式可以涉及任何可能的技术细节集成水平的系统、方法和/或计算机可读介质。计算机可读介质可以包括计算机可读非暂态存储介质(或介质),所述计算机可读非暂态存储介质上具有用于使处理器执行操作的计算机可读程序指令。
计算机可读存储介质可以是有形装置,该有形装置可以保留和存储供指令执行装置使用的指令。计算机可读存储介质可以是例如但不限于电子存储装置、磁存储装置、光存储装置、电磁存储装置、半导体存储装置或前述的任何合适的组合。计算机可读存储介质的更特定示例的非穷举列表包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、静态随机存取存储器(SRAM)、便携式致密盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、诸如穿孔卡或其上记录有指令的凹槽中的凸起结构的机械编码装置、以及前述的任何合适的组合。如本文所使用的计算机可读存储介质不应被解释为是暂态信号本身,例如无线电波或其他自由传播的电磁波、通过波导传播的电磁波或其他传输介质(例如,穿过光纤线缆的光脉冲)或通过导线传输的电信号。
本文中描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理装置,或者经由网络例如因特网、局域网、广域网和/或无线网络下载到外部计算机或外部存储装置。网络可以包括铜传输线缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理装置中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并且转发计算机可读程序指令以存储在相应的计算/处理装置内的计算机可读存储介质中。
用于执行操作的计算机可读程序代码/指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路系统的配置数据、或者以一种或更多种编程语言的任意组合编写的源代码或目标代码,所述一种或更多种编程语言包括诸如Smalltalk、C++等的面向对象的编程语言和诸如“C”编程语言或类似编程语言的过程编程语言。计算机可读程序指令可以完全在用户的计算机上、部分在用户的计算机上、作为独立的软件包、部分在用户的计算机上且部分在远程计算机上或者完全在远程计算机或服务器上执行。在后者的情况下,远程计算机可以通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机连接(例如,使用因特网服务提供商通过因特网)。在一些实施方式中,包括例如可编程逻辑电路系统、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路系统可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路系统个性化,以便执行各方面或操作。
可以将这些计算机可读程序指令提供给通用计算机的处理器、专用计算机的处理器或其他可编程数据处理装置的处理器以产生机构,使得经由计算机的处理器或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图块中指定的功能/动作的手段。这些计算机可读程序指令还可以被存储在计算机可读存储介质中,该计算机可读存储介质可以以特定的方式引导计算机、可编程数据处理装置或其他装置起作用,以使得其中存储有指令的计算机可读存储介质包括制品,该制品包括实现流程图和/或框图块中指定的功能/动作的各方面的指令。
计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置或其他装置上,以使得要在计算机、其他可编程装置或其他装置上执行的一系列操作步骤产生计算机实现的处理,使得在计算机、其他可编程装置或其他装置上执行的指令实现流程图和/或框图块中指定的功能/动作。
图中的流程图和框图示出了根据各种实施方式的系统、方法和计算机可读介质的可能实现方式的架构、功能和操作。在这方面,流程图或框图中的每个块可以表示模块、段或部分指令,所述模块、段或部分指令包括用于实现特定逻辑功能的一个或更多个可执行指令。方法、计算机系统和计算机可读介质可以包括与图中所描绘的那些块相比附加的块、更少的块、不同的块或不同布置的块。在一些替选实现方式中,块中注明的功能可以不按图中注明的顺序发生。例如,连续示出的两个块实际上可以同时或者基本上同时执行,或者这些块有时可以根据所涉及的功能而按照相反的顺序执行。还应当注意,可以由执行特定功能或动作或实现专用硬件和计算机指令的组合的基于硬件的专用系统来实现框图和/或流程图图示中的每个块以及框图和/或流程图图示中的块的组合。
将明显的是,可以以不同形式的硬件、固件、或硬件和软件的组合来实现本文所描述的系统和/或方法。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不限制实现方式。因此,本文中在不参考特定软件代码的情况下描述了系统和/或方法的操作和行为——应当理解的是,可以基于本文中的描述将软件和硬件设计成实现系统和/或方法。
除非明确这样描述,否则在本文中使用的元件、动作或指令都不应被解释为是关键或必要的。此外,如本文所使用的,冠词“一”和“一个”旨在包括一个或更多个项,并且可以与“一个或更多个”互换使用。此外,如本文所使用的,术语“集”旨在包括一个或更多个项(例如,相关项、不相关项、相关项和不相关项的组合等),并且可以与“一个或更多个”互换使用。在旨在仅一项的情况下,使用术语“一个”或类似语言。此外,如本文中使用的,术语“有(has)”、“具有(have)”、“含有(having)”等旨在为开放式术语。另外,除非另有明确说明,否则短语“基于”旨在表示“至少部分地基于”。
已经出于说明的目的呈现了对各个方面和实施方式的描述,但是不旨在是穷举的或限于所公开的实施方式。尽管在权利要求书中记载了和/或在说明书中公开了特征的组合,但是这些组合不旨在限制可能的实现方式的公开内容。实际上,可以以权利要求书中未具体记载以及/或者说明书中未具体公开的方式组合这些特征中的许多特征。尽管以下列出的每个从属权利要求可以直接根据仅一个权利要求,但是可能的实现方式的公开内容包括与权利要求集中的每个其他权利要求组合的每个从属权利要求。在不脱离所描述的实施方式的范围的情况下,许多修改和变化对于本领域普通技术人员而言将是明显的。本文所使用的术语被选择以最好地解释实施方式的原理、实际应用或对市场中发现的技术的技术改进,或使得本领域其他普通技术人员能够理解本文所公开的实施方式。

Claims (20)

1.一种能够由处理器执行的视频译码方法,包括:
接收视频数据;
确定所接收的视频数据的样本块的方向性,所述方向性对应于描述符;
基于所确定的方向性应用几何变换;以及
基于所应用的几何变换对所述视频数据进行解码。
2.根据权利要求1所述的方法,其中,所述描述符对应于边缘方向和梯度值中的一个或更多个。
3.根据权利要求2所述的方法,其中,在所述描述符对应于边缘方向的基础上,基于所述边缘方向和边缘位置确定所述方向性。
4.根据权利要求2所述的方法,其中,在所述描述符对应于梯度值的基础上,基于沿着与所述视频数据的边缘相对应的方向的梯度值来确定所述方向性。
5.根据权利要求1所述的方法,其中,基于与所接收的视频数据的样本块相关联的输入颜色分量来确定所述方向性。
6.根据权利要求1所述的方法,其中,基于与所接收的视频数据的样本块相关联的输出颜色分量来确定所述方向性。
7.根据权利要求1所述的方法,其中,基于所述方向性,对交叉分量滤波器的滤波器系数或滤波器支持区域中的重构样本进行变换。
8.根据权利要求7所述的方法,其中,在由边缘方向识别块的方向性的基础上,基于识别的边缘方向来旋转所述滤波器系数或所述滤波器支持区域中的重构样本。
9.根据权利要求8所述的方法,其中,目标方向仅包括一个单一方向。
10.根据权利要求9所述的方法,其中:
基于当前块的边缘方向为水平,不执行旋转;
基于当前块的边缘方向为垂直,将所述滤波器系数或所述滤波器支持区域中的样本顺时针旋转90度;
基于当前块的边缘方向为45度,将所述滤波器系数或所述滤波器支持区域中的样本顺时针旋转135度;
基于当前块的边缘方向为135度,将所述滤波器系数或所述滤波器支持区域中的样本顺时针旋转45度;
基于所述当前块是没有检测到边缘的平滑区域,不执行旋转。
11.根据权利要求8所述的方法,其中,目标方向包括多个方向。
12.根据权利要求11所述的方法,其中,在所述目标方向为水平和垂直的基础上:
基于当前块的边缘方向为水平,不执行旋转;
基于当前块的边缘方向为垂直,不执行旋转;
基于当前块的边缘方向为45度,将所述滤波器系数或所述滤波器支持区域中的样本顺时针旋转45度;
基于当前块的边缘方向为135度,将所述滤波器系数或所述滤波器支持区域中的样本顺时针旋转45度;以及
基于所述当前块是没有检测到边缘的平滑区域,不执行旋转。
13.根据权利要求7所述的方法,其中,基于所述交叉分量滤波器扫描当前块内的所有样本来执行旋转。
14.根据权利要求7所述的方法,其中,基于所述交叉分量滤波器仅扫描位于当前块内的边缘上的样本来执行旋转。
15.根据权利要求7所述的方法,其中,在由梯度值识别块的方向性的基础上,基于所述梯度值对所述滤波器系数或所述滤波器支持区域中的重构样本进行变换。
16.根据权利要求15所述的方法,其中,所述块的方向性通过边缘方向和梯度二者来测量,使得所述交叉分量滤波器的滤波器系数的变换取决于边缘方向和梯度二者。
17.根据权利要求16所述的方法,其中,所述边缘方向确定所述滤波器系数是否被旋转,并且其中,所述梯度确定所述滤波器系数是否被翻转。
18.根据权利要求7所述的方法,其中,所述几何变换被应用于所述交叉分量滤波器的训练过程中。
19.一种用于视频译码的计算机系统,所述计算机系统包括:
一个或更多个计算机可读非暂态存储介质,其被配置成存储计算机程序代码;以及
一个或更多个计算机处理器,其被配置成访问所述计算机程序代码并按照所述计算机程序代码的指示进行操作,所述计算机程序代码包括:
被配置成使所述一个或更多个计算机处理器接收视频数据的接收代码;
被配置成使所述一个或更多个计算机处理器确定所接收的视频数据的样本块的方向性的确定代码,所述方向性对应于描述符;
被配置成使所述一个或更多个计算机处理器基于所确定的方向性应用几何变换的应用代码;以及
被配置成使所述一个或更多个计算机处理器基于所应用的几何变换对所述视频数据进行解码的解码代码。
20.一种非暂态计算机可读介质,其上存储有用于视频译码的计算机程序,所述计算机程序被配置成使一个或更多个计算机处理器进行以下操作:
接收视频数据;
确定所接收的视频数据的样本块的方向性,所述方向性对应于描述符;
基于所确定的方向性应用几何变换;以及
基于所应用的几何变换对所述视频数据进行解码。
CN202180005290.7A 2020-04-26 2021-04-13 几何交叉分量滤波 Pending CN114391253A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063015586P 2020-04-26 2020-04-26
US63/015,586 2020-04-26
US17/077,564 2020-10-22
US17/077,564 US11394967B2 (en) 2020-04-26 2020-10-22 Geometric cross-component filtering
PCT/US2021/027024 WO2021221901A1 (en) 2020-04-26 2021-04-13 Geometric cross-component filtering

Publications (1)

Publication Number Publication Date
CN114391253A true CN114391253A (zh) 2022-04-22

Family

ID=78223131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180005290.7A Pending CN114391253A (zh) 2020-04-26 2021-04-13 几何交叉分量滤波

Country Status (6)

Country Link
US (2) US11394967B2 (zh)
EP (1) EP4000262A4 (zh)
JP (1) JP7467617B2 (zh)
KR (1) KR20220055498A (zh)
CN (1) CN114391253A (zh)
WO (1) WO2021221901A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220279176A1 (en) * 2021-02-26 2022-09-01 Alibaba Group Holding Limited Directional cross component filter for video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110069752A1 (en) * 2008-04-30 2011-03-24 Takashi Watanabe Moving image encoding/decoding method and apparatus with filtering function considering edges
US20170238020A1 (en) * 2016-02-15 2017-08-17 Qualcomm Incorporated Geometric transforms for filters for video coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023525A (en) 1997-10-23 2000-02-08 Xerox Corporation Determining an optimal color space direction for selecting color modulations
KR101291196B1 (ko) 2008-01-25 2013-07-31 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US20160241881A1 (en) 2015-02-13 2016-08-18 Mediatek Inc. Method and Apparatus of Loop Filters for Efficient Hardware Implementation
US20180041778A1 (en) * 2016-08-02 2018-02-08 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
US10419757B2 (en) * 2016-08-31 2019-09-17 Qualcomm Incorporated Cross-component filter
US10440396B2 (en) * 2017-03-28 2019-10-08 Qualcomm Incorporated Filter information sharing among color components
EP3662664A4 (en) * 2017-08-03 2020-11-25 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR DIVIDING VIDEO BLOCKS INTO AN INTERPREDICTION SLICE OF VIDEO DATA
CN111615828B (zh) * 2017-11-29 2023-01-10 韩国电子通信研究院 采用环内滤波的图像编码/解码方法和装置
US20190306502A1 (en) * 2018-04-02 2019-10-03 Qualcomm Incorporated System and method for improved adaptive loop filtering
US20190306534A1 (en) * 2018-04-02 2019-10-03 Qualcomm Incorporated Unification of deblocking filter and adaptive loop filter
KR20210100737A (ko) 2018-12-23 2021-08-17 후아웨이 테크놀러지 컴퍼니 리미티드 인코더, 디코더 및 적응 루프 필터를 사용한 대응 방법들
JP7454042B2 (ja) 2019-10-10 2024-03-21 北京字節跳動網絡技術有限公司 適応ループ・フィルタリングにおける利用可能でないサンプル位置でのパディング・プロセス
US11716468B2 (en) * 2019-12-20 2023-08-01 Qualcomm Incorporated Adaptive loop filter signaling redundancy removal field
US11303892B2 (en) * 2020-01-23 2022-04-12 Qualcomm Incorporated Adaptive rounding for loop filters
MX2022009122A (es) 2020-01-24 2022-10-27 Huawei Tech Co Ltd Un codificador, un decodificador y los métodos correspondientes para el filtrado de bucle adaptativo.
US11523138B2 (en) * 2020-03-26 2022-12-06 Alibaba Group Holding Limited Method and apparatus for cross component filtering

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110069752A1 (en) * 2008-04-30 2011-03-24 Takashi Watanabe Moving image encoding/decoding method and apparatus with filtering function considering edges
US20170238020A1 (en) * 2016-02-15 2017-08-17 Qualcomm Incorporated Geometric transforms for filters for video coding
CN108605126A (zh) * 2016-02-15 2018-09-28 高通股份有限公司 从用于视频译码的固定滤波器预测滤波器系数

Also Published As

Publication number Publication date
US11882278B2 (en) 2024-01-23
EP4000262A1 (en) 2022-05-25
US11394967B2 (en) 2022-07-19
US20210337193A1 (en) 2021-10-28
WO2021221901A1 (en) 2021-11-04
JP2022553696A (ja) 2022-12-26
KR20220055498A (ko) 2022-05-03
JP7467617B2 (ja) 2024-04-15
US20220303530A1 (en) 2022-09-22
EP4000262A4 (en) 2023-01-04

Similar Documents

Publication Publication Date Title
US11882278B2 (en) Geometric cross-component filtering
US11722678B2 (en) Method and apparatus for transform skip coefficients coding
US11575918B2 (en) Cross component intra prediction mode
US11405647B2 (en) Primary transforms using 8-bit and 10-bit cores
CN114503578A (zh) 用于视频编解码的区域自适应环路滤波器
CN116134815A (zh) 基于神经网络的系数符号预测
US20230148414A1 (en) Edge enhancement filter
JP2024074872A (ja) 幾何学的クロスコンポーネントフィルタリング
US11418792B2 (en) Estimating attributes for the classification of adaptive loop filtering based on projection-slice theorem
CN112788345B (zh) 视频数据解码方法、装置、计算机设备和存储介质
US20220345743A1 (en) Line graph transforms (lgt) using 8-bit and 10-bit cores
JP2024054392A (ja) 映像データをコーディングするための方法、コンピュータシステム、及びコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070635

Country of ref document: HK