CN109845255A - 用于将解块滤波器应用于重构视频数据的系统和方法 - Google Patents
用于将解块滤波器应用于重构视频数据的系统和方法 Download PDFInfo
- Publication number
- CN109845255A CN109845255A CN201780060283.0A CN201780060283A CN109845255A CN 109845255 A CN109845255 A CN 109845255A CN 201780060283 A CN201780060283 A CN 201780060283A CN 109845255 A CN109845255 A CN 109845255A
- Authority
- CN
- China
- Prior art keywords
- filter
- video
- block
- sample values
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 113
- 238000013139 quantization Methods 0.000 claims description 59
- 241000023320 Luma <angiosperm> Species 0.000 claims description 35
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 35
- 238000001914 filtration Methods 0.000 claims description 25
- 230000000903 blocking effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 70
- 239000013598 vector Substances 0.000 description 38
- 238000012545 processing Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 29
- 238000004891 communication Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000000638 solvent extraction Methods 0.000 description 9
- 238000005192 partition Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 1
- 241000985610 Forpus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供了一种视频编码设备,所述视频编码设备可被配置为根据本文描述的一种或多种技术执行视频编码。
Description
技术领域
本公开涉及视频编码,并且更具体地涉及用于解块重构视频数据的技术。
背景技术
数字视频功能可以结合到各种设备中,包括数字电视、笔记本电脑或台式电脑、平板电脑、数字录音设备、数字媒体播放器、视频游戏设备、蜂窝电话(包括所谓的智能电话)、医学成像设备等。可以根据视频编码标准对数字视频进行编码。视频编码标准可以结合视频压缩技术。视频编码标准的示例包括ISO/IEC MPEG-4Visual和ITU-T H.264(也被称为ISO/IEC MPEG-4AVC)和高效率视频编码(HEVC)。在2015年4月的高效视频编码(HEVC),Rec.ITU-T H.265中描述了HEVC,该标准以引用方式并入,并且在本文中称为ITU-T H.265。目前正在考虑对ITU-T H.265进行扩展和改进以开发下一代视频编码标准。例如,ITU-T视频编码专家组(VCEG)和ISO/IEC活动图像专家组(MPEG)(统称为联合视频研究组(JVET))正在研究压缩能力显著超过当前HEVC标准的未来视频编码技术的标准化的潜在需求。以引用方式并入本文的联合探索模型3(JEM 3)、联合探索测试模型3(JEM 3)的算法描述、ISO/IECJTC1/SC29/WG11文档:JVET-C1001v3(2016年5月,瑞士,日内瓦)描述了由JVET在联合测试模型研究下的编码特征,该技术是超越ITU-T H.265功能的潜在增强视频编码技术。应当注意,JEM 3的编码特征是在由Fraunhofer研究机构维护的JEM参考软件中实现的。目前,可以使用更新的JEM参考软件版本3(JEM 3.0)。如本文所用,使用术语JEM来统称JEM 3的算法描述和JEM参考软件的具体实施。
视频压缩技术可减少存储和传输视频数据的数据需求。视频压缩技术可通过利用视频序列中固有的冗余来减少数据需求。视频压缩技术可将视频序列再分成连续较小的部分(即视频序列内的帧组、帧组内的帧、帧内的片段、片段内的编码树单元(例如,宏块)、编码树单元内的编码块等)。可以使用帧内预测编码技术(例如,图片内(空间))和帧间预测技术(即图片间(时间))来生成待编码的视频数据单元与视频数据的参考单元之间的差值。该差值可被称为残差数据。残差数据可被编码为量化变换系数。语法元素可以涉及残差数据和参考编码单元(例如,帧内预测模式索引、运动向量和块向量)。可以对残差数据和语法元素进行熵编码。熵编码的残差数据和语法元素可以包括在合规比特流中。
发明内容
一般来讲,本公开描述用于编码视频数据的各种技术。具体地讲,本公开描述了用于解块重构视频数据的技术。应当注意,尽管本公开的技术是相对于ITU-T H.264、ITU-TH.265和JEM描述的,但本公开的技术通常适用于视频编码。例如,本文所述的编码技术可并入到包括块结构的视频编码系统(包括基于未来视频编码标准的视频编码系统)、帧内预测技术、帧间预测技术、变换技术、滤波技术和/或熵编码技术(除被包括在ITU-T H.265和JEM中的那些之外)中。因此,参考ITU-T H.264、ITU-T H.265和/或JEM是出于描述性目的,并且不应被解释为限制本文所述技术的范围。此外,应当注意,将文献以引用方式并入本文是出于描述性目的,并且不应被解释为限制或产生关于本文所用术语的歧义。例如,在某个并入的参考文献中提供的对某个术语的定义不同于另一个并入的参考文献和/或如本文中使用的该术语的情况下,则该术语应以广泛地包括每个相应定义的方式和/或以在包括替代方案中每个特定定义的方式来解释。
本发明的一个方面是对重构视频数据进行滤波的方法,该方法包括:接收包括用于视频数据的分量的相邻重构视频块的样本值阵列;确定与相邻重构视频块相关联的一个或多个条件是否得到满足;基于该一个或多个条件是否得到满足来选择滤波器;以及,基于所选的滤波器修改相邻重构视频块中的样本值。
附图说明
[图1]图1是示出根据本公开的一种或多种技术的可被配置为对视频数据进行编码和解码的系统的示例的框图。
[图2]图2是示出根据本公开的一种或多种技术的四叉树二进制树分区的概念图。
[图3]图3是示出根据本公开的一种或多种技术的视频分量的独立四叉树二叉树分区的概念图。
[图4]图4是示出根据本公开的一种或多种技术的视频分量采样格式的示例的概念图。
[图5A]图5A是示出根据本公开的一种或多种技术的包括解块边界的视频数据块的概念图。
[图5B]图5B是示出根据本公开的一种或多种技术的包括解块边界的视频数据块的概念图。
[图6]图6是示出根据本公开的一种或多种技术的解块网格的示例的概念图。
[图7]图7是根据本公开的一种或多种技术的可以用于确定解块参数的表的示例。
[图8]图8是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行编码的视频编码器的示例的框图。
[图9]图9是示出根据本公开的一种或多种技术的可以被配置为对重构视频数据进行滤波的滤波器单元的示例的框图。
[图10]图10是示出根据本公开的一种或多种技术的对视频数据进行滤波的示例的流程图。
[图11A]图11A是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图11B]图11B是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图11C]图11C是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图11D]图11D是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图11E]图11E是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图11F]图11F是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。
[图12]图12是示出根据本公开的一种或多种技术的对视频数据进行滤波的示例的流程图。
[图13]图13是示出根据本公开的一种或多种技术的对视频数据进行滤波的示例的流程图。
[图14]图14是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行解码的视频解码器的示例的框图。
具体实施方式
视频内容通常包括由一系列帧组成的视频序列。一系列帧也可以被称为一组图片(GOP)。每个视频帧或图片可以包括多个片段或片,其中片段或片包括多个视频块。如本文所用,术语视频块通常可以指图片的区域,包括一个或多个视频分量,或者可以更具体地指可以被预测性地编码的像素/样本值的最大阵列,其子分区和/或对应结构。此外,术语当前视频块可以指正被编码或解码的图片的区域。视频块可被定义为可被预测性地编码的像素值(也被称为样本)阵列。视频块可以根据扫描模式(例如,光栅扫描)来排序。视频编码器可对视频块和其子分区执行预测编码。视频块和其子部分可以被称为节点。ITU-T H.264规定了包括16×16亮度样本的宏块。ITU-T H.265规定了类似的编码树单元(CTU)结构,其中图片可以被分割成相同尺寸的CTU,并且每个CTU可以包括具有16×16、32×32或64×64亮度样本的编码树块(CTB)。在ITU-T H.265中,可以根据对应的四叉树块结构将CTU的CTB划分为编码块(CB)。根据ITU-T H.265,一个亮度CB连同两个对应的色度CB(例如,Cr和Cb色度分量)和相关联的语法元素被称为一个编码单元(CU)。在ITU-T H.265中,可以信号传输CB的最小允许尺寸。在ITU-T H.265中,亮度CB的最小允许尺寸是8×8亮度样本。CU与为CU定义一个或多个预测单元(PU)的预测单元(PU)结构关联,其中PU与对应的参考样本相关联。也就是说,在ITU-T H.265中,使用帧内预测或帧间预测对图片区域进行编码的决定在CU级下做出。在ITU-T H.265中,PU可以包括亮度和色度预测块(PB),其中方形PB被支持用于帧内预测,并且矩形PB被支持用于帧间预测。帧内预测数据(例如,帧内预测模式语法元素)或帧间预测数据(例如,运动数据语法元素)可将PU与对应参考样本相关联。
JEM规定了具有256×256亮度样本的最大尺寸的CTU。在JEM中,可根据四叉树加二叉树(QTBT)块结构进一步划分CTU。在JEM中,QTBT结构使四叉树叶节点能够通过二叉树结构进一步分割。在JEM中,二叉树结构使四叉树叶节点能够垂直或水平划分。图2示出了将CTU(例如,具有128×128亮度样本的尺寸的CTU)划分成四叉树叶节点并且根据二叉树将四叉树叶节点进一步划分的示例。也就是说,在图2中,虚线指示二叉树分区。因此,JEM中的二叉树结构实现了方形和矩形叶节点,其中每个叶节点包括用于视频数据的每个分量的编码块(CB)。在JEM中,CB可以用于预测而不需要任何进一步的分割。此外,在JEM中,亮度和色度分量可具有单独的QTBT结构。也就是说,色度CB可独立于亮度分割。在JEM中,对于使用帧内预测技术编码的视频数据片段,启用单独的QTBT结构。图3示出了根据用于亮度分量的QTBT和用于色度分量的独立QTBT划分CTU的示例。如图3中所示,当独立QTBT用于划分CTU时,亮度分量的CB不一定与色度分量的CB对准。
应当注意,JEM包括以下用于QTBT树的信号传输的参数:
CTU尺寸:四叉树的根节点尺寸(例如,256×256、128×128、64×64、32×32、16×16亮度样本);
MinQTSize:最小允许的四叉树叶节点尺寸(例如,16×16、8×8亮度样本);
MaxBTSize:最大允许的二叉树根节点尺寸,即可以通过二进制分割来划分的叶四叉树节点的最大尺寸(例如,64×64亮度样本);
MaxBTDepth:最大允许的二叉树深度,即可以发生二进制分割的最低位阶(例如,3);
MinBTSize:最小允许二叉树叶节点尺寸;即,二进制叶节点的最小宽度或高度(例如,4个亮度样本)。
视频采样格式(也可以称为色度格式)可以相对于CU中包括的亮度样本的数量来定义CU中包括的色度样本的数量。例如,对于4:2:0格式,亮度分量在水平和垂直方向的采样率是色度分量的两倍。因此,对于根据4:2:0格式格式化的CU,用于亮度分量的样本阵列的宽度和高度是用于色度分量的每个样本阵列的宽度和高度的两倍。图4是示出根据4:2:0样本格式格式化的编码单元的示例的概念图。图4示出了色度样本相对于CU内的亮度样本的相对位置。如上所述,通常根据水平和垂直亮度样本的数量来定义CU。因此,如图4所示,根据4:2:0样本格式格式化的16×16CU包括亮度分量的16×16个样本和用于每个色度分量的8×8个样本。此外,在一个示例中,在图4中示出了色度样本相对于用于与16×16相邻的视频块的亮度样本的相对位置。类似地,对于根据4:2:2格式格式化的CU,亮度分量的样本阵列的宽度是每个色度分量的样本阵列宽度的两倍,但亮度分量的样本阵列的高度等于每个色度分量的样本阵列的高度。此外,对于根据4:4:4格式格式化的CU,亮度分量的样本阵列具有与每个色度分量的样本阵列相同的宽度和高度。
包括在当前CU或另一类型的图片区域结构和相关联的参考样本(例如,使用预测生成的那些)中的样本值之间的差可以被称为残差数据。残差数据可以包括对应于视频数据的每个分量(例如,亮度(Y)和色度(Cb和Cr))的相应差值阵列。残差数据可能在像素域中。可对像素差值应用变换诸如离散余弦变换(DCT)、离散正弦变换(DST)、整数变换、小波变换或概念上类似的变换,以生成变换系数。应当注意,在ITU-T H.265中,CU可以进一步细分为变换单元(TU)。也就是说,在ITU-T H.265中,为了生成变换系数,可以对像素差值阵列进行细分(例如,可以将四个8×8变换应用于16×16残差值阵列),对于视频数据的每个分量,此类子分区可以被称为变换块(TB)。当前在JEM中,当使用QTBT分割结构时,对应于CB的残差值用于生成变换系数而无需进一步分割。也就是说,在JEM中,QTBT叶节点可以类似于ITU-T H.265中的PB和TB。因此,JEM使得矩形CB预测能够用于帧内和帧间预测。此外,在JEM中,可以(在编码器中)应用核心变换和后续二次变换来生成变换系数。对于视频解码器,变换的顺序是相反的。此外,在JEM中,是否应用二次变换来生成变换系数可取决于预测模式。
可以对变换系数执行量化处理。量化对变换系数进行缩放以改变发送一组变换系数所需的数据量。量化可包括将变换系数除以量化缩放因子和任何相关联的取整函数(例如,取整为最接近的整数)。量化的变换系数可以被称为系数位阶值或简称为位阶值。逆量化(或“去量化”)可以包括将系数位阶值与量化缩放因子相乘。应当注意,如本文所用,术语量化过程在一些情况下可指除以量化缩放因子以生成位阶值,并且在一些情况下可指乘以量化缩放因子以恢复变换系数。也就是说,量化过程在一些情况下可以指量化,而在一些情况下可以指逆量化。在ITU-T H.265中,量化缩放因子的值(在ITU-T H.265中被称为Q步)可以由量化参数确定。应当注意,如本文所用,术语量化参数可以用于通常指用于确定量化值的参数(例如,量化缩放因子)以及/或者可以用于更具体地指量化参数的具体实现(例如,ITU-T H.265中的Qp′Y)。在ITU-T H.265中,量化参数可以取0到51的52个值,并且量化参数的变化1通常对应于Q步值中约12%的变化。
可以根据熵编码技术(例如,内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)、概率区间划分熵编码(PIPE)等)对量化的变换系数和相关数据进行熵编码。此外,也可以对语法元素(诸如,指示预测模式的语法元素)进行熵编码。熵编码的量化变换系数和对应的熵编码语法元素可形成可用于再现视频数据的合规比特流。可以对语法元素执行二值化处理,将其作为熵编码处理的一部分。二值化是指将语法值转换为一个或多个位的序列的过程。这些位可以被称为“二进制位”。二值化是一个无损过程,并且可以包括以下编码技术中的一种或组合:固定长度编码、一元编码、截断一元编码、截断Rice编码、Golomb编码、k阶指数Golomb编码和Golomb-Rice编码。如本文所用,术语固定长度编码、一元编码、截断一元编码、截断Rice编码、Golomb编码、k阶指数Golomb编码和Golomb-Rice编码中的每一个可以指这些技术的一般实现和/或这些编码技术的更具体实现。例如,可以根据视频编码标准(例如,ITU-T H.265)具体地定义Golomb-Rice编码实施方式。二值化之后,CABAC熵编码器可以选择上下文模型。对于特定箱,可以从与该箱相关联的一组可用上下文模型中选择一个上下文模型。在一些示例中,可以基于先前的箱和/或先前语法元素的值来选择上下文模型。例如,可以基于相邻帧内预测模式的值来选择上下文模型。上下文模型可以识别某个箱为特定值的概率。例如,上下文模型可以指示对0值箱进行编码的概率为0.7,并且对1值箱进行编码的概率为0.3。在选择可用的上下文模型之后,CABAC熵编码器可以基于所识别的上下文模型对箱进行算术编码。需注意,可以使用算术编码对一些语法元素进行熵编码而不使用明确指定的上下文模型,此类编码可以被称为旁路编码。
如上所述,残差数据可以被编码为量化变换系数的阵列。可以将倒数逆量化过程和逆变换应用于量化变换阵列以生成重构的残差数据。可以将重构的残差数据添加到预测视频块以生成重构的视频块。生成重构视频块可以在解码过程期间或在编码过程期间发生。例如,在编码期间,可以使用所得的重构视频块来评估给定预测、变换类型和/或量化位阶的编码质量。在一些情况下,逐块地对视频数据进行编码可能导致所谓的块伪像。也就是说,在一些情况下,用户可以在视觉上察觉重构视频数据的编码块边界。
解块(或去块)、解块滤波或应用解块滤波器是指平滑化相邻重构视频块的边界(即,使得观察者不易察觉到边界)的过程。平滑化相邻重构视频块的边界可以包括修改被包括在邻近边界的行或列中的样本值。图5A至图5B示出了具有解块边界的视频块P和Q中包括的样本值。如本文所用,使用视频块P和Q来指代具有块边界的相邻视频块。修改样本值的方式可以基于定义的滤波器,其中pi和qi表示垂直边界的列中的相应样本值和水平边界的行中的样本值,pi′和qi′表示修改的样本值。ITU-T H.265包括可以用于修改亮度样本的两种类型的滤波器:强滤波器,其修改与边界相邻的三行或列中的样本值;弱滤波器,其修改与边界紧密相邻的行或列中的样本值并且有条件地修改从边界开始的第二行或列中的样本值。下文提供了用于修改亮度样本值的强滤波器和弱滤波器公式的简化定义。简化了定义,因为它们不包括ITU-T H.265中提供的限幅操作,然而,引用了ITU-T H.265中提供了其完整定义的第8.7.2.5.7节。
强滤波器
p0′=(p2+2*p1+2*p0+2*q0+q1+4)/8
p1′=(p2+p1+p0+q0+2)/4
p2′=(2*p3+3*p2+p1+p0+q0+4)/8
q0′=(p1+2*p0+2*q0+2*q1+q2+4)/8
q1′=(p0+q0+q1+q2+2)/4
q2′=(p0+q0+q1+3*q2+2*q3+4)/8
弱滤波器
Δ=(9*(q0-p0)-3*(q1-p1)+8)/16
p0′=p0+Δ
q0′=q0-Δ
其中如下文所述的那样,有条件地修改p1和q1,如下
Δp=((p2+p0+1)/2–p1+Δ)/2
Δq=((q2+p0+1)/2–q1+Δ)/2
p1′=p1+Δp
q1′=q1+Δq
此外,ITU-T H.265包括一种类型的可用于修改色度样本的滤波:正常滤波。下文提供了用于修改色度样本值的正常滤波公式的简化定义。
正常滤波
Δ=((q0+p0)*4+p1-q1+4)/8
p0′=p0+Δ
q0′=q0-Δ
可以基于解块颗粒度来执行解块。ITU-T H.265提供了8×8的解块颗粒度。也就是说,在ITU-T H.265中,对于图片的区域而言,评估位于8×8网格上的每个边缘以确定是否存在边界。图6示出了可能存在的边界条件的示例,例如,对于8×8解块网格的64×64CU中的亮度CB而言。此外,在ITU-T H.265中,确定每个边界的边界强度(Bs)。在ITU-T H.265中,如下确定Bs:
P和Q是两个相邻的编码块,则将滤波器强度Bs指定为:
如果块(P或Q)中的一者具有帧内预测模式,则Bs=2;
另外,如果P和Q属于不同的TB,则P或Q具有至少一个非零
变换系数,则Bs=1;
另外,如果P和Q的参考图片不相同,则Bs=1;
另外,如果P和Q具有不同数量的运动矢量,则Bs=1;
另外,如果P和Q的x运动矢量分量或y运动矢量分量之间的差等于
或大于一个整数样本,则Bs=1;
另外,Bs=0。
在ITU-T H.265中,基于用于对包括视频块P和Q(其可以称为QPP和QPQ)的CB进行编码的量化参数,确定变量tC和β。图7提供了用于确定tC和β的表。在ITU-T H.265中,如下确定Q:
对于亮度:
Q=(QPq+QPp+1)/2+slice_beta_offset_div2*2,其中slice_beta_offset_div2is an offset为
应用于视频数据片段的偏移值。
对于色度:
Q=(QPq+QPP+1)/2+Chroma_QP_Offset+slice_beta_offset_div2*2,其中Chroma_QP_Offset为应用于视频数据片段的QP偏移值。
此外,ITU-T H.265定义了变量d,其中基于亮度样本值确定d,如下:
dp0=Abs(p2,0-2*p1,0+p0,0)
dp3=Abs(p2,3-2*p1,3+p0,3)
dq0=Abs(q2,0-2*q1,0+q0,0)
dq3=Abs(q2,3-2*q1,3+q0,3)
dpq0=dp0+dq0
dpq3=dp3+dq3
dp=dp0+dp3
dq=dq0+dq3
d=dpq0+dpq3
其中Abs(x)是x的绝对值。
在ITU-T H.265中,Bs、tC、β和d中的每一者均用于确定应用哪种类型的滤波器(例如,强滤波器或弱滤波器)。在ITU-T H.265中,对于亮度分量,如果d大于或等于β,则不应用滤波。在ITU-T H.265中,对于亮度分量,如果d小于β,则在条件(dSam0=1&&dSam3=1)得到满足时应用强滤波器,其中&&是逻辑与条件,其中如下确定变量dSam0和dSam3:
如果((dpq0≤(β/4))&&((Abs(p3,0-p0,0)+Abs(q0,0-q3,0)<(β/8))&&(Abs(p0,0-q0,0)<(5*tc+1)/2)),则
dSam0=1;
另外
dSam0=0。
如果((dpq3≤(β/2))&&((Abs(p3,3-p0,3)+Abs(q0,3-q3,3)<(β/8))&&(Abs(p0,3-q0,3)<(5*tc+1)/2)),则
dSam3=1;
另外
dSam3=0。
此外,在ITU-T H.265中,对于亮度分量,如果d小于β并且条件(dSam0=1&&dSam3=1)未得到满足,则应用弱滤波器,其中用于修改p1和q1的条件如下:
如果dp<(β+(β/2))/8,则p1′=p1+Δp;并且
如果dp<(β+(β/2))/8,则q1′=q1+Δq。
在ITU-T H.265中,对于色度分量,仅在Bs等于2时应用正常滤波器。也就是说,在ITU-T H.265中,如果使用帧内预测模式生成块P或Q中的一者,则仅针对色度分量发生解块。应当注意,JEM实现与ITU-T H.265中提供的解块配置相同的基本解块配置。如ITU-TH.265和JEM中提供的那样执行解块可能不太理想。在一些情况下,以ITU-T H.265和JEM中提供的方式对色度分量进行解块可能不太理想。
图1是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行编码(例如,编码和/或解码)的系统的示例的框图。系统100表示可以根据本公开的一种或多种技术对重构视频数据进行解块的系统的示例。如图1所示,系统100包括源设备102、通信介质110和目标设备120。在图1所示的示例中,源设备102可以包括被配置为对视频数据进行编码并将编码的视频数据传送到通信介质110的任何设备。目标设备120可以包括被配置为经由通信介质110接收编码的视频数据并且对编码的视频数据进行解码的任何设备。源设备102和/或目标设备120可以包括配备用于进行有线和/或无线通信的计算设备,并且可以包括机顶盒、数字视频录像机、电视机、台式电脑、膝上型电脑或平板电脑、游戏控制台、移动设备,包括例如“智能”电话、蜂窝电话、个人游戏设备和医学成像设备。
通信介质110可以包括无线和有线通信介质和/或存储设备的任意组合。通信介质110可以包括同轴电缆、光纤电缆、双绞线电缆、无线发射器和接收器、路由器、交换机、中继器、基站或可用于促进各种设备和站点之间的通信的任何其他设备。通信介质110可以包括一个或多个网络。例如,通信介质110可以包括被配置为允许访问万维网例如互联网的网络。网络可以根据一个或多个电信协议的组合来运营。电信协议可以包括专有方面和/或可以包括标准化电信协议。标准化电信协议的示例包括数字视频广播(DVB)标准、高级电视系统委员会(ATSC)标准、综合服务数字广播(ISDB)标准、有线数据业务接口规范(DOCSIS)标准、全球移动通信系统(GSM)标准、码分多址(CDMA)标准、第三代合作伙伴计划(3GPP)标准、欧洲电信标准协会(ETSI)标准、互联网协议(IP)标准、无线应用协议(WAP)标准以及电气与电子工程师协会(IEEE)标准。
存储设备可以包括能够存储数据的任何类型的设备或存储介质。存储介质可以包括有形或非暂态计算机可读介质。计算机可读介质可以包括光盘、闪存、磁存储器或任何其他合适的数字存储介质。在一些示例中,存储器设备或其部分可以被描述为非易失性存储器,并且在其他示例中,存储器设备的部分可以被描述为易失性存储器。易失性存储器的示例可以包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)和静态随机存取存储器(SRAM)。非易失性存储器的示例可以包括磁性硬盘、光盘、软盘、闪存或电可编程存储器(EPROM)或电可擦除和可编程(EEPROM)存储器的形式。存储设备可以包括存储卡(例如,安全数字(SD)存储卡)、内部/外部硬盘驱动器和/或内部/外部固态驱动器。数据可以根据定义的文件格式存储在存储设备上。
再次参考图1,源设备102包括视频源104、视频编码器106和接口108。视频源104可以包括被配置为捕获和/或存储视频数据的任何设备。例如,视频源104可以包括摄像机和可操作地与其耦接的存储设备。视频编码器106可以包括被配置为接收视频数据并生成表示视频数据的合规比特流的任何设备。合规比特流可以指视频解码器可以从其接收和再现视频数据的比特流。合规比特流的各方面可根据视频编码标准来定义。当生成合规比特流时,视频编码器106可以压缩视频数据。压缩可能是有损的(可觉察的或不可觉察的)或无损的。接口108可以包括被配置为接收合规视频比特流并且将该合规视频比特流传送和/或存储到通信介质的任何设备。接口108可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可以发送和/或接收信息的任何其他类型的设备。此外,接口108可以包括计算机系统接口,其可以使得合规视频比特流能够存储在存储设备上。例如,接口108可以包括支持外围组件互连(PCI)和外围组件快速互连(PCIe)总线协议、专用总线协议、通用串行总线(USB)协议、I2C或任何其他可用于互连对等设备的逻辑和物理结构。
再次参考图1,目标设备120包括接口122、视频解码器124和显示器126。接口122可以包括被配置为从通信介质接收合规视频比特流的任何设备。接口108可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可以接收和/或发送信息的任何其他类型的设备。此外,接口122可以包括使得能够从存储设备检索合规视频比特流的计算机系统接口。例如,接口122可以包括支持PCI和PCIe总线协议、专用总线协议、USB协议、I2C的芯片组或可用于互连对等设备的任何其他逻辑和物理结构。视频解码器124可以包括被配置为接收合规比特流和/或其可接受变体且从其中再现视频数据的任何设备。显示器126可以包括被配置为显示视频数据的任何设备。显示器126可以包括各种显示设备诸如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一种类型的显示器中的一者。显示器126可以包括高清显示器或超高清显示器。应当注意,尽管在图1所示的示例中,视频解码器124被描述为将数据输出到显示器126,但视频解码器124可以被配置为将视频数据输出到各种类型的设备和/或其子部件。例如,视频解码器124可以被配置为将视频数据输出到任何通信介质,如本文所述。
图8是示出可实现本文所述的用于编码视频数据的技术的视频编码器200的示例的框图。应当注意,尽管示例性视频编码器200被示出为具有不同的功能块,但此类图示旨在用于描述目的,并且不将视频编码器200和/或其子部件限制为特定的硬件或软件架构。可使用硬件、固件和/或软件具体实施的任何组合来实现视频编码器200的功能。在一个示例中,视频编码器200可以被配置为根据本文所述的技术对视频数据进行编码。视频编码器200可以执行图片区域的帧内预测编码和帧间预测编码,并且因此可以被称为混合视频编码器。在图8所示的示例中,视频编码器200接收源视频块。在一些示例中,源视频块可以包括已经根据编码结构划分的图片区域。例如,源视频数据可包括宏块、CTU、CB、其子分区和/或另一等效编码单元。在一些示例中,视频编码器可被配置为执行源视频块的额外再分。应当注意,本文描述的技术通常适用于视频编码,而不管在编码之前和/或期间如何分割源视频数据。在图8所示的示例中,视频编码器200包括求和器202、变换系数生成器204、系数量化单元206、逆量化/变换处理单元208、求和器210、帧内预测处理单元212、帧间预测处理单元214、滤波器单元216和熵编码单元218。如图8所示,视频编码器200接收源视频块并输出比特流。
在图8所示的示例中,视频编码器200可以通过从源视频块中减去预测视频块来生成残差数据。求和器202表示被配置为执行该减法运算的部件。在一个示例中,减去视频块出现在像素域中。变换系数生成器204对残差块或其子分区应用变换诸如离散余弦变换(DCT)、离散正弦变换(DST)或概念上类似的变换(例如,可以将四个8×8变换应用于16×16残差值阵列)以产生残差变换系数集合。变换系数生成器204可以被配置为执行离散三角变换系列中包括的变换的任意和全部组合。变换系数生成器204可以将变换系数输出到系数量化单元206。
系数量化单元206可以被配置为执行变换系数的量化。如上所述,可以通过调整量化缩放因子来修改量化程度,其中量化缩放因子可以通过量化参数来确定。系数量化单元206可被进一步配置为确定量化值并输出QP数据,该QP数据可以由视频解码器用于重构量化参数(并且因此重构量化缩放因子),以在视频解码期间执行逆量化。例如,信号传输的QP数据可以包括QPΔ值。在ITU-T H.265中,应用于变换系数集合的量化程度可以取决于:片段级参数、从先前编码单元继承的参数以及/或者可选地信号传输的CU级Δ值。
如图8所示,量化的变换系数被输出到逆量化/变换处理单元208。逆量化/变换处理单元208可以被配置为应用逆量化和/或逆变换来生成重构的残差数据。如图8所示,在求和器210处,重构的残差数据可以被添加到预测视频块。这样,可以重构编码的视频块,并且可以使用所得的重构视频块来评估给定预测、变换类型和/或量化位阶的编码质量。视频编码器200可以被配置为执行多个编码回合(例如,在改变一个或多个编码参数的同时执行编码)。比特流的率失真或其他系统参数可以基于重构的视频块的评估来优化。此外,重构的视频块可被存储并用作预测后续块的参考。
如上所述,可以使用帧内预测来编码视频块。帧内预测处理单元212可以被配置为针对待编码视频块选择帧内预测模式。帧内预测处理单元212可以被配置为评估帧和/或其区域,并且确定用于对当前块进行编码的帧内预测模式。如图8所示,帧内预测处理单元212将帧内预测数据(例如,语法元素)输出到滤波器单元216和熵编码单元218。在ITU-T H.265中,定义的可能的帧内预测模式包括平面(即表面拟合)预测模式(predMode:0)、DC(即平坦整体平均)预测模式(predMode:1)和33个角预测模式(predMode:2-34)。在JEM中,定义的可能的帧内预测模式包括平面预测模式(predMode:0)、DC预测模式(predMode:1)以及65个角预测模式(predMode:2-66)。应当注意,平面预测模式和DC预测模式可以被称为无方向预测模式,并且角预测模式可以被称为方向预测模式。应当注意,无论定义的可能预测模式的数量如何,本文描述的技术通常都是适用的。此外,在一些示例中,可以从用于亮度预测模式的帧内预测推断出对色度分量的预测。
帧间预测处理单元214可以被配置为针对当前视频块执行帧间预测编码。帧间预测处理单元214可以被配置为接收源视频块并且计算视频块的PU等的运动向量。运动向量可以指示当前视频帧内的视频块的PU等相对于参考帧内的预测块的位移。帧间预测编码可以使用一个或多个参考图片。此外,运动预测可以是单向预测(使用一个运动向量)或双向预测(使用两个运动向量)。帧间预测处理单元214可以被配置为通过计算由例如绝对差之和(SAD)、平方差之和(SSD)或其他差值度量确定的像素差来选择预测块。运动向量和相关数据可以描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度)、预测方向和/或参考图片索引值。此外,编码标准,诸如ITU-T H.265,可以支持运动向量预测。运动向量预测使得能够使用相邻块的运动向量来指定运动向量。运动矢量预测的示例包括高级运动矢量预测(AMVP)、时间运动矢量预测(TMVP)、所谓的“合并”模式,以及“跳过”和“直接”运动推理。
此外,JEM支持高级时间运动矢量预测(ATMVP)、空间-时间运动矢量预测(STMVP)和高级运动矢量分辨率(AMVR)模式。此外,JEM支持重叠块运动补偿(OBMC)。因此,与ITU-TH.265相比,JEM利用高级帧间预测模式。在JEM中,OBMC将CB划分为子块,以便确定每个子块的运动矢量信息。也就是说,如果为CB提供运动矢量,则OBMC允许为CB提供特定子块的附加运动矢量信息。例如,可以将具有128×128个样本的CB划分为4×4个子块,并且位于CB的边界处的子块可以包括附加运动矢量信息。在一些示例中,附加运动矢量信息可以从位于另一CB中的相邻子块中继承。例如,可以作为与相邻子块相关联的预测块的加权平均,生成用于子块的预测块。如本文所用,OBMC通常可以指帧间预测技术,其中CB的子块包括比为CB提供的预测信息更精细的预测信息,或者可以更具体地指JEM中所描述的OBMC技术。应当注意,JEM使用术语运动补偿(MC)块作为与OBMC描述中的CB相对应的结构。此外,在JEM中,针对形成CB的顶部和左边界的子块执行OBMC。此外,在JEM中,可以针对亮度分量和色度分量两者应用OBMC。在JEM中,当用子CU模式(其可以包括子CU合并、仿射和帧率上转换(FRUC)模式)对CU进行编码时,CU的每个子块是MC块。
帧间预测处理单元214可以被配置为根据上文所述技术中的一种或多种来执行运动向量预测。帧间预测处理单元214可以被配置为使用运动预测数据来生成预测块。例如,帧间预测处理单元214可以定位帧缓冲器内的预测视频块(图8中未示出)。应当注意,帧间预测处理单元214可以被进一步被配置为将一个或多个内插滤波器应用于重构的残差块,以计算用于运动估计的子整数像素值。帧间预测处理单元214可以将所计算的运动向量的运动预测数据输出到滤波器单元216和熵编码单元218。
如上所述,解块是指平滑化重构视频块的边界的过程。如图8所示,滤波器单元216接收重构的视频块和编码参数,并且输出修改的重构视频数据。滤波器单元216可以被配置为执行解块和/或样本自适应偏移(SAO)滤波。SAO滤波是一种可用于通过向重构的视频数据添加偏移以改善重构的非线性振幅映射。应当注意,如图8所示,帧内预测处理单元212和帧间预测处理单元214可以经由滤波器单元216接收修改的重构视频块。也就是说,在一些情况下,解块可以在循环中发生,即,可以对存储在参考缓冲器中的预测视频块进行滤波。在一些情况下,解块可以在循环后发生,即,例如,在重构视频数据之后且在将其输出到显示器之前。本文所述的技术适用于循环中解块,循环后解块和/或两者的组合。
图9是示出根据本公开的一种或多种技术的可以被配置为对重构视频数据进行滤波的滤波器单元的示例的框图。如图9所示,滤波器单元300包括滤波器确定单元302和样本修改单元304。滤波器确定单元302可以被配置为接收编码参数和分量视频数据,并且确定待应用于分量视频数据的滤波器的类型。例如,滤波器确定单元302可以被配置为基于样本值和编码参数(例如,QP值、预测参数等)来确定Bs、tC、β和d中的一者或多者,例如,如上文所描述的那样。滤波器确定单元302可以将确定的滤波器类型(例如,强滤波器)输出到样本修改单元304。在一些情况下,确定的滤波器类型可以是跳过条件,例如,不针对边界进行解块。样本修改单元304可以被配置为接收分量视频数据(例如,亮度和/或色度样本值)和滤波器类型并且输出修改的视频数据。也就是说,样本修改单元304可以包括存储与定义的滤波器类型相对应的公式(例如,上文提供的强、弱和/或正常滤波器公式)的存储器,并且可以将相应的一组公式应用于所接收到的样本值的每个分量。
如上所述,在ITU-T H.265和JEM中,如果Bs=2,则仅发生针对色度分量的解块。在一些情况下,在更多情况下对色度分量应用解块可能是有益的。在一个示例中,滤波器单元300可以被配置为根据本文所述的技术对色度分量和/或亮度分量进行解块。图10是示出根据本公开的一种或多种技术的对视频数据进行滤波的示例的流程图。相对于图10所述的对视频数据进行滤波的示例可以应用于视频数据的亮度和/或色度分量。应当注意,尽管图10是相对于滤波器单元300进行描述的,但可以使用硬件、固件和/或软件具体实施的任何组合来在系统中实现所述技术。此外,应当注意,相对于图10以及本文所述的其他流程图而言,滤波器单元300可以被配置为执行所示决策和所得结果中的一部分。例如,滤波器单元300可以被配置为基于块尺寸条件来执行滤波或跳过滤波。
参考图10,滤波器单元300接收视频数据和编码参数(1000)。在一个示例中,滤波器单元300可以接收用于图片区域的重构视频块(例如,用于视频的一个或多个分量的样本值)和相关编码参数(例如,定义QTBT的标记、预测参数、QP等)。对于图片区域内的区域,滤波器单元300可以确定是否发生边界条件(1002)。也就是说,如上所述,可以定义解块颗粒度,可以将解块网格应用于图片区域,并且可以将解块网格上的CB边界识别为满足边界条件。应当注意,在一些情况下,滤波器单元300可以被配置为针对亮度或色度样本应用8×8解块网格,如上所述,或者应用更精细(例如,4×4)或更粗糙(例如,16×16)的解块网格。在一个示例中,滤波器单元300可以被配置为基于CTU尺寸来确定解块网格的颗粒度。例如,对于具有大于或等于128×128的CTU尺寸的视频数据片段,解块粒度可以是16×16,并且对于具有小于128×128的CTU尺寸的视频数据片段,解块粒度可以是16×16。如上所述,当边界条件得到满足时,可以定义视频块P和Q以用于随后的解块操作。
在1004处,在边界条件得到满足时,滤波器单元300可以确定第一预测条件是否得到满足。在一个示例中,第一预测条件可以是视频块P或Q中的任一者是否被包括在使用帧内预测模式生成的CB中。如上所述,ITU-T H.265规定,如果块P或Q中一者具有帧内预测模式,则边界强度变量Bs被设置为等于2。在一些示例中,第一预测条件可以对应于等于2的Bs或类似的边界强度变量。
如图10所示,在确定第一预测条件未得到满足时,滤波器单元300可以确定第二预测条件是否得到满足(1006)。在一个示例中,第二预测条件可以是一组条件中的任何条件是否得到满足。在一个示例中,这组条件可以包括上文相对于ITU-T H.265描述的条件中的一个或多个,使得Bs等于1。然而,应当注意,在一些示例中,可以将更少、更多或不同组的条件用于第二预测条件。例如,在一个示例中,仅当用于P和Q的参考图片不相同时,第二预测条件才可以得到满足。此外,在一些示例中,仅当特定类型的帧间预测编码模式用于视频块P或Q的重构时,第二预测条件才可以得到满足。此外,在一些示例中,以下附加条件中的一者或多者可以用于第二预测条件:
如果P和Q之间的帧间预测模式不同,则条件得到满足。
如果P和Q之间的运动向量分辨率不同,则条件得到满足。
应当注意,在以下任何情况下,帧间预测模式可以是不同的:P和Q均使用合并模式,但是使用了不同的合并候选列表。例如,P使用空间合并候选列表并且Q使用时间合并候选列表;P使用sub_block_mode合并候选列表(ATMVP和STMVP)并且Q使用其他候选列表;P或Q中的一者使用合并模式,另一者使用AMVP模式。
在一个示例中,滤波器单元300可以指定如上所述的Bs变量,并且图10中的第一预测条件可以对应于等于2的Bs,图10中的第二预测条件可以对应于等于1的Bs。在一个示例中,基于上文相对于I-ITU H.265所述的条件,Bs可以等于2、等于1或等于0。此外,在一个示例中,滤波器单元300可以被配置为如下确定边界强度:
P和Q是两个相邻的编码块,则将滤波器强度Bs指定为:
如果块(P或Q)中的一者具有帧内预测模式,则Bs=2;
如果使用OBMC将块(P或Q)中的一者包括在CU中,则Bs=0;
另外,如果P和Q属于不同的TB,则P或Q具有至少一个非零变换系数,则Bs=1;
另外,如果P和Q的参考图片不相同,则Bs=1;
另外,如果P和Q具有不同数量的运动矢量,则Bs=1;
另外,如果P和Q的x运动矢量分量或y运动矢量分量之间的差等于或大于一个整数样本,则Bs=1;
另外,如果P和Q之间的量化参数不相等,则Bs=1;
另外,Bs=0。
如上所述,在JEM中,OBMC可以对应于使用子CB模式对CB进行编码的情况。因此,在上文Bs的示例性导出中,如果使用如JEM中所提供的子CB帧间预测编码模式来生成视频块P或Q中的任一者,则可以跳过解块。
如图10所示,在确定第二预测条件得到满足时,滤波器单元300确定块尺寸条件是否得到满足(1008)。也就是说,滤波器单元300可以确定包括视频块P或Q的CB是否满足尺寸条件。图11A至图11F是示出根据本公开的一种或多种技术的具有边界条件的编码块的尺寸的示例的概念图。在图11A至图11F所示的每一个示例中,包括块P的CB具有相同的尺寸(例如,8×8),并且包括块Q的CB的尺寸变化。图11A至图11F所示的示例示出了可以基于上文相对于JEM所述的QTBT结构生成的各种CB尺寸和形状。例如,比较图11C与图11D,尽管图11C和图11D中包括Q的每个CB均具有相同的高度(例如,16),但图11D中的矩形可能引起更易让人察觉到的块伪像。因此,可能期望仅在图11D所示的情况下应用解块,或者,更一般地讲,与在图11C的情况下相比,在图11D的情况下,应用更强的解块滤波器(例如,修改更多列中的样本值)。
在一个示例中,块条件可以是块P和Q中的一者或两者是否被包括在满足最小尺寸条件的CB中。可以基于以下公式中的一者或多者来确定最小尺寸条件:
PW>N1&&PH>N2;
QW>N3&&QH>N4;
Max(PW,PH)>N5;
Max(QW,QH)>N6;
Max(PW,PH)>N7&&Max(QW,QH)>N8;
Min(PW,PH)>N9;
Min(QW,QH)>N10;
Min(PW,PH)>N11&&Min(QW,QH)>N12;
PW*PH>N13;
QW*QH>N14;
PW*PH>N15&&QW*QH>N16;
其中,
Pw是包括块P的CB的样本的宽度,
PH是包括块P的CB的样本的高度,
Qw是包括块Q的CB的样本的宽度,
QH是包括块Q的CB的样本的高度,
如果x>y,else y,则Max(x,y)返回到x,
如果x<y,else y,则Min(x,y)返回到x,并且
N1至N16是预定义的阈值(例如,8、16、32、64、128、256、512、1024等)。
应当注意,在一些示例中,N1至N16中的任一者可以基于上文所述的CTU尺寸和/或其他QTBT参数。例如,更大的CTU尺寸可以对应于更大的阈值。例如,如果CTU尺寸是256×256,则N13可以等于1024,并且如果CTU尺寸是128×128,则N13可以等于512。此外,应当注意,在一些示例中,可以例如使用片段级参数来信号传输N1至N16的值。
再次参考图10,如果以下条件中的任一者未得到满足:边界条件、第二预测条件或块尺寸条件,则滤波器单元300跳过解块(1010)。如图10中进一步所示,在确定第一预测条件得到满足或块尺寸条件得到满足时,可以应用第一滤波器类型、第二滤波器类型或第三滤波器类型中的一者。因此,在其中图10所示技术应用于色度分量的情况下,当使用帧内预测模式生成的CB中包括视频块P或Q中的任一者时并且当在一些情况下使用帧内预测模式生成的CB中不包括视频块P或Q中的任一者时(例如,当附加条件得到满足时),可以对色度分量进行解块。因此,在与ITU-T H.265和JEM中所述技术相比的另外情况下,滤波器单元300可以被配置为将解块应用于色度分量视频数据。
再次参考图10,在确定第一预测条件得到满足或块尺寸条件得到满足时,滤波器单元300确定第一样本值条件是否得到满足(1012)。如果第一样本值条件未得到满足,则滤波器单元300跳过解块(1010)。如上所述,在ITU-T H.265中,条件d<β用于确定是否应用解块。也就是说,如果d大于或等于β,则不应用解块。在一个示例中,第一样本条件可以包括条件d<β,其中如上所述确定d和β,并且如果条件d<β未得到满足,则跳过解块。此外,在一个示例中,滤波器单元300可以被配置为基于以下公式来确定d:
dp0=Abs(p2,0-2*p1,0+p0,0)
dp1=Abs(p2,1-2*p1,1+p0,1)
dq0=Abs(q2,0-2*q1,0+q0,0)
dq1=Abs(q2,1-2*q1,1+q0,1)
dpq0=dp0+dq0
dpq1=dp1+dq1
dp=dp0+dp1
dq=dq0+dq1
d=dpq0+dpq1
这样,滤波器单元300可以基于与边界相邻的两行或列来确定d。应当注意,以这种方式确定d对于色度解块可能是有用的。因此,在一个示例中,滤波器单元300可以被配置为使用如上文相对于ITU-T H.265所述的公式来确定用于亮度分量的d,并且使用不同组的等式来确定用于色度分量的d。此外,应当注意,在一些情况下,可以基于除图7中所示的表之外的表来确定β。例如,可能存在使得β等于0的另外QP值,这将使得满足d<β条件的情况更少。应当注意,在d<β条件下,d可以被一般化为基于样本值确定的估计块效应参数,并且β可以被一般化为编码质量参数。也就是说,低值d对应于高估计块效应,高值β对应于低编码质量。这样,在相对高的估计块效应(例如,d=0)和相对低的编码质量(例如,β=64)的情况下,可能存在解块伪像。因此,第一样本值条件可以对应于存在块伪像的可能性。在一些示例中,存在块伪像的可能性可以基于除d<β之外的条件。在一些示例中,第一样本值条件可以简单地确定P和Q的量化参数(QPP和QPQ)的平均值是否大于阈值。在一些示例中,可以将d与预先确定的阈值或提供编码质量的指示的另一参数进行比较。
再次参考图10,在确定第一样本值条件得到满足时,滤波器单元300确定第二样本值条件是否得到满足(1014),并且如果第二样本值条件得到满足,则应用第一滤波器类型(1016)。在一个示例中,第一滤波器类型可以包括上文所述的强滤波器。更一般地讲,第一滤波器类型可以包括与由滤波器单元300应用的其他滤波器类型相比使得最大数量的样本值被修改的滤波器类型。例如,第一滤波器类型可以使得与边界相邻的3(或4)列被修改,并且其他滤波器类型可以使得与边界相邻的更少列被修改。在一个示例中,第一滤波器类型可以基于以下公式来定义:
强滤波器2
ci=Ai*tc+Bi,
其中Ai和Bi是预先确定的值。在一些示例中,Ai和/或Bi的值可以基于样本的位置。此外,应当注意,在一些示例中,用于导出ci的公式可以是位置相关的。例如,尽管ci被示出为线性函数,但在一些示例中,不同的函数可以用于一些样本值(例如,i>1)。应当注意,ci可以称为限幅阈值。
其中,在一些示例中,可以如上所述的那样确定tC,或者在一些示例中,tC可以是QPP和QPQ的不同函数。
p0′=Clip(p0-c0,p0+c0,(p0+q0)/2);
p1′=Clip(p1-c1,p1+c1,(p1+q1)/2);
p2′=Clip(p2-c2,p2+c2,(p2+q2)/2);
p3′=Clip(p3-c3,p3+c3,(p3+q3)/2);
p0′=Clip(p0-c0,p0+c0,(p0+q0)/2);
q0′=Clip(q0-c0,q0+c0,(p0+q0)/2);
q1′=Clip(q1-c1,q1+c1,(p1+q1)/2);
q2′=Clip(q2-c2,q2+c2,(p2+q2)/2);
q3′=Clip(q3-c3,q3+c3,(p3+q3)/2);
其中Clip(x,y,z),如果x<z<y,则返回到z;
如果z小于或等于x,则返回到x;或者
如果z大于或等于y,则返回到y。
应当注意,关于强滤波器2,除(pi+qi)/2之外的函数可以用作Clip(x,y,z)函数中的z,以确定p0′和/或q0′。例如,可以使用函数诸如Abs(2*pi-qi)。
在第一滤波器类型对应于上述强滤波器或强滤波器2的情况下,在一些情况下,第二样本值条件可以包括上述(dSam0=1&&dSam3=1)条件。在一个示例中,第二样本值条件可以基于以下条件中的一者或多者:
条件1:Abs(p2-2*p1+p0)+Abs(q2-2*q1+q0)<(β/8);
条件2:Abs(p3-p0)+Abs(q3-q0)<(β/8);并且
条件3:Abs(p0-q0)<(2.5*tc);
其中,在一些示例中,可以如上所述的那样确定β和tC,或者在一些示例中,β可以是QPP和QPQ的不同函数且tC可以是QPP和QPQ的不同函数。
在一个示例中,如果以下条件得到满足,则第二样本值条件可以得到满足:
条件1&&条件2&&条件3&&(P最小尺寸条件)
在一个示例中,如果以下条件得到满足,则第二样本值条件可以得到满足:
条件1&&条件2&&条件3&&(Q最小尺寸条件)
在一个示例中,如果以下条件得到满足,则第二样本值条件可以得到满足:
条件1&&条件2&&条件3&&((P最小尺寸条件)或(Q最小尺寸条件))
在一个示例中,如果以下条件得到满足,则第二样本值条件可以得到满足:
条件1&&条件2&&条件3&&((P最小尺寸条件)&&(Q最小尺寸条件))
应当注意,最小尺寸条件可以包括上述最小尺寸条件(例如,PW>N1&&PH>N2)。在一个示例中,如果以下条件得到满足,则第二示例性值条件可以得到满足:
条件1&&条件2&&条件3&&(Max(PW,QW)>N17&&Max(PH,QH)>N18;
其中N17和N18是预定义的阈值。
再次参考图10,在确定第二样本值条件未得到满足时,滤波器单元300确定第三样本值条件是否得到满足(1018)。基于第三样本值条件是否得到满足,应用第二滤波器类型(1020)或应用第三滤波器类型(1022)。在一个示例中,第二滤波器类型可以包括上文所述的弱滤波器,其中两个相邻行或列中的样本值被修改。在一个示例中,第三滤波器类型可以包括上文所述的弱滤波器,其中一个相邻行或列中的样本值被修改。在一个示例中,第三滤波器类型可以包括上文所述的正常滤波器。
在一个示例中,第三样本值条件可以是(条件4&&条件5),其中如下定义条件4和条件5:
条件4:Abs(p2,0-2*p1,0+p0,0)+Abs(p2,1-2*p1,1+p0,1)<3*β/16;并且
条件5:Abs(q2,0-2*q1,0+q0,0)+Abs(q2,1-2*q1,1+q0,1)<3*β/16,
其中,在一些示例中,可以如上所述的那样确定β,或者在一些示例中,β可以是QPP和QPQ的不同函数。
这样,如图10所示,滤波器单元300可以被配置为有条件地跳过解块或者将第一滤波器类型、第二滤波器类型或第三滤波器类型中的一者应用于视频数据分量的重构视频块。应当注意,在一些示例中,滤波器单元300可以被配置为如I-ITU H.265中所提供的那样对色度分量进行解块或者根据上文相对于图10所述的技术对色度分量进行解块。在一个示例中,可在片段级别、序列参数集(SPS)级别或图片参数集(PPS)级别中的一者下信号传输标记,以(例如,向视频解码器)指示如何对色度分量进行解块。例如,标记可以指示是否应用了如I-ITU H.265中所提供的解块或是否应用了根据上文相对于图10所述的技术的解块。
此外,在一些示例中,图10所示的技术中可以包括附加条件。图12是示出对视频数据进行滤波的示例的流程图,其中第四滤波器类型可以用于解块(1026)。在一个示例中,第四滤波器类型可以包括上文所述的强滤波器2,并且第一滤波器类型可以包括上文所述的强滤波器。在一个示例中,第二块尺寸条件(1024)可以包括用于上述视频块P和/或Q的任何最小尺寸条件。图13是示出对视频数据进行滤波的示例的流程图,其中考虑附加条件以确定第一滤波器类型是否用于解块。如图13所示,在1028处评估帧间预测条件,以确定是否应用第一滤波器类型。如上所述,JEM支持高级(与I-ITU H.265相比)帧间预测模式,诸如OBMC。在一些情况下,可能期望仅在未使用高级帧间预测模式的情况下应用解块,或者更一般地讲,在使用高级帧间预测模式的情况下应用较弱的解块滤波器(例如,在较少的列或行中修改样本值)。例如,如上所述,在JEM中,针对形成CB的顶部和左边界的子块执行OBMC。以这种方式执行OBMC可以导致块伪像减少,并且因此,在这种情况下,可能期望应用比在未执行OBMC的情况下应用的解块滤波器更弱的解块滤波器。图13中的帧间预测条件可以对应于高级帧间预测模式的使用。例如,如JEM 3.0中所述的,子CB运动矢量预测、自适应运动矢量差分分辨率、OBMC、局部照明补偿、仿射运动补偿预测、模式匹配运动矢量导出或双向光流中的一者或多者。此外,应当注意,在一些示例中,对于亮度分量和色度分量而言,帧间预测条件可以是不同的。此外,在一些示例中,帧间预测条件可以在片段级别、SPS级别或PPS级别下信号传输。
再次参考图8,熵编码单元218接收量化变换系数和预测语法数据(即,帧内预测数据、运动预测数据、QP数据等)。应当注意,在一些示例中,系数量化单元206可以在将系数输出到熵编码单元218之前执行对包括量化变换系数的矩阵的扫描。在其他示例中,熵编码单元218可以执行扫描。熵编码单元218可以被配置为根据本文所述的技术中的一种或多种执行熵编码。熵编码单元218可以被配置为输出合规比特流(即视频解码器可从其接收和再现视频数据的比特流)。如上所述,标记可以用于指示是否和/或如何执行解块。可以在比特流中信号传输这些标志的值。此外,视频解码器用于确定解块参数的一个或多个值可以被包括在比特流中。
图14是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行解码的视频解码器的示例的框图。在一个示例中,视频解码器400可以被配置为基于上文所述的技术中的一种或多种来执行对重构视频数据的解块。视频解码器400可以被配置为执行帧内预测解码和帧间预测解码,并且因此可被称为混合解码器。在图14所示的示例中,视频解码器400包括熵解码单元402、逆量化单元404,逆变换处理单元406、帧内预测处理单元408、帧间预测处理单元410、求和器412、滤波器单元414、参考缓冲器416和缩放单元418。视频解码器400可以被配置为以与视频编码系统一致的方式对视频数据进行解码,该视频编码系统可以实现视频编码标准的一个或多个方面。应当注意,尽管示例性视频解码器400被示出为具有不同的功能块,但此类图示旨在用于描述目的,并且不将视频解码器400和/或其子部件限制为特定的硬件或软件架构。可使用硬件、固件和/或软件具体实施的任何组合来实现视频解码器400的功能。
如图14所示,熵解码单元402接收熵编码的比特流。熵解码单元402可以被配置为根据与熵编码过程互逆的过程从比特流中解码语法元素和量化系数。熵解码单元402可以被配置为根据上文所述的任何熵编码技术来执行熵解码。熵解码单元402可以以与视频编码标准一致的方式解析编码的比特流。
再次参考图14,逆量化单元404从熵解码单元402接收量化变换系数(即,位阶值)和量化参数数据。量化参数数据可包括上面描述的增量QP值和/或量化组尺寸值等的任何和所有组合。视频解码器400和/或逆量化单元404可以被配置为基于由视频编码器信号传输的值以及/或者通过视频属性和/或编码参数来确定用于逆量化的量化值。也就是说,逆量化单元404可以以与上述系数量化单元206互逆的方式操作。逆量化单元404可以被配置为应用逆量化。逆变换处理单元406可以被配置为执行逆变换以生成重构的残差数据。由逆量化单元404和逆变换处理单元406分别执行的技术可以类似于由上述逆量化/变换处理单元208执行的技术。逆变换处理单元406可以被配置为应用逆DCT、逆DST、逆整数变换、不可分二次变换(NSST)或概念上类似的逆变换过程来变换系数,以便产生像素域中的残差块。此外,如上所述,是否执行特定变换(或特定变换的类型)可以取决于帧内预测模式。如图14所示,可以将重构的残差数据提供给求和器412。求和器412可以将重构的残差数据添加到预测视频块并且生成重构的视频数据。可根据预测视频技术(即帧内预测和帧间预测)确定预测视频块。
帧内预测处理单元408可以被配置为接收帧内预测语法元素并且从参考缓冲器416检索预测视频块。参考缓冲器416可以包括被配置为存储一个或多个视频数据帧的存储器设备。帧内预测语法元素可识别帧内预测模式,诸如上述的帧内预测模式。在一个示例中,帧内预测处理单元408可以使用根据本文所述的帧内预测编码技术中的一种或多种来重构视频块。帧间预测处理单元410可以接收帧间预测语法元素并生成运动向量,以识别存储在参考缓冲器416中的一个或多个参考帧中的预测块。帧间预测处理单元410可以生成运动补偿块,可能基于内插滤波器执行内插。用于具有子像素精度的运动估计的内插滤波器的标识符可以被包括在语法元素中。帧间预测处理单元410可以使用内插滤波器来计算参考块的子整数像素的内插值。滤波器单元414可以被配置为根据本文所述的技术对重构的视频数据执行滤波。例如,滤波器单元414可被配置为执行解块和/或SAO滤波,如上文相对于滤波器单元216和滤波器单元300所描述的。此外,应当注意,在一些示例中,滤波器单元414可以被配置为执行专用的任意滤波(例如,视觉增强)。如图4所示,视频解码器400可以输出重构的视频块。
在一个或多个示例中,所描述的功能可以通过硬件、软件、固件或其任何组合来实现。如果以软件实现,则可将功能作为一个或多个指令或代码存储在计算机可读介质上或经由计算机可读介质上传输,并且由基于硬件的处理单元执行。计算机可读介质可包括对应于有形介质诸如数据存储介质的计算机可读存储介质,或者包括例如根据通信协议促进计算机程序从某个地方传输到另一个地方的任何介质的传播介质。这样,计算机可读介质通常可对应于:(1)非暂态的有形计算机可读存储介质,或者(2)通信介质诸如信号或载波。数据存储介质可以是可以由一个或多个计算机或一个或多个处理器访问以检索用于实现本公开中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。
以举例而非限制的方式,此类计算机可读存储介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储设备、磁盘存储设备或其他磁存储设备、闪存,或者可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其他介质。而且,任何连接都被适当地称为计算机可读介质。例如,如果使用同轴电缆、光纤电缆、双绞线、数字用户线路(DSL)或无线技术诸如红外线、无线电和微波从网站、服务器或其他远程源传输指令,则同轴电缆、光纤电缆、双绞线、DSL或无线技术诸如红外线、无线电和微波都包含在介质的定义中。然而,应该理解,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其他暂态介质,而是针对非暂态有形存储介质。如本文所用,磁盘和光盘包括压缩光盘(CD)、激光盘、光学光盘、数字通用光盘(DVD)、软磁盘及Blu-ray光盘,其中磁盘通常以磁性方式复制数据,而光盘则利用激光以光学方式复制数据。上述的组合也应该包括在计算机可读介质的范围内。
可以由一个或多个处理器诸如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其他等效集成或离散逻辑电路执行指令。因此,如本文所使用的术语“处理器”可以指任何前述结构或适用于实现本文所描述的技术的任何其他结构。此外,在一些方面中,可以在被配置用于编码和解码的专用硬件和/或软件模块内提供本文描述的功能,或者将其结合到组合编解码器中。而且,这些技术可以完全在一个或多个电路或逻辑元件中实现。
本公开的技术可以在各种设备或装置包括无线手机、集成电路(IC)或一组IC(例如,芯片组)中实现。在本公开中描述了各种部件、模块或单元,以强调被配置为执行所公开的技术的设备的功能方面,但是不一定需要通过不同的硬件单元来实现。相反,如上所述,可以将各种单元组合在编解码器硬件单元中,或者通过互操作硬件单元包括如上所述的一个或多个处理器的集合,结合合适的软件和/或固件来提供各种单元。
此外,每个上述实施方案中所使用的基站设备和终端设备的每个功能块或各种特征可通过电路(通常为一个集成电路或多个集成电路)实施或执行。被设计为执行本说明书中所述的功能的电路可包括通用处理器、数字信号处理器(DSP)、专用或通用集成电路(ASIC)、现场可编程门阵列(FPGA),或其他可编程逻辑设备、分立栅极或晶体管逻辑器,或分立硬件部件,或它们的组合。通用处理器可为微处理器,或另选地,该处理器可为常规处理器、控制器、微控制器或状态机。通用处理器或上述每种电路可由数字电路进行配置,或可由模拟电路进行配置。此外,当由于半导体技术的进步而出现制成取代当前集成电路的技术时,也能够使用通过该技术生产的集成电路。
已经描述了各种示例。这些示例和其他示例在以下权利要求的范围内。
<概述>
在一个示例中,对重构视频数据进行滤波的方法包括:接收包括用于视频数据分量的相邻重构视频块的样本值阵列;确定与该相邻重构视频块相关联的一个或多个条件是否得到满足;基于该一个或多个条件是否得到满足来选择滤波器;以及基于所选滤波器修改该相邻重构视频块中的样本值。
在一个示例中,用于视频编码的设备包括被配置为执行以下操作的一个或多个处理器:接收包括用于视频数据分量的相邻重构视频块的样本值阵列;确定与该相邻重构视频块相关联的一个或多个条件是否得到满足;基于该一个或多个条件是否得到满足来选择滤波器;以及基于所选滤波器修改该相邻重构视频块中的样本值。
在一个示例中,非暂态计算机可读存储介质包括存储在其上的指令,当这些指令被执行时,使得设备的一个或多个处理器执行以下操作:接收包括用于视频数据分量的相邻重构视频块的样本值阵列;确定与该相邻重构视频块相关联的一个或多个条件是否得到满足;基于该一个或多个条件是否得到满足来选择滤波器;以及基于所选滤波器修改该相邻重构视频块中的样本值。
在一个示例中,一种设备包括以下装置:用于接收包括用于视频数据分量的相邻重构视频块的样本值阵列的装置;用于确定与该相邻重构视频块相关联的一个或多个条件是否得到满足的装置;用于基于该一个或多个条件是否得到满足来选择滤波器的装置;以及用于基于所选滤波器修改该相邻重构视频块中的样本值的装置。
在以下附图和描述中阐述了一个或多个示例的细节。除非另有明确说明,否则部件和功能是任选的且可以被组合或被细分,并且操作可以按顺序变化或者可以被组合或被细分。其他特征、目的和优点将从描述和附图以及权利要求书中显而易见。
<交叉引用>
该非临时申请根据35U.S.C.§119要求2016年10月3日的临时专利申请No.62/403,658的优先权,其全部内容据此以引用方式并入。
Claims (20)
1.一种对重构视频数据进行滤波的方法,所述方法包括:
接收包括用于视频数据分量的相邻重构视频块的样本值阵列;
确定与所述相邻重构视频块相关联的一个或多个条件是否得到满足;
基于所述一个或多个条件是否得到满足来选择滤波器;以及
基于所述所选滤波器修改所述相邻重构视频块中的样本值。
2.根据权利要求1所述的方法,其中所述一个或多个条件包括所述相邻重构视频块是否满足最小尺寸条件的条件。
3.根据权利要求1或2中任一项所述的方法,其中所述一个或多个条件包括基于存在块伪像的可能性的条件。
4.根据权利要求3所述的方法,其中存在块伪像的可能性基于所述第一行和所述第二行的所述相邻重构视频块中的样本值。
5.根据权利要求3所述的方法,其中存在块伪像的可能性基于所述第一列和所述第二列的所述相邻重构视频块中的样本值。
6.根据权利要求3至5中任一项所述的方法,其中存在块伪像的可能性基于与所述相邻重构视频块相关联的量化参数。
7.根据权利要求1至6中任一项所述的方法,其中基于所述一个或多个条件是否得到满足来选择滤波器包括选择修改四列样本值的滤波器、修改三列样本值的滤波器、修改两列样本值的滤波器以及修改所述相邻重构视频块中的一列样本值的滤波器中的一者。
8.根据权利要求1至7中任一项所述的方法,其中基于所述一个或多个条件是否得到满足来选择滤波器包括选择修改四行样本值的滤波器、修改三行样本值的滤波器、修改两行样本值的滤波器以及修改所述相邻重构视频块中的一行样本值的滤波器中的一者。
9.根据权利要求7或8中任一项所述的方法,其中修改所述相邻重构视频块中的四行或四列样本值的所述滤波器使用限幅函数来修改样本值。
10.根据权利要求9所述的方法,其中所述限幅函数的所述上限是添加到样本值的限幅阈值,并且所述限幅函数的所述下限是从所述样本值中减去的所述限幅阈值。
11.根据权利要求1至10中任一项所述的方法,其中所述一个或多个条件包括基于与所述相邻视频块相关联的帧间预测模式的条件。
12.根据权利要求11所述的方法,其中,如果所述相邻块中的任一者与重叠块运动补偿帧间预测模式相关联,则跳过滤波。
13.根据权利要求1至12中任一项所述的方法,其中视频数据的所述分量包括色度分量。
14.根据权利要求1至13中任一项所述的方法,其中视频数据的所述分量包括亮度分量。
15.一种用于对视频数据进行编码的设备,所述设备包括被配置为执行根据权利要求1至14所述步骤的任意和全部组合的一个或多个处理器。
16.根据权利要求15所述的设备,其中所述设备包括视频编码器。
17.根据权利要求15所述的设备,其中所述设备包括视频解码器。
18.一种系统,包括:
根据权利要求16所述的设备;和
根据权利要求17所述的设备。
19.一种用于对视频数据进行编码的设备,所述设备包括用于执行根据权利要求1至14所述步骤的任意和全部组合的装置。
20.一种包括存储在其上的指令的非暂态计算机可读存储介质,当所述指令被执行时,使得用于对视频数据进行编码的设备的一个或多个处理器执行根据权利要求1至14所述步骤的任意和全部组合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662403658P | 2016-10-03 | 2016-10-03 | |
US62/403,658 | 2016-10-03 | ||
PCT/JP2017/029755 WO2018066241A1 (en) | 2016-10-03 | 2017-08-21 | Systems and methods for applying deblocking filters to reconstructed video data |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109845255A true CN109845255A (zh) | 2019-06-04 |
Family
ID=61832090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780060283.0A Pending CN109845255A (zh) | 2016-10-03 | 2017-08-21 | 用于将解块滤波器应用于重构视频数据的系统和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11310495B2 (zh) |
EP (1) | EP3520402A4 (zh) |
CN (1) | CN109845255A (zh) |
WO (1) | WO2018066241A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109845255A (zh) * | 2016-10-03 | 2019-06-04 | 夏普株式会社 | 用于将解块滤波器应用于重构视频数据的系统和方法 |
US10869063B2 (en) * | 2017-01-10 | 2020-12-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Deblocking filtering control |
JP6936641B2 (ja) * | 2017-07-05 | 2021-09-22 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
JP6854716B2 (ja) | 2017-07-05 | 2021-04-07 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
CN111684805B (zh) * | 2018-02-06 | 2024-04-02 | 松下电器(美国)知识产权公司 | 编码装置、解码装置、编码方法和解码方法 |
WO2019210829A1 (en) * | 2018-04-30 | 2019-11-07 | Mediatek Inc. | Signaling for illumination compensation |
GB2588004B (en) | 2018-06-05 | 2023-03-01 | Beijing Bytedance Network Tech Co Ltd | Interaction between IBC and affine |
WO2019244117A1 (en) | 2018-06-21 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Unified constrains for the merge affine mode and the non-merge affine mode |
CN113115046A (zh) | 2018-06-21 | 2021-07-13 | 北京字节跳动网络技术有限公司 | 分量相关的子块分割 |
JP6998846B2 (ja) * | 2018-08-30 | 2022-01-18 | Kddi株式会社 | 画像復号装置、画像符号化装置、画像処理システム及びプログラム |
MX2021002464A (es) * | 2018-09-05 | 2021-04-29 | Panasonic Ip Corp America | Codificador, decodificador, metodo de codificacion y metodo de decodificacion. |
CN110944196B (zh) | 2018-09-24 | 2023-05-30 | 北京字节跳动网络技术有限公司 | 简化的基于历史的运动矢量预测 |
WO2020094150A1 (en) | 2018-11-10 | 2020-05-14 | Beijing Bytedance Network Technology Co., Ltd. | Rounding in current picture referencing |
WO2020139596A1 (en) * | 2018-12-26 | 2020-07-02 | Interdigital Vc Holdings, Inc. | Motion compensation boundary filtering |
US11102476B2 (en) * | 2018-12-28 | 2021-08-24 | Qualcomm Incorporated | Subblock based affine motion model |
US11632563B2 (en) * | 2019-02-22 | 2023-04-18 | Qualcomm Incorporated | Motion vector derivation in video coding |
WO2020175145A1 (ja) * | 2019-02-27 | 2020-09-03 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006099321A1 (en) * | 2005-03-10 | 2006-09-21 | Qualcomm Incorporated | Interpolated frame deblocking operation in frame rate up conversion application |
CN102045567A (zh) * | 2009-10-13 | 2011-05-04 | 索尼公司 | 用于减少压缩图像和视频信号中的成块假象的方法和系统 |
US20110110603A1 (en) * | 2008-07-03 | 2011-05-12 | Tomohiro Ikai | Filter device |
WO2012154847A1 (en) * | 2011-05-12 | 2012-11-15 | Qualcomm Incorporated | Filtering blockiness artifacts for video coding |
CN103931185A (zh) * | 2011-10-25 | 2014-07-16 | 高通股份有限公司 | 确定视频译码的解块滤波的边界强度值 |
US20140219348A1 (en) * | 2011-11-28 | 2014-08-07 | Canon Kabushiki Kaisha | Moving image encoding apparatus, control method thereof and computer program |
US20140233649A1 (en) * | 2013-02-18 | 2014-08-21 | Mediatek Inc. | Method and apparatus for video decoding using multi-core processor |
US20160219298A1 (en) * | 2015-01-27 | 2016-07-28 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
CN105850121A (zh) * | 2013-11-15 | 2016-08-10 | 联发科技股份有限公司 | 用于基于块的自适应环路滤波的滤波器控制的方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725691B2 (en) * | 2005-01-28 | 2010-05-25 | Analog Devices, Inc. | Method and apparatus for accelerating processing of a non-sequential instruction stream on a processor with multiple compute units |
US20080123750A1 (en) * | 2006-11-29 | 2008-05-29 | Michael Bronstein | Parallel deblocking filter for H.264 video codec |
KR100922275B1 (ko) * | 2006-12-15 | 2009-10-15 | 경희대학교 산학협력단 | 경계 필터링 강도의 결정 방법 및 이를 이용한 디블록킹필터링 방법과 장치 |
US8964852B2 (en) * | 2011-02-23 | 2015-02-24 | Qualcomm Incorporated | Multi-metric filtering |
US9591302B2 (en) * | 2012-07-02 | 2017-03-07 | Microsoft Technology Licensing, Llc | Use of chroma quantization parameter offsets in deblocking |
US9270993B2 (en) * | 2012-09-10 | 2016-02-23 | Apple Inc. | Video deblocking filter strength derivation |
US10827178B2 (en) * | 2014-05-28 | 2020-11-03 | Arris Enterprises Llc | Content aware scheduling in a HEVC decoder operating on a multi-core processor platform |
US10038919B2 (en) * | 2014-05-29 | 2018-07-31 | Apple Inc. | In loop chroma deblocking filter |
CN109845255A (zh) * | 2016-10-03 | 2019-06-04 | 夏普株式会社 | 用于将解块滤波器应用于重构视频数据的系统和方法 |
-
2017
- 2017-08-21 CN CN201780060283.0A patent/CN109845255A/zh active Pending
- 2017-08-21 EP EP17858081.7A patent/EP3520402A4/en active Pending
- 2017-08-21 US US16/337,421 patent/US11310495B2/en active Active
- 2017-08-21 WO PCT/JP2017/029755 patent/WO2018066241A1/en active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006099321A1 (en) * | 2005-03-10 | 2006-09-21 | Qualcomm Incorporated | Interpolated frame deblocking operation in frame rate up conversion application |
US20110110603A1 (en) * | 2008-07-03 | 2011-05-12 | Tomohiro Ikai | Filter device |
CN102045567A (zh) * | 2009-10-13 | 2011-05-04 | 索尼公司 | 用于减少压缩图像和视频信号中的成块假象的方法和系统 |
WO2012154847A1 (en) * | 2011-05-12 | 2012-11-15 | Qualcomm Incorporated | Filtering blockiness artifacts for video coding |
CN103931185A (zh) * | 2011-10-25 | 2014-07-16 | 高通股份有限公司 | 确定视频译码的解块滤波的边界强度值 |
US20140219348A1 (en) * | 2011-11-28 | 2014-08-07 | Canon Kabushiki Kaisha | Moving image encoding apparatus, control method thereof and computer program |
US20140233649A1 (en) * | 2013-02-18 | 2014-08-21 | Mediatek Inc. | Method and apparatus for video decoding using multi-core processor |
CN105850121A (zh) * | 2013-11-15 | 2016-08-10 | 联发科技股份有限公司 | 用于基于块的自适应环路滤波的滤波器控制的方法 |
US20160219298A1 (en) * | 2015-01-27 | 2016-07-28 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
Non-Patent Citations (2)
Title |
---|
ANDREY NORKIN: "CE12: Ericsson’s and MediaTek’s deblocking filter", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 * |
INTERNATIONAL TELECOMMUNICATION UNION: "SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS", 《ITU-T H.265(04/2013)》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2018066241A1 (en) | 2018-04-12 |
EP3520402A1 (en) | 2019-08-07 |
US20190281294A1 (en) | 2019-09-12 |
US11310495B2 (en) | 2022-04-19 |
EP3520402A4 (en) | 2019-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11310495B2 (en) | Systems and methods for applying deblocking filters to reconstructed video data | |
US11677968B2 (en) | Systems and methods for coding video data using adaptive component scaling | |
US20240114139A1 (en) | Systems and methods for coding transform data | |
CN109196863B (zh) | 用于改变量化参数的系统和方法 | |
CN112042203B (zh) | 用于将解块滤波器应用于重构视频数据的系统和方法 | |
CN110313179B (zh) | 用于按比例缩放变换系数水平值的系统和方法 | |
CN109804630A (zh) | 对视频数据编码执行运动补偿的系统以及方法 | |
US20210092372A1 (en) | Systems and methods for partitioning video blocks in an inter prediction slice of video data | |
WO2017138352A1 (en) | Systems and methods for transform coefficient coding | |
CN112997501B (zh) | 导出用于对视频数据进行解码的预测亮度样本值的方法 | |
CN111819851A (zh) | 用于使用预测运动向量起点对视频编码执行运动向量预测的系统和方法 | |
US20210160507A1 (en) | Systems and methods for adaptively clipping sample values | |
CN110583021A (zh) | 用于执行平面帧内预测视频编码的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200810 Address after: No.1, Takumicho, Sakai Ward, Sakai City, Osaka Prefecture, Japan Applicant after: Sharp Corp. Applicant after: FG Innovation Co.,Ltd. Address before: Osaka Prefecture, Japan Applicant before: Sharp Corp. |
|
TA01 | Transfer of patent application right | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190604 |
|
WD01 | Invention patent application deemed withdrawn after publication |