CN114270817A - 基于位置的系数缩放 - Google Patents
基于位置的系数缩放 Download PDFInfo
- Publication number
- CN114270817A CN114270817A CN202080059166.4A CN202080059166A CN114270817A CN 114270817 A CN114270817 A CN 114270817A CN 202080059166 A CN202080059166 A CN 202080059166A CN 114270817 A CN114270817 A CN 114270817A
- Authority
- CN
- China
- Prior art keywords
- video
- transform
- matrix
- scaling
- video block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 356
- 238000006243 chemical reaction Methods 0.000 claims abstract description 81
- 238000003672 processing method Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims description 253
- 238000013139 quantization Methods 0.000 claims description 104
- 230000007704 transition Effects 0.000 claims description 64
- 230000011664 signaling Effects 0.000 claims description 29
- 230000004044 response Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 description 44
- 230000008569 process Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 25
- 239000013598 vector Substances 0.000 description 21
- 230000009466 transformation Effects 0.000 description 19
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 11
- 238000005070 sampling Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 9
- 241000023320 Luma <angiosperm> Species 0.000 description 8
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 8
- 238000013461 design Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种视频处理方法包括:根据规则基于是否对视频的视频块的部分应用二次变换矩阵而确定是否应用缩放矩阵,其中,该缩放矩阵用于缩放该视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换该视频块的该部分的至少一些残差系数;以及使用所选择的缩放矩阵执行该视频的视频块与该视频的比特流表示之间的转换。
Description
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请及时要求于2019年8月20日提交的国际专利申请No.PCT/CN2019/101555的优先权和利益。出于根据该法律的所有目的,将前述申请的全部公开内容以引用方式并入本文,以作为本申请公开内容的部分。
技术领域
本专利文件涉及视频编解码技术、设备和系统。
背景技术
尽管视频压缩有所进步,数字视频在互联网和其他数字通信网络上仍占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。
发明内容
公开了涉及数字视频编解码的,尤其涉及使用缩放矩阵和/或变换矩阵的视频编解码和解码的设备、系统和方法。
在一个示例性方面,公开了一种视频处理方法。该方法包括:执行视频的视频块与该视频的编解码表示之间的转换,其中,该编解码表示符合格式规则,其中,该格式规则规定通过该视频块的编解码条件确定变换跳过模式对该视频块的适用性,其中,该格式规则规定从该编解码表示中省略指示变换跳过模式的适用性的语法元素,并且其中,该变换跳过模式包括在编码成该编解码表示之前,跳过对至少一些系数应用正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用逆向变换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:为视频的两个紧邻视频块与该视频的编解码表示之间的转换,根据是否为该转换使用正向变换或逆向变换而确定是否将为该转换使用环路滤波器或重建后滤波器,其中,该正向变换包括在编码成该编解码表示之前,跳过对至少一些系数应用正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用逆向变换;以及基于环路滤波器或重建后滤波器的使用而执行该转换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:为视频的视频块与该视频的编解码表示之间的转换,基于该视频块的编解码模式确定缩放工具的因子;以及使用该缩放工具执行该转换,其中,该缩放工具的使用包括:在编码期间对表示该视频块的至少一些系数缩放或者在解码期间对来自该编解码表示的至少一些系数去缩放。
在另一个示例性方面中,公开了一种视频处理方法。该方法包括:为视频的视频块与该视频的编解码表示之间的转换,由于为视频块的转换的块差分脉冲编解码调制(BDPCM)编解码工具或量化残差BDPCM(QR-BDPCM)编解码工具而确定禁止使用缩放工具;以及在不使用该缩放工具的情况下执行该转换,其中,该缩放根据的使用包括:在编码期间对表示该视频块的至少一些系数缩放或者在解码期间对来自该编解码表示的至少一些系数去缩放。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:为视频的视频块与该视频的编解码表示之间的转换,基于为该转换选择的变换矩阵选择缩放矩阵,其中,该缩放矩阵用于缩放视频块的至少一些系数,并且其中,变换矩阵用于在该转换期间变换视频块的至少一些系数;以及使用缩放矩阵执行该转换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:根据规则,基于是否对视频的视频块的部分应用二次变换矩阵而确定是否应用缩放矩阵,其中,该缩放矩阵用于缩放该视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换该视频块的部分的至少一些残差系数;以及使用所选择的缩放矩阵执行该视频的视频块与该视频的比特流表示之间的转换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:对具有非方形形状的视频块,确定在视频的该视频块与该视频的编解码表示之间的转换中使用的缩放矩阵,其中,该编解码表示中的语法元素信令通知该缩放矩阵,并且其中,该缩放矩阵用于在该转换期间缩放视频块的至少一些系数;以及基于该缩放矩阵执行该转换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括执行视频的视频块与该视频的编解码表示之间的转换,其中,基于规则,该视频块包括第一数量的位置,在这些位置上在该转换期间应用缩放矩阵,并且该视频块还包括第二数量的位置,在这些位置上在该转换期间不应用该缩放矩阵。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:确定将在视频的视频块与该视频的编解码表示之间的转换期间应用缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该编解码表示指示该缩放矩阵中的元素的数量,并且其中,该数量取决于是否对该视频块的系数应用系数归零。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:根据规则执行视频的视频块与该视频的编解码表示之间的转换,其中,在对该视频块的变换系数应用K×L变换矩阵之后,在对除了左上M×N个变换系数之外的所有变换系数归零之后,该视频块用该编解码表示来表示,其中,该编解码表示配置为排除对缩放矩阵的处于对应于归零的位置上的元素的信令通知,其中,该缩放矩阵用于对变换系数进行缩放。
在另一个示例性方面,公开了一种视频处理方法。该方法包括在视频的视频块与该视频的编解码表示之间的转换期间,基于规则确定是否将基于该视频块的尺寸使用单个量化矩阵,其中,所有具有该尺寸的视频块都使用该单个量化矩阵;以及使用该量化矩阵执行该转换。
在另一个示例性方面,公开了一种视频处理方法。该方法包括:为视频的视频块的编解码表示与该视频块之间的转换,基于编解码模式信息确定是否为该转换启用变换跳过模式;以及基于该确定执行该转换,其中,在变换跳过模式中,在该转换期间跳过对表示该视频块的至少一些系数的变换应用。
在另一个示例性方面,公开了另一种视频处理方法。该方法包括:由于为视频块的编解码表示和该视频块之间的转换使用了块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)模式而确定为该转换使用缩放矩阵;以及使用该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间对表示该视频块的至少一些系数进行缩放。
在另一个示例性方面,公开了另一种视频处理方法。该方法包括:由于为视频块的编解码表示和该视频块之间的转换使用了块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)模式而禁止对该转换使用缩放矩阵;以及使用该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间对表示该视频块的至少一些系数进行缩放。
在另一个示例性方面,公开了另一种视频处理方法。该方法包括:为视频的视频块的编解码表示与该视频块之间的转换,根据是否为该转换启用变换跳过模式而确定环路滤波器的适用性;以及基于环路滤波器的适用性执行该转换,其中,在变换跳过模式中,在该转换期间跳过对表示该视频块的至少一些系数的变换应用。
在另一个示例性方面,公开了另一种视频处理方法。该方法包括:为视频的视频块与视频块的编解码表示之间的转换选择缩放矩阵,使得同一缩放矩阵用于基于帧间编解码和帧内块复制编解码的转换;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放所述视频块的至少一些系数。
在另一个示例性方面,公开了另一种视频处理方法。该方法包括:基于为视频的视频块与视频块的编解码表示之间的转换选择的变换矩阵选择为该转换的缩放矩阵;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放视频块的至少一些系数,并且其中,该变换矩阵用于在该转换期间变换视频块的至少一些系数。
在另一个示例性方面当中,公开了另一种视频处理方法。该方法包括:基于为视频的视频块与视频块的编解码表示之间的转换选择的二次变换矩阵选择为该转换的缩放矩阵;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换视频块的至少一些残差系数。
在另一个示例性方面当中,公开了另一种视频处理方法。该方法包括:对具有非方形形状的视频块,确定在该视频块与该视频块的编解码表示之间的转换中使用的缩放矩阵,其中,该编解码表示中的语法元素信令通知该缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间缩放视频块的至少一些系数。
在另一个示例性方面当中,公开了另一种视频处理方法。该方法包括:确定将在视频块的编解码表示与该视频块之间的转换期间部分应用的缩放矩阵;以及通过部分应用该缩放矩阵从而在该视频块的第一组位置上应用该缩放矩阵并且在该视频块的其余位置上禁用该缩放矩阵来执行该转换。
在另一个示例性方面当中,公开了另一种视频处理方法。该方法包括:确定将在视频块的编解码表示与该视频块之间的转换期间应用的缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该编解码表示信令通知该缩放矩阵的元素的数量,其中,该数量取决于该转换中的系数归零的应用。
在另一个示例性方面当中,公开了另一种视频处理方法。该方法包括:在视频块与该视频块的编解码表示之间的转换期间,基于特定类型的视频块的尺寸确定要使用的单个量化矩阵;以及使用该量化矩阵执行该转换。
在又一代表性方面中,上述方法被体现为处理器可执行代码的形式并存储于计算机可读程序介质中。
在又一代表性方面当中,公开了一种设备,该设备被配置为或可用于执行上述方法。该设备可以包括被编程为实施这种方法的处理器。
在又一典型的方面,一种视频解码器装置可以实施本文描述的方法。
在附图、说明书和权利要求书中更详细地描述了所公开的技术的上述和其他方面和特征。
附图说明
图1是一种示例性视频编码器实施方式的框图。
图2示出了二次变换的示例。
图3示出了缩减二次变换(RST)的示例。
图4是在所提出的依赖性量化方案中使用的两个标量量化器的例示。
图5示出了所提出的依赖性量化的状态转换和量化器选择的示例。
图6A-图6B示出了对角线扫描顺序的示例。
图7示出了用于QM信令通知的选定位置的示例(32x32变换尺寸)。
图8示出了用于QM信令通知的选定位置的示例(64x64变换尺寸)。
图9示出了对系数应用归零的示例。
图10示出了仅信令通知虚线区域(例如,MxN区域)内的选定元的示例。
图11是视频处理硬件平台的示例的框图。
图12是视频处理的示例性方法的流程图。
图13是示出了视频解码器的示例的框图。
图14是示出了示例性视频处理系统的框图,在该系统中可以实施本文公开的各种技术。
图15是示出了可以利用本公开的技术的示例性视频编解码系统的框图。
图16是示出了视频编码器的示例的框图。
图17-27是视频处理的示例性方法的流程图。
具体实施方式
可以将所公开的技术的实施例应用于现有视频编解码标准(例如,HEVC、H.265)和将来的标准,以改善压缩性能。在本文中,使用章节标题来提高描述的可读性,并且不以任何方式使讨论或实施例(和/或实施方式)仅局限于各自章节。
1.概述
本文件涉及图像/视频编解码技术。具体地,本文件涉及图像/视频编解码中的残差编解码。其可以应用于现有的视频编解码标准,如HEVC,或待定案的标准(多功能视频编解码)。其还可以适用于未来的视频编解码标准或视频编解码器。
2.背景
视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而演变的。ITU-T开发了H.261和H.263,ISO/IEC开发了MPEG-1和MPEG-4视觉,并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中采用了时域预测加变换编解码。为探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年共同成立了联合视频探索团队(JVET)。从那时起,JVET采用了许多新的方法,并将其应用到了名为联合探索模型(JEM)的参考软件中。2018年4月,在VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间创建了联合视频专家团队(JVET),其致力于研究以相较于HEVC有50%的比特率下降为目标的VVC标准。
可以在下述网址找到VVC草案的最新版本,即多功能视频编解码(草案5):
http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=6640
可以在下述网址找到VVC的名为VTM的最新参考软件:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.02.1
2.1.颜色空间和色度下采样
颜色空间又名颜色模型(或颜色系统),其是一种简单地将颜色的范围描述成数的元组的抽象数学模型,数的元组通常是3个或4个值或颜色分量(例如,RGB)。基本来讲,颜色空间是坐标系和子空间的阐述。
对于视频压缩而言,最频繁使用的颜色空间是YCbCr和RGB。
YCbCr、Y′CbCr或Y Pb/Cb Pr/Cr(又写作YCBCR或Y'CBCR)是被用作视频和数字摄影系统中的彩色图像管道的部分的一系列颜色空间。Y′是亮度分量,CB和CR是蓝色差和红色差色度分量。Y′(首选的)有别于作为亮度的Y,从而意味着基于经过伽马校正的RGB原色对光强进行非线性编码。
色度下采样是通过对色度信息实施比亮度信息更低的分辨率来对图像编码的惯例,其利用了人类视觉系统对颜色差异的敏锐性低于对亮度的敏锐性的特点。
2.1.1. 4:4:4
三个Y'CbCr分量中的每者具有相同的采样速率,因而没有色度子采样。这一方案有时被用在高端胶片扫描仪和电影后期制作当中。
2.1.2. 4:2:2
按照亮度的采样速率的一半对两个色度分量采样:使水平色度分辨率减半。这使未压缩视频信号的带宽下降了三分之一,而几乎没有视觉差异。
2.1.3. 4:2:0
在4:2:0当中,与4:1:1相比使水平采样加倍,但是由于在这一方案中仅隔行对Cb和Cr通道采样,因而垂直分辨率减半。因而,数据速率相同。在水平和垂直方向两者上都以二分之一对Cb和Cr每者子采样。有三种4:2:0方案的变型,它们具有不同的水平和垂直定址(siting)。
·在MPEG-2中,Cb和Cr水平共址(cosit)。Cb和Cr在垂直方向内定址于像素之间(填隙定址)。
·在JPEG/JFIF、H.261和MPEG-1中,Cb和Cr在相隔一个的亮度样点之间半途填隙定址。
·在4:2:0DV中,Cb和Cr在水平方向内共址。在垂直方向内,它们在隔行上共址。
2.2.典型视频编解码器的编解码流程
图1示出了VVC的编码器框图的示例,其含有三个环路滤波框:去方块滤波器(DF)、样点自适应偏移(SAO)和ALF。与使用预定义滤波器的DF不同,SAO和ALF借助于信令通知偏移和滤波器系数的编解码边信息分别通过添加偏移以及应用有限脉冲响应(FIR)滤波器而利用当前图片的原始样点来减少原始样点和重建样点之间的均方误差。ALF位于每一图片的最后处理阶段上,并且可以被视为尝试捕捉并且修复先前阶段建立的伪像的工具。
2.3.量化矩阵
人类视觉系统(HVS)的众所周知的空间频率灵敏度已经成为了现代化图像和视频编解码算法和标准(包括JPEG、MPEG2、H.264/AVC High Profile和HEVC)的设计的很多方面背后的关键驱动因素。
在MPEG2中使用的量化矩阵为8x8矩阵。在H.264/AVC中,量化矩阵块尺寸既包括4x4,又包括8x8。将这些QM编码到SPS(序列参数集)和PPS(图片参数集)中。H.264/AVC中的用于QM信令通知的压缩方法为差分脉冲编解码调制(DPCM)。
在H.264/AVC High Profile中,使用4x4块尺寸和8x8块尺寸。对于4x4块尺寸有六个QM(即,用于帧内/帧间编解码和Y/Cb/Cr分量的单独矩阵)并且对于8x8块尺寸有两个QM(即,用于帧内/帧间Y分量的单独矩阵),因而只需将八个量化矩阵编码到比特流当中。
2.4.VVC中的变换和量化设计
2.4.1.变换
HEVC规定了从4×4到32×32的各种尺寸的二维变换,它们是相对于离散余弦变换(DCT)的有限精确度近似。此外,HEVC还规定了与4×4亮度帧内预测残差块结合使用的基于离散正弦变换(DST)的备选4×4整数变换。除此之外,在某些块尺寸情况下,也可以允许变换跳过。
对于nS=4、8、16和32以及DCT-II而言,变换矩阵cij(i,j=0..nS-1)的定义如下:
nS=4
{64,64,64,64}
{83,36,-36,-83}
{64,-64,-64,64}
{36,-83,83,-36}
nS=8
{64,64,64,64,64,64,64,64}
{89,75,50,18,-18,-50,-75,-89}
{83,36,-36,-83,-83,-36,36,83}
{75,-18,-89,-50,50,89,18,-75}
{64,-64,-64,64,64,-64,-64,64}
{50,-89,18,75,-75,-18,89,-50}
{36,-83,83,-36,-36,83,-83,36}
{18,-50,75,-89,89,-75,50,-18}
nS=16
{64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64}
{90 87 80 70 57 43 25 9-9-25-43-57-70-80-87-90}
{89 75 50 18-18-50-75-89-89-75-50-18 18 50 75 89}
{87 57 9-43-80-90-70-25 25 70 90 80 43 -9-57-87}
{83 36-36-83-83-36 36 83 83 36-36-83-83-36 36 83}
{80 9-70-87-25 57 90 43-43-90-57 25 87 70-9-80}
{75-18-89-50 50 89 18-75-75 18 89 50-50-89-18 75}
{70-43-87 9 90 25-80-57 57 80-25-90-9 87 43-70}
{64-64-64 64 64-64-64 64 64-64-64 64 64-64-64 64}
{57-80-25 90 -9-87 43 70-70-43 87 9-90 25 80-57}
{50-89 18 75-75-18 89-50-50 89-18-75 75 18-89 50}
{43-90 57 25-87 70 9-80 80-9-70 87-25-57 90-43}
{36-83 83-36-36 83-83 36 36-83 83-36-36 83-83 36}
{25-70 90-80 43 9-57 87-87 57 -9-43 80-90 70-25}
{18-50 75-89 89-75 50-18-18 50-75 89-89 75-50 18}
{9-25 43-57 70-80 87-90 90-87 80-70 57-43 25 -9}
nS=32
{64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 6464 64 64 64 64 64 64 64 64}
{90 90 88 85 82 78 73 67 61 54 46 38 31 22 13 4 -4-13-22-31-38-46-54-61-67-73-78-82-85-88-90-90}
{90 87 80 70 57 43 25 9 -9-25-43-57-70-80-87-90-90-87-80-70-57-43-25-9 9 25 43 57 70 80 87 90}
{90 82 67 46 22 -4-31-54-73-85-90-88-78-61-38-13 13 38 61 78 88 90 8573 54 31 4-22-46-67-82-90}
{89 75 50 18-18-50-75-89-89-75-50-18 18 50 75 89 89 75 50 18-18-50-75-89-89-75-50-18 18 50 75 89}
{88 67 31-13-54-82-90-78-46 -4 38 73 90 85 61 22-22-61-85-90-73-38 446 78 90 82 54 13-31-67-88}
{87 57 9-43-80-90-70-25 25 70 90 80 43 -9-57-87-87-57 -9 43 80 90 7025-25-70-90-80-43 9 57 87}
{85 46-13-67-90-73-22 38 82 88 54 -4-61-90-78-31 31 78 90 61 4-54-88-82-38 22 73 90 67 13-46-85}
{83 36-36-83-83-36 36 83 83 36-36-83-83-36 36 83 83 36-36-83-83-36 3683 83 36-36-83-83-36 36 83}
{82 22-54-90-61 13 78 85 31-46-90-67 4 73 88 38-38-88-73 -4 67 90 46-31-85-78-13 61 90 54-22-82}
{80 9-70-87-25 57 90 43-43-90-57 25 87 70 -9-80-80 -9 70 87 25-57-90-43 43 90 57-25-87-70 9 80}
{78 -4-82-73 13 85 67-22-88-61 31 90 54-38-90-46 46 90 38-54-90-31 6188 22-67-85-13 73 82 4-78}
{75-18-89-50 50 89 18-75-75 18 89 50-50-89-18 75 75-18-89-50 50 8918-75-75 18 89 50-50-89-18 75}
{73-31-90-22 78 67-38-90-13 82 61-46-88 -4 85 54-54-85 4 88 46-61-8213 90 38-67-78 22 90 31-73}
{70-43-87 9 90 25-80-57 57 80-25-90 -9 87 43-70-70 43 87 -9-90-25 8057-57-80 25 90 9-87-43 70}
{67-54-78 38 85-22-90 4 90 13-88-31 82 46-73-61 61 73-46-82 31 88-13-90 -4 90 22-85-38 78 54-67}
{64-64-64 64 64-64-64 64 64-64-64 64 64-64-64 64 64-64-64 64 64-64-6464 64-64-64 64 64-64-64 64}
{61-73-46 82 31-88-13 90 -4-90 22 85-38-78 54 67-67-54 78 38-85-22 904-90 13 88-31-82 46 73-61}
{57-80-25 90 -9-87 43 70-70-43 87 9-90 25 80-57-57 80 25-90 9 87-43-70 70 43-87 -9 90-25-80 57}
{54-85 -4 88-46-61 82 13-90 38 67-78-22 90-31-73 73 31-90 22 78-67-3890-13-82 61 46-88 4 85-54}
{50-89 18 75-75-18 89-50-50 89-18-75 75 18-89 50 50-89 18 75-75-1889-50-50 89-18-75 75 18-89 50}
{46-90 38 54-90 31 61-88 22 67-85 13 73-82 4 78-78 -4 82-73-13 85-67-22 88-61-31 90-54-38 90-46}
{43-90 57 25-87 70 9-80 80 -9-70 87-25-57 90-43-43 90-57-25 87-70 -980-80 9 70-87 25 57-90 43}
{38-88 73 -4-67 90-46-31 85-78 13 61-90 54 22-82 82-22-54 90-61-1378-85 31 46-90 67 4-73 88-38}
{36-83 83-36-36 83-83 36 36-83 83-36-36 83-83 36 36-83 83-36-36 83-8336 36-83 83-36-36 83-83 36}
{31-78 90-61 4 54-88 82-38-22 73-90 67-13-46 85-85 46 13-67 90-73 2238-82 88-54 -4 61-90 78-31}
{25-70 90-80 43 9-57 87-87 57 -9-43 80-90 70-25-25 70-90 80-43 -9 57-87 87-57 943-80 90-70 25}
{22-61 85-90 73-38 -4 46-78 90-82 54-13-31 67-88 88-67 31 13-54 82-9078-46 4 38-73 90-85 61-22}
{18-50 75-89 89-75 50-18-18 50-75 89-89 75-50 18 18-50 75-89 89-7550-18-18 50-75 89-89 75-50 18}
{13-38 61-78 88-90 85-73 54-31 4 22-46 67-82 90-90 82-67 46-22 -4 31-54 73-85 90-88 78-61 38-13}
{9-25 43-57 70-80 87-90 90-87 80-70 57-43 25 -9 -9 25-43 57-70 80-8790-90 87-80 70-57 43-25 9}
{4-13 22-31 38-46 54-61 67-73 78-82 85-88 90-90 90-90 88-85 82-78 73-67 61-54 46-38 31-22 13 -4}
2.4.2.量化
HEVC量化器设计与H.264/AVC的类似,其中,将处于0-51的范围内(对于8比特视频序列)的量化参数(QP)映射至量化器步长尺寸,该步长尺寸每当QP值增大6时加倍。然而,关键差异在于在HEVC中不再需要被结合到H.264/AVC的去缩放矩阵当中的变换基范数校正因数,从而简化了量化器设计。对于小到8× 8个样点的量化群组可以传输QP值(以ΔQP的形式),从而实现速率控制和感知量化的目的。用于计算ΔQP的QP预测值使用左侧、上方和先前QP值的组合。HEVC还通过对所有变换块尺寸使用量化矩阵而支持频率相关量化。将在章节2.4.3中描述细节。
由变换系数dij(i,j=0..nS-1)将量化变换系数qij(i,j=0..nS-1)推导为:
qij=(dij*f[QP%6]+offset)>>(29+QP/6–nS–BitDepth),其中,i,j=0,...,nS-1
其中,
f[x]={26214,23302,20560,18396,16384,14564},x=0,…,5
228+QP/6–nS-BitDepth<offset<229+QP/6–nS-BitDepth
QP表示一个变换单元的量化参数,BitDepth表示与当前颜色分量相关联的比特深度。
在HEVC中,QP的范围是[0,51]。
2.4.3.量化矩阵
量化矩阵(QM)已被采纳到诸如JPEG和JPEG-2000的图像编解码标准当中以及诸如MPEG2、MPEG4和H.264/AVC的视频标准当中。QM能够通过对不同频率系数的频率加权改善主观质量。在HEVC标准中,量化块尺寸可以一直达到32×32。可以将具有尺寸4×4、8×8、16×16、32×32的QM编码到比特流当中。对于每一块尺寸,帧内/帧间预测类型和Y/Cb/Cr颜色分量需要不同量化矩阵。总共应当对24个量化矩阵(用于4×4、8×8、16×16和32×32这四个块尺寸的单独矩阵)编码。
用于量化矩阵的参数可以是直接从参考量化矩阵复制的,或者可以是显式信令通知的。在显式信令通知时,直接对第一参数(又名该矩阵的(0,0)分量的值)编解码。并且根据对该矩阵的光栅扫描采用预测编解码对其余参数编解码。
HEVC中对缩放矩阵的编码和信令通知暗指三种模式:OFF(关闭)、DEFAULT(默认)和USER_DEFINED(用户定义)。要指出的是:对于大于8×8的变换单元尺寸(即,16×16、32×32),缩放矩阵是通过升采样至更大尺寸(对元的复制)而由8×8缩放矩阵获得的。对于大于8×8的TB的缩放矩阵必须信令通知额外的DC值。
在HEVC中,一个缩放矩阵的编解码值的最大数量等于64。
对于所有TB尺寸而言,默认模式的DC值均等于16。
2.4.3.1.语法和语义
7.3.2.2序列参数集RBSP语法
7.3.2.2.1通用序列参数集RBSP语法
7.3.2.3图片参数集RBSP语法7.3.2.3.1通用图片参数集RBSP语法
7.3.4缩放列表数据语法
scaling_list_enabled_flag等于1规定:对变换系数的缩放过程使用缩放列表。scaling_list_enabled_flag等于0规定:不对变换系数的缩放过程使用缩放列表。
sps_scaling_list_data_present_flag等于1规定:在SPS中存在scaling_list_data()语法结构。sps_scaling_list_data_present_flag等于0规定:在SPS中不存在scaling_list_data()语法结构。当不存在sps_scaling_list_data_present_flag时,将sps_scaling_list_data_present_flag的值推断为等于0。
pps_scaling_list_data_present_flag等于1规定:用于参照该PPS的图片的缩放列表数据是基于由有效SPS规定的缩放列表和由该PPS规定的缩放列表推导出的。pps_scaling_list_data_present_flag等于0规定:将用于参照该PPS的图片的缩放列表数据推断为等于由有效SPS规定的那些。在scaling_list_enabled_flag等于0时,pps_scaling_list_data_present_flag的值必须等于0。在scaling_list_enabled_flag等于1,sps_scaling_list_data_present_flag等于0,并且pps_scaling_list_data_present_flag等于0时,使用默认缩放列表数据推导数组ScalingFactor,如条款7.4.5中规定的缩放列表数据语义中所述。
7.4.5缩放列表数据语义
scaling_list_pred_mode_flag[sizeId][matrixId]等于0规定:缩放列表的值与参考缩放列表的值相同。参考缩放列表是由scaling_list_pred_matrix_id_delta[sizeId][matrixId]指定的。scaling_list_pred_mode_flag[sizeId][matrixId]等于1规定:缩放列表的值是显式信令通知的。
scaling_list_pred_matrix_id_delta[sizeId][matrixId]如下规定用于推导ScalingList[sizeId][matrixId]的参考缩放列表:
–如果scaling_list_pred_matrix_id_delta[sizeId][matrixId]等于0,那么缩放列表是由表格7-5和表格7-6中指定的默认缩放列表ScalingList[sizeId][matrixId][i](对于i=0..Min(63,(1<<(4+(sizeId<<1)))-1))推断的。
–否则,缩放列表是如下由参考缩放列表推断的:
refMatrixId=matrixId-
scaling_list_pred_matrix_id_delta[sizeId][matrixId]*(sizeId==3?3:1) (7-42)
ScalingList[sizeId][matrixId][i]=ScalingList[sizeId][refMatrixId][i]
其中,i=0..Min(63,(1<<(4+(sizeId<<1)))-1) (7-43)
如果sizeId小于或等于2,那么scaling_list_pred_matrix_id_delta[sizeId][matrixId]的值必须处于0到matrixId(含端点)的范围内。否则(sizeId等于3),那么scaling_list_pred_matrix_id_delta[sizeId][matrixId]的值必须处于1到matrixId/3(含端点)的范围内。
表格7-3–sizeId的规范
量化矩阵的尺寸 | sizeId |
4×4 | 0 |
8×8 | 1 |
16×16 | 2 |
32×32 | 3 |
表格7-4–根据sizeId、预测模式和颜色分量的matrixId规范
scaling_list_dc_coef_minus8[sizeId-2][matrixId]加8规定在sizeId等于2时对于16x16尺寸而言用于缩放列表的变量ScalingFactor[2][matrixId][0][0]的值并且规定在sizeId等于3时对于32x32尺寸而言用于缩放列表的ScalingFactor[3][matrixId][0][0]的值。scaling_list_dc_coef_minus8[sizeId-2][matrixId]的值必须于-7到247(含端点)的范围内。
在scaling_list_pred_mode_flag[sizeId][matrixId]等于0,scaling_list_pred_matrix_id_delta[sizeId][matrixId]等于0,并且sizeId大于1时,将scaling_list_dc_coef_minus8[sizeId-2][matrixId]的值推断为等于8。
在scaling_list_pred_matrix_id_delta[sizeId][matrixId]不等于0并且sizeId大于1时,将scaling_list_dc_coef_minus8[sizeId-2][matrixId]的值推断为等于scaling_list_dc_coef_minus8[sizeId-2][refMatrixId],其中,refMatrixId的值是由方程7-42给出的。
在scaling_list_pred_mode_flag[sizeId][matrixId]等于1时,scaling_list_delta_coef规定当前矩阵系数ScalingList[sizeId][matrixId][i]与先前矩阵系数ScalingList[sizeId][matrixId][i-1]之间的差。scaling_list_delta_coef的值必须于-128到127(含端点)的范围内。ScalingList[sizeId][matrixId][i]的值必须大于0。
表格7-5–ScalingList[0][matrixId][i]的默认值的规范,其中,i=0..15
表格7-6–ScalingList[1..3][matrixId][i]的默认值的规范,其中,i=0..63
四维数组ScalingFactor[sizeId][matrixId][x][y](其中,x,y=0..(1<<(2+sizeId))-1)根据表格7-3中规定的变量sizeId和表格7-4中规定的变量matrixId规定缩放因数的数组。
如下推导具有尺寸4x4的量化矩阵的元ScalingFactor[0][matrixId][][]:
ScalingFactor[0][matrixId][x][y]=ScalingList[0][matrixId][i] (7-44)
其中,i=0..15,matrixId=0..5,x=ScanOrder[2][0][i][0]并且
y=ScanOrder[2][0][i][1]
如下推导具有尺寸8x8的量化矩阵的元ScalingFactor[1][matrixId][][]:
ScalingFactor[1][matrixId][x][y]=ScalingList[1][matrixId][i] (7-45)
其中,i=0..63,matrixId=0..5,x=ScanOrder[3][0][i][0]并且
y=ScanOrder[3][0][i][1]
如下推导具有尺寸16x16的量化矩阵的元ScalingFactor[2][matrixId][][]:
ScalingFactor[2][matrixId][x*2+k][y*2+j]=ScalingList[2][matrixId][i](7-46)
其中,i=0..63,j=0..1,k=0..1,matrixId=0..5,x=ScanOrder[3][0][i][0]并且y=ScanOrder[3][0][i][1]
ScalingFactor[2][matrixId][0][0]=scaling_list_dc_coef_minus8[0][matrixId]+8 (7-47)
其中,matrixId=0..5
如下推导具有尺寸32x32的量化矩阵的元ScalingFactor[3][matrixId][][]:
ScalingFactor[3][matrixId][x*4+k][y*4+j]=ScalingList[3][matrixId][i](7-48)
其中,i=0..63,j=0..3,k=0..3,matrixId=0,3,x=ScanOrder[3][0][i][0]并且y=ScanOrder[3][0][i][1]
ScalingFactor[3][matrixId][0][0]=scaling_list_dc_coef_minus8[1][matrixId]+8 (7-49)
其中,matrixId=0,3
在ChromaArrayType等于3时,如下推导具有尺寸32x32的色度量化矩阵的元ScalingFactor[3][matrixId][][](其中,matrixId=1、2、4和5):
ScalingFactor[3][matrixId][x*4+k][y*4+j]=ScalingList[2][matrixId][i](7-50)
其中,i=0..63,j=0..3,k=0..3,x=ScanOrder[3][0][i][0]并且y=ScanOrder[3][0][i][1]
ScalingFactor[3][matrixId][0][0]=scaling_list_dc_coef_minus8[0][matrixId]+8 (7-51)
2.5 VVC中的变换和量化设计
2.5.1 MTS(多变换选择)
离散正弦变换族系包括公知的离散傅里叶变换、离散余弦变换、离散正弦变换和离散Karhunen-Loeve(在一阶Markov条件下)变换。在所有成员当中,有8种类型的变换基于余弦函数,并且有8种类型的变换基于正弦函数,即分别为DCT-I、II……VIII和DST-I、II……VIII。离散余弦和正弦变换的这些变型源自于它们的对应对称周期序列的不同对称性[22]。在下面的表格1中用公式表述了在所提出的方法中使用的选定类型的DCT和DST的变换基函数。
表格1 对于N点输入而言的DCT-II/V/VIII和DSTI/VII的变换基函数
对于一个块而言,可以选择变换跳过或者DCT2/DST7/DCT8。这样的方法被称为多变换选择(MTS)。
为了控制MTS方案,分别对帧内和帧间在SPS级上规定单独的启用标志。当在SPS上启用MTS时,信令通知CU级标志,以指示是否应用MTS。这里,仅对亮度应用MTS。在满足下述条件时信令通知MTS CU级标志。
-宽度和高度两者都小于或者等于32
-CBF标志等于1
如果MTS CU标志等于0,那么在两个方向内都应用DCT2。然而,如果MTS CU标志等于1,那么附加地信令通知其他两个标志,从而分别指示水平方向和垂直方向的变换类型。在下面的表格中示出了变换和信令通知映射表格。在涉及到变换矩阵精确度时,采用8比特主变换核心。因此,使HEVC中使用的所有变换核心保持相同,其包括4点DCT-2和DST-7以及8点、16点和32点DCT-2。而且,其他变换核心包括64点DCT-2、4点DCT-8以及8点、16点、32点DST-7和DCT-8主变换核心。
表格1 对于N点输入而言的DCT-II/V/VIII和DSTI/VII的变换基函数
与HEVC中一样,可以采用变换跳过模式对块的残差编解码。为了避免语法编解码的冗余,在CU级MTS_CU_flag不等于零时不信令通知变换跳过标志。针对变换跳过的块尺寸限制与针对JEM4中的MTS的块尺寸限制相同,其指示对于一个CU而言当块宽度和高度两者均等于或小于32时变换跳过是适用的。
2.5.1.1.高频率的归零
在VTM4中,启用了在尺寸上高达64×64的大块尺寸变换,其主要可用于较高分辨率视频,例如,1080p序列和4K序列。对于具有等于64的尺寸(宽度或高度,或者宽度和高度两者)的变换块,使高频变换系数归零,从而只保留低频系数。例如,对于M×N变换块(其中,M作为块宽度,N作为块高度),当M等于64时,仅留下左侧的32列变换系数。类似地,当N等于64时,仅保持顶部的32行变换系数。在将变换跳过模式用于大块时,使用整个块而不使任何值归零。
为了降低大尺寸DST-7和DCT-8的复杂性,对于具有等于32的尺寸(宽度或高度,或者宽度和高度两者)的DST-7块和DCT-8块使高频变换系数归零。仅保留处于16×16较低频率区域内的系数。
2.5.2.缩减二次变换
在JEM中,在正向主变换和量化(编码器处)之间以及在逆量化和逆主变换(解码器处)之间应用二次变换。如图2所示,4×4(或8×8)二次变换的执行取决于块尺寸。例如,对于小块(即,min(宽度,高度)<8)应用4×4二次变换,并且对较大块(即,min(宽度,高度)>4)按照每一8×8块应用8×8二次变换。
对于二次变换,应用不可分变换,因此,其又名为不可分二次变换(NSST)。总共有35个变换集,并且每变换集采用3个不可分变换矩阵(内核,每者具有16×16矩阵)。
曾根据帧内预测方向在JVET-K0099中引入过缩减二次变换(RST)并且在JVET-L0133中引入过4个变换集(而非35个变换集)。在本文献中,分别对8×8块和4×4块采用16×48矩阵和16×16矩阵。为了标记方便,将16×48变换表示为RST 8×8,将16×16变换表示为RST 4×4。这样的方法近来被VVC采纳过。
图3示出了缩减二次变换(TST)的示例。
二次正向变换和逆变换是与主变换的处理步骤分开的处理步骤。
对于编码器而言,首先执行主正向变换,之后继之以二次正向变换和量化以及CABAC比特编码。对于解码器而言,首先执行CABAC比特解码和逆量化以及随后的二次逆变换,随后继之以主逆变换。
RST仅适用于帧内编解码TU。
2.5.3.量化
在VTM4中,最大QP曾被从51扩展至63,并且相应地改变初始QP的信令通知。当对slice_qp_delta的非零值编解码时,在条带段层修改SliceQpY的初始值。具体地,将init_qp_minus26的值修改为处于-(26+QpBdOffsetY)到+37的范围内。
此外,还将同样的HEVC标量量化与一种被称为依赖性标量量化的新的理念相结合。依赖性标量量化是指一种方案,其中,变换系数的一组可容许的重建值依赖于在重建顺序中处于当前变换系数幅值之前的变换系数幅值的值。这一方案的主要作用在于,与HEVC中使用的常规独立标量量化相比,在N维矢量空间(N表示变换块中的变换系数的数量)内更致密地填充可容许重建矢量。这意味着,对于给定的每一个N维单元体积的可容许重建矢量的平均数量而言,降低了输入矢量与最接近的重建矢量之间的平均失真。该依赖性标量量化方案是通过下述操作实现的:(a)定义两个具有不同重建幅值的标量量化器以及(b)定义用于在两个标量量化器之间切换的过程。
图4是在所提出的依赖性量化方案中使用的两个标量量化器的例示。
在图4中示出了通过Q0和Q1表示的所使用的两个标量量化器。通过量化步长尺寸Δ唯一地指定可用重建幅值的位置。所使用的标量量化器(Q0或Q1)未在比特流中显式信令通知。相反,通过按照编解码/重建顺序处于当前变换系数之前的变换系数的奇偶性确定用于当前变换系数的量化器。
如图5所示,通过具有四个状态的状态机实现两个标量量化器(Q0和Q1)之间的切换。状态可以采取四个不同值:0、1、2、3。其由按照编解码/重建顺序处于当前变换系数之前的变换系数幅值的奇偶性唯一地确定。在针对变换块的反量化开始时,状态被设置为0。按照扫描顺序(即,按照它们被熵解码的相同顺序)重建变换系数。在重建当前变换系数之后,对状态进行更新,如图5所示,其中,k表示变换系数幅值的值。
2.5.4 JVET-N0847中的用户定义量化矩阵
在本文献中,提出了基于VTM4.0增添对默认及用户定义的缩放矩阵的信令通知的支持。本提议符合更大的块尺寸范围(对于亮度从4×4到64×64,对于色度从2×2到32×32)、矩形TB、依赖性量化、多变换选择(MTS)、使高频系数归零的大变换(与用于TB的缩放矩阵的一步定义过程一致)、帧内字块分割子块分割(ISP)和帧内块复制(IBC,又称为当前图片参考CPR)。
提出了在VTM4.0的基础上增添用以支持对默认和用户定义的缩放矩阵的信令通知的语法,其符合下述内容:
–缩放矩阵的三种模式:OFF(关闭)、DEFAULT(默认)和USER_DEFINED(用户定义)
–更大的块尺寸范围(对于亮度从4×4到64×64,对于色度从2×2到32×32)
–矩形变换块(TB)
–依赖性量化
–多变换选择(MTS)
–使高频系数归零的大变换
–帧内子块分割(ISP)
–帧内块复制(IBC,又称为当前图片参考CPR)与帧内编解码块共享相同QM
–对于所有TB尺寸,DEFAULT缩放矩阵都是扁平的,其具有默认值16
–“不”应对以下内容应用缩放矩阵
○针对所有TB尺寸的TS
○二次变换(又名RST)
2.5.4.1.对于方形变换尺寸的QM信令通知
2.5.4.1.1.缩放矩阵中的元素的扫描顺序
按照与系数编解码的扫描顺序(即,对角线扫描顺序)相同的扫描顺序对这些元素编解码。在图6A-图6B描绘了对角线扫描顺序的示例。
图6A-图6B示出了对角线扫描顺序的示例。图6A示出了扫描方向示例。图6B示出了每一元素的坐标和扫描顺序索引。
如下定义针对这一顺序的对应规范:
6.5.2右上对角线扫描顺序数组初始化过程
这一过程的输入是块宽度blkWidth和块尺寸高度blkHeight。
这一过程的输出为数组diagScan[sPos][sComp]。数组索引sPos指定处于从0到(blkWidth*blkHeight)-1的范围内的扫描位置。等于0的数组索引sComp指定水平分量,等于1的数组索引sComp指定垂直分量。依据blkWidth和blkHeight的值,如下推导数组diagScan:
2.5.4.1.2.对选择元素的编解码
对于下述缩放矩阵对DC值(即,处于矩阵左上的等于0的扫描索引上的元素)单独编解码。16×16、32×32和64×64。
对于尺寸小于或等于8×8(N<=8)的TB(N×N)
对于尺寸小于或等于8×8的TB,信令通知一个缩放矩阵内的所有元素。
对于尺寸大于8×8(N>8)的TB(N×N)
如果TB具有大于8×8的尺寸,那么仅信令通知一个8×8缩放矩阵中的64个元素作为基本缩放矩阵。这64个元素对应于坐标(m*X,m*Y),其中,m=N/8并且X和Y为[0…7]。换言之,将一个NxN块划分成多个m*m非重叠区域,并且对于每一区域,它们共享相同元素,并且信令通知这一共享元素。
为了获得尺寸大于8×8的方形矩阵,将8×8基本缩放矩阵升采样(通过对元的复制)至对应的方形尺寸(即,16×16、32×32、64×64)。
以32×2和64×64为例,采用圆圈标出了将信令通知的元素的选定位置。每一方形表示一个元素。
图7示出了用于QM信令通知的选定位置的示例(32×32变换尺寸)。
图8示出了用于QM信令通知的选定位置的示例(64×64变换尺寸)。
2.5.4.2.对于非方形变换尺寸的QM推导
对于非方形变换尺寸而言,没有对QM的额外信令通知。相反,非方形变换尺寸的QM是由方形变换尺寸的QM推导出的。在图7中示出了示例。
更具体而言,在生成矩形TB的缩放矩阵时,考虑两种情况:
1.矩形矩阵的高度H大于宽度W,因而如下由具有尺寸baseL×baseL的参考缩放矩阵定义具有尺寸WxH的矩形TB的缩放矩阵
ScalingMatrix,其中,baseL等于min(log2(H),3):
2.矩形矩阵的高度H小于宽度W,因而如下由具有尺寸baseL×baseL的参考缩放矩阵定义具有尺寸WxH的矩形TB的缩放矩阵
ScalingMatrix,其中,baseL等于min(log2(W),3):
这里,int(x)是通过截断分数部分修改x的值。
图8示出了由方形块对非方形块进行QM推导的示例。(a)由8×8块推导出的2×8块的QM,(b)由8×8块推导出的8×2块的QM。
2.5.4.3.对带有归零的变换块的QM信令通知
此外,在对64点变换应用对高频系数的归零时,缩放矩阵的对应高频也被归零。也就是说,如果TB的宽度或高度大于或等于32,那么仅保留左侧的一半或者顶部的一半系数,并且向其余系数分配零,如图9所示。在根据方程(1)和(2)获得矩形矩阵时针对这一情况执行检查,并且向ScalingMatrix(i,j)中对应元素分配0。
2.5.4.4.用于量化矩阵的语法、语义
将与HEVC中的相同的语法元素添加至SPS和PPS。然而,将缩放列表数据语法的信令通知改为:
7.3.2.11缩放列表数据语法
7.4.3.11缩放列表数据语义
scaling_list_pred_mode_flag[sizeId][matrixId]等于0规定:缩放列表的值与参考缩放列表的值相同。参考缩放列表是由scaling_list_pred_matrix_id_delta[sizeId][matrixId]指定的。scaling_list_pred_mode_flag[sizeId][matrixId]等于1规定:缩放列表的值是显式信令通知的。
scaling_list_pred_matrix_id_delta[sizeId][matrixId]规定用于推导ScalingList[sizeId][matrixId]的参考缩放列表,ScalingList[sizeId][matrixId]的推导如下基于scaling_list_pred_matrix_id_delta[sizeId][matrixId]:
–如果scaling_list_pred_matrix_id_delta[sizeId][matrixId]等于0,那么由表格7-15、表格7-16、表格7-17、表格7-18中规定的默认缩放列表ScalingList[sizeId][matrixId][i](对于i=0..Min(63,(1<<(sizeId<<1))-1))推断出该缩放列表。
–否则,如下由参考缩放列表推断出该缩放列表:
对于sizeId=1…6,
refMatrixId=matrixId-
scaling_list_pred_matrix_id_delta[sizeId][matrixId]*(sizeId==6?3:1) (7-XX)
如果sizeId等于1,那么refMatrixId的值必须不等于0或3。否则,如果sizeId小于或等于5,那么scaling_list_pred_matrix_id_delta[sizeId][matrixId]的值必须处于0到matrixId(含端点)的范围内。否则(sizeId等于6),那么scaling_list_pred_matrix_id_delta[sizeId][matrixId]的值必须处于0到matrixId/3(含端点)的范围内。
表格7-13–sizeId的规范
表格7-14–根据sizeId、预测模式和颜色分量的matrixId规范
scaling_list_dc_coef_minus8[sizeId][matrixId]加8规定在sizeId等于4时对于16x16尺寸而言用于该缩放列表的变量ScalingFactor[4][matrixId][0][0]的值,并且规定在sizeId等于5时对于32x32尺寸而言用于该缩放列表的ScalingFactor[5][matrixId][0][0]的值,并且规定在sizeId等于6时对于64x64尺寸而言用于该缩放列表的ScalingFactor[6][matrixId][0][0]的值。scaling_list_dc_coef_minus8[sizeId][matrixId]的值必须于-7到247(含端点)的范围内。
在scaling_list_pred_mode_flag[sizeId][matrixId]等于0,scaling_list_pred_matrix_id_delta[sizeId][matrixId]等于0,并且sizeId大于3时,将scaling_list_dc_coef_minus8[sizeId][matrixId]的值推断为等于8。
在scaling_list_pred_matrix_id_delta[sizeId][matrixId]不等于0并且sizeId大于3时,将scaling_list_dc_coef_minus8[sizeId][matrixId]的值推断为等于scaling_list_dc_coef_minus8[sizeId][refMatrixId],其中,refMatrixId的值由方程7-XX给定。
在scaling_list_pred_mode_flag[sizeId][matrixId]等于1时,scaling_list_delta_coef规定当前矩阵系数ScalingList[sizeId][matrixId][i]与先前矩阵系数ScalingList[sizeId][matrixId][i-1]之间的差。scaling_list_delta_coef的值必须于-128到127(含端点)的范围内。ScalingList[sizeId][matrixId][i]的值必须大于0。在scaling_list_pred_mode_flag[sizeId][matrixId]等于1并且scaling_list_delta_coef不存在时,将ScalingList[sizeId][matrixId][i]的值推断为0。
表格7-15–ScalingList[1][matrixId][i]的默认值的规范,其中,i=0..3
表格7-16–ScalingList[2][matrixId][i]的默认值的规范,其中,i=0..15
表格7-17–ScalingList[3..6][matrixId][i]的默认值的规范,其中,i=0..63
表格7-18–ScalingList[6][matrixId][i]的默认值的规范,其中,i=0..63
五维数组ScalingFactor[sizeId][sizeId][matrixId][x][y](其中,x,y=0..(1<<sizeId)-1)根据表格7-13中规定的变量sizeId和表格7-14中规定的变量matrixId规定缩放因数的数组。
如下推导具有尺寸2×2的量化矩阵的元素ScalingFactor[1][matrixId][][]:
ScalingFactor[1][1][matrixId][x][y]=ScalingList[1][matrixId][i] (7-XX)
其中,i=0..3,matrixId=1,2,4,5,x=DiagScanOrder[1][1][i][0]并且y=DiagScanOrder[1][1][i][1]
如下推导具有尺寸4×4的量化矩阵的元素ScalingFactor[2][matrixId][][]:
ScalingFactor[2][2][matrixId][x][y]=ScalingList[2][matrixId][i] (7-XX)
其中,i=0..15,matrixId=0..5,x=DiagScanOrder[2][2][i][0]并且y=DiagScanOrder[2][2][i][1]
如下推导具有尺寸8×8的量化矩阵的元素ScalingFactor[3][matrixId][][]:
ScalingFactor[3][3][matrixId][x][y]=ScalingList[3][matrixId][i] (7-XX)
其中,i=0..63,matrixId=0..5,x=DiagScanOrder[3][3][i][0]并且y=DiagScanOrder[3][3][i][1]
如下推导具有尺寸16×16的量化矩阵的元素ScalingFactor[4][matrixId][][]:
ScalingFactor[4][4][matrixId][x*2+k][y*2+j]=ScalingList[4][matrixId][i] (7-XX)
其中,i=0..63,j=0..1,k=0..1,matrixId=0..5,x=DiagScanOrder[3][3][i][0]并且y=DiagScanOrder[3][3][i][1]
ScalingFactor[4][4][matrixId][0][0]=scaling_list_dc_coef_minus8[0][matrixId]+8 (7-XX)
其中,matrixId=0..5
如下推导具有尺寸32×32的量化矩阵的元素ScalingFactor[5][matrixId][][]:
ScalingFactor[5][5][matrixId][x*4+k][y*4+j]=ScalingList[5][matrixId][i] (7-XX)
其中,i=0..63,j=0..3,k=0..3,matrixId=0..5,x=DiagScanOrder[3][3][i][0]并且y=DiagScanOrder[3][3][i][1]
ScalingFactor[5][5][matrixId][0][0]=scaling_list_dc_coef_minus8[1][matrixId]+8 (7-XX)
其中,matrixId=0..5
如下推导具有尺寸64×64的量化矩阵的元素ScalingFactor[6][matrixId][][]:
ScalingFactor[6][6][matrixId][x*8+k][y*8+j]=ScalingList[6][matrixId][i] (7-XX)
其中,i=0..63,j=0..7,k=0..7,matrixId=0,3,x=DiagScanOrder[3][3][i][0]并且y=DiagScanOrder[3][3][i][1]
ScalingFactor[6][6][matrixId][0][0]=scaling_list_dc_coef_minus8[2][matrixId]+8 (7-XX)
其中,matrixId=0,3
在ChromaArrayType等于3时,如下推导具有尺寸64×64的色度量化矩阵的元素ScalingFactor[6][6][matrixId][][](其中,matrixId=1、2、4和5):
ScalingFactor[6][6][matrixId][x*8+k][y*8+j]=ScalingList[5][matrixId][i] (7-XX)
其中,i=0..63,j=0..7,k=0..7,x=DiagScanOrder[3][3][i][0]并且y=DiagScanOrder[3][3][i][1]
ScalingFactor[6][6][matrixId][0][0]=scaling_list_dc_coef_minus8[1][matrixId]+8 (7-XX)
//非方形情况
对于具有矩形尺寸的量化矩阵,
五维数组ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y](其中,x=0..(1<<sizeIdW)-1,y=0..(1<<sizeIdH)-1,sizeIdW!=sizeIdH)如下根据表格7-19中规定的变量sizeIdW和sizeIdHare规定缩放因数的数组
可以按照下述规则由ScalingList[sizeLId][matrixId][i]生成ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y],其中,sizeLId=max(sizeIdW,sizeIdH),sizeIdW=0,1..6,sizeIdH=0,1..6,matrixId=0..5,x=0..(1<<sizeIdW)-1,y=0..(1<<sizeIdH)–1,,x=DiagScanOrder[k][k][i][0]并且y=DiagScanOrder[k][k][i][1],k=min(sizeLId,3)并且ratioW=(1<<sizeIdW)/(1<<k),ratioH=(1<<sizeIdH)/(1<<k)并且ratioWH=(1<<abs(sizeIdW-sizeIdH))
-If(sizeIdW>sizeIdH)
ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y]=ScalingList[sizeLId][matrixId][Raster2Diag[(1<<k)*((y*ratioWH)/ratioW)+x/ratioW]]
-else
ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y]=ScalingList[sizeLId][matrixId][Raster2Diag[(1<<k)*(y/ratioH)+(x*ratioWH)/ratioH]],
其中,Raster2Diag[]是将一个8×8块中的光栅扫描位置转化为对角线扫描位置的函数
//归零情况
对于满足下述条件的样点必须对具有矩形尺寸的量化矩阵进行归零处理
-x>32
-y>32
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdW)==32并且x>16
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdH)==32并且y>16
表格7-19–sizeIdW和sizeIdH的规范
2.6量化残差块差分脉冲编解码调制
在JVET-M0413中,提出了量化残差块差分脉冲编解码调制(QR-BDPCM)以高效率地对屏幕内容进行编解码。
QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。通过在类似于帧内预测的预测方向(水平或垂直预测)内进行样点复制来对整个块进行帧内预测。对残差进行量化,并对量化残差与其预测子(水平或垂直)量化值之间的Δ进行编解码。可以通过如下方式描述这种情况:对于尺寸为M(行)×N(列)的块,令ri,j(0≤i≤M-1,0≤j≤N-1)为使用来自上方或左侧块边界样点的未滤波样点水平地(跨越预测块逐条线地复制左侧邻居像素值)或垂直地(将顶部邻居线复制到预测块中的每条线)执行帧内预测之后的预测残差。令Q(ri,j)(0≤i≤M-1,0≤j≤N-1)表示残差ri,j的量化版本,其中,残差是初始块和预测块值之间的差值。然后,将块DPCM应用于量化残差样点,获得修改的M×N数组其元素为在信令通知垂直BDPCM时:
对于水平预测而言,适用类似规则,并且通过如下方程获得残差量化样点
在解码器侧,逆转以上计算,从而产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
对于水平情况,
将逆量化残差Q-1(Q(ri,j))加到帧内块预测值上,以产生重建样点值。
这种方案的主要益处在于,能够在解析系数时简单地通过加上预测子而在系数解析期间即时完成逆DPCM,或者其可以在解析之后执行。
如下示出了QR-BDPCM的草案文本变化。
7.3.6.5编解码单元语法
bdpcm_flag[x0][y0]等于1规定在包括位置(x0,y0)处的亮度编解码块的编解码单元中存在bdpcm_dir_flag
bdpcm_dir_flag[x0][y0]等于0规定要在bdpdcm块中使用的预测方向为水平方向,否则其为垂直方向。
3.由实施例和技术解决的示例性技术问题
当前VVC设计在量化矩阵方面具有以下问题:
1.对于QR-BDPCM块和BDPCM块,不应用变换。因此,按照与其他应用变换的块类似的方式对此类块应用缩放矩阵是非优选的。
2.IBC和帧内编解码模式共享相同的缩放矩阵。然而,IBC更类似于一种帧间编解码工具。这样的设计似乎是不合理的。
3.对于带有归零的较大块,信令通知几个元素,但是在解码过程中却被重置为零,这浪费了比特。
4.在一些框架当中,按照总是应用量化矩阵的方式执行量化。因而,对于小块的量化矩阵可能引起频繁的矩阵变化。
4.实施例和技术的列举
下文详述的发明应被视为解释一般概念的示例。不应狭义地解释这些发明。此外,可以按照任何方式使这些方面相结合。
1.当在比特流中不信令通知变换跳过(TS)标志时,如何设置这一标志的值可以取决于编解码模式信息。
a.在一个示例中,对于BDPCM/QR-BDPCM编解码块,将TS标志推断为1。
b.在一个示例中,对于非BDPCM/QR-BDPCM编解码块,将TS标志推断为0。
2.提出了可以对BDPCM/QR-BDPCM编解码块应用缩放矩阵。
a.替代性地,提出了对于BDPCM/QR-BDPCM编解码块不允许缩放矩阵。
b.在一个示例中,可以按照与变换跳过编解码块相同的方式执行如何为BDPCM/QR-BDPCM编解码块选择缩放矩阵。
c.在一个示例中,如何选择BDPCM/QR-BDPCM编解码块的缩放矩阵可以取决于是否对该块应用一个或多个变换。
i.在一个示例中,如果对BDPCM/QR-BDPCM编解码块应用一个或多个变换,那么可以允许缩放矩阵。
ii.在一个示例中,如果对BDPCM/QR-BDPCM编解码块应用一个或多个变换,那么如何选择BDPCM/QR-BDPCM编解码块的缩放矩阵可以是按照与帧内编解码块相同的方式执行的。
3.是否和/或如何通过环路滤波器(去方块滤波器)和/或其他重建后滤波器对两个紧邻块之间的样点/边缘滤波可以取决于这两个紧邻块中的任何一者或两者是否是采用变换跳过(TS)模式编解码的。
a.是否和/或如何通过环路滤波器(去方块滤波器)和/或其他重建后滤波器对两个紧邻块之间的样点/边缘滤波可以取决于这两个紧邻块是否是采用TS、BDPCM、QR-BDPCM、调色板模式编解码的。
b.在一个示例中,边界滤波强度的推导可以取决于这两个紧邻块之一或两者的(多个)TS模式标志。
c.在一个示例中,对于位于TS编解码块处的样点,可以禁用去方块滤波器/样点自适应偏移/自适应环路滤波器/其他种类的环路滤波器/其他重建后滤波器。
i.在一个示例中,如果两个紧邻块都是采用变换跳过模式编解码的,那么不需要对这两个块之间的边缘滤波。
ii.在一个示例中,如果两个紧邻块之一是采用变换跳过模式编解码的,另一个不是,那么不需要对处于TS编解码块处的样点滤波。
d.替代性地,对于位于TS编解码块处的样点,可以允许不同滤波器(例如,更平滑的滤波器)。
e.在环路滤波器(例如,去方块滤波器)和/或其他重建后滤波器(例如,双边滤波器、扩散滤波器)的处理期间,可以按照与采用TS模式编解码相同的方式(例如,上文所提及的)处理采用PCM/BDPCM/QR-BDPCM和/或其他种类的不应用变换的模式编解码的块。
4.采用IBC模式和帧间编解码模式编解码的块可以共享相同的缩放矩阵。
5.缩放矩阵选择可以取决于变换矩阵类型。
a.在一个示例中,缩放矩阵的选择可以取决于该块是否使用默认变换,例如,DCT2。
b.在一个示例中,可以对多个变换矩阵类型单独信令通知缩放矩阵。
6.缩放矩阵选择可以取决于块的运动信息。
a.在一个示例中,缩放矩阵选择可以取决于该块是否是采用子块编解码模式(例如,仿射模型)编解码的。
b.在一个示例中,可以对仿射模式和非仿射模式单独信令通知缩放矩阵。
c.在一个示例中,缩放矩阵选择可以取决于该块是否是采用仿射帧内预测模式编解码的。
7.提出了对二次变换编解码块启用缩放矩阵,取代对二次变换编解码块禁用缩放矩阵。假定变换块尺寸由K×L表示,并且对左上M×N块应用二次变换。
a.可以为二次变换或/和缩减二次变换或/和旋转变换在片组标头/条带标头/PPS/VPS/SPS中信令通知缩放矩阵。
b.在一个示例中,可以根据是否应用二次变换选择缩放矩阵。
i.在一个示例中,可以为是否应用二次变换单独信令通知左上M×N块的缩放矩阵的元素。
c.替代性地,此外,缩放矩阵可以仅适用于不应用二次变换的区域。
d.在一个示例中,除了左上M×N区域的其余部分仍然可以应用缩放矩阵。
e.替代性地,缩放矩阵可以仅适用于应用二次变换的区域。
8.提出了信令通知非方形块的缩放矩阵,取代从方形块推导非方形块的缩放矩阵。
a.在一个示例中,对于可能用来自方形块的预测编解码的非方形块可以启用缩放矩阵。
9.提出了对于一些位置禁用缩放矩阵的使用,并且对于块内的其余位置启用缩放矩阵的使用。
a.例如,对于包括超过M*N个位置的块,只有左上方的M*N区域可以使用缩放矩阵。
b.例如,对于包括超过M*N个位置的块,只有上方的M*N区域可以使用缩放矩阵。
c.例如,对于包括超过M*N个位置的块,只有左侧的M*N区域可以使用缩放矩阵。
10.将信令通知缩放矩阵中的多少个元素可以取决于是否应用归零。
a.在一个示例中,对于64×64变换,假定仅保持左上的M×N个变换系数,并且使所有其余系数归零。那么可以要信令通知的元素的数量推导为M/8*N/8。
11.对于带有归零的变换,提出了禁止信令通知缩放矩阵中的位于归零区域中的元素。对于K×L变换,假定仅保持左上的M×N个变换系数,并且使所有其余系数归零。
a.在一个示例中,K=L=64并且M=N=32。
b.在一个示例中,跳过对缩放矩阵中的对应于左上M×N区域外的位置的元素的信令通知。
图10示出了仅信令通知虚线区域(例如,M×N区域)内的选定元素的示例。
c.在一个示例中,为在缩放矩阵中选择元素的下采样比可以由K和/或L确定。
i.例如,将变换块划分成多个子区域,并且每一子区域尺寸为Uw*Uh。可以信令通知位于左上M×N区域的每一子区域内的一个元素。
ii.替代性地,此外,要对多少个元素编解码可以取决于M和/或N。
1)在一个示例中,对于这种带有归零的K×L变换,待编解码的元素的数量与不带有归零的M×N变换块的不同。
d.在一个示例中,为选择缩放矩阵中的元素的下采样比可以是由M和/或N确定的,而不是由K和L确定。
i.例如,将该M×N区域划分成多个子区域。可以信令通知每一区域(M/Uw,N/Uh)内的一个元素。
ii.替代性地,此外,对于这种带有归零的K×L变换待编解码的元素的数量与不带有归零的M×N变换块的相同。
e.在一个示例中,K=L=64,M=N=32,Uw=Uh=8。
12.提出了对某些块尺寸(例如,对小尺寸块)仅使用一个量化矩阵。
a.在一个示例中,可以不允许所有小于W×H的块(不管块类型如何)使用两个或更多量化矩阵。
b.在一个示例中,可以不允许所有宽度小于阈值的块使用两个或更多量化矩阵。
c.在一个示例中,可以不允许所有高度小于阈值的块使用两个或更多量化矩阵。
d.在一个示例中,可以不对小尺寸块应用量化矩阵。
13.以上项目符号可以适用于其他不应用变换(或者不应用恒等变换)的编解码方法。
a.在一个示例中,通过以“调色板”代替“TS/BDPCM/QR-BDPCM”,以上项目符号可以适用于调色板模式编解码块。
5.实施例
5.1关于去方块滤波器的实施例#1
通过加粗斜体文本突出呈现对VVC工作草案版本5施加的修改。可以添加突出呈现的条件中的一者或多者。
8.8.2去方块滤波过程
8.8.2.1概述
这个过程的输入是去方块之前的重建图片,即,数组recPictureL,以及ChromaArrayType不等于0时的数组recPictureCb和recPictureCr。
这个过程的输出是去方块之后的经修改的重建图片,即,数组recPictureL以及ChromaArrayType不等于0时的数组recPictureCb和recPictureCr。
首先对图片中的垂直边缘进行滤波。然后利用由垂直边缘滤波过程修改的样点作为输入对图片中的水平边缘进行滤波。基于编解码单元,独立地处理每个CTU的CTB中的垂直和水平边缘。从编解码块左侧的边缘开始,对编解码单元中编解码块的垂直边缘进行滤波,按照其几何顺序,朝向编解码块的右侧,通过各个边缘进行滤波。从编解码块上方的边缘开始,对编解码单元中编解码块的水平边缘进行滤波,按照其几何顺序,朝向编解码块的下方,通过各个边缘进行滤波。
注意——尽管在本说明书中基于图片规定了滤波过程,但可以基于编解码单元实施滤波过程而获得等价效果,条件是解码器适当考虑处理依赖性顺序,以便产生相同的输出值。
将去方块滤波过程应用于图片的所有编解码子块边缘和变换块边缘,除了以下类型的边缘:
-处于图片边界处的边缘,
-在pps_loop_filter_across_virtual_boundaries_disabled_flag等于1时,与图片的虚拟边界重合的边缘,
-在loop_filter_across_bricks_enabled_flag等于0时,与图块边界重合的边缘,
-在slice_loop_filter_across_slices_enabled_flag等于0或slice_deblocking_filter_disabled_flag等于1时,与条带的上边界或左边界重合的边缘,
-在slice_deblocking_filter_disabled_flag等于1时,条带之内的边缘,
-不对应于所考虑分量的8×8样点网格边界的边缘,
–色度分量内的边缘,对其而言边缘两侧均使用帧间预测,
–色度变换块的不是关联变换单元的边缘的的边缘。
–跨越具有不等于ISP_NO_SPLIT的IntraSubPartitionsSplit值的编解码单元的亮度变换块的边缘。
–两个变换跳过编解码块之间的边缘。
–处于一个变换跳过编解码块和一个PCM编解码块之间的边缘。
–处于一个变换跳过编解码块和一个QR-BDPCM编解码块之间的边缘。
–处于一个变换跳过编解码块和一个BDPCM编解码块之间的边缘。
–处于一个PCM编解码块和一个QR-BDPCM编解码块之间的边缘。
5.2关于缩放矩阵的实施例#2
这一章节提供了章节4中的项目符号11.d的示例。
如下推导具有尺寸64×64的量化矩阵的元素ScalingFactor[6][matrixId][][]:
此外,
ScalingFactor[6][6][matrixId][x][y]=0 (7-xx)
其中,x>=32||y>=32
ScalingFactor[6][6][matrixId][0][0]=scaling_list_dc_coef_minus8[2][matrixId]+8 (7-XX)
其中,matrixId=0,3
//归零情况
对于满足下述条件的样点必须对具有矩形尺寸的量化矩阵进行归零处理
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdW)==32并且x>16
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdH)==32并且y>16
5.3关于缩放矩阵的实施例#3
这一章节提供了章节4中的项目符号9、11.c的示例。
7.3.2.11缩放列表数据语法
如下推导具有尺寸64x64的量化矩阵的元ScalingFactor[6][matrixId][][]:
ScalingFactor[6][6][matrixId][x*8+k][y*8+j]=ScalingList[6][matrixId][i] (7-XX)
此外,
ScalingFactor[6][6][matrixId][x][y]=0 (7-xx)
其中,x>=32||y>=32
ScalingFactor[6][6][matrixId][0][0]=scaling_list_dc_coef_minus8[2][matrixId]+8 (7-XX)
其中,matrixId=0,3
//归零情况
对于满足下述条件的样点必须对具有矩形尺寸的量化矩阵进行归零处理
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdW)==32并且x>16
-解码后的tu不是通过默认变换模式编解码的,(1<<sizeIdH)==32并且y>16
5.4关于缩放矩阵的实施例#4
这一章节提供了对于QR-BDPCM编解码块不允许缩放矩阵的示例。
通过加粗斜体文本突出呈现对JVET-N0847施加的修改,并且采用删除线标记去除的文本。可以添加突出呈现的条件中的一者或多者。
8.7.3变换系数的缩放过程
这一过程的输入为:
–亮度位置(xTbY,yTbY),相对于当前图片的左上亮度样点指定当前亮度变换块的左上样点,
–指定变换块宽度的变量nTbW,
–指定变换块高度的变量nTbH,
–变量cIdx,指定当前块的颜色分量,
–变量bitDepth,指定当前颜色分量的比特深度。
这一过程的输出为具有元素d[x][y]的缩放变换系数的(nTbW)x(nTbH)数组d。
如下推导量化参数qP:
–如果cIdx等于0,那么以下内容适用:
qP=Qp′Y (8-1019)
–否则,如果cIdx等于1,那么以下内容适用:
qP=Qp′Cb (8-1020)
–否则(cIdx等于2),那么以下内容适用:
qP=Qp′Cr (8-1021)
如下推导变量rectNonTsFlag:
rectNonTsFlag=(((Log2(nTbW)+Log2(nTbH))&1)==1&&
(8-1022)
transform_skip_flag[xTbY][yTbY]==0)
如下推导变量bdShift、rectNorm和bdOffset:
bdShift=bitDepth+((rectNonTsFlag?8:0)+
(8-1023)
(Log2(nTbW)+Log2(nTbH))/2)-5+dep_quant_enabled_flag
rectNorm=rectNonTsFlag?181:1 (8-1024)
bdOffset=(1<<bdShift)>>1 (8-1025)
将列表levelScale[]规定为levelScale[k]={40,45,51,57,64,72},其中,k=0..5。
对于经缩放的变换系数d[x][y]的推导(其中,x=0..nTbW-1,y=0..nTbH-1),以下内容适用:
–如下推导中间缩放因数m[x][y]:
–如果下述条件中的一者或多者为真,那么将m[x][y]设置为等于16:
–scaling_list_enabled_flag等于0。
–transform_skip_flag[xTbY][yTbY]等于1。
–bdpcm_flag[xTbY][yTbY]等于1。
–否则,以下内容适用:
–m[x][y]=ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y] (8-XXX)
其中,将sizeIdW设置为等于Log2(nTbW),将sizeIdH设置为等于Log2(nTbH),并且在表格7-14中规定了matrixId。
–如下推导缩放因数ls[x][y]:
-如果dep_quant_enabled_flag等于1,那么以下内容适用:
ls[x][y]=(m[x][y]*levelScale[(qP+1)%6])<<((qP+1)/6) (8-1026)
–否则(dep_quant_enabled_flag等于0),以下内容适用:
ls[x][y]=(m[x][y]*levelScale[qP%6])<<(qP/6) (8-1027)
–如下推导dnc[x][y]的值:
dnc[x][y] = (8-1028)
(TransCoeffLevel[xTbY][yTbY][cIdx][x][y]*ls[x][y]*rectNorm+bdOffset)>>bdShift
–如下推导经缩放的变换系数d[x][y]:
d[x][y]=Clip3(CoeffMin,CoeffMax,dnc[x][y]) (8-1029)
5.5关于变换跳过标志的语义的实施例#5
transform_skip_flag[x0][y0]规定是否对亮度变换块应用变换。数组索引x0、y0指定所考虑的变换块的左上亮度样点相对于该图片的左上亮度样点位置(x0,y0)。transform_skip_flag[x0][y0]等于1规定不对该亮度变换块应用变换。transform_skip_flag[x0][y0]等于0规定是否对该亮度变换块应用变换的决定将取决于其他语法元素。在transform_skip_flag[x0][y0]不存在并且bdpcm_flag[x0][y0]等于0时,推断transform_skip_flag[x0][y0]等于0。在transform_skip_flag[x0][y0]不存在并且bdpcm_flag[x0][y0]等于1时,推断transform_skip_flag[x0][y0]等于0。
图11是视频处理装置1100的框图。装置1100可以用于实施本文描述的方法中的一者或多者。装置1100可以被体现到智能手机、平板电脑、计算机、物联网(IoT)接收器等当中。装置1100可以包括一个或多个处理器1102、一个或多个存储器1104以及视频处理硬件1106。(一个或多个)处理器1102可以被配置为实施本文件中描述的一种或多种方法。(一个或多个)存储器1104可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件1106可以用于在硬件电路中实施本文件中描述的一些技术。
可以实施以下解决方案作为一些实施例中的优选解决方案。
可以将下述解决方案与先前章节中列举的项目(例如,项目1)当中描述的附加技术一起实施。
1.一种视频处理方法(例如,图12中所示的方法1200),包括:针对视频的视频块的编解码表示与该视频块之间的转换,基于编解码模式信息确定(1202)是否对该转换启用变换跳过模式;以及基于该确定执行(1204)该转换,其中,在变换跳过模式中,在该转换期间跳过对表示该视频块的至少一些系数的变换应用。
2.根据解决方案1所述的方法,其中,由于编解码模式信息指示块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)而确定启用变换跳过模式。
3.根据解决方案1所述的方法,其中,不对该编解码表示中的指示变换跳过模式的标志进行解析。
4.根据解决方案1所述的方法,其中,跳过对该编解码表示中的指示变换跳过模式的标志的解析。
可以将下述解决方案与先前章节中列举的项目(例如,项目2)当中描述的附加技术一起实施。
5.一种视频处理方法,包括:由于对视频块的编解码表示和该视频块之间的转换使用了块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)模式而确定对该转换使用缩放矩阵;以及使用该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间对表示该视频块的至少一些系数进行缩放。
6.根据解决方案5所述的方法,其中,该转换包括根据取决于在该转换期间将对所述系数应用的变换的数量的模式应用该缩放矩阵。
7.一种视频处理方法,包括:由于对视频块的编解码表示和该视频块之间的转换使用了块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)模式而确定禁止对该转换使用缩放矩阵;以及使用该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间对表示该视频块的至少一些系数进行缩放。
可以将下述解决方案与先前章节中列举的项目(例如,项目3)当中描述的附加技术一起实施。
8.一种视频处理方法,包括:针对视频的视频块的编解码表示与该视频块之间的转换,依据是否对该转换启用变换跳过模式而确定环路滤波器的适用性;以及基于环路滤波器的适用性执行该转换,其中,在变换跳过模式中,在该转换期间跳过对表示该视频块的至少一些系数的变换应用。
9.根据解决方案8所述的方法,其中,所述环路滤波器包括去方块滤波器。
10.根据解决方案8-9中的任何解决方案所述的方法,进一步包括基于该视频块的变换跳过模式和邻近块的另一变换跳过模式确定环路滤波器的强度。
11.根据解决方案8-9中的任何解决方案所述的方法,其中,该确定包括确定由于对该视频块禁用该变换跳过模式的原因环路滤波器不适用。
可以将下述解决方案与先前章节中列举的项目(例如,项目4和5)当中描述的附加技术一起实施。
12.一种视频处理方法,包括:针对视频的视频块与视频块的编解码表示之间的转换选择缩放矩阵,从而将同一缩放矩阵用于基于帧间编解码和帧内块复制编解码的转换;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放所述视频块的至少一些系数。
可以将下述解决方案与先前章节中列举的项目(例如,项目6)当中描述的附加技术一起实施。
13.一种视频处理方法,包括:基于为视频的视频块与视频块的编解码表示之间的转换选择的变换矩阵选择用于该转换的缩放矩阵;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放视频块的至少一些系数,并且其中,该变换矩阵用于在该转换期间变换视频块的至少一些系数。
14.根据解决方案13所述的方法,其中,选择缩放矩阵基于视频块的转换是否使用子块编解码模式。
15.根据解决方案14所述的方法,其中,该子块编解码模式为仿射编解码模式。
16.根据解决方案15所述的方法,其中,用于仿射编解码模式的缩放矩阵不同于另一个视频块的另一缩放矩阵,其中,该另一视频块的转换不使用仿射编解码模式。
可以将下述解决方案与先前章节中列举的项目(例如,项目7)当中描述的附加技术一起实施。
17.一种视频处理方法,包括:基于为视频的视频块与视频块的编解码表示之间的转换选择的二次变换矩阵选择用于该转换的缩放矩阵;以及使用所选择的缩放矩阵执行该转换,其中,该缩放矩阵用于缩放视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换视频块的至少一些残差系数。
18.根据解决方案17所述的方法,其中,将该二次变换矩阵应用于该视频块的MxN左上部分,并且其中,将该缩放矩阵应用于超过该视频块的MxN左上部分的范围。
19.根据解决方案17所述的方法,其中,将该二次变换矩阵应用于该视频块的MxN左上部分,并且其中,将该缩放矩阵仅应用于该视频块的MxN左上部分。
20.根据解决方案17-19中的任何解决方案所述的方法,其中,该编解码表示中的语法元素指示该缩放矩阵。
可以将下述解决方案与先前章节中列举的项目(例如,项目8)当中描述的附加技术一起实施。
21.一种视频处理方法,包括:针对具有非方形形状的视频块确定在该视频块与该视频块的编解码表示之间的转换中使用的缩放矩阵,其中,该编解码表示中的语法元素信令通知该缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该缩放矩阵用于在该转换期间缩放视频块的至少一些系数。
22.根据解决方案21所述的方法,其中,该语法元素由先前方形块的缩放矩阵对该缩放矩阵进行预测编解码。
可以将下述解决方案与先前章节中列举的项目(例如,项目9)当中描述的附加技术一起实施。
23.一种视频处理方法,包括:确定将在视频块的编解码表示与该视频块之间的转换期间部分地应用的缩放矩阵;以及通过部分地应用该缩放矩阵从而在该视频块的第一组位置上应用该缩放矩阵并且在该视频块的其余位置上禁用该缩放矩阵来执行该转换。
24.根据解决方案23所述的方法,其中,第一组位置包括该视频块的左上M*N个位置。
25.根据解决方案23所述的方法,其中,第一组位置对应于该视频块的顶部M*N个位置。
26.根据解决方案23所述的方法,其中,第一组位置包括该视频块的左侧M*N个位置。
可以将下述解决方案与先前章节中列举的项目(例如,项目10和11)当中描述的附加技术一起实施。
27.一种视频处理方法,包括:确定将在视频块的编解码表示与该视频块之间的转换期间应用缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该编解码表示信令通知该缩放矩阵的元的数量,其中,该数量取决于该转换中的系数归零的应用。
28.根据解决方案27所述的方法,其中,该转换包括对该视频块的左上MxN个位置以外的所有位置归零,并且其中,该数量为M/8*N/8。
可以将下述解决方案与先前章节中列举的项目(例如,项目11)当中描述的附加技术一起实施。
29.根据解决方案27-28中的任何解决方案所述的方法,其中,该数量取决于在该转换期间使用的变换矩阵。
30.根据解决方案29所述的方法,其中,该变换矩阵具有尺寸KxL,并且其中,只有顶部的MxN个系数不被归零。
31.根据解决方案27-30中的任何解决方案所述的方法,其中,通过根据由K或L确定的因数进行子采样而应用该缩放矩阵。
可以将下述解决方案与先前章节中列举的项目(例如,项目12)当中描述的附加技术一起实施。
32.一种视频处理方法,包括:在视频块与该视频块的编解码表示之间的转换期间基于具有特定类型的该视频块的尺寸确定要使用的单个量化矩阵;以及使用该量化矩阵执行该转换。
33.根据解决方案32所述的方法,其中,该视频块的尺寸小于WxH,其中,W和H为整数。
34.根据解决方案32-33中的任何解决方案所述的方法,其中,该视频块的宽度小于阈值。
35.根据解决方案32-33中的任何解决方案所述的方法,其中,该视频块的高度小于阈值。
36.根据解决方案32所述的方法,其中,该量化矩阵是不影响量化值的恒等量化矩阵。
37.根据解决方案1到36中的任何解决方案所述的方法,其中,该转换包括将该视频编码成编解码表示。
38.根据解决方案1到36中的任何解决方案所述的方法,其中,该转换包括对该编解码表示解码,以生成该视频的像素值。
39.一种视频解码装置,包括处理器,该处理器被配置为实施根据解决方案1到38中的一者或多者所述的方法。
40.一种视频编码装置,包括处理器,该处理器被配置为实施根据解决方案1到38中的一者或多者所述的方法。
41.一种具有存储于其上的计算机代码的计算机程序产品,代码在被处理器执行时使得该处理器实施根据解决方案1到38中的任何解决方案所述的方法。
42.本文件中描述的方法、装置或系统。
所公开技术的一些实施例包括作出启用视频处理工具或模式的判定或决定。在一个示例中,当视频处理工具或模式被启用时,编码器将在视频块的处理中使用或实施该工具或模式,但不一定基于该工具或模式的使用来修改所得的比特流。也就是说,当基于判定或决定启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知道已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说,将使用基于判定或决定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包括作出禁用视频处理工具或模式的判定或决定。在一个示例中,当视频处理工具或模式被禁用时,编码器在将视频块转换为视频的比特流表示中将不使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知道并未使用基于判定或决定禁用的视频处理工具或模式对比特流做出修改的情况下处理比特流。
图15是示出了可以利用本公开的技术的示例性视频编解码系统100的框图。如图15中所示,视频编解码系统100可以包括源设备110和目标设备120。可以被称为视频编码设备的源设备110生成编码视频数据。可以被称为视频解码设备的目标设备120可以对源设备110生成的编码视频数据解码。源设备110可以包括视频源112、视频编解码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备的源、从视频内容提供商接收视频数据的接口、和/或为生成视频数据的计算机图形系统、或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码,以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码的视频数据可以通过网络130a经由I/O接口116直接传输到目标设备120。编码的视频数据也可以存储在存储介质/服务器130b上,以供目标设备120访问。
目标设备120可以包括I/O接口126、视频解码器124和显示设备122。
目标设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以解码编码的视频数据。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目标设备120集成,或者可以在目标设备120的外部,目标设备120被配置为与外部显示设备接口。
视频编码器114和视频解码器124可以根据视频压缩标准操作,诸如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其他当前和/或进一步的标准。
图16是示出视频编码器200的示例的框图,视频编码器200可以是图15所示的系统100中的视频编码器114。
视频编解码器200可以被配置成执行本公开的任何或所有技术。在图16的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206的预测单元202、残差生成单元207、变换单元208、量化单元209、反量化单元210、逆变换单元211、重建单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块拷贝(intra block copy,IBC)单元。IBC单元可以在IBC模式下执行预测,在IBC模式下,至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以是高度集成的,但是为了解释的目的,在图18的示例中单独表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于误差结果选择帧内或帧间编解码模式之一,并将所得的帧内或帧间编解码块提供给残差生成单元207以生成残差块数据,并提供给重建单元212以重建编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测组合(CIIP)模式,在CIIP模式下,预测是基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以为块选择运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲器213的除了与当前视频块相关联的图片之外的图片的解码样点来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带中、P条带中还是在B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元204然后可以生成指示包含参考视频块的列表0或列表1中的参考图片的参考索引和指示当前视频块和参考视频块之间的空间位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以为当前视频块的参考视频块搜索列表0中的参考图片,并且还可以为当前视频块的另一个参考视频块搜索列表1中的参考图片。运动估计单元204然后可以生成指示包含参考视频块的列表0和列表1中的参考图片的参考索引以及指示参考视频块和当前视频块之间的空间位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出完整的运动信息集,用于解码器的解码处理。
在一些示例中,运动估计单元204可能不输出当前视频的完整的运动信息集。相反,运动估计单元204可以参考另一视频块的运动信息信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示一个值,该值向视频解码器300指示当前视频块具有与另一视频块相同的运动信息。
在另一示例中,运动估计单元204可以在与当前视频块相关联的语法结构中识别另一视频块和运动矢量差值(MVD)。运动矢量差值指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差值。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差值来确定当前视频块的运动矢量。
如上所述,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(advanced motionvector predication,AMVP)和Merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号表示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式中,当前视频块可能没有当前视频块的残差数据,并且残差生成单元207可能不执行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(quantization parameter,QP)值来量化与当前视频块相关联的变换系数视频块。
反量化单元210和逆变换单元211可以分别对变换系数视频块应用反量化和逆变换,以从变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到由预测单元202生成的一个或多个预测视频块的相应样点,以产生与当前块相关联的重建视频块,用于存储在缓冲器213中。
在重建单元212重建视频块之后,可以执行环路滤波操作来减少视频块中的视频块伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码数据,并输出包括熵编码数据的比特流。
图13是示出视频解码器300的示例的框图,视频解码器300可以是图15所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图13的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图13的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、反量化单元304、逆变换单元305以及重建单元306和缓冲器307。在一些示例中,视频解码器300可以执行通常与视频编码器200(图16)描述的编码过程相反的解码过程。
熵解码单元301可以获取编码比特流。该编码比特流可以包括熵编解码的视频数据(例如,视频数据的编码块)。熵解码单元301可以解码熵编解码的视频数据,并且根据熵解码的视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。要以亚像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用视频编码器20在视频块编码期间使用的插值滤波器来计算参考块的亚整数像素的插值。运动补偿单元302可以根据接收的语法信息确定视频编码器200使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分区如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空间紧邻的块形成预测块。反量化单元303对在比特流中提供并由熵解码单元301解码的量化视频块系数进行反量化,即,解量化。逆变换单元303应用逆变换。
重建单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的相应预测块相加,以形成解码块。如果需要,还可以应用去块滤波器来滤波解码的块,以便去除成块效应(blockiness artifacts)。解码的视频块然后被存储在缓冲器307中,缓冲器307为随后的运动补偿/帧内预测提供参考块,并且还产生解码的视频以在显示设备上呈现。
在本文件中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,视频压缩算法可以在从视频的像素表示到相应比特流表示的转换期间应用,反之亦然。当前视频块的比特流表示或编解码表示可以例如对应于比特流中的并置或分布在不同位置的比特,如语法所定义的。例如,视频块可以根据变换和编解码误差残余值来编码,并且还可以使用比特流中的标头和其他字段中的比特来编解码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上解决方案中所述。类似地,编码器可以确定是否包括某些语法字段,并通过从编解码表示中包括或排除语法字段来相应地生成编解码表示。
图14是示出其中可以实施本文公开的各种技术的示例视频处理系统2000的框图。各种实施方式可以包括系统2000的一些或全部组件。系统2000可以包括用于接收视频内容的输入2002。视频内容可以以原始或未压缩格式接收,例如8或10比特多分量像素值,或者可以以压缩或编码格式接收。输入2002可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(Passive Optical Network,PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统2000可以包括编解码组件2004,其可以实施本文档中描述的各种编解码或编码方法。编解码组件2004可以降低从输入2002到编解码组件2004的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件2004的输出可以被存储,或者经由连接的通信(如由组件2006表示的)传输。组件2008可以使用存储的或在输入2002处接收的视频的通信传送的比特流(或编解码)表示来生成发送到显示接口2010的像素值或可显示视频。从比特流表示生成用户可观看的视频的过程有时被称为视频解压缩。此外,虽然特定视频处理操作被称为“编解码”操作或工具,但是应当理解,编解码工具或操作在编码器处使用,并且将由解码器来执行反转编解码结果的对应的解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型计算机、智能手机或能够执行数字数据处理和/或视频显示的其他设备。
图17是视频处理的示例性方法1700的流程图。方法1700包括:执行(1702)视频的视频块与该视频的编解码表示之间的转换,其中,该编解码表示符合格式规则,其中,该格式规则规定通过该视频块的编解码条件确定变换跳过模式对该视频块的适用性,其中,该格式规则规定从该编解码表示中省略指示变换跳过模式的适用性的语法元素,并且其中,该变换跳过模式包括在编码成该编解码表示之前,跳过对至少一些系数应用正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用逆变换。
图18是视频处理的示例性方法1800的流程图。方法1800包括:针对视频的两个紧邻视频块与该视频的编解码表示之间的转换,依据是否对该转换使用正向变换或逆变换而确定(1802)是否将对该转换使用环路滤波器或重建后滤波器,其中,该正向变换包括在编码成该编解码表示之前,跳过对至少一些系数应用该正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用该逆变换;以及基于环路滤波器或重建后滤波器的使用执行(1804)该转换。
图19是视频处理的示例性方法1900的流程图。方法1900包括:针对视频的视频块与该视频的编解码表示之间的转换,因对该转换使用块差分脉冲编解码调制(BDPCM)编解码工具或量化残差BDPCM(QR-BDPCM)编解码工具的原因而确定(1902)使用缩放工具;以及在使用该缩放工具的情况下执行(1904)该转换,其中,该编解码表示中的语法元素指示该缩放工具的使用,并且其中,该缩放根据的使用包括:在编码期间缩放表示该视频块的至少一些系数或者在解码期间对来自该编解码表示的至少一些系数去缩放。
图20是视频处理的示例性方法2000的流程图。方法2000包括:针对视频的视频块与该视频的编解码表示之间的转换,因用于该视频块的转换的块差分脉冲编解码调制(BDPCM)编解码工具或量化残差BDPCM(QR-BDPCM)编解码工具的原因而确定(2002)禁止使用缩放工具;以及在不使用该缩放工具的情况下执行(2004)该转换,其中,该缩放根据的使用包括:在编码期间缩放表示该视频块的至少一些系数或者在解码期间对来自该编解码表示的至少一些系数去缩放。
图21是视频处理的示例性方法2100的流程图。方法2100包括:针对视频的视频块与该视频的编解码表示之间的转换,基于为该转换选择的变换矩阵选择(2102)缩放矩阵,其中,这些缩放矩阵用于缩放这些视频块的至少一些系数,并且其中,这些变换矩阵用于在该转换期间变换这些视频块的所述至少一些系数;以及使用这些缩放矩阵执行(2104)该转换。
图22是视频处理的示例性方法2200的流程图。方法2200包括:根据规则基于是否对视频的视频块的部分应用二次变换矩阵而确定(2202)是否应用缩放矩阵,其中,该缩放矩阵用于缩放该视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换该视频块的该部分的至少一些残差系数;以及使用所选择的缩放矩阵执行(2204)该视频的视频块与该视频的比特流表示之间的转换。
图23是视频处理的示例性方法2300的流程图。方法2300包括:对具有非方形形状的视频块确定(2302)在视频的该视频块与该视频的编解码表示之间的转换中使用的缩放矩阵,其中,该编解码表示中的语法元素信令通知该缩放矩阵,并且其中,该缩放矩阵用于在该转换期间缩放视频块的至少一些系数;以及基于该缩放矩阵执行(2304)该转换。
图24是视频处理的示例性方法2400的流程图。方法2400包括执行(2402)视频的视频块与该视频的编解码表示之间的转换,其中,基于规则,该视频块包括第一数量的位置,在这些位置上在该转换期间应用缩放矩阵,并且该视频块还包括第二数量的位置,在这些位置上在在该转换期间不应用该缩放矩阵。
图25是视频处理的示例性方法2500的流程图。方法2500包括:确定(2502)将在视频的视频块与该视频的编解码表示之间的转换期间应用缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该编解码表示指示该缩放矩阵中的元的数量,并且其中,该数量取决于是否对该视频块应用系数归零。
图26是视频处理的示例性方法2600的流程图。方法2600包括:根据规则执行(2602)视频的视频块与该视频的编解码表示之间的转换,其中,在对该视频块的变换系数应用K×L变换矩阵之后,在对除了左上M×N个变换系数之外的所有变换系数归零之后,将该视频块表示到该编解码表示当中,其中,将该编解码表示配置为排除对缩放矩阵的处于对应于归零的位置上的元的信令通知,其中,该缩放矩阵用于对变换系数进行缩放。
图27是视频处理的示例性方法2700的流程图。方法2700包括在视频的视频块与该视频的编解码表示之间的转换期间基于规则确定(2702)是否将基于该视频块的尺寸使用单个量化矩阵,其中,所有具有该尺寸的视频块都使用该单个量化矩阵;以及使用该量化矩阵执行该转换。
下文的三个章节描述了具有下述编号的示例性视频处理技术:
章节A
1.一种视频处理方法,包括:执行视频的视频块与该视频的编解码表示之间的转换,其中,该编解码表示符合格式规则,其中,该格式规则规定通过该视频块的编解码条件确定变换跳过模式对该视频块的适用性,其中,该格式规则规定从该编解码表示中省略指示变换跳过模式的适用性的语法元素,并且其中,该变换跳过模式包括在向该编解码表示当中编解码之前,跳过对至少一些系数应用正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用逆变换。
2.根据示例1所述的方法,其中,由于该视频块的编解码条件表明对该视频块使用块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)而确定启用变换跳过模式。
3.根据示例1所述的方法,其中,由于该视频块的编解码条件表明对该视频块使用非块差分脉冲编解码调制(非BDPCM)或非量化残差BDPCM(非QR-BDPCM)而确定禁用变换跳过模式。
4.一种视频处理方法,包括:针对视频的两个紧邻视频块与该视频的编解码表示之间的转换,依据是否对该转换使用正向变换或逆变换而确定是否将对该转换使用环路滤波器或重建后滤波器,其中,该正向变换包括在编码成该编解码之前,跳过对至少一些系数应用该正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用该逆变换;以及基于环路滤波器或重建后滤波器的使用执行该转换。
5.根据示例4所述的方法,其中,该正向变换或逆变换包括变换跳过模式或块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)或调色板模式,并且其中,对所述两个紧邻视频块使用环路滤波器或重建后滤波器基于是否对所述两个紧邻视频块使用变换跳过模式或块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)或调色板模式。
6.根据示例4所述的方法,其中,该正向变换或逆变换包括变换跳过模式,并且其中,边界滤波强度的推导取决于指示是否对所述两个紧邻视频块之一或两者启用变换跳过模式的一个或多个语法元素。
7.根据示例4所述的方法,其中,该正向变换或逆变换包括变换跳过模式,并且其中,响应于位于所述两个紧邻视频块处的样点是采用变换跳过模式编解码的而禁用去方块滤波器、样点自适应偏移、自适应环路滤波器或重建后滤波器。
8.根据示例7所述的方法,其中,该正向变换或逆变换包括变换跳过模式,并且其中,响应于对所述两个紧邻视频块启用变换跳过模式而不对所述两个紧邻视频块之间的边缘应用环路滤波器和重建后滤波器。
9.根据示例7所述的方法,其中,该正向变换或逆变换包括变换跳过模式,并且其中,响应于对所述两个紧邻视频块之一启用变换跳过模式而不对所述两个紧邻视频块之间的样点应用环路滤波器和重建后滤波器。
10.根据示例4所述的方法,其中,该正向变换或逆变换包括变换跳过模式,并且其中,响应于对所述两个紧邻视频块启用变换跳过模式而使用环路滤波器或重建后滤波器之外的滤波器对所述样点滤波。
11.根据示例10所述的方法,其中,该滤波器包括更平滑的滤波器。
12.根据示例4所述的方法,其中,该视频包括采用脉冲编解码调制(PCM)或块差分脉冲编解码调制(BDPCM)或量化残差BDPCM(QR-BDPCM)或另一种类型的不对视频块应用正向变换或逆变换的模式编解码的视频块,并且其中,对所述视频块的转换是否使用环路滤波器或重建后滤波器是按照在对所述两个紧邻视频块启用变换跳过模式时对于所述两个紧邻视频块而言的相同的方式确定的。
13.根据示例4-12中的任何示例所述的方法,其中,该环路滤波器包括去方块滤波器。
14.根据示例4-12中的任何示例所述的方法,其中,该重建后滤波器包括双边滤波器或扩散滤波器。
15.根据示例1到14中的任何示例所述的方法,其中,该转换包括将该视频块编码到该编解码表示当中。
16.根据示例1到14中的任何示例所述的方法,其中,该转换包括对该编解码表示解码,以生成该视频块的像素值。
17.一种视频解码装置,包括处理器,其被配置为实施示例1到16中的一者或多者当中所述的方法。
18.一种其上存储了计算机代码的计算机程序产品,所述代码在由处理器执行时使该处理器实施示例1到17中的任何示例当中所述的方法。
章节B
1.一种视频处理方法,包括:针对视频的视频块与该视频的编解码表示之间的转换,基于该视频块的编解码模式确定缩放工具的因数;以及使用该缩放工具执行该转换,其中,该缩放工具的使用包括:在编码期间缩放表示该视频块的至少一些系数或者在解码期间对来自该编解码表示的至少一些系数去缩放。
2.根据示例1所述的方法,进一步包括:响应于对该视频块的转换使用块差分脉冲编解码调制(BDPCM)编解码工具或量化残差BDPCM(QR-BDPCM)编解码工具而基于预定义值确定缩放工具的因数。
3.根据示例2所述的方法,其中,用于应用了BDPCM编解码工具或QR-BDPCM编解码工具的视频块的缩放工具的因数与用于应用了变换跳过模式的视频块的缩放工具的因数相同,并且其中,该变换跳过模式包括在编码成该编解码表示之前,跳过对至少一些系数应用正向变换,或者在解码期间,在从该编解码表示解码之前,跳过对至少一些系数应用逆变换。
4.根据示例2所述的方法,其中,该转换包括基于在该转换期间应用于该视频块的至少一些系数的一项或多项变换确定该缩放工具的因数。
5.根据示例4所述的方法,其中,响应于对该视频块的所述至少一些系数应用了所述一项或多项变换而对该转换允许该缩放工具。
6.根据示例4所述的方法,其中,作为对该视频块的所述至少一些系数应用了所述一项或多项变换的响应,用于确定该缩放工具的因数的技术与用于帧内编解码块的相同。
7.根据示例1所述的方法,其中,对于该视频的使用帧内块复制模式和帧间模式编解码的视频块而言,按照相同的方式确定该缩放矩阵的因数。
8.一种视频处理方法,包括:针对视频的视频块与该视频的编解码表示之间的转换,因用于该视频块的转换的块差分脉冲编解码调制(BDPCM)编解码工具或量化残差BDPCM(QR-BDPCM)编解码工具的原因而确定禁止使用缩放工具;以及在不使用该缩放工具的情况下执行该转换,其中,该缩放根据的使用包括:在编码期间缩放表示该视频块的至少一些系数或者在解码期间对来自该编解码表示的至少一些系数去缩放。
9.一种视频处理方法,包括:针对视频的视频块与该视频的编解码表示之间的转换,基于为该转换选择的变换矩阵选择缩放矩阵,其中,这些缩放矩阵用于缩放这些视频块的至少一些系数,并且其中,这些变换矩阵用于在该转换期间变换这些视频块的所述至少一些系数;以及使用这些缩放矩阵执行该转换。
10.根据示例9所述的方法,其中,选择缩放矩阵基于所述视频块的转换是否使用默认变换模式。
11.根据示例10所述的方法,其中,该默认变换模式包括离散余弦变换2(DCT2)。
12.根据示例9所述的方法,其中,针对多个变换矩阵单独信令通知各缩放矩阵。
13.根据示例9所述的方法,其中,选择缩放矩阵基于视频块的运动信息。
15.根据示例13所述的方法,其中,选择缩放矩阵基于视频块的转换是否使用子块编解码模式。
15.根据示例14所述的方法,其中,该子块编解码模式包括仿射编解码模式。
16.根据示例15所述的方法,其中,相较于另一个其转换使用非仿射模式的视频块的缩放矩阵而言,不同地信令通知用于仿射编解码模式的缩放矩阵。
17.根据示例13所述的方法,其中,选择缩放矩阵基于视频块是否是采用仿射帧内预测模式编解码的。
18.根据示例1到17中的任何示例所述的方法,其中,该转换包括将该(一个或多个)视频块编码到该编解码表示当中。
19.根据示例1到17中的任何示例所述的方法,其中,该转换包括对该编解码表示解码,以生成该(一个或多个)视频块的像素值。
20.一种视频解码装置,包括处理器,其被配置为实施示例1到19中的一者或多者当中所述的方法。
21.一种视频编码装置,包括处理器,其被配置为实施示例1到19中的一者或多者当中所述的方法。
22.一种其上存储了计算机代码的计算机程序产品,所述代码在由处理器执行时使该处理器实施示例1到19中的任何示例当中所述的方法。
章节C
1.一种视频处理方法,包括:根据规则基于是否对视频的视频块的部分应用二次变换矩阵而确定是否应用缩放矩阵,其中,该缩放矩阵用于缩放该视频块的至少一些系数,并且其中,该二次变换矩阵用于在该转换期间变换该视频块的该部分的至少一些残差系数;以及使用所选择的缩放矩阵执行该视频的视频块与该视频的比特流表示之间的转换。
2.根据示例1所述的方法,其中,该规则规定响应于对包括KxL变换块尺寸的视频块的MxN左上部分应用二次变换矩阵而对该视频块的MxN左上部分应用该缩放矩阵。
3.根据示例1所述的方法,其中,在该比特流表示中信令通知该缩放矩阵。
4.根据示例3所述的方法,其中,针对该二次变换矩阵或者针对缩减二次变换或旋转变换在片组标头、条带标头、图片参数集(PPS)、视频参数集(VPS)、序列参数集(SPS)中信令通知该缩放矩阵。
5.根据示例1所述的方法,其中,该比特流表示包括指示是否应用该缩放矩阵的第一语法元素,并且其中,该比特流表示包括指示是否应用该二次变换矩阵的第二语法元素。
6.根据示例1所述的方法,其中,该规则规定仅对该视频块的未应用该二次变换矩阵的部分应用该缩放矩阵。
7.根据示例1所述的方法,其中,该规则规定对该视频块的除了应用该二次变换矩阵的MxN左上部分之外的部分应用该缩放矩阵。
8.根据示例1所述的方法,其中,该规则规定仅对该视频块的应用该二次变换矩阵的部分应用该缩放矩阵。
9.一种视频处理方法,包括:针对具有非方形形状的视频块确定在视频的该视频块与该视频的编解码表示之间的转换中使用的缩放矩阵,其中,该编解码表示中的语法元素信令通知该缩放矩阵,并且其中,该缩放矩阵用于在该转换期间缩放视频块的至少一些系数;以及基于该缩放矩阵执行该转换。
10.根据示例9所述的方法,其中,该语法元素由该视频的先前方形块的另一缩放矩阵对该缩放矩阵进行预测编解码。
11.一种视频处理方法,包括:执行视频的视频块与该视频的编解码表示之间的转换,其中,基于规则,该视频块包括第一数量的位置,在这些位置上在该转换期间应用缩放矩阵,并且该视频块还包括第二数量的位置,在这些位置上在在该转换期间不应用该缩放矩阵。
12.根据示例11所述的方法,其中,该第一数量的位置包括该视频块的左上M*N个位置,并且其中,该视频块包括超过M*N个位置。
13.根据示例11所述的方法,其中,该第一数量的位置包括该视频块的顶部的M*N个位置,并且其中,该视频块包括超过M*N个位置。
14.根据示例11所述的方法,其中,该第一数量的位置包括该视频块的左侧的M*N个位置,并且其中,该视频块包括超过M*N个位置。
15.一种视频处理方法,包括:确定将在视频的视频块与该视频的编解码表示之间的转换期间应用缩放矩阵;以及基于该缩放矩阵执行该转换,其中,该编解码表示指示该缩放矩阵中的元的数量,并且其中,该数量取决于是否对该视频块应用系数归零。
16.根据示例15所述的方法,其中,对于64x64变换,该转换包括对该视频块的左上MxN个位置以外的所有位置归零,并且其中,该缩放矩阵的元的数量为M/8*N/8。
17.一种视频处理方法,包括:根据规则执行视频的视频块与该视频的编解码表示之间的转换,其中,在对该视频块的变换系数应用KxL变换矩阵之后,在对除了左上MxN个变换系数之外的所有变换系数归零之后,将该视频块表示到该编解码表示当中,其中,将该编解码表示配置为排除对缩放矩阵的处于对应于归零的位置上的元的信令通知,其中,该缩放矩阵用于对变换系数进行缩放。
18.根据示例17所述的方法,其中,跳过对该缩放矩阵的位于左上MxN个系数之外的区域内的元的信令通知。
19.根据示例17所述的方法,其中,通过根据由K和/或L确定的比值进行子采样而应用该缩放矩阵。
20.根据示例19所述的方法,其中,将该视频块划分成多个子区域,其中,每一子区域的尺寸为Uw*Uh,并且其中,在该编解码表示中信令通知该缩放矩阵的位于包括该视频块的左上MxN个系数的区域的每一子区域内的一个元。
21.根据示例19所述的方法,其中,在该编解码表示中指示的该缩放矩阵的元的数量基于所述的M和/或N。
22.根据示例19所述的方法,其中,对于该KxL变换矩阵而言在该编解码表示中指示的该缩放矩阵的元的第一数量不同于在不采用归零的情况下对于该左上MxN个系数在该编解码表示中指示的该缩放矩阵的元的第二数量。
23.根据示例17所述的方法,其中,通过根据由M和/或N确定的比值进行子采样而应用该缩放矩阵。
24.根据示例23所述的方法,其中,将包括左上MxN个系数的区域划分成多个子区域,其中,每一子区域的尺寸为Uw*Uh,并且其中,在该编解码表示中信令通知每一子区域内的一个元。
25.根据示例23所述的方法,其中,对于该K×L变换矩阵而言在该编解码表示中指示的该缩放矩阵的元的数量与在不采用归零的情况下对于该左上MxN个系数在该编解码表示中指示的相同。
26.根据示例17到25中的任何示例所述的方法,其中,K=L=64,并且其中,M=N=32。
27.根据示例20或24中的任何示例所述的方法,其中,K=L=64,其中,M=N=32,并且其中,Uw=Uh=8。
28.一种视频处理方法,包括:在视频的视频块与该视频的编解码表示之间的转换期间基于规则确定是否将基于该视频块的尺寸使用单个量化矩阵,其中,所有具有该尺寸的视频块都使用该单个量化矩阵;以及使用该量化矩阵执行该转换。
29.根据示例28所述的方法,其中,该规则规定响应于该视频块的尺寸小于WxH而仅允许单个量化矩阵,其中,W和H是整数。
30.根据示例28所述的方法,其中,该规则规定响应于该视频块的宽度的小于阈值而仅允许单个量化矩阵。
31.根据示例28所述的方法,其中,该规则规定响应于该视频块的高度的小于阈值而仅允许单个量化矩阵。
32.根据示例28所述的方法,其中,该规则规定不对具有与小尺寸视频块相关联的尺寸的视频块应用单个量化矩阵。
33.根据示例1到32中的任何示例所述的方法,其中,对该视频块应用调色板模式。
34.根据示例1到33中的任何示例所述的方法,其中,该转换包括将该视频编码到该编解码表示当中。
35.根据示例1到33中的任何示例所述的方法,其中,该转换包括对该编解码表示进行解码,以生成该视频块的像素值。
36.一种视频解码装置,包括处理器,其被配置为实施示例1到35中的一者或多者当中所述的方法。
37.一种视频编码装置,包括处理器,其被配置为实施示例1到35中的一者或多者当中所述的方法。
38.一种其上存储了计算机代码的计算机程序产品,所述代码在由处理器执行时使该处理器实施示例1到35中的任何示例当中所述的方法。
本文件中描述的所公开的以及其他的解决方案、示例、实施例、模块和功能操作可以在数字电子电路或者计算机软件、固件或硬件中实施,其包括本文件中所公开的结构及其结构等同物,或其中一个或多个的组合。所公开的实施例和其他实施例可以被实施成一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储衬底、存储设备、影响机器可读传播信号的物质组成或者它们当中的一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括(例如)可编程处理器、计算机或者多个处理器或计算机。除硬件外,该装置还可以包括为所考虑的计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或者它们当中的一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成为对信息编码,以便传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以按照任何形式部署,包括作为独立程序或作为模块、部件、子例程或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的部分中,专用于所讨论的程序的单个文件中,或者多个协调文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。可以将计算机程序部署为在一个或多个计算机上执行,这一个或多个计算机位于一个站点上,或者跨越多个站点分布并通过通信网络互连。
本说明书中描述的过程和逻辑流可以通过由一个或多个可编程处理器执行一个或多个计算机程序来执行,从而通过对输入数据进行操作并生成输出来执行功能。这些过程和逻辑流也可以通过专用逻辑电路来执行,并且装置也可以被实施成专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何种类的数字计算机的任何一个或多个处理器。一般来讲,处理器将从只读存储器或随机存取存储器或这两者接收指令和数据。计算机的基本元件是执行指令的处理器以及存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或被操作性地耦接为从一个或多个大容量存储设备接收数据或向其传输数据,或两者兼有。然而,计算机不一定具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括(例如)半导体存储设备,例如,EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何主题或权利要求范围的限制,而应解释为对特定技术的特定实施例的具体特征的描述。本专利文件在各单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或者以任何合适的子组合的形式在多个实施例中实施。此外,虽然某些特征可能在上面被描述为以某些组合来起作用并且甚至最初也这样地来要求对其的权利保护,但是来自要求权利保护的组合的一个或多个特征在某些情况下可从该组合中去除,并且要求权利保护的组合可以涉及子组合或子组合的变型。
类似地,尽管附图中以特定顺序描述了操作,但这不应被理解为要获得想要的结果必须按照所示的特定顺序或者按照顺次排序执行此类操作,或者必须执行所有例示操作。此外,在本专利文件中描述的实施例当中对各种系统部件的划分不应被理解为在所有实施例中都要求这样的划分。
仅描述了几种实施方式和示例,并且其他实施方式、增强和变化可以基于本专利文件中描述和说明的内容做出。
Claims (38)
1.一种视频处理方法,包括:
根据规则基于是否对视频的视频块的部分应用二次变换矩阵而确定是否应用缩放矩阵,
其中,所述缩放矩阵用于缩放所述视频块的至少一些系数,并且
其中,所述二次变换矩阵用于在所述转换期间变换所述视频块的部分的至少一些残差系数;以及
使用所选择的缩放矩阵执行所述视频的视频块与所述视频的比特流表示之间的转换。
2.根据权利要求1所述的方法,其中,所述规则规定响应于对包括K×L变换块尺寸的所述视频块的M×N左上部分应用二次变换矩阵,对所述视频块的M×N左上部分应用所述缩放矩阵。
3.根据权利要求1所述的方法,其中,在所述比特流表示中信令通知所述缩放矩阵。
4.根据权利要求3所述的方法,其中,为所述二次变换矩阵或者对缩减二次变换或旋转变换在片组标头、条带标头、图片参数集(PPS)、视频参数集(VPS)、序列参数集(SPS)中信令通知所述缩放矩阵。
5.根据权利要求1所述的方法,其中,所述比特流表示包括指示是否应用所述缩放矩阵的第一语法元素,并且其中,所述比特流表示包括指示是否应用所述二次变换矩阵的第二语法元素。
6.根据权利要求1所述的方法,其中,所述规则规定仅对所述视频块的未应用所述二次变换矩阵的部分应用所述缩放矩阵。
7.根据权利要求1所述的方法,其中,所述规则规定对所述视频块的除了应用所述二次变换矩阵的M×N左上部分之外的部分应用所述缩放矩阵。
8.根据权利要求1所述的方法,其中,所述规则规定仅对所述视频块的应用所述二次变换矩阵的部分应用所述缩放矩阵。
9.一种视频处理方法,包括:
为具有非方形形状的视频块,确定在视频的所述视频块与所述视频的编解码表示之间的转换中使用的缩放矩阵,
其中,所述编解码表示中的语法元素信令通知所述缩放矩阵,并且
其中,所述缩放矩阵用于在所述转换期间缩放所述视频块的至少一些系数;以及
基于所述缩放矩阵执行所述转换。
10.根据权利要求9所述的方法,其中,所述语法元素由所述视频的先前方形块的另一缩放矩阵对所述缩放矩阵进行预测编码。
11.一种视频处理方法,包括:
执行视频的视频块与所述视频的编解码表示之间的转换,
其中,基于规则,所述视频块包括第一数量的位置,在所述第一数量的位置上在所述转换期间应用缩放矩阵,并且所述视频块还包括第二数量的位置,在在所述第二数量的位置上在所述转换期间不应用所述缩放矩阵。
12.根据权利要求11所述的方法,其中,所述第一数量的位置包括所述视频块的左上M*N个位置,并且其中,所述视频块包括超过M*N个位置。
13.根据权利要求11所述的方法,其中,所述第一数量的位置包括所述视频块的上方的M*N个位置,并且其中,所述视频块包括超过M*N个位置。
14.根据权利要求11所述的方法,其中,所述第一数量的位置包括所述视频块的左侧的M*N个位置,并且其中,所述视频块包括超过M*N个位置。
15.一种视频处理方法,包括:
确定要在视频的视频块与所述视频的编解码表示之间的转换期间应用的缩放矩阵;以及
基于所述缩放矩阵执行所述转换,
其中,所述编解码表示指示所述缩放矩阵中的元素的数量,并且
其中,所述数量取决于是否对所述视频块应用系数归零。
16.根据权利要求15所述的方法,其中,对于64×64变换,所述转换包括对所述视频块的左上M×N个位置以外的所有位置归零,并且其中,所述缩放矩阵的元素的数量为M/8*N/8。
17.一种视频处理方法,包括:
根据规则执行视频的视频块与所述视频的编解码表示之间的转换,
其中,在对所述视频块的变换系数应用K×L变换矩阵之后,在对除了左上M×N个变换系数之外的所有变换系数归零之后,将所述视频块表示到所述编解码表示当中,
其中,所述编解码表示配置为排除对所述缩放矩阵的处于对应于归零的位置上的元素的信令通知,
其中,所述缩放矩阵用于对所述变换系数进行缩放。
18.根据权利要求17所述的方法,其中,跳过对所述缩放矩阵的位于左上M×N个系数之外的区域内的元素的信令通知。
19.根据权利要求17所述的方法,其中,通过根据由K和/或L确定的比值进行下采样而应用所述缩放矩阵。
20.根据权利要求19所述的方法,其中,将所述视频块划分成多个子区域,其中,每一子区域的尺寸为Uw*Uh,并且其中,在所述编解码表示中信令通知所述缩放矩阵的位于包括所述视频块的左上M×N个系数的区域的每一子区域内的一个元素。
21.根据权利要求19所述的方法,其中,在所述编解码表示中指示的所述缩放矩阵的元素的数量基于M和/或N。
22.根据权利要求19所述的方法,其中,为所述K×L变换矩阵,在所述编解码表示中指示的所述缩放矩阵的元素的第一数量不同于为不带有归零的所述左上M×N个系数,在所述编解码表示中指示的所述缩放矩阵的元素的第二数量。
23.根据权利要求17所述的方法,其中,通过根据由M和/或N确定的比值进行下采样而应用所述缩放矩阵。
24.根据权利要求23所述的方法,其中,将包括左上M×N个系数的区域划分成多个子区域,其中,每一子区域的尺寸为Uw*Uh,并且其中,在所述编解码表示中信令通知每一子区域内的一个元素。
25.根据权利要求23所述的方法,其中,为所述K×L变换矩阵,在所述编解码表示中指示的所述缩放矩阵的元素的数量与为不带有归零的所述左上MxN个系数在所述编解码表示中指示的相同。
26.根据权利要求17到25中的任何一项所述的方法,其中,K=L=64,并且其中,M=N=32。
27.根据权利要求20或24中的任何一项所述的方法,其中,K=L=64,其中,M=N=32,并且其中,Uw=Uh=8。
28.一种视频处理方法,包括:
在视频的视频块与所述视频的编解码表示之间的转换期间,基于规则,基于所述视频块的尺寸确定是否要使用单个量化矩阵,其中,所有具有所述尺寸的视频块都使用所述单个量化矩阵;以及
使用所述量化矩阵执行所述转换。
29.根据权利要求28所述的方法,其中,所述规则规定仅响应于所述视频块的尺寸小于W×H而允许所述单个量化矩阵,其中,W和H是整数。
30.根据权利要求28所述的方法,其中,所述规则规定仅响应于所述视频块的宽度小于阈值而允许所述单个量化矩阵。
31.根据权利要求28所述的方法,其中,所述规则规定仅响应于所述视频块的高度小于阈值而允许所述单个量化矩阵。
32.根据权利要求28所述的方法,其中,所述规则规定不对具有与小尺寸视频块相关联的尺寸的视频块应用所述单个量化矩阵。
33.根据权利要求1到32中的任何一项所述的方法,其中,对所述视频块应用调色板模式。
34.根据权利要求1到33中的任何一项所述的方法,其中,所述转换包括将所述视频编码到所述编解码表示当中。
35.根据权利要求1到33中的任何一项所述的方法,其中,所述转换包括对所述编解码表示解码,以生成所述视频块的像素值。
36.一种视频解码装置,包括处理器,其被配置为实施权利要求1到35中的一项或多项当中所述的方法。
37.一种视频编码装置,包括处理器,其被配置为实施权利要求1到35中的一项或多项当中所述的方法。
38.一种具有存储于其上的计算机代码的计算机程序产品,所述代码在由处理器执行时使所述处理器实施根据权利要求1到35中的任何一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019101555 | 2019-08-20 | ||
CNPCT/CN2019/101555 | 2019-08-20 | ||
PCT/CN2020/110229 WO2021032158A1 (en) | 2019-08-20 | 2020-08-20 | Position-based coefficients scaling |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114270817A true CN114270817A (zh) | 2022-04-01 |
CN114270817B CN114270817B (zh) | 2024-07-05 |
Family
ID=74659756
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080059166.4A Active CN114270817B (zh) | 2019-08-20 | 2020-08-20 | 基于位置的系数缩放 |
CN202080059009.3A Active CN114270838B (zh) | 2019-08-20 | 2020-08-20 | 变换跳过模式的信令通知 |
CN202311555521.9A Pending CN117336482A (zh) | 2019-08-20 | 2020-08-20 | 变换跳过模式的信令通知 |
CN202080059117.0A Pending CN114342398A (zh) | 2019-08-20 | 2020-08-20 | 默认缩放矩阵和用户定义缩放矩阵的使用 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080059009.3A Active CN114270838B (zh) | 2019-08-20 | 2020-08-20 | 变换跳过模式的信令通知 |
CN202311555521.9A Pending CN117336482A (zh) | 2019-08-20 | 2020-08-20 | 变换跳过模式的信令通知 |
CN202080059117.0A Pending CN114342398A (zh) | 2019-08-20 | 2020-08-20 | 默认缩放矩阵和用户定义缩放矩阵的使用 |
Country Status (6)
Country | Link |
---|---|
US (4) | US11641478B2 (zh) |
EP (2) | EP4000258A4 (zh) |
JP (3) | JP7397172B2 (zh) |
KR (2) | KR20220045955A (zh) |
CN (4) | CN114270817B (zh) |
WO (3) | WO2021032158A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12096013B2 (en) | 2019-08-20 | 2024-09-17 | Beijing Bytedance Network Technology Co., Ltd. | Signaling for transform skip mode |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2585030A (en) * | 2019-06-25 | 2020-12-30 | British Broadcasting Corp | Method of signalling in a video codec |
CN114223204B (zh) * | 2019-09-19 | 2024-04-12 | 寰发股份有限公司 | 视频编解码的方法和装置 |
WO2024208952A1 (en) * | 2023-04-07 | 2024-10-10 | Interdigital Ce Patent Holdings, Sas | Prediction and transform dependency |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100239006A1 (en) * | 2009-03-17 | 2010-09-23 | Ng Gregory C | Video decoder plus a discrete cosine transform unit |
US20140086311A1 (en) * | 2012-09-25 | 2014-03-27 | General Instrument Corporation | Signaling of scaling list |
US20140254661A1 (en) * | 2013-03-08 | 2014-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for applying secondary transforms on enhancement-layer residuals |
US20150078442A1 (en) * | 2012-04-16 | 2015-03-19 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
CN106105206A (zh) * | 2014-03-17 | 2016-11-09 | 高通股份有限公司 | 用于使用置零系数的低复杂度正变换的系统和方法 |
WO2018038554A1 (ko) * | 2016-08-24 | 2018-03-01 | 엘지전자(주) | 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치 |
CN109076226A (zh) * | 2016-05-13 | 2018-12-21 | 索尼公司 | 图像处理装置和方法 |
KR20190013380A (ko) * | 2017-07-31 | 2019-02-11 | 에스케이텔레콤 주식회사 | 비-제로 계수들의 위치를 표현하는 방법 및 장치 |
CN109417621A (zh) * | 2016-07-04 | 2019-03-01 | 索尼公司 | 图像处理装置及方法 |
CN109644269A (zh) * | 2016-08-24 | 2019-04-16 | 索尼公司 | 图像处理设备、图像处理方法和程序 |
CN109661820A (zh) * | 2016-09-13 | 2019-04-19 | 联发科技股份有限公司 | 用于视频编解码的多个量化矩阵集合的方法 |
US20190191185A1 (en) * | 2016-05-12 | 2019-06-20 | Lg Electronics Inc. | Method and apparatus for processing video signal using coefficient-induced reconstruction |
US20190246142A1 (en) * | 2018-02-05 | 2019-08-08 | Tencent America LLC | Method, apparatus and medium for decoding or encoding |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009050897A1 (ja) * | 2007-10-19 | 2009-04-23 | Panasonic Corporation | 符号化レート変換装置、符号化レート変換方法および集積回路 |
US9118898B2 (en) * | 2009-06-24 | 2015-08-25 | Qualcomm Incorporated | 8-point transform for media data coding |
CN102137261A (zh) * | 2011-04-20 | 2011-07-27 | 深圳市融创天下科技发展有限公司 | 一种视频编码16x16整数变换方法 |
GB2492333B (en) * | 2011-06-27 | 2018-12-12 | British Broadcasting Corp | Video encoding and decoding using transforms |
US9516316B2 (en) * | 2011-06-29 | 2016-12-06 | Qualcomm Incorporated | VLC coefficient coding for large chroma block |
US20130170555A1 (en) * | 2011-12-28 | 2013-07-04 | Broadcom Corporation | Adapting transform coefficient scaling in video/image coding to block features identified in the transform domain |
US20130177084A1 (en) | 2012-01-10 | 2013-07-11 | Qualcomm Incorporated | Motion vector scaling in video coding |
CN108924571B (zh) * | 2012-01-20 | 2021-09-07 | 韩国电子通信研究院 | 使用量化矩阵的视频编解码方法 |
US9866829B2 (en) * | 2012-01-22 | 2018-01-09 | Qualcomm Incorporated | Coding of syntax elements that correspond to coefficients of a coefficient block in video coding |
EP3432583B1 (en) | 2012-02-29 | 2020-04-01 | Sony Corporation | Image processing device and method |
WO2013154028A1 (ja) * | 2012-04-13 | 2013-10-17 | ソニー株式会社 | 画像処理装置および方法 |
US20130294524A1 (en) * | 2012-05-04 | 2013-11-07 | Qualcomm Incorporated | Transform skipping and lossless coding unification |
US9706200B2 (en) * | 2012-06-18 | 2017-07-11 | Qualcomm Incorporated | Unification of signaling lossless coding mode and pulse code modulation (PCM) mode in video coding |
CN115052155A (zh) * | 2012-07-02 | 2022-09-13 | 韩国电子通信研究院 | 图像编码/解码方法和非暂时性计算机可读记录介质 |
EP3588958B1 (en) | 2012-08-29 | 2024-07-03 | Vid Scale, Inc. | Method and apparatus of motion vector prediction for scalable video coding |
JP6763664B2 (ja) * | 2012-10-01 | 2020-09-30 | ジーイー ビデオ コンプレッション エルエルシー | エンハンスメント層作動パラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化 |
CN103796015A (zh) * | 2012-10-31 | 2014-05-14 | 朱洪波 | 系数数目自适应的量化参数差分编码 |
EP3490259B1 (en) | 2013-04-02 | 2021-10-13 | InterDigital Madison Patent Holdings, SAS | Enhanced temporal motion vector prediction for scalable video coding |
WO2015100522A1 (en) | 2013-12-30 | 2015-07-09 | Mediatek Singapore Pte. Ltd. | Methods for inter-component residual prediction |
CN106105227B (zh) | 2014-03-16 | 2019-12-24 | Vid拓展公司 | 用于无损视频译码的信令的方法和设备 |
AU2014388185B2 (en) | 2014-03-27 | 2018-08-02 | Microsoft Technology Licensing, Llc | Adjusting quantization/scaling and inverse quantization/scaling when switching color spaces |
US10200700B2 (en) | 2014-06-20 | 2019-02-05 | Qualcomm Incorporated | Cross-component prediction in video coding |
CN107079157B (zh) | 2014-09-12 | 2020-12-22 | Vid拓展公司 | 用于视频编码的分量间去相关 |
CN106663209B (zh) * | 2014-09-19 | 2020-05-08 | 华为技术有限公司 | 用于非均匀映射图像/视频编码中不同尺寸的量化矩阵之间的量化矩阵系数的方法和装置 |
US10405000B2 (en) * | 2014-11-21 | 2019-09-03 | Vid Scale, Inc. | One-dimensional transform modes and coefficient scan order |
EP3251352A1 (en) | 2015-01-29 | 2017-12-06 | VID SCALE, Inc. | Escape color coding for palette coding mode |
US10924743B2 (en) | 2015-02-06 | 2021-02-16 | Microsoft Technology Licensing, Llc | Skipping evaluation stages during media encoding |
CN115134609A (zh) * | 2015-06-11 | 2022-09-30 | 杜比实验室特许公司 | 使用自适应去块滤波编码和解码图像的方法及其装置 |
US10574988B2 (en) * | 2015-11-19 | 2020-02-25 | Qualcomm Incorporated | System and methods for reducing slice boundary visual artifacts in display stream compression (DSC) |
WO2017088093A1 (en) | 2015-11-23 | 2017-06-01 | Mediatek Singapore Pte. Ltd. | On the smallest allowed block size in video coding |
WO2017156669A1 (en) | 2016-03-14 | 2017-09-21 | Mediatek Singapore Pte. Ltd. | Methods for motion vector storage in video coding |
CN109076242B (zh) * | 2016-05-13 | 2023-01-03 | 索尼公司 | 图像处理设备和方法 |
CN109792541A (zh) * | 2016-10-05 | 2019-05-21 | 瑞典爱立信有限公司 | 用于视频译码的去振铃滤波器 |
EP3813375A1 (en) | 2017-01-31 | 2021-04-28 | Sharp Kabushiki Kaisha | Systems and methods for partitioning a picture into video blocks for video coding |
US10779007B2 (en) * | 2017-03-23 | 2020-09-15 | Mediatek Inc. | Transform coding of video data |
US11206419B2 (en) * | 2017-05-17 | 2021-12-21 | Kt Corporation | Method and device for video signal processing |
KR20200031102A (ko) * | 2017-07-28 | 2020-03-23 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
EP4395317A3 (en) | 2017-07-28 | 2024-08-14 | Panasonic Intellectual Property Corporation of America | Encoding device and encoding method |
US11736687B2 (en) | 2017-09-26 | 2023-08-22 | Qualcomm Incorporated | Adaptive GOP structure with future reference frame in random access configuration for video coding |
CN117061738A (zh) | 2018-04-02 | 2023-11-14 | 深圳市大疆创新科技有限公司 | 用于图像处理的方法和图像处理装置 |
EP3804315A4 (en) | 2018-05-31 | 2022-03-09 | Sharp Kabushiki Kaisha | SYSTEMS AND METHODS FOR PARTITIONING VIDEO BLOCKS INTO A SLOT FOR INTERPRETING VIDEO DATA |
WO2019235891A1 (ko) * | 2018-06-08 | 2019-12-12 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
US11996924B2 (en) | 2018-06-22 | 2024-05-28 | Nokia Technologies Oy | Methods, devices and computer readable medium for allocating measurement resources |
CN110662075B (zh) | 2018-06-29 | 2023-04-25 | 北京字节跳动网络技术有限公司 | 改进的时域运动矢量预测推导 |
WO2020003268A2 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Definition of zero unit |
CN113302916B (zh) | 2019-01-27 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 具有cu级别权重的双向预测的插值 |
US11190794B2 (en) * | 2019-02-12 | 2021-11-30 | Tencent America LLC | Method and apparatus for video coding |
BR112021016925A2 (pt) | 2019-02-27 | 2021-11-03 | Huawei Tech Co Ltd | Codificador, decodificador e métodos correspondentes |
WO2020177704A1 (en) | 2019-03-04 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | In-loop filtering in video processing |
EP3918800A4 (en) | 2019-03-08 | 2022-07-06 | Beijing Bytedance Network Technology Co., Ltd. | SIGNALING TRANSFORMATION INFORMATION IN VIDEO PROCESSING |
BR112021019564A2 (pt) | 2019-04-18 | 2021-12-07 | Beijing Bytedance Network Tech Co Ltd | Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador |
WO2020214980A1 (en) | 2019-04-19 | 2020-10-22 | Bytedance Inc. | Context coding for transform skip mode |
CN113711612B (zh) | 2019-04-20 | 2023-05-26 | 北京字节跳动网络技术有限公司 | 视频编解码中的色度语法元素的信令 |
TW202101987A (zh) * | 2019-04-26 | 2021-01-01 | 美商松下電器(美國)知識產權公司 | 編碼裝置、解碼裝置、編碼方法及解碼方法 |
US10904532B2 (en) | 2019-05-20 | 2021-01-26 | Samsung Display Co., Ltd. | Differential prefix coding for high throughput entropy coder in display compression |
US11218728B2 (en) * | 2019-06-04 | 2022-01-04 | Tencent America LLC | Method and apparatus for video coding |
WO2021006632A1 (ko) * | 2019-07-08 | 2021-01-14 | 엘지전자 주식회사 | 스케일링 리스트 파라미터 기반 비디오 또는 영상 코딩 |
EP4000258A4 (en) | 2019-08-20 | 2023-03-15 | Beijing Bytedance Network Technology Co., Ltd. | SCALING POSITION-BASED COEFFICIENTS |
-
2020
- 2020-08-20 EP EP20855686.0A patent/EP4000258A4/en active Pending
- 2020-08-20 WO PCT/CN2020/110229 patent/WO2021032158A1/en unknown
- 2020-08-20 EP EP20854699.4A patent/EP4000265A4/en active Pending
- 2020-08-20 JP JP2022511034A patent/JP7397172B2/ja active Active
- 2020-08-20 KR KR1020227002777A patent/KR20220045955A/ko not_active Application Discontinuation
- 2020-08-20 WO PCT/CN2020/110260 patent/WO2021032162A1/en active Application Filing
- 2020-08-20 CN CN202080059166.4A patent/CN114270817B/zh active Active
- 2020-08-20 JP JP2022511033A patent/JP7444970B2/ja active Active
- 2020-08-20 KR KR1020227002779A patent/KR20220047759A/ko not_active Application Discontinuation
- 2020-08-20 CN CN202080059009.3A patent/CN114270838B/zh active Active
- 2020-08-20 WO PCT/CN2020/110275 patent/WO2021032165A1/en unknown
- 2020-08-20 CN CN202311555521.9A patent/CN117336482A/zh active Pending
- 2020-08-20 CN CN202080059117.0A patent/CN114342398A/zh active Pending
-
2022
- 2022-02-18 US US17/675,843 patent/US11641478B2/en active Active
- 2022-02-18 US US17/675,796 patent/US11595671B2/en active Active
- 2022-02-18 US US17/675,880 patent/US11539970B2/en active Active
-
2023
- 2023-02-22 US US18/172,484 patent/US12096013B2/en active Active
- 2023-11-15 JP JP2023194599A patent/JP2024020419A/ja active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100239006A1 (en) * | 2009-03-17 | 2010-09-23 | Ng Gregory C | Video decoder plus a discrete cosine transform unit |
US20150078442A1 (en) * | 2012-04-16 | 2015-03-19 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
US20140086311A1 (en) * | 2012-09-25 | 2014-03-27 | General Instrument Corporation | Signaling of scaling list |
US20140254661A1 (en) * | 2013-03-08 | 2014-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for applying secondary transforms on enhancement-layer residuals |
CN106105206A (zh) * | 2014-03-17 | 2016-11-09 | 高通股份有限公司 | 用于使用置零系数的低复杂度正变换的系统和方法 |
US20190191185A1 (en) * | 2016-05-12 | 2019-06-20 | Lg Electronics Inc. | Method and apparatus for processing video signal using coefficient-induced reconstruction |
CN109076226A (zh) * | 2016-05-13 | 2018-12-21 | 索尼公司 | 图像处理装置和方法 |
CN109417621A (zh) * | 2016-07-04 | 2019-03-01 | 索尼公司 | 图像处理装置及方法 |
CN109644269A (zh) * | 2016-08-24 | 2019-04-16 | 索尼公司 | 图像处理设备、图像处理方法和程序 |
WO2018038554A1 (ko) * | 2016-08-24 | 2018-03-01 | 엘지전자(주) | 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치 |
CN109661820A (zh) * | 2016-09-13 | 2019-04-19 | 联发科技股份有限公司 | 用于视频编解码的多个量化矩阵集合的方法 |
KR20190013380A (ko) * | 2017-07-31 | 2019-02-11 | 에스케이텔레콤 주식회사 | 비-제로 계수들의 위치를 표현하는 방법 및 장치 |
US20190246142A1 (en) * | 2018-02-05 | 2019-08-08 | Tencent America LLC | Method, apparatus and medium for decoding or encoding |
Non-Patent Citations (2)
Title |
---|
OLENA CHUBACH ET AL: "CE7-related: Support of quantization matrices for VVC", JOINT VIDEO EXPERTS TEAM (JVET)OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019, JVET-N0847-V1, pages 1 - 2 * |
TOMONORI HASHIMOTO ET AL: "Non-CE7: Harmonization of scaling matrix and LFNST", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 1115TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019,JVET-O0383-V2, pages 1 - 2 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12096013B2 (en) | 2019-08-20 | 2024-09-17 | Beijing Bytedance Network Technology Co., Ltd. | Signaling for transform skip mode |
Also Published As
Publication number | Publication date |
---|---|
US11595671B2 (en) | 2023-02-28 |
CN114270817B (zh) | 2024-07-05 |
EP4000258A1 (en) | 2022-05-25 |
WO2021032162A1 (en) | 2021-02-25 |
EP4000258A4 (en) | 2023-03-15 |
EP4000265A4 (en) | 2022-10-26 |
CN114270838B (zh) | 2024-04-12 |
US12096013B2 (en) | 2024-09-17 |
CN114270838A (zh) | 2022-04-01 |
JP2022545451A (ja) | 2022-10-27 |
EP4000265A1 (en) | 2022-05-25 |
WO2021032165A1 (en) | 2021-02-25 |
US20230209072A1 (en) | 2023-06-29 |
JP2022545452A (ja) | 2022-10-27 |
JP2024020419A (ja) | 2024-02-14 |
US11641478B2 (en) | 2023-05-02 |
KR20220047759A (ko) | 2022-04-19 |
KR20220045955A (ko) | 2022-04-13 |
WO2021032158A1 (en) | 2021-02-25 |
JP7444970B2 (ja) | 2024-03-06 |
US20220174298A1 (en) | 2022-06-02 |
US20220174280A1 (en) | 2022-06-02 |
US20220174299A1 (en) | 2022-06-02 |
CN117336482A (zh) | 2024-01-02 |
JP7397172B2 (ja) | 2023-12-12 |
US11539970B2 (en) | 2022-12-27 |
CN114342398A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102696039B1 (ko) | 코딩 된 비디오의 양자화된 잔차 차동 펄스 코드 변조 표현 | |
JP7534399B2 (ja) | クロス成分映像コーディングにおける線形パラメータの導出 | |
CN114270838B (zh) | 变换跳过模式的信令通知 | |
WO2021110018A1 (en) | Separable secondary transform processing of coded video | |
WO2020236719A2 (en) | Transform design for large blocks in video coding | |
WO2021121419A1 (en) | Interaction between adaptive color transform and quantization parameters | |
WO2020233664A1 (en) | Sub-block based use of transform skip mode | |
JP2023521503A (ja) | クロスコンポーネント予測のための利用制約 | |
CN115606182A (zh) | 使用增强二次变换的编解码视频处理 | |
WO2021190594A1 (en) | Implicit determination of transform skip mode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |