CN107211151B - 用于视频译码的跨组件预测剪裁及自适应性色彩变换 - Google Patents
用于视频译码的跨组件预测剪裁及自适应性色彩变换 Download PDFInfo
- Publication number
- CN107211151B CN107211151B CN201680006123.3A CN201680006123A CN107211151B CN 107211151 B CN107211151 B CN 107211151B CN 201680006123 A CN201680006123 A CN 201680006123A CN 107211151 B CN107211151 B CN 107211151B
- Authority
- CN
- China
- Prior art keywords
- video
- residual data
- transform
- bit depth
- inverse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims description 89
- 230000015654 memory Effects 0.000 claims description 28
- 238000003860 storage Methods 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 18
- 230000001413 cellular effect Effects 0.000 claims description 4
- 230000010267 cellular communication Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 41
- 241000023320 Luma <angiosperm> Species 0.000 description 38
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 38
- 238000012545 processing Methods 0.000 description 33
- 238000013139 quantization Methods 0.000 description 31
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 27
- 239000013598 vector Substances 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 10
- 238000005192 partition Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 7
- 238000000844 transformation Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012432 intermediate storage Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920002451 polyvinyl alcohol Polymers 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101001091388 Homo sapiens Kallikrein-7 Proteins 0.000 description 1
- 102100034867 Kallikrein-7 Human genes 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/02—Colour television systems with bandwidth reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/04—Colour television systems using pulse code modulation
- H04N11/042—Codec means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/04—Colour television systems using pulse code modulation
- H04N11/042—Codec means
- H04N11/044—Codec means involving transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/24—High-definition television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2383—Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/438—Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
- H04N21/4382—Demodulation or channel decoding, e.g. QPSK demodulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/6106—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
- H04N21/6131—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/6156—Network physical structure; Signal processing specially adapted to the upstream path of the transmission network
- H04N21/6181—Network physical structure; Signal processing specially adapted to the upstream path of the transmission network involving transmission via a mobile phone network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/64—Circuits for processing colour signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/50—Control of the SSIS exposure
- H04N25/57—Control of the dynamic range
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computer Networks & Wireless Communication (AREA)
- Discrete Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
一种用于编码或解码视频数据的装置可基于第一残余数据的位深度来剪辑所述第一残余数据。所述装置可至少部分地通过将逆自适应性色彩变换IACT应用于所述第一残余数据来产生第二残余数据。此外,所述装置可基于所述第二残余数据来重新建构所述视频数据的译码单元CU的译码块。
Description
本申请案要求2015年1月30日申请的美国临时专利申请案62/110,324、2015年2月6日申请的美国临时专利申请案62/113,269及2015年2月12日申请的美国临时专利申请案62/115,487的权益,所述美国临时专利申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上或台式计算机、平板计算机、电子书阅读器、数字摄影机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置等等。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4、Part 10、高级视频译码(AVC)、ITU-T H.265、高效率视频译码(HEVC)定义的标准及这些标准的扩展(例如,可调式视频译码(SVC)、多视图视频译码(MVC)、可调式HEVC(SHVC)、多视图HEVC(MV-HEVC)、3D-HEVC及HEVC范围扩展)中所描述的视频译码技术。视频装置可通过实施这些视频译码技术来较有效地传输、接收、编码、解码及/或存储数字视频信息。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以缩减或移除视频序列中所固有的冗余。对于基于块的视频译码,视频切片(例如,视频帧或视频帧的部分)可被分割成视频块,视频块还可被称作树型块、译码树型单元(CTU)、译码单元(CU)及/或译码节点。视频块可包含明度块及色度块。在图片的经帧内译码(I)切片中,使用关于同一图片中的相邻块中的参考样本的空间预测来编码块。图片的经帧间译码(P或B)切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码块的预测性块。残余数据表示原始待译码块与预测性块之间的像素差。根据指向形成预测性块的参考样本块的运动向量及指示经译码块与预测性块之间的差的残余数据来编码经帧间译码块。根据帧内译码模式及残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生可接着被量化的残余变换系数。经量化变换系数可经熵译码以实现甚至更多的压缩。
发明内容
本发明涉及视频译码的领域,且更确切地说,涉及当应用例如自适应性色彩变换(ACT)及跨组件预测(CCP)等工具时的位深度考虑。本发明的特定技术可缩减、消除或以其它方式控制归因于ACT及CCP的应用的样本的位深度增加。
在一个方面中,本发明描述一种编码或解码视频数据的方法,所述方法包括:基于第一残余数据的位深度将所述第一残余数据剪辑到可变范围;至少部分地通过将逆自适应性色彩变换(IACT)应用于所述经剪辑第一残余数据来产生第二残余数据;以及基于所述第二残余数据来重新建构所述视频数据的译码单元(CU)的译码块。
在另一方面中,本发明描述一种用于编码或解码视频数据的装置,所述装置包括:存储器,其经配置以存储所述视频数据;以及一或多个处理器,其经配置以进行以下操作:基于第一残余数据的位深度将所述第一残余数据剪辑到可变范围;至少部分地通过将逆自适应性色彩变换(IACT)应用于所述经剪辑第一残余数据来产生第二经逆变换残余数据;以及基于所述第二经逆变换残余数据来重新建构所述视频数据的译码单元(CU)的译码块。
在另一方面中,本发明描述一种用于编码或解码视频数据的装置,所述装置包括:用于基于第一残余数据的位深度将所述第一残余数据剪辑到可变范围的设备;用于至少部分地通过将逆自适应性色彩变换(IACT)应用于所述经剪辑第一残余数据来产生第二残余数据的设备;以及用于基于所述第二经逆变换残余数据来重新建构所述视频数据的译码单元(CU)的译码块的设备。
在另一方面中,本发明描述一种存储有指令的计算机可读存储媒体,所述指令在被执行时致使用于编码或解码视频数据的装置的一或多个处理器进行以下操作:基于第一残余数据的位深度将所述第一残余数据剪辑到可变范围;至少部分地通过将逆自适应性色彩变换(IACT)应用于所述经剪辑第一残余数据来产生第二残余数据;以及基于所述第二残余数据来重新建构所述视频数据的译码单元(CU)的译码块。
在随附图式及以下描述中阐明本发明的一或多个实例的细节。其它特征、目标及优势将从描述、图式及权利要求书变得显而易见。
附图说明
图1为说明可利用本发明的技术的实例视频译码系统的框图。
图2为说明实例自适应性色彩变换(ACT)及跨组件预测(CCP)处理次序的概念图。
图3为说明实例经高效率视频译码(HEVC)译码输入/输出(IO)位深度的概念图。
图4A为说明用于使用CCP的屏幕内容译码的配置的实例位深度信息的概念图。
图4B为说明用于使用ACT及CCP的屏幕内容译码的配置的实例位深度信息的概念图。
图5A为根据本发明的一或多种技术的说明在前向CCP之后的仅运用CCP的剪辑的概念图。
图5B为根据本发明的一或多种技术的说明可归因于在前向CCP之后的仅运用CCP的剪辑的动态范围改变的概念图。
图5C为根据本发明的一或多种技术的说明在前向CCP之后的运用ACT及CCP的剪辑的概念图。
图5D为根据本发明的一或多种技术的说明可归因于在前向CCP之后的运用ACT及CCP的剪辑的动态范围改变的概念图。
图6A为根据本发明的一或多种技术的说明视频解码器处的实例剪辑位置的概念图。
图6B为说明图6A中所指示的剪辑位置处的剪辑实例的概念图。
图6C为说明图6A中所指示的剪辑位置处的剪辑实例的概念图。
图6D为说明图6A中所指示的剪辑位置处的剪辑实例的概念图。
图7为根据本发明的一或多种技术的说明逆ACT输入处的剪辑实例的概念图,其中先前模块用于逆CCP(ICCP)。
图8为根据本发明的一或多种技术的说明逆ACT输入处的剪辑实例的概念图,其中先前模块用于逆变换。
图9A为根据本发明的一或多种技术的说明一系列实例变换的概念图,其中到ICCP的输入服从约束。
图9B为根据本发明的一或多种技术的说明一系列实例变换的概念图,其中到IACT的输入服从约束。
图9C为根据本发明的一或多种技术的说明展示图9A及图9B的缩合形式的一系列实例变换的概念图。
图10为说明可执行根据本发明的一或多个方面的技术的视频编码器的实例的框图。
图11为说明可执行根据本发明的一或多个方面的技术的视频解码器的实例的框图。
图12为根据本发明的技术的说明视频译码器的实例操作的流程图。
具体实施方式
高效率视频译码(HEVC)为最近定案的视频译码标准。用于屏幕内容译码(SCC)的HEVC扩展正在开发中。HEVC的SCC扩展实施自适应性色彩变换(ACT)及跨组件预测(CCP)变换以缩减色彩分量当中的冗余。一般来说,本发明涉及视频译码的领域,且更确切地说,涉及当应用例如ACT及CCP的工具时的位深度考虑。所提议技术主要与SCC有关,但大体上可适用于HEVC扩展及其它视频译码标准,包含支持高位深度(例如,大于8个位)、不同色度取样格式等等的标准。
在HEVC的SCC扩展中,视频编码器可产生指示视频数据的译码块的样本与预测性块的对应样本之间的差的残余数据。视频编码器可接着将ACT应用于残余数据以获得第一组经变换残余数据。视频编码器可接着将CCP变换应用于第一组经变换残余数据以获得第二组经变换残余数据。随后,视频编码器可将例如离散余弦变换(DCT)等变换(T)应用于第二组经变换残余数据以获得第三组经变换残余数据。与第一组经变换残余数据及第二组经变换残余数据对比,第三组经变换残余数据可在频域而非样本域中。“频域”中的残余数据是按照以不同频率振荡的函数(例如,余弦函数或正弦函数)来表示。“样本域”中的残余数据是按照视频数据的样本值(例如,明度值或色度值)来表示。视频编码器可接着量化第三组经变换残余数据。
视频解码器可逆转此过程。举例来说,视频解码器可获得指示经量化第三组经变换残余数据的语法元素。视频解码器可接着逆量化第三组经变换残余数据以重新产生第三组经变换残余数据。接下来,视频解码器可应用例如逆DCT等逆变换(IT)以重新产生第二组经变换残余数据。视频解码器可接着将逆CCP(ICCP)变换应用于经重新产生第二组经变换残余数据以重新产生第一组经变换残余数据。随后,视频解码器可将逆ACT(IACT)应用于经重新产生第一组经变换残余数据以重新产生残余数据。视频解码器可基于经重新产生残余数据及预测性块来重新建构译码块。
在上文所概述的过程中,经重新产生第二组经变换残余数据的每一样本(即,IT的输出)具有比译码块的样本的原始位深度大7个位的位深度。在此上下文中,术语“位深度”是指用以表示单个样本的位的数目。此外,经重新产生第二组经变换残余数据的每一样本(即,ICCP变换的输出)具有比译码块的样本的原始位深度大8个位的位深度。经重新产生第一组经变换残余数据的每一样本(即,IACT的输出)具有比译码块的样本的原始位深度大9个位的位深度。
与使用ACT及CCP变换相关联的位深度增加可增加针对视频编码器及视频解码器的实施复杂性及成本。举例来说,在视频编码器及视频解码器的硬件实施方案中,用于携载及存储经变换残余数据的样本的数据路径可需要较多的信道及/或存储位置。
本发明描述若干技术,所述技术缩减或消除与在视频译码中使用ACT及CCP变换相关联的位深度增加。举例来说,作为用以解码视频数据的过程的部分,视频解码器可基于第一残余数据的位深度将第一残余数据剪辑到可变范围。剪辑可指在值超过上限值的情况下将所述值设置成所述上限值且在所述值小于下限值的情况下将所述值设置成所述下限值的过程。在一些实例中,视频解码器可应用ICCP以产生第一残余数据。在一些实例中,视频解码器可在不应用ICCP的情况下应用从变换域到样本域的变换以产生第一残余数据。接下来,视频解码器可至少部分地通过将IACT应用于经剪辑输入来产生第二残余数据。因此,视频解码器可基于到IACT的输入的位深度来剪辑到IACT的输入。视频解码器可基于第二残余数据来重新建构视频数据的译码单元(CU)的译码块。举例来说,视频解码器可重新建构CU的译码块,使得对于对应于第二残余数据中的样本的译码块的每一相应样本,译码块的相应样本等于第二残余数据中的对应样本加CU的预测单元(PU)的预测性块中的对应样本。视频编码器可执行相同或相似过程作为视频编码器的重新建构回路(即,解码回路)的部分。有利地,此实例中所描述的过程可在使用ACT及/或CCP时防止位深度增加超出特定数目。
图1为说明可利用本发明的技术的实例视频译码系统10的框图。如本文中所使用,术语“视频译码器”一般是指视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”一般可指视频编码或视频解码。根据本发明中所描述的各种实例,视频译码系统10的视频编码器20及视频解码器30表示可经配置以执行用于视频译码的技术的装置的实例。
如图1所展示,视频译码系统10包含源装置12及目的地装置14。源装置12产生经编码视频数据。因此,源装置12可被称作视频编码装置或视频编码设备。目的地装置14可解码由源装置12产生的经编码视频数据。因此,目的地装置14可被称作视频解码装置或视频解码设备。源装置12及目的地装置14可为视频译码装置或视频译码设备的实例。
源装置12及目的地装置14可包括广泛范围的装置,所述装置包含台式计算机、移动计算装置、笔记本(例如,膝上)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手机、电视、摄影机、显示装置、数字媒体播放器、视频游戏机、车载计算机,等等。
目的地装置14可经由信道16自源装置12接收经编码视频数据。信道16可包括能够将经编码视频数据自源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可包括使得源装置12能够实时地将经编码视频数据直接地传输到目的地装置14的一或多个通信媒体。在此实例中,源装置12可根据通信标准(例如,无线通信协议)来调制经编码视频数据,且可将经调制视频数据传输到目的地装置14。一或多个通信媒体可包含无线及/或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。一或多个通信媒体可形成基于数据包的网络(例如,局域网、广域网或全球网(例如,因特网))的部分。一或多个通信媒体可包含路由器、交换器、基站,或促进从源装置12到目的地装置14的通信的其它设备。
在另一实例中,信道16可包含存储由源装置12产生的经编码视频数据的存储媒体。在此实例中,目的地装置14可(例如)经由磁盘存取或卡存取来存取存储媒体。存储媒体可包含多种本地存取式数据存储媒体,例如蓝光(Blu-ray)光盘、DVD、CD-ROM、闪存器,或用于存储经编码视频数据的其它合适数字存储媒体。
在另一实例中,信道16可包含存储由源装置12产生的经编码视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载来存取存储在文件服务器或另一中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据传输到目的地装置14的服务器类型。实例文件服务器包含网页服务器(例如,用于网站)、文件传送协议(FTP)服务器、网络附接存储(NAS)装置,及本地磁盘驱动器。
目的地装置14可经由标准数据连接(例如,因特网连接)来存取经编码视频数据。数据连接的实例类型可包含适合于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等)或这两者的组合。经编码视频数据从文件服务器的传输可为流式传输、下载传输或这两者的组合。
本发明的技术并不限于无线应用或设置。所述技术可应用于视频译码来支持多种多媒体应用,例如空中电视广播、有线电视传输、卫星电视传输、流式视频传输(例如,经由因特网)、供存储在数据存储媒体上的视频数据的编码、存储在数据存储媒体上的视频数据的解码,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播及/或视频电话的应用。
图1所说明的视频译码系统10仅仅为实例,且本发明的技术可应用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其它实例中,数据是从本地存储器取回、经由网络进行流式传输,等等。视频编码装置可将数据编码及存储到存储器,及/或视频解码装置可从存储器取回及解码数据。在许多实例中,编码及解码是由并不彼此通信但仅仅将数据编码到存储器及/或从存储器取回及解码数据的装置执行。视频编码器20及视频解码器30可包括经配置以存储视频数据的存储器。视频编码器20可编码存储在存储器中的视频数据。视频解码器30可解码经编码视频数据且将所得视频数据存储在存储器中。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些实例中,输出接口22可包含调制器/解调器(调制解调器)及/或发射器。视频源18可包含视频捕获装置(例如,视频摄影机)、含有先前捕获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈送接口,及/或用于产生视频数据的计算机图形系统,或视频数据的这些源的组合。
视频编码器20可编码来自视频源18的视频数据。在一些实例中,源装置12经由输出接口22直接地将经编码视频数据传输到目的地装置14。在其它实例中,经编码视频数据还可存储到存储媒体上或文件服务器上以稍后供目的地装置14存取以用于解码及/或回放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些实例中,输入接口28包含接收器及/或调制解调器。输入接口28可经由信道16来接收经编码视频数据。显示装置32可与目的地装置14集成或可在目的地装置14外部。一般来说,显示装置32显示经解码视频数据。显示装置32可包括多种显示装置,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
视频编码器20及视频解码器30各自可被实施为多种合适电路系统中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件,或其任何组合。如果部分地以软件来实施技术,那么装置可将用于软件的指令存储在合适非暂时性计算机可读存储媒体中,且可使用一或多个处理器而以硬件来执行所述指令以执行本发明的技术。可将上述各者(包含硬件、软件、硬件与软件的组合等等)中的任一者视为一或多个处理器。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中,编码器或解码器中的任一者可被集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
本发明大体上可指视频编码器20将某一信息“传信”或“传输”到另一装置,例如视频解码器30。术语“传信”或“传输”大体上可指用以解码经压缩视频数据的语法元素及/或其它数据的通信。此通信可实时地或近实时地发生。替代地,此通信可在时间跨度上发生,例如可在编码时以经编码位流将语法元素存储到计算机可读存储媒体时发生,所述语法元素接着可在存储到此媒体之后的任何时间由解码装置取回。
在图1的实例中,源装置12及目的地装置14可各自包括无线通信装置。源装置12可包括以通信方式耦合到源装置12的一或多个处理器的发射器。换句话说,源装置12的一或多个处理器可以允许源装置12的一或多个处理器与发射器通信的方式直接地或间接地耦合到发射器。输出接口22可包括发射器。发射器可经配置以传输包括视频数据的经编码表示的位流。举例来说,视频数据的此经编码表示可包括译码单元的经编码表示。相似地,目的地装置14可包括以通信方式耦合到目的地装置14的一或多个处理器的接收器。换句话说,目的地装置14的一或多个处理器可以允许目的地装置14的一或多个处理器与接收器通信的方式直接地或间接地耦合到接收器。输入接口28可包括接收器。接收器可经配置以接收包括视频数据的经编码表示的位流。在一些实例中,无线通信装置为蜂窝电话,位流是根据蜂窝通信标准来调制。在这些实例中,位流可由发射器传输,或位流可由接收器接收。
最近,新的视频译码标准(即,高效率视频译码(HEVC))的设计已由ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合协作小组(JCT-VC)定案。在一些实例中,视频编码器20及视频解码器30根据例如HEVC标准的视频压缩标准而操作。2013年10月23日到11月1日于瑞士日内瓦举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG11的视频译码联合协作小组(JCT-VC)第15次会议上的Wang等人的“High EfficiencyVideo Coding(HEVC)Defect Report 2”(文件JCTVC-01003_v2,可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/wg11/JCTVC-O1003-v2.zip)为HEVC草案规格且在下文中被称作HEVC WD。2014年3月27日到4月4日于西班牙瓦伦西亚举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合协作小组(JCT-VC)第17次会议上的Wang等人的“High Efficiency Video Coding(HEVC)DefectReport 4”(文件JCTVC-Q1003(v.1),可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1003-v1.zip)(在下文中,HEVC版本1)为描述HEVC标准的另一文件。Recommendation ITU-T H.265(高效率视频译码,可得自http://www.itu.int/rec/T-REC-H.265-201304-I)为含有最新HEVC规格的另一文件。除了基底HEVC标准以外,还存在进行中的努力以产生用于HEVC的可调式视频译码、多视图视频译码及3D译码扩展。
为对HEVC标准的另一扩展的HEVC范围扩展针对额外色彩表示(还被称作“色彩格式”)以及针对增加的色彩位深度而新增对HEVC的支持。可被称作“HEVC RExt”的对HEVC的范围扩展也正由JCT-VC开发。HEVC范围扩展的最近草案为:2014年3月27日到4月4日于西班牙瓦伦西亚举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG11的视频译码联合协作小组(JCT-VC)第17次会议上的Flynn等人的“High Efficiency Video Coding(HEVC)RangeExtensions text specification:Draft 7”,其可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v9.zip。在下文中被称作RExtWD7的HEVC范围扩展的另一最近工作草案(WD)被描述于2014年3月27日到4月4日于西班牙瓦伦西亚举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC29/WG 11的视频译码联合协作小组(JCT-VC)第17次会议上的Flynn等人的“High Efficiency Video Coding(HEVC)RangeExtensions text specification:Draft 7”中,其可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v4.zip。
如上文所指示,HEVC范围扩展可针对增加的色彩位深度而新增对HEVC的支持。色彩位深度为用以表示色彩表示的每一分量的位的数目。针对其它色彩格式的支持可包含用于编码及解码视频数据的红-绿-蓝(RGB)源以及具有其它色彩表示且相比于HEVC主简档使用不同色度次取样型样的视频数据的支持。
范围扩展规格可变为HEVC的版本2。然而,在很大程度上,关于涉及本发明的所提议技术(例如,运动向量预测),HEVC版本1及HEVC范围扩展规格是技术上相似的。因此,每当本发明提及基于HEVC版本1的改变时,相同改变就可应用于HEVC范围扩展规格,且每当本发明重新使用HEVC版本1模块时,本发明就也可实际上重新使用HEVC范围扩展模块(具有相同次子句)。
用于译码例如具有运动的文本及图形的屏幕内容材料的HEVC的另一扩展(即,屏幕内容译码(SCC))也正被开发。SCC的最近工作草案(WD)(2014年6月30到7月9日于日本札幌举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合协作小组(JCT-VC)第18次会议上的Joshi等人的“High Efficiency Video Coding(HEVC)Screen ContentCoding:Draft 1”,文件JCTVC-R1005_v3(在下文中,“JCTVC-R1005”))可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC-R1005-v3.zip。
在HEVC及其它视频译码标准中,视频序列通常包含一系列图片。图片还可被称作“帧”。图片可包含三个样本阵列,被表示为SL、SCb及SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb彩度样本的二维阵列。SCr为Cr彩度样本的二维阵列。彩度样本还可在本文中被称作“色度”样本。在其它情况下,图片可为单色的,且可仅包含明度样本阵列。
为了产生图片的经编码表示,视频编码器20可产生一组译码树型单元(CTU)。所述CTU中的每一者可为明度样本的译码树型块、色度样本的两个对应译码树型块,及用以译码所述译码树型块的样本的语法结构。译码树型块可为样本的N×N块。CTU还可被称作“树型块”或“最大译码单元”(LCU)。切片可包含在光栅扫描中连续地排序的整数数目个CTU。
为了产生经编码CTU,视频编码器20可对CTU的译码树型块递归地执行四分树分割以将译码树型块划分成译码块,因此名称为“译码树型单元”。译码块为样本的N×N块。译码单元(CU)可为具有明度样本阵列、Cb样本阵列及Cr样本阵列的图片的明度样本的译码块及色度样本的两个对应译码块,以及用以译码所述译码块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单个译码块,及用以译码所述译码块的样本的语法结构。
视频编码器20可将CU的译码块分割成一或多个预测块。预测块可为被应用相同预测的矩形(即,正方形或非正方形)样本块。CU的预测单元(PU)可为图片的明度样本的预测块、图片的色度样本的两个对应预测块,及用以预测所述预测块样本的语法结构。视频编码器20可产生用于CU的每一PU的明度、Cb及Cr预测块的预测性明度、Cb及Cr块。在单色图片或具有三个单独色彩平面的图片中,PU可包括单个预测块,及用以预测所述预测块的语法结构。
视频编码器20可使用帧内预测或帧间预测以产生PU的预测性块。如果视频编码器20使用帧内预测以产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本来产生PU的预测性块。如果视频编码器20使用帧间预测以产生PU的预测性块,那么视频编码器20可基于除了与PU相关联的图片以外的一或多个图片的经解码样本来产生PU的预测性块。
在视频编码器20产生用于CU的一或多个PU的预测性块(例如,预测性明度、Cb及Cr块)之后,视频编码器20可产生CU的残余块。CU的残余块中的每一样本指示用于CU的PU的预测性块中的样本与CU的译码块中的对应样本之间的差。举例来说,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的PU的预测性明度块中的明度样本与CU的明度译码块中的对应样本之间的差。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的PU的预测性Cb块中的Cb样本与CU的Cb译码块中的对应样本之间的差。视频编码器20还可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示用于CU的PU的预测性Cr块中的Cr样本与CU的Cr译码块中的对应样本之间的差。
此外,视频编码器20可使用四分树分割以将CU的残余块(例如,明度、Cb及Cr残余块)分解成一或多个变换块(例如,明度、Cb及Cr变换块)。变换块可为被应用相同变换的矩形样本块。CU的变换单元(TU)可为明度样本的变换块、色度样本的两个对应变换块,及用以变换所述变换块样本的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块及Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单个变换块,及用以变换所述变换块的样本的语法结构。
视频编码器20可将一或多个变换应用于TU的变换块以产生用于TU的系数块。举例来说,视频编码器20可将一或多个变换应用于TU的明度变换块以产生用于TU的明度系数块。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生用于TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生用于TU的Cr系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化通常是指用以量化变换系数以可能地缩减用以表示变换系数的数据的量而提供进一步压缩的过程。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应性二进制算术译码(CABAC)。视频编码器20可在位流中输出经熵编码语法元素。位流可包括视频数据的经编码表示。
视频编码器20可输出包含经熵编码语法元素的位流。位流可包含形成经译码图片及关联数据的表示的位序列。位流可包括网络抽象层(NAL)单元序列。所述NAL单元中的每一者包含NAL单元标头且封装原始字节序列载荷(RBSP)。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为封装于NAL单元内的含有整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可封装不同类型的RBSP。举例来说,第一类型的NAL单元可封装用于图片参数集(PPS)的RBSP,第二类型的NAL单元可封装用于经译码切片的RBSP,第三类型的NAL单元可封装用于补充增强信息(SEI)的RBSP,等等。封装用于视频译码数据的RBSP(相对于用于参数集及SEI消息的RBSP)的NAL单元可被称作视频译码层(VCL)NAL单元。
在图1的实例中,视频解码器30接收由视频编码器20产生的位流。另外,视频解码器30可解析位流以从位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素来重新建构视频数据的图片。用以重新建构视频数据的过程可与由视频编码器20执行的过程大体上互逆。举例来说,视频解码器30可使用帧内预测或帧间预测来确定当前CU的PU的预测性块。另外,视频解码器30可逆量化用于当前CU的TU的系数块。视频解码器30可对系数块执行逆变换以重新产生用于当前CU的TU的变换块。视频解码器30可通过将用于当前CU的PU的预测性块的样本加到用于当前CU的TU的变换块的对应样本来重新建构当前CU的译码块。通过重新建构用于图片的每一CU的译码块,视频解码器30可重新建构图片。
视频数据的每一块的像素各自以特定格式(被称作“色彩表示”)来表示色彩。不同视频译码标准可将不同色彩表示用于视频数据的块。作为一个实例,HEVC视频标准的主简档使用YCbCr色彩表示以表示视频数据的块的像素。
YCbCr色彩表示通常是指用以由色彩信息的三个分量或信道“Y”、“Cb”及“Cr”表示视频数据的每一像素的色彩表示。Y信道表示用于特定像素的明度(即,光强度或亮度)数据。Cb及Cr分量分别为蓝差及红差彩度(即,“色度”)分量。YCbCr常常用以表示经压缩视频数据中的色彩,这是因为在Y、Cb及Cr分量中的每一者之间存在强去相关,此意味着在Y、Cb及Cr分量中的每一者之间存在很少的重复或冗余数据。使用YCbCr色彩表示来译码视频数据因此在许多状况下提供良好压缩性能。
另外,许多视频译码技术利用被称作“色度次取样”的技术以进一步改进色彩数据的压缩。具有YCbCr色彩表示的视频数据的色度次取样通过根据型样来选择性地省略色度分量而缩减经译码视频位流中传信的色度值的数目。在经色度次取样视频数据的块中,针对所述块的每一像素通常存在明度值。然而,可针对块的一些像素仅传信Cb及Cr分量,使得色度分量相对于明度分量被次取样。
视频译码器(即,视频编码器或视频解码器)可内插用于像素的Cb及Cr分量,其中未针对像素的经色度次取样块明确地传信Cb及Cr值。色度次取样良好地用来缩减彩度数据的量,而不会在较均一的像素块中引入失真。色度次取样较不良好地用来表示具有广泛不同的色度值的视频数据,且可在那些状况下引入大量失真。
如上文所提及,由于色彩表示(还被称作色彩格式)的明度分量与两个色度分量之间的大体上强色彩去相关,HEVC主简档使用YCbCr。然而,在一些状况下,在Y、Cb及Cr分量之间可仍存在相关。色彩表示的分量之间的相关可被称作跨色彩分量相关或色彩分量间相关。
视频译码器可经配置以基于不同分量的值(例如,明度分量的样本)来预测一个分量的值(例如,色度分量的样本)。基于第二分量来预测来自第一分量的样本的过程被称作“针对色彩视频的跨组件预测”或“色彩分量间预测”。视频译码器可基于第一分量与第二分量之间的相关来预测第一分量的值。
当捕获到视频数据时,常常出于各种预处理目的而将其转换成RGB色彩空间。在预处理之后,为了视频译码,视频数据通常被转换成YCbCr 4:2:0以得到更好的压缩效率。然而,色彩转换可造成色彩失真,从而导致主观质量降级。HEVC的范围扩展提供用于除了YCbCr 4:2:0以外的色彩空间(例如YCbCr 4:2:2、YCbCr 4:4:4及RGB 4:4:4)的视频译码。
如果RGB数据是在无色彩变换(例如,色彩转换)的情况下被直接地压缩,那么译码效率可因为色彩信道之间的冗余未缩减而缩减。另一方面,比如YCbCr的传统色彩转换可造成色彩失真。因此,可需要开发可以较少色彩失真来实现译码效率改进的技术。
HEVC的屏幕内容译码(SCC)使用两个译码工具以利用三个色彩分量当中的冗余来实现较高压缩比,即,自适应性色彩变换(ACT)及跨组件预测(CCP)。如2014年6月30日到7月9日于日本札幌举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合协作小组(JCT-VC)第18次会议上的L.Zhang等人的“SCCE5Test 3.2.1:In-loop color-spacetransform”(文件JCTVC-R0147(在下文中,“JCTVC-R0147”))中所描述,ACT为回路内色彩空间变换,其针对有损译码之前向及逆向色彩空间变换使用YCoCg变换矩阵,所述矩阵被定义如下:
在以上等式中,原始色彩空间(C0,C1,C2)可对应于(R,G,B)或(Y,U,V)。
CCP为用以从明度(或第一分量)预测色度(或第二及第三分量)的过程。CCP被描述于2014年6月30日到7月9日于日本札幌举行的ITU-T SG 16WP 3及ISO/IEC JTC 1/SC29/WG11的视频译码联合协作小组(JCT-VC)第18次会议上的R.Joshi及J.Xu的“High efficientvideo coding(HEVC)screen content coding:Draft 2”(在下文中,“JCTVC-S1005”)中。用于CCP的等式被展示如下:
前向:
-Y=Y
逆向:
-Y=Y
其中α可为{-8,-4,-2,-1,0,1,2,4,8}。
图2为说明实例ACT及CCP处理次序的概念图。ACT及CCP两者是基于残余的操作,且其在编解码器内的对应处理次序被展示于图2中。在图2的实例中,视频编码器(在图2中被缩写为“Enc”)执行残余产生操作48以获得残余数据50(例如,以在本发明中的别处所描述的方式)。残余数据50在图2中被缩写为“Res”。此外,在图2中,视频编码器将ACT 52应用于残余数据50,进而获得残余数据54。接下来,视频编码器将CCP变换56应用于残余数据54,进而获得残余数据58。视频编码器接着将变换60应用于残余数据58,进而获得残余数据62。残余数据62可在变换域(例如,频域)中。此外,视频编码器可将量化操作64应用于残余数据62,进而获得经量化残余数据66。
在图2中,视频解码器将逆量化操作68应用于经量化残余数据66,进而获得经逆量化残余数据70。接下来,视频解码器将逆变换72应用于经逆量化残余数据70,进而获得残余数据74。残余数据74可在样本域中。此外,视频解码器将逆CCP变换(ICCP)76应用于残余数据74,进而获得残余数据78。接下来,视频解码器将逆ACT(IACT)80应用于残余数据78,进而获得残余数据82。视频解码器可部分地基于残余数据82来应用重新建构操作84以重新建构译码块。视频编码器可执行关于视频解码器所描述作为解码回路的部分的图2的部分。
沿着HEVC数据路径的动态范围分析已在2013年7月出版的IEEE Trans.CircuitsSyst.Video Technol.第23卷第7期第1131到1136页上的C.Yeo等人的“Dynamic RangeAnalysis in High Efficiency Video Coding Residual Coding and Reconstruction”及2011年11月19日到30日于瑞士日内瓦举行的ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合协作小组(JCT-VC)第7次会议上的M.Zhou的“AHG7:IDCT Output RangeAfter T+Q+IQ+IT With Valid Residual Inputs”(文件JCTVC-G856)中来详细地研究。
图3为说明实例经HEVC译码输入/输出(IO)位深度的概念图。如图3所说明,在经重新建构残余中可发生高达5个位的位深度扩展,其中B位为输入像素及预测像素的位深度。确切地说,在图3中,视频编码器可执行残余产生操作100以获得残余数据102(在图3中被缩写为“Res”)。残余数据102的每一样本可具有为B+1的位深度。接下来,在图3中,视频编码器可将变换104应用于残余数据102以获得残余数据106。视频编码器可将量化操作108应用于残余数据106,进而获得经量化残余数据110。
在图3中,视频解码器可将逆量化操作112应用于经量化残余数据110,进而获得经逆量化残余数据114。接下来,视频解码器可将逆变换(IT)116应用于经逆量化残余数据114,进而获得经逆变换(例如,逆离散余弦变换或逆正弦变换)残余数据118。IT 116可将残余数据从变换域变换到样本域(即,像素域)。如图3所展示,作为应用逆变换116的结果,残余数据118的每一样本可具有为B+6的位深度。此外,在图3中,视频解码器可将重新建构操作120应用于残余数据118以重新建构译码块的样本。在图3中,视频解码器可应用剪辑操作以作为执行重新建构操作120的部分。剪辑操作可确保译码块的经重新建构样本的位深度等于B。
图4A为说明用于使用CCP的屏幕内容译码的配置的实例位深度信息的概念图。图4B为说明用于使用ACT及CCP的屏幕内容译码的配置的实例位深度信息的概念图。图4A及图4B相似于图3,但包含CCP,且在图4B中包含ACT。在图4A中,视频编码器将CCP变换150应用于残余数据160,且视频解码器(或视频编码器重新建构回路)将逆CCP变换152应用于由IT116获得的残余数据162。在图4B中,视频编码器将ACT 154应用于残余数据164,接着应用CCP变换150,且视频解码器(或视频编码器重新建构回路)应用逆CCP变换152,接着应用逆ACT 156。
在考虑SCC的ACT及CCP操作的情况下,在图4A及图4B中展示动态范围扩展,其中IACT代表逆ACT且ICCP代表逆CCP。从图4A及图4B清楚看到,在逆变换(IT)116之后的位深度增加到(B+7)个位,这是归因于前向CCP操作150及(在图4B中)前向ACT操作154的添加。此可将色度残余(或残余差量)的位深度增加再一个位而达(B+2)个位。因为使用明度残余数据而仅将CCP应用于色度残余数据,所以明度残余数据的位深度未由CCP改变。
从图4A及图4B中的位深度分析可看出,变换的输入处的位深度增加可沿着数据路径(比如在转置缓冲器、ICCP及IACT中)具有动态范围影响,此可产生较高实施成本且一般来说在实施方案中可并不合乎需要。术语“动态范围”及“位深度”可在本发明中被可互换地使用。
本发明提议可使位深度保持不变或可在启用ACT及CCP工具时缩减位深度增加的技术。举例来说,在本发明的第一实例中,提议在前向CCP操作之后在视频编码器处应用剪辑操作,如图5A及图5B所展示的Clip_A。本发明提议将CCP的输出的动态范围剪辑到B+1个位,其中B位为输入像素及预测像素的位深度,因此CCP的输出的动态范围可被恢复到HEVC版本2(Recommendation ITU-T H.265,2014年10月)中所指示的极限。本发明的技术的潜在益处可包含:无需改变解码器侧,且维持原始数据路径的动态范围,此可意味着现有设计无需使其位深度沿着数据路径而改变。
图5A为根据本发明的一或多种技术的说明在前向CCP之后的仅运用CCP的剪辑的概念图。图5B为根据本发明的一或多种技术的说明可归因于在前向CCP之后的仅运用CCP的剪辑的动态范围改变的概念图。在图5A的实例中,视频编码器20对CCP 150的输出执行剪辑操作170。如图5B的实例中所展示,执行剪辑操作170的结果为:到变换104的输入的位深度为B+1个位而非B+2个位。此外,如图5B的实例中所展示,作为执行剪辑操作170的结果,到ICCP变换152的输入为B+6个位而非B+7个位。相似地,如图5B的实例中所展示,作为执行剪辑操作170的结果,到重新建构操作120的输入为B+7个位而非B+8个位。
因此,在图5A及图5B的实例中,视频编码器20可基于译码块的原始样本及一或多个预测性块的样本来产生用于视频数据的CU的残余数据。另外,视频编码器20可通过将CCP变换应用于残余数据来产生经变换残余数据。在将CCP变换应用于残余数据之后,视频编码器20可将剪辑操作应用于经变换残余数据。在图5A及图5B的实例中,视频编码器20可执行剪辑操作,使得经变换残余数据的每一样本的位深度为B+1个位,其中B为译码块的原始样本的位深度。
图5C为根据本发明的一或多种技术的说明在前向CCP之后的运用ACT及CCP的剪辑的概念图。图5D为根据本发明的一或多种技术的说明可归因于在前向CCP之后的运用ACT及CCP的剪辑的动态范围改变的概念图。在图5C的实例中,视频编码器20对CCP 150的输出执行剪辑操作170。如图5D的实例中所展示,执行剪辑操作170的结果为:到变换104的输入的位深度为B+1个位而非B+2个位。此外,如图5D的实例中所展示,作为执行剪辑操作170的结果,到ICCP变换152的输入为B+6个位而非B+7个位。相似地,如图5D的实例中所展示,作为执行剪辑操作170的结果,到IACT 156的输入为B+7个位而非B+8个位。另外,如图5B的实例中所展示,作为执行剪辑操作170的结果,到重新建构操作120的输入为B+8个位而非B+9个位。
因此,在图5C及图5D的实例中,视频编码器20可基于译码块的原始样本及一或多个预测性块的样本来产生用于视频数据的CU的残余数据。另外,视频编码器20可通过将自适应性色彩变换应用于残余数据来产生第一残余数据。在产生第一残余数据之后,视频编码器20可通过将CCP变换应用于第一残余数据来产生第二残余数据。在将CCP变换应用于第一残余数据之后,视频编码器20可将剪辑操作应用于第二残余数据。在图5C及图5D的实例中,视频编码器20可执行剪辑操作,使得残余数据的每一样本的位深度为B+1个位,其中B为译码块的原始样本的位深度。
根据本发明的第二实例,提议将到ICCP的输入的动态范围剪辑到B+n1个位,其中B位为输入像素及预测像素的位深度,且n1可为1到6,此取决于先前阶段的结果的动态范围及性能要求。图6A为根据本发明的一或多种技术的说明视频解码器30处的实例剪辑位置(Clip_B、Clip_C及Clip_D)的概念图。图6B、图6C及图6D为说明图6A中所指示的剪辑位置处的实例剪辑的概念图。
在图6A及图6B的实例中,用于将到ICCP 152的输入的动态范围剪辑到B+n1个位的剪辑操作180被展示为Clip_B。举例来说,由于Clip_B在解码器侧处应用于逆CCP输入,因此用以添加Clip_B的修改可不与范围扩展(RExt)解码器相容,在此情况下不存在且不需要此剪辑。因此,虽然可需要使SCC解码器能够解码范围扩展位流,但此修改可能不适于SCC标准。图6A所展示的剪辑位置还可存在于视频编码器20的解码回路中。
因此,根据图6B所展示的本发明的第二实例,视频解码器30可通过应用逆变换116来产生残余数据260。IT 116可将残余数据从变换域转换到样本值域。举例来说,IT 116可为逆余弦变换或逆正弦变换。此外,在应用IT 116以产生残余数据260之后,视频解码器30可通过将剪辑操作180应用于残余数据260来产生经剪辑残余数据261。在将剪辑操作180应用于残余数据260之后,视频解码器30可通过将ICCP 152变换应用于经剪辑残余数据261来产生残余数据262。视频解码器30可基于残余数据262来重新建构视频数据的CU的译码块。在一些情况下,作为重新建构译码块的部分,视频解码器30可通过将IACT 156应用于残余数据262来产生残余数据264,且可基于残余数据264来产生CU的译码块。在此实例中,作为产生经剪辑残余数据261的部分,视频解码器30可剪辑残余数据260,使得残余数据260的每一样本的位深度为B+n1个位,其中B为译码块的样本的位深度,且n1为在1到6的范围内的值。在一些此类实例中,n1的值取决于第一逆变换的动态范围。还可执行此实例作为视频编码器20的解码回路的部分。
在图6B所展示的本发明的第三实例中,提议将到IACT 156的输入的动态范围剪辑到B+n2个位,其中B位为输入像素及预测像素的位深度,且用于n2的实施例可为1到7,此取决于先前阶段的结果的动态范围及性能要求。在此实例中,剪辑位置为图6所展示的Clip_C。换句话说,在图6A的实例中,用于将到IACT 152的输入的动态范围剪辑到B+n2个位的剪辑操作182被展示为Clip_C。
因此,根据本发明的第三实例,视频解码器30可通过应用IT 116来产生残余数据260。在产生残余数据260之后,视频解码器30可通过将ICCP变换152应用于残余数据260来产生残余数据262。在产生残余数据262之后,视频解码器30可通过将剪辑操作182应用于残余数据262来产生经剪辑残余数据263。此外,在此实例中,视频解码器30可通过将IACT 156应用于经剪辑残余数据263来产生残余数据264。在此实例中,视频解码器30可基于残余数据264来重新建构视频数据的CU的译码块。在此实例中,作为产生经剪辑残余数据263的部分,视频解码器30可剪辑残余数据262,使得残余数据262的每一样本的位深度为B+n2个位,其中B为译码块的样本的位深度,且n1为在1到7的范围内的值。此外,在此实例中,n2的值可取决于ICCP 152的动态范围。还可执行此实例作为视频编码器20的解码回路的部分。
在图6D中所展示的本发明的第四实例中,提议将IACT 156的输出的动态范围剪辑到B+n3个位,其中B位为输入像素及预测像素的位深度,且n3的实例可为1到8,此可取决于先前阶段的结果的动态范围及性能要求。在此实例中,剪辑位置为图6A及图6D所展示的Clip_D。换句话说,在图6A及6D的实例中,用于将到IACT的输入的动态范围剪辑到B+n2个位的剪辑操作184被展示为Clip_D。
因此,根据本发明的第四实例,视频解码器30可通过应用IT 116来产生残余数据260。在产生残余数据260之后,视频解码器30可通过将ICCP变换152应用于残余数据260来产生残余数据262。在产生残余数据262之后,视频解码器30可通过将IACT 156应用于残余数据262来产生残余数据264。在产生残余数据264之后,视频解码器30可通过将剪辑操作184应用于残余数据264来产生经剪辑残余数据265。在此实例中,视频解码器30可基于经剪辑残余数据265来重新建构视频数据的CU的译码块。在此实例中,作为产生经剪辑残余数据265的部分,视频解码器30可剪辑残余数据264,使得残余数据264的每一样本的位深度为B+n3个位,其中B为译码块的样本的位深度,且n3为在1到8的范围内的值。在此实例中,n3的值可取决于IACT 156的动态范围。还可执行此实例作为视频编码器20的解码回路的部分。
本发明的第五实例提供将到IACT的输入剪辑到Max(B+n4,16)个位,使得IACT的输入缓冲器或阵列:
(1)可在输入的位深度B≤12位的情况下保持在16位分辨率;或
(2)将在输入的位深度B>12位的情况下高达(B+n4)位分辨率,其中用于n4的实施例为如n4≥4,且n4<=32-B。
在IACT的输入处提议此剪辑,因此其先前模块可为ICCP或IT或任何其它可能有效模块。其是依据如下假定:停用扩展精确度,且考虑输入位深度B≤12位及B>12位(参见JCTVC Bug Track#1321)。益处为可节省软件的存储及硬件的存储两者(尤其是在软件中),这是因为针对输入位深度<=12位的状况可仍保持16位阵列分辨率,而非32位阵列。因为由此第五实例中的剪辑产生的位深度可为预定值(例如,16)或原始位深度加n4,所以由此第五实例中的剪辑产生的位深度可在可变范围内。所述范围是可变的,这是因为其取决于原始位深度及n4。
图7及图8中展示用于本发明的第五实例的图解。确切地说,图7为根据本发明的一或多种技术的说明IACT输入处的剪辑实例的概念图,其中先前模块用于逆CCP。在图7的实例中,视频解码器30或视频编码器20的解码回路可将剪辑操作200应用于输出ICCP 152(即,到IACT 156的输入)。作为剪辑操作200的结果,到IACT 156的输入为B+n4及16的最大值。
图8为根据本发明的一或多种技术的说明IACT输入处的剪辑实例的概念图,其中先前模块用于逆变换。在图8的实例中,视频解码器30或视频编码器20的解码回路可将剪辑操作210应用于IT 116的输出(即,到IACT 156的输入)。作为剪辑操作210的结果,到逆ACT156的输入为B+n4及16的最大值。
因此,在图7及图8两者中,例如视频编码器20或视频解码器30的视频译码器可通过将逆变换(例如,图7中的ICCP 152或图8中的IT 116)应用于残余数据282来产生残余数据280。在图7的实例中,残余数据282在样本域中,且在图8的实例中,残余数据282在变换域(例如,频域)中。残余数据280为到IACT 156的输入。在产生残余数据280之后且在产生残余数据284之前,视频译码器可基于到IACT 156的输入的位深度将到IACT 156的输入剪辑到可变范围。此外,视频译码器可通过将IACT 156应用于经剪辑输入来产生残余数据284。此外,视频译码器可基于残余数据284来重新建构视频数据的CU的译码块286。
作为剪辑到IACT 156的输入(即,残余数据280)的部分,基于残余数据280的位深度小于或等于特定值(例如,12),视频译码器可将残余数据280的分辨率保持在特定分辨率(例如,15或16)。在本发明中,术语位深度及分辨率可为可互换的。基于残余数据280的位深度大于特定值,视频译码器可将剪辑操作应用于残余数据280。举例来说,剪辑操作可在输入(即,残余数据280)的位深度B≤12位的情况下将位深度保持在16位分辨率,或在输入的位深度B>12位的情况下允许位深度高达(B+n4)位分辨率,其中n4≥4且n4<=32-B。在图7及图8两者中,视频译码器可剪辑残余数据280,使得残余数据280具有等于(i)残余数据280的位深度加一值及(ii)特定分辨率的最大值的位深度。
在本发明的第五实例的另一版本中,视频译码器可通过将逆变换应用于残余数据来产生残余数据280。在产生残余数据280之后且在产生残余数据284之前,基于残余数据280的位深度小于或等于特定值,视频译码器可将残余数据280的分辨率保持在特定分辨率。替代地,基于残余数据280的位深度大于特定值,视频译码器可将剪辑操作应用于残余数据280。在此实例中,视频译码器可通过将ICCP变换152应用于残余数据282来产生残余数据280。此外,视频译码器可基于残余数据284来重新建构视频数据的CU的译码块。
图9A为根据本发明的第六实例的说明一系列实例变换的概念图,其中到ICCP的输入服从约束。本发明的第六实例约束位流的编码,使得到ICCP的输入受限于Max(B+n5,15)个位,即,到ICCP的输入:
(1)可在输入的位深度B<=12位的情况下保持在15位分辨率;或
(2)将在输入的位深度B>12位的情况下高达(B+n5)位分辨率,其中用于n5的实施例为如n5>=3,且n5<=32-B。
一般来说,“约束”为由视频译码标准定义的限定,其指定违反约束的位流不符合视频译码标准。因此,如果位流符合视频译码标准,那么位流不违反约束。
ICCP可沿着数据路径引入再一个位。因此,使用ICCP可仍将IACT的输入缓冲器/阵列位深度对准到Max(B+n4,16)个位,即如上文关于本发明的第五实例所提及。图9A为根据本发明的一或多种技术的说明一系列实例变换的概念图。此实例是运用如下假定来描述:停用扩展精确度,且考虑输入位深度B≤12位及B>12位(参见JCTVC Bug Track#1321)。益处为可节省软件的存储及硬件的存储两者(尤其是在软件中),针对输入位深度≤12位的状况可仍保持16位阵列分辨率,而非32位阵列。
如图9A的实例中所展示,在本发明的第六实例中,位流经编码使得到ICCP 152的输入(即,残余数据292)为B+n5及15的最大值。此外,如图9A的实例中所展示,在本发明的此第六实例中,位流经编码使得到IACT 156的输入(即,残余数据294)为B+n4及16的最大值。
因此,在本发明的第六实例中,视频编码器20可产生服从限制残余数据292的样本值的分辨率的约束的位流,所述位流被提供为到ICCP 152的输入。经编码位流包括视频数据的经编码表示。在此实例中,视频编码器20可输出位流。在此实例中,对于残余数据292的每一相应样本值,约束可将相应样本值的分辨率限于以下各者中的任何较大者:预定义值、或取决于CU的原始样本值的分辨率的值。
相似地,在本发明的第六实例中,视频解码器30可基于从包括视频数据的经编码表示的经编码位流获得的语法元素来确定用于视频数据的CU的残余数据292。在此实例中,经编码位流服从限制残余数据292的样本值的分辨率的约束。此外,在此实例中,视频解码器30可通过将逆ICCP应用于残余数据292来产生残余数据294。视频解码器30可基于残余数据294来重新建构CU的译码块298。举例来说,视频解码器30可通过将IACT 156应用于残余数据294以产生残余数据296而基于残余数据294来重新建构译码块,残余数据296可由视频解码器30使用以重新建构译码块298。
对于视频编码器20及视频解码器30两者,在第六实例中,对于残余数据292的每一相应样本值,约束可将相应样本值的分辨率限于以下各者中的任何较大者:预定义值(例如,15),或取决于CU的原始样本值的分辨率的值(B+n5)。在此实例中,取决于CU的原始样本值的分辨率的值等于CU的原始样本值的分辨率加大于或等于3且小于或等于32的值(例如,n5)减CU的原始样本值的分辨率(例如,n5≥3且n5≤32-B)。在一些情况下,预定义值等于16或等于特定实施方案所需要的精确度的另一值。
在此第六实例中,当CU的原始样本值的位深度小于或等于第一值(例如,12)时,残余数据292的样本值的分辨率保持在第二值(例如,15)。当CU的原始样本值的位深度大于第一值时,残余数据292的样本值的分辨率限于CU的原始样本值的位深度加第三值(例如,n5)。在此第六实例中,第三值可在大于或等于3的值与小于或等于32减CU的原始样本值的位深度的值之间(例如,n5≥3且n5≤32-B)。
图9B为根据本发明的第七实例的说明一系列实例变换的概念图,其中到IACT的输入服从约束。本发明的第七实例约束经编码位流,使得到IACT 156的输入限于Max(B+n5,16)个位,即,到IACT 156的输入:
(1)可在输入的位深度B<=12位的情况下保持在16位分辨率;或
(2)将在输入的位深度为B>12位的情况下高达(B+n5)位分辨率,其中用于n5的实施例为n5>=3,且n5<=32-B。
因此,在本发明的第七实例中,视频编码器20可产生位流,所述位流服从限制用于视频数据的CU的残余数据294的样本值的分辨率的约束。在此实例中,经编码位流包括视频数据的经编码表示。在视频解码器处,残余数据294为到IACT 156的输入。视频编码器20可输出位流。
相似地,在本发明的第七实例中,视频解码器30可基于从包括视频数据的经编码表示的经编码位流获得的语法元素来确定用于视频数据的CU的残余数据294。举例来说,视频解码器30可从位流获得语法元素,基于语法元素来确定经量化变换系数,逆量化经量化变换系数,应用逆变换IT 116,且应用ICCP 152,进而获得残余数据294。在其它情况下,视频解码器30可从位流获得语法元素,基于语法元素(例如,数据230)来确定经量化样本,逆量化经量化样本,且应用ICCP 152,进而获得残余数据294。
经编码位流服从限制残余数据294的样本值的分辨率的约束。在此实例中,视频解码器30可通过将ICCP 152应用于残余数据292来产生残余数据294。视频解码器30可通过将IACT 156应用于残余数据294来产生残余数据296。视频解码器30可基于残余数据296来重新建构CU的译码块298。
在本发明的第七实例中,对于视频编码器20及视频解码器30两者,对于残余数据294的每一相应样本值,约束将相应样本值的分辨率限于以下各者中的任何较大者:预定义值(例如,16),或取决于CU的原始样本值的分辨率的值(B+n4)。此外,取决于CU的原始样本值的分辨率的值可等于CU的原始样本值的分辨率加大于或等于3且小于或等于32的值减CU的原始样本值的分辨率。
此外,在本发明的第七实例中,对于视频编码器20及视频解码器30两者,当CU的原始样本值的位深度小于或等于第一值(例如,12)时,残余数据294的样本值的分辨率保持在第二值(例如,16)。当CU的原始样本值的位深度大于第一值(例如,12)时,残余数据294的样本值的分辨率限于CU的原始样本值的位深度(例如,B)加第三值(例如,n4)。第三值在大于或等于3的值与小于或等于32减CU的原始样本值的位深度的值之间(例如,n5≥3且n5≤32-B)。
图9C为根据本发明的一或多种技术的说明展示图9A及图9B的缩合形式的一系列实例变换的概念图。图9C同时展示上述第六实例及第七实例两者的效应。
图10为说明可执行根据本发明的一或多个方面的技术的视频编码器20的实例的框图。在图10的实例中,视频编码器20包含视频数据存储器300、模式选择单元302、经解码图片缓冲器304、加法器306、变换处理单元308、量化单元310,及熵编码单元312。模式选择单元302又包含运动补偿单元314、运动估计单元316、帧内预测处理单元318,及分割单元320。为了视频块重新建构,视频编码器20还包含逆量化单元322、逆变换单元324,及加法器326。
视频数据存储器300可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器300中的视频数据。经解码图片缓冲器304可为存储用于供视频编码器20用来编码视频数据(例如,以帧内或帧间译码模式)的参考视频数据的参考图片存储器。视频数据存储器300及经解码图片缓冲器116可由多种存储器装置中的任一者形成,所述存储器装置例如为动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM),或其它类型的存储器装置。视频数据存储器300及经解码图片缓冲器304可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器300可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
在编码过程期间,视频编码器20接收待译码视频帧或切片。可将所述帧或切片划分成多个视频块。以此方式,视频编码器20可接收待编码视频帧内的当前视频块。
运动估计单元316及运动补偿单元314执行经接收视频块相对于一或多个参考帧中的一或多个块的帧间预测性译码以提供时间预测。帧内预测处理单元318可替代地执行经接收视频块相对于与待译码块相同的帧或切片中的一或多个相邻块的帧内预测性译码以提供空间预测。视频编码器20可执行多个译码遍次,例如,以选择用于视频数据的每一块的适当译码模式。
分割单元320可基于先前译码遍次中的先前分割方案的评估将视频数据的块分割成子块。举例来说,分割单元320可最初将帧或切片分割成LCU,且基于率-失真分析(例如,率-失真优化)将所述LCU中的每一者分割成子CU。模式选择单元302可进一步产生指示将LCU分割成CU的四分树数据结构。四分树的叶节点CU可包含一或多个PU及一或多个TU。
模式选择单元302可(例如)基于误差结果来选择译码模式中的一者(帧内或帧间),且可将所得经帧内或帧间译码块提供到加法器306。加法器306可产生残余块数据。举例来说,加法器306可产生用于当前CU的残余块数据,使得残余块数据的每一样本等于当前CU的译码块中的样本与当前CU的PU的预测块的对应样本之间的差。加法器306可执行图2的残余产生操作48以及图3、图4A、图4B、图5A、图5B、图5C及图5D的残余产生操作100。
加法器326可重新建构经编码块(即,译码块)以用作参考帧。加法器326可执行图2的重新建构操作84以及图3、图4A、图4B、图5A、图5B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图8、图9A、图9B及图9C的重新建构操作120。模式选择单元302还将语法元素(例如运动向量、帧内模式指示符、分割区信息及其它此类语法信息)提供到熵编码单元312。
由运动估计单元316执行的运动估计为产生运动向量的过程,运动向量估计用于视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测性块的位移,预测性块是相对于当前帧(或其它经译码单元)内正被译码的当前块。预测性块为被发现为在像素差方面紧密地匹配待译码块的块(即,预测块),像素差可由绝对差总和(SAD)、平方差总和(SSD)或其它差度量确定。
运动补偿单元314可执行运动补偿。运动补偿可涉及基于由运动估计单元316针对PU所确定的一或多个运动向量来提取或产生PU的一或多个预测性块。在接收到用于当前视频块的PU的运动向量后,运动补偿单元314就可基于运动向量来定位来自参考图片列表中的一者的图片的预测性块。一般来说,运动估计单元316执行相对于明度分量的运动估计,且运动补偿单元314将基于明度分量所计算的运动向量用于色度分量及明度分量两者。模式选择单元302还可产生与视频块及视频切片相关联的语法元素以供视频解码器30用来解码视频切片的视频块。
帧内预测处理单元318可帧内预测当前块,以作为由运动估计单元316及运动补偿单元314执行的帧间预测的替代方案。确切来说,帧内预测处理单元318可确定帧内预测模式以用来编码当前块。在一些实例中,帧内预测处理单元318可(例如)在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测处理单元318(或在一些实例中,模式选择单元302)可从经测试模式选择待使用的适当帧内预测模式。在选择用于块的帧内预测模式之后,帧内预测处理单元318可将指示用于块的经选择帧内预测模式的信息提供到熵编码单元312。熵编码单元312可编码指示经选择帧内预测模式的信息。
视频编码器20可通过确定来自模式选择单元302的预测数据(例如,预测性块)与来自正被译码的原始视频块(例如,译码块)的数据之间的差来形成残余视频块。加法器306表示执行此差运算的一或多个组件。变换处理单元308可将变换应用于残余块,从而产生包括残余变换系数值的视频块(即,变换系数块)。举例来说,变换处理单元308可将离散余弦变换(DCT)或概念上相似变换应用于残余块以产生残余系数值。
变换处理单元308可执行概念上相似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换,或其它类型的变换。在任何状况下,变换处理单元308将变换应用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素(或样本)值域转换到变换域,例如频域。变换处理单元308可将所得变换系数发送到量化单元310。
此外,变换处理单元308可将ACT变换及/或CCP变换应用于残余数据。此外,根据本发明的一或多种技术,变换处理单元308可将剪辑操作应用于残余数据以缩减由样本到变换域变换、ACT变换及/或CCP变换产生的残余数据的位深度。因此,变换处理单元308可执行图2的变换60以及图3、图4A、图4B、图5A、图5B、图5C及图5D的变换104。此外,变换处理单元308可执行图2的CCP 56以及图4A、图4B、图5A、图5B、图5C及图5D的CCP 150。另外,变换处理单元308可执行图2的ACT 52以及图4A、图4B、图5C及图5D的ACT 154。在一些实例中,变换处理单元308可加强关于以上第六实例及第七实例所描述的约束。
量化单元310量化变换系数以进一步缩减位速率。量化过程可缩减与所述系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元310执行图2的量化操作64以及图3、图4A、图4B、图5A、图5B、图5C及图5D的量化操作108。此外,在一些实例中,量化单元310可接着执行包含经量化变换系数的矩阵的扫描。替代地,熵编码单元312可执行所述扫描。
视频编码器20可在经译码视频位流中编码各种参数集。这些参数集可包含:图片参数集(PPS),其可包含为一或多个图片所共有的语法元素;及/或序列参数集,其可包含为一或多个图片序列所共有的语法元素。
在量化之后,熵编码单元312熵译码经量化变换系数。换句话说,熵编码单元312可熵编码表示经量化变换系数的语法元素。举例来说,熵编码单元312可执行上下文自适应性二进制算术译码(CABAC)、上下文自适应性可变长度译码(CAVLC)、基于语法的上下文自适应性二进制算术译码(SBAC)、机率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在熵编码单元312的熵译码之后,视频编码器20可将经编码位流传输到另一装置(例如,视频解码器30)或加以存档以供稍后传输或取回。在图10的实例中,发射器313传输位流。发射器313可为输出接口22的部分。
逆量化单元322及逆变换单元324分别应用逆量化及逆变换以在像素域中产生残余块,例如,以供稍后用作参考块。举例来说,逆量化单元322可解量化变换系数块。逆变换单元324可通过将逆变换应用于经解量化变换系数块来产生TU的变换块。逆量化单元322可执行图2的逆量化操作68以及图3、图4A、图4B、图5A、图5B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图8、图9A、图9B及图9C的逆量化操作112。逆变换单元322可执行图2的逆变换72以及图3、图4A、图4B、图5A、图5B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图8、图9A、图9B及图9C的逆变换116。此外,逆变换单元322可执行图2的ICCP 76以及图4A、图4B、图5A、图5B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图9A、图9B及图9C的ICCP 152。逆变换单元322可执行图2的IACT 80以及图4B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图8、图9A、图9B及图9C的IACT 156。
逆量化单元322、逆变换单元324及加法器326可形成视频编码器20的解码回路。根据本发明的一或多种技术,逆变换单元324可应用逆ACT及逆CCP变换。此外,根据本发明的一或多种技术,逆变换单元324可执行剪辑操作,如在本发明中的别处的实例中所描述。
加法器326将残余块加到由运动补偿单元314产生的经运动补偿预测块以产生用于存储在经解码图片缓冲器304中的经重新建构视频块。运动估计单元316及运动补偿单元314可将经重新建构视频块用作参考块以帧间译码(即,帧间预测)后续视频帧中的块。
运动估计单元316可确定可由视频编码器20用来预测经帧间预测的一或多个PU的像素值的一或多个参考图片。运动估计单元316可将参考图片存储在经解码图片缓冲器304中直到所述图片被标记为不用于参考为止。视频编码器20的模式选择单元302可编码包含用于一或多个参考图片的识别信息的各种语法元素。
图11为说明可执行根据本发明的一或多个方面的技术的视频解码器的实例的框图。在图11的实例中,视频解码器30包含视频数据存储器350、熵解码单元352、运动补偿单元354、帧内预测处理单元356、逆量化单元358、逆变换单元360、经解码图片缓冲器362及加法器364。在一些实例中,视频解码器30可执行与关于视频编码器20(图1及图10)所描述的编码遍次大体上互逆的解码遍次。
视频数据存储器350可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。可(例如)从信道16(图1)(例如,从例如摄影机等本地视频源)、经由视频数据的有线或无线网络通信或通过存取物理数据存储媒体来获得存储在视频数据存储器350中的视频数据。视频数据存储器350可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。经解码图片缓冲器362可为存储用于供视频解码器30用来解码视频数据(例如,以帧内或帧间译码模式)的参考视频数据的参考图片存储器。视频数据存储器350及经解码图片缓冲器362可由多种存储器装置中的任一者形成,所述存储器装置例如为动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM),或其它类型的存储器装置。视频数据存储器350及经解码图片缓冲器362可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器350可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。如图11的实例中所展示,视频解码器30可从接收器361接收经编码视频位流。接收器361可为输入接口28的部分。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及关联语法元素及/或语法数据的经编码视频位流。视频解码器30的熵解码单元352熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符,及其它语法元素。熵解码单元352可将语法元素转发到运动补偿单元354。
熵解码单元352可解码及解析各种参数集中的额外语法元素。这些参数集可包含:PPS,其可包含为一或多个图片所共有的语法元素;及/或SPS,其可包含为一或多个图片序列所共有的语法元素。
视频解码器30可基于存储在经解码图片缓冲器362中的参考图片来建构参考图片列表(列表0及列表1)(例如,使用预设建构技术)。当将视频切片译码为经帧内译码(I)切片时,帧内预测处理单元356可产生用于当前视频切片的视频块的预测数据。帧内预测处理单元356可基于经传信帧内预测模式及来自当前帧或图片的经先前解码块的数据来产生预测数据。当视频解码器30将视频帧的切片译码为经帧间译码(即,B或P)切片时,运动补偿单元354可基于从熵解码单元352接收的运动向量及其它语法元素来产生用于当前视频切片的视频块的预测性块。运动补偿单元354可从参考图片列表中的一者内的参考图片中的一者产生预测性块。
运动补偿单元354可使用运动向量及/或语法元素来确定用于当前视频切片的视频块的预测信息。在一些实例中,运动补偿单元354可基于从熵解码单元352接收的运动向量来产生预测信息。运动补偿单元354可使用预测信息以产生用于正被解码的当前视频块的预测性块。举例来说,运动补偿单元354使用经接收语法元素中的一些来确定用以译码当前视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于切片的参考图片列表中的一或多者的建构信息、用于当前视频切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
逆量化单元358逆量化(即,解量化)位流中提供且由熵解码单元352解码的经量化变换系数。逆量化过程可包含使用量化参数QPY来确定量化程度且同样地确定应被应用的逆量化程度。视频解码器30可针对视频切片中的每一视频块计算量化参数QPY。
逆变换单元360可接收经解量化变换系数块。如果针对当前块跳过变换,那么逆变换单元360可接收经解量化残余块。逆变换单元360可使用逆变换来变换经接收块。在一些实例中,逆变换(例如,逆DCT、逆整数变换或概念上相似逆变换过程)到变换系数以便在像素域中产生残余块(例如,变换块)。逆变换单元360可输出被称作“残余信号”的信号。
此外,逆变换单元360可将逆ACT变换及/或逆CCP变换应用于经逆变换(例如,逆余弦变换或逆正弦变换)残余数据。此外,根据本发明的一或多种技术,逆变换单元360可将剪辑操作应用于经逆变换残余数据以缩减由变换到样本域变换、逆ACT变换及/或逆CCP变换产生的经逆变换残余数据的位深度。
视频解码器30还可基于语法元素或其它信息来确定当前块被帧内预测。如果当前视频块被帧内预测,那么帧内预测处理单元356可解码所述当前块。帧内预测处理单元356可从与当前块相同的图片确定相邻预测性块。帧内预测处理单元356可基于预测性块来产生变换系数块及/或残余块。
在运动补偿单元354或帧内预测处理单元356基于运动向量及其它语法元素来产生用于当前视频块的变换系数块及/或残余块之后,视频解码器30通过组合来自逆变换单元358的残余块与由运动补偿单元354产生的对应预测性块来形成经解码视频块。加法器364表示可执行此求和运算的一或多个组件。经解码图片缓冲器362将经解码视频块存储在给定帧或图片中,给定帧或图片可由视频解码器30用于后续运动补偿。经解码图片缓冲器362还可存储经解码视频以供稍后呈现于显示装置(例如图1的显示装置32)上。
运动补偿单元354及/或帧内预测处理单元356可基于明度残余块、缩放比例及经预测色度残余样本来确定色度残余样本的块。在具有色度残余样本的块的情况下,加法器364可求和色度残余样本及明度残余样本与预测性块的相应色度样本及明度样本以解码当前块(例如,重新建构当前块)。加法器364可执行图3、图4A、图4B、图5A、图5B、图5C、图5D、图6A、图6B、图6C、图6D、图7、图8、图9A、图9B及图9C的重新建构操作120。在一些实例中,一旦视频解码器30产生经重新建构视频,视频解码器30就可输出经重新建构视频块作为经解码视频(例如,用于显示或存储)。
如上文所描述,在帧间预测期间,运动补偿单元354可确定可由视频解码器30用以形成用于正被解码的当前块的预测性视频块的一或多个参考图片。运动补偿单元354可将参考图片存储在经解码图片缓冲器362中直到所述参考图片被标记为不用于参考为止。
图12为根据本发明的技术的说明视频译码器的实例操作的流程图。图12的操作可由视频编码器(例如,图1及图10的视频编码器20)、视频解码器(例如,图1及图11的视频解码器30)或另一单元或装置执行。
在图12的实例中,视频译码器可基于第一残余数据的位深度将第一残余数据剪辑到可变范围(402)。在一些实例中,视频译码器可通过将逆变换应用于经变换残余数据来产生第一经逆变换残余数据。在一些实例中,逆变换为从变换域到样本域的变换。举例来说,逆变换可为逆离散余弦变换或逆离散正弦变换。在其它实例中,逆变换可为ICCP。第一残余数据为到IACT的输入。
此外,视频译码器可至少部分地通过将IACT应用于经剪辑第一残余数据来产生第二残余数据(404)。在一些实例中,可应用除了IACT以外的一或多个改变以产生第二残余数据。视频译码器可基于第二残余数据来重新建构视频数据的CU的译码块(406)。举例来说,视频译码器可重新建构CU的译码块,使得对应于第二残余数据的样本的译码块的每一相应样本大体上等于(例如,具有可能舍入误差)第二残余数据的样本与CU的PU的预测性块的对应样本的总和。
在此实例中,视频译码器可通过将逆变换应用于残余数据来产生第一残余数据。在产生第一残余数据之后且在产生第二残余数据之前:
(i)基于第一经逆变换残余数据的位深度小于或等于特定值,视频译码器可将第一经逆变换残余数据的分辨率保持在特定分辨率;或
(ii)基于第一经逆变换残余数据的位深度大于特定值,视频译码器可将剪辑操作应用于第一经逆变换残余数据。
在此实例中,视频译码器可通过将IACT应用于第一残余数据来产生第二残余数据。视频译码器可基于第二残余数据来重新建构视频数据的CU的译码块。
应认识到,取决于实例,可以不同序列执行、可添加、合并或完全地省略本文中所描述的技术中的任一者的某些动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践是必要的)。此外,在某些实例中,可(例如)经由多执行绪处理、中断处理或多个处理器同时地而非依序地执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。举例来说,图10及图11的步骤可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么所述功能可作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体进行传输,且由基于硬件的处理单元执行。计算机可读媒体可包含:计算机可读存储媒体,其对应于例如数据存储媒体的有形媒体;或通信媒体,其包含(例如)根据通信协议来促进计算机程序从一位置到另一位置的传送的任何媒体。以此方式,计算机可读媒体通常可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以取回用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存器,或可用以存储呈指令或数据结构形式的所要代码且可由计算机存取的任何其它媒体。并且,任何连接被适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源传输指令,那么同轴电缆、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是有关于非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各者的组合还应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路系统的一或多个处理器执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编解码器中。并且,所述技术可完全地实施于一或多个电路或逻辑元件中。
本发明的技术可实施于各种各样的装置或设备中,所述装置或设备包含无线手机、集成电路(IC)或一组IC(例如,芯片集)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元进行实现。确切来说,如上文所描述,各种单元可组合于编解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适软件及/或固件而提供。
已描述各种实例。这些及其它实例在以下权利要求书的范围内。
Claims (24)
1.一种编码或解码视频数据的方法,所述方法包括:
将到逆自适应性色彩变换IACT的输入剪辑到以下中的最大值:(i)16位及(ii)位深度等于预测像素的位深度加值,其中所述值大于或等于4且小于或等于32减所述预测像素的所述位深度,其中到所述IACT的所述输入为第一残余数据;
至少部分地通过将所述IACT应用于经剪辑输入来产生第二残余数据;以及
基于所述第二残余数据来重新建构所述视频数据的译码单元CU的译码块。
2.根据权利要求1所述的方法,其中剪辑所述输入包括:
基于所述预测像素的所述位深度小于或等于特定值,将所述第一残余数据的位深度保持在16位;以及
基于所述预测像素的所述位深度大于所述特定值,将剪辑操作应用于所述第一残余数据。
3.根据权利要求2所述的方法,其中所述特定值为12。
4.根据权利要求1所述的方法,其进一步包括应用逆跨组件预测ICCP变换以产生所述第一残余数据。
5.根据权利要求1所述的方法,其进一步包括应用从变换域到样本域的逆变换以产生所述第一残余数据。
6.根据权利要求5所述的方法,其中所述逆变换为逆离散余弦变换。
7.根据权利要求1所述的方法,所述方法可在无线通信装置上执行,其中所述无线通信装置包括:
存储器,其经配置以存储所述视频数据;
处理器,其经配置以执行指令以处理存储在所述存储器中的所述视频数据;以及
以下各者中的至少一者:
发射器,其经配置以传输包括所述视频数据的经编码表示的位流,所述视频数据的所述经编码表示包括所述CU的经编码表示;或
接收器,其经配置以接收包括所述视频数据的所述经编码表示的所述位流。
8.根据权利要求7所述的方法,其中:
所述无线通信装置为蜂窝电话,
所述位流是根据蜂窝通信标准来调制,及
以下各者中的至少一者:
所述位流是由所述发射器传输,或
所述位流是由所述接收器接收。
9.一种用于编码或解码视频数据的装置,所述装置包括:
存储器,其经配置以存储所述视频数据;以及
一或多个处理器,其经配置以进行以下操作:
将到逆自适应性色彩变换IACT的输入剪辑到以下中的最大值:(i)16位及(ii)位深度等于预测像素的位深度加值,其中所述值大于或等于4且小于或等于32减所述预测像素的所述位深度,其中到所述IACT的所述输入为第一残余数据;
至少部分地通过将所述IACT应用于经剪辑输入来产生第二经逆变换残余数据;以及
基于所述第二经逆变换残余数据来重新建构所述视频数据的译码单元CU的译码块。
10.根据权利要求9所述的装置,其中所述一或多个处理器经配置使得作为剪辑所述输入的部分,所述一或多个处理器进行以下操作:
基于所述预测像素的所述位深度小于或等于特定值,将所述第一残余数据的位深度保持在16位;以及
基于所述预测像素的所述位深度大于所述特定值,将剪辑操作应用于所述第一残余数据。
11.根据权利要求10所述的装置,其中所述特定值为12。
12.根据权利要求9所述的装置,其中所述一或多个处理器经配置以应用逆跨组件预测ICCP变换以产生所述第一残余数据。
13.根据权利要求9所述的装置,其中所述一或多个处理器经配置以应用从变换域到样本域的逆变换以产生所述第一残余数据。
14.根据权利要求13所述的装置,其中所述逆变换为逆离散余弦变换。
15.根据权利要求9所述的装置,其中所述装置为无线通信装置,其进一步包括以下各者中的至少一者:
发射器,其以通信方式耦合到所述一或多个处理器,所述发射器经配置以传输包括所述视频数据的经编码表示的位流,所述视频数据的所述经编码表示包括所述CU的经编码表示;或
接收器,其以通信方式耦合到所述一或多个处理器,所述接收器经配置以接收包括所述视频数据的所述经编码表示的所述位流。
16.根据权利要求15所述的装置,其中:
所述无线通信装置为蜂窝电话,
所述位流是根据蜂窝通信标准来调制,及
以下各者中的至少一者:
所述位流是由所述发射器传输,或
所述位流是由所述接收器接收。
17.一种用于编码或解码视频数据的装置,所述装置包括:
用于将到逆自适应性色彩变换IACT的输入剪辑到以下中的最大值的装置:(i)16位及(ii)位深度等于预测像素的位深度加值,其中所述值大于或等于4且小于或等于32减所述预测像素的所述位深度,其中到所述IACT的所述输入为第一残余数据;
用于至少部分地通过将所述IACT应用于经剪辑输入来产生第二经逆变换残余数据的装置;以及
用于基于所述第二经逆变换残余数据来重新建构所述视频数据的译码单元CU的译码块的装置。
18.根据权利要求17所述的装置,其中所述用于剪辑所述输入的装置包括:
用于基于所述预测像素的所述位深度小于或等于特定值,将所述第一残余数据的位深度保持在16位的装置;以及
用于基于所述预测像素的所述位深度大于所述特定值,将剪辑操作应用于所述第一残余数据的装置。
19.根据权利要求18所述的装置,其中所述特定值为12。
20.根据权利要求17所述的装置,其进一步包括用于应用逆跨组件预测ICCP变换以产生所述第一残余数据的装置。
21.根据权利要求17所述的装置,其进一步包括用于应用从变换域到样本域的逆变换以产生所述第一残余数据的装置。
22.根据权利要求21所述的装置,其中所述逆变换为逆离散余弦变换。
23.一种存储有指令的计算机可读存储媒体,所述指令在被执行时致使用于编码或解码视频数据的装置的一或多个处理器进行以下操作:
将到逆自适应性色彩变换IACT的输入剪辑到以下中的最大值:(i)16位及(ii)位深度等于预测像素的位深度加值,其中所述值大于或等于4且小于或等于32减所述预测像素的所述位深度,其中到所述IACT的所述输入为第一残余数据;
至少部分地通过将所述IACT应用于经剪辑输入来产生第二残余数据;以及
基于所述第二残余数据来重新建构所述视频数据的译码单元CU的译码块。
24.根据权利要求23所述的计算机可读存储媒体,其中所述指令部分地通过致使所述一或多个处理器进行以下操作来致使所述一或多个处理器剪辑所述输入:
基于所述预测像素的所述位深度小于或等于特定值,将所述第一残余数据的位深度保持在16位;以及
基于所述预测像素的所述位深度大于所述特定值,将剪辑操作应用于所述第一残余数据。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562110324P | 2015-01-30 | 2015-01-30 | |
US62/110,324 | 2015-01-30 | ||
US201562113269P | 2015-02-06 | 2015-02-06 | |
US62/113,269 | 2015-02-06 | ||
US201562115487P | 2015-02-12 | 2015-02-12 | |
US62/115,487 | 2015-02-12 | ||
US15/006,563 | 2016-01-26 | ||
US15/006,563 US10158836B2 (en) | 2015-01-30 | 2016-01-26 | Clipping for cross-component prediction and adaptive color transform for video coding |
PCT/US2016/015149 WO2016123232A1 (en) | 2015-01-30 | 2016-01-27 | Clipping for cross-component prediction and adaptive color transform for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107211151A CN107211151A (zh) | 2017-09-26 |
CN107211151B true CN107211151B (zh) | 2020-03-27 |
Family
ID=55398431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680006123.3A Active CN107211151B (zh) | 2015-01-30 | 2016-01-27 | 用于视频译码的跨组件预测剪裁及自适应性色彩变换 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10158836B2 (zh) |
EP (1) | EP3251359A1 (zh) |
JP (1) | JP6608454B2 (zh) |
KR (1) | KR102060868B1 (zh) |
CN (1) | CN107211151B (zh) |
AU (1) | AU2016211519B2 (zh) |
BR (1) | BR112017016380A2 (zh) |
TW (1) | TWI678100B (zh) |
WO (1) | WO2016123232A1 (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3198556B1 (en) * | 2014-09-26 | 2018-05-16 | Dolby Laboratories Licensing Corp. | Encoding and decoding perceptually-quantized video content |
EP3297282A1 (en) * | 2016-09-15 | 2018-03-21 | Thomson Licensing | Method and apparatus for video coding with adaptive clipping |
WO2019065487A1 (ja) * | 2017-09-28 | 2019-04-04 | シャープ株式会社 | 値制限フィルタ装置、動画像符号化装置および動画像復号装置 |
US11115660B2 (en) * | 2018-04-30 | 2021-09-07 | Mediatek Inc. | Method and apparatus of syntax interleaving for separate coding tree in video coding |
CN109451305B (zh) * | 2018-10-26 | 2021-05-07 | 西安科锐盛创新科技有限公司 | 带宽压缩中的预测方法 |
CN113273203B (zh) * | 2018-12-22 | 2024-03-12 | 北京字节跳动网络技术有限公司 | 两步交叉分量预测模式 |
US12114000B2 (en) * | 2019-03-08 | 2024-10-08 | Qualcomm Incorporated | Combined residual coding in video coding |
JP7233565B2 (ja) * | 2019-03-24 | 2023-03-06 | 北京字節跳動網絡技術有限公司 | ビデオ処理におけるマルチパラメータ適応ループフィルタリング |
KR102609947B1 (ko) | 2019-04-02 | 2023-12-04 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 양방향 광학 흐름 기반 비디오 코딩 및 디코딩 |
WO2020211864A1 (en) | 2019-04-19 | 2020-10-22 | Beijing Bytedance Network Technology Co., Ltd. | Region based gradient calculation in different motion vector refinements |
CN113711609B (zh) | 2019-04-19 | 2023-12-01 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程中的增量运动矢量 |
CN113711608B (zh) | 2019-04-19 | 2023-09-01 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程的适用性 |
US10818083B1 (en) * | 2019-04-30 | 2020-10-27 | International Business Machines Corporation | Pyramid generation via depth-first walk |
CN118138754A (zh) | 2019-06-14 | 2024-06-04 | 北京字节跳动网络技术有限公司 | 处理视频单元边界和虚拟边界 |
WO2021004542A1 (en) | 2019-07-11 | 2021-01-14 | Beijing Bytedance Network Technology Co., Ltd. | Sample padding in adaptive loop filtering |
KR20230117266A (ko) | 2019-10-11 | 2023-08-07 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 4:4:4 크로마 포맷의 비디오 코딩 방법 및 장치 |
WO2021121419A1 (en) | 2019-12-19 | 2021-06-24 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between adaptive color transform and quantization parameters |
WO2021138476A1 (en) * | 2019-12-30 | 2021-07-08 | Beijing Dajia Internet Information Technology Co., Ltd. | Coding of chrominance residuals |
CN115191118A (zh) | 2020-01-05 | 2022-10-14 | 抖音视界有限公司 | 在视频编解码中使用自适应颜色变换 |
KR20230101946A (ko) * | 2020-01-05 | 2023-07-06 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 4:4:4 크로마 포맷에서의 비디오 코딩의 방법들 및장치 |
WO2021139707A1 (en) * | 2020-01-08 | 2021-07-15 | Beijing Bytedance Network Technology Co., Ltd. | Joint coding of chroma residuals and adaptive color transforms |
CN115176470A (zh) * | 2020-01-18 | 2022-10-11 | 抖音视界有限公司 | 图像/视频编解码中的自适应颜色变换 |
KR20220128338A (ko) * | 2020-01-24 | 2022-09-20 | 소니그룹주식회사 | 화상 처리 장치 및 방법 |
WO2021150086A1 (ko) * | 2020-01-25 | 2021-07-29 | 엘지전자 주식회사 | Act 레지듀얼 기반 영상 또는 비디오 코딩 |
US12088832B2 (en) * | 2020-01-25 | 2024-09-10 | Lg Electronics Inc. | Image or video coding for residuals using color space transformation |
US12120299B2 (en) * | 2020-01-25 | 2024-10-15 | Lg Electronics Inc. | Image or video coding based on color space conversion |
WO2021252995A1 (en) | 2020-06-12 | 2021-12-16 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus of video coding in 4:4:4 color format |
US20240080463A1 (en) * | 2022-09-02 | 2024-03-07 | Tencent America LLC | Cross component sample clipping |
CN117612072B (zh) * | 2024-01-23 | 2024-04-19 | 中国科学技术大学 | 一种基于动态时空图的视频理解方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103891293A (zh) * | 2011-10-21 | 2014-06-25 | 高通股份有限公司 | 用于色度分量的自适应环路滤波 |
WO2014113390A1 (en) * | 2013-01-16 | 2014-07-24 | Qualcomm Incorporated | Inter-layer prediction for scalable coding of video information |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1538844A3 (en) * | 2003-11-26 | 2006-05-31 | Samsung Electronics Co., Ltd. | Color image residue transformation and encoding method |
US7949044B2 (en) | 2005-04-12 | 2011-05-24 | Lsi Corporation | Method for coefficient bitdepth limitation, encoder and bitstream generation apparatus |
US8014445B2 (en) * | 2006-02-24 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for high dynamic range video coding |
US9456111B2 (en) * | 2010-06-15 | 2016-09-27 | Mediatek Inc. | System and method for content adaptive clipping |
CN104054338B (zh) * | 2011-03-10 | 2019-04-05 | 杜比实验室特许公司 | 位深和颜色可伸缩视频编码 |
US9225991B2 (en) * | 2013-05-30 | 2015-12-29 | Apple Inc. | Adaptive color space transform coding |
US9648332B2 (en) * | 2013-10-28 | 2017-05-09 | Qualcomm Incorporated | Adaptive inter-color component residual prediction |
US9756337B2 (en) * | 2013-12-17 | 2017-09-05 | Qualcomm Incorporated | Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding |
US9948933B2 (en) * | 2014-03-14 | 2018-04-17 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
US9883184B2 (en) * | 2014-10-07 | 2018-01-30 | Qualcomm Incorporated | QP derivation and offset for adaptive color transform in video coding |
US9468332B2 (en) * | 2014-11-10 | 2016-10-18 | Haier Us Appliance Solutions, Inc. | Docking station for a beverage dispenser having a reservoir |
-
2016
- 2016-01-26 US US15/006,563 patent/US10158836B2/en active Active
- 2016-01-27 BR BR112017016380A patent/BR112017016380A2/pt not_active Application Discontinuation
- 2016-01-27 CN CN201680006123.3A patent/CN107211151B/zh active Active
- 2016-01-27 KR KR1020177020971A patent/KR102060868B1/ko active IP Right Grant
- 2016-01-27 EP EP16705370.1A patent/EP3251359A1/en not_active Ceased
- 2016-01-27 TW TW105102623A patent/TWI678100B/zh active
- 2016-01-27 WO PCT/US2016/015149 patent/WO2016123232A1/en active Application Filing
- 2016-01-27 AU AU2016211519A patent/AU2016211519B2/en active Active
- 2016-01-27 JP JP2017540094A patent/JP6608454B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103891293A (zh) * | 2011-10-21 | 2014-06-25 | 高通股份有限公司 | 用于色度分量的自适应环路滤波 |
WO2014113390A1 (en) * | 2013-01-16 | 2014-07-24 | Qualcomm Incorporated | Inter-layer prediction for scalable coding of video information |
Also Published As
Publication number | Publication date |
---|---|
TWI678100B (zh) | 2019-11-21 |
CN107211151A (zh) | 2017-09-26 |
KR20170108964A (ko) | 2017-09-27 |
US10158836B2 (en) | 2018-12-18 |
JP2018507622A (ja) | 2018-03-15 |
TW201633781A (zh) | 2016-09-16 |
AU2016211519B2 (en) | 2019-11-07 |
BR112017016380A2 (pt) | 2018-03-27 |
JP6608454B2 (ja) | 2019-11-20 |
AU2016211519A1 (en) | 2017-07-13 |
US20160227224A1 (en) | 2016-08-04 |
EP3251359A1 (en) | 2017-12-06 |
WO2016123232A1 (en) | 2016-08-04 |
KR102060868B1 (ko) | 2019-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107211151B (zh) | 用于视频译码的跨组件预测剪裁及自适应性色彩变换 | |
US11778234B2 (en) | Video intra prediction using hybrid recursive filters | |
CN107113436B (zh) | 用于解码视频数据的方法和装置以及计算机可读存储媒体 | |
CN107710765B (zh) | 用于译码视频数据的方法和装置及计算机可读存储介质 | |
US10455249B2 (en) | Downsampling process for linear model prediction mode | |
CN108028940B (zh) | 调色板模式视频译码中转义像素信号值的限制 | |
CN107079150B (zh) | 用于视频译码中自适应颜色变换的量化参数推导及偏移 | |
KR101918873B1 (ko) | 비디오 코딩에서 교차 구성 예측과 적응형 컬러 변환의 조화 | |
CN107409215B (zh) | 用于视频译码的调色板模式译码 | |
KR101977450B1 (ko) | 팔레트 코딩 모드에서의 비디오 블록의 이스케이프 픽셀들의 양자화 | |
CN106464877B (zh) | 在视频译码中确定将解块滤波应用于经调色板译码块 | |
TWI689195B (zh) | 用於調色板寫碼之寫碼逃脫像素 | |
CN107211138B (zh) | 编码、解码视频数据的方法、装置和计算机可读存储媒体 | |
TWI544787B (zh) | 當跳過轉換時用於有損寫碼之內部預測模式 | |
JP2023153802A (ja) | イントラ・サブパーティション・コーディング・ツールによって引き起こされるサブパーティション境界のためのデブロッキングフィルタ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |