CN107211135A - 用于调色盘模式译码的译码逃脱像素 - Google Patents
用于调色盘模式译码的译码逃脱像素 Download PDFInfo
- Publication number
- CN107211135A CN107211135A CN201680005867.3A CN201680005867A CN107211135A CN 107211135 A CN107211135 A CN 107211135A CN 201680005867 A CN201680005867 A CN 201680005867A CN 107211135 A CN107211135 A CN 107211135A
- Authority
- CN
- China
- Prior art keywords
- value
- parameter
- pixel
- color saucer
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013139 quantization Methods 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims description 92
- 238000003860 storage Methods 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 description 43
- 238000006243 chemical reaction Methods 0.000 description 32
- 239000013598 vector Substances 0.000 description 32
- 230000008569 process Effects 0.000 description 25
- 230000009466 transformation Effects 0.000 description 14
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 239000000523 sample Substances 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 12
- 239000003086 colorant Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000013074 reference sample Substances 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000017105 transposition Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 241000270295 Serpentes Species 0.000 description 2
- 229910002056 binary alloy Inorganic materials 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 244000283207 Indigofera tinctoria Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30018—Bit or string instructions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
在一个实例中,一种用于解码视频数据的装置包含:存储器,其经配置以存储视频数据;和视频解码器,其经配置以确定所述视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零、基于所述右移位参数的所述值小于零而将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值,且使用所述左移位参数的所述值而对所述逃脱模式译码像素进行反量化。
Description
本申请案主张2015年1月31日申请的美国临时申请案第62/110,519号的权益,所述美国临时申请案特此以全文引用的方式并入。
技术领域
本发明涉及视频译码,且更明确地说,涉及使用调色盘模式对视频数据进行译码。
背景技术
数字视频频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放机、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置和其类似者。数字视频装置实施视频译码技术,例如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4,Part10先进视频译码(AVC)、ITU-T H.265(也被称作高效视频译码(HEVC))定义的标准和这些标准的扩展中所描述的那些视频译码技术。视频装置可通过实施这些视频译码技术而更有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,视频切片(例如,视频图片或视频图片的一部分)可分割成视频块,视频块也可被称作译码树单元(CTU)、译码单元(CU)和/或译码节点。可使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的经帧内译码(I)的切片中的视频块。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。经帧内译码的块是根据帧内译码模式和残余数据来编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而导致残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
大体来说,本发明描述关于量化视频数据的调色盘模式译码块的逃脱模式译码像素的值的技术。明确地说,在一些情况下,常规逃脱模式译码技术导致其中二进制值将由负值右移位的某些情况。通过负值的按位移位运算通常为未定义运算,其可能造成错误。本发明的技术可用以在这些错误出现时校正这些错误。明确地说,本发明的技术可用以将移位值从负改变为正,且可用以执行按位左移位运算,而非按位右移位运算。
在一个实例中,一种方法包含:确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零;基于所述右移位参数的原始值小于零,将左移位参数的值设定为具有等于原始值的绝对值的绝对值的正值;且使用所述左移位参数的值对所述逃脱模式译码像素进行反量化。
在另一实例中,一种用于解码视频数据的装置包含:存储器,其经配置以存储视频数据;和视频解码器,其经配置以基于所述视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零而确定所述右移位参数的所述值小于零、将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值,且使用所述左移位参数的所述值对所述逃脱模式译码像素进行反量化。
在另一实例中,一种用于解码视频数据的装置包含:用于确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移参数的值小于零的装置;用于基于所述右移参数的所述值小于零而将左移位参数的值设定为具有等于所述右移参数的绝对值的绝对值的正值的装置;和用于使用所述左移参数的所述值对所述逃脱模式译码像素进行反量化的装置。
在另一实例中,一种计算机可读存储媒体编码有指令,所述指令当在执行时使得可编程处理器:确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零;基于所述右移位参数的所述值小于零而将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值;和使用所述左移位参数的值对所述逃脱模式译码像素进行反量化。
在另一实例中,一种对视频数据进行编码的方法包含:确定视频数据的调色盘模式译码块的逃脱模式译码像素的左移位参数的值小于零;基于所述左移位参数的值小于零,将右移位参数的值设定为具有等于所述左移位参数的绝对值的绝对值的正值;和使用所述左移位参数的值对所述逃脱模式译码像素进行量化。
在以下附图和描述中阐述一或多个实例的细节。其它特征、目标和优点将从所述描述和图以及从权利要求书显而易见。
附图说明
图1为说明可利用本发明的技术用于对调色盘模式译码块中的逃脱像素进行译码的实例视频编码和解码系统的框图。
图2为说明可根据本发明的技术实施用于对调色盘模式译码块中的逃脱像素进行编码的技术的视频编码器的实例的框图。
图3为说明可根据本发明的技术实施用于对调色盘模式译码块中的逃脱像素进行解码的技术的视频解码器的实例的框图。
图4为说明用于根据本发明的技术对视频数据的块进行编码的实例方法的流程图。
图5为说明用于根据本发明的技术对视频数据的块进行解码的实例方法的流程图。
图6为说明调色盘解码单元可藉以根据本发明的技术对视频数据的调色盘模式编码块的经量化逃脱像素值进行解量化的实例技术的流程图。
具体实施方式
大体来说,本申请案描述用于支持通过调色盘模式译码对视频内容(尤其屏幕内容)的译码的技术。更明确地说,这些技术涉及用于调色盘模式译码(也被称作“调色盘译码”)的逃脱像素译码。
在传统视频译码中,假定图像为连续色调且在空间上平滑。基于这些假设,已开发各种工具,例如,基于块的变换、滤波等,且这些工具已展示针对从然内容视频的良好性能。然而,在如远程台式、合作工作和无线显示器的应用中,计算机产生的屏幕内容(例如,例如文字或计算机图形)可为待压缩的主要内容。此类型的内容倾向于具有离散色调且以尖锐线和高对比度物件边界为特征。连续色调和平滑度的假设可能不再适用于屏幕内容,且因此传统视频译码技术可能不为压缩包含屏幕内容的视频数据的有效方式。
基于屏幕内容视频的特性,引入调色盘译码以改善屏幕内容译码(SCC)效率,且于2013年4月18日到26日在韩国仁川举行的ITU-T SG 13WP 3的JCT-VC和ISO/IEC JTC 1/SC29/WG 11第13次会议JCTVC-M0323中郭(Guo)等人的“用于屏幕内容译码的调色盘模式(Palette Mode for Screen Content Coding)”中首先提出调色盘译码。具体地说,基于在SCC中一个译码单元(CU)内的颜色通常集中于少数峰值的事实,调色盘译码引入查找表(即,调色盘)来压缩重复像素值。给定用于特定CU的调色盘,CU内的像素经映射到调色盘索引。在第二阶段中,提议来自左执行长度方法的有效副本以有效地压缩指数块的重复型样。后来,在2013年7月25日到8月2日于奥地利维也纳举行的ITU-T SG 16 WP 3的JCT-VC和ISO/IEC JTC 1/SC 29/WG 11,JCTVC-N0249第14次会议中郭等人的“非RCE3:用于屏幕内容译码的修改的调色盘模式(Non-RCE3:Modified Palette Mode for Screen ContentCoding)”中,将调色盘索引译码模式一般化到具有执行长度译码的来自左方的副本和来自上方的副本两者。应注意,未调用任何变换过程用于调色盘译码以避免模糊尖锐边缘,模糊尖锐边缘对屏幕内容的视觉质量有着巨大的负面影响。
调色盘为存储{索引,像素值}对的数据结构。视频编码器可(例如,基于当前CU中的像素值直方图)确定调色盘。举例来说,可将直方图中的峰值添加到调色盘中,而低频像素值不必包含于调色盘中。可将调色盘大小限制为在0到等于31的max_palette_size的范围内。
对于SCC,一个切片内的CU块可共享许多主要颜色。因此,有可能使用前述调色盘模式CU的调色盘(以CU解码次序)作为参考而预测当前块的调色盘。具体来说,可用信号表示0-1二进制向量以指示当前调色盘是否再使用参考调色盘中的像素值。作为实例,在下文的表1和2中,假定参考调色盘具有6个项目。可通过当前调色盘用信号表示向量(1,0,1,1,1,1),所述向量指示在当前调色盘中再使用v0、v2、v3、v4和v5而并未再使用v1。如果当前调色盘含有不可从参考调色盘预测的颜色,那么对未预测颜色的数目进行译码,且接着直接用信号表示这些像素值(例如,亮度值或色度值)。举例来说,在表1和2中,直接将u0和u1用信号表示于位流中。
表1—参考调色盘
索引 | 像素值 |
0 | V0 |
1 | V1 |
2 | V2 |
3 | V3 |
4 | V4 |
5 | V5 |
表2—当前调色盘
预测旗标 | 索引 | 像素值 |
1 | 0 | V0 |
0 | ||
1 | 1 | V2 |
1 | 2 | V3 |
1 | 3 | V4 |
4 | V5 | |
5 | U0 | |
6 | U1 |
对于通过调色盘模式译码的块,可从先前调色盘译码块的调色盘条目预测调色盘、可将调色盘明确地用信号表示为新条目,或可完全再使用先前译码块的调色盘。后一情况被称为调色盘共享,且可用信号表示旗标palette_share_flag以指示先前块的整个调色盘未作修改而按原样再使用。在上文的表1和2中展示参考调色盘和当前调色盘的实例。明确地说,表1说明实例参考调色盘,且表2说明可从表1的参考调色盘预测的实例当前调色盘。
在当前SCM3.0参考软件中,从规范性观点来看,调色盘译码的两个主要方面为调色盘的译码和用于以调色盘模式译码的块中的每一样本的调色盘索引的译码。使用两个主要模式(“索引”模式和“上方副本”模式)执行调色盘索引的译码。通过对palette_modeflag进行译码来用信号表示此译码。“索引”模式也用以指示逃脱样本,即,不属于调色盘的样本。在当前设计中,“上方副本”模式对于调色盘块的第一行来说是不可能的。此外,“上方副本”模式可能不遵循另一“上方副本”模式。在这些情况下,推断出“索引”模式。
具体地说,对于调色盘模式,按以下的水平/垂直蛇形扫描次序对CU中的像素进行编码:
1.“索引”模式:在此模式中,首先用信号表示一个调色盘索引。如果索引等于调色盘的大小,那么此情形指示样本为逃脱样本。在此情况下,用信号表示用于每一分量(例如,亮度和色度)的样本值或经量化样本值。举例来说,如果调色盘大小为4,那么对于非逃脱样本,调色盘索引在[0,3]范围内。在此情况下,索引值4表示逃脱样本。如果索引指示非逃脱样本,那么通过指示执行长度的非负值n-1用信号表示执行长度,执行长度指定在扫描次序上共享相同索引的后续样本的数目,此意味着包含当前像素的后续n个像素具有与首先用信号表示的像素相同的像素索引。
2.“从上方复制”执行模式(CA):在此模式中,仅发射非负执行长度值m-1以指示对于包含当前像素的后续m个像素,调色盘索引分别与其正上方的相邻者相同。应注意,在调色盘索引在从上方复制执行模式内可能不同的意义上,此模式不同于“索引”模式。
尽管在当前设计中,在CU层级用信号表示调色盘模式,但在PU层级用信号表示调色盘模式可为可能的。也可用信号表示旗标palette_esc_val_present_flag来指示当前块中逃脱样本的存在。
在调色盘模式中,块中的像素扫描可属于两个类型:垂直跨越扫描或水平跨越(蛇形)扫描。根据每块单元用信号表示的旗标palette_transpose_flag导出用于块中的扫描型样。
在调色盘索引译码期间,可应用调色盘索引调整过程。在块中从第二像素开始,调色盘索引调整过程由检查先前经译码像素的调色盘模式组成。首先,调色盘大小减小1,且如果左模式等于执行模式,那么在索引大于左调色盘索引的情况下,待译码的调色盘索引减小1;或如果左模式为复制模式,那么在索引大于以上调色盘索引的情况下,待译码的调色盘索引减小1。所述描述是从编码侧提供,且在解码器侧,也可以相反次序执行对应过程。
在SCM-3.0中,采用了以下语法优化:
·如果调色盘大小为0,那么导出所有逃脱像素,且不用信号表示任何逃脱当前旗标、调色盘模式、调色盘索引、调色盘执行和调色盘转置旗标,且推断逃脱当前旗标等于1,推断调色盘模式等于索引模式,将调色盘索引设定为等于逃脱,将调色盘运行值设定为等于块大小,且将调色盘转置旗标设定为0。
·如果调色盘大小为1且在块中未使用任何逃脱像素,那么不用信号表示任何调色盘模式、调色盘执行或调色盘转置旗标,且将调色盘模式导出为等于索引模式,将调色盘索引设定为0,将调色盘运行值设定等于块大小,且将调色盘转置旗标设定为0。
本发明描述关于基于调色盘的译码的技术,所述技术可特别适合于屏幕产生的内容译码。举例来说,假定视频数据的特定区域具有相对较少数目个颜色,那么视频译码器(例如,视频编码器或视频解码器)可形成所谓的“调色盘”以表示具有所述特定区域的视频数据。可将调色盘表达为表示特定区域(例如,给定块)的视频数据的颜色或像素值的表格。举例来说,调色盘可包含给定块中的最主要像素值。在一些情况下,所述最主要像素值可包含在块内最频繁地出现的一或多个像素值。另外,在一些情况下,视频译码器可应用阈值以确定是否应将像素值包含为所述块中的最主要像素值中的一个。根据基于调色盘的译码的各种方面,视频译码器可对指示当前块的像素值中的一或多个的索引值进行译码,而非对视频数据的当前块的实际像素值或其残差进行译码。在基于调色盘的译码的上下文中,索引值指示调色盘中用以表示当前块的个别像素值的相应条目。
举例来说,视频编码器可通过以下操作来对视频数据的块进行编码:确定用于块的调色盘(例如,明确地对调色盘进行译码,预测调色盘,或其组合),定位调色盘中用来表示所述像素值中的一或多个的条目,且通过指示调色盘中用以表示块的像素值的条目的索引值而对所述块进行编码。在一些实例中,视频编码器可在经编码位流中用信号表示所述调色盘和/或索引值。反过来,视频解码器可从经编码位流获得用于块的调色盘,以及用于块的个别像素的索引值。视频解码器可使像素的索引值与调色盘的条目相关以重构建块的各个像素值。
更明确地说,可使用“索引”模式(其中使用对调色盘的参考对像素进行译码)或从上方复制模式(其中使用对上方相邻像素的参考对像素进行译码)对使用调色盘模式译码的块的像素进行译码。第三选项为将像素译码为逃脱像素。在此情况下,直接用信号表示像素的值(或像素的经量化值)。
到本发明的时间为止,在当前SCM3.0中,使用解量化来重构建以调色盘模式量化的逃脱像素。具体地说,使用以下程序来重构建逃脱像素:
1.如下根据不同颜色分量索引(cIdx)值导出量化参数qP:
qP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
2.如下导出量化比率qPper和量化余数qPrem:
qPper=qP/6
qPrem=qP%6
3.如下导出右移位参数invQuantRightShift和偏移参数addOffset:
invQuantRightShift=6-qPper
addOffset=invQuantRightShift==0?0:1<<(invQuantRightShift-1)
4.如下基于经熵解码EspValue导出经解量化逃脱像素deQuantEspValue:
deQuantEspValue=(EspValue*invQuantScale[qPrem]+addOffset)>>invQuantRightShift
5.如下将deQuantEspValue进一步修改为处于深度范围中:
deQuantEspValue=clip3(0,2bitDepth-1,deQuantEspValue)
在SCM3.0的当前设计中可能遇到的一个问题为:当qPper大于6时,invQuantRightShift为负的。不存在通过负数定义的右移位。因此,此情形可引起对于不同解码器的解量化的不同解译,其对于实际设计并不合乎需要。
根据本发明的技术,视频译码器(例如,视频编码器和视频解码器)可经配置以避免上文所述的问题。明确地说,视频译码器可经配置以解决量化参数(qP)值的完整范围。举例来说,qP可在[0,1,…,51](包含0和51)的范围内。且可使用不同解量化过程来针对调色盘模式重构建逃脱像素。下文更详细描述这些和其它技术。
图1为说明可利用本发明的技术用于对调色盘模式译码块中的逃脱像素进行译码的实例视频编码和解码系统10的框图。如图1中所展示,系统10包含源装置12,源装置12提供待在稍后时间由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一个,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手机、所谓的“智能”板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或其类似者。在一些情况下,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于封包的网络(例如,局域网、广域网或全球网络,例如,因特网)的部分。通信媒体可包含路由器、交换器、基站或可适用于促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,可由输入接口从存储装置存取经编码数据。存储装置可包含多种分散式或本地存取的数据存储媒体中的任一个,例如,硬盘机、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它适合数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘机。目的地装置14可通过任何标准数据连接(包含因特网连接)而存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等),或两者的组合。经编码视频数据从存储装置的发射可为流式传输发射、下载发射或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于支持多种多媒体应用中的任一个的视频译码,所述多媒体应用例如空中电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射(例如,通过HTTP的动态自适应流式传输(DASH))、编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于对调色盘模式译码块中的逃脱像素进行译码的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部摄影机)接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。对调色盘模式译码块中的逃脱像素进行译码的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常称作“编解码器”)执行。此外,本发明的技术也可由视频预处理器执行。源装置12和目的地装置14仅为源装置12产生经译码视频数据用于发射到目的地装置14的这些译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一个包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播,以用于(例如)视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如,摄像机、含有先前俘获的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈入接口。作为另一替代,视频源18可产生基于计算机图形的数据(作为源视频)或实况视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。然而,如上文所提及,本发明中的所描述技术一般可适用于视频译码,且可适用于无线和/或有线应用。在每一情况下,俘获、先前俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如,无线广播或有线网络发射,或存储媒体(即,非暂时性存储媒体),例如,硬盘、闪存盘、紧密光盘、数字影音光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置12接收经编码视频数据,且(例如)经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体产生设施(例如,光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,可理解计算机可读媒体16包含一或多个各种形式的计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述信息也由视频解码器30使用,其包含描述块和其它经译码单元的特性和/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一个,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或其它类型的显示装置。
视频编码器20和视频解码器30可根据视频译码标准操作,例如,高效视频译码(HEVC)标准,也被称作ITU-T H.265。替代地,视频编码器20和视频解码器30可根据其它专有或工业标准操作,例如,ITU-T H.264标准(替代地被称作MPEG-4,第10部分,先进视频译码(AVC))或这些标准的延伸。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件和软件,以处置在共同数据流或单独数据流中的音频和视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可实施为各种适合编码器电路中的任一个,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行指令以执行本发明的技术。视频编码器20和视频解码器30中的每一个可包含于一或多个编码器或解码器中,所述一或多个编码器或解码器中的任一个可集成为相应装置中的组合式编码器/解码器(编解码器)的部分。
大体来说,根据ITU-T H.265,可将视频图片划分成可包含亮度样本和色度样本两者的一序列译码树单元(CTU)(或最大译码单元(LCU))。替代地,CTU可包含单色数据(即,仅亮度样本)。位流内的语法数据可定义CTU的大小,CTU就像素的数目来说为最大译码单元。切片包含按译码次序的数个连续CTU。视频图片可分割成一或多个切片。每一CTU可根据四分树而分裂成译码单元(CU)。大体来说,四分树数据结构每CU包含一个节点,其中根节点对应于CTU。如果CU分裂成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一个对应于所述子CU中的一个。
四分树数据结构的每一节点可提供针对对应CU的语法数据。举例来说,四分树中的节点可包含分裂旗标,从而指示对应于所述节点的CU是否分裂成子CU。可递回地定义针对CU的语法元素,且针对CU的语法元素可取决于所述CU是否分裂成子CU。如果CU未经进一步分裂,那么其被称作叶CU。在本发明中,即使不存在原始叶CU的显式分裂,叶CU的四个子CU也将被称作叶CU。举例来说,如果16×16大小的CU未进一步分裂,那么四个8×8子CU也将被称作叶CU,尽管所述16×16CU从未分裂。
除CU不具有大小区别外,CU具有与H.264标准的宏块类似的用途。举例来说,CTU可分裂成四个子节点(也被称作子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。被称作四分树的叶节点的最终的未分裂子节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可界定可分裂CTU的最大次数(其被称作最大CU深度),且也可界定所述译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”以在HEVC的上下文中指代CU、预测单元(PU)或变换单元(TU)中的任一个,或在其它标准的上下文中指代类似数据结构(例如,H.264/AVC中的宏块和其子块)。
CU包含译码节点以及与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且大体为正方形形状。CU的大小范围可从8×8像素直到具有最大大小(例如,64×64像素或更大)的CTU的大小。每一CU可含有一或多个PU和一或多个TU。与CU相关联的语法数据可描述(例如)CU到一或多个PU的分割。分割模式可在CU经跳过或直接模式编码、帧内预测模式编码或是帧间预测模式编码之间有所不同。PU可分割成非正方形形状。与CU相关联的语法数据也可描述(例如)CU根据四分树到一或多个TU的分割。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU进行变换,所述变换对于不同CU可能不同。通常基于针对经分割CTU所定义的给定CU内的PU的大小来设定TU的大小,但可能并非始终为此情况。TU的大小通常与PU相同或比PU小。在一些实例中,可使用被称为“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分为较小单元。可将RQT的叶节点称作变换单元(TU)。与TU相关联的像素差值可经变换以产生可加以量化的变换系数。
叶CU可包含一或多个预测单元(PU)。大体来说,PU表示对应于对应CU的全部或一部分的空间区域,且可包含用于检索和/或产生用于PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可包含于残余四分树(RQT)中,所述RQT可包含描述用于对应于所述PU的TU的帧内预测模式的数据。RQT也可被称作变换树。在一些实例中,可在叶CU语法而非RQT中用信号表示帧内预测模式。作为另一实例,当对PU进行模式间编码时,PU可包含界定PU的运动信息(例如,一或多个运动向量)的数据。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,和/或运动向量的参考图片列表(例如,列表0或列表1)。
具有一或多个PU的叶CU也可包含一或多个变换单元(TU)。如上文所论述,可使用RQT(也被称作TU四分树结构)来指定变换单元。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,可将每一变换单元进一步分裂为进一步的子TU。当TU未进一步分裂时,可将其称作叶TU。大体来说,对于帧内译码来说,属于叶CU的所有叶TU共享相同的帧内预测模式。即,一般应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为在CU的对应于TU的部分与原始块之间的差。TU不必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可与用于同一CU的对应叶TU共置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与相应四分树数据结构(称作残余四分树(RQT))相关联。即,叶CU可包含指示所述叶CU如何被分割成TU的四分树。TU四分树的根节点大体对应于叶CU,而CU四分树的根节点大体对应于CTU(或LCU)。RQT的未分裂的TU称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU和TU来指叶CU和叶TU。
视频序列通常包含开始于随机存取点(RAP)图片的一系列视频帧或图片。视频序列可将语法数据包含于所述视频序列所特有的序列参数集(SPS)中。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可能根据指定译码标准而大小不同。
作为实例,可针对各种大小的PU执行预测。假定特定CU的大小为2N×2N,那么可在2N×2N或N×N的PU大小上执行帧内预测,且在2N×2N、2N×N、N×2N或N×N的对称PU大小上执行帧间预测。也可针对2N×nU、2N×nD、nL×2N和nR×2N的PU大小执行帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%和75%。CU的对应于25%分割的部分由“n”继之以“U(上)”、“D(下)”、“L(左)”或“R(右)”的指示来指示。因此,举例来说,“2N×nU”指水平上以顶部的2N×0.5N PU和底部的2N×1.5N PU分割的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换地使用以指代视频块在垂直维度与水平维度方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16),且在水平方向上将具有16个像素(x=16)。同样,N×N块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。此外,块未必需要在水平方向上与垂直方向上具有相同数目个像素。举例来说,块可包括N×M像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也被称作像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包括在对残余视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或在概念上类似的变换)之后在变换域中的系数。残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成TU以包含表示用于CU的残余数据的经量化变换系数。即,视频编码器20可计算残余数据(以残余块的形式)、变换残余块以产生变换系数的块,且接着量化变换系数以形成经量化变换系数。视频编码器20可形成包含经量化变换系数的TU,以及其它语法信息(例如,TU的分裂信息)。
如上文所指出,在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化通常指量化变换系数以可能地减小用以表示所述系数的数据的量,从而提供进一步压缩的过程。量化过程可减小与一些或所有系数相关联的位深度。举例来说,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描所述变换系数,从而从包含所述量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(且因此较低频率)系数置于阵列前部,和将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而对一维向量进行熵编码。视频编码器20也可对与经编码视频数据相关联的供视频解码器30用于解码视频数据的语法元素进行熵编码。
为执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可能与(例如)符号的相邻值是否为非零有关。为执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。可构建VLC中的码字,使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相对于(例如)针对待发射的每一符号使用相等长度码字,使用VLC可达成位节省。概率确定可基于指派给符号的上下文。
大体来说,视频解码器30执行与由视频编码器20执行的过程大体上类似但互反的过程,以对经编码数据进行解码。举例来说,视频解码器30反量化且反变换所接收TU的系数以再生残余块。视频解码器30使用经用信号表示预测模式(帧内或帧间预测或调色盘模式)以以形成经预测块。接着视频解码器30(在像素乘像素基础上)使经预测块与残余块组合以再生原始块。可执行额外处理,例如执行解块过程以减少沿块边界的视觉伪影。另外,视频解码器30可以与视频编码器20的CABAC编码过程大体上类似但互反的方式使用CABAC对语法元素进行解码。
视频编码器20可进一步(例如)在图片标头、块标头、切片标头中将语法数据或其它语法数据(例如序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS))发送到视频解码器30。视频解码器30可使用这些参数来对视频数据进行解码。
根据本发明的技术,视频编码器20可执行以下过程以在调色盘模式译码期间量化逃脱像素值:
1.视频编码器20如下根据不同颜色分量索引(cIdx)值导出量化参数qP:
qP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
2.视频编码器20如下导出量化比率qPper和量化余数qPrem:
qPper=qP/6
qPrem=qP%6
3.视频编码器20如下导出右移位参数quantRightShift和偏移参数Offset:
quantRightShift=14+qPper
Offset=1<<(quantRightShift-1)
4.如下导出经量化逃脱像素值:
EspValue=(pixelValue*quantScale[qPrem]+Offset)>>quantRightShift
类似地,作为互反过程,视频解码器30可执行以下过程以在调色盘模式译码期间反量化(或解量化)逃脱像素值:
1.视频解码器30如下根据不同颜色分量索引(cIdx)值导出量化参数qP:
qP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
2.视频解码器30如下导出量化比率qPper和量化余数qPrem:
qPper=qP/6
qPrem=qP%6
3.视频解码器30如下导出右移位参数invQuantRightShift和偏移参数addOffset:
invQuantRightShift=6-qPper
addOffset=invQuantRightShift==0?0:1<<(invQuantRightShift-1)
4A.如果invQuantRightShift大于0,那么视频解码器30执行以下程序:
deQuantEspValue=(EspValue*invQuantScale[qPrem]+addOffset)>>invQuantRightShift
4B.否则(invQuantRightShift<=0),视频解码器30执行以下程序:
invQuantLeftShift=-invQuantRightShift
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift
5.视频解码器30进一步如下将deQuantEspValue修改成在深度范围中:
deQuantEspValue=clip3(0,2bitDepth-1,deQuantEspValue)
quantScale[.]和invQuantScale[.]可为可分别为{26214,23302,20560,18396,16384,14564}、{40,45,51,57,64,72}的查找表(例如,实施为阵列),或当致能自适应性量化按比例调整时可为具有6个条目的另一查找表(或阵列)。举例来说,当致能自适应性量化按比例调整时,视频解码器30可调整invQuantRightShift和/或invQuantLeftShift以使由自适应性量化按比例调整引入的按比例调整因数正规化。
视频编码器20和视频解码器30各自可经实施为可适用的多种适合编码器或解码器电路中的任一个,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件,或其任何组合。视频编码器20和视频解码器30中的每一个可包含在一或多个编码器或解码器中,编码器或解码器中的任一个可集成为组合式编码器/解码器(编解码器)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
图2为说明可根据本发明的技术实施用于对调色盘模式译码块中的逃脱像素进行编码的技术的视频编码器20的实例的框图。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或去除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一个。帧间模式(例如单向预测(P模式)或双向预测(B模式))可指若干基于时间的译码模式中的任一个。
如图2中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64(其也可被称作经解码图片缓冲器(DPB))、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46、调色盘模式编码单元49和分割单元48。为了视频块重构建,视频编码器20也包含反量化单元58、反变换单元60和求和器62。也可包含解块滤波器(图2中未展示)以对块边界进行滤波以从经重构建视频去除方块效应伪影。如果需要,那么解块滤波器将通常对求和器62的输出进行滤波。除了解块滤波器外,也可使用额外滤波器(回路中或回路后)。为简洁起见未展示这些滤波器,但如果需要,这些滤波器可对求和器50的输出进行滤波(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将所述帧或切片划分成多个视频块。运动估计单元42和运动补偿单元44相对于一或多个参考帧中的一或多个块对所接收视频块执行帧间预测性编码以提供时间预测。帧内预测单元46可替代地相对于与待译码块在相同帧或片段中的一或多个相邻块对所接收视频块执行帧内预测性编码以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据的块分割为子块。举例来说,分割单元48可最初将帧或切片分割成CTU,且基于速率-失真分析(例如,速率-失真优化)来将所述CTU中的每一个分割成子CU。模式选择单元40可进一步产生指示CTU到子CU的分割的四分树数据结构。四分树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可选择预测模式中的一个(帧内或帧间)(例如,基于错误结果),且将所得预测块提供到求和器50以产生残余数据且提供到求和器62以重构建经编码块以作为参考帧使用。此外,模式选择单元40可选择调色盘模式作为帧内和帧间预测模式的替代。模式选择单元40也将语法元素(例如,运动向量、帧内模式指示符、分割信息和其它此类语法信息)提供到熵编码单元56。
运动估计单元42与运动补偿单元44可高度集成,但为概念目的而分开来说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示在与参考图片(或其它经译码单元)内的预测性块有关的当前视频帧或图片内的视频块的PU相对于在所述当前图片(或其它经译码单元)内正译码的当前块的位移。预测性块为被发现在像素差方面紧密地匹配待译码块的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量予以确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,运动估计单元42可执行关于全像素位置和分率像素位置的运动搜索,且以分率像素精度输出运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一个识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元42将所计算运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量提取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可即刻在参考图片列表中的一个中定位运动向量所指向的预测性块。求和器50通过从正译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般来说,运动估计单元42对于亮度分量执行运动估计,且运动补偿单元44将基于亮度分量所计算的运动向量用于色度分量与亮度分量两者。模式选择单元40也可产生与视频块和视频切片相关联的语法元素以供视频解码器30在对视频切片的视频块进行解码时使用。
如上文所描述,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代,帧内预测单元46可对当前块进行帧内预测。明确地说,帧内预测单元46可确定待用以对当前块进行编码的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式对当前块进行编码,且帧内预测单元46(或在一些实例中为模式选择单元40)可从测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可使用对于各种所测试帧内预测模式的速率-失真分析来计算速率-失真值,且在所测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析大体上确定经编码块与原始、未编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位率(即,位的数目)。帧内预测单元46可根据各种经编码块的失真和速率来计算比率以确定哪一帧内预测模式展现用于所述块的最佳速率-失真值。
在选择用于块的帧内预测模式后,帧内预测单元46可将指示用于所述块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可对指示所选帧内预测模式的信息进行编码。视频编码器20可在所发射位流中包含以下各者:配置数据,其可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也被称作码字映射表);各种块的编码上下文的定义;和待用于所述上下文中的每一个的最有可能的帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括变换系数值的视频块。可使用小波变换、整数变换、子频带变换、离散正弦变换(DST)或其它类型的变换,而非DCT。在任何情况下,变换处理单元52将变换应用于残余块,从而产生变换系数块。所述变换可将残余信息从像素域转换到变换域,例如,频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减少位速率。量化过程可减小与一些或所有系数相关联的位深度。可通过调整量化参数来修改量化程度。
在量化之后,熵编码单元56对经量化变换系数进行熵译码。举例来说,熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在由熵编码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30)或加以存档以供稍后发射或检索。
反量化单元58和反变换单元60分别应用反量化和反变换以重构建像素域中的残余块。明确地说,求和器62将经重构建残余块添加到由运动补偿单元44或帧内预测单元46产生的运动补偿预测块,以产生用于存储于参考图片存储器64中的经重构建视频块。所述经重构建视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
根据本发明的技术,视频编码器20可经配置以执行基于调色盘的译码。更明确地说,调色盘编码单元49可执行视频数据的块(例如,CU或PU)的调色盘模式编码。相对于HEVC构架,作为实例,基于调色盘的译码技术可经配置以用作CU模式。在其它实例中,基于调色盘的译码技术可经配置以用作HEVC的构架中的PU模式。因此,本文中(贯穿本发明)在CU模式的上下文中描述的全部所揭示过程可另外或替代地适用于PU模式。然而,这些基于HEVC的实例不应视为约束或限制本文描述的基于调色盘的译码技术,因为这些技术可适合于独立地起作用或作为其它现有或有待开发的系统/标准的部分。在这些情况下,用于调色盘译码的单元可为正方形块、矩形块或甚至非矩形形状区域。
举例来说,当(例如)针对CU或PU选择基于调色盘的编码模式时,调色盘编码单元49可执行基于调色盘的编码。举例来说,调色盘编码单元49可经配置以产生具有指示像素值的条目的调色盘,选择调色盘中的像素值以表示视频数据的块中的至少一些位置的像素值,且用信号表示使视频数据的块的位置中的至少一些位置与调色盘中分别对应于所选择像素值的条目相关联的信息。尽管将各种功能描述为由调色盘编码单元49执行,但这些功能中的一些或全部可由其它处理单元或不同处理单元的组合执行。
根据本发明的技术中的一或多个,视频编码器20(且具体地说,调色盘编码单元49),可执行经预测视频块的基于调色盘的视频译码。如上文所描述,可明确地编码、从先前调色盘条目预测、从先前像素值预测(或其组合)由视频编码器20产生的调色盘。
明确地说,模式选择单元40可确定视频数据的块(例如,CU或PU)的编码模式,例如,帧间预测、帧内预测或调色盘模式。假定选择了调色盘模式,调色盘编码单元49可基于所述块的像素值的统计形成用于所述块的调色盘。对于所述块的每一像素,调色盘编码单元49可确定像素在调色盘中是否具有对应的值,且如果具有,那么将像素的对应值的索引用信号表示于调色盘中。调色盘编码单元49也可用信号表示运行值,表示与先前像素具有相同值的像素的数目。
替代地,如果一连串像素具有等于上方相邻像素的值,那么调色盘编码单元49可针对“从上方复制”模式用信号表示运行值,其中运行表示具有等于上方相邻像素的值的像素的数目。
如果索引模式或从上方复制模式两者皆不充分地表示调色盘模式译码块的当前像素的值,那么调色盘编码单元49可使用本发明的技术来将所述像素译码为逃脱像素。即,可执行这些技术以量化逃脱像素值,其中逃脱像素值表示正译码的像素的实际值(例如,亮度值和/或色度值)。根据本发明的技术,视频编码器20可量化待译码为逃脱像素的像素的值,例如,如上文相对于图1所论述。即,调色盘编码单元49可执行以下量化过程:
1.调色盘编码单元49如下根据不同颜色分量索引cIdx导出qP:
qP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
2.调色盘编码单元49如下导出量化比率qPper和量化余数qPrem:
qPper=qP/6
qPrem=qP%6
3.调色盘编码单元49如下导出右移位参数invQuantRightShift和偏移参数addOffset:
invQuantRightShift=6-qPper
addOffset=invQuantRightShift==0?0:1<<(invQuantRightShift-1)
4.调色盘编码单元49如下基于熵解码EspValue导出经解量化逃脱像素deQuantEspValue:
deQuantEspValue=(EspValue*invQuantScale[qPrem]+addOffset)>>invQuantRightShift
5.调色盘编码单元49如下进一步将deQuantEspValue修改成在深度范围中:
deQuantEspValue=clip3(0,2bitDepth-1,deQuantEspValue)
在此实例中,“EspValue”表示用于具有由“pixelValue”表示的原始值的像素的经量化逃脱值。
以此方式,图2的视频编码器20表示视频编码器的实例,所述视频编码器经配置以确定视频数据的调色盘模式译码块的逃脱模式译码像素的左移位参数的值小于零,基于所述左移位参数的原始值小于零而将右移位参数的值设定为具有等于所述左移位参数的绝对值的绝对值的正值,且使用所述左移位参数的值而量化所述逃脱模式译码像素。
图3为说明可根据本发明的技术实施用于对调色盘模式译码块中的逃脱像素进行解码的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、调色盘解码单元75、反量化单元76、反变换单元78、参考图片存储器82和求和器80。在一些实例中,视频解码器30可执行通常与相对于视频编码器20(图2)所描述编码遍次互反的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联的语法元素的经编码视频位流。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转递到运动补偿单元72。视频解码器30可在视频切片层级和/或视频块层级接收语法元素。
当视频切片经译码为帧内译码(I)切片时,帧内预测单元74可基于用信号表示的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B或P)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素产生用于当前视频切片的视频块的预测性块。可从在参考图片列表中的一个内的参考图片中的一个产生所述预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认构建技术构建参考图片列表——列表0和列表1。运动补偿单元72通过剖析运动向量和其它语法元素而确定用于当前视频切片的视频块的预测信息,且使用预测信息产生用于正解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些来确定用以对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于所述切片的参考图片列表中的一或多个的构建信息、用于所述切片的每一经帧间编码视频块的运动向量、用于所述切片的每一经帧间译码视频块的帧间预测状态和用以对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元72也可执行基于内插滤波器的内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据所接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
反量化单元76反量化(即,解量化)在位流中提供且由熵解码单元70解码的经量化变换系数。反量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算的量化参数QPY来确定应应用的量化程度和(同样地)反量化程度。
反变换单元78将反变换(例如,反DCT、反整数变换或在概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素产生用于当前视频块的预测性块后,视频解码器30通过对来自反变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码视频块。求和器80表示执行此求和运算的组件。如果需要,也可应用解块滤波器来对经解码块进行滤波以便去除方块效应伪影。也可使用其它回路滤波器(在译码回路中抑或在译码回路之后)以使像素转变平滑,或以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储于参考图片存储器82中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82也存储经解码视频以供稍后在显示装置(例如,图1的显示装置32)上呈现。
根据本发明的各种实例,视频解码器30可经配置以执行基于调色盘的解码。明确地说,视频解码器30包含可执行基于调色盘的解码的调色盘解码单元75。举例来说,调色盘解码单元75可经配置以产生具有指示像素值的条目的调色盘。另外,在此实例中,调色盘解码单元75可接收使视频数据块的至少一些位置与调色盘中的条目相关联的信息,例如,图3中所展示的语法元素。在此实例中,调色盘解码单元75可基于所述信息来选择调色盘中的像素值。另外,在此实例中,调色盘解码单元75可基于所选择的像素值来重构建所述块的像素值。尽管各种功能经描述为由调色盘解码单元75执行,但这些功能中的一些或全部可由其它处理单元或不同处理单元的组合执行。
调色盘解码单元75可接收调色盘译码模式信息,且在调色盘译码模式信息指示调色盘译码模式适用于块时执行上述操作。当调色盘译码模式信息指示调色盘译码模式并不适用于块时,或当其它模式信息指示不同模式的使用时,调色盘解码单元75使用非基于调色盘的译码模式(例如,HEVC帧间预测性或帧内预测性译码模式)(当调色盘译码模式信息指示调色盘译码模式不适用于块时)而对视频数据的块进行解码。视频数据的块可为(例如)根据HEVC译码过程产生的CU或PU。视频解码器30可通过帧间预测性时间预测或帧内预测性空间译码模式而对一些块进行解码,且通过基于调色盘的译码模式对其它块进行解码。基于调色盘的译码模式可包括多个不同基于调色盘的译码模式中的一个,或可存在单个基于调色盘的译码模式。
根据本发明的技术中的一或多个,视频解码器30(且具体地说,调色盘解码单元75),可对调色盘译码视频块执行基于调色盘的视频解码。如上文所描述,可明确地编码且用信号表示、由视频解码器30相对于所接收经调色盘译码块重构建、从先前调色盘条目预测、从先前像素值预测(或其组合)由视频解码器30解码的调色盘。
明确地说,熵解码单元70可对指示使用调色盘模式对视频数据的块(例如,PU或CU)进行译码的信息进行解码。熵解码单元70可进一步对表示如何使用调色盘模式对块的每一像素进行译码的信息进行解码。举例来说,熵解码单元70可将索引值和运行值解码为{索引,运行}对。索引值表示用于块的调色盘的条目,其中条目指定像素值,且运行值指示除了当前像素的外具有相同值的像素的数目。
如果索引值等于调色盘的大小,那么熵解码单元70可确定当前像素为逃脱像素。因此,熵解码单元70可对表示逃脱像素的值进行熵解码。明确地说,熵解码单元70可对用于逃脱像素的经量化逃脱像素值进行解码。熵解码单元70可接着将经量化逃脱像素值传递到调色盘解码单元75。
根据本发明的技术,调色盘解码单元75可解量化经量化逃脱像素值。为了解量化经量化逃脱像素值,调色盘解码单元75可执行以下过程:
1.调色盘解码单元75如下根据不同颜色分量索引cIdx导出量化参数qP:
qP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
2.调色盘解码单元75如下导出量化比率qPper和量化余数qPrem:
qPper=qP/6
qPrem=qP%6
3.调色盘解码单元75如下导出右移位参数invQuantRightShift和偏移参数addOffset:
invQuantRightShift=6-qPper
addOffset=invQuantRightShift==0?0:1<<(invQuantRightShift-1)
4A.如果invQuantRightShift大于0,那么调色盘解码单元75执行以下程序:
deQuantEspValue=(EspValue*invQuantScale[qPrem]+addOffset)>>invQuantRightShift
4B.否则(invQuantRightShift<=0),调色盘解码单元75执行以下程序:
invQuantLeftShift=-invQuantRightShift
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift
5.调色盘解码单元75如下进一步将deQuantEspValue修改成在深度范围中:
deQuantEspValue=clip3(0,2bitDepth-1,deQuantEspValue)
invQuantScale[.]查找表可实施为具有条目{40,45,51,57,64,72}的阵列,或具有(例如)6个条目的另一查找表,且当致能自适应性量化按比例调整时可使用所述查找表。举例来说,当致能自适应性量化按比例调整时,视频解码器30可调整invQuantRightShift和/或invQuantLeftShift以使由自适应性量化按比例调整引入的按比例调整因数正规化。
以此方式,图3的视频解码器30表示视频编码器的实例,所述视频解码器经配置以确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零,基于所述右移位参数的原始值小于零而将左移位参数的值设定为具有等于所述原始值的绝对值的绝对值的正值,且使用所述左移位参数的值而反量化所述逃脱模式译码像素。
图4为说明用于根据本发明的技术对视频数据的块进行编码的实例方法的流程图。可由视频编码器20和其组件(例如,图2中所说明)执行图4的方法。
在此实例中,模式选择单元40首先接收视频数据的块(100)。所述块可为(例如)预测单元(PU)或译码单元(CU)。模式选择单元40接着确定块的译码模式(102)。举例来说,模式选择单元40可测试各种译码模式且使用速率-失真优化(RDO)过程来比较所述模式。另外,模式选择单元40也可使用RDO过程来比较各种块大小和块分割方案。
模式选择单元40可选择帧内或帧间预测模式,在此情况下,运动估计单元42和运动补偿单元44或帧内预测单元46可分别使用帧内预测或帧间预测来预测块的像素,从而形成经预测块(104)。视频编码器20接着可形成和处理块的残余值(106)。举例来说,残余产生单元50可在逐像素基础上从经预测块减去原始块,从而形成残余块。变换处理单元52可接着使用例如DCT的变换来变换残余块,从而形成变换块。量化单元54可接着量化变换块的变换系数,且将经量化变换系数提供到熵编码单元56。模式选择单元40也将表示预测模式(例如帧内/帧间,如果使用帧内预测,那么选择帧内模式;如果使用帧间预测,那么选择运动参数)的信息提供到熵编码单元56。因此,熵编码单元56对预测信息和残余值(即,经量化变换系数)进行熵编码(108)。
替代地,模式选择单元40可选择调色盘模式以对块进行译码,在此情况下,调色盘编码单元49分析块的像素统计(110)。举例来说,调色盘编码单元49可确定频繁使用的像素值。调色盘编码单元49接着基于所述统计形成用于块的调色盘(112)。尽管图4中未展示,但熵编码单元56可对用于调色盘的数据进行熵编码。举例来说,可相对于先前使用的调色盘(例如,如上文相对于表1和2所论述)预测性地对调色盘进行译码。
调色盘编码单元49可接着扫描块的像素(114)以确定如何对像素进行译码。举例来说,调色盘编码单元49可确定当前像素值是否包含于调色盘中。如果所述像素值包含于调色盘中,那么调色盘编码单元49可将来自调色盘的对应于像素值的索引提供到熵编码单元56,熵编码单元56可对所述索引值进行熵译码(116)。此外,调色盘编码单元49可确定在先前像素之后的列中具有相同值的像素的数目,且将“执行”值提供到熵编码单元56,熵编码单元56可对运行值进行熵译码(118)。
替代地,如果当前像素在调色盘中并不具有值,那么调色盘编码单元49可确定像素的值是否与上方相邻像素值相同。在一些实例中,可在确定像素值是否对应于调色盘中的值之前作出此确定。在任何情况下,如果当前像素具有等于上方相邻像素值的值,那么调色盘编码单元49可将描述具有等于其上方相邻像素的值的像素的数目的运行值提供到熵编码单元56,熵编码单元56可对运行值进行熵译码(120)。
如果当前像素并不对应于调色盘中的值且并不具有等于上方相邻像素的值,那么调色盘编码单元49可将像素编码为逃脱像素。明确地说,调色盘编码单元49可将等于调色盘的大小的索引值提供到熵编码单元56,熵编码单元56可将索引值熵译码为调色盘的大小(122)。等于调色盘的大小的索引值可用信号表示当前像素正被编码为逃脱像素。调色盘编码单元49可进一步将逃脱像素的值提供到熵编码单元56。
根据本发明的技术,调色盘编码单元49可量化像素值(124)。像素值的量化可通常包含按位移位运算。明确地说,如上文所解释,如果调色盘编码单元49确定在量化期间左移位参数低于或等于零,那么调色盘编码单元49可使用具有等于左移位参数的绝对值的绝对值且具有正值的右移位参数而替代地执行按位右移位。调色盘编码单元49可接着将经量化逃脱像素值提供到熵编码单元56,熵编码单元56可对经量化像素值进行熵编码(126)。
视频编码器20可针对调色盘模式译码块的每一像素执行此过程(例如,步骤序列116和118、步骤120或步骤序列122到126中的一个)。
以此方式,图4的方法表示对视频数据进行编码的方法的实例,所述方法包含确定视频数据的调色盘模式译码块的逃脱模式译码像素的左移位参数的值小于零,基于所述左移位参数的原始值小于零而将右移位参数的值设定为具有等于所述左移位参数的绝对值的绝对值的正值,且使用所述左移位参数的值而量化所述逃脱模式译码像素。
图5为说明用于根据本发明的技术对视频数据的块进行解码的实例方法的流程图。可由视频解码器30和其组件(例如,图3中所说明)执行图5的方法。
首先,熵解码单元70可对指示视频数据的块的译码模式的数据进行解码(150)。熵解码单元70可使用此数据来确定块的译码模式(152),例如,帧内预测、帧间预测或调色盘模式中的一个。
在译码模式为帧内预测或帧间预测的情况下,熵解码单元70可对预测信息(例如,帧内模式或运动参数)进行解码且将预测信息提供到运动补偿单元72或帧内预测单元74中的一适当者,以执行帧内预测或帧间预测(154)。举例来说,帧内预测单元74可使用帧内预测模式来依据块的相邻像素构建预测块。作为另一实例,运动补偿单元72可使用运动参数来检索(且潜在地处理,例如,滤波)来自参考图片存储器82的先前经解码图片的参考块。
此外,视频解码器30可解码且处理块的残余值(156)。举例来说,反量化单元76可反量化经量化变换系数,且反变换单元78可反变换变换系数,以重构建残余块。求和器80可接着组合残余块的残余值与经预测块的经预测值(158),以重构建原始块。
替代地,熵解码单元70可确定块的译码模式为调色盘模式。在此情况下,熵解码单元70可对用于块的调色盘的数据进行熵解码,而调色盘解码单元75可使用经熵解码数据而对块的调色盘进行解码(160)。如上文相对于表1和2所论述,可相对于先前调色盘预测性地对调色盘进行译码。因此,熵解码单元70可将调色盘的经熵解码数据提供到调色盘解码单元75,调色盘解码单元75可使用经解码数据而重构建块的调色盘。
熵解码单元70也可对用于块的像素的数据进行解码(164)。举例来说,经解码数据可对应于小于调色盘的大小的索引值。在此情况下,熵解码单元70也可对运行值进行解码(166),且将索引值和运行值提供到调色盘解码单元75。调色盘解码单元75可将像素的值和执行中的像素中的每一个设定为等于对应于索引值的调色盘的像素值(168)。
作为另一实例,经解码数据可为无索引值的运行值。此类无索引值的运行值可指示使用从上方复制模式译码的像素的数目。在此情况下,熵解码单元70可将运行值提供到调色盘解码单元75,调色盘解码单元75可将执行中的像素中的每一个设定为等于相应上方相邻像素值的值(170)。
作为另一实例,经解码数据可为等于调色盘的大小的索引值。在此情况下,熵解码单元70可确定当前像素经编码为逃脱像素。因此,熵解码单元70可对用于逃脱像素的经量化值进行熵解码(172),且将所述经量化值提供到调色盘解码单元75。调色盘解码单元75又可解量化所述经量化值(174)。明确地说,调色盘解码单元75可使用本发明的技术解量化所述经量化值,例如,如上文且相对于下文的图6更详细地解释。
视频解码器30可针对调色盘模式译码块的每一像素执行此过程(例如,步骤序列166和168、步骤170或步骤序列172和174中的一个),由此对调色盘模式译码块进行解码。
以此方式,图5的方法表示包含以下步骤的方法的实例:确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零,基于所述右移位参数的原始值小于零而将左移位参数的值设定为具有等于所述原始值的绝对值的绝对值的正值,且使用所述左移位参数的值而反量化所述逃脱模式译码像素。
图6为说明根据本发明的技术的调色盘解码单元75可藉以解量化视频数据的调色盘模式编码块的经量化逃脱像素值的实例技术的流程图。大体来说,图6的方法可对应于图5的元件174。即,图6表示解量化视频数据的调色盘模式编码块的经量化逃脱像素值的方法的一个实例。不必按所展示的次序执行图6中所展示的步骤,且可并行地执行某些步骤。
在此实例中,首先,调色盘解码单元75导出用于视频数据的调色盘模式编码块的量化参数(QP)(200)。举例来说,调色盘解码单元75可使用以下方程式确定QP:
QP=(cIdx==0)?Qp'Y:((cIdx==1)?Qp'Cb:Qp'Cr)
在此实例方程式中,cIdx表示视频数据的块的上下文索引。可基于块为亮度块、蓝色调色度块还是红色调色度块而设定cIdx的值。
调色盘解码单元75可接着确定QP比率值和QP余数值(202)。举例来说,调色盘解码单元75可根据以下方程式确定QP比率(qPper)值和QP余数(qPrem)值:
qPper=qP/6
qPrem=qP%6
调色盘解码单元75可接着导出右移位参数值(204)。举例来说,调色盘解码单元75可根据以下方程式导出右移位参数(invQuantRightShift)值:
invQuantRightShift=6-qPper
另外,调色盘解码单元75可导出偏移参数值(206)。调色盘解码单元75可根据以下方程式导出偏移参数(addOffset)值:
addOffset=invQuantRightShift==0?0:1<<(invQuantRightShift-1)
调色盘解码单元75可接着确定右移位参数值是否低于或等于零(208)。如果否(即,如果右移位参数值大于零)(208的“否”分支),那么调色盘解码单元75可使用右移位参数值和偏移参数值而从逃脱像素的经量化值计算逃脱像素的解量化值(210)。举例来说,调色盘解码单元75可根据以下方程式计算解量化值(deQuantEspValue):
deQuantEspValue=(EspValue*invQuantScale[qPrem]+addOffset)>>invQuantRightShift,
其中EspValue表示经量化值,且invQuantScale[.]表示查找表,例如{40,45,51,57,64,72}。
另一方面,如果右移位参数低于或等于零(208的“是”分支),那么调色盘解码单元75可将左移位参数值计算为等于右移位参数值的绝对值的正值(212)。调色盘解码单元75可接着使用左移位参数值从经量化值计算经解量化值(214)。举例来说,调色盘解码单元75可根据以下方程式计算解量化值(deQuantEspValue):
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift
调色盘解码单元75接着可舍入解量化值(216)。举例来说,调色盘解码单元75可使用以下实例截割运算舍入解量化值:
deQuantEspValue=clip3(0,2bitDepth-1,deQuantEspValue),
其中clip3为如在ITU-T H.265中定义的函数。明确地说,H.265如下定义clip3(x,y,z):
在其它实例中,其它舍入运算可用于确保解量化逃脱像素的值在对应的深度范围内。
以此方式,图6的方法表示包含以下步骤的方法的实例:确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零,基于所述右移位参数的原始值小于零而将左移位参数的值设定为具有等于所述原始值的绝对值的绝对值的正值,且使用所述左移位参数的值而反量化所述逃脱模式译码像素。
应认识到,取决于实例,本文中所描述技术中的任一个的某些动作或事件可以不同顺序执行,可添加、合并或完全省略所述动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践是必要的)。此外,在某些实例中,可(例如)通过多线程处理、中断处理或多个处理器同时而非依序执移动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或通过计算机可读媒体进行发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体(例如数据存储媒体),或包含促进将计算机程序从一处传送到另一处(例如,根据通信协议)的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用于存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。又,可将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)从网站、服务器或其它远程源发射指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是针对非暂时性有形存储媒体。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。以上各者的组合也应包含于计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用术语“处理器”可指上述结构或适合于实施本文中所描述技术的任何其它结构中的任一个。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码和解码的专用硬件和/或软件模块内,或并入组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑元件中。
可以广泛多种装置或设备实施本发明的技术,所述装置或设备包含无线手机、集成电路(IC)或IC的集合(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。确切地说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适软件和/或固件来提供所述单元。
已描述各种实例。这些和其它实例处于以下权利要求书的范围内。
Claims (29)
1.一种对视频数据进行解码的方法,所述方法包括:
确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零;
基于所述右移位参数的所述值小于零,将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值;以及
使用所述左移位参数的所述值而对所述逃脱模式译码像素进行反量化。
2.根据权利要求1所述的方法,其进一步包括基于所述块的量化参数qP的值而确定所述右移位参数的所述值。
3.根据权利要求2所述的方法,其进一步包括基于包含所述逃脱模式译码像素的颜色分量的颜色分量索引cIdx而确定qP的所述值。
4.根据权利要求2所述的方法,其中确定所述右移位参数的所述值包括:
根据方程式qPper=qP/6计算量化比率(qPper),其中qP表示所述qP的所述值;以及
根据方程式invQuantRightShift=6-qPper计算所述右移位参数(invQuantRightShift)的所述值。
5.根据权利要求1所述的方法,其中对所述逃脱模式译码像素进行反量化包括根据以下方程式计算所述逃脱模式译码像素的值(deQuantEspValue):
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift,
其中EspValue表示经译码用于所述逃脱模式译码像素的经译码经量化逃脱值,invQuantScale表示反量化比例值的阵列,qPrem表示量化参数余数值,invQuantLeftShift表示所述左移位参数的所述值,且<<表示按位左移位算子。
6.根据权利要求5所述的方法,其中invQuantScale包括{40,45,51,57,64,72}。
7.根据权利要求1所述的方法,其进一步包括:
对用于所述调色盘模式译码块的调色盘进行解码;
使用所述调色盘对所述块的至少一个其它像素进行解码;以及
使用所述逃脱模式译码像素和所述经解码至少一个其它像素而重构建所述块。
8.一种用于对视频数据进行解码的装置,所述装置包括:
存储器,其经配置以存储视频数据;以及
视频解码器,其经配置以:
确定所述视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零;
基于所述右移位参数的所述值小于零,将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值;以及
使用所述左移位参数的所述值而对所述逃脱模式译码像素进行反量化。
9.根据权利要求8所述的装置,其中所述视频解码器经进一步配置以基于所述块的量化参数qP的值而确定所述右移位参数的所述值。
10.根据权利要求9所述的装置,其中所述视频解码器经进一步配置以基于包含所述逃脱模式译码像素的颜色分量的颜色分量索引cIdx而确定qP的所述值。
11.根据权利要求9所述的装置,其中为了确定所述右移位参数的所述值,所述视频解码器经配置以:
根据方程式qPper=qP/6计算量化比率(qPper),其中qP表示所述qP的所述值;以及
根据方程式invQuantRightShift=6-qPper计算所述右移位参数(invQuantRightShift)的所述值。
12.根据权利要求8所述的装置,其中为了对所述逃脱模式译码像素进行反量化,所述视频解码器经配置以根据以下方程式计算所述逃脱模式译码像素的值(deQuantEspValue):
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift,
其中EspValue表示经译码用于所述逃脱模式译码像素的经译码经量化逃脱值,invQuantScale表示反量化比例值的阵列,qPrem表示量化参数余数值,invQuantLeftShift表示所述左移位参数的所述值,且<<表示按位左移位算子。
13.根据权利要求12所述的装置,其中invQuantScale包括{40,45,51,57,64,72}。
14.根据权利要求8所述的装置,其中所述视频解码器经进一步配置以:
对用于所述调色盘模式译码块的调色盘进行解码;
使用所述调色盘对所述块的至少一个其它像素进行解码;以及
使用所述逃脱模式译码像素和所述经解码至少一个其它像素而重构建所述块。
15.根据权利要求8所述的装置,其中所述装置包括以下各者中的至少一个:
集成电路;
微处理器;或
无线通信装置。
16.一种用于对视频数据进行解码的装置,所述装置包括:
用于确定视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零的装置;
用于基于所述右移位参数的所述值小于零而将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值的装置;以及
用于使用所述左移位参数的所述值而对所述逃脱模式译码像素进行反量化的装置。
17.根据权利要求16所述的装置,其进一步包括用于基于所述块的量化参数qP的值而确定所述右移位参数的所述值的装置。
18.根据权利要求17所述的装置,其进一步包括用于基于包含所述逃脱模式译码像素的颜色分量的颜色分量索引(cIdx)而确定所述qP的所述值的装置。
19.根据权利要求17所述的装置,其中所述用于确定所述右移位参数的所述值的装置包括:
用于根据方程式qPper=qP/6计算量化比率(qPper)的装置,其中qP表示所述qP的所述值;以及
用于根据方程式invQuantRightShift=6-qPper计算所述右移位参数(invQuantRightShift)的所述值的装置。
20.根据权利要求16所述的装置,其中所述用于对所述逃脱模式译码像素进行反量化的装置包括用于根据以下方程式计算用于所述逃脱模式译码像素的值(deQuantEspValue)的装置:
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift,
其中EspValue表示经译码用于所述逃脱模式译码像素的经译码经量化逃脱值,invQuantScale表示反量化比例值的阵列,qPrem表示量化参数余数值,invQuantLeftShift表示所述左移位参数的所述值,且<<表示按位左移位算子。
21.根据权利要求20所述的装置,其中invQuantScale包括{40,45,51,57,64,72}。
22.根据权利要求16所述的装置,其进一步包括:
用于对用于所述调色盘模式译码块的调色盘进行解码的装置;
用于使用所述调色盘对所述块的至少一个其它像素进行解码的装置;以及
用于使用所述逃脱模式译码像素和所述经解码至少一个其它像素而重构建所述块的装置。
23.一种上面存储有指令的计算机可读存储媒体,所述指令在执行时使得用于解码视频数据的装置的处理器:
确定所述视频数据的调色盘模式译码块的逃脱模式译码像素的右移位参数的值小于零;
基于所述右移位参数的所述值小于零,将左移位参数的值设定为具有等于所述右移位参数的绝对值的绝对值的正值;以及
使用所述左移位参数的所述值而对所述逃脱模式译码像素进行反量化。
24.根据权利要求23所述的计算机可读存储媒体,其进一步包括使得所述处理器基于用于所述块的量化参数qP的值而确定所述右移位参数的所述值的指令。
25.根据权利要求24所述的计算机可读存储媒体,其进一步包括使得所述处理器基于包含所述逃脱模式译码像素的颜色分量的颜色分量索引cIdx而确定所述qP的所述值的指令。
26.根据权利要求24所述的计算机可读存储媒体,其中所述使得所述处理器确定所述右移位参数的所述值的指令包括使得所述处理器进行以下操作的指令:
根据方程式qPper=qP/6计算量化比率(qPper),其中qP表示所述qP的所述值;以及
根据方程式invQuantRightShift=6-qPper计算所述右移位参数(invQuantRightShift)的所述值。
27.根据权利要求23所述的计算机可读存储媒体,其中所述使得所述处理器对所述逃脱模式译码像素进行反量化的指令包括使得所述处理器根据以下方程式计算用于所述逃脱模式译码像素的值(deQuantEspValue)的指令:
deQuantEspValue=EspValue*invQuantScale[qPrem]<<invQuantLeftShift,
其中EspValue表示经译码用于所述逃脱模式译码像素的经译码经量化逃脱值,invQuantScale表示反量化比例值的阵列,qPrem表示量化参数余数值,invQuantLeftShift表示所述左移位参数的所述值,且<<表示按位左移位算子。
28.根据权利要求27所述的计算机可读存储媒体,其中invQuantScale包括{40,45,51,57,64,72}。
29.根据权利要求23所述的计算机可读存储媒体,其进一步包括使得所述处理器进行以下操作的指令:
对用于所述调色盘模式译码块的调色盘进行解码;
使用所述调色盘对所述块的至少一个其它像素进行解码;以及
使用所述逃脱模式译码像素和所述经解码至少一个其它像素而重构建所述块。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562110519P | 2015-01-31 | 2015-01-31 | |
US62/110,519 | 2015-01-31 | ||
US15/009,609 US10057587B2 (en) | 2015-01-31 | 2016-01-28 | Coding escape pixels for palette mode coding |
US15/009,609 | 2016-01-28 | ||
PCT/US2016/015672 WO2016123492A1 (en) | 2015-01-31 | 2016-01-29 | Coding escape pixels for palette mode coding |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107211135A true CN107211135A (zh) | 2017-09-26 |
Family
ID=55359749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680005867.3A Pending CN107211135A (zh) | 2015-01-31 | 2016-01-29 | 用于调色盘模式译码的译码逃脱像素 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10057587B2 (zh) |
EP (1) | EP3251365A1 (zh) |
JP (2) | JP2018507625A (zh) |
KR (1) | KR102031468B1 (zh) |
CN (1) | CN107211135A (zh) |
AU (1) | AU2016211251B2 (zh) |
BR (1) | BR112017016405A2 (zh) |
EA (1) | EA035121B1 (zh) |
TN (1) | TN2017000313A1 (zh) |
TW (1) | TWI665911B (zh) |
WO (1) | WO2016123492A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114128298A (zh) * | 2019-07-24 | 2022-03-01 | 高通股份有限公司 | 调色板模式下的增量量化参数(qp)信令 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017138761A1 (ko) * | 2016-02-11 | 2017-08-17 | 삼성전자 주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
CA3025334C (en) * | 2016-05-25 | 2021-07-13 | Arris Enterprises Llc | Binary ternary quad tree partitioning for jvet coding of video data |
JP6986868B2 (ja) * | 2017-06-19 | 2021-12-22 | キヤノン株式会社 | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、プログラム |
EP3797517B1 (en) * | 2018-08-30 | 2023-08-16 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods using a palette coding |
US11025905B2 (en) * | 2018-09-14 | 2021-06-01 | Tencent America LLC | Method and device for decoding with palette mode |
JP7197720B2 (ja) | 2019-02-24 | 2022-12-27 | 北京字節跳動網絡技術有限公司 | パレットモードの使用の指示の独立した符号化 |
KR20220032520A (ko) | 2019-07-20 | 2022-03-15 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 팔레트 모드 사용 지시의 조건 종속적인 코딩 |
CN114145013B (zh) | 2019-07-23 | 2023-11-14 | 北京字节跳动网络技术有限公司 | 调色板模式编解码的模式确定 |
WO2021018166A1 (en) | 2019-07-29 | 2021-02-04 | Beijing Bytedance Network Technology Co., Ltd. | Scanning order improvements for palette mode coding |
KR20230049764A (ko) * | 2019-08-15 | 2023-04-13 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 팔레트 모드를 이용한 비디오 코딩의 방법 및 장치 |
US11323711B2 (en) * | 2019-09-20 | 2022-05-03 | Alibaba Group Holding Limited | Method and system for signaling chroma quantization parameter offset |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1086618A (zh) * | 1992-09-29 | 1994-05-11 | 松下电器产业株式会社 | 运算装置 |
CN101874237A (zh) * | 2007-10-30 | 2010-10-27 | Arm有限公司 | 用于执行算术运算的大小检测的设备和方法 |
CN106508042B (zh) * | 2010-12-24 | 2014-01-08 | 中国电子技术标准化研究院 | 基于fmo编码的标签到读写器的数据传输方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6909744B2 (en) * | 1999-12-09 | 2005-06-21 | Redrock Semiconductor, Inc. | Processor architecture for compression and decompression of video and images |
US7818356B2 (en) * | 2001-10-29 | 2010-10-19 | Intel Corporation | Bitstream buffer manipulation with a SIMD merge instruction |
US7356079B2 (en) * | 2001-11-21 | 2008-04-08 | Vixs Systems Inc. | Method and system for rate control during video transcoding |
US7502415B2 (en) * | 2003-07-18 | 2009-03-10 | Microsoft Corporation | Range reduction |
US8014450B2 (en) * | 2003-09-07 | 2011-09-06 | Microsoft Corporation | Flexible range reduction |
US7610472B2 (en) * | 2005-06-05 | 2009-10-27 | Apple Inc. | Performing variable and/or bitwise shift operation for a shift instruction that does not provide a variable or bitwise shift option |
US8385424B2 (en) * | 2006-06-26 | 2013-02-26 | Qualcomm Incorporated | Reduction of errors during computation of inverse discrete cosine transform |
US7554468B2 (en) * | 2006-08-25 | 2009-06-30 | Sony Computer Entertainment Inc, | Entropy decoding methods and apparatus using most probable and least probable signal cases |
US8749409B2 (en) * | 2006-08-25 | 2014-06-10 | Sony Computer Entertainment Inc. | Entropy decoding methods and apparatus using most probable and least probable signal cases |
JP5214742B2 (ja) * | 2008-01-21 | 2013-06-19 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 予測に基づく画像処理 |
US8331664B2 (en) * | 2008-01-21 | 2012-12-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Prediction-based image processing |
KR101530284B1 (ko) * | 2010-07-16 | 2015-06-19 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
KR101931675B1 (ko) * | 2011-06-23 | 2018-12-21 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조 |
GB2501535A (en) * | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US20140286413A1 (en) * | 2013-03-25 | 2014-09-25 | Qualcomm Incorporated | Disabling sign data hiding in video coding |
US9558567B2 (en) * | 2013-07-12 | 2017-01-31 | Qualcomm Incorporated | Palette prediction in palette-based video coding |
KR102268090B1 (ko) * | 2014-03-14 | 2021-06-23 | 브이아이디 스케일, 인크. | 스크린 콘텐츠 코딩을 위한 팔레트 코딩 |
US20150264348A1 (en) * | 2014-03-17 | 2015-09-17 | Qualcomm Incorporated | Dictionary coding of video content |
JP6272630B2 (ja) * | 2014-05-09 | 2018-01-31 | ノキア テクノロジーズ オーユー | ビデオ符号化及び復号の方法及び技術装置 |
CN105323583B (zh) * | 2014-06-13 | 2019-11-15 | 财团法人工业技术研究院 | 编码方法、解码方法、编解码系统、编码器与解码器 |
US20170171560A1 (en) * | 2014-06-20 | 2017-06-15 | Sharp Kabushiki Kaisha | Efficient palette coding for screen content codings |
JP2017535169A (ja) * | 2014-10-06 | 2017-11-24 | ヴィド スケール インコーポレイテッド | スクリーンコンテンツコード化のための改善されたパレットコード化 |
JP2018510539A (ja) * | 2015-01-29 | 2018-04-12 | ヴィド スケール インコーポレイテッド | パレット符号化モードのためのエスケープカラー符号化 |
-
2016
- 2016-01-28 US US15/009,609 patent/US10057587B2/en active Active
- 2016-01-29 TN TNP/2017/000313A patent/TN2017000313A1/en unknown
- 2016-01-29 KR KR1020177021410A patent/KR102031468B1/ko active IP Right Grant
- 2016-01-29 TW TW105102938A patent/TWI665911B/zh active
- 2016-01-29 WO PCT/US2016/015672 patent/WO2016123492A1/en active Application Filing
- 2016-01-29 BR BR112017016405A patent/BR112017016405A2/pt not_active Application Discontinuation
- 2016-01-29 AU AU2016211251A patent/AU2016211251B2/en active Active
- 2016-01-29 EP EP16704762.0A patent/EP3251365A1/en not_active Withdrawn
- 2016-01-29 EA EA201791499A patent/EA035121B1/ru unknown
- 2016-01-29 CN CN201680005867.3A patent/CN107211135A/zh active Pending
- 2016-01-29 JP JP2017540111A patent/JP2018507625A/ja active Pending
-
2019
- 2019-10-25 JP JP2019194351A patent/JP2020039138A/ja not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1086618A (zh) * | 1992-09-29 | 1994-05-11 | 松下电器产业株式会社 | 运算装置 |
CN101874237A (zh) * | 2007-10-30 | 2010-10-27 | Arm有限公司 | 用于执行算术运算的大小检测的设备和方法 |
CN106508042B (zh) * | 2010-12-24 | 2014-01-08 | 中国电子技术标准化研究院 | 基于fmo编码的标签到读写器的数据传输方法 |
Non-Patent Citations (2)
Title |
---|
BINLI: "TComPrediction.cpp", 《FRAUNHOFER HHI》 * |
RAJAN JOSHI ET AL.: "High Efficiency Video Coding (HEVC) Screen Content Coding: Draft 2", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 18TH MEETING: SAPPORO》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114128298A (zh) * | 2019-07-24 | 2022-03-01 | 高通股份有限公司 | 调色板模式下的增量量化参数(qp)信令 |
Also Published As
Publication number | Publication date |
---|---|
US10057587B2 (en) | 2018-08-21 |
EA201791499A1 (ru) | 2017-11-30 |
TWI665911B (zh) | 2019-07-11 |
KR20170115529A (ko) | 2017-10-17 |
JP2018507625A (ja) | 2018-03-15 |
US20160227225A1 (en) | 2016-08-04 |
JP2020039138A (ja) | 2020-03-12 |
KR102031468B1 (ko) | 2019-10-11 |
BR112017016405A2 (pt) | 2018-03-27 |
EP3251365A1 (en) | 2017-12-06 |
EA035121B1 (ru) | 2020-04-29 |
TW201644277A (zh) | 2016-12-16 |
AU2016211251A1 (en) | 2017-07-13 |
WO2016123492A1 (en) | 2016-08-04 |
AU2016211251B2 (en) | 2019-09-26 |
TN2017000313A1 (en) | 2019-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107211135A (zh) | 用于调色盘模式译码的译码逃脱像素 | |
CN107211124B (zh) | 用于译码视频数据的方法、装置和计算机可读存储媒体 | |
CN106105206B (zh) | 用于使用置零系数的低复杂度正变换的系统和方法 | |
CN105474645B (zh) | 对视频数据进行解码的方法、对视频数据进行编码的方法、视频解码装置及视频编码装置 | |
CN103563378B (zh) | 存储器高效的上下文建模 | |
CN103703781B (zh) | 使用自适应运动向量分辨率的视频译码 | |
CN106105203B (zh) | 块自适应颜色空间转换译码 | |
CN105264891B (zh) | 一种对视频数据进行解码、编码的方法及装置 | |
CN105493507B (zh) | 用于帧内块复制的残余预测 | |
CN104221381B (zh) | 用于视频译码的波前并行处理的方法、装置及计算机可读存储媒体 | |
CN103404144B (zh) | 视频译码中的经量化脉码调制 | |
CN103947207B (zh) | 用于图片分割方案的统一设计 | |
CN103931182B (zh) | 帧内预测视频译码中的非正方形变换 | |
CN104247421B (zh) | 用于系数扫描的系数群及系数译码 | |
CN106105198B (zh) | 对视频数据译码的方法、装置以及计算机可读介质 | |
CN104137542B (zh) | 在视频译码过程中对与残余视频数据相关联的变换系数进行译码的方法、设备以及计算机可读介质 | |
CN107736023A (zh) | 帧内预测及帧内模式译码 | |
CN107743705A (zh) | 帧内预测及帧内模式译码 | |
CN107736022A (zh) | 帧内预测及帧内模式译码 | |
CN107771393A (zh) | 帧内预测及帧内模式译码 | |
CN107750457A (zh) | 帧内预测及帧内模式译码 | |
CN109076230A (zh) | 二值化二次变换指数 | |
CN107750455A (zh) | 帧内预测及帧内模式译码 | |
CN108141608A (zh) | 针对视频译码使用与位置相关的预测组合的改进视频帧内预测 | |
CN108141590A (zh) | 用于矩形变换单元的量化的增量qp、基于短距离帧内预测sdip的视频译码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170926 |
|
RJ01 | Rejection of invention patent application after publication |