CN106791833A - 编码方法、解码方法、编码设备以及解码设备 - Google Patents
编码方法、解码方法、编码设备以及解码设备 Download PDFInfo
- Publication number
- CN106791833A CN106791833A CN201710102184.6A CN201710102184A CN106791833A CN 106791833 A CN106791833 A CN 106791833A CN 201710102184 A CN201710102184 A CN 201710102184A CN 106791833 A CN106791833 A CN 106791833A
- Authority
- CN
- China
- Prior art keywords
- value
- weighting factor
- difference
- reference value
- coded data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000033001 locomotion Effects 0.000 claims abstract description 172
- 230000009466 transformation Effects 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 description 73
- 238000012986 modification Methods 0.000 description 73
- 238000013139 quantization Methods 0.000 description 46
- 238000009795 derivation Methods 0.000 description 39
- 230000015654 memory Effects 0.000 description 37
- 230000008859 change Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 32
- 238000003860 storage Methods 0.000 description 17
- 238000011084 recovery Methods 0.000 description 16
- 241000208340 Araliaceae Species 0.000 description 12
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 12
- 235000003140 Panax quinquefolius Nutrition 0.000 description 12
- 235000008434 ginseng Nutrition 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000005520 cutting process Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000004804 winding Methods 0.000 description 9
- 230000004075 alteration Effects 0.000 description 8
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 6
- 101150039623 Clip1 gene Proteins 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 4
- 102000016550 Complement Factor H Human genes 0.000 description 3
- 108010053085 Complement Factor H Proteins 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002845 discoloration Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
编码方法包括导出步骤和编码步骤。该导出步骤基于表示加权因数的粗糙度的固定小数点精度来导出作为加权因数的参考值的第一参考值,该加权因数用于通过将参考图像乘以加权因数来进行像素值变化的运动补偿预测。该编码步骤对作为加权因数与第一参考值之间的差值的第一差值进行编码。该加权因数被包括于以第一参考值作为近似中心的预定位精度的范围中。
Description
本分案申请是2012年6月27日递交的题为“编码方法、解码方法、编码设备以及解码设备”的中国专利申请NO.201280042152.7的分案申请。
技术领域
本发明涉及编码方法、解码方法、编码设备以及解码设备。
背景技术
近年来,一种以显著改善的编码效率对图像进行编码的方法被ITU-T(国际电信联盟电信标准化部门)和ISO(国际标准化组织)/IEC(国际电工委员会)共同推荐为ITU-TREC.H.264和ISO/IEC14496-10(在下文中称为“H.264”)。
在H.264中,公开了一种帧间预测编码系统,其中通过使用已编码图像作为参考图像来进行分数精度的运动补偿预测,从而消除了时间方向上的冗余以实现高编码效率。
另外,提出了一种其中以高于根据ISO/IEC MPEG(运动图像专家组)-1、2、4的帧间预测编码系统的效率对包括衰退或溶解效应的运动图像进行编码的系统。在此系统中,针对作为用于预测时间方向上的亮度变化的帧的具有辉度和两个色差的输入运动图像进行分数精度的运动补偿预测。然后,通过使用参考图像、辉度以及用于每个辉度和两个色差的加权因数、用于每个辉度和两个色差的偏移等,将预测图像乘以加权因数,并向其添加偏移。该加权因数能够使用表示固定小数点精度的参数来表示具有预定精度的分数,并且能够针对图像之间的像素值变化进行具有更精细精度的加权运动补偿预测。
引用列表
专利文献
专利文献1:日本特许公开专利公布号2004-7377
发明内容
技术问题
在如上所述的常规技术中,参考图像、加权因数、偏移等被编码为索引,且该索引被定义为用预定位精度来表示,并且因此,存在其中不能表示加权因数的情况。本发明的目的是提供能够在以预定位精度来表示加权因数的同时改善编码效率的编码方法、解码方法、编码设备以及解码设备。
问题的解决方案
根据实施例的编码方法包括导出步骤和编码步骤。该导出步骤基于表示加权因数的粗糙度的固定小数点精度来导出作为加权因数的参考值的第一参考值,该加权因数被用于通过将参考图像乘以该加权因数而进行像素值变化的运动补偿预测。该编码步骤对作为加权因数与第一参考值之间的差值的第一差值进行编码。该加权因数被包括于在以第一参考值作为近似中心的预定位精度的范围中。
附图说明
图1是图示出根据第一实施例的编码设备的示例的框图。
图2A是图示出根据第一实施例的用于像素块的预测编码序列的示例的说明图。
图2B是图示出根据第一实施例的用于像素块的预测编码序列的另一示例的说明图。
图3A是图示出根据第一实施例的编码树块的尺寸的示例的图。
图3B是图示出根据第一实施例的编码树块的特定示例的图。
图3C是图示出根据第一实施例的编码树块的另一特定示例的图。
图3D是图示出根据第一实施例的编码树块的另一特定示例的图。
图4是图示出根据第一实施例的预测图像生成单元的示例的框图。
图5是图示出根据第一实施例的用于双向预测中的运动补偿预测的运动矢量之间的关系的示例的图。
图6是图示出根据第一实施例的多帧运动补偿单元的示例的框图。
图7是图示出加权因数的选择范围的参考图。
图8是图示出H.264的加权因数的选择范围的参考图。
图9是图示出根据第一实施例的加权因数的选择范围的示例的说明图。
图10A是图示出根据第一实施例的加权因数的选择范围的特定示例的说明图。
图10B是图示出根据第一实施例的加权因数的选择范围的另一特定示例的说明图。
图11是图示出H.264加权因数的最小值和最大值的参考图。
图12是图示出根据第一实施例的加权因数的最小值和最大值的示例的说明图。
图13A是图示出根据第一实施例的WP参数信息的示例的图。
图13B是图示出根据第一实施例的WP参数信息的示例的图。
图14是图示出根据第一实施例的导出加权因数的选择范围的处理示例的流程图。
图15是图示出根据第一实施例的语法的示例的图。
图16是图示出根据第一实施例的画面参数集语法的图。
图17是图示出根据第一实施例的滑块报头语法的图。
图18是图示出根据第一实施例的预测权值表的示例的图。
图19是图示出根据第一实施例的语法元素的值的关系的示例的说明图。
图20是图示出根据第二实施例的解码设备的配置示例的框图。
图21是图示出根据修改1的偏移的选择范围的示例的说明图。
图22是图示出根据修改1的导出偏移的选择范围的处理示例的流程图。
图23是图示出根据修改2的加权因数的选择范围的示例的说明图。
图24是图示出根据修改2的导出加权因数的选择范围的处理示例的流程图。
图25是图示出根据修改3的编码目标的加权因数之间的差值的范围的示例的说明图。
图26是图示出根据修改3的语法元素的值之间的关系的示例的说明图。
图27是图示出根据修改4的加权因数之间的差值的范围的示例的说明图。
图28是图示出根据修改4的解码之后的加权因数的选择范围的示例的说明图。
图29是图示出根据修改5的加权因数之间的差值的卷绕处理的示例的流程图。
图30是图示出根据修改5的加权因数的恢复处理的示例的流程图。
具体实施方式
在下文中将参考附图来详细地描述实施例。下面提出的根据每个实施例的编码设备和解码设备可用诸如LSI(大规模集成)芯片、DSP(数字信号处理器)或FPGA(现场可编程门阵列)之类的硬件来实现。另外,下面提出的根据每个实施例的编码设备和解码设备可通过使计算机执行程序、换言之用软件来实现。在下面提出的描述中,可用诸如“视频”、“像素”、“图像信号”、“图片”或“图像数据”之类的术语来适当地替换术语“图像”。
第一实施例
在第一实施例中,将描述对运动图像进行编码的编码设备。
图1是图示出根据第一实施例的编码设备100的配置示例的框图。
编码设备100将构成输入图像的每个帧或每个字段划分成多个像素块并使用来自编码控制单元111的编码参数输入来执行所划分的像素块的预测编码,从而生成预测图像。然后,编码设备100通过用被划分成所述多个像素块的输入图像减去预测图像来生成预测误差,通过针对生成的预测误差执行正交变换、以及量化、并且然后进行熵编码来生成已编码数据,并输出生成的已编码数据。
编码设备100通过选择性地应用在像素块的块尺寸和生成预测图像的方法中的至少一个方面相互不同的多个预测模式来执行预测编码。生成预测图像的方法可主要划分成两类,包括其中在编码目标帧内进行预测的帧内预测以及其中使用不同时间点的一个或多个参考帧来进行运动补偿预测的帧间预测。帧内预测也称为画面内部预测、帧内部预测等,并且帧间预测也称为画面间预测、帧间预测、运动补偿预测等。
图2A是图示出根据第一实施例的用于像素块的预测编码序列的示例的说明图。在图2A中所示的示例中,编码设备100在像素块中从左上侧朝着右下侧执行预测编码。因此,在编码处理目标帧f中,已被编码的像素块p位于编码目标像素块c的左侧和上侧。
图2B是图示出根据第一实施例的用于像素块的预测编码序列的另一示例的说明图。在图2B中所示的示例中,编码设备100将画面划分成多个瓦片状或切片状,并且然后从每个瓦片或每个切片中的像素块的左上侧朝着右下侧执行预测编码。相应地,在编码处理目标帧f中,已被编码的像素块p位于编码目标像素块c的左侧和上侧。在这里,瓦片表示通过将画面切割成任意矩形区域而获得的区域,并且切片表示通过将画面按照预测编码顺序切割成稍后将描述的任意数目的大编码树块而获得的区域。
在图2B中所示的示例中,在将画面划分成多个瓦片状或多个切片之后,对每个瓦片或每个切片执行编码处理,并且相应地,能够对每个瓦片或每个切片执行解码处理。因此,通过以并行方式来执行高分辨率视频的解码解码,能够划分解码所需的计算量。换言之,在图2B中所示的示例中,能够以高速度执行编码处理和解码处理。
尽管在下文中,为了描述的简化,假设编码设备100按照图2A中所示的顺序来执行预测编码,但预测编码的顺序不限于此。
像素块表示用于处理图像的单元,并且例如具有M×N尺寸(在这里,M和N是自然数)的块、编码树块、宏块、子块、一个像素等与像素块相对应。在下面提出的描述中,基本上,像素块作为编码树块的意义来使用,但是其可作为不同意义来使用。例如,在预测单元的描述中,使用像素块作为预测单元的像素块的意义来使用。可将块称为单元等。例如,可将编码块称为编码单元。
图3A是图示出根据第一实施例的编码树块的尺寸的示例的图。编码树块通常是64×64的像素块,如图3A中所示。然而,编码树块不限于此,而是可以是32×32的像素块、16×16的像素块、8×8的像素块、4×4的像素块等。在这里,编码树块可以不是正方形,而是例如可以是M×N尺寸的像素块(在这里,M≠N)。
图3B至3D是表示根据第一实施例的编码树块的特定示例的图。图3B表示具有64×64的尺寸的编码树块(N=32)。在这里,N表示参考编码树块的尺寸。其中编码树块被划分的情况的尺寸被定义为N,并且其中编码树块未被划分的情况的尺寸被定义为2N。图3C表示通过将图3B中所示的编码树块划分成四叉树而获得的编码树块。如图3C中所示的编码树块具有四叉树结构。在编码树块被划分的情况下,如图3C中所示,编号在划分之后被按照Z扫描顺序附着于四个像素块。
另外,在四叉树的每个编号内,可将编码树块进一步划分成四叉树。相应地,可以分层方式来划分编码树块。在这种情况下,将划分的深度定义为深度(Depth)。图3D表示通过将图3B中所示的编码树块划分成四叉树而获取的编码树块中的一个,其块尺寸为32×32(N=16)。图3B中所示的编码树块的深度为“0”,并且图3D中所示的编码树块的深度为“1”。另外,具有最大单元的编码树块被称为大编码树块,并且在此类单元中输入图像信号被按照光栅扫描顺序编码。
在下面提出的描述中,可将输入图像的已编码目标快或编码树块称为预测目标块或预测像素块。另外,编码单元不限于像素块,而是可使用帧、字段、切片、线以及像素中的至少一个作为编码单元。
如图1中所示的编码设备100包括:减法单元101;正交变换单元102;量化单元103;逆量化单元104;逆正交变换单元105;加法单元106;预测图像生成单元107;索引设置单元108;运动评估单元109;以及编码单元110。另外,图1中所示的编码控制单元111控制编码设备100,并且例如可通过使用CPU(中央处理单元)等来实现。
减法单元101通过用被划分成像素块的输入图像减去相应的预测图像来获取预测误差。减法单元101输出该预测误差,从而使该预测误差被输入到正交变换单元102。
正交变换单元102对从减法单元101输入的预测误差执行诸如离散余弦变换(DCT)或离散正弦变换(DST)之类的正交变换,从而获取变换系数。正交变换单元102输出变换系数,从而使该变换系数被输入到量化单元103。
量化单元103对从正交变换单元102输入的变换系数执行量化处理,从而获取量化变换系数。更具体地,量化单元103基于由编码控制单元111指定的量化参数和诸如量化矩阵之类的量化信息来执行量化。更详细地描述,量化单元103通过将变换系数除以基于量化信息导出的量化步幅而获取量化变换系数。量化参数表示量化的细度。量化矩阵被用于针对变换系数的每个分量对量化的细度进行加权。量化单元103输出量化变换系数,从而使该量化变换系数被输入到逆量化单元104和编码单元110。
逆量化单元104对从量化单元103输入的量化变换系数执行逆量化处理,从而获取恢复变换系数。更具体地,逆量化单元104基于量化单元103所使用的量化信息来执行逆量化。详细地描述,逆量化单元104通过将量化变换系数乘以基于量化信息导出的量化步幅来获取恢复变换系数。另外,量化单元103所使用的量化信息是从编码控制单元111的内部存储器(其在图中并未示出)加载的并被使用。逆量化单元104输出恢复变换系数,从而将该恢复变换系数输入到逆正交变换单元105。
逆正交变换单元105对从逆量化单元104输入的恢复变换系数执行诸如逆离散余弦变换(IDCT)和逆离散正弦变换(IDST)之类的逆正交变换,从而获取恢复预测误差。在这里,由逆正交变换单元105执行的逆正交变换对应于由正交变换单元102执行的正交变换。逆正交变换单元105输出恢复预测误差,从而该恢复预测误差其被输入到加法单元106。
加法单元106将从逆正交变换单元105输入的恢复预测误差与相应的预测图像相加,从而生成本地已解码图像。加法单元106输出本地已解码图像,从而使本地已解码图像被输入到预测图像生成单元107。
预测图像生成单元107将从加法单元106输入的本地已解码图像作为参考图像存储在存储器(图1中未示出)中,并输出存储在存储器中的参考图像,从而使该参考图像被输入到运动评估单元109。另外,预测图像生成单元107通过基于从运动评估单元109输入的运动信息和WP参数信息来执行加权运动补偿预测来生成预测图像。预测图像生成单元107输出预测图像,从而使预测图像被输入到减法单元101和加法单元106。
图4是图示出根据第一实施例的预测图像生成单元107的配置示例的框图。如图4中所示的预测图像生成单元107包括:多帧运动补偿单元201;存储器202;单向运动补偿单元203;预测参数控制单元204;参考图像选择器205;帧存储器206以及参考图像控制单元207。
帧存储器206在参考图像控制单元207的控制下将从加法单元106输入的本地已解码图像存储为参考图像。帧存储器206包括被用于临时地存储参考图像的多个存储器组FM1至FMN(在这里,N≥1)。
预测参数控制单元204基于从运动评估单元109输入的运动信息将多个分别由参考图像编号和预测参数构成的组合制为表格。在这里,运动信息表示运动矢量的信息,运动矢量表示运动的偏差,运动偏差被用于运动补偿预测、参考图像编号以及诸如单向/双向预测的预测模式。预测参数表示关于运动矢量和预测模式的信息。然后,预测参数控制单元204基于输入图像来选择被用于生成预测图像的参考图像编号和预测参数的组合,并输出所选组合,从而允许参考图像编号被输入到参考图像选择器205并允许预测参数被输入到单向运动补偿单元203。
参考图像选择器205是一种开关,该开关基于从预测参数控制单元204输入的参考图像编号来将包括在帧存储器206中的帧存储器FM1至FMN的输出端子中的一个变为接通。例如,当参考图像编号为“0”时,参考图像选择器205将帧存储器FM1的输出端子连接至参考图像选择器205的输出端子,并且当参考图像编号是N-1时,参考图像选择器205将帧存储器FMN的输出端子连接到参考图像选择器205的输出端子。参考图像选择器205输出存储于包括在帧存储器206中的帧存储器FM1至FMN之中的、其输出端子与参考图像选择器连接的帧存储器中存储的参考图像,从而使该参考图像被输入到单向运动补偿单元203和运动评估单元109。
单向运动补偿单元203基于从预测参数控制单元204输入的预测参数和从参考图像选择器205输入的参考图像来执行运动补偿预测处理,从而生成单向预测图像。
图5是图示出根据第一实施例的用于双向预测中的运动补偿预测的运动矢量之间的关系的示例的图。在运动补偿预测中,使用参考图像来执行内插处理,并且基于生成的内插图像和来自位于编码目标位置处的像素块的输入图像的运动偏差而生成单向预测图像。在这里,偏差是运动矢量。如图5中所示,在双向预测切片(B切片)中,通过使用两种类型的参考图像和运动矢量集来生成预测图像。作为内插处理,使用1/2像素精度的内插处理、1/4像素精度的内插处理等,并且通过对参考图像执行滤波处理,来生成内插图像的值。例如,在其中能够对辉度信号执行达到1/4像素精度的内插的H.264中,将偏差表示为四倍整数像素精度。
单向运动补偿单元203输出单向预测图像,并临时地将单向预测图像存储在存储器202中。在这里,在其中运动信息(预测参数)表示双向预测的情况下,多帧运动补偿单元201使用两种单向预测图像来进行加权预测。相应地,单向运动补偿单元203将单向预测图像中的对应于第一类型的单向预测图像存储在存储器202中,并将对应于第二类型的单向预测图像直接地输出到多帧运动补偿单元201。在这里,将对应于第一类型的单向预测图像称为第一预测图像,并且将对应于第二类型的单向预测图像称为第二预测图像。
另外,可准备两个单向运动补偿单元203且生成两个单向预测图像。在这种情况下,当运动信息(预测参数)表示单向预测时,单向运动补偿单元203可将第一单向预测图像作为第一预测图像直接地输出到多帧运动补偿单元201。
多帧运动补偿单元201通过使用从存储器202输入的第一预测图像、从单向运动补偿单元203输入的第二预测图像以及从运动评估单元109输入的WP参数信息来进行加权预测,从而生成预测图像。多帧运动补偿单元201输出预测图像,从而使该预测图像被输入到减法单元101和加法单元106。
图6是图示出根据第一实施例的多帧运动补偿单元201的配置示例的框图。如图6中所示,多帧运动补偿单元201包括:默认运动补偿单元301;加权运动补偿单元302;WP参数控制单元303;以及WP选择器304和305。
WP参数控制单元303基于从运动评估单元109输入的WP参数信息而输出WP应用标志和加权信息,从而将WP应用标志输入到WP选择器304和305并将加权信息输入到加权运动补偿单元302。
在这里,WP参数信息包括第一WP应用标志(更详细描述,第一WP应用标志的标志信息)、第二WP应用标志(更详细地描述,第二WP应用标志的标志信息)以及加权信息的信息。第一WP应用标志和第二WP应用标志是能够针对每个参考图像和每个信号分量来设置的参数,并且包括是针对第一预测图像和第二预测图像进行默认运动补偿预测还是进行加权运动补偿预测的信息。在这里,在其中第一WP应用标志和第二WP应用标志分别是“0”的情况下,其表示进行默认运动补偿预测。另一方面,在其中第一WP应用标志和第二WP应用标志分别是“1”的情况下,其表示进行加权运动补偿预测。
加权信息包括第一加权因数的值w0C、第二加权因数的值w1C、表示第一和第二加权因数的固定小数点精度的参数LWD(在这里,可将其称为“固定小数点精度LWD”)、第一偏移o0C以及第二偏移o1C的信息。在这里,变量C表示信号分量。例如,在YUV空间信号的情况下,用C=Y来表示辉度信号,用C=Cr来表示Cr色差信号,并且用C=Cb来表示Cb色差分量。
第一加权因数是对应于第一预测图像的加权因数,并且是具有根据固定小数点精度LWD而确定(改变)的值的参数。第二加权因数是对应于第二预测图像的加权因数,并且是具有根据固定小数点精度LWD而确定(改变)的值的参数。固定小数点精度LWD是控制对应于第二加权因数的分数精度的间隔宽度的参数。虽然根据辉度和色差可使用固定小数点精度LWD的不同值,但在这里,为了描述的简化,将在不针对每个色彩信号进行明确地划分情况下来描述固定小数点精度。例如,在w0C被表示为实值时是1.0(二进制记数法中的1)且LWD是5的情况下,第一加权因数是32(二进制记数法中的100000)。另外,在w1C被表示为实值时是2.0(二进制记数法中的10)且LWD是5的情况下,第二加权因数是64(二进制记数法中的1000000)。第一偏移o0C是对应于第一预测图像的偏移,并且第二偏移o1C是对应于第二预测图像的偏移。
另外,当输入WP参数信息时,WP参数控制单元303检查加权信息的值是否在规定范围内并将在范围之外的值重置成在范围内的值或改变WP应用标志的值。例如,在w0C被表示为实值时是3.0且LWD是7的情况下,第一加权因数是384。在这里,假设384在第一加权因数的范围之外且不能被使用,并且96在第一加权因数的范围内且能够被使用。在这种情况下,WP参数控制单元303可在w0C被表示为实值时被保持在3.0的情况下通过将LWD设置成5并将第一加权因数设置成96来将第一加权因数重置成在第一加权因数的范围内。另外,此时,WP参数控制单元303可执行量化处理。例如,在LWD是7且第一加权因数是385的情况下,WP参数控制单元303可通过经由执行量化处理来将第一加权因数设置成384且然后将LWD设置成5并将w0C设置为被表示为实值时的3.0来将第一加权因数重置成96。另外,WP参数控制单元303可将第一WP应用标志的值从1变成0,从而不使用加权运动补偿预测。然而本技术不限于此,只要WP参数控制单元303执行控制以使得加权信息的值不超过基于规范等确定的规定范围。
WP选择器304和305基于从WP参数控制单元303输入的WP应用标志来改变预测图像的连接端。在相应的WP应用标志是“0”的情况下,WP选择器304和305中的每一个将其输出端连接到默认运动补偿单元301。然后,WP选择器304和305输出第一和第二预测图像,从而使第一和第二预测图像被输入到默认运动补偿单元301。另一方面,在相应的WP应用标志是“1”的情况下,WP选择器304和305中的每一个将其输出端连接到加权运动补偿单元302。然后,WP选择器304和305输出第一和第二预测图像,从而使第一和第二预测图像被输入到加权运动补偿单元302。
默认运动补偿单元301基于从WP选择器304和305输入的两个单向预测图像(第一和第二预测图像)来执行平均处理(默认运动补偿预测),从而生成预测图像。更具体地,在第一和第二WP应用标志是“0”的情况下,默认运动补偿单元301基于数值表达式(1)来执行平均处理。
P[x,y]=Clip1((PL0[x,y]+PL1[x,y]+offset2)>>(shift2)) (1)
在这里,P[x,y]是预测图像,PL0[x,y]是第一预测图像,并且PL1[x,y]是第二预测图像。另外,offset2和shift2是平均处理中的舍入处理的参数,并且是基于第一和第二预测图像的内部计算精度而确定的。Clip1(X)是用于用特定位精度对变量X进行裁剪的函数,并且在这里将变量X裁剪到预测图像的位精度内。例如,当预测图像的位精度L是8时,在0至255的范围之外的值被裁剪成0至255。更详细地描述,0以下的值被设置成0,并且超过255的值被设置成255。
当预测图像的位精度是L且第一和第二预测图像的位精度是M(L≤M)时,用数值表达式(2)将shift2公式化,并且用数值表达式(3)将offset2公式化。
shift2=(M–L+1) (2)
offset2=(1<<(shift2-1) (3)
例如,预测图像的位精度是“8”且第一和第二预测图像的位精度是“14”,基于数值表达式(2)shift2=7且基于数值表达式(3)offset2=(1<<6),
另外,在运动信息(预测参数)所表示的预测模式是单向预测的情况下,默认运动补偿单元301基于数值表达式(4)仅使用第一预测图像来计算最终的预测图像。
P[x,y]=Clip1((PLX[x,y]+offset1)>>(shift1))(4)
在这里,PLX[x,y]表示单向预测图像(第一预测图像),并且X是表示作为参考列表的“0”或“1”的标识符。例如,PLX[x,y]在参考列表是“0”的情况下为PL0[x,y]且在参考列表是“1”的情况下是PL1[x,y]。另外,offset1和shift1是用于舍入处理的参数,并且是基于第一预测图像的内部计算精度而确定的。当预测图像的位精度是L且第一预测图像的位精度是M时,用数值表达式(5)将shift1公式化,并且用数值表达式(6)将offset1公式化。
shift1=(M-L) (5)
offset1=(1<<(shift1-1) (6)
例如,在预测图像的位精度是“8”且第一预测图像的位精度是“14”的情况下,基于数值表达式(5)shift1=6且基于数值表达式(6)offset1=(1<<5)。
加权运动补偿单元302基于从WP选择器304和305输入的两个单向预测图像(第一和第二预测图像)和从WP参数控制单元303输入的加权信息来执行加权运动补偿(加权运动补偿预测)。
在这里,将进一步描述加权因数。图7是用于描述加权因数的参考图,并且图示出在时间方向上具有像素值变化的运动图像的灰度变化的示例。在图7中所示的示例中,编码目标帧是Frame(t),在时间上在编码目标帧之前的一个帧是Frame(t-1),并且在时间上在编码目标帧之后的一个帧是Frame(t+1)。如图7中所示,在从白色变成黑色的衰退图像中,图像的亮度(灰度值)随着时间的流逝而减小。加权因数的值表示如参考图7所述的像素值的变化程度,并且在不存在像素值变化的情况下(在其中像素值的变化是“0”的情况下)采取被表示为实值时为“1.0”的值。
在这里,将描述不存在像素值的变化的情况。例如,在考虑其中相同的静止图像在时间上连续的运动图像的情况下,画面之间的辉度方面的变化是零。在这种情况下,由于即使在进行加权运动补偿预测时,像素值的变化也是零,所以该情况等效于加权运动补偿单元302进行默认运动补偿预测的情况。在这种情况下,换言之,在不存在像素值变化的情况下,加权运动补偿单元302选择加权因数的参考值,由此,将默认运动补偿预测实现为加权运动补偿预测。在这里,能够基于固定小数点精度来导出加权因数的参考值(1<<LWD)。
一般地,诸如衰退效应、溶解效应等运动图像的像素值变化并非对于每个帧而言都那么大,并且相应地,加权因数的值在被表示为实值时朝着1.0倾斜。另外,在第一实施例中,由于用被表示为2的幂的固定小数点精度对加权因数的值进行量化,所以即使当仅存在两个图像之间在像素值方面的平均变化时,在具有1/128以下的精度的变化的情况下,加权因数的值在被表示为实值时被量化成1/0。相应地,在第一实施例中,即使在发生像素值变化的情况下,也能够将该情况视为其中基本不存在像素值的变化的情况。在下文中,为了描述的简化,在假设不存在像素值的变化的情况下、换言之在加权因数的值在被表示为实值时为1.0的情况在来提出以下描述。另外,不存在像素值的变化的情况对应于像素值的变化是预定值(充分地小于加权因数的精度的值)或更小的情况。
相应地,在第一WP应用标志和第二WP应用标志是“1”的情况下,加权运动补偿单元302基于数值表达式(7)来执行加权处理。
P[x,y]=Clip1(((PL0[x,y]*w0C+PL1[x,y]*w1C+((o0C+o1C+1)<<LWD))>>(LWD+1))) (7)
另外,在其中第一和第二预测图像的计算精度和预测图像的计算精度相互不同的情况下,加权运动补偿单元302通过如在数值表达式(8)中那样控制LWD来实现舍入处理。
LWD’=LWD+offset1 (8)
能够通过用在数值表达式(8)中表示的LWD'来代替在数值表达式(7)中表示的LWD而实现舍入处理。例如,在预测图像的位精度是8且第一和第二预测图像的位精度是14的情况下,通过重置LWD,能够实现具有与在数值表达式(1)中表示的shift2的计算精度相同的计算精度的批舍入处理。
另外,在用运动信息(预测参数)表示的预测模式是单向预测的情况下,加权运动补偿单元302基于数值表达式(9)仅使用第一预测图像来计算最后预测图像。
P[x,y]=Clip1((PLX[x,y]*wXC+(1<<(LWD-1)))>>(LWD)+oXC)(9)
在这里,PLX[x,y]表示单向预测图像(第一预测图像),wXC表示对应于单向预测的加权因数,X是表示作为参考列表的“0”或“1”的标识符,并且oXC表示对应于单向预测的偏移。例如,PLX[x,y]、wXC以及偏移在参考列表是“0”的情况下是PL0[x,y]、w0C以及o0C,并且在参考列表是“1”的情况下是PL1[x,y]、w1C以及o1C。
另外,在其中第一和第二预测图像的计算精度和预测图像的计算精度相互不同的情况下,加权运动补偿单元302通过如在数值表达式(8)中那样控制LWD来实现舍入处理,类似于双向预测的情况。
能够通过用在数值表达式(8)中表示的LWD'来替换在数值表达式(9)中表示的LWD而实现舍入处理。例如,在其中预测图像的位精度是“8”且第一预测图像的位精度是“14”的情况下,通过将LWD重置,可以实现针对与在数值表达式(4)中表示的shift1的计算精度类似的计算精度的批舍入处理。
另外,在单向预测的情况下,不使用对应于第二预测图像的各种参数(第二WP应用标志、第二加权因数以及第二偏移信息)且可将其设置成预先确定的初始值。
返回参考图1,运动评估单元109基于输入图像和从预测图像生成单元107输入的参考图像来执行多个帧之间的运动评估,并输出运动信息和WP参数信息,从而将运动信息输入到预测图像生成单元107和编码单元110,并将WP参数信息输入到预测图像生成单元107和索引设置单元108。
运动评估单元109通过计算预测目标像素块的输入图像与对应于与起始点相同的位置的多个参考图像之间的差来计算误差,以分数精度使该位置移位,并且使用诸如用于发现最小误差块等的块匹配之类的技术来计算最佳运动信息。在双向预测的情况下,运动评估单元109使用从单向预测导出的运动信息来执行包括如在数值表达式(1)和(4)中表示的默认运动补偿预测的块匹配,从而计算双向预测的运动信息。
在这时,运动评估单元109能够通过执行包括如在数值表达式(7)和(9)中表示的加权运动补偿预测的块匹配来计算WP参数信息。另外,为了计算WP参数信息,可使用使用输入图像的像素梯度来计算加权因数或偏移的方法、根据编码时的预测误差的累积来计算加权因数或偏移的方法等。此外,作为WP参数信息,可使用针对每个编码设备预先确定的固定值。
在这里,将通过返回参考图7来描述计算加权因数、加权因数的固定小数点精度以及与在时间上具有像素值变化的运动图像的偏移的方法。如上所述,在如图7中所示的从白色变成黑色的衰退图像中,像素值(灰度值)根据时间的流逝而减小。运动评估单元109能够通过计算其斜率来计算加权因数。
加权因数的固定小数点精度是表示斜率的精度的信息,并且运动评估单元109能够基于在时间上到参考图像的距离和图像值的变化程度来计算最佳值。例如,在图7中,在Frame(t-1)和Frame(t+1)之间的加权因数的值用实值精度来表示时是0.75的情况下,能够在1/4精度的情况下表示3/4,并且相应地,运动评估单元109将固定小数点精度设置成2(1<<2)。由于固定小数点精度的值对加权因数被编码的情况的编码量有影响,所以作为固定小数点精度的值,能够在考虑代码量和预测精度的情况下选择最佳值。另外,固定小数点精度的值可以是预先确定的固定值。
另外,在其中斜率不匹配的情况下,运动评估单元109能够通过获取对应于线性函数的截距的校正值(偏差量)来计算偏移的值。例如,在图7中,在Frame(t-1)和Frame(t+1)之间的加权因数用实精度来表示时是0.60且固定小数点精度是“1”(1<<1)的情况下,存在加权因数被设置成“1”(对应于用实精度来表示加权因数的值时的0.50)的很大可能性。在这种情况下,由于加权因数的分数精度与作为最佳值的0.60偏离0.10,所以运动评估单元109基于像素的最大值来计算与之相对应的校正值,并且将该校正值设置为偏移的值。在其中像素的最大值是255的情况下,运动评估单元109可设置诸如25(255×0.1)之类的值。
在第一实施例中,虽然将运动评估单元109作为示例而表示为编码设备100的一个功能,但运动评估单元109并不是编码设备100的必要配置,并且例如运动评估单元109可以是除编码设备100之外的设备。在这种情况下,可将运动信息和由运动评估单元109计算的WP参数信息加载到编码设备100中。
索引设置单元108接收从运动评估单元109输入的WP参数信息,检查参考列表(列表编号)和参考图像(参考编号),并输出索引信息,从而使索引信息被输入到编码单元110。索引设置单元108通过将从运动评估单元109输入的WP参数信息映射成稍后将描述的语法元素来生成索引信息。这时,索引设置单元108导出加权因数的选择范围并检查加权因数被包括在选择范围内。
在这里,将描述加权因数的选择范围的导出。
在第一实施例中,如上所述,假设其中不存在像素值变化且加权因数的值在被表示为实值时为1.0的情况。在这种情况下,加权因数/加权因数的参考值=1是令人满意的。如上所述,由于加权因数的参考值是(1<<LWD),所以加权因数是(1<<LWD)且具有与第一实施例中的加权因数的参考值相同的值。
顺便地,在H.264等中,加权因数、偏移等的每个索引被定义成采取-128到127的有符号8位值,并且固定小数点精度被定义成采取0至7的值。因此,根据第一实施例,存在其中加权因数在定义范围之外的情况。
图8是图示出H.264的加权因数的选择范围并表示固定小数点精度LWD采取从0至7的值的情况的加权因数(1<<LWD)的参考图。如从图8显而易见的,加权因数随着固定小数点精度LWD的值减小而采取接近零的正值。然而,当固定小数点精度LWD的值是7,加权因数是128,其在H.264中定义的范围之外。
如上所述,在H.264的规定中,期望使用的加权因数的范围在规规定的围之外,这不服从实际应用。另外,在单向预测中,即使当选择了对应于相反方向的加权因数时,存在这样的高可能性,即可能基于输入图像的裁剪范围将由单向预测输出的预测像素值裁剪成为零,并且基本上不能选择对应于相反方向的加权因数。另一方面,在双向预测中,为了实现外部插入预测,采用其中将一侧的单向预测的加权因数设置成负值并将另一侧的加权因数设置成正值的使用方法。然而,存在其中负侧值不要求与作为加权因数范围的正侧值相同的精度的许多情况。
因此,根据第一实施例,索引设置单元108通过在加权因数的参考值被设置为近似中心的情况下分配在负和正方向上的值来导出加权因数的选择范围并检查该加权因数被包括在加权因数的导出选择范围内。
图9是图示出根据第一实施例的加权因数的选择范围的示例的说明图。在图9中所示的示例中,与参考图8所述的加权因数的选择范围不同,加权因数的参考值(1<<LWD)被布置成位于选择范围的近似中心处,通过用加权因数的参考值减去128而获取的值(-128+(1<<LWD))是选择范围的最小值,并且通过将加权因数的参考值加上127而获取的值(127+(1<<LWD))是选择范围的最大值。
索引设置单元108通过使用数值表达式(10)和(11)来设置加权因数的选择范围。用数值表达式(10)将选择范围的最小值公式化,并且通过使用数值表达式(11)将选择范围的最大值公式化。
min_wXC=-128+(1<<LWD)(10)
max_wXC=127+(1<<LWD)(11)
图10A和10B是图示出根据第一实施例的加权因数的选择范围的特定示例的说明图。图10A图示出其中固定小数点精度LWD的值是7的情况的加权因数的选择范围,并且图10B图示出其中固定小数点精度LWD的值是5的情况的加权因数的选择范围。在图10A中所示的示例中,作为“128”的加权因数的参考值被布置成位于选择范围的近似中心处,该选择范围的最小值是0,并且该选择范围的最大值是255。在图10B中所示的示例中,作为“32”的加权因数的参考值被布置成位于选择范围的近似中心处,该选择范围的最小值是-96,并且该选择范围的最大值是159。
图11是图示出H.264的加权因数的选择范围的最小值和最大值的参考图。图12是图示出根据第一实施例的加权因数的选择范围的最小值和最大值的示例的说明图。如图11中所示,在H.264中,加权因数的选择范围的最小值和最大值是恒定的,无论加权因数的参考值如何。另一方面,如图12中所示,根据第一实施例,加权因数的选择范围的最小值和最大值根据加权因数的参考值而改变。
如图12中所示,在其中在以加权因数的参考值为其近似中心来设置加权因数的选择范围的情况下,加权因数所采取的范围是-127至255,并且要求有符号的9位的精度。为此,在第一实施例中,稍后将描述的编码单元110将更新成被设置为索引的加权因数,换言之,编码目标的值更新成加权因数与加权因数的参考值之间的差值。如图9中所示,能够理解的是通过用导出的加权因数的选择范围来减去加权因数的参考值,加权因数之间的差值的范围采取-128到127的有符号的8位值。换言之,虽然在以加权因数的参考值为其近似中心来设置加权因数的选择范围的情况下加权因数的选择范围根据加权因数的参考值而变,通过用加权因数的选择范围减去加权因数的参考值,加权因数之间的差值的范围是恒定的,无论加权因数的参考值如何。如上所述,根据第一实施例,由于用加权因数之间的差值替换了加权因数,所以加权因数的选择范围扩展,并且能够定义具有有符号的8位精度的选择范围。
另外,在检查到加权因数未被包括在导出的加权因数的选择范围中的情况下,索引设置单元108可使用加权因数的选择范围的最大值或最小值来执行裁剪处理。在这种情况下,索引设置单元108可在加权因数小于选择范围的最小值的情况下将加权因数裁剪成最小值,并在加权因数大于选择范围的最大值的情况下将加权因数裁剪成最大值。通过引入此类裁剪处理,编码目标的值、诸如加权因数之间的差值在未布置特定范围限制的情况下采取在预定位精度内的值,并且相应地,能够使硬件所使用的电路尺度的配置明了。
此外,在第一实施例中,虽然假设了加权因数的选择范围具有有符号8位精度的情况,但加权因数的选择范围的精度不限于此,并且例如可以是有符号的9位精度。在这种情况下,虽然加权因数的选择范围是-256至255,但可以用-256来替换在数值表达式(10)中表示的-128,并且可以用255来替换在数值表达式(11)中表示的127。
另外,在第一实施例中,虽然已描述了由索引设置单元108来导出加权因数的选择范围的示例,但选择范围的导出不限于此,而是可以由编码单元110来执行。
图13A和13B是图示出根据第一实施例的被输入到索引设置单元108的WP参数信息的示例的图。P切片时的WP参数信息的示例如图13A中所示,并且B切片时的WP参数信息的示例如图13A和13B中所示。列表编号是表示预测方向的标识符。该列表编号在单向预测的情况下具有“0”的值。另一方面,在双向预测的情况下,能够使用两个类型的预测,并且相应地,列表编号具有“0”和“1”的两个值。参考编号是对应于在帧存储器206中表示的1至N中的任何一个的值。由于为每个参考列表和参考图像保持了WP参数信息,所以在其中存在N个参考图像的情况下,在B切片时需要2N个信息片。
图14是图示出根据第一实施例的导出加权因数的选择范围的处理示例的流程图。在这里,虽然假设了其中索引设置单元108执行导出加权因数的选择范围的处理的情况来描述,如上所述,但可由编码单元110来执行该处理。
首先,索引设置单元108导出加权因数的固定小数点精度LWD(步骤S02)。在这里,索引设置单元108可从WP参数信息或从索引信息导出加权因数的固定小数点精度LWD。
随后,索引设置单元108通过使用导出的固定小数点精度LWD来导出加权因数的参考值(1<<LWD)(步骤S03)。
随后,索引设置单元108通过用加权因数的导出参考值(1<<LWD)减去128来导出加权因数的选择范围的最小值(步骤S04)。
随后,索引设置单元108将加权因数的导出参考值(1<<LWD)加上127,从而导出加权因数的选择范围的最大值(步骤S05)。
然后,索引设置单元108检查加权因数被包括在加权因数的导出选择范围内。
返回参考图1,编码单元110执行各种编码参数的编码处理,诸如从量化单元103输入的量化变换系数、从运动评估单元109输入的运动信息、从索引设置单元108输入的加权因数的索引信息和选择范围以及由编码控制单元111指定的量化信息,从而生成已编码数据。作为编码处理,例如,存在霍夫曼编码或算术编码。
在这里,编码参数是诸如表示预测方法等的预测信息、关于量化变换系数的信息以及关于解码处理所需的量化的信息之类的参数。例如,可将其配置成使得图中未示出的内部存储器被包括在编码控制单元111中,编码参数被保持在内部存储器中,并且当对像素块进行编码时,使用已经完成以进行编码的相邻像素块的编码参数。例如,在H.264的帧内预测中,可从已经完成以进行编码的相邻块的预测信息导出像素块的预测信息。
编码单元110以由编码控制单元111管理的适当输出时序来输出生成的已编码数据。作为输出已编码数据的各种信息例如被该图等中未示出的复用单元等复用,并临时地存储在该图等中未示出的输出缓冲器等中,并且然后例如输出到存储系统(存储介质)或传输系统(通信线路)。
编码单元110包括熵编码单元110A和索引重配置单元110B。
熵编码单元110A对已经输入的信息执行诸如可变长度编码或算术编码之类的编码处理。例如,在H.264中,使用基于上下文的自适应可变长度编码(CAVLC)、基于上下文的自适应二级制算术编码(CABAC)等。
为了减小从索引设置单元108输入的索引信息的语法元素的代码长度,索引重配置单元110B基于语法元素的参数特性来执行预测处理,计算语法元素的值(直接值)与预测值之间的差值,并将该差输出到熵编码单元110A。稍后将描述预测处理的特定示例。另外,在其中由编码单元110导出加权因数的选择范围的情况下,由索引重配置单元110B来执行预测处理。
图15是图示出根据第一实施例的编码设备100所使用的语法500的示例的图。语法500图示出通过使用编码设备100对输入图像(运动图像数据)进行编码而生成的已编码数据的结构。当已编码数据被解码时,稍后要描述的解码设备通过参考与语法500的相同的语法结构来执行运动图像数据的语法分析。
语法500包括三个部分,包括高级语法501、切片级语法502和编码树级语法503。高级语法501包括具有高于切片的水平的上层的语法信息。该语法信息例如包括在图2B中所示的示例中描述的瓦片状划分的信息。在这里,切片表示包括在帧或字段中的矩形区域或连续区域。切片级语法502包括将每个切片解码所需的信息。编码树级语法503包括将每个编码树(换言之,每个编码树块)解码所需的信息。这些部分中的每一个包括更详细的语法。
高级语法501包括序列和画面级的语法,诸如序列参数集语法504、画面参数集语法505和自适应参数集语法506。
切片级语法502包括切片报头语法507、预测权值表语法508、切片数据语法509等。预测权值表语法508是从切片报头语法507调用的。
编码树级语法503包括编码树单元语法510、变换单元语法511、预测单元语法512等。编码树单元语法510可具有四叉树结构。更具体地,可进一步递归地调用编码树单元语法510作为编码树单元语法510的语法元素。换言之,可将一个编码树块再分成四叉树。另外,变换单元语法511被包括在编码树单元语法510中。变换单元语法511被从位于四叉树的尾端处的每个编码树单元语法510调用。在变换单元语法511中,描述了关于逆正交变换、量化等信息。在该语法中,可描述关于加权运动补偿预测的信息。
图16是图示出根据第一实施例的画面参数集语法505的示例的图。在这里,例如weighted_pred_flag是表示用于P切换的根据第一实施例的加权补偿预测的有效性或无效性的语法元素。在其中weighted_pred_flag是“0”的情况下,P切片内的根据第一实施例的加权运动补偿预测是无效的。相应地,包括在WP参数信息中的WP应用标志被恒定地设置成“0”,并且WP选择器304和305的输出端被连接到默认运动补偿单元301。另一方面,在其中weighted_pred_flag是“1”的情况下,P切片内的根据第一实施例的加权运动补偿预测是有效的。
作为另一示例,在其中weighted_pred_flag是“1”的情况下,可针对下层的语法中的切片内的每个局部区域(切片报头、编码树块、变换单元、预测单元等)定义根据第一实施例的加权运动补偿预测的有效性或无效性。
另外,weighted_bipred_idc例如是表示用于B切片的根据第一实施例的加权补偿预测的有效性或无效性的语法元素。在其中weighted_bipred_idc是“0”的情况下,B切片内的根据第一实施例的加权运动补偿预测是无效的。相应地,包括在WP参数信息中的WP应用标志被恒定地设置成“0”,并且WP选择器304和305的输出端被连接到默认运动补偿单元301。另一方面,在其中weighted_bipred_idc是“1”的情况下,B切片内的根据第一实施例的加权运动补偿预测是有效的。
作为另一示例,在其中weighted_bipred_idc是“1”的情况下,可针对下层的语法中的切片内的每个局部区域(切片报头、编码树块、变换单元、预测单元等)定义根据第一实施例的加权运动补偿预测的有效性或无效性。
图17是图示出根据第一实施例的切换报头语法507的示例的图。在这里,切片类型表示切片的类型(I切片、P切片、B切片等)。另外,pic_parameter_set_id是表示被称为505的画面参数集语法的标识符。num_ref_idx_active_override_flag是表示是否要更新有效参考图像的数目的标志,并且在其中此标志是“1”的情况下,可使用定义参考列表的参考图像的数目的num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1。另外,pred_weight_table()是表示被用于加权运动补偿预测的预测权值表语法的函数,并且此函数在其中weighted_pred_flag在P切片的情况下为“1”的情况下和其中weighted_bipred_idc在B切片的情况下是“1”的情况下被调用。
图18是图示出根据第一实施例的预测权值表语法508的示例的图。在这里,luma_log2_weight_denom表示切片中的辉度信号的加权因数的固定小数点精度(LWD),并且是对应于在数值表达式(7)或(9)中表示的LWD的值。另外,delta_chroma_log2_weight_denom表示切片中的色差信号的固定小数点精度,并且稍后将描述其导出方法。chroma_format_idc是表示色彩空间的标识符,并且MONO_IDX是表示单色视频的值。另外,num_ref_common_active_minus1表示通过用包括在切片中的公共列表中的参考图像的数目减去一而获取的值。
luma_weight_l0_flag和luma_weight_l1_flag表示对应于列表0和1的辉度信号的WP应用标志。在其中此标志是“1”的情况下,根据第一实施例的辉度信号的加权运动补偿预测对于切片内的所有区域而言是有效的。另外,chroma_weight_l0_flag和chroma_weight_l1_flag表示对应于列表0和1的色差信号的WP应用标志。在其中此标志是“1”的情况下,根据第一实施例的色差信号的加权运动补偿预测对于切片内的所有区域而言是有效的。luma_weight_10[i]和luma_weight_11[i]是由列表0和1管理的辉度信号的加权因数,其对应于第i参考编号。另外,luma_offset_10[i]和luma_offset_11[i]是由列表0和1管理的辉度信号的偏移,其对应于第i参考编号。这些是对应于在数值表达式(7)或(9)中表示的w0C、w1C、o0C、o1C的值。这里,C=Y.
chroma_weight_10[i][j]和chroma_weight_11[i][j]是由列表0和1管理的色差信号的加权因数,其对应于第i参考编号。另外,chroma_offset_l0[i][j]和chroma_offset_11[i][j]是由列表0和1管理的色差信号的偏移,其对应于第i参考信号。这些是对应于在数值表达式(7)或(9)中表示的w0C、w1C、o0C、o1C的值。在这里,C=Cr或Cb。另外,j表示色差的分量,并且例如在YUV 4:2:0的信号的情况下,j=0表示Cr分量,并且j=1表示Cb分量。此外,可使用此表示,使得j=0是Cb分量且j=1表示Cr分量。
在这里,将详细地描述与语法配置中的加权预测有关的预测每个语法元素的方法。语法元素的预测是由索引重配置单元110B执行的。在图18中所示的示例中,通过附加前缀“delta”来表示已经引入其预测的每个语法元素。
首先,将描述表示加权因数的固定小数点精度的luma_log2_weight_denom和chroma_log2_weight_denom的帧间信号预测方法。索引重配置单元110B使用数值表达式(12)来执行luma_log2_weight_denom和chroma_log2_weight_denom的帧间信号预测方法,并使用数值表达式(13)来执行恢复处理。在这里,如图18中所示,由于首先定义了luma_log2_weight_denom,所以是基于luma_log2_weight_denom的值来预测chroma_log2_weight_denom。
delta_chroma_log2_weight_deno=(chroma_log2_weight_denom-luma_log2_weight_denom) (12)
chroma_log2_weight_denom=(luma_log2_weight_denom+delta_chroma_log2_weight_denom) (13)
在衰退效应中,一般地,由于存在其中针对每个色彩空间不同地进行时间变化的少数情况,所以用于每个信号分量的固定小数点精度与辉度分量和色差分量具有强相关性。相应地,通过如上所述地在色彩空间内部进行预测,能够减少表示固定小数点精度的信息量。
在数值表达式(12)中,虽然用色差分量减去辉度分量,但可用辉度分量减去色差分量。在这种情况下,可根据数值表达式(12)来改变数值表达式(13)。
接下来,将描述预测表示辉度和色差信号的加权因数的luma_weight_1x[i]和chroma_weight_1x[i][j]的方法。在这里,x是表示“0”或“1”的标识符。luma_weight_1x[i]和chroma_weight_1x[i][j]的值根据luma_log2_weight_denom和chroma_log2_weight_denom的值而改变。例如,在其中luma_log2_weight_denom的值是“3”的情况下,luma_weight_1x[i]在其中假设像素值不变化的情况下是(1<<3)。另一方面,在其中luma_log2_weight_denom的值是“5”的情况下,luma_weight_1x[i]在其中假设亮度不变化的情况下是(1<<5)。
相应地,索引重配置单元110B在使用不存在像素值变化的情况的加权因数作为参考系数(默认值)的情况下执行预测处理。更具体地,索引重配置单元110B使用数值表达式(14)和(15)来执行luma_weight_lx[i]的预测处理,并使用数值表达式(16)来执行恢复处理。同样地,索引重配置单元110B使用数值表达式(17)和(18)来执行chroma_weight_lx[i]的预测处理并使用数值表达式(19)来执行恢复处理。
delta_luma_weight_lx[i]=(luma_weight_lx[i]-default_luma_weight_lx)(14)
default_luma_weight_lx=(1<<luma_log2_weight_denom)
(15)
luma_weight_lx[i]=(default_luma_weight_lx+delta_luma_weight_lx[i])(16)
delta_chroma_weight_lx[i][j]=(chroma_weight_lx[i][j]-default_chroma_weight_lx) (17)
default_chroma_weight_lx=(1<<chroma_log2_weight_denom)
(18)
chroma_weight_lx[i][j]=(default_chroma_weight_lx+delta_chroma_weight_lx[i][j]) (19)
在这里,default_luma_weight_1x、default_chroma_weight_1x是其中不存在辉度分量和色差分量的像素值变化的情况的参考值(默认值)。
包括衰退效应的图像在特定衰退变化点处衰退,并且存在其中其他图像是普通自然图像或不具有衰退效应的图像的许多情况。在这种情况下,存在加权因数采取不存在像素值变化的情况的许多情况。相应地,基于固定小数点精度而导出其中不存在像素值变化的情况的初始值并将其用作预测值,由此能够减少加权因数的代码量。
接下来,将描述表示色差信号的偏移的chroma_offset_1x[i][j]的预测方法。在YUV的色彩空间中,色差分量表示使用与中值的偏差的量来表示色彩。相应地,能够使用加权因数将基于随所考虑中值的像素值变化的变化量设置为预测值。更具体地,索引重配置单元110B使用数值表达式(20)和(21)来执行chroma_offset_1x[i][j]的预测处理并使用数值表达式(22)来执行恢复处理。
delta_chroma_offset_lx[i][j]=(chroma_offset_lx[i][j]+((MED*chroma_weight_lx[i][j])>>chroma_log2_weight_denom)-MED)(20)
MED=(MaxChromaValue>>1)(21)
在这里,MaxChromaValue表示获得色差信号的最大像素值。例如,在8位信号的情况下,MaxChromaValue是255,并且MED是128。
chroma_offset_lx[i][j]=(delta_chroma_offset_lx[i][j]-((MED*chroma_weight_lx[i][j])>>chroma_log2_weight_denom)+MED)(22)
通过引入通过使用色差信号的特性来考虑与中值的偏差量而获取的预测值,色差信号的偏移值的代码量比其中直接对偏移值进行编码的情况的小。
图19是图示出根据第一实施例的语法值的关系的示例且图示出luma_log2_weight_denom、default_luma_weight_1x、luma_weight_1x[i]以及delta_luma_weight_1x[i]的值的关系的说明图。如图19中所示,作为将被熵编码单元110A编码的语法元素的delta_luma_weight_1x[i]的范围、换言之加权因数之间的差值被固定于-128至127的范围且具有有符号的8位精度。
如上所述,在第一实施例中,通过在加权因数的参考点(在该点处像素值的变化是零)被设置为近似中心的情况下分配在负和正方向上的值而导出加权因数的选择范围,并且检查该加权因数被包括在加权因数的导出选择范围内。因此,根据第一实施例,与H.264等的情况相比,加权因数的选择范围扩展,并且能够容易地采取具有高选择频率的正侧值。另外,根据第一实施例,由于编码目标的加权因数之间的差值采取-128至127的有符号的8位值作为固定值,所以能够在扩展加权因数的选择范围的同时定义有符号的8位精度的选择范围。
如上所述,在第一实施例中,由于要编码的语法的范围(加权因数之间的差值)能够具有固定值,所以与其中编码器动态地改变此类范围的配置相比,能够简化规范。例如,在其中将要编码的语法设置为加权因数且加权因数的选择范围根据加权因数的参考值而变的情况下,需要其中准备使加权因数的参考值与加权因数的选择范围的最小值和最大值相关联的表格,且每当导出加权因数的选择范围时参考该表格的配置,或其中每次计算以导出加权因数的选择范围的配置。在这种情况下,需要用于每当表格被加载到存储器中时参考表格的配置或每次被用于计算加权因数的选择范围的计算电路的配置,由此硬件尺度增加。与此相反,根据第一实施例,由于能够将要编码的语法的范围(加权因数之间的差值)配置为固定值,所以能够在不具有上述硬件配置等的限制的情况下减小硬度尺度。
另外,在第一实施例中,虽然对其范围被固定于有符号的8位精度的加权因数之间的差值进行编码,但加权之间的差值采取接近范围的中心(接近于零)的值,并且相应地,能够缩短编码时的代码长度,由此能够改善编码效率。在H.264等中,虽然用有符号指数Golomb编码(se(v))对加权因数进行编码,但此编码对于其值将被指数编码的随着被用作参考的零而增加的符号而言是有效的,并且相应地,一般地,具有最高使用频率的参考值被设置在范围的中心处。在第一实施例中,使用其中一般运动图像的画面之间的像素值变化是零的情况作为加权因数的参考值,并且在用于加权因数的选择范围的预测中同样地,引入了来自参考值的预测。由此,指数Golomb编码预测的选择范围和加权因数相互匹配,并且减少代码量的效果是高的。另外,由于在参考值被设置为中心的情况下确定系数范围,所以即使在其中采取大的值的情况下,正值和负值与参考值的距离程度也是相同,由此存在能够使用比常规技术更短的代码长度来对数据进行编码的优点。
另外,在根据作为示例的第一实施例的图16至18中所示的语法表的各行之间,可插入在本实施例中未定义的语法元素,或者可包括关于另一条件分支的描述。此外,可将语法表划分成多个表格,或者可将多个语法表集成。另外,可任意地改变被表示为示例的每个语法元素的项。
第二实施例
在第二实施例中,将描述对由根据第一实施例的编码设备编码的已编码数据进行解码的解码设备。并且,在第二实施例中,类似于第一实施例,将假设其中不存在像素值的变化的情况、换言之其中加权因数的值在被表示为实值时为1.0的情况来提出以下描述。
图20是图示出根据第二实施例的解码设备800的配置示例的框图。
解码设备800将存储在该图等中未示出的输入缓冲器中的已编码数据解码成已解码图像并将已解码图像输出到图中未示出的输出缓冲器作为输出图像。例如,已编码数据被从图1等中所示的编码设备100输出,并通过该图等中未示出的存储系统、传输系统、缓冲器等输入到解码设备800。
如图20中所示的解码设备800包括:解码单元801、逆量化单元802;逆正交变换单元803;加法单元804;预测图像生成单元805;以及索引设置单元806。逆量化单元802、逆正交变换单元803、加法单元804以及预测图像生成单元806是与图1中所示的逆量化单元104、逆正交变换单元105、加法单元106以及预测图像生成单元107基本上相同或类似的元素。另外,图20中所示的解码控制单元807控制解码设备800,并且例如由CPU等来实现。
为了将已编码数据解码,解码单元801基于用于每个帧或每个字段的语法来执行解码。解码单元801包括熵解码单元801A和索引重配置单元801B。
熵解码单元801A连续地执行每个语法的代码串的熵解码,并重新生成包括预测模式、运动矢量以及参考编号的运动信息、被用于预测加权运动补偿预测的索引信息以及诸如量化变换系数之类的编码目标块的编码参数等。另外,熵解码也称为解析处理等。在这里,编码参数是对上述那些以及其他关于变换系数的信息、关于量化的信息等进行解码所需的全部参数。
更具体地,熵解码单元801A具有用于对输入已编码数据执行诸如可变长度解码处理或算术解码处理之类的解码处理的功能。例如,在H.264中,使用基于上下文的自适应可变长度编码(CAVLC)、基于上下文的自适应二进制算术编码(CABAC)等,并将输入已编码数据解码成具有意义的语法元素。此类处理也称为解码处理。
索引重配置单元801B通过恢复已解码索引信息来重配置索引信息。更具体地,为了减小已解码索引信息的语法元素的代码长度,索引重配置单元801B根据语法元素的参数特性来执行预测处理,恢复元素元素,并重配置索引信息。稍后将描述预测处理的特定示例。
解码单元801输出运动信息、索引信息和量化变换系数,从而将量化变换系数输入到逆量化单元802,将索引信息输入到索引设置单元806,并且将运动信息输入到预测图像生成单元805。
逆量化单元802对从解码单元801输入的量化变换系数执行逆量化处理并获取恢复变换系数。更具体地,逆量化单元802基于解码单元801所使用的量化信息来执行逆量化。更详细地描述,逆量化单元802将量化变换系数乘以基于量化信息导出的量化步幅,从而获取恢复变换系数。逆量化单元802输出已恢复变换系数,从而使其被输入到逆正交变换单元803。
逆正交变换单元803对从逆量化单元802输入的已恢复变换系数执行逆正交变换,其对应于在编码侧执行的正交变换,从而获取已恢复预测误差。逆正交变换单元803输出已恢复预测误差从而使其被输入到加法单元804。
加法单元804将从逆正交变换单元803输入的已恢复预测误差与相应的预测图像相加,从而生成已解码图像。加法单元804输出已解码图像,从而使其被输入到预测图像生成单元805。另外,加法单元804将已解码图像作为输出图像输出到外部。然后,该输出图像被临时地存储在该图等中未示出的外部输出缓冲器等中,并且被例如以由解码控制单元807管理的输出时序输出到诸如该图等中未示出的显示器或监视器之类的显示设备系统或视频设备系统。
索引设置单元806接收从解码单元801输入的索引信息,将该索引信息转换成WP参数信息,并输出WP参数信息从而使其被输入到预测图像生成单元805。更具体地,索引设置单元806接收已被处理以由熵解码单元801A解码的索引信息并被索引重配置单元801B重配置。然后,索引设置单元806检查参考图像列表和参考编号,将索引信息转换成WP参数信息,并将已转换WP参数信息输出到预测图像生成单元805。当索引信息被转换成WP参数信息时,索引设置单元806导出加权因数的选择范围并检查该加权因数被包括在选择范围内。在这里,加权因数的选择范围的导出与第一实施例的相同,并且因此将不会提出其详细描述。另外,可不是由索引设置单元806而是由索引重配置单元801B来执行选择范围的导出。
另外,类似于第一实施例,WP参数信息包括第一WP应用标志、第二WP应用标志以及加权信息的信息。此外,类似于第一实施例,加权信息包括第一加权因数的值w0C、第二加权因数的值w1C、第一和第二加权因数的固定小数点精度LWD、第一偏移o0C以及第二偏移o1C的信息。
预测图像生成单元805通过使用从解码单元801输入的运动该信息、从索引设置单元806输入的WP参数信息以及从加法单元804输入的已解码图像来生成预测图像。
在这里,将参考图4来详细地描述预测图像生成单元805。类似于预测图像生成单元107,预测图像生成单元805包括:多帧运动补偿单元201;存储器202;单向运动补偿单元203;预测参数控制单元204;参考图像选择器205;帧存储器206;以及参考图像控制单元207。
帧存储器206在参考图像控制单元207的控制下将从加法单元106输入的已解码图像存储为参考图像。帧存储器206包括被用于临时地存储参考图像的多个存储器组FM1至FMN(在这里,N≥1)。
预测参数控制单元204基于从解码单元801输入的运动信息将每一个由参考图像编号和预测参数构成的多个组合制为表格。在这里,运动信息表示运动矢量、参考图像编号以及诸如单向/双向预测的预测模式的信息,其中运动矢量表示运动的偏差,运动的偏差被用于运动补偿预测。预测参数表示关于运动矢量和预测模式的信息。然后,预测参数控制单元204选择被用于基于运动信息生成预测图像的参数编号和预测参数的组合,并输出所选组合,从而允许参考图像编号被输入到参考图像选择器205并允许预测参数被输入到单向运动补偿单元203。
参考图像选择器205是改变帧存储器FM1至FMN的输出端子中的一个的开关,其被包括在帧存储器206中,将基于从预测参数控制单元204输入的参考图像编号而被开关。例如,当参考图像编号为“0”时,参考图像选择器205将帧存储器FM1的输出端子连接至参考图像选择器205的输出端子,并且当参考图像编号是N-1时,参考图像选择器205将帧存储器FMN的输出端子连接到参考图像选择器205的输出端子。参考图像选择器205输出存储于来自包括在帧存储器206中的帧存储器FM1至FMN之中的、其输出端子被连接到参考图像选择器205的帧存储器中的参考图像,从而使其被输入到单向运动补偿单元203。在解码设备800中,参考图像未被除预测图像生成单元805之外的任何单元使用,并且相应地,不需要将参考图像输出到预测图像生成单元805的外部。
单向运动补偿单元203基于从预测参数控制单元204输入的预测参数和从参考图像选择器205输入的参考图像来执行运动补偿预测处理,从而生成单向预测图像。已参考图5描述了运动补偿预测,并且因此将不会提出其描述。
单向运动补偿单元203输出单向预测图像,并临时地将单向预测图像存储在存储器202中。在这里,在其中运动信息(预测参数)表示双向预测的情况下,多帧运动补偿单元201使用两种单向预测图像来进行加权预测。相应地,单向运动补偿单元203将单向预测图像中的对应于第一类型的单向预测图像存储在存储器202中,并将对应于第二类型的单向预测图像直接地输出到多帧运动补偿单元201。在这里,将对应于第一类型的单向预测图像称为第一预测图像,并且将对应于第二类型的单向预测图像称为第二预测图像。
另外,可准备两个单向运动补偿单元203且其生成两个单向预测图像。在这种情况下,当运动信息(预测参数)表示单向预测时,单向运动补偿单元203可将第一单向预测图像作为第一预测图像直接地输出到多帧运动补偿单元201。
多帧运动补偿单元201通过使用从存储器202输入的第一预测图像、从单向运动补偿单元203输入的第二预测图像以及从运动评估单元109输入的WP参数信息来进行加权预测,从而生成预测图像。多帧运动补偿单元201输出预测图像,从而使其被输入到加法单元804。
在这里,将参考图6来详细地描述多帧运动补偿单元201。类似于预测图像生成单元107,多帧运动补偿单元201包括:默认运动补偿单元301;加权运动补偿单元302;WP参数控制单元303;以及WP选择器304和305。
WP参数控制单元303基于从索引设置单元806输入的WP参数信息而输出WP应用标志和加权信息,从而将WP应用标志输入到WP选择器304和305并将加权信息输入到加权运动补偿单元302。
详细地描述,当从索引设置单元806输入WP参数信息时,WP参数控制单元303在WP参数信息被划分成第一WP应用标志、第二WP应用标志以及加权信息的情况下将WP参数信息输出,从而将第一WP应用标志输入到WP选择器304,将第二WP应用标志输入到WP选择器305,并将加权信息输入到加权运动补偿单元302。
另外,当输入了WP参数信息时,WP参数控制单元303检查加权信息的值是否在规定范围内。例如,在其中w0C是3.0的情况下,当表示为实值时且LWD是7时,第一加权因数是384。在这里,假设384在第一加权因数的范围之外且不能使用。在这种情况下,数据违背规范,并且相应地,WP参数控制单元303可将表示规范的违背的信息通知解码控制单元807并停止该解码处理。另外,WP参数控制单元303可在第一加权因数的范围内执行裁剪处理并促进解码处理。此外,WP参数控制单元303可将第一WP应用标志的值从1变成0,并执行默认运动补偿预测。
WP选择器304和305基于从WP参数控制单元303输入的WP应用标志来改变预测图像的连接端。在其中相应WP应用标志是“0”的情况下,WP选择器304和305中的每一个将其输出端连接到默认运动补偿单元301。然后,WP选择器304和305输出第一和第二预测图像,从而使其被输入到默认运动补偿单元301。另一方面,在其中相应WP应用标志是“1”的情况下,WP选择器304和305中的每一个将其输出端连接到加权运动补偿单元302。然后,WP选择器304和305输出第一和第二预测图像,从而使其被输入到加权运动补偿单元302。
默认运动补偿单元301基于从WP选择器304和305输入的两个单向预测图像(第一和第二预测图像)而执行平均处理,从而生成预测图像。更具体地,在其中第一和第二WP应用标志是“0”的情况下,默认运动补偿单元301基于数值表达式(1)来执行平均处理。
另外,在其中运动信息(预测参数)所表示的预测模式是单向预测的情况下,默认运动补偿单元301基于数值表达式(4)仅使用第一预测图像来计算最后预测图像。
加权运动补偿单元302基于从WP选择器304和305输入的两个单向预测图像(第一和第二预测图像)和从WP参数控制单元303输入的加权信息来执行加权运动补偿。更具体地,在其中第一WP应用标志和第二WP应用标志是"1"的情况下,加权运动补偿单元302基于数值表达式(7)来执行加权处理。
另外,在其中第一和第二预测图像的计算精度和预测图像的计算精度相互不同的情况下,加权运动补偿单元302通过如在数值表达式(8)中那样控制LWD(其为固定小数点精度)来实现舍入处理。
另外,在其中用运动信息(预测参数)表示的预测模式是单向预测的情况下,加权运动补偿单元302基于数值表达式(9)仅使用第一预测图像来计算最后预测图像。
另外,在其中第一和第二预测图像的计算精度和预测图像的计算精度相互不同的情况下,加权运动补偿单元302通过如在数值表达式(8)中那样控制LWD(其为固定小数点精度)来实现舍入处理,类似于双向预测的情况。
已参考图7描述了加权因数的固定小数点精度,并且因此将不会提出其描述。另外,在单向预测的情况下,不使用对应于第二预测图像的各种参数(第二WP应用标志、第二加权因数以及第二偏移信息)且可将其设置成预先确定的初始值。
解码单元801使用图15中表示的语法500。语法500表示作为解码单元801的解码目标的已编码数据的结构。已参考图15描述了语法500,并且因此将不会提出其描述。另外,已参考图16描述了画面参数集语法505,只是使用解码而不是编码,并且因此将不会提出其描述。此外,已参考图17描述了切片报头语法507,只是使用解码而不是编码,并且因此将不会提出其描述。另外,已参考图18描述了预测权值表语法508,只是使用解码而不是编码,并且因此将不会提出其描述。
在这里,将详细地描述预测关于语法配置中的加权预测的每个语法元素的方法。语法元素的预测是由索引重配置单元801B执行的。明确地表示根据第二实施例的预测方法的语法配置与第一第二实施例的相同。
在表示加权因数的固定小数点精度的luma_log2_weight_denom和chroma_log2_weight_denom的帧间信号预测方法中,使用数值表达式(13)来执行恢复处理。
在表示辉度和色差信号的加权因数的luma_weight_lx[i]和chroma_weight_lx[i][j]的预测方法中,使用数值表达式(16)和(19)来执行恢复处理。
上述的多个预测方法不仅可独立地使用,而且可以组合方式使用。例如,通过将数值表达式(13)、(15)以及(19)等组合,能够高效地减少索引信息的语法元素的代码量。
如上所述,在第二实施例中,通过在加权因数的参考点(在该点处像素值的变化是零)被设置为近似中心的情况下分配在负和正方向上的值而导出加权因数的选择范围,并且检查该加权因数被包括在加权因数的导出选择范围内。因此,根据第二实施例,与H.264等的情况相比,加权因数的选择范围扩展,并且能够容易地采取具有高选择频率的正侧值。另外,根据第一实施例,由于解码目标的加权因数之间的差值采取-128至127的有符号的8位值作为固定值,所以能够在扩展加权因数的选择范围的同时定义有符号的8位精度的选择范围。
如上所述,在第二实施例中,要解码的语法的范围(加权因数之间的差值)能够具有固定值,解码器能够以简化方式来检查已被解码的已编码数据是否在预定规范的范围内,并且能够简化该规范。例如,在其中要解码的语法被设置为加权因数且加权因数的选择范围根据加权因数的参考值而改变的情况下,需要准备了使加权因数的参考值与加权因数的选择范围的最小值和最大值相关联的表格、且每当导出加权因数的选择范围时参考该表格的配置。在这种情况下,需要用于每当表格被加载到存储器中时参考表格的配置,由此硬件尺度增加。与此相反,根据第二实施例,由于能够将要解码的语法的范围(加权因数之间的差值)配置为具有固定值,所以能够在不具有上述硬件配置等的限制的情况下减小硬度尺度。
另外,在第二实施例中,虽然对其范围被固定于有符号的8位精度的加权因数之间的差值进行解码,但加权之间的差值采取接近范围的中心(接近于零)的值,并且相应地,能够缩短解码时的代码长度,由此能够改善编码效率。在H.264等中,虽然用有符号指数Golomb编码(se(v))对加权因数进行解码,但此编码对于将被解码的其值随着被用作参考的零而指数增加的符号而言是有效的,并且相应地,一般地,具有最高使用频率的参考值被设置在范围的中心处。在第二实施例中,使用其中一般运动图像的画面之间的像素值变化是零的情况作为加权因数的参考值,并且在用于加权因数的选择范围的预测中同样地,引入了来自参考值的预测。由此,指数Golomb编码预测的选择范围和加权因数相互匹配,并且减少代码量的效果是高的。另外,由于在参考值被设置为中心的情况下确定系数范围,所以即使在其中采取大的值的情况下,正值和负值与参考值的距离程度也是相同,由此存在能够使用比常规技术更短的代码长度来对数据进行解码的优点。
第一实施例的修改1
在第一实施例中,虽然已描述了编码设备100的加权因数的选择范围的导出,但在修改1中,将描述编码设备100中的偏移的选择范围的导出。
如参考图数值表达式(20)至(22)所述,在YUV的色彩空间中,色差分量表示使用与中值的偏离量的色彩。相应地,能够将在使用加权因数来考虑中值的情况下的根据像素值变化的变化量设置为预测值。此预测值表示其中不包括加权因数的影响的情况下的偏移的参考值。换言之,索引设置单元108能够通过在预测值(偏移的参考值)被设置为近似中心的情况下分配该值采取的范围来导出偏移的选择范围,并且能够检查偏移被包括在偏移的导出选择范围内。
例如,在其中LWD是2且加权因数的值是5的情况下,加权因数的参考值是(1<<2),换言之为4。另一方面,由于加权因数的值是5,所以发生像素值变化。由于色差信号使用与中值的偏离量来表示色彩,所以索引设置单元108通过排除加权因数的影响来获取偏移的参考值。使用数值表达式(23)来将该偏移的参考值公式化。
Pred=(MED-((MED*chroma_weight_lx[i][j])>>chroma_log2_weight_denom))(23)
在这里,Pred表示色差信号的偏移的参考值,MED表示色差信号的中值(8位的情况下128),并且右项表示由于加权因数的影响而引起的与中值的偏离量。另外,数值表达式(23)对应于通过使数值表达式(20)的右端项的符号反相而获取的值。如在数值表达式(23)中所表示的,基于色差信号的加权因数和固定精度来确定色差信号的偏移的参考值。
另外,可将数值表达式(23)变换为数值表达式(24)。
Pred=((1<<(BitDepth-1))-((chroma_weight_lx[i][j])<<(BitDepth-1-chroma_log2_weight_denom))(24)
在这里,BitDepth表示色差信号的像素深度,并且BitDepth在8位信号的情况下是8。由于在数值表达式(23)中表示的MED是被表示为2的幂的值,因此通过使用BitDepth来重写右侧的移位内部,能够将其表示为数值表达式(24)。
图21是图示出根据修改1的色差信号的偏移的选择范围的示例的说明图。在图21中所示的示例中,将Pred布置成定位于选择范围的近似中心处,(Pred)-(1<<OR)是选择范围的最小值,并且(Pred)+(1<<OR)-1是选择范围的最大值。另外,OR表示偏移的位精度,并且例如在H.264等中是8。如图21中所示,在色差信号的偏移的参考值是近似中心的情况下在预定位精度内定义色差信号的偏移的选择范围。虽然将不提出详细描述,但能够将编码目标的色差信号的偏移之间的差值(色差信号的偏移与色差信号的偏移的参考值之间的差)定义为偏移的位精度的固定值。例如,在8位精度的情况下,色差信号的偏移之间的差值是-128至127的8位固定值。另外,例如,在9位精度的情况下,色差信号的偏移之间的差值是-256至255的9位固定值。
由此,能够解决在不恢复参考值的情况下不确定要编码的值的范围的问题。另外,在修改1中,虽然已描述了其中由索引设置单元108导出色差信号的偏移的选择范围的示例,但选择范围的导出不限于此,而是可由编码单元110来执行。
图22是图示出根据修改1的导出色差信号的偏移的选择范围的处理的示例的流程图。在这里,虽然将描述假设由索引设置单元108执行导出色差信号的偏移的选择范围的处理的情况,如上所述,但可由编码单元110来执行该处理。
首先,索引设置单元108导出加权因数的固定小数点精度LWD(步骤S12)。在这里,索引设置单元108可从WP参数信息或从索引信息导出加权因数的固定小数点精度LWD。
随后,索引设置单元108导出加权因数Wxc(S13)。在这里,索引设置单元108可从WP参数信息或从索引信息导出加权因数Wxc。
随后,索引设置单元108通过使用加权因数的固定精度LWD和已经导出的加权因数Wxc而使用数值表达式(23)来导出色差信号的偏移的参考值(步骤S14)。
随后,索引设置单元108通过用从色差信号的偏移的导出参考值减去(1<<OR)来导出色差信号的偏移的选择范围的最小值(步骤S15)。
随后,索引设置单元108将色差信号的偏移的导出参考值加上(1<<OR)-1,从而导出色差信号的偏移的选择范围的最大值(步骤16)。
然后,索引设置单元108检查色差信号的偏移被包括在色差信号的偏移的导出选择范围内。另外,在检查到色差信号的偏移未被包括在色差信号的偏移的选择范围内的情况下,索引设置单元108可使用色差信号的偏移的选择范围的最大值或最小值来执行裁剪处理。在这种情况下,索引设置单元108可在色差信号的偏移小于选择范围的最小值的情况下将色差信号的偏移裁剪成最小值,并在色差信号的偏移大于选择范围的最大值的情况下将色差信号的偏移裁剪成最大值。通过引入此类裁剪处理,编码目标的值、诸如色差信号的偏移之间的差值在未布置特定范围限制的情况下采取在预定位精度内的值,并且相应地,能够使硬件所使用的电路尺度的配置明了。
另外,如参考图18所述,在偏移的信息之前首先对加权因数的值和固定小数点精度的信息进行编码,当导出偏移的参考值时,能够导出加权因数的值。
此外,可与在第一实施例中描述第一和第二加权因数的选择范围分开地应用在修改1中描述的用于色差信号的第一和第二偏移的选择范围。例如,可将其配置成使得第一和第二加权因数的选择范围在H.264中是相同的,并且第一和第二偏移的选择范围是如修改1的那些。
根据修改1,由于要编码的语法的范围(偏移之间的差值)能够具有固定值,所以与其中编码器动态地改变此类范围的配置相比,能够简化规范。另外,在将要编码的语法设置为偏移且偏移的选择范围根据偏移的参考值而变的情况下,需要其中准备了使偏移的参考值与偏移的选择范围的最小值和最大值相关联的表、并且每当偏移的选择氛围被导出时引用该表的配置,或其中每次计算以导出偏移的选择范围的配置。在这种情况下,需要用于每当表格被加载到存储器中时参考表格的配置或每次被用于计算偏移的选择范围的计算电路,由此硬件尺度增加。与此相反,在其中要编码的语法的范围(偏移之间的差值)如在修改1中那样被固定的情况下,能够在不具有上文所述的硬件配置的限制等的情况下减小硬件尺度。
第二实施例的修改1
在第二实施例中,虽然已描述了解码设备800的加权因数的选择范围的导出,但在第二实施例的修改1中,将描述解码设备800中的偏移的选择范围的导出。在第二实施例的修改1中,索引设置单元806能够在预定值(偏移的参考值)被设置为近似中心的情况下通过分配由该值采取的范围来导出偏移的选择范围,并且能够检查该偏移被包括在偏移的导出选择范围内。偏移的选择范围的导出与第一实施例的修改1相同,并且因此将不会提出其详细描述。另外,偏移的选择范围的导出可不由索引设置单元806执行,而是由索引重配置单元801B执行。
根据第二实施例的修改1,由于要编码的语法的范围(偏移之间的差值)能够具有固定值,所以与其中编码器动态地改变此类范围的配置相比,能够简化规范。另外,在其中将要编码的语法设置为偏移且偏移的选择范围根据偏移的参考值而变的情况下,需要准备了使偏移的参考值与偏移的选择范围的最小值和最大值相关联的表、且每当导出偏移的选择范围时参考该表的配置,或每次计算以导出偏移的选择范围的配置。在这种情况下,需要用于每当表格被加载到存储器中时参考表格的配置或每次被用于计算偏移的选择范围的计算电路,由此增加硬件尺度。与此相反,在其中要编码的语法的范围(偏移之间的差值)如在修改1中那样被固定的情况下,能够在不具有上文所述的硬件配置的限制等的情况下减小硬件尺度。
第一实施例的修改2
在第一实施例中,虽然已描述了编码设备100的加权因数的选择范围的导出,但在修改2中,将描述其中当在编码设备100中导出加权因数的选择范围时加权因数的选择范围被移位的示例。
在第一实施例中,如参考图9所述,加权因数的选择范围的近似中心被设置为加权因数的参考值。另外,如参考图7等所述,在其中平均起来不存在图像之间的像素值变化的情况下,加权因数的值在被表示为实值时为1.0,并且在单向加权预测中未选择其中加权因数为负的范围。由此,应理解的是在实际上被操作的加权因数的选择范围内,参考值附近的选择的频率是最高的,并且负范围使用得不多。相应地,在修改2中,索引设置单元108在导出加权因数的选择范围时使加权因数的选择范围向正侧移位。
图23是图示出根据修改2的加权因数的选择范围的示例的说明图。在图23中所示的示例中,不同于参考图9所述的加权因数的选择范围,将通过将加权因数的参考值(1<<LWD)加上移位值SHFT获取的新参考值((1<<LWD)+SHFT)布置成位于选择范围的近似中心处,并且通过用此值减去128而获取的值(-128+(1<<LWD)+SHFT)是选择范围的最小值,并且通过将此值加上127而获取的值(127+(1<<LWD)+SHFT)是选择范围的最大值。这时,虽然存在其中最大值基于固定小数点精度LWD的值而大于255的情况,但索引设置单元108可在最大值被设置成255的情况下执行裁剪处理,或者可改变针对每个固定小数点而言能够采取的SHFT的值。另外,在修改2中,虽然已描述了其中由索引设置单元108来导出加权因数的选择范围的示例,但选择范围的导出不限于此,而是可以由编码单元110来执行。
图24是图示出根据修改2的导出加权因数的选择范围的处理示例的流程图。在这里,虽然描述了假设由索引设置单元108执行导出加权因数的选择范围的处理的情况,如上所述,但可由编码单元110来导出选择范围。
首先,索引设置单元108导出加权因数的固定小数点精度LWD(步骤S22)。在这里,索引设置单元108可从WP参数信息或从索引信息导出加权因数的固定小数点精度LWD。
随后,索引设置单元108通过使用已导出的固定小数点精度LWD和移位值SHFT来导出加权因数的参考值(1<<LWD+SHFT)(步骤S23)。
随后,索引设置单元108用加权因数的导出参考值((1<<LWD)+SHFT)减去128,从而导出加权因数的选择范围的最小值(步骤S24)。
随后,索引设置单元108将加权因数的导出参考值((1<<LWD)+SHFT)加上127,从而导出加权因数的选择范围的最大值(步骤S25)。
然后,索引设置单元108检查加权因数被包括在加权因数的导出选择范围内。另外,在检查到加权因数未被包括在加权因数的导出选择范围中的情况下,索引设置单元108可使用加权因数的选择范围的最大值或最小值来执行裁剪处理。在这种情况下,索引设置单元108可在其中加权因数小于选择范围的最小值的情况下将加权因数裁剪成最小值,并在其中加权因数大于选择范围的最大值的情况下将加权因数裁剪成最大值。通过引入此类裁剪处理,编码目标的值、诸如加权因数之间的差值在未布置特定范围限制的情况下采取在预定位精度内的值,并且相应地,能够使硬件所使用的电路尺度的配置明了。
如上所述,在修改2中,在加权因数的选择范围内,在负方向和正方向上分配各值,其中以考虑加权因数的变化的预定值移位的参考值被设置为中心,要编码的值的范围能够是固定的。
第二实施例的修改2
在第二实施例中,虽然将加权因数的选择范围描述为在解码设备800中导出,但在第二实施例的修改2中,将描述其中当在解码设备800中导出加权因数的选择范围时加权因数的选择范围移位的示例。在第二实施例的修改2中,索引设置单元806在导出加权因数的选择范围时使加权因数的选择范围移位。加权因数的选择范围的导出与第一实施例的修改2相同,并且因此将不会提出其详细描述。另外,加权因数的选择范围并不是由索引设置单元806而是由索引重配置单元801B导出。
如上所述,在第二实施例的修改2中,在加权因数的选择范围内,在负方向和正方向上分配各值,其中以考虑加权因数的变化的预定值移位的参考值被设置为中心,要解码的值的范围能够是固定的。
第一实施例的修改3
在修改3中,将描述根据第一实施例的除编码设备100的加权因数的选择范围的导出技术之外的导出技术。
在修改3中,在数值表达式14至16中表示的luma_weight_1x[i]具有固定选择范围,并且delta_luma_weight_1x[i]具有根据LWD的动态选择范围。另外,修改5的加权因数luma_weight_1x[i]的选择范围如图9中所示。
图25是图示出根据修改3的编码目标的加权因数之间的差值的范围的示例的说明图。在图25中所示的示例中,加权因数的差值delta_luma_weight_1x[i]采取有符号的9位值以便执行有符号的8位值的加法或减法。另一方面,加权因数的参考值采取根据固定小数点精度而增加的值,并且加权因数之间的差值趋向于随着固定小数点精度的值增加而向负侧倾斜。
图26是图示出根据修改3的语法元素的值之间的关系的示例的说明图,并且图示出luma_log2_weight_denom、default_luma_weight_1x、luma_weight_1x[i]和delta_luma_weight_1x[i]的值之间的关系。应理解的是如图19中所示,作为由熵编码单元110A编码的语法元素的delta_luma_weight_1x[i](换言之由,加权因数之间的差值采取的范围)趋向于随着表示固定小数点精度的luma_log2_weight_denom的值增加而向负侧倾斜。另外,应理解的是已解码加权因数的值luma_weight_1x[i]具有-128至127的固定范围。
如上所述,根据修改3,要编码的差值的范围被设置成使得已解码加权因数的值具有固定选择范围,并且相应地,即使在其中预测方法改变的情况下,也能够设定与H.264相同的选择范围。
第二实施例的修改3
在第二实施例的修改3中,将描述根据第二实施例的除解码设备800的加权因数的选择范围的导出技术之外的导出技术。然而,根据第二实施例的修改3的加权因数的选择范围的导出技术与第一实施例的修改3相同,并且因此将不会提出其详细描述。
如上所述,根据第二实施例的修改3,要解码的差值的范围被设置成使得加权因数的值具有固定选择范围,并且相应地,即使在其中预测方法改变的情况下,也能够设定与H.264相同的选择范围。
第一实施例的修改4
在修改4中,将描述其中当导出根据第一实施例的修改3的加权因数的选择范围时加权因数的选择范围移位的示例。
在修改4中,虽然索引设置单元108使加权因数之间的差值的范围向正侧移位,但这基本上等效于使解码之后的加权因数的选择范围向正侧移位。
图27是图示出根据修改4的加权因数之间的差值的范围的示例的说明图。与第一实施例的修改3相比,采取在-128至127的8位范围内的值的加权因数之间的差值的范围以SHFT向正侧移位。
图28图示出根据修改4的解码之后的加权因数的选择范围。根据图28,能够理解的是在修改4中,加权因数的范围以差值的移位量向正侧移位。即使在此类配置下,也能够选择按照惯例不能被选择的、LWD为7的情况的参考值。
第二实施例的修改4
在第二实施例的修改4中,将描述其中当导出根据第二实施例的修改3的加权因数的选择范围时使加权因数的选择范围移位的示例。然而,根据第二实施例的修改4的用于使加权因数的选择范围移位的技术与第一实施例的修改4的相同,并且因此将不会提出其详细描述。即使在此类配置下,也能够选择按照惯例不能被选择的、LWD为7的情况的参考值。
第一实施例的修改5
在修改5中,将描述根据第一实施例的修改3和4的其中对加权因数之间的差值执行卷绕处理的示例。
如参考图25所述,加权因数之间的差值是有符号的9位信号(-256至126),并且随着固定小数点精度增加而向负侧倾斜。一般地,使用指数Golomb编码等对加权因数进行熵编码,并且相应地,在其中平衡向正/负侧倾斜的情况下,存在其中编码效率降低的情况。虽然加权因数之间的差值的范围根据固定小数点精度而不同,但固定小数点精度确定的情况的范围是8位。例如,在其中LWD是7的情况下,差值的范围是-256至-1,并且当范围相对于参考0移位时,该范围对应于0至255的8位的值。相应地,索引设置单元110B根据固定小数点精度执行针对有符号9位至无符号8位的卷绕处理。在这种情况下,正方向上的值采取常规值,并且负方向上的值被连接到正值的远端。
图29是图示出根据修改5的加权因数之间的差值的卷绕处理的示例的流程图。
首先,索引重配置单元110B从索引信息导出加权因数的固定小数点精度LWD(步骤S32)。
随后,索引重配置单元110B从索引信息导出加权因数(步骤S33)。
随后,索引重配置单元110B使用导出的固定小数点精度LWD来导出加权因数的参考值(1<<LWD)(步骤S34)。
随后,索引重配置单元110B使用数值表达式(14)来导出加权因数之间的差值(步骤S35)。
随后,索引重配置单元110B基于加权因数的参考值(1<<LWD)来执行卷绕处理,并且通过保持正值并将负值连接到正最大值后面,生成无符号的8位代码(步骤S36)。
然后,由熵编码单元110A对由索引重配置单元110B生成的代码执行熵编码。
如上所述,在修改5中,通过对有符号9位的值执行卷绕处理,能够将值恒定地编码成无符号8位,并且由此不需要布置诸如有符号9位的指数Golomb编码单元之类的硬件。
第二实施例的修改5
在第二实施例的修改5中,将描述第二实施例的修改3和4中的其中对加权因数之间的差值执行卷绕处理的示例。
如参考图25所述,加权因数之间的差值是有符号9位信号(-256至126),并且随着固定小数点精度增加而向负侧倾斜。一般地,使用指数Golomb编码等对加权因数进行熵编码,并且相应地,在其中平衡向正/负侧倾斜的情况下,存在编码效率降低的情况。虽然加权因数之间的差值的范围根据固定小数点精度而不同,但固定小数点精度确定的情况的范围是8位。例如,在其中LWD是7的情况下,差值的范围是-256至-1,并且当范围相对于参考0移位时,该范围对应于0至255的8位的值。相应地,索引重设置单元801B根据固定小数点精度执行针对有符号9位至无符号8位的卷绕处理。在这种情况下,正方向上的值采取常规值,并且负方向上的值被连接到正值的远端。
图30是图示出根据第二实施例的修改5的加权因数的恢复处理的示例的流程图。
首先,索引重配置单元801A通过将已编码数据解码来导出加权因数的固定小数点精度LWD(步骤S42)。
随后,索引重配置单元801A接下来将已编码数据解码,从而将表示加权因数之间的差值的无符号8位代码解码(步骤S43)。
随后,索引重配置单元801B使用导出的固定小数点精度LWD来导出加权因数的参考值(1<<LWD)(步骤S44)。
随后,索引重配置单元801B通过使用加权因数的导出参考值((1<<LWD)来将无符号8位代码恢复成有符号9位之间的差值(步骤S45)。在这里,基于已解码数据来保持小于参考值的值,并且作为参考值或更大的代码被连接到负侧,由此恢复差值。如上所述,导出加权因数之间的恢复差值,并且使用数值表达式(15)来恢复加权因数。
如上所述,在第二实施例的修改5中,通过对有符号9位的值执行卷绕处理,能够将值恒定地编码成无符号8位,并且由此不需要布置诸如有符号9位的指数Golomb编码单元之类的硬件。
修改6
在上述第一和第二实施例中,已描述了其中将帧划分成每个具有16×16像素的尺寸的矩形块并按照从画面的左上块朝向右下块的顺序将其编码/解码的示例(参见图2A)。然而,编码顺序和解码顺序不限于在本示例中所示的那些。例如,可按照从右下侧朝向左上侧的顺序来执行编码和解码,或者可执行编码和解码从而画出从画面的中心朝向画面的边缘的漩涡。另外,可按照从右上侧朝向左下侧的顺序来执行编码和解码,或者可执行编码和解码从而画出从画面的边缘朝向画面的中心的漩涡。在这种情况下,由于可根据编码顺序来参考的相邻像素块的位置改变,所以可将该位置变成可适当使用的位置。
在上述第一和第二实施例中,虽然以作为示例而示出的诸如4×4像素块、8×8像素块、16×16像素块等之类的预测目标块的尺寸来提出本描述,但预测目标块不需要具有均匀块状。例如,预测目标块的尺寸可以是16×8像素块、8×16像素块、8×4像素块、4×8像素块等。另外,不需要将一个编码树块内的所有块尺寸统一,并且可将相互不同的多个块尺寸混合。在其中相互不同的多个块尺寸在一个编码树块内被混合的情况下,用于对划分信息进行编码或解码的代码量根据划分数目的增加而增加。因此,优选的是在考虑划分信息的代码量与局部已编码图像或已解码图像的质量之间的平衡的情况下选择块尺寸。
在上述第一和第二实施例中,为了简化,已针对色彩信号分量提出了某些部分的全面描述而没有将导出辉度信号和色差信号的选择范围的预测处理或方法相互区别。然而,在其中导出选择范围的预测处理或方法在辉度信号与色差信号之间不同的情况,可使用相同的预测方法或相互不同的预测方法。在其中将相互不同的预测方法用于辉度信号和色差信号的情况下,类似于针对辉度信号,可使用针对色差信号选择的预测方法来执行编码或解码。
在上述第一和第二实施例中,为了简化起见,已针对色彩信号分量提出了全面的描述,而没有将辉度信号和色差信号的加权运动补偿预测处理相互区别。然而,在其中辉度信号和色差信号的加权预测处理相互不同的情况下,可使用相同的加权预测方法或相互不同的加权预测方法。在其中将相互不同的加权预测方法用于辉度信号和色差信号的情况下,类似于针对辉度信号,可使用针对色差信号选择的加权预测方法来执行编码或解码。
在上述第一和第二实施例中,在语法配置中所表示的表格的各行之间,可插入在本实施例中未定义的语法元素,并且可包括关于其他条件分支的技术。替换地,可将语法表划分成多个表格,或者可将语法表集成在一起。另外,不需要使用相同的术语,但是可根据所使用的形式任意地改变术语。
如上所述,根据每个实施例和每个修改,通过采用当进行加权运动补偿预测时定义了由语法元素采取的值的范围的配置,根据该配置的值的范围被设置在位精度范围内,并且对具有实际高使用频率的值被给予较短代码长度,解决了将语法元素的冗余信息编码的问题,并且实现了具有高效率的加权运动补偿预测处理。因此,根据每个实施例和每个修改,改善了编码效率,并且改善了主观图像质量。
虽然已描述了本发明的多个实施例,但此类实施例是作为示例而提出的,并且并不用于限制本发明的范围的目的。这些新型实施例能够以其他各种形式来执行,并且在不脱离本发明的概念的范围内能够对其进行各种省略、替换以及改变。这些实施例及其修改属于本发明的范围或概念,并且属于在权利要求和与之等效的范围中所述的本发明。
例如,可在存储在计算机可读存储介质中的情况下提供实现上述每个实施例的处理的程序。作为存储介质,不论何种存储形式,可使用能够存储程序且能够被计算机读取的存储介质,诸如磁盘、光盘(CD-ROM、CD-R、DVD等)、磁光盘(MO等)或半导体存储器.
另外,可将实现每个实施例的处理的程序存储在连接到诸如因特网之类的网络的计算机(服务器)中并通过网络下载到计算机(客户端)。
附图标记列表
100 编码设备
101 减法单元
102 正交变换单元
103 量化单元
104 逆量化单元
105 逆正交变换单元
106 加法单元
107 预测图像生成单元
108 索引设置单元
109 运动评估单元
110 编码单元
110a 熵编码单元
110b 索引重配置单元
111 编码控制单元
201 多帧运动补偿单元
202 存储器
203 单向运动补偿单元
204 预测参数控制单元
205 参考图像选择器
206 帧存储器
207 参考图像控制单元
301 默认运动补偿单元
302 加权运动补偿单元
303 WP参数控制单元
304、305 WP选择器
800 解码设备
801 解码单元
801a 熵解码单元
801b 索引重配置单元
802 逆量化单元
803 逆正交变换单元
804 加法单元
805 预测图像生成单元
806 索引设置单元
807 解码控制单元
Claims (18)
1.一种电子设备,包括:
解码器模块,所述解码器模块配置为:
从编码数据解码用于目标图像的亮度加权因数的第一分母;
根据所述第一分母得到所述亮度加权因数的第一参考值,其中所述第一参考值等于通过将“1”向左移位由所述第一分母指定的至少一个二进制位获得的值;
从所述编码数据解码所述亮度加权因数的第一差值,其中所述第一差值等于所述亮度加权因数与所述第一参考值之间的差的值,其中所述第一差值在-128到+127的固定范围内而与所述第一分母无关;
通过将所述第一参考值和所述第一差值相加得到所述亮度加权因数,其中所述亮度加权因数在(所述第一参考值-128)到(所述第一参考值+127)的范围内;
通过从最大像素值的中值减去获得的值得到所述目标图像的色度偏移的第二参考值,所述获得的值通过将所述中值与色度加权因数相乘以及向右移位由用于所述色度加权因数的第二分母指定的至少一个二进制位两者获得;
从所述编码数据解码所述色度偏移的第二差值,其中所述第二差值等于所述色度偏移与所述第二参考值之间的差的值,其中所述第二差值在-2n到+2n-1的固定范围内;以及
通过将所述第二参考值和所述第二差值相加得到所述色度偏移,其中所述色度偏移在(所述第二参考值-2n)到(所述第二参考值+2n-1)的范围内。
2.根据权利要求1所述的电子设备,其中
所述解码器模块进一步配置为:
从所述编码数据解码第三差值,所述第三差值等于所述第一分母和所述第二分母之间的差的值;以及
通过将所述第一分母和所述第三差值相加得到所述第二分母。
3.根据权利要求1所述的电子设备,其中
所述解码器模块进一步配置为:
根据所述第二分母得到所述色度加权因数的第三参考值,其中所述第三参考值等于通过将“1”向左移位由所述第二分母指定的至少一个二进制位获得的值;
从所述编码数据解码所述色度加权因数的第四差值,其中所述第四差值等于所述色度加权因数和所述第三参考值之间的差的值,其中所述第四差值与所述第二分母无关地在-128到+127的固定范围内;以及
通过将所述第三参考值和所述第四差值相加得到所述色度加权因数,其中所述色度加权因数在(所述第三参考值-128)到(所述第三参考值+127)的范围内。
4.根据权利要求1所述的电子设备,其中
通过将“1”向左移位由所述第一分母指定的所述至少一个二进制位获得的所述值等于当所述目标图像与所述参考图像在亮度上没有差别时使用的特定亮度加权因数。
5.根据权利要求1所述的电子设备,其中
所述解码器模块进一步配置为:
从所述编码数据解码所述目标图像的亮度偏移;
通过至少使用参考图像的亮度分量和所述亮度加权因数的乘法、向右移位由所述第一分母指定的所述至少一个二进制位、以及所述亮度偏移的加法,来得到预测的亮度值;以及
通过至少使用所述参考图像的色度分量和所述色度加权因数的乘法、向右移位由所述第二分母指定的所述至少一个二进制位、以及所述色度偏移的加法,来得到预测的色度值。
6.根据权利要求5所述的电子设备,其中
所述解码器模块进一步配置为:
从所述编码数据解码变换系数;
通过至少使用所述变换系数的逆变换得到预测误差值;以及
通过至少使用所述预测误差值、所述预测的亮度值、以及所述预测的色度值得到解码图像。
7.根据权利要求5所述的电子设备,其中
所述解码器模块进一步配置为:
从所述编码数据解码运动矢量;以及
基于所述运动矢量确定所述参考图像。
8.根据权利要求1-7中任一项所述的电子设备,进一步包括:
接收机模块,所述接收机模块配置为经由通信链路接收所述编码数据;以及
缓冲器,所述缓冲器配置为临时地存储所述编码数据的至少一部分,其中
所述解码器模块进一步配置为:
从所述缓冲器读取所述编码数据的至少一部分;以及
解码所述编码数据中的参数,以及
所述解码器模块为中央处理单元CPU。
9.根据权利要求1-7中任一项所述的电子设备,进一步包括:
接收机模块,所述接收机模块配置为经由通信链路接收所述编码数据;以及
缓冲器,所述缓冲器配置为临时地存储所述编码数据的至少一部分,其中
所述解码器模块进一步配置为:
从所述缓冲器读取所述编码数据的至少一部分;以及
解码所述编码数据中的参数,以及
所述解码器模块为数字信号处理器DSP或现场可编程门阵列FPGA。
10.一种解码方法,包括:
输入编码数据;
从所述编码数据解码用于目标图像的亮度加权因数的第一分母;
根据所述第一分母得到所述亮度加权因数的第一参考值,其中所述第一参考值等于通过将“1”向左移位由所述第一分母指定的至少一个二进制位获得的值;
从所述编码数据解码所述亮度加权因数的第一差值,其中所述第一差值等于所述亮度加权因数与所述第一参考值之间的差的值,其中所述第一差值在-128到+127的固定范围内而与所述第一分母无关;
通过将所述第一参考值和所述第一差值相加得到所述亮度加权因数,其中所述亮度加权因数在(所述第一参考值-128)到(所述第一参考值+127)的范围内;
通过从最大像素值的中值减去获得的值得到所述目标图像的色度偏移的第二参考值,所述获得的值通过将所述中值与色度加权因数相乘以及向右移位由用于所述色度加权因数的第二分母指定的至少一个二进制位两者获得;
从所述编码数据解码所述色度偏移的第二差值,其中所述第二差值等于所述色度偏移与所述第二参考值之间的差的值,其中所述第二差值在-2n到+2n-1的固定范围内;以及
通过将所述第二参考值和所述第二差值相加得到所述色度偏移,其中所述色度偏移在(所述第二参考值-2n)到(所述第二参考值+2n-1)的范围内。
11.根据权利要求10所述的解码方法,其中
所述方法进一步包括:
从所述编码数据解码第三差值,所述第三差值等于所述第一分母和所述第二分母之间的差的值;以及
通过将所述第一分母和所述第三差值相加得到所述第二分母。
12.根据权利要求10所述的解码方法,其中
所述方法进一步包括:
根据所述第二分母得到所述色度加权因数的第三参考值,其中所述第三参考值等于通过将“1”向左移位由所述第二分母指定的至少一个二进制位获得的值;
从所述编码数据解码所述色度加权因数的第四差值,其中所述第四差值等于所述色度加权因数和所述第三参考值之间的差的值,其中所述第四差值与所述第二分母无关地在-128到+127的固定范围内;以及
通过将所述第三参考值和所述第四差值相加得到所述色度加权因数,其中所述色度加权因数在(所述第三参考值-128)到(所述第三参考值+127)的范围内。
13.根据权利要求10所述的解码方法,其中
通过将“1”向左移位由所述第一分母指定的所述至少一个二进制位获得的所述值等于当所述目标图像与所述参考图像在亮度上没有差别时使用的特定亮度加权因数。
14.根据权利要求10所述的解码方法,其中
所述方法进一步包括:
从所述编码数据解码所述目标图像的亮度偏移;
通过至少使用参考图像的亮度分量和所述亮度加权因数的乘法、向右移位由所述第一分母指定的所述至少一个二进制位、以及所述亮度偏移的加法,来得到预测的亮度值;以及
通过至少使用所述参考图像的色度分量和所述色度加权因数的乘法、向右移位由所述第二分母指定的所述至少一个二进制位、以及所述色度偏移的加法,来得到预测的色度值。
15.根据权利要求14所述的解码方法,其中
所述方法进一步包括:
从所述编码数据解码变换系数;
通过至少使用所述变换系数的逆变换得到预测误差值;以及
通过至少使用所述预测误差值、所述预测的亮度值、以及所述预测的色度值得到解码图像。
16.根据权利要求14所述的解码方法,其中
所述方法进一步包括:
从所述编码数据解码运动矢量;以及
基于所述运动矢量确定所述参考图像。
17.根据权利要求10-16中任一项所述的解码方法,其中所述方法包括:
通过接收机模块经由通信链路接收所述编码数据;
通过缓冲器临时地存储所述编码数据的至少一部分;
通过解码器模块从所述缓冲器读取所述编码数据的至少一部分;以及
通过所述解码器模块解码所述编码数据中的参数,其中
所述解码器模块为中央处理单元CPU。
18.根据权利要求10-16中任一项所述的解码方法,其中所述方法包括:
通过接收机模块经由通信链路接收所述编码数据;
通过缓冲器临时地存储所述编码数据的至少一部分;
通过解码器模块从所述缓冲器读取所述编码数据的至少一部分;以及
通过所述解码器模块解码所述编码数据中的参数,其中
所述解码器模块为数字信号处理器DSP或现场可编程门阵列FPGA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710102184.6A CN106791833B (zh) | 2012-06-27 | 2012-06-27 | 编码方法、解码方法、编码设备以及解码设备 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710102184.6A CN106791833B (zh) | 2012-06-27 | 2012-06-27 | 编码方法、解码方法、编码设备以及解码设备 |
PCT/JP2012/066410 WO2014002217A1 (ja) | 2012-06-27 | 2012-06-27 | 符号化方法、復号方法、符号化装置、及び復号装置 |
CN201280042152.7A CN103765897B (zh) | 2012-06-27 | 2012-06-27 | 编码设备、解码设备、编码方法以及解码方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280042152.7A Division CN103765897B (zh) | 2012-06-27 | 2012-06-27 | 编码设备、解码设备、编码方法以及解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106791833A true CN106791833A (zh) | 2017-05-31 |
CN106791833B CN106791833B (zh) | 2019-10-11 |
Family
ID=49782448
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710102187.XA Active CN106899849B (zh) | 2012-06-27 | 2012-06-27 | 一种电子设备和解码方法 |
CN201280042152.7A Active CN103765897B (zh) | 2012-06-27 | 2012-06-27 | 编码设备、解码设备、编码方法以及解码方法 |
CN201710102184.6A Active CN106791833B (zh) | 2012-06-27 | 2012-06-27 | 编码方法、解码方法、编码设备以及解码设备 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710102187.XA Active CN106899849B (zh) | 2012-06-27 | 2012-06-27 | 一种电子设备和解码方法 |
CN201280042152.7A Active CN103765897B (zh) | 2012-06-27 | 2012-06-27 | 编码设备、解码设备、编码方法以及解码方法 |
Country Status (12)
Country | Link |
---|---|
US (9) | US9462291B2 (zh) |
EP (5) | EP3506639B1 (zh) |
JP (1) | JP5925801B2 (zh) |
KR (2) | KR101624059B1 (zh) |
CN (3) | CN106899849B (zh) |
AU (1) | AU2012383769B2 (zh) |
BR (1) | BR112014004652B1 (zh) |
CA (4) | CA2971911C (zh) |
MX (2) | MX353824B (zh) |
RU (1) | RU2609063C2 (zh) |
SG (1) | SG11201400296RA (zh) |
WO (1) | WO2014002217A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111886867A (zh) * | 2018-01-09 | 2020-11-03 | 夏普株式会社 | 运动矢量推导装置、运动图像解码装置以及运动图像编码装置 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101624058B1 (ko) | 2011-10-17 | 2016-05-24 | 가부시끼가이샤 도시바 | 암호화 장치 및 암호화 방법 |
US9473769B2 (en) | 2012-06-08 | 2016-10-18 | Texas Instruments Incorporated | Method and system for reducing slice header parsing overhead in video coding |
CN106899849B (zh) | 2012-06-27 | 2019-08-13 | 株式会社东芝 | 一种电子设备和解码方法 |
WO2015069734A1 (en) | 2013-11-05 | 2015-05-14 | Arris Enterprises, Inc. | Bit depth variable for high precision data in weighted prediction syntax and semantics |
KR20160065939A (ko) * | 2013-11-05 | 2016-06-09 | 애리스 인터프라이지즈, 인크. | 고정밀도 데이터에 대한 비트 심도 변수를 이용한 가중화된 예측 신택스 및 시맨틱들의 간략화된 프로세싱 |
GB2525648C (en) * | 2014-05-01 | 2019-10-09 | Imagination Tech Ltd | Approximating functions |
GB2547052B (en) * | 2016-02-08 | 2020-09-16 | Canon Kk | Methods, devices and computer programs for encoding and/or decoding images in video bit-streams using weighted predictions |
WO2018037919A1 (ja) * | 2016-08-26 | 2018-03-01 | シャープ株式会社 | 画像復号装置、画像符号化装置、画像復号方法、および画像符号化方法 |
EP3550834A1 (en) * | 2018-04-06 | 2019-10-09 | Comcast Cable Communications LLC | Encoding of video cross-fades using weighted inter-prediction |
CN111083484B (zh) | 2018-10-22 | 2024-06-28 | 北京字节跳动网络技术有限公司 | 基于子块的预测 |
WO2020084475A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Utilization of refined motion vector |
CN111436227B (zh) | 2018-11-12 | 2024-03-29 | 北京字节跳动网络技术有限公司 | 在视频处理中使用组合帧间-帧内预测 |
JP7241870B2 (ja) | 2018-11-20 | 2023-03-17 | 北京字節跳動網絡技術有限公司 | 部分的な位置に基づく差分計算 |
CN113170097B (zh) | 2018-11-20 | 2024-04-09 | 北京字节跳动网络技术有限公司 | 视频编解码模式的编解码和解码 |
EP3915259A4 (en) | 2019-03-06 | 2022-03-30 | Beijing Bytedance Network Technology Co., Ltd. | USE OF A CONVERTED UNIVERSITY PREDICTION CANDIDATE |
EP3939275A4 (en) * | 2019-03-11 | 2022-06-22 | Telefonaktiebolaget Lm Ericsson (Publ) | VIDEO ENCODING WITH GOP-BASED TEMPORAL FILTRATION |
KR20230169434A (ko) | 2019-04-02 | 2023-12-15 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 디코더 측 움직임 벡터 유도 |
WO2020224613A1 (en) * | 2019-05-07 | 2020-11-12 | Beijing Bytedance Network Technology Co., Ltd. | Unified calculation method for inter prediction with refinement |
EP4011077A4 (en) | 2019-09-13 | 2022-11-30 | Beijing Bytedance Network Technology Co., Ltd. | SAMPLE WEIGHTED BIDIRECTIONAL PREDICTION IN VIDEO CODING |
US12081736B2 (en) * | 2021-04-26 | 2024-09-03 | Tencent America LLC | Bi-prediction without signaling cu-level weights |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227608A (zh) * | 2006-12-21 | 2008-07-23 | 泰德广播电视公司 | 加权预测视频编码 |
US20100061644A1 (en) * | 2001-11-30 | 2010-03-11 | Sony Corporation | Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information |
CN102223527A (zh) * | 2010-04-13 | 2011-10-19 | 华为技术有限公司 | 频带加权量化编解码方法和装置 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738423B1 (en) * | 2000-01-21 | 2004-05-18 | Nokia Mobile Phones Ltd. | Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder |
CN1484922A (zh) * | 2001-11-06 | 2004-03-24 | 松下电器产业株式会社 | 运动图像编码方法及运动图像解码方法 |
JP4015934B2 (ja) * | 2002-04-18 | 2007-11-28 | 株式会社東芝 | 動画像符号化方法及び装置 |
JP2004007379A (ja) * | 2002-04-10 | 2004-01-08 | Toshiba Corp | 動画像符号化方法及び動画像復号化方法 |
EP1827029A1 (en) | 2002-01-18 | 2007-08-29 | Kabushiki Kaisha Toshiba | Video decoding method and apparatus |
EP1547381A4 (en) | 2002-10-01 | 2010-11-03 | Thomson Licensing | IMPLIED WEIGHTING OF REFERENCE IMAGES IN A VIDEO PROCESSOR |
JP2004179687A (ja) | 2002-11-22 | 2004-06-24 | Toshiba Corp | 動画像符号化/復号化方法及び装置 |
WO2004054225A2 (en) | 2002-12-04 | 2004-06-24 | Thomson Licensing S.A. | Encoding of video cross-fades using weighted prediction |
EP1636998A2 (en) * | 2003-06-25 | 2006-03-22 | Thomson Licensing | Method and apparatus for weighted prediction estimation using a displaced frame differential |
JP2005318297A (ja) | 2004-04-28 | 2005-11-10 | Toshiba Corp | 動画像符号化・復号方法及び装置 |
KR101201930B1 (ko) | 2004-09-16 | 2012-11-19 | 톰슨 라이센싱 | 국부적 밝기 변동을 이용한 가중화된 예측을 가진 비디오 코덱 |
US20060137843A1 (en) | 2004-12-29 | 2006-06-29 | Sutman Frank J | Retention and drainage in the manufacture of paper |
US8638862B2 (en) * | 2005-03-18 | 2014-01-28 | Sharp Laboratories Of America, Inc. | Methods and systems for upsampling filter design |
US8457203B2 (en) | 2005-05-26 | 2013-06-04 | Ntt Docomo, Inc. | Method and apparatus for coding motion and prediction weighting parameters |
JP2007043651A (ja) | 2005-07-05 | 2007-02-15 | Ntt Docomo Inc | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム |
JP2007061518A (ja) | 2005-09-02 | 2007-03-15 | Nippon Hanekku:Kk | 温熱浴用の天然鉱石粉砕粒物 |
JP2007081518A (ja) | 2005-09-12 | 2007-03-29 | Victor Co Of Japan Ltd | 動画像符号化装置および動画像符号化方法 |
US20070097903A1 (en) | 2005-11-03 | 2007-05-03 | Interdigital Technology Corporation | Method and apparatus of exchanging messages via a wireless distribution system between groups operating in different frequencies |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
KR101406156B1 (ko) | 2006-02-02 | 2014-06-13 | 톰슨 라이센싱 | 움직임 보상 예측을 위한 적응 가중 선택 방법 및 장치 |
US8630346B2 (en) * | 2007-02-20 | 2014-01-14 | Samsung Electronics Co., Ltd | System and method for introducing virtual zero motion vector candidates in areas of a video sequence involving overlays |
CN101335902B (zh) * | 2007-06-25 | 2010-06-02 | 华为技术有限公司 | 视频编解码中的加权预测方法和装置 |
US20110007893A1 (en) * | 2009-07-08 | 2011-01-13 | Berk Sunar | Method and apparatus for fingerprinting and copy protecting optical recording media |
CN101631242A (zh) * | 2009-07-30 | 2010-01-20 | 上海交通大学 | 视频加权预测系统及其编码解码方法 |
EP2302933A1 (en) | 2009-09-17 | 2011-03-30 | Mitsubishi Electric R&D Centre Europe B.V. | Weighted motion compensation of video |
US9083984B2 (en) * | 2010-03-19 | 2015-07-14 | Texas Instruments Incorporated | Adaptive coding structure and adaptive FCode determination in video coding |
WO2011126288A2 (en) | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image and method and apparatus for decoding image using adaptive coefficient scan order |
EP2375754A1 (en) * | 2010-04-09 | 2011-10-12 | Mitsubishi Electric R&D Centre Europe B.V. | Weighted motion compensation of video |
US20110261885A1 (en) * | 2010-04-27 | 2011-10-27 | De Rivaz Peter Francis Chevalley | Method and system for bandwidth reduction through integration of motion estimation and macroblock encoding |
RU2422967C1 (ru) | 2010-05-17 | 2011-06-27 | Государственное образовательное учреждение высшего профессионального образования "Пермский государственный технический университет" | Способ уменьшения реактивного намагничивающего тока в элементах систем электроснабжения и устройство для его осуществления |
EP3174300A1 (en) | 2011-10-17 | 2017-05-31 | Kabushiki Kaisha Toshiba | Decoding device and decoding method |
KR101624058B1 (ko) | 2011-10-17 | 2016-05-24 | 가부시끼가이샤 도시바 | 암호화 장치 및 암호화 방법 |
CN106899849B (zh) | 2012-06-27 | 2019-08-13 | 株式会社东芝 | 一种电子设备和解码方法 |
-
2012
- 2012-06-27 CN CN201710102187.XA patent/CN106899849B/zh active Active
- 2012-06-27 CA CA2971911A patent/CA2971911C/en active Active
- 2012-06-27 JP JP2013543440A patent/JP5925801B2/ja active Active
- 2012-06-27 SG SG11201400296RA patent/SG11201400296RA/en unknown
- 2012-06-27 EP EP19150765.6A patent/EP3506639B1/en active Active
- 2012-06-27 EP EP12870927.6A patent/EP2869574B1/en active Active
- 2012-06-27 MX MX2016000273A patent/MX353824B/es unknown
- 2012-06-27 RU RU2014107491A patent/RU2609063C2/ru active
- 2012-06-27 CA CA2847304A patent/CA2847304C/en active Active
- 2012-06-27 CA CA3070902A patent/CA3070902C/en active Active
- 2012-06-27 KR KR1020147005650A patent/KR101624059B1/ko active IP Right Grant
- 2012-06-27 CN CN201280042152.7A patent/CN103765897B/zh active Active
- 2012-06-27 EP EP17159255.3A patent/EP3203745B1/en active Active
- 2012-06-27 KR KR1020157031715A patent/KR101639965B1/ko active IP Right Grant
- 2012-06-27 EP EP17159231.4A patent/EP3193506A1/en not_active Withdrawn
- 2012-06-27 CN CN201710102184.6A patent/CN106791833B/zh active Active
- 2012-06-27 CA CA3160230A patent/CA3160230A1/en active Pending
- 2012-06-27 MX MX2014002541A patent/MX336158B/es unknown
- 2012-06-27 BR BR112014004652-2A patent/BR112014004652B1/pt active IP Right Grant
- 2012-06-27 AU AU2012383769A patent/AU2012383769B2/en active Active
- 2012-06-27 EP EP20169963.4A patent/EP3700215B1/en active Active
- 2012-06-27 WO PCT/JP2012/066410 patent/WO2014002217A1/ja active Application Filing
-
2013
- 2013-09-13 US US14/026,727 patent/US9462291B2/en active Active
-
2015
- 2015-05-29 US US14/725,941 patent/US9621914B2/en active Active
-
2017
- 2017-02-21 US US15/438,357 patent/US10277900B2/en active Active
- 2017-02-21 US US15/438,333 patent/US10257516B2/en active Active
-
2019
- 2019-03-06 US US16/293,916 patent/US10609376B2/en active Active
-
2020
- 2020-02-14 US US16/791,917 patent/US11202075B2/en active Active
- 2020-04-10 US US16/845,910 patent/US11363270B2/en active Active
-
2022
- 2022-04-28 US US17/661,120 patent/US11800111B2/en active Active
-
2023
- 2023-09-14 US US18/466,917 patent/US12088810B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100061644A1 (en) * | 2001-11-30 | 2010-03-11 | Sony Corporation | Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information |
US20120140817A1 (en) * | 2001-11-30 | 2012-06-07 | Sony Corporation | Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information |
CN101227608A (zh) * | 2006-12-21 | 2008-07-23 | 泰德广播电视公司 | 加权预测视频编码 |
CN102223527A (zh) * | 2010-04-13 | 2011-10-19 | 华为技术有限公司 | 频带加权量化编解码方法和装置 |
Non-Patent Citations (2)
Title |
---|
TANIZAWA ET AL: "《Redundancy remocal of explict weighted prediction syntax》", 《JCT-VC》 * |
TANIZAWA ET AL: "《Revised text of explicit weighted prediction in HM WD6》", 《JCT-VC》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111886867A (zh) * | 2018-01-09 | 2020-11-03 | 夏普株式会社 | 运动矢量推导装置、运动图像解码装置以及运动图像编码装置 |
CN111886867B (zh) * | 2018-01-09 | 2023-12-19 | 夏普株式会社 | 运动矢量推导装置、运动图像解码装置以及运动图像编码装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103765897B (zh) | 编码设备、解码设备、编码方法以及解码方法 | |
US11871007B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
US10271061B2 (en) | Encoding device, decoding device, encoding method, and decoding method for efficient coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |