CN114556942A - 用于无损和近无损压缩的量化器 - Google Patents
用于无损和近无损压缩的量化器 Download PDFInfo
- Publication number
- CN114556942A CN114556942A CN202080068737.0A CN202080068737A CN114556942A CN 114556942 A CN114556942 A CN 114556942A CN 202080068737 A CN202080068737 A CN 202080068737A CN 114556942 A CN114556942 A CN 114556942A
- Authority
- CN
- China
- Prior art keywords
- quantization index
- value
- index value
- quantization
- lossless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title description 19
- 238000007906 compression Methods 0.000 title description 19
- 238000013139 quantization Methods 0.000 claims abstract description 242
- 238000000034 method Methods 0.000 claims description 51
- 238000004590 computer program Methods 0.000 claims description 11
- 230000033001 locomotion Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000013507 mapping Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001268392 Dalla Species 0.000 description 1
- 240000002989 Euphorbia neriifolia Species 0.000 description 1
- 101500019086 Ustilago maydis P6 virus KP6 killer toxin subunit alpha Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种系统包括代码,该代码包括获得:获得代码,用于获得指示第一量化索引值的第一语法元素;获得指示偏移值的至少一个第二语法元素;获得另一个系数的第二量化索引值,第二量化索引值通过组合第一量化索引值和偏移值以获得组合值,并将组合值修改为预定最小值以作为第二量化索引值来获得;第四获得代码,用于获得对应于第二量化索引值的量化步长;以及确定代码,用于基于确定第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定偏移值是否小于或等于与无损编码相关联的量化索引值,来确定对已编码图像进行解码所用的模式。
Description
相关申请的交叉引用
本申请要求于2020年7月20日提交的第63/054,049号美国临时专利申请和于2020年10月8日提交的第17/065,974号美国专利申请的优先权,这两个申请整体并入本文中。
技术领域
本公开的实施例涉及一组高级视频编码技术,更具体地涉及用于处理无损/近无损压缩的量化器技术。
背景技术
AOMediaVideo1(AV1)是由开放媒体联盟(AOMedia,Alliance For OpenMedia)作为VP9的后继者开发的,该联盟成立于2015年,包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。AV1项目的许多组件来自该联盟成员先前的研究工作。个体贡献者早在几年前就开始了实验性技术平台:Xiph/Mozilla的Daala已于2010年发布代码,谷歌(Google)的实验性VP9演进项目VP10于2014年9月12日发布,思科(Cisco)的Thor于2015年8月11日发布。基于VP9的代码库,AV1结合了其他技术,其中一些技术是以这些实验格式开发的。AV1参考编解码器的第一个版本0.1.0于2016年4月7日发布。该联盟于2018年3月28日宣布发布AV1比特流规范,以及基于软件的参考编码器和参考解码器。2018年6月25日,发布了该规范的验证版本1.0.0,并于2019年1月8日发布了“AV1比特流和解码过程规范”,其是该规范的带有勘误表1的验证版本1.0.0。AV1比特流规范包括参考视频编解码器。“AV1比特流和解码过程规范”(具有勘误表1的版本1.0.0),开放媒体联盟(2019年1月8日)通过引用整体并入本文中。目前正在开发AOMediaVideo2(AV2),为此设计8位/10位变换核。
附图说明
通过以下详细描述和附图,所公开的主题的进一步特征、性质和各种优点将更加明显,在附图中:
图1是根据一个实施例的通信系统的简化框图的示意图。
图2是根据一个实施例的通信系统的简化框图的示意图。
图3是根据一个实施例的解码器的简化框图的示意图。
图4是根据一个实施例的编码器的简化框图的示意图。
图5是在表格中示出AC系数的示例性qindex到QStep映射的曲线图。
图6是在表格中示出DC系数的示例性qindex到QStep映射的曲线图。
图7是根据一个实施例的解码器的各方面的简化框图的示意图。
图8是适合于实现实施例的计算机系统的图。
具体实施方式
AV1量化
变换系数的量化可对DC变换系数和AC变换系数应用不同的量化步长,对亮度变换系数和色度变换系数应用不同的量化步长。为了指定量化步长,在帧报头中,首先用信号表示“base_q_idx”语法元素,该语法元素是指定亮度AC系数的量化步长的8位无符号固定长度代码。“base_q_idx”的有效范围是[0,255]。此后,进一步用信号表示亮度DC系数相对于“base_q_idx”的δ值,δ值表示为“DeltaQYDc”。此外,如果存在多于一个颜色平面,则用信号表示标志“diff_uv_delta”以指示Cb颜色分量和Cr颜色分量是否应用不同的量化索引值。如果“diff_uv_delta”用信号表示为“0”,则仅用信号表示色度DC系数相对于“base_q_idx”的δ值(表示为“DeltaQUDc”)和色度AC系数相对于“base_q_idx”的δ值(表示为“DeltaQUAc”)。否则用信号表示Cb DC系数和Cr DC系数相对于“base_q_idx”的δ值(表示为“DeltaQUDc”和“DeltaQVDc”)以及Cb AC系数和Cr AC系数相对于“base_q_idx”的δ值(表示为“DeltaQUAc”和“DeltaQVAc”)。δ值用信号表示为带符号的6位整数。
上述解码的“DeltaQYDc”、“DeltaQUAc”、“DeltaQUDc”、“DeltaQVAc”和“DeltaQVDc”与“base_q_idx”相加以导出量化索引“qindex”。然后,根据两个表将这些索引“qindex”进一步映射到量化步长。对于DC系数,从量化索引到8位、10位和12位内部位深度的量化步长的映射由查找表“Dc_Qlookup[3][256]”指定,从量化索引到8位、10位和12位的量化步长的映射由查找表“Ac_Qlookup[3][256]”指定。在图5中的表格中示出AC系数的“qindex”到“Qstep”映射的示例。在图6中的表格中示出DC系数的“qindex”到“Qstep”映射的示例。参考图5的曲线图500,8位AC使用以字母“A”为参考的线示出,10位AC使用以字母“B”为参考的线示出,12位AC使用以字母“C”为参考的线示出。参考图6的曲线图600,8位DC使用以字母“D”为参考的线示出,10位DC使用以字母“E”为参考的线示出,12位DC使用以字母“F”为参考的线示出。
正在AV2中研究改进的量子化
在进行中的AV2开发过程中,提出与量化器设计相关的以下工具。
去除单独的查找表“Dc_Qlookup[3][256]”和“Ac_Qlookup[3][256]”。仅保留统一的查找表“Ac_Qlookup[256]”,且两个附加的序列级语法参数(“base_y_dc_delta_q”、“base_uv_dc_delta_q”)指定亮度和色度的DC偏移。除了在AV1量化过程中指定的帧层级δ之外,使用偏移从“Ac_Qlookup[256]”获得亮度和色度的DC量化步长。
在AV1中,使用以下项从查找表中选择要使用的量化步长:
·针对亮度/色度DC系数的Dc_Qlookup[3][clip(base_q_idx+delta_dc,0,255)]
·针对色度AC系数的Ac_Qlookup[3][clip(base_q_idx+delta_ac,0,255)]
·针对亮度AC系数的Ac_Qlookup[3][clip(base_q_idx,0,255)]
其中“delta_dc”可以是“DeltaQYDc”、“DeltaQUDc”、“DeltaQVDc”中的任何一个;“delta_ac”可以是“DeltaQUAc”和“DeltaQVAc”中的任何一个,以及clip()函数裁剪值介于0和255之间的值。
在AV1中的量化器设计以及针对AV2提出的改进的量化器,从使用以下项的查找表中选择要使用的量化步长:
·针对亮度/色度DC系数的Dc_Qlookup[clip(base_q_idx+delta_dc,0,255)]
·针对色度AC系数的Ac_Qlookup[clip(base_q_idx+delta_ac,0,255)]
·针对亮度AC系数的Ac_Qlookup[clip(base_q_idx,0,255)]
其中“delta_dc”可以是“DeltaQYDc”-“base_y_dc_delta_q”、“DeltaQUDc”-“base_uv_dc_delta_q”或“DeltaQVDc”-“base_uv_dc_delta_q”中的任何一个;“delta_ac”可以是“DeltaQUAc”和“DeltaQVAc”中的任何一个,以及clip()函数裁剪值介于0和255之间。
此外,为了在现有技术中使用无损模式对块进行编码,在现有技术中必须满足以下所有条件:
·base_q_idx==0
·DeltaQYDc==0
·DeltaQUAc==0
·DeltaQUDc==0
·DeltaQVAc==0
·DeltaQVDc==0
利用针对AV2提出的工具,无损模式的条件变成:
·base_q_idx==0
·DeltaQYDc-base_y_dc_delta_q<=0
·DeltaQUAc==0
·DeltaQUDc-base_uv_dc_delta_q<=0
·DeltaQVAc==0
·DeltaQVDc-base_uv_dc_delta_q<=0
如果满足以上所有条件,则所选择的步长为4(在考虑了缩放因子为4之后,该缩放因子由在无损模式下使用的可逆4点沃尔什-哈达玛(Walsh-Hadamard)变换引入)。然而,当不满足上述条件(有损模式),且base_q_idx+delta_dc<=0或base_q_idx+delta_ac<=0时,clip(base_q_idx+delta_dc)或clip(base_q_idx+delta_ac)将导致“qindex”值为零,且所选择的步长仍为4。在这种情况下使用的变换将是离散余弦变换(DCT)、非对称离散正弦变换(ADST)或恒等变换(IDTX)的组合中的一种,这引入缩放因子8。这将导致有损编码模式,尽管比特率高于无损模式的比特率(但是对于亮度和色度,峰值信噪比(PSNR)较低)。因此,现有技术的问题在于,有损编码模式可导致比无损编码模式下的比特率更高的比特率。
本公开的实施例解决上述问题和/或其它问题。
本公开的实施例可提供一组高级视频编码技术,这组高级视频编码技术提供视频数据的有效压缩。本公开的实施例可提供量化器技术,该量化器技术在AV2中提供无损/近无损压缩。
根据一个或多个实施例,提供一种系统。该系统包括:至少一个存储器,被配置成存储计算机程序代码;以及至少一个处理器,被配置成访问计算机程序代码并根据计算机程序代码的指示来操作。计算机程序代码包括:第一获得代码,被配置成使得至少一个处理器获得第一语法元素,第一语法元素指示已编码图像的AC系数的第一量化索引值;第二获得代码,被配置成使得至少一个处理器获得指示偏移值的至少一个第二语法元素;第三获得代码,被配置成使得至少一个处理器获得已编码图像的另一个系数的第二量化索引值,第二量化索引值通过组合第一语法元素的第一量化索引值和至少一个第二语法元素的偏移值以获得组合值,并在组合值小于预定最小值的情况下将组合值修改为预定最小值以作为第二量化索引值来获得;第四获得代码,被配置成使得至少一个处理器获得对应于所获得的第二量化索引值的量化步长;确定代码,被配置成使得至少一个处理器基于确定第一量化索引值是否等于与无损编码相关联的量化索引值,以及基于确定偏移值是否小于或等于与无损编码相关联的量化索引值,来确定对已编码图像进行解码所用的模式是有损模式还是无损模式;第一设置代码,被配置成使得至少一个处理器基于确定代码进行的确定而将预定最小值设置成与组合值相当的值;以及解码代码,被配置成使得至少一个处理器基于确定代码进行的确定并通过使用所获得的量化步长,来以有损模式或无损模式对已编码图像进行解码。
根据一个实施例,第一设置代码被配置成使得至少一个处理器基于确定第一量化索引值等于与无损编码相关联的量化索引值以及基于确定偏移值小于或等于与无损编码相关联的量化索引值,来将预定最小值设置成与无损编码相关联的量化索引值。
根据一个实施例,与无损编码相关联的量化索引值是0。
根据一个实施例,与无损编码相关联的量化索引值是大于0的正整数值。
根据一个实施例,第一设置代码被配置成使得至少一个处理器基于确定第一量化索引值不等于与无损编码相关联的量化索引值或者基于确定偏移值大于与无损编码相关联的量化索引值,来将预定最小值设置成不同于与无损编码相关联的量化索引值的值。
根据一个实施例,与无损编码相关联的量化索引值是0。
根据一个实施例,与无损编码相关联的量化索引值是不同于0的值。
根据一个实施例,第四获得代码被配置成使得至少一个处理器通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得对应于第二量化索引值的量化步长,以及计算机程序代码进一步包括第二设置代码,第二设置代码被配置成使得至少一个处理器在至少一个查找表中设置与和无损编码相关联的量化索引值相关联的量化步长。
根据一个实施例,第二设置代码被配置成使得至少一个处理器:执行2x乘以4的运算,其中x是预定值;以及在至少一个查找表中将与和无损编码相关联的量化索引值相关联的量化步长设置成运算的结果。
根据一个实施例,第四获得代码被配置成使得至少一个处理器通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得对应于第二量化索引值的量化步长,以及计算机程序代码进一步包括第二设置代码,第二设置代码被配置成使得至少一个处理器在至少一个查找表中设置与多个与有损编码相关联的量化索引值中的一个相关联的量化步长。
根据一个实施例,第二设置代码被配置成使得至少一个处理器:执行2x乘以8的运算,其中x是预定值;以及在至少一个查找表中将与多个与有损编码相关联的量化索引值中的一个相关联的量化步长设置成运算的结果。
根据一个或多个实施例,提供一种方法。该方法包括:获得第一语法元素,第一语法元素指示已编码图像的AC系数的第一量化索引值;获得指示偏移值的至少一个第二语法元素;获得已编码图像的另一个系数的第二量化索引值,第二量化索引值通过组合第一语法元素的第一量化索引值和至少一个第二语法元素的偏移值以获得组合值,并基于组合值小于预定最小值将组合值修改为预定最小值以作为第二量化索引值来获得;获得对应于所获得的第二量化索引值的量化步长;基于确定第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定偏移值是否小于或等于与无损编码相关联的量化索引值,来确定对已编码图像进行解码所用的模式是有损模式还是无损模式;基于该确定而将预定最小值设置成与组合值相当的值;以及基于该确定并通过使用所获得的量化步长,来以有损模式或无损模式对已编码图像进行解码。
根据一个实施例,该设置包括:基于确定第一量化索引值等于与无损编码相关联的量化索引值以及基于确定偏移值小于或等于与无损编码相关联的量化索引值,将预定最小值设置成与无损编码相关联的量化索引值。
根据一个实施例,与无损编码相关联的量化索引值是大于0的正整数值。
根据一个实施例,该设置包括:基于确定第一量化索引值不等于与无损编码相关联的量化索引值,或者基于确定偏移值大于与无损编码相关联的量化索引值,将预定最小值设置成不同于与无损编码相关联的量化索引值的值。
根据一个实施例,与无损编码相关联的量化索引值是不同于0的值。
根据一个实施例,获得量化步长包括通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得对应于第二量化索引值的量化步长,以及该方法进一步包括:在至少一个查找表中设置与和无损编码相关联的量化索引值相关联的量化步长。
根据一个实施例,获得量化步长包括通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得对应于第二量化索引值的量化步长,以及该方法进一步包括:在至少一个查找表中设置与多个与有损编码相关联的量化索引值中的一个相关联的量化步长。
根据一个实施例,该设置包括:执行2x乘以8的运算,其中x是预定值;以及在至少一个查找表中将与多个与有损编码相关联的量化索引值中的一个相关联的量化步长设置成运算的结果。
根据一个或多个实施例,提供一种非暂时性计算机可读介质,该非暂时性计算机可读介质存储有计算机指令,当计算机指令由至少一个处理器执行时,计算机指令配置成使得至少一个处理器:获得第一语法元素,第一语法元素指示已编码图像的AC系数的第一量化索引值;获得指示偏移值的至少一个第二语法元素;获得已编码图像的另一个系数的第二量化索引值,第二量化索引值通过组合第一语法元素的第一量化索引值和至少一个第二语法元素的偏移值以获得组合值,并基于组合值小于预定最小值将组合值修改为预定最小值以作为第二量化索引值来获得;获得对应于所获得的第二量化索引值的量化步长;基于确定第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定偏移值是否小于或等于与无损编码相关联的量化索引值,来确定对已编码图像进行解码所用的模式是有损模式还是无损模式;基于该确定而将预定最小值设置成与组合值相当的值;以及基于该确定并通过使用所获得的量化步长,来以有损模式或无损模式对已编码图像进行解码。
图1示出了根据本公开的一个实施例的通信系统(100)的简化框图。系统(100)可包括通过网络(150)互连的至少两个终端(110,120)。对于数据的单向传输,第一终端(110)可以在本地位置对视频数据进行编码,以通过网络(150)传输到另一终端(120)。第二终端(120)可从网络(150)接收另一终端的已编码视频数据,对已编码数据进行解码并显示所恢复的视频数据。单向数据传输在媒体服务等应用中可以是较常见的。
图1示出了第二对终端(130和140),提供第二对终端以支持例如在视频会议期间可能发生的已编码视频的双向传输。对于数据的双向传输,每个终端(130和140)可以对在本地采集的视频数据进行编码,以通过网络(150)传输到另一个终端。终端(130和140)中的每一个还可以接收另一个终端发送的已编码视频数据,可以解码已编码数据并且可以在本地显示装置上显示恢复的视频数据。
在图1中,终端(110-140)可被示为服务器、个人计算机、智能手机、和/或任何其它类型的终端。例如,终端(110-140)可以是膝上型计算机、平板计算机、媒体播放器和/或专用视频会议设备。网络(150)表示在终端(110-140)之间传送已编码视频数据的任何数量的网络,包括例如有线和/或无线通信网络。通信网络(150)可在电路交换和/或分组交换信道中交换数据。代表性的网络包括电信网络、局域网、广域网和/或互联网。出于本讨论的目的,除非在下文中有所解释,否则网络(150)的架构和拓扑对于本公开的操作来说可能是不重要的。
作为所公开的主题的应用的示例,图2示出了视频解码器和解码器在流式传输环境中的放置方式。所公开的主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV、在包括CD、DVD、记忆棒等的数字媒体上存储压缩视频等等。
如图2所示,流式传输系统(200)可包括采集子系统(213),该采集子系统可包括视频源(201)和编码器(203)。视频源(201)可以是例如数码相机,且可配置成创建未压缩的视频样本流(202)。相较于已编码视频比特流,未压缩的视频样本流(202)可提供高数据量,且可由耦接到相机(201)的编码器(203)处理。编码器(203)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开的主题的各方面。相较于样本流,已编码视频比特流(204)可包括较低数据量,且可存储在流式传输服务器(205)上以供将来使用。一个或多个流式传输客户端(206)可访问流式传输服务器(205)以检索视频比特流(209),该视频比特流可以是已编码视频比特流(204)的副本。
在实施例中,流式传输服务器(205)还可用作媒体感知网络单元(MANE)。例如,流式传输服务器(205)可配置成修剪已编码视频比特流(204),以裁剪相对于一个或多个流式传输客户端(206)可能不同的比特流。在实施例中,MANE可与流式传输系统(200)中的流式传输服务器(205)分开提供。
流式传输客户端(206)可包括视频解码器(210)和显示器(212)。视频解码器(210)可例如对作为已编码视频比特流(204)的传入副本的视频比特流(209)进行解码,且可产生可在显示器(212)或另一呈现装置(未示出)上呈现的输出视频样本流(211)。在一些流式传输系统中,可根据某些视频编码/压缩标准对视频比特流(204,209)进行编码。这些标准的示例包括但不限于ITU-T建议书H.265。正在开发的视频编码标准非正式地称为通用视频编码(VVC)。本公开的实施例可用于VVC的上下文中。
图3示出了根据本公开的一个实施例的附接到显示器(212)的视频解码器(210)的示例性功能框图。
视频解码器(210)可包括信道(312)、接收器(310)、缓冲存储器(315)、熵解码器/解析器(320)、缩放器/逆变换单元(351)、帧内预测单元(352)、运动补偿预测单元(353)、聚合器(355)、环路滤波器单元(356)、参考图片存储器(357)和当前图片存储器()。在至少一个实施例中,视频解码器(210)可包括集成电路、一系列集成电路和/或其它电子电路。视频解码器(210)还可部分地或完全地在具有相关联的存储器的一个或多个CPU上运行的软件中实现。
在本实施例和其它实施例中,接收器(310)可接收将由解码器(210)解码的一个或多个已编码视频序列,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列的解码。可从信道(312)接收已编码视频序列,该信道可以是通向存储已编码视频数据的存储设备的硬件/软件链路。接收器(310)可以接收已编码视频数据和其他数据,例如已编码音频数据和/或辅助数据流,这些数据可以被转发到它们各自的使用实体(未示出)。接收器(310)可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器(315)可耦接在接收器(310)与熵解码器/解析器(320)(此后称为“解析器”)之间。当接收器(310)从具有足够带宽和可控性的存储/转发设备或从等时同步网络接收数据时,可能不使用缓冲器(315),或可将该缓冲器做得很小。为了在互联网等业务分组网络上使用,可能需要缓冲器(315),该缓冲器可相对较大且可具有自适应性大小。
视频解码器(210)可包括解析器(320)以根据已熵编码的视频序列重建符号(321)。这些符号的类别包括例如用于管理解码器(210)的操作的信息,以及用于控制呈现设备(例如,显示器(212))的潜在信息,该呈现设备可如图2所示耦接到解码器。呈现设备的控制信息可以是辅助增强信息(Supplementary Enhancement Information,SEI)或视频可用性信息(Video Usability Information,VUI)参数集片段(未示出)的形式。解析器(320)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行,且可遵循本领域技术人员公知的各种原理,包括可变长度编码、霍夫曼编码、具有或不具有上下文灵敏度的算术编码等。解析器(320)可基于对应于群组的至少一个参数,从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可以包括图像群组(Groups of Pictures,GOP)、图像、图块、切片、宏块、编码单元(CU)、块、变换单元(TU)、预测单元(PU)等。解析器(320)还可以从已编码视频序列中提取信息,例如变换系数、量化器参数值、运动矢量等。
解析器(320)可对从缓冲器(315)接收的视频序列执行熵解码/解析操作,从而创建符号(321)。
取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素,符号(321)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(320)通过从已编码视频序列中解析的子群控制信息来控制。为了清楚起见,未描述解析器(320)与下文的多个单元之间的此类子群控制信息流。
除了已经提及的功能块之外,解码器210可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实现方式中,这些单元中的许多单元彼此密切交互,并且可以至少部分地彼此集成。然而,出于描述所公开主题的目的,概念上细分成下文的功能单元是适当的。
一个单元可以是缩放器/逆变换单元(351)。缩放器/逆变换单元(351)可从解析器(320)接收作为符号(321)的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(351)可输出包括样本值的块,该样本值可输入到聚合器(355)中。
在一些情况下,缩放器/逆变换(351)的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(352)提供。在一些情况下,帧内图片预测单元(352)采用从来自当前图片存储器(358)的当前(部分重建的)图片提取的周围已重建信息来生成大小和形状与正在重建的块相同的块。在一些情况下,聚合器(355)基于每个样本,将帧内预测单元(352)生成的预测性信息添加到由缩放器/逆变换单元(351)提供的输出样本信息中。
在其它情况下,缩放器/逆变换单元(351)的输出样本可属于帧间编码块和潜在运动补偿块。在此情况下,运动补偿预测单元(353)可访问参考图片存储器(357)以提取用于预测的样本。在根据属于块的符号(321)对提取的样本进行运动补偿之后,这些样本可由聚合器(355)添加到缩放器/逆变换单元(351)的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元(353)从参考图片存储器(357)获取预测样本的地址可受到运动矢量控制。该运动矢量以符号(321)的形式而供运动补偿预测单元(353)使用,符号(321)可具有例如X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器(357)提取的样本值的内插、运动矢量预测机制等。
聚合器(355)的输出样本可经受环路滤波器单元(356)中的各种环路滤波技术。视频压缩技术可包括环路内滤波器技术,该环路内滤波器技术受控于包括在已编码视频比特流中且作为来自解析器(320)的符号(321)可用于环路滤波器单元(356)的参数,然而,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
环路滤波器单元(356)的输出可以是样本流,该样本流可输出到呈现设备(例如,显示器(212))以及存储在参考图片存储器(357)中,以用于后续的帧间图片预测。
一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。一旦已编码图片被完全重建,且已编码图片(通过例如解析器(320))被识别为参考图片,则当前参考图片可变成参考图片存储器(357)的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片存储器。
视频解码器(210)可根据例如ITU-T H.265标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循如视频压缩技术文件或标准以及在视频压缩技术文件或标准的配置文件中指定的视频压缩技术或标准的语法的意义上,已编码视频序列符合所使用的视频压缩技术或标准指定的语法。对于一些视频压缩技术或标准的合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图像大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图像大小等。在一些情况下,由层级设定的限制可通过假想参考解码器(Hypothetical Reference Decoder,HRD)规范和在已编码视频序列中用信号通知的HRD缓冲器管理的元数据来进一步限定。
在一个实施例中,接收器(310)可连同已编码视频一起接收附加(冗余)数据。该附加数据可被包括作为已编码视频序列的一部分。该附加数据可由视频解码器(210)使用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(SNR)增强层、冗余切片、冗余图片、前向纠错码等形式。
图4示出了根据本公开的一个实施例的与视频源(201)相关联的视频编码器(203)的示例性功能框图。
视频编码器(203)可包括例如作为源编码器(430)的编码器、编码引擎(432)、(本地)解码器(433)、参考图片存储器(434)、预测器(435)、传输器(440)、熵编码器(445)、控制器(450)和信道(460)。
编码器(203)可从视频源(201)(并不是编码器的一部分)接收视频样本,该视频源可采集将由编码器(203)编码的视频图像。
视频源(201)可提供将由编码器(203)编码的呈数字视频样本流形式的源视频序列,该数字视频样本流可具有任何合适位深度(例如:8位、10位、12位……)、任何色彩空间(例如BT.601 Y CrCB、RGB……)和任何合适采样结构(例如Y CrCb 4:2:0、Y CrCb 4:4:4)。在媒体服务系统中,视频源(201)可以是存储先前已准备的视频的存储设备。在视频会议系统中,视频源(203)可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的采样结构、色彩空间等,每个像素可包括一个或多个样本。本领域技术人员可容易理解像素与样本之间的关系。下文侧重于描述样本。
根据一个实施例,编码器(203)可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列(443)。施行适当的编码速度是控制器(450)的一个功能。控制器(450)还可控制如下文所描述的其它功能单元且可在功能上耦接到这些单元。为了清楚起见,未描述耦接。由控制器(450)设置的参数可包括速率控制相关参数(例如,图片跳过、量化器、率失真优化技术的λ值……)、图片大小、图片群组(GOP)布局、最大运动矢量搜索范围等。本领域技术人员可容易地识别控制器(450)的其它功能,因为这些功能可涉及针对某一系统设计优化的视频编码器(203)。
一些视频编码器在本领域技术人员容易识别的“编码环路”中操作。作为简化的描述,编码环路可包括源编码器(430)构成的编码部分(源编码器负责基于待编码的输入图片和参考图片创建符号)和嵌入于编码器(203)中的(本地)解码器(433),当在某些视频压缩技术中,符号与已编码视频比特流之间的任何压缩是无损的时,(本地)解码器重建符号以用于创建(远程)解码器会创建的样本数据。该重建的样本流可输入到参考图片存储器(434)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片缓冲器中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。本领域技术人员熟知这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)。
“本地”解码器(433)的操作可与例如已在上文结合图3详细描述的“远程”解码器(210)的操作相同。然而,当符号可用且熵编码器(445)和解析器(320)可无损地将符号编码/解码成已编码视频序列时,解码器(210)的熵解码部分(包括信道(312)、接收器(310)、缓冲器(315)和解析器(320))可能无法完全在本地解码器(433)中实施。
此时可观察到,除了存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。为此,所公开的主题集中于解码器操作。可简化对编码器技术的描述,因为对编码器技术的描述可与全面描述的解码器技术互逆。仅在某些区域中需要更详细的描述并在下文提供。
作为其操作的一部分,源编码器(430)可执行运动补偿预测编码,参考来自视频序列中被指定为“参考帧”的一个或多个先前已编码帧,该运动补偿预测编码对输入帧进行预测性编码。以此方式,编码引擎(432)对输入帧的像素块与参考帧的像素块之间的差异进行编码,该参考帧可被选作该输入帧的预测参考。
本地视频解码器(433)可基于源编码器(430)创建的符号,对可指定为参考帧的帧的已编码视频数据进行解码。编码引擎(432)的操作有利地可以是有损过程。当已编码视频数据可在视频解码器(图4中未示出)处被解码时,已重建视频序列通常可以是源视频序列的副本,但带有一些误差。本地视频解码器(433)复制解码过程,该解码过程可由视频解码器对参考帧执行,且可使重建参考帧存储在参考图片存储器(434)中。以此方式,编码器(203)可在本地存储重建参考帧的副本,该副本与将由远端视频解码器获得的重建参考帧具有共同内容(不存在传输误差)。
预测器(435)可对编码引擎(432)执行预测搜索。即,对于将要编码的新帧,预测器(435)可在参考图片存储器(434)中搜索可作为该新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器(435)可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,如由预测器(435)获得的搜索结果所确定的那样,输入图片可具有从参考图片存储器(434)中存储的多个参考图片取得的预测参考。
控制器(450)可管理视频编码器(430)的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
可在熵编码器(445)中对所有上述功能单元的输出进行熵编码。熵编码器通过根据本领域技术人员已知的例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩,从而将该符号变换成已编码视频序列。
传输器(440)可缓冲由熵编码器(445)创建的已编码视频序列,从而为通过通信信道(460)进行传输做准备,该通信信道可以是通向将存储已编码视频数据的存储设备的硬件/软件链路。传输器(440)可将来自视频编码器(430)的已编码视频数据与要传输的其它数据合并,该其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
控制器(450)可管理编码器(203)的操作。在编码期间,控制器(450)可给每个已编码图片分配某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片分配为帧内图片(I图片)、预测性图片(P图片)和双向预测性图片(B图片)。
帧内图片(I图片)可以是不将序列中的任何其它帧用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(IDR)图片。本领域技术人员了解I图片的那些变体及其相应的应用和特征。
预测性图片(P图片)可以是可使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
双向预测性图片(B图片)可以是可使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多个预测性图片可使用多于两个参考图片和相关联的元数据以用于重建单个块。
源图片通常可在空间上细分成多个样本块(例如,4×4、8×8、4×8或16×16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测性编码,该其它块如由应用于块的相应图片的编码分配来确定。举例来说,I图片的块可进行非预测性编码,或该块可参考同一图片的已编码块来进行预测性编码(空间预测或帧内预测)。P图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时间预测进行预非测性编码。B图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时间预测进行非预测性编码。
视频编码器(203)可根据诸如ITU-T建议书H.265的预定视频编码技术或标准执行编码操作。在操作中,视频编码器(203)可执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此,已编码视频数据可符合所使用的视频编码技术或标准指定的语法。
在一个实施例中,传输器(440)可在传输已编码视频时传输附加数据。视频编码器(430)可包括此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/SNR增强层、诸如冗余图片和切片的其它形式的冗余数据、辅助增强信息(SEI)消息、视频可用性信息(VUI)的参数集片段等。
在更详细地描述本公开的实施例的某些方面之前,下面引入在本说明书的其余部分中提及的数个术语。
此后,在某些情况下,“子图片”指的是从语义上分组且可以以改变的分辨率独立编码的样本、块、宏块、编码单元或类似实体的矩形排列。一个或多个子图片可形成图片。一个或多个已编码子图片可形成已编码图片。一个或多个子图片可拼接成图片,且可从图片中提取一个或多个子图片。在某些环境中,一个或多个已编码子图片可以在压缩域中拼接,而不必转码到已编码图片中的样本水平,且在相同或某些其它情况下,可从压缩域中的已编码图片中提取一个或多个已编码子图片。
此后,“自适应分辨率改变”(ARC)指的是允许通过例如参考图片重采样来改变已编码视频序列内的图片或子图片的分辨率的机制。此后,“ARC参数”指的是执行自适应分辨率改变所需的控制信息,其可包括例如滤波器参数、缩放因子、输出和/或参考图片的分辨率、各种控制标志等。
本公开的系统和方法可以以任何顺序单独使用或组合使用。在本公开中,术语“DeltaQ”可指的是应用于“base_q_idx”的所有偏移值的集合或偏移值的组合。集合“DeltaQ”的元素包括但不限于:{“DeltaQYDc”、“DeltaQUDc”、“DeltaQVDc”、“DeltaQUAc”、“DeltaQVAc”、“base_y_dc_delta_q”、“base_uv_dc_delta_q”、“DeltaQYDc”-“base_y_dc_delta_q”、“DeltaQUDc”-“base_uv_dc_delta_q”、“DeltaQVDc”-“base_uv_dc_delta_q”}。在本公开中,与无损编码相关的qindex值表示成“qindex_lossless”。在AV1中,“qindex_lossless”的值为0。
本公开的实施例可实现本文参考的现有技术的各方面,且可不同于如下所述的现有技术。
根据一个或多个实施例,无损/有损模式需要满足的条件可不同于现有技术。
在一个实施例中,当“base_q_idx”等于“qindex_lossless”且“DeltaQ”的所有元素小于或等于“qindex_lossless”时,应用无损模式。
在一个实施例中,当“base_q_idx”不等于“qindex_lossless”或“DeltaQ”不同于“qindex_lossless”时,应用有损模式。
在一个实施例中,当“qindex”值“qindex_lossless”应用于所有系数,而不管这些系数来自AC或DC或者亮度或色度时,应用无损模式。
根据一个或多个实施例,用于无损模式的可使用的“qindex_lossless”可不同于现有技术。
在一个实施例中,如果“base_q_idx+DeltaQ”小于或等于零,“base_q_idx”等于“qindex_lossless”,且“DeltaQ”的所有元素小于或等于“qindex_lossless”,则clip(base_q_idx+DeltaQ)将产生零值,该零值可以是“qindex_lossless”值。
在一个实施例中,如果base_q_idx+DeltaQ小于或等于零,“base_q_idx”等于“qindex_lossless”,且“DeltaQ”的所有元素小于或等于“qindex_lossless”,则clip(base_q_idx+DeltaQ)将产生值A(值A还可以是“qindex_lossless”值),其中A是除了零之外的固定正整数值。
在一个实施例中,当可配置“base_q_idx”值的范围时,A的值取决于“base_q_idx”的范围。“base_q_idx”的示例值包括但不限于51,63,127,255。A的示例值包括但不限于0,1,2,3,4。
根据一个或多个实施例,用于有损模式的最小可使用的“qindex”可不同于现有技术。例如,本公开的解码器可基于确定是否满足某些条件来确定模式是有损还是无损,并设置clip函数的下限值以具有合适的A值(等于或不等于qindex_lossless)。
在一个实施例中,如果base_q_idx+DeltaQ小于零,“base_q_idx”不等于“qindex_lossless”,和/或“DeltaQ”的所有元素不小于或等于“qindex_lossless”,则clip(base_q_idx+DeltaQ)将产生非零值A作为“qindex”值,非零值A不等于“qindex_lossless”。A的示例值包括但不限于1,2,3,4,…,24。例如,本公开的解码器可设置clip函数的下限值,使得对值进行裁剪,且所得到的“qindex”值具有大于“qindex_lossless”值的值A,其中“qindex_lossless”等于0。即,例如,下限值可以是值n,其中n是正整数。
在一个实施例中,如果base_q_idx+DeltaQ小于零,“base_q_idx”不等于“qindex_lossless”,和/或“DeltaQ”的所有元素不小于或等于“qindex_lossless”,则clip(base_q_idx+DeltaQ)将产生值A的“qindex”值,值A不与无损编码相关联(例如,不等于“qindex_lossless”)。A的示例值包括但不限于0,1,2,3,4,…,24。例如,本公开的解码器可设置clip函数的下限值,使得对值进行裁剪,且所得到的“qindex”具有不同于“qindex_lossless”值的值A,其中“qindex_lossless”等于一个整数。即,例如,下限值可以是值n,其中n大于“qindex_lossless”值。
根据一个或多个实施例,用于无损模式的量化步长可不同于现有技术。
在一个实施例中,用于无损编码的量化步骤可以是等式4*POWER(2,精度)的结果。例如,本公开的解码器可通过使用上述等式来计算用于无损编码的量化步骤。“精度”的示例值包括但不限于0,1,2,3,4,5。
根据实施例,应用于无损编码模式的变换(例如AV1中的哈达玛变换)的输出进一步右移N位,其中N等于“精度”的值。例如,在一个实施例中,以如下方式右移N:在应用行和列变换期间导出的中间系数落在16+bitdepth_offset位范围内,其中“bitdepth_offset”取决于内部位深度。“bitdepth_offset”的示例值包括但不限于0,2,4。在一个实施例中,对于特定内部位深度下的行和列变换,所使用的“bitdepth_offset”值可以不同。
根据一个或多个实施例,用于有损模式的最小可使用的量化步长可不同于现有技术。
在一个实施例中,用于有损编码的最小量化步长可以是等式8*POWER(2,精度)的结果。例如,本公开的解码器可通过使用上述等式来计算用于有损编码的最小可使用的量化步骤。“精度”的示例值包括但不限于0,1,2,3,4,5。
根据实施例,应用于有损编码的变换的输出进一步右移N位,其中N等于“精度”。例如,在一个实施例中,以如下方式进行右移N:在应用行和列变换期间导出的中间系数落在16+bitdepth_offset位范围内,其中“bitdepth_offset”取决于内部位深度。“bitdepth_offset”的示例值包括但不限于0,2,4。在一个实施例中,对于特定内部位深度下的行和列变换,所使用的“bitdepth_offset”值可以不同。
本公开的实施例可包括至少一个处理器和存储有计算机指令的存储器。计算机指令可被配置成当计算机指令由至少一个处理器执行时,使得至少一个处理器执行本公开的实施例的功能。
例如,参考图7,本公开的解码器(700)可包括至少一个处理器和存储有计算机指令的存储器。计算机指令可包括第一获得代码(710)、第二获得代码(720)、第三获得代码(730)、第四获得代码(740)、确定代码(750)、第一设置代码(760)、第二设置代码(770)和解码代码(780)。解码器(700)可实现图2和图3所示的视频解码器(210)。
第一获得代码(710)可被配置成使得至少一个处理器获得第一语法元素(例如base_q_idx),第一语法元素指示已编码图像的AC系数的第一量化索引值。
第二获得代码(720)可被配置成使得至少一个处理器获得指示偏移值的至少一个第二语法元素(例如,集合DeltaQ的一个或多个元素)。
第三获得代码(730)可被配置成使得至少一个处理器获得已编码图像的另一个系数的第二量化索引值,第二量化索引值通过组合第一语法元素的第一量化索引值和至少一个第二语法元素的偏移值以获得组合值,并在组合值小于预定最小值的情况下将组合值修改为预定最小值以作为第二量化索引值来获得。组合可指的是将“base_q_idx”的值与“DeltaQ”的一个或多个元素的值组合,如本公开中描述的。修改可指的是应用如本公开中描述的clip函数。
第四获得代码(740)可被配置成使得至少一个处理器获得对应于所获得的第二量化索引值的量化步长。例如,根据一个或多个实施例,第四获得代码(740)可被配置成使得至少一个处理器通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得对应于第二量化索引值的量化步长。
确定代码(750)可被配置成使得至少一个处理器基于例如确定第一量化索引值是否等于与无损编码相关联的量化索引值(例如“qindex_lossless”),以及基于确定偏移值是否小于或等于与无损编码相关联的量化索引值,来确定对已编码图像进行解码所用的模式是有损模式还是无损模式。
第一设置代码(760)可被配置成使得至少一个处理器基于确定代码进行的确定而将预定最小值(例如,clip函数的下边界)设置成与组合值相当的值。例如,根据一个或多个实施例,第一设置代码(760)可配置成使得至少一个处理器基于确定第一量化索引值等于与无损编码相关联的量化索引值,以及基于确定偏移值小于或等于与无损编码相关联的量化索引值,来将预定最小值设置成与无损编码相关联的量化索引值。根据一个或多个实施例,第一设置代码(760)可配置成使得至少一个处理器基于确定第一量化索引值不等于与无损编码相关联的量化索引值,或者基于确定偏移值大于与无损编码相关联的量化索引值,来将预定最小值设置成不同于与无损编码相关联的量化索引值的值。与无损编码相关联的量化索引值(例如qindex_lossless)可以是0或不同于0的值。根据上文,第一设置代码(760)可被配置成修改本公开的clip函数。
第二设置代码(770)可被配置成使得至少一个处理器在至少一个查找表中设置与和无损编码相关联的量化索引值相关联的量化步长。例如,根据一个或多个实施例,第二设置代码(770)可被配置成使得至少一个处理器:执行2x乘以4的运算,其中x是预定值;以及在至少一个查找表中将与和无损编码相关联的量化索引值相关联的量化步长设置成运算的结果。可选地或附加地,第二设置代码(770)可被配置成使得至少一个处理器在至少一个查找表中设置与多个与有损编码相关联的量化索引值中的一个相关联的量化步长。例如,根据一个或多个实施例,第二设置代码(770)可被配置成使得至少一个处理器:执行2x乘以8的运算,其中x是预定值;以及在至少一个查找表中将与多个与有损编码相关联的量化索引值中的一个相关联的量化步长设置成运算的结果。
解码代码(780)可被配置成使得至少一个处理器基于确定代码进行的确定,并通过使用所获得的量化步长,来以有损模式或无损模式对已编码图像进行解码。
上文描述的本公开的实施例的技术可使用计算机可读介质实现为计算机软件,且可物理地存储在一个或多个计算机可读介质中。例如,图8示出了适合于实现所公开的主题的实施例的计算机系统(900)。
可使用任何合适的机器代码或计算机语言对计算机软件进行编码,任何合适的机器代码或计算机语言可经受汇编、编译、链接或类似的机制以创建包括指令的代码,该指令可由计算机中央处理单元(CPU)、图形处理单元(GPU)等直接执行或通过解释、微代码执行等执行。
指令可在各种类型的计算机或其组件上执行,计算机或其组件包括例如个人计算机、平板计算机、服务器、智能手机、游戏设备、物联网设备等。
图8所示的计算机系统(900)的组件本质上是示例性的,并不旨在对实施本公开的实施例的计算机软件的使用范围或功能提出任何限制。组件的配置也不应被解释为具有与计算机系统(900)的示例性实施例中所示的组件中的任何一个组件或组件的组合相关的任何依赖或要求。
计算机系统(900)可包括某些人机接口输入设备。此类人机接口输入设备可响应于一个或多个人类用户通过例如下述的输入:触觉输入(例如:击键、划动,数据手套移动)、音频输入(例如:语音、拍手)、视觉输入(例如:手势)、嗅觉输入(未示出)。人机接口设备还可用于捕获不一定与人的意识输入直接相关的某些媒介,例如音频(例如:语音、音乐、环境声音)、图像(例如:扫描的图像、从静止图像相机获取摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。
输入人机接口设备可包括下述中的一项或多项(每种中仅示出一个):键盘(901)、鼠标(902)、触控板(903)、触摸屏(910)、数据手套、操纵杆(905)、麦克风(906)、扫描仪(907)、相机(908)。
计算机系统(900)还可包括某些人机接口输出设备。此类人机接口输出设备可例如通过触觉输出、声音、光和气味/味道来刺激一个或多个人类用户的感官。此类人机接口输出设备可包括触觉输出设备(例如触摸屏(910)的触觉反馈、数据手套或操纵杆(905),但也可以是不作为输入设备的触觉反馈设备)。例如,此类设备可以是音频输出设备(例如:扬声器(909)、耳机(未示出))、视觉输出设备(例如包括CRT屏幕、LCD屏幕、等离子屏幕、OLED屏幕的屏幕(910),每种屏幕都有或没有触摸屏输入功能,每种屏幕都有或没有触觉反馈功能-其中的一些屏幕能够通过诸如立体图像输出之类的装置、虚拟现实眼镜(未示出)、全息显示器和烟箱(未示出)以及打印机(未示出)来输出二维视觉输出或超过三维的输出。
计算机系统(900)还可包括人类可访问存储设备及其关联介质,例如,包括具有CD/DVD等介质(921)的CD/DVD ROM/RW(920)的光学介质、指状驱动器(922)、可拆卸硬盘驱动器或固态驱动器(923)、诸如磁带和软盘之类的传统磁性介质(未描绘)、诸如安全软件狗之类的基于专用ROM/ASIC/PLD的设备(未描绘)等。
本领域技术人员还应该理解,结合当前公开的主题使用的术语“计算机可读介质”不涵盖传输介质、载波或其它暂时性信号。
计算机系统(900)还可包括通到一个或多个通信网络的接口。网络可例如是无线网络、有线网络、光网络。网络可进一步是本地网络、广域网络、城域网络、车辆和工业网络、实时网络、延迟容忍网络等。网络的示例包括诸如以太网之类的局域网、无线LAN、包括GSM、3G、4G、5G、LTE等的蜂窝网络、包括有线电视、卫星电视和地面广播电视的电视有线或无线广域数字网络、包括CANBus的车辆和工业用网络等。某些网络通常需要连接到某些通用数据端口或外围总线(949)的外部网络接口适配器(例如,计算机系统(900)的USB端口);如下所述,其它网络接口通常通过连接到系统总线而集成到计算机系统(900)的内核中(例如,连接到PC计算机系统中的以太网接口或连接到智能手机计算机系统中的蜂窝网络接口)。计算机系统(900)可使用这些网络中的任何一个网络与其它实体通信。此类通信可以是仅单向接收的(例如,广播电视)、仅单向发送的(例如,连接到某些CANbus设备的CANbus)或双向的,例如,使用局域网或广域网数字网络连接到其它计算机系统。此类通信可包括与云计算环境(955)的通信。如上所述,可在那些网络和网络接口中的每一个上使用某些协议和协议栈。
上述人机接口设备、人机可访问的存储设备和网络接口(954)可附接到计算机系统(900)的内核(940)。
内核(940)可包括一个或多个中央处理单元(CPU)(941),图形处理单元(GPU)(942),现场可编程门区域(FPGA)(943)形式的专用可编程处理单元、用于某些任务的硬件加速器(944)等。这些设备以及只读存储器(ROM)(945)、随机存取存储器(946)、诸如内部非用户可访问的硬盘驱动器、SSD等之类的内部大容量存储器(947)可通过系统总线(948)连接。在一些计算机系统中,可以以一个或多个物理插头的形式访问系统总线(948),以能够通过附加的CPU、GPU等进行扩展。外围设备可直接连接到内核的系统总线(948)或通过外围总线(949)连接到内核的系统总线(948)。外围总线的体系结构包括PCI、USB等。图形适配器950可包括在内核940中。
CPU(941)、GPU(942)、FPGA(943)和加速器(944)可执行某些指令,这些指令可以组合来构成上述计算机代码。该计算机代码可存储在ROM(945)或RAM(946)中。过渡数据也可存储在RAM(946)中,而永久数据可例如存储在内部大容量存储器(947)中。可通过使用高速缓存来进行到任何存储设备的快速存储及检索,该高速缓存可与下述紧密关联:一个或多个CPU(941)、GPU(942)、大容量存储器(947)、ROM(945)、RAM(946)等。
计算机可读介质可在其上具有用于执行各种由计算机实现的操作的计算机代码。介质和计算机代码可以是出于本公开的目的而专门设计和构造的介质和计算机代码,或者介质和计算机代码可以是计算机软件领域的技术人员公知且可用的类型。
作为非限制性示例,可由于一个或多个处理器(包括CPU、GPU、FPGA、加速器等)执行包含在一种或多种有形的计算机可读介质中的软件而使得具有架构(900),特别是内核(940)的计算机系统提供功能。此类计算机可读介质可以是与如上所述的用户可访问的大容量存储相关联的介质,以及某些非暂时性的内核(940)的存储器,例如内核内部大容量存储器(947)或ROM(945)。可将实施本公开的各实施例的软件存储在此类设备中并由内核(940)执行。根据特定需要,计算机可读介质可包括一个或多个存储设备或芯片。软件可使得内核(940),特别是其中的处理器(包括CPU、GPU、FPGA等)执行本文所描述的特定过程或特定过程的特定部分,包括定义存储在RAM(946)中的数据结构以及根据由软件定义的过程来修改此类数据结构。附加地或替换地,可由于硬连线或以其它方式体现在电路(例如,加速器(944))中的逻辑而使得计算机系统提供功能,该电路可替换软件或与软件一起运行以执行本文描述的特定过程或特定过程的特定部分。在适当的情况下,提及软件的部分可包含逻辑,反之亦然。在适当的情况下,提及计算机可读介质的部分可包括存储用于执行的软件的电路(例如集成电路(IC))、体现用于执行的逻辑的电路或包括两者。本公开包括硬件和软件的任何合适的组合。
虽然本公开已经描述了多个非限制性示例实施例,但是存在落入本公开的范围内的更改、置换和各种替换等效物。因此,应当理解,本领域技术人员将能够设计出许多虽然未在本文中明确示出或描述,但是体现了本公开的原理,因此落入本公开的精神和范围内的系统和方法。
Claims (20)
1.一种系统,包括:
至少一个存储器,被配置成存储计算机程序代码;以及
至少一个处理器,被配置成访问所述计算机程序代码并根据所述计算机程序代码的指示来操作,所述计算机程序代码包括:
第一获得代码,被配置成使得所述至少一个处理器获得第一语法元素,所述第一语法元素指示已编码图像的AC系数的第一量化索引值;
第二获得代码,被配置成使得所述至少一个处理器获得指示偏移值的至少一个第二语法元素;
第三获得代码,被配置成使得所述至少一个处理器获得所述已编码图像的另一个系数的第二量化索引值,所述第二量化索引值通过以下方式获得:组合所述第一语法元素的所述第一量化索引值和所述至少一个第二语法元素的所述偏移值以获得组合值,并在所述组合值小于预定最小值的情况下将所述组合值修改为所述预定最小值以作为所述第二量化索引值;
第四获得代码,被配置成使得所述至少一个处理器获得对应于所获得的第二量化索引值的量化步长;
确定代码,被配置成使得所述至少一个处理器基于确定所述第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定所述偏移值是否小于或等于所述与无损编码相关联的量化索引值,来确定对所述已编码图像进行解码所用的模式是有损模式还是无损模式;
第一设置代码,被配置成使得所述至少一个处理器基于所述确定代码进行的确定而将所述预定最小值设置成与所述组合值相当的值;以及
解码代码,被配置成使得所述至少一个处理器基于所述确定代码进行的确定并通过使用所获得的量化步长,来以所述有损模式或所述无损模式对所述已编码图像进行解码。
2.根据权利要求1所述的系统,其中,
所述第一设置代码被配置成使得所述至少一个处理器基于确定所述第一量化索引值等于所述与无损编码相关联的量化索引值以及基于确定所述偏移值小于或等于所述与无损编码相关联的量化索引值,来将所述预定最小值设置成所述与无损编码相关联的量化索引值。
3.根据权利要求2所述的系统,其中,
所述与无损编码相关联的量化索引值是0。
4.根据权利要求2所述的系统,其中,
所述与无损编码相关联的量化索引值是大于0的正整数值。
5.根据权利要求1所述的系统,其中,
第一设置代码被配置成使得所述至少一个处理器基于确定所述第一量化索引值不等于所述与无损编码相关联的量化索引值或者基于确定所述偏移值大于所述与无损编码相关联的量化索引值,来将所述预定最小值设置成与所述与无损编码相关联的量化索引值不同的值。
6.根据权利要求5所述的系统,其中,
所述与无损编码相关联的量化索引值是0。
7.根据权利要求5所述的系统,其中,
所述与无损编码相关联的量化索引值是不同于0的值。
8.根据权利要求1所述的系统,其中,
所述第四获得代码被配置成使得所述至少一个处理器通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得所述对应于第二量化索引值的量化步长,以及
所述计算机程序代码进一步包括第二设置代码,所述第二设置代码被配置成使得所述至少一个处理器在所述至少一个查找表中设置与所述与无损编码相关联的量化索引值相关联的量化步长。
9.根据权利要求8所述的系统,其中,
所述第二设置代码被配置成使得所述至少一个处理器:执行2x乘以4的运算,其中x是预定值;以及在所述至少一个查找表中将与所述与无损编码相关联的量化索引值相关联的量化步长设置成所述运算的结果。
10.根据权利要求1所述的系统,其中,
所述第四获得代码被配置成使得所述至少一个处理器通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得所述对应于第二量化索引值的量化步长,以及
所述计算机程序代码进一步包括第二设置代码,所述第二设置代码被配置成使得所述至少一个处理器在所述至少一个查找表中设置与多个与有损编码相关联的量化索引值中的一个相关联的量化步长。
11.根据权利要求10所述的系统,其中,
所述第二设置代码被配置成使得所述至少一个处理器:执行2x乘以8的运算,其中x是预定值;以及在所述至少一个查找表中将所述与多个与有损编码相关联的量化索引值中的一个相关联的量化步长设置成所述运算的结果。
12.一种方法,由至少一个计算机处理器执行,包括:
获得第一语法元素,所述第一语法元素指示已编码图像的AC系数的第一量化索引值;
获得指示偏移值的至少一个第二语法元素;
获得所述已编码图像的另一个系数的第二量化索引值,所述第二量化索引值通过以下方式获得:组合所述第一语法元素的所述第一量化索引值和所述至少一个第二语法元素的所述偏移值以获得组合值,并基于所述组合值小于预定最小值将所述组合值修改为所述预定最小值以作为所述第二量化索引值;
获得对应于所获得的第二量化索引值的量化步长;
基于确定所述第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定所述偏移值是否小于或等于所述与无损编码相关联的量化索引值,来确定对所述已编码图像进行解码所用的模式是有损模式还是无损模式;
基于所述确定而将所述预定最小值设置成与所述组合值相当的值;以及
基于所述确定并通过使用所获得的量化步长,来以所述有损模式或所述无损模式对所述已编码图像进行解码。
13.根据权利要求12所述的方法,其中,
所述设置包括:基于确定所述第一量化索引值等于所述与无损编码相关联的量化索引值以及基于确定所述偏移值小于或等于所述与无损编码相关联的量化索引值,来将所述预定最小值设置成所述与无损编码相关联的量化索引值。
14.根据权利要求13所述的方法,其中,
所述与无损编码相关联的量化索引值是大于0的正整数值。
15.根据权利要求12所述的方法,其中,
所述设置包括:基于确定所述第一量化索引值不等于所述与无损编码相关联的量化索引值或者基于确定所述偏移值大于所述与无损编码相关联的量化索引值,来将所述预定最小值设置成与所述与无损编码相关联的量化索引值不同的值。
16.根据权利要求13所述的方法,其中,
所述与无损编码相关联的量化索引值是不同于0的值。
17.根据权利要求12所述的方法,其中,
所述获得量化步长包括通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得所述对应于第二量化索引值的量化步长,以及
所述方法进一步包括:在所述至少一个查找表中设置与所述与无损编码相关联的量化索引值相关联的量化步长。
18.根据权利要求12所述的方法,其中,
所述获得量化步长包括通过使用指示多个量化索引值与多个量化步长之间的对应关系的至少一个查找表来获得所述对应于第二量化索引值的量化步长,以及
所述方法进一步包括:在所述至少一个查找表中设置与多个与有损编码相关联的量化索引值中的一个相关联的量化步长。
19.根据权利要求18所述的方法,其中,
所述设置包括:执行2x乘以8的运算,其中x是预定值;以及在所述至少一个查找表中将所述与多个与有损编码相关联的量化索引值中的一个相关联的量化步长设置成所述运算的结果。
20.一种非暂时性计算机可读介质,存储有计算机指令,当所述计算机指令由至少一个处理器执行时,所述计算机指令配置成使得所述至少一个处理器:
获得第一语法元素,所述第一语法元素指示已编码图像的AC系数的第一量化索引值;
获得指示偏移值的至少一个第二语法元素;
获得所述已编码图像的另一个系数的第二量化索引值,所述第二量化索引值通过以下方式获得:组合所述第一语法元素的所述第一量化索引值和所述至少一个第二语法元素的所述偏移值以获得组合值,并基于所述组合值小于预定最小值将所述组合值修改为所述预定最小值以作为所述第二量化索引值;
获得对应于所获得的第二量化索引值的量化步长;
基于确定所述第一量化索引值是否等于与无损编码相关联的量化索引值以及基于确定所述偏移值是否小于或等于所述与无损编码相关联的量化索引值,来确定对所述已编码图像进行解码所用的模式是有损模式还是无损模式;
基于所述确定而将所述预定最小值设置成与所述组合值相当的值;以及
基于所述确定并通过使用所获得的量化步长,来以所述有损模式或所述无损模式对所述已编码图像进行解码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410107449.1A CN117880506A (zh) | 2020-07-20 | 2020-11-16 | 视频解码系统、方法、视频解码器及计算机可读介质 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063054049P | 2020-07-20 | 2020-07-20 | |
US63/054,049 | 2020-07-20 | ||
US17/065,974 | 2020-10-08 | ||
US17/065,974 US11032546B1 (en) | 2020-07-20 | 2020-10-08 | Quantizer for lossless and near-lossless compression |
PCT/US2020/060742 WO2022019942A1 (en) | 2020-07-20 | 2020-11-16 | Quantizer for lossless & near-lossless compression |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410107449.1A Division CN117880506A (zh) | 2020-07-20 | 2020-11-16 | 视频解码系统、方法、视频解码器及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114556942A true CN114556942A (zh) | 2022-05-27 |
CN114556942B CN114556942B (zh) | 2024-02-06 |
Family
ID=76213365
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410107449.1A Pending CN117880506A (zh) | 2020-07-20 | 2020-11-16 | 视频解码系统、方法、视频解码器及计算机可读介质 |
CN202080068737.0A Active CN114556942B (zh) | 2020-07-20 | 2020-11-16 | 视频解码系统、方法及计算机可读介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410107449.1A Pending CN117880506A (zh) | 2020-07-20 | 2020-11-16 | 视频解码系统、方法、视频解码器及计算机可读介质 |
Country Status (6)
Country | Link |
---|---|
US (4) | US11032546B1 (zh) |
EP (1) | EP4008110A4 (zh) |
JP (1) | JP7278681B2 (zh) |
KR (2) | KR102626280B1 (zh) |
CN (2) | CN117880506A (zh) |
WO (1) | WO2022019942A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11399188B2 (en) * | 2020-01-01 | 2022-07-26 | Tencent America LLC | Method for mixed NAL unit type support in a coded picture |
US11770535B2 (en) * | 2021-02-19 | 2023-09-26 | Samsung Display Co., Ltd. | Systems and methods for joint color channel entropy encoding with positive reconstruction error |
US12047589B2 (en) * | 2021-09-30 | 2024-07-23 | Tencent America LLC | Deriving offsets in cross-component transform coefficient level reconstruction |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102918837A (zh) * | 2010-06-04 | 2013-02-06 | 索尼公司 | 图像处理设备和方法 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
US20150264376A1 (en) * | 2014-03-17 | 2015-09-17 | Qualcomm Incorporated | Quantization processes for residue differential pulse code modulation |
US20170064313A1 (en) * | 2015-08-31 | 2017-03-02 | Microsoft Technology Licensing, Llc | Acceleration interface for video decoding |
CN109417639A (zh) * | 2016-05-13 | 2019-03-01 | 交互数字Vc控股公司 | 利用自适应裁剪的视频编码的方法和设备 |
US20190116361A1 (en) * | 2017-10-12 | 2019-04-18 | Qualcomm Incorporated | Video coding with content adaptive spatially varying quantization |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3988990B2 (ja) * | 2002-08-27 | 2007-10-10 | 株式会社リコー | 符号変換装置、符号変換方法、プログラム及び記録媒体 |
JP6056124B2 (ja) * | 2011-09-05 | 2017-01-11 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US20130294524A1 (en) * | 2012-05-04 | 2013-11-07 | Qualcomm Incorporated | Transform skipping and lossless coding unification |
KR20220133337A (ko) * | 2014-03-16 | 2022-10-04 | 브이아이디 스케일, 인크. | 무손실 비디오 코딩의 시그널링을 위한 방법 및 장치 |
KR102267922B1 (ko) * | 2015-09-23 | 2021-06-22 | 노키아 테크놀로지스 오와이 | 360도 파노라마 비디오를 코딩하는 방법, 장치 및 컴퓨터 프로그램 제품 |
KR20180007680A (ko) * | 2016-07-13 | 2018-01-23 | 한국전자통신연구원 | 영상 부호화/복호화 방법 및 장치 |
US10587875B2 (en) * | 2017-03-01 | 2020-03-10 | Intel Corporation | Coding tools for subjective quality improvements in video codecs |
-
2020
- 2020-10-08 US US17/065,974 patent/US11032546B1/en active Active
- 2020-11-16 KR KR1020227008250A patent/KR102626280B1/ko active IP Right Grant
- 2020-11-16 CN CN202410107449.1A patent/CN117880506A/zh active Pending
- 2020-11-16 JP JP2022531577A patent/JP7278681B2/ja active Active
- 2020-11-16 WO PCT/US2020/060742 patent/WO2022019942A1/en unknown
- 2020-11-16 EP EP20946427.0A patent/EP4008110A4/en active Pending
- 2020-11-16 KR KR1020247001202A patent/KR20240010544A/ko not_active Application Discontinuation
- 2020-11-16 CN CN202080068737.0A patent/CN114556942B/zh active Active
-
2021
- 2021-04-28 US US17/243,132 patent/US11381821B2/en active Active
-
2022
- 2022-05-31 US US17/828,728 patent/US11750812B2/en active Active
-
2023
- 2023-06-27 US US18/342,349 patent/US20230336727A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102918837A (zh) * | 2010-06-04 | 2013-02-06 | 索尼公司 | 图像处理设备和方法 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
US20150264376A1 (en) * | 2014-03-17 | 2015-09-17 | Qualcomm Incorporated | Quantization processes for residue differential pulse code modulation |
US20170064313A1 (en) * | 2015-08-31 | 2017-03-02 | Microsoft Technology Licensing, Llc | Acceleration interface for video decoding |
CN109417639A (zh) * | 2016-05-13 | 2019-03-01 | 交互数字Vc控股公司 | 利用自适应裁剪的视频编码的方法和设备 |
US20190116361A1 (en) * | 2017-10-12 | 2019-04-18 | Qualcomm Incorporated | Video coding with content adaptive spatially varying quantization |
Non-Patent Citations (2)
Title |
---|
PETER DE RIVAY ,ET AL: "《AV1 Bitstream & Decoding Process Specification》", Retrieved from the Internet <URL:https://aomediacodec.github.io/av1-spec/av1-spec.pdf> * |
Z.-Y. LIN, T.-D. CHUANG, ETC: "《AHG18: Disabling dependent quantization in lossless coding》", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11:JVET-P0148》 * |
Also Published As
Publication number | Publication date |
---|---|
JP2023504800A (ja) | 2023-02-07 |
KR20240010544A (ko) | 2024-01-23 |
US11032546B1 (en) | 2021-06-08 |
US20230336727A1 (en) | 2023-10-19 |
WO2022019942A1 (en) | 2022-01-27 |
KR102626280B1 (ko) | 2024-01-18 |
CN117880506A (zh) | 2024-04-12 |
CN114556942B (zh) | 2024-02-06 |
KR20220043215A (ko) | 2022-04-05 |
US11750812B2 (en) | 2023-09-05 |
US20220295064A1 (en) | 2022-09-15 |
EP4008110A4 (en) | 2022-10-05 |
JP7278681B2 (ja) | 2023-05-22 |
EP4008110A1 (en) | 2022-06-08 |
US20220021880A1 (en) | 2022-01-20 |
US11381821B2 (en) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102648248B1 (ko) | 랜덤 액세스 포인트 및 픽처 유형의 식별 방법 | |
CN113875242A (zh) | 支持各种色度格式的视频编解码工具的信令 | |
JP2022513715A (ja) | 無指向性媒体符号化及び復号のためのラップアラウンドパディングの方法 | |
CN113382259B (zh) | 视频解码方法、装置和计算机设备 | |
CN114556942B (zh) | 视频解码系统、方法及计算机可读介质 | |
AU2024205187A1 (en) | Signaling of adaptive picture size in video bitstream | |
CN112514385B (zh) | 视频解码方法及装置、计算机设备和计算机可读介质 | |
CN112005549B (zh) | 一种帧内-帧间预测控制方法、装置、设备及存储介质 | |
CN113711605A (zh) | 用于在已编码图片中支持混合nal单元类型的方法 | |
CN112118456B (zh) | 莱斯参数选择方法、装置、计算机设备及存储介质 | |
CN113994676A (zh) | 视频编解码方法和装置 | |
CN113316932B (zh) | 编解码方法、装置和设备 | |
CN113273152B (zh) | 媒体解码的方法、装置与计算机可读介质 | |
CN113632456A (zh) | 用信号通知接入单元分界符的方法 | |
US20230075516A1 (en) | System and method for decoding including network abstraction layer unit structure with picture header | |
CN113508582A (zh) | 多线帧内预测的模式列表生成 | |
CN115867906A (zh) | 使用基于会话的dash操作的基于会话的描述url定制 | |
CN110636296B (zh) | 视频解码方法、装置、计算机设备以及存储介质 | |
CN113785495A (zh) | 灵活的图片分割 | |
CN115552898A (zh) | 视频编码中并行处理的改进 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40072089 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |