CN117640942A - 一种用于视频图像的编码方法和装置 - Google Patents
一种用于视频图像的编码方法和装置 Download PDFInfo
- Publication number
- CN117640942A CN117640942A CN202311124557.1A CN202311124557A CN117640942A CN 117640942 A CN117640942 A CN 117640942A CN 202311124557 A CN202311124557 A CN 202311124557A CN 117640942 A CN117640942 A CN 117640942A
- Authority
- CN
- China
- Prior art keywords
- value
- determining
- image
- threshold
- brightness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 238000012545 processing Methods 0.000 claims abstract description 38
- 230000000873 masking effect Effects 0.000 claims description 98
- 238000013507 mapping Methods 0.000 claims description 58
- 230000008569 process Effects 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 241000282414 Homo sapiens Species 0.000 description 34
- 230000006870 function Effects 0.000 description 18
- 238000012360 testing method Methods 0.000 description 17
- 230000009466 transformation Effects 0.000 description 16
- 230000000007 visual effect Effects 0.000 description 12
- 101150039623 Clip1 gene Proteins 0.000 description 10
- 238000004088 simulation Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000016776 visual perception Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种用于视频图像的编码方法和装置,属于视频编解码处理领域。所述发明包括从视频图像中提取亮度分量,确定失真度量值,根据失真度量值获取与视频图像对应的第一阈值和第二阈值,根据第一阈值和第二阈值确定控制参数,基于控制参数对视频图像进行编码,得到编码后的视频图像。通过利用恰可察觉误差,克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于从而更好的改善视频中有序区域的感知质量,提高视频整体的观看感受。
Description
技术领域
本发明属于视频编解码处理领域,特别涉及一种用于视频图像的编码方法和装置。
背景技术
高动态范围(High-Dynamic Range,HDR)视频,将会成为电视领域里的下一件大事。HDR视频可同时大幅度拓展对比度和色彩,画面中明亮的部分会更加明亮,从而使其看上去更具“深度”;而色彩的拓展的能让红绿蓝和它们之间的所有颜色看上去更加明亮纯粹。为了降低码率的同时提供高质量的视觉效果,对高动态范围(HDR)视频的编码称为当前视频技术领域的重点研究对象。
由于大多数视频编码传输的最终接收者是人类,而编码和传输人眼不能察觉或者不感兴趣的信息对于网络宽带来说是种浪费,因此视频编码算法要尽可能的考虑人类视觉系统(Human Visual System,HVS)的特性。基于这种思想,利用人眼视觉理论来指导视频压缩,降低压缩码率是视频压缩技术的一个重要研究方向。
在实现本发明的过程中,发明人发现现有技术没有充分考虑人眼的视觉特性,导致编码过程无法根据视频内容进行自适应处理,使得编码运算量过大,降低了编码效率。
发明内容
为了解决现有技术的问题,本发明实施例中提供了用于视频图像的编码方法和装置。
根据本发明的一个实施例,提供了一种用于视频图像的编码方法,所述用于视频图像的编码方法,包括:
从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值;
根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值;
根据所述第一阈值和所述第二阈值确定控制参数;
基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像。
可选地,从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值,包括:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
可选地,获取与所述输入图像对应的有序图和无序图,包括:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
可选地,获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值,包括:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
可选地,根据所述第一阈值和所述第二阈值确定控制参数,包括:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
根据本发明的另一个实施例,提供了一种用于视频图像的编码装置,所述用于视频图像的编码装置,包括:
提取单元,用于从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值;
获取单元,用于根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值;
处理单元,用于根据所述第一阈值和所述第二阈值确定控制参数;
控制单元,用于基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像。
可选地,提取单元,用于:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
可选地,提取单元,具体用于:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
可选地,提取单元,具体用于:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
可选地,控制单元,用于:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
根据本发明的另一个实施例,还提供了一种控制参数的确定方法,包括:对图像中像素的亮度进行映射,得到亮度映射值;根据所述亮度映射值,确定所述像素的第一失真度量值;根据所述第一失真度量值,确定所述图像的第一阈值和所述图像中编码块的第二阈值;根据所述第一阈值和所述第二阈值,确定权重参数;根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数。
可选地,对所述图像中像素的亮度进行映射,得到所述亮度映射值,包括:将所述图像中像素的亮度的采样值转换为亮度值;对所述亮度值进行非线性处理后得到所述亮度映射值。
可选地,根据所述亮度映射值确定所述像素的第一失真度量值包括:确定所述图像的预测图像,其中,根据所述亮度映射值与白噪声的加权和设置所述预测图像中的像素值;根据所述预测图像确定所述第一失真度量值。
可选地,根据所述预测图像确定所述第一失真度量值包括:确定所述预测图像中像素的平均背景亮度值,将所述预测图像中与像素点对应的亮度掩蔽值设置为所述平均背景亮度值经亮度掩模处理后的值;将梯度加权值设置为所述预测图像中像素四个方向梯度中最大的加权平均梯度值;将空间掩蔽值设置为所述平均背景亮度值经所述梯度加权值进行加权处理后的值与所述平均背景亮度值加权值的和值;将第一变量设置为所述亮度掩蔽值、所述空间掩蔽值、所述亮度掩蔽值与所述空间掩蔽值之间较小者的加权和;将第二变量设置为所述图像与所述预测图像中对应像素的差值的加权值;将所述第一失真度量值设置为所述第一变量、所述第二变量、所述第一变量与第二变量之间较小者的加权和。
可选地,根据所述第一失真度量值,确定所述图像的所述第一阈值和所述图像中编码块的所述第二阈值,包括:将所述第一阈值设置为所述图像中像素的所述第一失真度量值的平均值;将所述第二阈值设置为所述编码块中像素的所述第一失真度量值的平均值。
可选地,根据所述第一阈值和所述第二阈值,确定所述权重参数,包括:计算所述第一阈值与所述第二阈值之间的差值;计算所述差值的指数关系映射值;将所述权重参数设置为所述指数关系映射值的多项式加权和。
可选地,根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数,包括:将所述控制参数设置为所述权重参数对第一控制参数的加权值,其中,根据所述编码块量化参数的指数映射值的加权值设置所述第一控制参数。
可选地,在根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数之后,还包括:使用所述控制参数确定所述编码块的编码参数。
根据本发明的另一方面,还提供了一种控制参数的确定装置,包括:映射模块,用于对图像中像素的亮度进行映射,得到亮度映射值;第一确定模块,用于根据所述亮度映射值,确定所述像素的第一失真度量值;第二确定模块,用于根据所述第一失真度量值,确定所述图像的第一阈值和所述图像中编码块的第二阈值;第三确定模块,用于根据所述第一阈值和所述第二阈值,确定权重参数;第四确定模块,用于根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数。
可选地,所述映射模块包括:转换单元,用于将所述图像中像素的亮度的采样值转换为亮度值;得到单元,用于对所述亮度值进行非线性处理后得到所述亮度映射值。
可选地,所述第一确定模块包括:第一确定单元,用于确定所述图像的预测图像,其中,根据所述亮度映射值与白噪声的加权和设置所述预测图像中的像素值;第二确定单元,用于根据所述预测图像确定所述第一失真度量值。
可选地,所述第二确定单元具体用于:确定所述预测图像中像素的平均背景亮度值,并将所述预测图像中与每个像素点对应的亮度掩蔽值设置为所述平均背景亮度值经亮度掩模处理后的值;将梯度加权值设置为所述预测图像中像素四个方向梯度中最大的加权平均梯度值;将空间掩蔽值设置为所述平均背景亮度值经所述梯度加权值进行加权处理后的值与所述平均背景亮度值加权值的和值;将第一变量设置为所述亮度掩蔽值、所述空间掩蔽值、所述亮度掩蔽值与所述空间掩蔽值之间较小者的加权和;将第二变量设置为所述图像与所述预测图像中对应像素的差值的加权值;将所述第一失真度量值设置为所述第一变量、所述第二变量、所述第一变量与第二变量之间较小者的加权和。
可选地,所述第二确定模块包括:第一设置单元,用于将所述第一阈值设置为所述图像中像素的所述第一失真度量值的平均值;第二设置单元,用于将所述第二阈值设置为所述编码块中像素的所述第一失真度量值的平均值。
可选地,所述第三确定模块包括:第一计算单元,用于计算所述第一阈值与所述第二阈值之间的差值;第二计算单元,用于计算所述差值的指数关系映射值;第三设置单元,用于将所述权重参数设置为所述指数关系映射值的多项式加权和。
可选地,所述第四确定模块包括:第四设置单元,用于将所述控制参数设置为所述权重参数对第一控制参数的加权值,其中,根据所述编码块量化参数的指数映射值的加权值设置所述第一控制参数。
可选地,所述装置还包括:第五确定模块,用于在根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数之后,使用所述控制参数确定所述编码块的编码参数。
本发明提供的技术方案带来的有益效果是:
通过利用恰可察觉误差,克服了在以往的恰可察觉误差(Just-Noticeable-Difference,简称为JND)模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于更好的改善视频中有序区域的感知质量,提高视频整体的观看感受。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种用于视频图像的编码方法的结构示意图;
图2是本发明提供的一种用于视频图像的编码装置的结构示意图;
图3(a)是测试序列Market的原始视频帧图;
图3(b)是测试序列Market的FEJND阈值图;
图4(a)是对测试序列Market使用HM16.2方法处理得到的重建帧;
图4(b)是对测试序列Market使用HM16.2方法处理得到的重建帧的局部放大图;
图4(c)是基于本发明提供的用于视频图像的编码方法的对测试序列Market进行处理后的重建帧;
图4(d)是基于本发明提供的用于视频图像的编码方法的对测试序列Market进行处理后的重建帧的局部放大图;
图5(a)是对测试序列Balloon使用HM16.2方法处理得到的重建帧;
图5(b)是对测试序列Balloon使用HM16.2方法处理得到的重建帧的局部放大图一;
图5(c)是对测试序列Balloon使用HM16.2方法处理得到的重建帧的局部放大图二;
图5(d)是基于本发明提供的用于视频图像的编码方法的对测试序列Balloon进行处理后的重建帧;
图5(e)是基于本发明提供的用于视频图像的编码方法的对测试序列Balloon进行处理后的重建帧的局部放大图一;
图5(f)是基于本发明提供的用于视频图像的编码方法的对测试序列Balloon进行处理后的重建帧的局部放大图二。
具体实施方式
为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进一步地描述。
实施例一
本发明提供了一种用于视频图像的编码方法,如图1所示,所述用于视频图像的编码方法,包括:
11、从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值。
12、根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值。
13、根据所述第一阈值和所述第二阈值确定控制参数。
14、基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像。
在实施中,为了解决现有编码技术中无法进行内容自适应,导致编码效率低下的缺陷,本发明提供了一种用于视频图像的编码方法,该编码方法中获取失真度量值,基于失真度量值将视频帧分解为有序图和无序图。对于有序图,结合人类视觉系统的亮度掩蔽效应计算亮度掩蔽值,结合空间掩蔽效应计算空间掩蔽值,联合亮度和空间掩蔽值得到有序图的JND。联合有序图和无序图的JND得到每个像素点的自由能量恰克察觉误差(Free-Energy JND,简称为FEJND),将FEJND用于模式选择过程的拉格朗日乘子调整。最后对解码之后的视频进行编码,得到编码后视频图像。
值得注意的是,在步骤11获取到的失真度量值本质上为视频图像的FEJND阈值,基于该阈值,在步骤12中,确定视频图像中所有像素的平均FEJND阈值即FEJNDframe作为第一阈值。类似的,在视频图像中划分若干数量的编码单元(Coding Unit,简称为CU),将每个编码单元中所有像素的平均FEJND阈值作为该编码单元的阈值FEJNDCU即第二阈值。以便于步骤13中基于第一阈值FEJNDframe和第二阈值FEJNDCU确定编码过程中的控制参数。
在上述处理过程中,通过利用自由能量(Free-Energy,简称为FE)原则,也即人眼对视频中无序区域的掩蔽效应来改善现有的JND模型,提高无序区域的JND。这里的JND,也即恰可察觉误差,是指人眼观察时可以区分出差异的最小阈值。该方法克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余。另外,本发明根据已有的亮度掩膜(Luminance Masking,简称为LM),并结合HEVC Main 10框架支持的数据格式,得出一种适用于量化后的HDR视频的亮度掩膜,联合使用所得的亮度掩膜与空间掩膜可以更加准确的估计有序区域的JND。从而更好的改善视频中有序区域的感知质量,提高视频整体的主观质量。
本发明提供了一种用于视频图像的编码方法,包括从视频图像中提取亮度分量,确定失真度量值,根据失真度量值获取与视频图像对应的第一阈值和第二阈值,根据第一阈值和第二阈值确定控制参数,基于控制参数对视频图像进行编码,得到编码后的视频图像。通过利用恰可察觉误差,克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于从改善视频中有序区域的感知质量,提高视频整体的观看感受。
可选的,从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值,包括:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
在实施中,步骤11的具体实现方式为:
101、对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像。
在该步骤中对视频图像进行编码预处理的方式具体分为四步,依次为利用编码变换函数处理HDR视频、颜色空间变换、将颜色空间变换后的视频量化到10比特范围、色度下采样使得视频格式从4:4:4变换到4:2:0,这个步骤具体为:
a)利用编码变换函数处理HDR视频;
R'=PQ_TF(max(0,min(R/10000,1)));
G'=PQ_TF(max(0,min(G/10000,1)));
B'=PQ_TF(max(0,min(B/10000,1)));
其中,函数max(x,y)表示取两者之间的最大值,min(x,y)表示取两者之间的最小值。系数m1、m2分别为0.1593、78.8438,c1、c2和c3分别为0.8359、18.8516和18.6875。
b)颜色空间变换:从R'G'B'到Y'CbCr;
Y'=0.262700*R'+0.678000*G'+0.059300*B';
Cb=-0.139630*R'-0.360370*G'+0.500000*B';
Cr=0.500000*R'-0.459786*G'-0.040214*B';
c)将颜色空间变换后的视频量化到10比特范围;
DY'=Clip1Y(Round((1<<(BitDepthY-8))*(219*Y'+16)));
DCb=Clip1C(Round((1<<(BitDepthC-8))*(224*Cb+128)));
DCr=Clip1C(Round((1<<(BitDepthC-8))*(224*Cr+128)));
其中,
Round(x)=Sign(x)*Floor(Abs(x)+0.5);
Floor(x):小于或等于x的最大整数;
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x);
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x);
符号“<<”表示左移运算符。BitDepthY表示Y'的比特深度,BitDepthC表示Cb和Cr的比特深度。这里BitDepthY和BitDepthC均取为10。
d)色度下采样使得视频格式从4:4:4变换到4:2:0。
在完成上述四步处理后,得到预处理视频图像,提取其中的亮度分量DY',基于亮度分量DY'构建输入图像F。
102、获取与所述输入图像对应的有序图和无序图。
从输入图像F中获取到的有序图对应人眼较为敏感的图像区域,而无序图则对应人眼不是很敏感的图像区域,具体获取有序图和无序图的步骤在下文中进行具体描述。
103、获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
在获取到有序图和无序图后,还要确定与其对应的有序阈值和无序阈值,以便于根据有序阈值和无序阈值确定失真度量值,进而根据失真度量值获取后文中的第一阈值和第二阈值,从而最终确定对视频图像进行编码过程中的控制参数。
可选的,获取与所述输入图像对应的有序图和无序图,包括:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
在实施中,基于公式一和公式二即可获取有序图P及无序图D,有序图对应人眼较为敏感的图像区域,而无序图则对应人眼不是很敏感的图像区域。
在本步骤中,利用FEJND模型将视频图像分为有序图和无序图,是为了后续步骤中使用视觉权重参数调整率失真优化过程中的拉格朗日乘子。
在本步骤使用了率失真理论,该理论是用信息论的基本观点和方法研究数据压缩问题的理论,又称限失真信源编码理论。使用该理论的目的是为人眼敏感的有序区域分配较多的比特率,而对人眼不敏感的无序区域则分配较少的比特率,有效提高了有序区域的感知质量,而在无序区域则隐藏了更多的失真,完美的结合了人类视觉系统的掩蔽机制,在降低编码比特率的同时提高了视觉感知质量。
可选的,获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值,包括:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
在实施中,步骤103的具体实现方式为:
1031、在获取有序阈值JNDp(x,y)之前,需要获取到有序图中与每个像素点对应的亮度掩蔽值LC(x,y)以及与有序图中每个像素点对应的空间掩蔽值SM(x,y),二者的具体获取方式可以参考如下公式:
在公式中,bg(x,y)是每个像素点的平均背景亮度值,基于下边的公式获取,
其中,B(i,j)是一个低通滤波器,如下所示:
在获取亮度掩蔽值LC(x,y)公式中的LM(·)是适用于量化后HDR视频的亮度掩膜分量,由前文步骤101中的分步骤c)的内容中量化过程可知,亮度分量Y’的量化值DY'范围是[64,940],64和940分别对应编码变换函数能编码的最低亮度(10-6cd/m2)和最高亮度(104cd/m2),因此亮度掩膜分量LM(·)只考虑范围[64,940]内的值,计算过程如下:
计算过程中使用的逆变换编码函数inversePQ_TF(·)计算如下:
系数m1、m2分别为0.1593、78.8438,c1、c2和c3分别为0.8359、18.8516和18.6875。在获取空间掩蔽值SM(x,y)过程中的函数mg(x,y)是像素点(x,y)周围四个方向的梯度中最大的加权平均梯度,
其中,Gk(i,j)是用来确定纹理区域的四个方向上的高通滤波器,如下所示:
基于上述内容,在获取空间掩蔽值SM(x,y)过程中的函数α(bg(x,y))和β(bg(x,y))的表达式为:
1032、在获取到亮度掩蔽值LC(x,y)和空间掩蔽值SM(x,y)后,结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三。
1033、结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
1034、结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
在完成步骤1034后,即获取到与视频图像对应的失真度量值FEJND(x,y),该失真度量值其实是视频图像中每个像素值的FEJND阈值,在前文中已经提出,基于该FEJND阈值确定视频图像中所有像素的平均FEJND阈值即FEJNDframe作为第一阈值,以及将每个编码单元中所有像素的平均FEJND阈值作为该编码单元的阈值FEJNDCU即第二阈值。根据所述第一阈值和所述第二阈值确定控制参数,如下文所示。
可选的,根据所述第一阈值和所述第二阈值确定控制参数,包括:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
在实施中,基于获取到的第一阈值FEJNDframe和第二阈值FEJNDCU确定编码过程中的控制参数λ,确定该控制参数λ的具体步骤分为:
301、结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4。
302、基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λ`R(s,c,mode|QP) 公式七。
其中,J为代价函数,D是失真值,R是编码比特率值,s和c分别表示原图和通过编码之后的重建图像,mode表示基本编码单元可选择的编码模式。
对公式七求基于R的偏导数,令偏导数的值为零即获取到λ`的值即λsse为HEVC中原始的拉格朗日乘子,结合公式λ=η*λsse确定最终的控制参数λ。
由于公式七构建的代价函数中包含有失真值D和编码比特率值R,因此求解出的λ`为同时考虑失真值D和编码比特率值R的最优解,因此基于λ`结合步骤301确定的确定权重参数η得到的控制参数λ进行编码,可以将为人眼敏感的有序区域分配较多的比特率,而对人眼不敏感的无序区域则分配较少的比特率,有效提高了有序区域的感知质量,而在无序区域则隐藏了更多的失真,完美的结合了人类视觉系统的掩蔽机制,在降低编码比特率的同时提高了视觉感知质量。
在获取到的控制参数λ后,令编码器根据λ对视频图像进行编码。在后续编码过程中还包括依次为色度上采样使得视频格式从4:2:0变换到4:4:4,将颜色空间变换后的视频量化到16比特范围、颜色空间反变换、利用逆编码变换函数处理HDR视频的处理步骤,得到最终的编码后图像,由于篇幅所限,不对该部分内容进行详细描述。
本发明提供了一种用于视频图像的编码方法,包括从视频图像中提取亮度分量,确定失真度量值,根据失真度量值获取与视频图像对应的第一阈值和第二阈值,根据第一阈值和第二阈值确定控制参数,基于控制参数对视频图像进行编码,得到编码后的视频图像。通过利用恰可察觉误差,克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于更好的改善视频中有序区域的感知质量,提高视频整体的观看感受。
在本发明实施例中,还提供了一种控制参数的确定方法,包括如下步骤:
S1,对图像中像素的亮度进行映射,得到亮度映射值;
S2,根据上述亮度映射值,确定上述像素的第一失真度量值(例如,上述的FEJND(x,y));
S3,根据上述第一失真度量值,确定图像的第一阈值(例如,上述的FEJNDframe)和图像中编码块的第二阈值(例如,上述的FEJNDCU);
S4,根据上述第一阈值和第二阈值,确定权重参数;
S5,根据上述权重参数,确定对编码块的编码参数进行确定过程中使用的控制参数。
其中,上述的图像可以是视频图像,当上述图像是视频图像时,上述第一失真度量值相当于本发明其它实施例中所提及的失真度量值。
在一个可选的实施例中,可以通过如下方式对图像中像素的亮度进行映射,得到所述亮度映射值:将上述图像中像素的亮度的采样值转换为亮度值;对上述亮度值进行非线性处理后得到上述亮度映射值。
在一个可选的实施例中,可以通过如下方式根据上述亮度映射值确定像素的第一失真度量值:确定上述图像的预测图像(例如,上述的有序图P),其中,根据上述亮度映射值与白噪声的加权和设置上述预测图像中的像素值;根据上述预测图像确定第一失真度量值。
下面对如何根据预测图像确定第一失真度量值进行说明:
可以通过如下方式确定上述第一失真度量值:确定上述预测图像中像素的平均背景亮度值,将上述预测图像中与像素点对应的亮度掩蔽值设置为平均背景亮度值经亮度掩模处理后的值;将梯度加权值设置为上述预测图像中像素四个方向梯度中最大的加权平均梯度值;将空间掩蔽值设置为上述平均背景亮度值经梯度加权值进行加权处理后的值与平均背景亮度值加权值的和值;将第一变量设置为上述亮度掩蔽值、空间掩蔽值、亮度掩蔽值与空间掩蔽值之间较小者的加权和(即,进行加权的是三个值,分别是亮度掩蔽值、控件掩蔽值、亮度掩蔽值与空间掩蔽值之间较小者,在进行加权计算时,加权参数可以是正数也可以是负数)(例如,上述的公式三);将第二变量设置为上述图像与预测图像中对应像素的差值的加权值(例如,上述的公式四);将上述第一失真度量值设置为上述第一变量、第二变量、第一变量与第二变量之间较小者的加权和(即,进行加权的是三个值,分别是第一变量、第二变量、第一变量与第二变量之间较小者,在进行加权计算时,加权参数可以是正数也可以是负数)(例如,上述的公式五)。
在一个可选的实施例中,根据上述第一失真度量值,确定图像的第一阈值和图像中编码块的第二阈值时,可以通过如下方式确定:将上述第一阈值设置为图像中像素的第一失真度量值的平均值;将上述第二阈值设置为编码块中像素的第一失真度量值的平均值。
在一个可选的实施例中,根据上述第一阈值和第二阈值,确定上述权重参数时,可以通过如下方式确定:计算第一阈值与第二阈值之间的差值;计算差值的指数关系映射值;将上述权重参数设置为指数关系映射值的多项式加权和。
在一个可选的实施例中,根据上述权重参数,确定对编码块的编码参数进行确定过程中使用的控制参数,可以通过如下方式实现:将上述控制参数设置为权重参数对第一控制参数的加权值,其中,根据编码块量化参数的指数映射值的加权值设置上述第一控制参数。
在一个可选的实施例中,在根据上述权重参数,确定对编码块的编码参数进行确定过程中使用的控制参数之后,上述方法还包括:使用上述控制参数确定编码块的编码参数。在本实施例中,在确定了编码块的编码参数后,可以利用确定的编码参数对上述图像进行编码,以得到编码后的图像。
实施例二
本实施例提供了一种用于视频图像的编码装置2,如图2所示,所述用于视频图像的编码装置,包括:
提取单元21,用于从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值;
获取单元22,用于根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值;
处理单元23,用于根据所述第一阈值和所述第二阈值确定控制参数;
控制单元24,用于基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像。
在实施中,为了解决现有编码技术中无法进行内容自适应,导致编码效率低下的缺陷,本发明提供了一种用于视频图像的编码方法,该编码方法中获取失真度量值,基于失真度量值将视频帧分解为有序图和无序图。对于有序图,结合人类视觉系统的亮度掩蔽效应计算亮度掩蔽值,结合空间掩蔽效应计算空间掩蔽值,联合亮度和空间掩蔽值得到有序图的恰可察觉误差。联合有序图和无序图的JND得到每个像素点的Free-Energy JND(FEJND),将FEJND用于模式选择过程的拉格朗日乘子调整。最后对解码之后的视频进行编码,得到编码后视频图像。
值得注意的是,在提取单元21中获取到的失真度量值本质上为视频图像的FEJND阈值,基于该阈值,在获取单元22中,确定视频图像中所有像素的平均FEJND阈值即FEJNDframe作为第一阈值。类似的,在视频图像中划分若干数量的编码单元Coding Unit,将每个编码单元中所有像素的平均FEJND阈值作为该编码单元的阈值FEJNDCU即第二阈值。以便于处理单元23中基于第一阈值FEJNDframe和第二阈值FEJNDCU确定编码过程中的控制参数。
在上述处理过程中,通过利用自由能量原则,也即人眼对视频中无序区域的掩蔽效应来改善现有的JND模型,提高无序区域的JND。这里的JND,也即恰可察觉误差,是指人眼观察时可以区分出差异的最小阈值。该方法克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余。另外,本发明根据已有的亮度掩膜,并结合HEVC Main 10框架支持的数据格式,得出一种适用于量化后的HDR视频的亮度掩膜,联合使用所得的亮度掩膜与空间掩膜可以更加准确的估计有序区域的JND。从而更好的改善视频中有序区域的感知质量,提高视频整体的主观质量。
本发明提供了一种用于视频图像的编码装置,包括从视频图像中提取亮度分量,确定失真度量值,根据失真度量值获取与视频图像对应的第一阈值和第二阈值,根据第一阈值和第二阈值确定控制参数,基于控制参数对视频图像进行编码,得到编码后的视频图像。通过利用恰可察觉误差,克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于更好的改善视频中有序区域的感知质量,提高视频整体的观看感受。
可选的,提取单元21,用于:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
在实施中,提取单元21的具体工作方式为:
401、对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像。
在该步骤中对视频图像进行编码预处理的方式具体分为四步,依次为利用编码变换函数处理HDR视频、颜色空间变换、将颜色空间变换后的视频量化到10比特范围、色度下采样使得视频格式从4:4:4变换到4:2:0,这个步骤具体为:
a)利用编码变换函数处理HDR视频;
R'=PQ_TF(max(0,min(R/10000,1)));
G'=PQ_TF(max(0,min(G/10000,1)));
B'=PQ_TF(max(0,min(B/10000,1)));
其中,函数max(x,y)表示取两者之间的最大值,min(x,y)表示取两者之间的最小值。系数m1、m2分别为0.1593、78.8438,c1、c2和c3分别为0.8359、18.8516和18.6875。
b)颜色空间变换:从R'G'B'到Y'CbCr;
Y'=0.262700*R'+0.678000*G'+0.059300*B';
Cb=-0.139630*R'-0.360370*G'+0.500000*B';
Cr=0.500000*R'-0.459786*G'-0.040214*B';
c)将颜色空间变换后的视频量化到10比特范围;
DY'=Clip1Y(Round((1<<(BitDepthY-8))*(219*Y'+16)));
DCb=Clip1C(Round((1<<(BitDepthC-8))*(224*Cb+128)));
DCr=Clip1C(Round((1<<(BitDepthC-8))*(224*Cr+128)));
其中,
Round(x)=Sign(x)*Floor(Abs(x)+0.5);
Floor(x):小于或等于x的最大整数;
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x);
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x);
符号“<<”表示左移运算符。BitDepthY表示Y'的比特深度,BitDepthC表示Cb和Cr的比特深度。这里BitDepthY和BitDepthC均取为10。
d)色度下采样使得视频格式从4:4:4变换到4:2:0。
在完成上述四步处理后,得到预处理视频图像,提取其中的亮度分量DY',基于亮度分量DY'构建输入图像F。
402、获取与所述输入图像对应的有序图和无序图。
从输入图像F中获取到的有序图对应人眼较为敏感的图像区域,而无序图则对应人眼不是很敏感的图像区域,具体获取有序图和无序图的步骤在下文中进行具体描述。
403、获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值。
在获取到有序图和无序图后,还要确定与其对应的有序阈值和无序阈值,以便于根据有序阈值和无序阈值确定失真度量值,进而根据失真度量值获取后文中的第一阈值和第二阈值,从而最终确定对视频图像进行编码过程中的控制参数。
可选的,提取单元21,具体用于:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
在实施中,基于公式一和公式二即可获取有序图P及无序图D,有序图对应人眼较为敏感的图像区域,而无序图则对应人眼不是很敏感的图像区域。
在本步骤中,利用FEJND模型将视频图像分为有序图和无序图,是为了后续步骤中使用视觉权重参数调整率失真优化过程中的拉格朗日乘子。
在本步骤使用了率失真理论,该理论是用信息论的基本观点和方法研究数据压缩问题的理论,又称限失真信源编码理论。使用该理论的目的是为人眼敏感的有序区域分配较多的比特率,而对人眼不敏感的无序区域则分配较少的比特率,有效提高了有序区域的感知质量,而在无序区域则隐藏了更多的失真,完美的结合了人类视觉系统的掩蔽机制,在降低编码比特率的同时提高了视觉感知质量。
可选的,提取单元21,具体用于:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
在实施中,提取单元21确定失真度量值FEJND(x,y)的具体实现方式为:
1031、在获取有序阈值JNDp(x,y)之前,需要获取到有序图中与每个像素点对应的亮度掩蔽值LC(x,y)以及与有序图中每个像素点对应的空间掩蔽值SM(x,y),二者的具体获取方式可以参考如下公式:
在公式中,bg(x,y)是每个像素点的平均背景亮度值,基于下边的公式获取,
其中,B(i,j)是一个低通滤波器,如下所示:
在获取亮度掩蔽值LC(x,y)公式中的LM(·)是适用于量化后HDR视频的亮度掩膜分量,由前文步骤101中的分步骤c)的内容中量化过程可知,亮度分量Y’的量化值DY'范围是[64,940],64和940分别对应编码变换函数能编码的最低亮度(10-6cd/m2)和最高亮度(104cd/m2),因此亮度掩膜分量LM(·)只考虑范围[64,940]内的值,计算过程如下:
计算过程中使用的逆变换编码函数inversePQ_TF(·)计算如下:
系数m1、m2分别为0.1593、78.8438,c1、c2和c3分别为0.8359、18.8516和18.6875。在获取空间掩蔽值SM(x,y)过程中的函数mg(x,y)是像素点(x,y)周围四个方向的梯度中最大的加权平均梯度,
其中,Gk(i,j)是用来确定纹理区域的四个方向上的高通滤波器,如下所示:
基于上述内容,在获取空间掩蔽值SM(x,y)过程中的函数α(bg(x,y))和β(bg(x,y))的表达式为:
1032、在获取到亮度掩蔽值LC(x,y)和空间掩蔽值SM(x,y)后,结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三。
1033、结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y)公式四;
其中,D(x,y)为所述无序图中的像素值;
1034、结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
在完成步骤1034后,即获取到与视频图像对应的失真度量值FEJND(x,y),该失真度量值其实是视频图像中每个像素值的FEJND阈值,在前文中已经提出,基于该FEJND阈值确定视频图像中所有像素的平均FEJND阈值即FEJNDframe作为第一阈值,以及将每个编码单元中所有像素的平均FEJND阈值作为该编码单元的阈值FEJNDCU即第二阈值。根据所述第一阈值和所述第二阈值确定控制参数,如下文所示。
可选的,控制单元24,用于:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
在实施中,基于获取到的第一阈值FEJNDframe和第二阈值FEJNDCU确定编码过程中的控制参数λ,确定该控制参数λ的具体步骤分为:
301、结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4。
302、基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λ`R(s,c,mode|QP) 公式七。
其中,J为代价函数,D是失真值,R是编码比特率值,s和c分别表示原图和通过编码之后的重建图像,mode表示基本编码单元可选择的编码模式。
对公式七求基于R的偏导数,令偏导数的值为零即获取到λ`的值即λsse为HEVC中原始的拉格朗日乘子,结合公式λ=η*λsse确定最终的控制参数λ。
由于公式七构建的代价函数中包含有失真值D和编码比特率值R,因此求解出的λ`为同时考虑失真值D和编码比特率值R的最优解,因此基于λ`结合步骤301确定的确定权重参数η得到的控制参数λ进行编码,可以将为人眼敏感的有序区域分配较多的比特率,而对人眼不敏感的无序区域则分配较少的比特率,有效提高了有序区域的感知质量,而在无序区域则隐藏了更多的失真,完美的结合了人类视觉系统的掩蔽机制,在降低编码比特率的同时提高了视觉感知质量。
在获取到的控制参数λ后,令编码器根据λ对视频图像进行编码。在后续编码过程中还包括依次为色度上采样使得视频格式从4:2:0变换到4:4:4,将颜色空间变换后的视频量化到16比特范围、颜色空间反变换、利用逆编码变换函数处理HDR视频的处理步骤,得到最终的编码后图像,由于篇幅所限,不对该部分内容进行详细描述。
根据本发明的另一方面,还提供了一种控制参数的确定装置,包括:映射模块,用于对图像中像素的亮度进行映射,得到亮度映射值;第一确定模块,连接至上述映射模块,用于根据上述亮度映射值,确定上述像素的第一失真度量值;第二确定模块,连接至上述第一确定模块,用于根据上述第一失真度量值,确定图像的第一阈值和图像中编码块的第二阈值;第三确定模块,连接至上述第二确定模块,用于根据上述第一阈值和第二阈值,确定权重参数;第四确定模块,连接至上述第三确定模块,用于根据权重参数,确定对编码块的编码参数进行确定过程中使用的控制参数。
在一个可选的实施例中,上述映射模块包括:转换单元,用于将所述图像中像素的亮度的采样值转换为亮度值;得到单元,连接至上述转换单元,用于上述亮度值进行非线性处理后得到亮度映射值。
在一个可选的实施例中,上述第一确定模块包括:第一确定单元,用于确定所述图像的预测图像,其中,根据上述亮度映射值与白噪声的加权和设置上述预测图像中的像素值;第二确定单元,连接至上述第一确定单元,用于根据预测图像确定上述第一失真度量值。
在一个可选的实施例中,上述第二确定单元具体用于:确定预测图像中像素的平均背景亮度值,并将预测图像中与每个像素点对应的亮度掩蔽值设置为平均背景亮度值经亮度掩模处理后的值;将梯度加权值设置为预测图像中像素四个方向梯度中最大的加权平均梯度值;将空间掩蔽值设置为平均背景亮度值经梯度加权值进行加权处理后的值与平均背景亮度值加权值的和值;将第一变量设置为亮度掩蔽值、空间掩蔽值、亮度掩蔽值与空间掩蔽值之间较小者的加权和;将第二变量设置为图像与预测图像中对应像素的差值的加权值;将第一失真度量值设置为第一变量、第二变量、第一变量与第二变量之间较小者的加权和。
在一个可选的实施例中,上述第二确定模块包括:第一设置单元,用于将第一阈值设置为上述图像中像素的第一失真度量值的平均值;第二设置单元,连接至上述第一设置单元,用于将第二阈值设置为上述编码块中像素的第一失真度量值的平均值。
在一个可选的实施例中,上述第三确定模块包括:第一计算单元,用于计算第一阈值与第二阈值之间的差值;第二计算单元,连接至上述第一计算单元,用于计算上述差值的指数关系映射值;第三设置单元,连接至上述第二计算单元,用于将上述权重参数设置为指数关系映射值的多项式加权和。
在一个可选的实施例中,上述第四确定模块包括:第四设置单元,用于将上述控制参数设置为权重参数对第一控制参数的加权值,其中,根据编码块量化参数的指数映射值的加权值设置上述第一控制参数。
在一个可选的实施例中,上述装置还包括:第五确定模块,连接至上述第四确定模块,用于在根据上述权重参数,确定对编码块的编码参数进行确定过程中使用的控制参数之后,使用上述控制参数确定编码块的编码参数。
本发明提供了一种用于视频图像的编码装置,包括从视频图像中提取亮度分量,确定失真度量值,根据失真度量值获取与视频图像对应的第一阈值和第二阈值,根据第一阈值和第二阈值确定控制参数,基于控制参数对视频图像进行编码,得到编码后的视频图像。通过利用恰可察觉误差,克服了以往JND模型中对无序区域JND阈值的弱估计问题,有效地消除了视频序列中的空间冗余,降低了编码量,提高了编码效率。同时使用所得的亮度掩膜与空间掩膜对有序区域的JND进行更加准确的估计,以便于改善视频中有序区域的感知质量,提高视频整体的观看感受。
本发明的效果可以通过以下仿真实验进一步说明:
1.仿真条件:
在CPU为Intel(R)CoreTM i3核处理器M350:主频2.27GHZ,内存2G,操作系统:WINDOWS 7,仿真平台:HEVC Main 10参考软件HM16.2。
仿真选择3个4:4:4格式的16比特高动态范围视频测试序列(Market3,Balloon和Tibul2),分辨率是1920×1080,采用主流画质(Main Profile 10)编码。选择的量化参数QP的值分别为22,27,32,37,编码帧数为50帧,GOP结构为I帧+49P帧。
2.仿真内容:
仿真实验中,利用本发明方法与现有的高动态范围视频压缩编码系统分别在3个视频序列上进行性能测试。
仿真1,利用本发明方法和现有高动态范围视频压缩编码系统分别对上述3个视频序列进行编码,HM16.2方法与本发明方法比特率比较结果如表1所示。
表1 HM16.2方法与本发明方法比特率比较
Sequences | QP=22 | QP=27 | QP=32 | QP=37 | Average |
Market3 | -7.62% | -7.74% | -8.16% | -8.75% | -8.07% |
Balloon | -12.27% | -12.30% | -13.08% | -14.32% | -12.99% |
Tibul2 | -4.46% | -4.03% | -1.18% | 1.70% | -2.15% |
表1是HM16.2方法与本发明方法比特率比较。如表1所示,除Tibul2序列在QP=37情况下,本发明方法使用的比特数均少于HM16.2方法,3个序列的平均比特率分别减少8.07%,12.99%,2.15%,实验结果表明本发明方法能够有效的降低比特率。
仿真2,利用本发明方法得到视频帧的区域分割图,其中:
图3(a)为Market的原始视频帧图(亮度图);
图3(b)为Market的FEJND阈值图;
图中颜色越暗的区域(黑色)代表有序区域,颜色越亮的区域代表无序区域(白色),由此可以说明,无序区域(像墙上的植物、衣服等)比有序区域(像天空、地面)有更多的结构不确定性,因此有更高的FEJND阈值。经过区域分割之后,可以得知视频帧的有序性。视频帧的有序性越大,表明其结构不确定性越小,也即无序区域所占的比例越小。
仿真3,在低比特率下(QP=37),利用本发明方法和HM16.2方法对测试序列Market进行编码,得到测试视频第2帧的重建帧图像如图4所示,其中:
图4(a)为使用HM16.2方法处理得到的重建帧;
图4(b)为图4(a)的局部放大图;
图4(c)为使用本发明方法处理得到的重建帧;
图4(d)为图4(c)的局部放大图。
由该图对比可见,本发明方法得到的重建帧图像视觉感知质量得到了比较明显的改善,保留了原始帧图像中更多的结构信息和细节信息,减少了模糊,尤其是图中红框所标示的墙上的纹理信息,所以本发明不仅明显降低了视频编码的比特率,而且改善了视频的感知质量。
仿真4,在低比特率下(QP=37),利用本发明方法和HM16.2方法对测试序列Balloon进行编码,得到测试视频第25帧的重建帧图像如图5所示,其中:
图5(a)为使用HM16.2方法处理得到的重建帧;
图5(b)和(c)为图5(a)在不同区域的局部放大图;
图5(d)为使用本发明方法处理得到的重建帧;
图5(e)和(f)为图5(d)在不同区域的局部放大图。
由该图对比可见,本发明方法得到的重建帧图像的视觉感知质量有了明显的提升,保留了原始帧图像中更多的结构信息,所得到的图像边缘更加清晰,同时由于人眼的掩蔽效应,使得隐藏在无序区域的失真不能被人眼感知。
需要说明的是:上述实施例提供的一种用于视频图像的编码方法和装置进行视频图像编码的实施例,仅作为该编码方法和装置在实际应用中的说明,还可以根据实际需要而将上述编码方法和装置在其他应用场景中使用,其具体实现过程类似于上述实施例,这里不再赘述。
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (18)
1.一种用于视频图像的编码方法,其特征在于,所述用于视频图像的编码方法,包括:
从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值,其中,所述视频图像为高动态范围视频图像;
根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值;
根据所述第一阈值和所述第二阈值确定控制参数;
基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像;其中,从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值,包括:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值;
其中,获取与所述有序图对应的有序阈值之前,所述方法还包括:通过以下公式获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y):
LC(x,y)=LM(bg(x,y)),其中,bg(x,y)为所述每个像素点的平均背景亮度值;
其中,获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值,包括:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
2.根据权利要求1所述的用于视频图像的编码方法,其特征在于,获取与所述输入图像对应的有序图和无序图,包括:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
3.根据权利要求1所述的用于视频图像的编码方法,其特征在于,根据所述第一阈值和所述第二阈值确定控制参数,包括:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
4.一种用于视频图像的编码装置,其特征在于,所述用于视频图像的编码装置,包括:
提取单元,用于从视频图像中提取亮度分量,基于所述亮度分量,确定失真度量值,其中,所述视频图像为高动态范围视频图像;
获取单元,用于根据所述失真度量值获取与所述视频图像对应的第一阈值和第二阈值;
处理单元,用于根据所述第一阈值和所述第二阈值确定控制参数;
控制单元,用于基于所述控制参数对所述视频图像进行编码,得到编码后的视频图像;其中,提取单元,用于:
对所述视频图像进行编码预处理,得到预处理视频图像,提取所述预处理视频图像的亮度分量,基于所述亮度分量构建输入图像;
获取与所述输入图像对应的有序图和无序图;
获取与所述有序图对应的有序阈值,以及与所述无序图对应的无序阈值,基于所述有序阈值和无序阈值,确定失真度量值;
其中,提取单元,具体用于:通过以下公式获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y):
LC(x,y)=LM(bg(x,y)),其中,bg(x,y)为所述每个像素点的平均背景亮度值;
其中,提取单元,具体用于:
获取所述有序图中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述有序图中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定有序阈值JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定无序阈值JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述无序图中的像素值;
结合公式五,确定失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
5.根据权利要求4所述的用于视频图像的编码装置,其特征在于,提取单元,具体用于:
根据公式一,确定与所述输入图像F对应的有序图P,
其中,ε是白噪声,ck是规范化系数,x是中心像素,χ={x1,x2,...,xN}是其邻域像素,I(x;xk)代表x与其邻域像素xk的互信息;
根据公式二,确定与所述输入图像F对应的无序图D,
D=|F-F'| 公式二。
6.根据权利要求4所述的用于视频图像的编码装置,其特征在于,控制单元,用于:
结合公式六,根据所述第一阈值和所述第二阈值确定权重参数η,
其中,FEJNDframe为第一阈值,FEJNDCU为第二阈值,a,b和c都是常数,取值分别为a=0.7,b=0.6,c=4;
基于优化失真理论,对公式七求偏导,确定控制参数λ,
J(s,c,mode|QP)=D(s,c,mode|QP)+λR(s,c,mode|QP) 公式七。
7.一种控制参数的确定方法,其特征在于,包括:
对图像中像素的亮度进行映射,得到亮度映射值,其中,所述图像为高动态范围视频图像;
根据所述亮度映射值,确定所述像素的第一失真度量值;
根据所述第一失真度量值,确定所述图像的第一阈值和所述图像中编码块的第二阈值;
根据所述第一阈值和所述第二阈值,确定权重参数;
根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数;
其中,对所述图像中像素的亮度进行映射,得到所述亮度映射值,包括:将所述图像中像素的亮度的采样值转换为亮度值;对所述亮度值进行非线性处理后得到所述亮度映射值;
其中,根据所述亮度映射值,确定所述像素的第一失真度量值,包括:确定所述图像的预测图像,其中,根据所述亮度映射值与白噪声的加权和设置所述预测图像中的像素值;根据所述预测图像确定所述第一失真度量值;
其中,根据所述第一失真度量值,确定所述图像的第一阈值之前,所述方法还包括:通过以下公式获取所述预测图像中与每个像素点对应的亮度掩蔽值LC(x,y):
LC(x,y)=LM(bg(x,y)),其中,bg(x,y)为所述每个像素点的平均背景亮度值;
其中,根据所述亮度映射值,确定所述像素的第一失真度量值,包括:
获取所述预测图像中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述预测图像中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定第一变量JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定第二变量JNDd(x,y),
JNDd(x,y)=1.125*D(x,y)公式四;
其中,D(x,y)为所述图像与所述预测图像中对应像素的差值对应的图像中的像素值;
结合公式五,确定第一失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)}公式五。
8.根据权利要求7所述方法,其特征在于,根据所述预测图像确定所述第一失真度量值包括:
确定所述预测图像中像素的平均背景亮度值,将所述预测图像中与像素点对应的亮度掩蔽值设置为所述平均背景亮度值经亮度掩模处理后的值;
将梯度加权值设置为所述预测图像中像素四个方向梯度中最大的加权平均梯度值;
将空间掩蔽值设置为所述平均背景亮度值经所述梯度加权值进行加权处理后的值与所述平均背景亮度值加权值的和值;
将第一变量设置为所述亮度掩蔽值、所述空间掩蔽值、所述亮度掩蔽值与所述空间掩蔽值之间较小者的加权和;
将第二变量设置为所述图像与所述预测图像中对应像素的差值的加权值;
将所述第一失真度量值设置为所述第一变量、所述第二变量、所述第一变量与第二变量之间较小者的加权和。
9.根据权利要求7所述方法,其特征在于,根据所述第一失真度量值,确定所述图像的所述第一阈值和所述图像中编码块的所述第二阈值,包括:
将所述第一阈值设置为所述图像中像素的所述第一失真度量值的平均值;
将所述第二阈值设置为所述编码块中像素的所述第一失真度量值的平均值。
10.根据权利要求7所述方法,其特征在于,根据所述第一阈值和所述第二阈值,确定所述权重参数,包括:
计算所述第一阈值与所述第二阈值之间的差值;
计算所述差值的指数关系映射值;
将所述权重参数设置为所述指数关系映射值的多项式加权和。
11.根据权利要求7所述方法,其特征在于,根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数,包括:
将所述控制参数设置为所述权重参数对第一控制参数的加权值,其中,根据编码块量化参数的指数映射值的加权值设置所述第一控制参数。
12.根据权利要求7所述方法,其特征在于,在根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数之后,还包括:
使用所述控制参数确定所述编码块的编码参数。
13.一种控制参数的确定装置,其特征在于,包括:
映射模块,用于对图像中像素的亮度进行映射,得到亮度映射值;
第一确定模块,用于根据所述亮度映射值,确定所述像素的第一失真度量值;
第二确定模块,用于根据所述第一失真度量值,确定所述图像的第一阈值和所述图像中编码块的第二阈值;
第三确定模块,用于根据所述第一阈值和所述第二阈值,确定权重参数;
第四确定模块,用于根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数;
其中,所述映射模块包括:转换单元,用于将所述图像中像素的亮度的采样值转换为亮度值;得到单元,用于对所述亮度值进行非线性处理后得到所述亮度映射值;
其中,所述第一确定模块包括:第一确定单元,用于确定所述图像的预测图像,其中,根据所述亮度映射值与白噪声的加权和设置所述预测图像中的像素值;第二确定单元,用于根据所述预测图像确定所述第一失真度量值;
其中,所述第二确定模块,还用于通过以下公式获取所述预测图像中与每个像素点对应的亮度掩蔽值LC(x,y):
LC(x,y)=LM(bg(x,y)),其中,bg(x,y)为所述每个像素点的平均背景亮度值;
其中,所述第二确定单元具体用于:
获取所述预测图像中与每个像素点对应的亮度掩蔽值LC(x,y);
获取所述预测图像中与所述每个像素点对应的空间掩蔽值SM(x,y);
结合公式三,确定第一变量JNDp(x,y),
JNDp(x,y)=LC(x,y)+SM(x,y)-0.3*min{LC(x,y),SM(x,y)} 公式三;
结合公式四,确定第二变量JNDd(x,y),
JNDd(x,y)=1.125*D(x,y) 公式四;
其中,D(x,y)为所述图像与所述预测图像中对应像素的差值对应的图像中的像素值;
结合公式五,确定第一失真度量值FEJND(x,y),
FEJND(x,y)=JNDp(x,y)+JNDd(x,y)-0.3*min{JNDp(x,y),JNDd(x,y)} 公式五。
14.根据权利要求13所述装置,其特征在于,所述第二确定单元具体用于:
确定所述预测图像中像素的平均背景亮度值,并将所述预测图像中与像素点对应的亮度掩蔽值设置为所述平均背景亮度值经亮度掩模处理后的值;
将梯度加权值设置为所述预测图像中像素四个方向梯度中最大的加权平均梯度值;
将空间掩蔽值设置为所述平均背景亮度值经所述梯度加权值进行加权处理后的值与所述平均背景亮度值加权值的和值;
将第一变量设置为所述亮度掩蔽值、所述空间掩蔽值、所述亮度掩蔽值与所述空间掩蔽值之间较小者的加权和;
将第二变量设置为所述图像与所述预测图像中对应像素的差值的加权值;
将所述第一失真度量值设置为所述第一变量、所述第二变量、所述第一变量与第二变量之间较小者的加权和。
15.根据权利要求13所述装置,其特征在于,所述第二确定模块包括:
第一设置单元,用于将所述第一阈值设置为所述图像中像素的所述第一失真度量值的平均值;
第二设置单元,用于将所述第二阈值设置为所述编码块中像素的所述第一失真度量值的平均值。
16.根据权利要求13所述装置,其特征在于,所述第三确定模块包括:
第一计算单元,用于计算所述第一阈值与所述第二阈值之间的差值;
第二计算单元,用于计算所述差值的指数关系映射值;
第三设置单元,用于将所述权重参数设置为所述指数关系映射值的多项式加权和。
17.根据权利要求13所述装置,其特征在于,所述第四确定模块包括:
第四设置单元,用于将所述控制参数设置为所述权重参数对第一控制参数的加权值,其中,根据编码块量化参数的指数映射值的加权值设置所述第一控制参数。
18.根据权利要求13所述装置,其特征在于,所述装置还包括:
第五确定模块,用于在根据所述权重参数,确定对所述编码块的编码参数进行确定过程中使用的控制参数之后,使用所述控制参数确定所述编码块的编码参数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610065413.7A CN105812805A (zh) | 2016-01-31 | 2016-01-31 | 一种用于视频图像的编码方法和装置 |
CN2016100654137 | 2016-01-31 | ||
CN201610873447.9A CN107027031A (zh) | 2016-01-31 | 2016-10-01 | 一种用于视频图像的编码方法和装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610873447.9A Division CN107027031A (zh) | 2016-01-31 | 2016-10-01 | 一种用于视频图像的编码方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117640942A true CN117640942A (zh) | 2024-03-01 |
Family
ID=56465733
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610065413.7A Pending CN105812805A (zh) | 2016-01-31 | 2016-01-31 | 一种用于视频图像的编码方法和装置 |
CN201610873447.9A Pending CN107027031A (zh) | 2016-01-31 | 2016-10-01 | 一种用于视频图像的编码方法和装置 |
CN202311124557.1A Pending CN117640942A (zh) | 2016-01-31 | 2016-10-01 | 一种用于视频图像的编码方法和装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610065413.7A Pending CN105812805A (zh) | 2016-01-31 | 2016-01-31 | 一种用于视频图像的编码方法和装置 |
CN201610873447.9A Pending CN107027031A (zh) | 2016-01-31 | 2016-10-01 | 一种用于视频图像的编码方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN105812805A (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107147912B (zh) * | 2017-05-04 | 2020-09-29 | 浙江大华技术股份有限公司 | 一种视频编码方法及装置 |
CN110300310B (zh) * | 2018-03-23 | 2021-01-15 | 华为技术有限公司 | 图像编码方法、装置及计算机存储介质 |
CN108900838B (zh) * | 2018-06-08 | 2021-10-15 | 宁波大学 | 一种基于hdr-vdp-2失真准则的率失真优化方法 |
CN112655212B (zh) * | 2018-11-28 | 2023-04-04 | Oppo广东移动通信有限公司 | 视频编码优化方法、装置及计算机存储介质 |
US20230103665A1 (en) * | 2019-02-28 | 2023-04-06 | Samsung Electronics Co., Ltd | Apparatuses for encoding and decoding image, and methods for encoding and decoding image thereby |
CN110602495A (zh) * | 2019-08-20 | 2019-12-20 | 深圳市盛世生物医疗科技有限公司 | 一种医学图像编码方法及装置 |
CN111510722A (zh) * | 2020-04-27 | 2020-08-07 | 王程 | 一种抗误码性能卓越的视频图像高质量转码方法 |
CN113422956B (zh) * | 2021-06-17 | 2022-09-09 | 北京金山云网络技术有限公司 | 一种图像编码方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103124347B (zh) * | 2012-10-22 | 2016-04-27 | 上海大学 | 利用视觉感知特性指导多视点视频编码量化过程的方法 |
US9237343B2 (en) * | 2012-12-13 | 2016-01-12 | Mitsubishi Electric Research Laboratories, Inc. | Perceptually coding images and videos |
CN104994382B (zh) * | 2015-04-30 | 2017-12-19 | 西安电子科技大学 | 一种感知率失真的优化方法 |
-
2016
- 2016-01-31 CN CN201610065413.7A patent/CN105812805A/zh active Pending
- 2016-10-01 CN CN201610873447.9A patent/CN107027031A/zh active Pending
- 2016-10-01 CN CN202311124557.1A patent/CN117640942A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN107027031A (zh) | 2017-08-08 |
CN105812805A (zh) | 2016-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117640942A (zh) | 一种用于视频图像的编码方法和装置 | |
CN107211128B (zh) | 自适应色度下采样和色彩空间转换技术 | |
Tan et al. | A perceptually relevant MSE-based image quality metric | |
CN103069809B (zh) | 扩展图像动态范围 | |
US9456111B2 (en) | System and method for content adaptive clipping | |
US8666186B1 (en) | Lossy compression of high dynamic range video | |
KR20120107429A (ko) | 구역 기반의 톤 매핑 | |
CN102812705B (zh) | 图像编码器和图像解码器 | |
CN104994382B (zh) | 一种感知率失真的优化方法 | |
CN104469386B (zh) | 一种基于dof的恰可察觉误差模型的感知立体视频编码方法 | |
CN101507277A (zh) | 图像编码/解码方法和设备 | |
CN101507284A (zh) | 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 | |
WO2019092463A1 (en) | Video image processing | |
US20170094281A1 (en) | Compressing high dynamic range images | |
CN111429357B (zh) | 训练数据确定方法、视频处理方法、装置、设备及介质 | |
US8340442B1 (en) | Lossy compression of high-dynamic range image files | |
Mai et al. | Visually favorable tone-mapping with high compression performance in bit-depth scalable video coding | |
CN105828089A (zh) | 一种基于自适应感知量化的视频编码方法和系统 | |
Koz et al. | Methods for improving the tone mapping for backward compatible high dynamic range image and video coding | |
CN111667406B (zh) | 一种基于时域相关性的视频图像超分辨率重建方法 | |
CN107197266B (zh) | 一种hdr视频编码方法 | |
US9153017B1 (en) | System and method for optimized chroma subsampling | |
CN107409223A (zh) | 视频编解码方法和视频编解码器 | |
CN114173131A (zh) | 一种基于帧间相关性的视频压缩方法及系统 | |
Lee et al. | Rate-distortion optimized layered coding of high dynamic range videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |