CN106534870B - 一种基于rgb源视频的率失真优化编码方法 - Google Patents
一种基于rgb源视频的率失真优化编码方法 Download PDFInfo
- Publication number
- CN106534870B CN106534870B CN201611178028.XA CN201611178028A CN106534870B CN 106534870 B CN106534870 B CN 106534870B CN 201611178028 A CN201611178028 A CN 201611178028A CN 106534870 B CN106534870 B CN 106534870B
- Authority
- CN
- China
- Prior art keywords
- rgb
- video
- rate
- distortion
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000013442 quality metrics Methods 0.000 claims abstract description 8
- 230000006835 compression Effects 0.000 claims description 9
- 238000007906 compression Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 238000013139 quantization Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/567—Motion estimation based on rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
本发明公开了一种基于RGB源视频的率失真优化编码方法,其特征在于,包括如下步骤:步骤1、输入RGB源视频;步骤2、将RGB源视频转换为YUV视频;步骤3、对转换得到的YUV视频进行预测编码;步骤4、进行率失真优化:在预测编码过程中,针对各编码模式计算编码比特数,且将该编码模式下解码后的重构视频转换成RGB空间的重构视频,并计算RGB重构视频与RGB源视频之间的失真;步骤5、根据步骤4计算的编码比特数和RGB失真,计算各编码模式对应的率失真代价;步骤6、选择率失真代价最小的编码模式进行编码。提高RGB视频的编码效率和编码质量,提高用户显示体验。
Description
技术领域
本发明涉及一种基于RGB源视频的率失真优化编码方法。
背景技术
伴随着多媒体和通信技术的发展和成熟,人们日常生活中涌现了大量的视频应用,一方面视频应用呈现出多样化的特点,如视频监控、视频会议、视频电话、电视广播等;另一方面视频内容呈现出了数字化、高清化和超高清化等特点,尤其是关于高清视频的各种应用受到了用户的欢迎和青睐。然而,较高分辨率使得高清视频的数据量倍增,对目前的视频编解码算法(如H.264/AVC等)的压缩性能要求更高。因此近年来,国内外各大科研机构一直致力于研究更加有效的视频编码优化技术。
率失真优化方法是视频编码过程中一个极其重要的模块,即通过计算编码比特率和编码失真的代价和,根据代价的大小来选取更加有效的编码模式。目前常用的MPEG、H.264/AVC等编码技术主要针对YUV(YUV是被欧洲电视系统所采用的一种颜色编码方法)视频的编码,包括近期发布的新一代视频编码标准HEVC。这些方法中,输入的是YUV源视频,即视频分为一个亮度分量(Y)和两个色度分量(U和V),其中的率失真优化编码则是分别计算Y、U、V三个通道的失真以及编码码率,最后通过码率和YUV失真代价的大小选择最优的编码模式。由于受视者对色度空间敏感性较低,采用YUV分量对视频图像进行编码,可以通过降低色度分量分辨率来提高编码压缩效率。如YUV420则是对亮度分量Y的分辨率保持不变,对U、V色度分量进行水平和垂直方向的1/2下采样,这种对U、V分量的下采样可以提高编码压缩效率。
然而,目前广泛采用的显示设备均采用的RGB(红、绿、蓝)三原色原理对视频图片进行显示,视频内容的采集过程中也通常直接采集的是RGB源视频。因此,如何提高RGB颜色分量的编码效率和编码质量是一项至关重要的课题。
发明内容
针对上述问题,本发明提供一种基于RGB源视频的率失真优化编码方法,提高RGB视频的编码效率和编码质量,提高用户显示体验。
名词解释:
重构视频:对视频进行解、编码,解、编码之后得到新的视频,即重构视频。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基于RGB源视频的率失真优化编码方法,其特征在于,包括如下步骤:
步骤1、输入RGB源视频;
步骤2、将RGB源视频转换为YUV视频;
步骤3、对转换得到的YUV视频进行预测编码;
步骤4、进行率失真优化:一方面,在预测编码过程中,针对各编码模式计算编码比特数;另一方面,把步骤3中YUV视频转换成RGB空间的重构视频,并计算RGB重构视频与RGB源视频之间的失真;步骤5、根据步骤4计算的编码比特数和失真,计算编码比特数和编码失真的加权求和,,得到各编码模式对应的率失真代价;
步骤6、选择率失真代价最小的编码模式进行编码。
优选,步骤3中,预测编码包括变换、量化,即将空间或时间上相邻的像素作为当前图像块预测值,源像素与预测像素作差得到预测残差。对预测残差进行DCT变换可以实现能量的聚集,并得到变换系数,通过对变换系数先后进行量化和熵编码实现压缩。
优选,步骤4中,率失真优化为:
min{J},J=Drgb+λrgb·rate
式中,J为率失真代价,rate为实际编码比特数,Drgb表示输出图像与源图像的RGB平方误差和,λrgb为相应的乘子参数。
优选,式中,其中CUrgb和分别为RGB源视频块和对应的RGB重构视频块,SSD即为平方误差和。
优选,步骤2中,采用BT709标准将RGB源视频转换为YUV视频,即:
优选,λrgb取值为λ的4倍,λ为拉格朗日乘子。
本发明的有益效果是:
基于RGB源视频输入,提出RGB率失真优化算法,并基于RGB-YUV颜色空间转换矩阵,调整乘子参数。相比于YUV视频编码方法,在相同的编码码率前提下极大地提升了RGB视频的编码质量。具有编码质量高、用户显示体验佳等特点。
附图说明
图1是传统YUV源视频率失真代价计算示意图;
图2是本发明RGB源视频的率失真代价计算示意图;
图3是本发明一种基于RGB源视频的率失真优化编码方法的流程图。
具体实施方式
下面结合附图和具体的实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
传统YUV源视频编码方法都是通过计算YUV颜色空间的率失真代价来选取最优编码模式,比如,常用的编码标准如H.264/AVC、HEVC等都是在YUV颜色空间上进行编码,输入的是YUV视频源文件,经过压缩编码之后,输出的也是YUV文件。如图1所示,其中的率失真优化编码是分别计算Y、U、V三个通道的失真以及编码码率,最后通过YUV率失真代价选取最优的编码模式。由于受视者对色度分量敏感性较低,这种方法可以通过降低色度空间分辨率来提高编码压缩效率。如对U、V色度分量进行水平和垂直方向的1/2下采样后再编码,从而提高编码压缩效率。
YUV视频编码方法的率失真优化过程是:
在给定码率条件下,使得YUV分量的PSNR(峰值信噪比)越大越好,即
max{PSNRyuv},s.t.rate≤Rc (1)
其中,PSNRyuv表示解码视频图像的编码质量,rate和Rc分别表示编码比特数和带宽大小。针对该带约束问题,引入一个拉格朗日乘子λ,即将问题转化为求率失真代价最小化问题:
min(J),J=Dyuv+λ·rate (2)
其中,J为率失真代价,失真Dyuv为解码图像与源图像的YUV分量的平方误差和,rate为编码比特数,λ为拉格朗日乘子,起到平衡失真和码率的的作用。
然而,通常的图像显示设备是基于RGB颜色空间来显示,同时视频采集设备也是基于RGB颜色空间的,那么直接在RGB颜色空间上对图像质量(PSNR)进行评估,可以获得更好的编码性能和更优的用户显示体验。
图2和图3显示了本发明率失真优化编码方法的示意图,首先对视频采集设备获取的RGB源视频进行转换,生成YUV视频;然后再对该YUV视频进行压缩编码,编码之后生成YUV的重构视频;最后对重构视频进行反向转换,生成RGB的重构视频。也就是说,一方面与传统的YUV视频编码方法不同,本发明输入的是RGB源视频,考虑的是降低RGB颜色空间的失真。另一方面,为保留色度分量下采样的良好压缩性能,该方法仍然将RGB视频转换成YUV视频进行编码,预测编码等操作都是针对转换得到的YUV视频。然而更重要的是,本发明在率失真优化过程中考虑的是RGB分量的失真,即率失真代价为YUV转换视频的编码比特数和RGB失真代价之和,通过该率失真代价选择最优编码模式,下面进行详细介绍:
一种基于RGB源视频的率失真优化编码方法,包括如下步骤:
步骤1、输入RGB源视频;
步骤2、将RGB源视频转换为YUV视频;
输入的是RGB源视频,缓存输入RGB源视频,并在编码过程中转换为YUV视频,缓存RGB源视频是为了后面计算RGB失真,将其转换为YUV视频,是为了完成YUV420的色度通道下采样编码。
步骤3、对转换得到的YUV视频进行预测编码:对转换得到的YUV视频色度通道分别进行水平、垂直方向的1/2下采样,并开始逐块进行预测编码,该过程包括变换、量化等操作,即预测编码将空间或时间上相邻的像素作为当前图像块预测值,源像素与预测像素作差得到预测残差。对预测残差进行DCT变换(离散余弦变换)可以实现能量的聚集,并得到变换系数,通过对变换系数先后进行量化和熵编码实现压缩。
步骤4、进行率失真优化:一方面,在预测编码过程中,针对各编码模式计算编码比特数;另一方面,需要把已编码的信息进行解码,解码之后得到新的视频,即重构视频,重构视频与源视频相比包含了编码失真。即把步骤3中YUV视频转换成RGB空间的重构视频,并计算RGB重构视频与RGB源视频之间的失真。在预测编码过程中,针对各编码模式计算预测残差和编码模式等信息的编码比特数,且将该编码模式下重构视频转换成RGB空间的重构视频,并计算RGB重构视频与RGB源视频之间的失真;
步骤5、根据步骤4计算的编码比特数和RGB失真,计算编码比特数和编码失真的加权求和(即率失真代价),利用λrgb计算各编码模式对应的率失真代价;
步骤6、选择率失真代价最小的编码模式进行编码:比较各模式的率失真代价大小,选择其中代价较小的模式为最优模式。判断编码模式是否执行完成,否则继续预测其他模式。
本发明提出的率失真优化方法可采用公式描述如下:
min{J},J=Drgb+λrgb·rate (3)
式中,J为率失真代价,rate为实际编码比特数,Drgb表示输出图像与源图像的RGB平方误差和,λrgb为相应的乘子参数。也就是说,本发明与传统YUV视频编码率失真计算不同,后者计算的是YUV空间的失真,即YUV源视频与YUV重构视频之间的失真。本发明的率失真优化方法计算的是RGB颜色空间的失真,即RGB源视频与RGB重构视频之间的失真,即
其中,CUrgb和分别为RGB源视频块和对应的RGB重构视频块,SSD即为平方误差和。
其中,采用BT709标准将RGB源视频转换为YUV视频,由于RGB到YUV的转换,采用BT709标准:
那么:
其中,ΔR、ΔG、ΔB分别为R、G、B各颜色通道的失真,ΔY、ΔU、ΔV分别为对应的Y、U、V各颜色通道上的编码失真。不考虑后面的交叉项,RGB失真是YUV失真的约4倍。由于Drgb和Dyuv的取值范围不同,拉格朗日乘子的取值也要进行调整。因此,我们将λrgb调整为λ的4倍。
本发明提出了一种针对RGB源视频的新型率失真优化编码方法,与传统的YUV视频编码方法不同,本发明主要针对RGB源视频输入。为保留色度分量下采样的良好压缩性能,该方法仍然将RGB视频转换成YUV视频进行编码。然而,在率失真优化过程中,本方法分别计算RGB分量的失真和编码码率大小,选取RGB率失真代价最小的对应模式为最优编码模式,从而提高RGB视频的编码效率和编码质量,真正做到提高用户显示体验。本发明结合YUV420编码的色度下采样的优点,以RGB率失真优化编码提高编码质量为核心,对提高视频的用户显示体验具有重要的实际意义。具有编码质量高、用户显示体验佳等特点。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或者等效流程变换,或者直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (2)
1.一种基于RGB源视频的率失真优化编码方法,其特征在于,包括如下步骤:
步骤1、输入RGB源视频;
步骤2、将RGB源视频转换为YUV视频;
步骤3、对转换得到的YUV视频进行预测编码;
步骤4、进行率失真优化:一方面,在预测编码过程中,针对各编码模式计算编码比特数;另一方面,把步骤3中YUV视频转换成RGB空间的重构视频,并计算RGB重构视频与RGB源视频之间的失真;
步骤5、根据步骤4计算的编码比特数和失真,计算编码比特数和编码失真的加权求和,得到各编码模式对应的率失真代价;
步骤6、选择率失真代价最小的编码模式进行编码;
步骤3中,针对RGB源视频转换而来的YUV视频,预测编码先将空间或时间上相邻的像素作为当前图像块预测值,源像素与预测像素作差得到预测残差,对预测残差进行DCT变换实现能量的聚集,并得到变换系数,通过对变换系数先后进行量化和熵编码实现压缩;
步骤4中,率失真优化为:
min{J},J=Drgb+λrgb·rate
式中,J为率失真代价,rate为实际编码比特数,Drgb表示输出图像与源图像的RGB平方误差和,λrgb为相应的乘子参数;
式中,其中CUrgb和分别为RGB源视频块和对应的RGB重构视频块,SSD即为平方误差和;
步骤2中,采用BT709标准将RGB源视频转换为YUV视频,即:
。
2.根据权利要求1所述的一种基于RGB源视频的率失真优化编码方法,其特征在于,λrgb取值为λ的4倍,λ为拉格朗日乘子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611178028.XA CN106534870B (zh) | 2016-12-19 | 2016-12-19 | 一种基于rgb源视频的率失真优化编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611178028.XA CN106534870B (zh) | 2016-12-19 | 2016-12-19 | 一种基于rgb源视频的率失真优化编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106534870A CN106534870A (zh) | 2017-03-22 |
CN106534870B true CN106534870B (zh) | 2019-12-03 |
Family
ID=58341062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611178028.XA Active CN106534870B (zh) | 2016-12-19 | 2016-12-19 | 一种基于rgb源视频的率失真优化编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106534870B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109640100B (zh) * | 2018-11-19 | 2021-04-06 | 南瑞集团有限公司 | 一种视频图像再压缩方法 |
CN111447438B (zh) * | 2020-04-24 | 2023-05-26 | 西安理工大学 | 一种面向通用视频编码的快速帧内预测模式判决方法 |
CN114501007B (zh) * | 2021-12-20 | 2024-01-09 | 杭州当虹科技股份有限公司 | 基于422视频的快速编码方法及编码器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103546758A (zh) * | 2013-09-29 | 2014-01-29 | 北京航空航天大学 | 一种快速深度图序列帧间模式选择分形编码方法 |
CN104853197A (zh) * | 2011-06-28 | 2015-08-19 | 三星电子株式会社 | 对视频数据进行解码的方法 |
WO2015196126A1 (en) * | 2014-06-20 | 2015-12-23 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
CN106034238A (zh) * | 2015-03-11 | 2016-10-19 | 杭州海康威视数字技术股份有限公司 | 计算编码失真度和编码模式控制的方法及其系统 |
CN106131547A (zh) * | 2016-07-12 | 2016-11-16 | 北京大学深圳研究生院 | 视频编码中帧内预测模式的快速决策方法 |
-
2016
- 2016-12-19 CN CN201611178028.XA patent/CN106534870B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104853197A (zh) * | 2011-06-28 | 2015-08-19 | 三星电子株式会社 | 对视频数据进行解码的方法 |
CN103546758A (zh) * | 2013-09-29 | 2014-01-29 | 北京航空航天大学 | 一种快速深度图序列帧间模式选择分形编码方法 |
WO2015196126A1 (en) * | 2014-06-20 | 2015-12-23 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
CN106034238A (zh) * | 2015-03-11 | 2016-10-19 | 杭州海康威视数字技术股份有限公司 | 计算编码失真度和编码模式控制的方法及其系统 |
CN106131547A (zh) * | 2016-07-12 | 2016-11-16 | 北京大学深圳研究生院 | 视频编码中帧内预测模式的快速决策方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106534870A (zh) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104768002B (zh) | 确定图像编码单元和图像解码单元的帧内预测模式 | |
CN101796843A (zh) | 图像编码方法及装置、图像解码方法及装置、程序、集成电路 | |
CN104396245A (zh) | 用于对图像进行编码或解码的方法和装置 | |
CN108337516B (zh) | 一种面向多用户的hdr视频动态范围可分级编码方法 | |
CN103782598A (zh) | 用于无损编码的快速编码方法 | |
CN101507284A (zh) | 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 | |
CN103916675B (zh) | 一种基于条带划分的低延迟帧内编码方法 | |
CN106534870B (zh) | 一种基于rgb源视频的率失真优化编码方法 | |
US6993199B2 (en) | Method and system for improving coding efficiency in image codecs | |
CN103442228B (zh) | 从h.264/avc标准到hevc标准的快速帧内转码方法及其转码器 | |
CN106961610A (zh) | 结合超分辨率重建的超高清视频新型压缩框架 | |
US10148982B2 (en) | Video compression using perceptual modeling | |
CN106165420A (zh) | 用于显示流压缩(dsc)的平度检测的系统及方法 | |
CN104994387B (zh) | 一种融合图像特征的码率控制方法 | |
CN117640942A (zh) | 一种用于视频图像的编码方法和装置 | |
CN103313055B (zh) | 一种基于分割的色度帧内预测方法、及视频编码解码方法 | |
CN109922339A (zh) | 结合多采样率下采样和超分辨率重建技术的图像编码框架 | |
CN102510496B (zh) | 基于感兴趣区域的快速降尺寸转码方法 | |
CN110545426B (zh) | 基于编码损伤修复cnn的空域可分级视频编码方法 | |
Hériard-Dubreuil et al. | Light field compression using translation-assisted view estimation | |
CN106973296A (zh) | 视频或图像编码方法以及相关装置 | |
CN102333223A (zh) | 视频数据编码方法、解码方法、编码系统和解码系统 | |
CN108432249A (zh) | 用于在显示流压缩(dsc)中计算失真的系统和方法 | |
WO2022141515A1 (zh) | 视频的编解码方法与装置 | |
CN103634603B (zh) | 视频编解码方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |