CN105306946A - 一种基于均方误差门限的质量可分级视频编码方法 - Google Patents
一种基于均方误差门限的质量可分级视频编码方法 Download PDFInfo
- Publication number
- CN105306946A CN105306946A CN201510759685.2A CN201510759685A CN105306946A CN 105306946 A CN105306946 A CN 105306946A CN 201510759685 A CN201510759685 A CN 201510759685A CN 105306946 A CN105306946 A CN 105306946A
- Authority
- CN
- China
- Prior art keywords
- mean square
- image block
- primary layer
- enhancement layer
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明公开一种基于均方误差门限的质量可分级视频编码方法,其利用模式矢量大小不同对于重建图像质量的影响,对于不同质量层采用具有不同大小模式矢量的特征模式库进行编码,从而实现视频质量可分级。首先,对视频图像进行分块,对于基本层采用具有较大模式矢量的特征模式库进行编码;通过与均方误差门限比较,对于均方误差较大的图像块进一步分割,采用具有较小模式矢量的特征模式库对这些分割后的图像块进行编码形成增强层。本发明只需要对图像块进行搜索匹配最佳模式矢量,并对索引进行编码,摒弃了现有非常复杂的帧内预测、帧间预测和层间预测,大大降低了复杂度,提升了压缩性能。
Description
技术领域
本发明涉及视频编码领域,具体一种基于均方误差门限的质量可分级视频编码方法。
背景技术
互联网、智能终端和无线宽带通信技术的发展,大大促进了各种视频应用的飞速增长。由于不同智能终端具有不同的分辨率和解码能力,不同网络的传输带宽也不相同。为了适应不同的视频应用需求需要采用可分级视频编码技术。目前,较为成熟的可分级视频编码标准是H.264/SVC。可分级视频编码技术主要包括时间可分级、空间可分级和质量可分级。其中,质量可分级编码主要分为粗粒度质量可分级、中间粒度质量可分级和精细粒度质量可分级。粗粒度质量可分级的实现方式是在基本层使用较大的量化系数,在增强层使用较小的量化系数;中间粒度质量可分级则是在粗粒度质量可分级的基础上,增加了对量化后系数的分片编码,从而实现更加精细的可分级编码;精细粒度质量可分级是采用位平面编码技术来实现最为精细的质量可分级。
但是上述质量可分级视频编码技术需要采用繁琐精细的帧内预测、帧间预测和层间预测算法才能实现,复杂度非常高。随着视频分辨率越来越高,视频编码的计算量将会越来越巨大,对处理速度提出了非常越来越高的要求。同时存储视频所需要的空间也越来越巨大,上述质量可分级视频编码算法的压缩性能难以满足视频应用的新需求。
发明内容
本发明所要解决的现有质量可分级视频编码算法复杂度高的不足,提供一种基于均方误差门限的质量可分级视频编码方法。
为解决上述问题,本发明是通过以下技术方案实现的:
一种基于均方误差门限的质量可分级视频编码方法,包括如下步骤:
步骤1、基本层特征模式库的生成;将所要编码的视频的每一帧图像都采用预定的基本层尺寸进行分块,将所得的基本层图像块作为基本层训练矢量集并采用自组织映射方法训练,得到基本层特征模式库;
步骤2、基本层编码的产生;对于所要编码的视频的每一帧图像的每一个基本层尺寸图像块,分别在基本层特征模式库中搜索匹配,从基本层特征模式库中找出均方误差最小的模式矢量,并将该模式矢量在基本层特征模式库中的索引序号作为该基本尺寸图像块的基本层编码,同时在每一个索引前设置一个标志位标示该图像块是否需要进行增强层编码;将所要编码的视频的每一帧采用基本层编码进行编码。
上述方案中,步骤1具体为:
步骤1.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为a×a的基本层尺寸图像块组成基本层训练矢量集X(n),n=1,2,…,L,其中L为X(n)中训练矢量个数;
步骤1.2、计算基本层训练矢量集X(n)中各训练矢量的均方差,将X(n)中各训练矢量根据其均方差的大小进行顺序排列;
步骤1.3、从重新排序后的基本层训练矢量集中随机或以固定间隔抽取一定数量的模式矢量形成层初始模式库;
步骤1.4、利用基本层训练矢量集X(n)训练基本层初始模式库,得到基本层特征模式库。
上述方案中,步骤2具体为:
步骤2.1,将分解后的视频图像分割为a×a的基本层尺寸图像块,在基本层,在基本层特征模式库中搜索匹配得到均方误差最小的模式矢量,并得到与该模式矢量对应得索引;
步骤2.2,求出原图像块与对应的模式矢量的均方误差;
步骤2.3,在基本层每个图像块对应的索引前插入一个标志位Flag;若均方误差值小于等于预设阀值,则跳过该图像块并将Flag置为0;若均方误差值大于等于预设阀值,则Flag置为1;最后将Flag的值和该图像块对应的索引一起编码作为基本层。
上述方案中,步骤1.3进一步为:
首先,将重新排序后的基本层训练矢量集均分为p个部分,得到均方差依次增加的p个部分,即X1(n)、X2(n)、…、Xp(n),其中n=1,2,…,L/p,p为大于等于1的正整数;
然后,分别随机或以固定的间隔从X1(n)~Xp(n)中分别抽取N1~NP个模式矢量,合在一起组成含有N个模式矢量的基本初始模式库;其中N1+N2+…+NP=N,N为设定值,且N<L。
上述一种基于均方误差门限的质量可分级视频编码方法,还进一步包括如下步骤:
步骤3、增强层特征模式库的生成;将所要编码的视频的每一帧图像都采用预定的增强层尺寸进行分块,将所得的增强层图像块作为增强层训练矢量集并采用自组织映射方法训练,得到增强层特征模式库;
步骤4、增强层编码的产生;对于增强层标志位的值为1的对应的基本层图像块采用预定的增强层尺寸进行分块,分为4个等大的图像块,对于每个细分后的图像块,分别在增强层特征模式库中搜索匹配,在增强层特征模式库中找出均方误差最小的模式矢量,并将该最佳匹配的模式矢量在增强层特征模式库中的索引序号编码作为增强层。
上述方案中,步骤3具体为:
步骤3.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为b×b的增强层尺寸的图像块组成增强层训练矢量集Y(m),m=1,2,…,K,其中K为Y(m)中训练矢量个数;
步骤3.2、计算增强层训练矢量集Y(m)中各矢量的均方差,将增强层训练矢量根据其均方差的大小进行顺序排列;
步骤3.3、从重新排序后的增强层训练矢量集中随机或以固定间隔抽取一定数量的模式矢量形成增强层初始模式库;
步骤3.4、利用增强层训练矢量集Y(m)训练增强层初始模式库,得到增强层特征模式库。
上述方案中,步骤3.3进一步为:
首先,将重新排序后的增强层训练矢量集均分为q个部分,得到均方差依次增加的q个部分,即Y1(m)、Y2(m)、…、Yq(m),其中m=1,2,…,K/q,q为大于等于1的正整数;
然后,分别随机或以固定的间隔从Y1(m)~Yq(m)中分别抽取M1~Mq个模式矢量,合在一起组成含有M个模式矢量的增强初始模式库,其中M1+M2+…+Mq=M,M为设定值,且M<K。
上述方案中,基本层图像块和增强层图像块均为正方形的图像块,且基本层图像块的面积为增强层图像块面积的4倍。
与现有技术相比,本发明采用基于模式识别的方法对视频进行编码,即将自组织映射方法用于质量可分级视频编码,只需要对图像块进行搜索匹配最佳模式矢量,并对索引进行编码,摒弃了现有非常复杂的帧内预测、帧间预测和层间预测,大大降低了复杂度。同时,由于自组织映射方法优秀的聚类性能,利用模式矢量索引编码代替现有DCT编码,提高了视频编码算法压缩性能。
附图说明
图1为一种基于均方误差门限的质量可分级视频编码的原理框图。
具体实施方式
一种基于均方误差门限的质量可分级视频编码方法,其采用两层编码方法,首先,对视频图像进行分块,对于基本层采用具有较大尺寸模式矢量的特征模式库进行编码;然后对于均方误差较大的图像块进一步分割,采用具有较小尺寸模式矢量的特征模式库对这些分割后的图像块进行编码形成增强层。如图1所示,具体步骤如下:
步骤1、基本层特征模式库产生。将所要编码的视频的每一帧图像都采用规定的大尺寸进行分块,将所得的图像块作为训练矢量集并采用自组织映射方法训练,得到基本层特征模式库。
步骤1.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为16×16的图像块组成基本层训练矢量集X(n),n=1,2,…,L,其中L为X(n)中训练矢量个数。
步骤1.2、计算基本层训练矢量集X(n)中各训练矢量的均方差,将X(n)中各训练矢量根据其均方差的大小按从小到大的顺序排列。
步骤1.3、将重新排序后的基本层训练矢量集均分为两部分,得到均方差依次增加的两部分,即低频部分和高频部分X1(n)和X2(n),其中n=1,2,…,L/2。分别以固定的间隔从X1(n)和X2(n)抽取N1和N2个模式矢量(N1+N2=N),合在一起组成含有N个模式矢量的基本层初始模式库。此处可不对基本层训练矢量集进行分割,也可划分为两个以上的部分,可以以固定间隔抽取模式矢量,也可以随机抽取模式矢量,但是要保证抽取N个模式矢量组成初始模式库。
步骤1.4、利用基本层训练矢量集X(n)训练基本层初始模式库,得到基本层特征模式库。
步骤2、增强层特征模式库的产生。将所要编码的视频的每一帧图像都采用规定的小尺寸进行分块,将所得的图像块作为训练矢量集并采用自组织映射方法训练,得到增强层特征模式库。在本发明优选实施例中,采用大尺寸分块所得的每个图像块面积为采用小尺寸分块所得的每个图像块的4倍。
步骤2.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为8×8的图像块组成增强层训练矢量集Y(m),m=1,2,…,K,其中K为Y(m)中训练矢量个数。
步骤2.2、计算增强层训练矢量集Y(m)中各训练矢量的均方差,将Y(m)中各训练矢量根据其均方差的大小按从小到大的顺序排列。
步骤2.3、将重新排序后的增强层训练矢量集均分为两部分,得到均方差依次增加的两部分,即低频部分和高频部分Y1(m)和Y2(m),其中m=1,2,…,K/2。分别以固定的间隔从Y1(m)和Y2(m)抽取M1和M2个模式矢量(M1+M2=M),合在一起组成含有M个模式矢量的增强初始模式库。此处可不对增强训练矢量集进行分割,也可划分为两个以上的部分,可以以固定间隔抽取模式矢量,也可以随机抽取模式矢量,但是要保证抽取M个模式矢量组成初始模式库。
步骤2.4、利用增强层训练矢量集Y(m)训练增强层初始模式库,得到增强层特征模式库。
步骤3、基本层编码。将所要编码的视频的每帧图像以较大尺寸分块,使用基本层特征模式库对每个图像块进行模式匹配,得到最佳匹配的模式矢量,并将与之对应的索引进行编码作为基本层。
步骤3.1、对于分解后的视频图像,取其中一帧,将图像分割为16×16的图像块,在基本层特征模式库中搜索匹配得到均方误差最小的模式矢量,并得到与该模式矢量对应的索引。
步骤3.2、求出原图像块与对应的模式矢量之间的均方误差值。
步骤3.3、在基本层每个图像块对应的索引前插入一个标志位Flag。若均方误差值小于等于预设阀值,则跳过该图像块并将Flag置为0;若均方误差值大于等于预设阀值,则Flag置为1。最后将Flag的值和该图像块对应的索引一起编码作为基本层。对所要编码视频的每一帧图像的每一个图像块都采用步骤3.1-3.3的方法进行基本层编码。
步骤4、增强层编码。对于步骤3.1中已划分为16×16的图像块,其对应的Flag值为1的图像块进一步细分为4个8×8的图像块,在增强层特征模式库中分别对4个8×8的图像块搜索匹配得到均方误差最小的模式矢量,将与该模式矢量对应的索引进行编码得到增强层。所要编码视频的每一帧图像每一个图像块都采用步骤4的方法进行增强层编码。
本发明利用模式矢量大小不同对于重建图像质量的影响,对于不同质量层采用具有不同大小模式矢量的特征模式库进行编码,从而实现视频质量可分级。首先,对视频图像进行分块,对于基本层采用具有较大模式矢量的特征模式库进行编码;通过与均方误差门限比较,对于均方误差较大的图像块进一步分割,采用具有较小模式矢量的特征模式库对这些分割后的图像块进行编码形成增强层。本发明只需要对图像块进行搜索匹配最佳模式矢量,并对索引进行编码,摒弃了现有非常复杂的帧内预测、帧间预测和层间预测,大大降低了复杂度,提升了压缩性能。
Claims (8)
1.一种基于均方误差门限的质量可分级视频编码方法,具特征是,包括如下步骤:
步骤1、基本层特征模式库的生成;将所要编码的视频的每一帧图像都采用预定的基本层尺寸进行分块,将所得的基本层图像块作为基本层训练矢量集并采用自组织映射方法训练,得到基本层特征模式库;
步骤2、基本层编码的产生;对于所要编码的视频的每一帧图像的每一个基本层尺寸图像块,分别在基本层特征模式库中搜索匹配,从基本层特征模式库中找出均方误差最小的模式矢量,并将该模式矢量在基本层特征模式库中的索引序号作为该基本尺寸图像块的基本层编码,同时在每一个索引前设置一个标志位标示该图像块是否需要进行增强层编码;将所要编码的视频的每一帧采用基本层编码进行编码。
2.根据权利要求1所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,步骤1具体为:
步骤1.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为a×a的基本层尺寸图像块组成基本层训练矢量集X(n),n=1,2,…,L,其中L为X(n)中训练矢量个数;
步骤1.2、计算基本层训练矢量集X(n)中各训练矢量的均方差,将X(n)中各训练矢量根据其均方差的大小进行顺序排列;
步骤1.3、从重新排序后的基本层训练矢量集中随机或以固定间隔抽取一定数量的模式矢量形成层初始模式库;
步骤1.4、利用基本层训练矢量集X(n)训练基本层初始模式库,得到基本层特征模式库。
3.根据权利要求2所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,步骤1.3进一步为:
首先,将重新排序后的基本层训练矢量集均分为p个部分,得到均方差依次增加的p个部分,即X1(n)、X2(n)、…、Xp(n),其中n=1,2,…,L/p,p为大于等于1的正整数;
然后,分别随机或以固定的间隔从X1(n)~Xp(n)中分别抽取N1~NP个模式矢量,合在一起组成含有N个模式矢量的基本初始模式库;其中N1+N2+…+NP=N,N为设定值,且N<L。
4.根据权利要求1所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,步骤2具体为:
步骤2.1,将分解后的视频图像分割为a×a的基本层尺寸图像块,在基本层,在基本层特征模式库中搜索匹配得到均方误差最小的模式矢量,并得到与该模式矢量对应得索引;
步骤2.2,求出原图像块与对应的模式矢量的均方误差;
步骤2.3,在基本层每个图像块对应的索引前插入一个标志位Flag;若均方误差值小于等于预设阀值,则跳过该图像块并将Flag置为0;若均方误差值大于等于预设阀值,则Flag置为1;最后将Flag的值和该图像块对应的索引一起编码作为基本层。
5.根据权利要求1所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,还进一步包括如下步骤:
步骤3、增强层特征模式库的生成;将所要编码的视频的每一帧图像都采用预定的增强层尺寸进行分块,将所得的增强层图像块作为增强层训练矢量集并采用自组织映射方法训练,得到增强层特征模式库;
步骤4、增强层编码的产生;对于增强层标志位的值为1的对应的基本层图像块采用预定的增强层尺寸进行分块,分为4个等大的图像块,对于每个细分后的图像块,分别在增强层特征模式库中搜索匹配,在增强层特征模式库中找出均方误差最小的模式矢量,并将该最佳匹配的模式矢量在增强层特征模式库中的索引序号编码作为增强层。
6.根据权利要求5所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,步骤3具体为:
步骤3.1、将所要编码的视频分解为一帧一帧的图像,然后将所有图像分割为b×b的增强层尺寸的图像块组成增强层训练矢量集Y(m),m=1,2,…,K,其中K为Y(m)中训练矢量个数;
步骤3.2、计算增强层训练矢量集Y(m)中各矢量的均方差,将增强层训练矢量根据其均方差的大小进行顺序排列;
步骤3.3、从重新排序后的增强层训练矢量集中随机或以固定间隔抽取一定数量的模式矢量形成增强层初始模式库;
步骤3.4、利用增强层训练矢量集Y(m)训练增强层初始模式库,得到增强层特征模式库。
7.根据权利要求6所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,步骤3.3进一步为:
首先,将重新排序后的增强层训练矢量集均分为q个部分,得到均方差依次增加的q个部分,即Y1(m)、Y2(m)、…、Yq(m),其中m=1,2,…,K/q,q为大于等于1的正整数;
然后,分别随机或以固定的间隔从Y1(m)~Yq(m)中分别抽取M1~Mq个模式矢量,合在一起组成含有M个模式矢量的增强初始模式库,其中M1+M2+…+Mq=M,M为设定值,且M<K。
8.根据权利要求5所述的一种基于均方误差门限的质量可分级视频编码方法,具特征是,基本层图像块和增强层图像块均为正方形的图像块,且基本层图像块的面积为增强层图像块面积的4倍。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510759685.2A CN105306946B (zh) | 2015-11-10 | 2015-11-10 | 一种基于均方误差门限的质量可分级视频编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510759685.2A CN105306946B (zh) | 2015-11-10 | 2015-11-10 | 一种基于均方误差门限的质量可分级视频编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105306946A true CN105306946A (zh) | 2016-02-03 |
CN105306946B CN105306946B (zh) | 2018-06-22 |
Family
ID=55203621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510759685.2A Active CN105306946B (zh) | 2015-11-10 | 2015-11-10 | 一种基于均方误差门限的质量可分级视频编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105306946B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106028043A (zh) * | 2016-05-13 | 2016-10-12 | 桂林电子科技大学 | 基于新的邻域函数的三维自组织映射图像编码方法 |
CN110113604A (zh) * | 2019-04-26 | 2019-08-09 | 电子科技大学 | 一种新型图像分层编码方法 |
CN114467133A (zh) * | 2020-03-11 | 2022-05-10 | 深圳云英谷科技有限公司 | 压缩和解压缩显示补偿亮度不匀的补偿数据的方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101283379A (zh) * | 2005-10-14 | 2008-10-08 | 微软公司 | 建模用于特征提取的微结构 |
-
2015
- 2015-11-10 CN CN201510759685.2A patent/CN105306946B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101283379A (zh) * | 2005-10-14 | 2008-10-08 | 微软公司 | 建模用于特征提取的微结构 |
Non-Patent Citations (1)
Title |
---|
黎洪松等: "一种高效处理三维信号的自组织映射算法", 《桂林电子科技大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106028043A (zh) * | 2016-05-13 | 2016-10-12 | 桂林电子科技大学 | 基于新的邻域函数的三维自组织映射图像编码方法 |
CN106028043B (zh) * | 2016-05-13 | 2018-08-31 | 桂林电子科技大学 | 基于新的邻域函数的三维自组织映射图像编码方法 |
CN110113604A (zh) * | 2019-04-26 | 2019-08-09 | 电子科技大学 | 一种新型图像分层编码方法 |
CN110113604B (zh) * | 2019-04-26 | 2021-03-30 | 电子科技大学 | 一种图像分层编码方法 |
CN114467133A (zh) * | 2020-03-11 | 2022-05-10 | 深圳云英谷科技有限公司 | 压缩和解压缩显示补偿亮度不匀的补偿数据的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105306946B (zh) | 2018-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103004197B (zh) | 用于对图像编码的设备和方法 | |
CN103248893A (zh) | 从h.264/avc标准到hevc标准的快速帧间转码方法及其转码器 | |
CN103609118A (zh) | 用于视频译码的并行化友好合并候选者 | |
CN104079937B (zh) | 一种基于运动矢量分析的由h.264到hevc的快速帧间转码方法及转码装置 | |
CN103338370B (zh) | 一种多视点深度视频快速编码方法 | |
CN104919797A (zh) | 基于高效率视频译码对视频信息的可缩放译码的装置和方法 | |
CN105681797A (zh) | 一种基于预测残差的dvc-hevc视频转码方法 | |
CN103546758A (zh) | 一种快速深度图序列帧间模式选择分形编码方法 | |
CN107864380A (zh) | 基于dct的3d‑hevc快速帧内预测决策方法 | |
CN100502507C (zh) | 视频数据压缩编码方法 | |
CN101895753B (zh) | 基于网络拥塞程度的视频传输方法、系统及装置 | |
CN105306946A (zh) | 一种基于均方误差门限的质量可分级视频编码方法 | |
CN105611301A (zh) | 基于小波域残差的分布式视频编解码方法 | |
Ma et al. | A cross channel context model for latents in deep image compression | |
CN101980536A (zh) | 一种基于对象和分形的多目立体视频压缩编解码方法 | |
CN101895752A (zh) | 基于图像视觉质量的视频传输方法、系统及装置 | |
CN105825530A (zh) | 基于感兴趣区域的海岸带高光谱图像分布式有损编码和解码方法 | |
Wang et al. | A low complexity compressed sensing-based codec for consumer depth video sensors | |
CN100586185C (zh) | 一种h.264视频降低分辨率转码的模式选择方法 | |
CN105828088A (zh) | 边缘增强的改进spiht图像编码和解码方法 | |
CN113453009B (zh) | 基于拟合平面几何误差最小的点云空间可伸缩编码几何重构方法 | |
CN105049871B (zh) | 一种基于hevc的音频信息嵌入方法及提取和重构方法 | |
Deng et al. | MASIC: Deep Mask Stereo Image Compression | |
Shu et al. | Shape adaptive texture coding based on wavelet-based contourlet transform | |
Vadivel et al. | Progressive point cloud compression with the fusion of symmetry based convolutional neural pyramid and vector quantization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |