CN102143362A - 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置 - Google Patents

从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置 Download PDF

Info

Publication number
CN102143362A
CN102143362A CN 201110051527 CN201110051527A CN102143362A CN 102143362 A CN102143362 A CN 102143362A CN 201110051527 CN201110051527 CN 201110051527 CN 201110051527 A CN201110051527 A CN 201110051527A CN 102143362 A CN102143362 A CN 102143362A
Authority
CN
China
Prior art keywords
inter
macro block
frame forecast
residual energy
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201110051527
Other languages
English (en)
Other versions
CN102143362B (zh
Inventor
张健
徐桂忠
郭宇
张德
何永刚
范茂军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongdian wisdom Technology Co. Ltd.
Original Assignee
CETC 3 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 3 Research Institute filed Critical CETC 3 Research Institute
Priority to CN 201110051527 priority Critical patent/CN102143362B/zh
Publication of CN102143362A publication Critical patent/CN102143362A/zh
Application granted granted Critical
Publication of CN102143362B publication Critical patent/CN102143362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法及装置。包括:能量判断步骤,将读取视频数据的宏块的残差能量与判定阈值相比较;若宏块的各子块的残差能量均小于或等于判定阈值,则执行第一处理;若宏块残差能量大于判定阈值,则执行第二处理;第一处理:对宏块在P16x16、P16x8、P8x16或P8x8范围内选择帧间预测模式,使后续能根据选择的帧间预测模式对宏块进行运动估计处理;第二处理:对宏块重新进行运动估计,得出宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优帧间预测模式和运动向量,以选择帧间预测模式对宏块进行运动估计处理。该方法转换效率高,且质量好。

Description

从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法及装置
技术领域
本发明属于视频编码领域,特别涉及一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法及装置。
背景技术
目前对从MPEG2或H.263格式到H.264格式的视频转换编码的处理中,大部分文献给出的方法都利用转换前的宏块的一些信息量进行预测,如预测模式,运动向量,DCT系数等等。利用运动向量进行预测时,由于约束精度的问题,使得类似的方案会较大的损失转换图像的质量;利用以前的预测模式进行预测时,由于H.264以前的视频标准中帧间预测模式较少,可利用的信息量并不大,因此,单独的利用以前的预测模式,也会带来较大的质量损失。所以,很多的文献给出的方法都研究以前的DCT系数或者综合几种信息来预测转换后H.264中的预测模式和运动向量。如图1所示,DCT系数分为直流分量(DC)和交流分量(AC),直流分量反应了该子块的平滑程度,而交流分量反应了该子块的细节部分。同时,DCT系数也反映了图像的能量。因此,根据DCT系数的情况可在一定程度上判断该子块的能量分布情况。但是,由于这些判断方法比较复杂,使得目前从MPEG2或H.263格式到H.264格式的视频编码转换的处理方法,效率不高,对应的转换编码器较复杂,因此,如何在保证转换后视频质量的前提下,提高转换效率,实现快速转换,并降低转换编码器的复杂度是个需要解决的问题。
发明内容
本发明实施方式的目的是提供一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法及装置,解决在CPDT结构的转换编码中,实现提高转换编码的速度,保证较少转换时间的同时尽量减少视频质量的损失,通过对重新编码复杂度的改善,实现从MPEG2到H.264格式的P帧的快速转换。
本发明的目的是通过以下技术方案实现的:
本发明实施方式提供一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理方 法,包括:
能量判断步骤,将所读取的一帧MPEG2格式或H.263格式的视频数据的宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则执行第一处理步骤;若比较结果为宏块中的残差能量大于判定阈值,则执行第二处理步骤;
第一处理步骤,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
第二处理步骤,对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
本发明实施方式还提供一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,包括:
能量判断单元、第一处理单元和第二处理单元;
所述能量判断单元,用于将所读取的一帧MPEG2格式或H.263格式视频数据的宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则由所述第一处理单元处理;若比较结果为宏块中的残差能量大于判定阈值,则由所述第二处理单元处理;
所述第一处理单元,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
所述第二处理单元,用于对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
从上述本发明实施方式给出的技术方案中可以看出,本发明实施方式的处理方法中,先在能量判断步骤中用阈值判定的方式实现能量分层判决来确定后续的处理步骤,再根据阈值判定的结果,采用对应的处理步骤完成从MPEG2或H.263格式到H.264格式的视频转换编码的处理。该方法通过能量分层判决的自适应快速转换编码处理,对重新编码复杂度改善,实现从MPEG2到H.264格式的P帧的快速转换。该方法不仅能够提供更好的转换编码效率,并且能够对转换时间和视频图像质量上提供更好的平衡。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为现有技术提供视频编码转换中的子块中DCT系数的两种分量示意图;
图2为本发明实施例提供的处理方法流程图;
图3a~图3d为四种视频测试序列中宏块能量分布与平均能量的示意图;
图4为本发明实施例提供的处理方法用在转换编码流程中的示意图;
图5为本发明实施例提供的处理方法实际应用中的流程图;
图6为本发明实施例提供的处理方法中计算自适应能量阈值的流程图;
图7为本发明实施例提供的处理方法中的第一处理步骤的流程图;
图8为本发明实施例提供的处理装置的结构框图;
图9为本发明实施例提供的处理装置的能量判断单元的结构框图;
图10为本发明实施例提供的处理装置的第一处理单元的结构框图;
图11为本发明实施例提供的处理装置的第二处理单元的结构框图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面将结合附图对本发明实施例作进一步地详细描述。
本发明实施例提供一种从MPEG2格式或H.263格式到H.264格式的视频转换编码的处理方法,如图1所示,该方法包括:
步骤1,能量判断步骤,将所读取的一帧MPEG2格式或H.263格式的视频数据的宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则执行第一处理步骤;若比较结果为宏块中的残差能量大于判定阈值,则执行第二处理步骤;
步骤2,第一处理步骤,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
步骤3,第二处理步骤,对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
上述处理方法中,能量判断步骤中采用的判定阈值为:设定的自适应参数与残差平均能量的乘积;其中,所述的残差平均能量是根据所读取的一帧视频数据的DCT系数计算出的8×8块的残差平均能量;所述设定的自适应参数为:可根据传输信道的带宽的大小将自适应参数设置为等于1、大于1或者小于1,如在传输通道的带宽较小为低速通道时,则可将自适应参数设置为大于1或等于1,或者,当在传输通道的带宽较大为高速通道时,则可将自适应参数设置为小于1。
上述的能量判断步骤中,将所读取的一帧视频数据的宏块中的残差能量与判定阈值相比较包括:
将所述宏块分为四个8x8的子块,计算累加四个子块的残差能量和,将累加的所述残差能量和与所述判定阈值相比较。
上述处理方法的能量判断步骤中还可以包括:中断步骤,在累加各子块的残差能量和过程中,依次将每次累加得到的残差能量和与所述判定阈值相比较,若累加到的某个子块的残差能量和已大于所述判定阈值,则中断累加,直接进入第二处理步骤对该宏块进行处理。
如图6所示,上述处理方法中的第一处理步骤具体包括:
步骤a、当所述宏块的四个8×8子块的残差能量均低于判决阈值时,则对所述宏块选择原有的P16×16或者P8×8帧间预测模式,选择帧间预测模式后结束第一处理步骤;若存在至少一个子块的残差能量不低于判决阈值,则执行步骤b;
步骤b、若存在三个8×8子块的残差能量均低于判决阈值,一个子块的残差能量高于判决阈值,则分别计算该残差能量高于判决阈值的8×8子块与相邻子块的残差能量和,并对计算得到的垂直方向上的残差能量和与水平方向上的残差能量和进行比较,若垂直方向上的残差能量和大于水平方向上的残差能量和,则对所述宏块选择P16×8帧间预测模式,反之,对宏块选择P8×16帧间预测模式,选择帧间预测模式后结束第一处理步骤;若存在至少两个子块的残差能量不低于判决阈值,则进行步骤c;
步骤c、若存在两个子块的残差能量均低于判决阈值,若所述的两个子块在水平方向相邻,则采用P8×16帧间预测模式,选择帧间预测模式后结束第一处理步骤;若所述的两个子块在垂直方向相邻,则对所述宏块选择P16×8帧间预测模式;若所述的两个子块不相邻,则对所述宏块选择P8×8帧间预测模式,选择帧间预测模式后结束第一处理步骤;
比较所述宏块的四个8×8子块的残差能量与判决阈值后的其它情况,均对所述宏块选择P8×8帧间预测模式,并在选择帧间预测模式后结束第一处理步骤。
可根据上述第一处理步骤中选择的帧间预测模式,在后续转换编码处理中对所述宏块进行运动估计处理。
上述处理方法中的第二处理步骤中,对所述宏块重新进行运动估计计算时,不对原有的P16x16帧间预测模式进行计算;
在所述的第二处理步骤中,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量为:采用RDO算法从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量。
下面结合在视频编码中的处理过程对上述方法作进一步说明。
首先对目前的像素域的级联转码(CPDT)结构的算法分析:
(1)对残差能量方法(EEM)分析
(1.1)DCT域内能量分析
在视频编码转换中,帧间模式的性能是由残差的能量大小来决定的。在视频的运动估计与运动补偿中,需要计算当前块和参考帧中一系列相邻块的差值的能量,通常,均方差(MSE)可以用来衡量残差块中的能量。一个N×N块的MSE(均方差)计算如下:
MSE = 1 N 2 Σ i = 0 N - 1 Σ j = 0 N - 1 ( C ij - R ij ) 2 - - - ( 2.2 )
其中Cij是当前块的像素,Rij是参考区域的像素。
在运动估计中,当计算出最佳模式后,需要对残差进行DCT变换以及量化,量化后的DCT系数经过编码作为输出码流。而在转换编码中,对接收码流进行反解码后得到的就是经过量化后的DCT系数。因此,需要在DCT域内计算宏块的残差能量。
在像素域内对残差进行DCT变换的公式为:
F xy = C ( x ) C ( y ) 4 Σ i = 0 7 Σ i = 0 7 f ij cos ( ( 2 i + 1 ) xπ 16 ) cos ( ( 2 j + 1 ) xπ 16 ) - - - ( 2.3 )
其中,fij=Cij-Rij
用矩阵的形式表示为:
F=AxAT                                        (2.4)
对于图像变换编码,最理想的变换操作应对整个图像进行,以便去除所有像素间的相关性。但这样的操作计算量太大。实际上,往往把图像分为若干块,以块为单位进行DCT变换。在H.263和MPEG 2中,采用的是8x8的像素块进行DCT变换。对于矩阵A,因为AAT=E(2.5),所以,矩阵A为正交矩阵。根据正交变换的定义,有(x,y)=(Tx,Ty)(2.6),因此,
(f,f)=(Tf,Tf)=(AfAT,AfAT)                    (2.7)
(f,f)=(F,F)                                    (2.8)
矩阵f本身的内积相当于该矩阵的自相关系数,即为该矩阵的能量。同理,矩阵F本身的内积即相当于矩阵F的能量值。因此,在DCT域内计算图像的能量残差的方法是:运动补偿预测后DCT系数的绝对平方和,即:
E F = Σ i , j = 0 N × N - 1 F ij 2 - - - ( 2.9 )
从上述分析中得出的模式统计特性如下:实际传输的宏块残差是能量最小的判断结果。从MPEG2或H.263到H.264的转换编码中,需要在H.264中重新进行运动估计并找出9种模式中最好的结果。但是,如果在转换前的标准中,宏块的残差能量已经很小了,而在H.264中重新做运动估计时找到的最好模式仍然是之前的模式。这样会造成重复的计算工作,增加了计算的复杂度。
在H.264中,还引入了一个新的模式判断方法,比特失真最优化。实际上,在增加宏块分割复杂度的同时,还会增加运动向量的编码,因此,在H.264中,并不是宏块分割得越细编码效果越好,还需要考虑到运动向量的编码,因此,采用RDO算法(即:码率-失真度最优化算法)的方法来平衡两者之间的关系。表1显示测试序列在H.264中,各个模式的分布情况:
表1测试序列中各种模式的分布情况
Figure BDA0000048767110000071
根据帧间预测的方法,当前帧在附近的参考帧中寻找匹配的补偿块进行预测,当整个图像的运动细节较少时,大尺寸的匹配块会更容易出现。当运动细节较多时,大尺寸的匹配块可能会带来较大的残差,因此,在高复杂度运动的场景中,小尺寸的匹配块将会出现频繁。
通过上述表1中可以看到,P16x16模式与PSKIP模式在整个编码模式中占了非常大的比重。在低码率的视频序列中,这部分模式所占的比例非常大,即使运动很复杂的mobile视频序列,16x16模式以及PSKIP(也是16x16)模式也占据了50%以上。随着运动程度的减小,16x16模式所占据的百分比也逐渐增加。因此,在进行转换编码时,需要判断宏块需不需要重新再做运动估计,因为H.264中的也会出现大量的16x16的匹配块,因此通过EEM方法来判断该宏块是否直接使用MPEG2或H.263中的16x16模式以及运动向量。
从上述分析中得出的能量统计特性如下:
在MPEG2或H.263DCT系数中,宏块的残差能量可以通过公式2.9计算得到。在帧间预测中,当宏块的残差能量可能很低,甚至等于零,这种情况下,该宏块在H.264编码器中不需要重新进行帧间预测,可以直接使用该模式进行计算。
从图3a~图3d依次是foreman、mobile、stefan和carphone等四种视频测试序列中宏块能量分布与平均能量,其中,图3a~图3d显示了序列中各个宏块的能量值。从图3a~图3d中可以看出,在MPEG2或H.263中,大部分的宏块残差能量都很低或者等于零,即使在有复杂的运动背景的视频系列中,很多宏块的残差能量依然很低,并且从平均残差能量线可以看到,大部分宏块残差能量都在平均线以下,只有少部分宏块的残差能量非常高。
根据上述分析,可以设定一个阈值,来判断哪些宏块不需要重新进行运动估计。但若事先设定阈值,则会造成该处理方法的使用范围受到限制,因此,可设定自适应参数根据整幅图像的残差能量特性,进行阈值的自适应调整。
本发明实施的处理方法采用自适应能量分级的方法来对转换编码进行处理,其应用在转换编码处理流程中的示意如图4所示。通过本发明的处理方法可简化H.264中的帧间预测过程,节省转换编码的时间。
本发明处理方法的具体流程如图5所示,进行H.264编码前,首先通过设置的能量阈值判断宏块中残差能量的大小。如果宏块的残差能量很小,可只考虑平滑的模式,如P16x16,P16x8,P8x16,P8x8,选择何种平滑模式可根据宏块的能量分布特性来确定,然后对选择的宏块模式进行运动估计,这种选择方法对应于该处理方法中的第一处理步骤;如果以前宏块残差的能量非常大的话,需要在H.264编码器中对该宏块所有模式(模式选择中除去P16x16)重新进行运动估计,则处理过程对应于该处理方法的第二处理步骤。
如图5所示的本发明处理方法的流程中,采用了下述处理方式:
(1)早期中断
每个宏块分为4个8×8的子块,计算四个子块的残差能量和是否大于阈值,如果大于阈值,则进入Profile2重新进行运动估计。为了节省计算时间,当计算到某个子块的和时,残差能量已经大于阈值时,则中断累加,不需要再累加计算,直接判断该宏块进入第二处理步骤重新进行运动估计。
(2)分级处理
为了提高效率,整个处理分为第一、第二两个处理步骤。首先判断每个宏块的残差能量值是否小于能量阈值TE。如果当前宏块的残差能量小于或等于能量阈值TE,则进入第一处理步骤,该宏块不需要重新进行运动估计,宏块的预测模式范围只包括P16x16,P16x8,P8x16,P8x8,减小了重新编码的时间;如果当前宏块的残差能量大于能量阈值TE,则进入第二处理步骤,即在H.264标准下重新进行运动估计,对各种可能的预测模式都进行计算,采用RDO算法选择最优的预测模式和运动向量。同时,设置的自适应参数α可根据传输信道环境预先设置。在不清楚传输信道环境的情况下,α值设为1,即对阈值不产生影响;当传输信道带宽较大是或对转换速度要求不高时,可设定α值小于1,这样,需要重新编码的宏块将变多,转换编码的质量进一步改进;当传输信道带宽较小或 对转换速度要求较高时,可设定值α大于1,这样,需要重新编码的宏块变少,转换编码的质量有所下降。
上述处理方法中,第一处理步骤的模式选择中,由于输入的视频流是不确定的,每一个宏块的残差也不同。因此,需要通过一个自适应参数来作为判断标准,判断该子块的残差是较小还是较大,形成一种利用自适应能量阈值来进行模式选择的方法,该自适应能量阈值的计算流程如图5所示,具体包括以下步骤:
(1)读取一帧的DCT系数,计算出8×8块的残差平均能量 
Figure BDA0000048767110000091
(2)设定自适应参数α;
(3)计算判决阈值 T E = α E 8 × 8 ‾ ;
(4)对每一个宏块,将宏块划分为四个子块,计算每个子块的残差能量,分别记为EB1,EB2,EB3,EB4
由于能量的阈值只是根据一帧图像的宏块来进行计算,当作下一帧预测时,能量的阈值会重新进行计算,不会影响其它帧的判断。自适应参数α能够根据不同的传输环境进行预设,可满足不同需要。在低速通道中,视频的质量要求不高,可将α值设定得较大,这样,不需要重新进行运动估计的宏块数量会变多,从而减少了转换时间,但是视频转换质量会相应的降低。
具体的模式判决流程(即第一处理步骤)见图6:
第一步,判断是否四个子块的残差能量都低于判决阈值TE,如果都低于TE,则说明该宏块的残差比较小,编码效率较高,不需要重新进行模式选择,而使用原来的模式P16×16帧间预测模式。如果不是,则进行下一步。
第二步,若有三个子块的残差能量都低于判决阈值TE,意味着只有一个子块的残差能量高于判决阈值TE,假设该子块为Bx,分别计算该子块与相邻子块的残差能量和进行比较,若垂直方向上的残差能量和大于水平方向上的残差能量和,则该宏块选择P16×8帧间预测模式,反之,该宏块选择P8×16帧间预测模式。如果不是,则进行下一步。
第三步,若有两个子块的残差能量都低于判决阈值TE。如果这两个子块在水平方向相邻,则采用P8×16帧间预测模式,如果这两个子块在垂直方向相邻,则采用P16×8帧间预测模式,如果这两个子块不相邻,则采用P8×8帧间预测模式。
第四步,其它的情况都采用P8×8帧间预测模式。
第二处理步骤中,模式选择的参数设计与流程
当本发明的处理方法进入第二处理步骤中时,需要对宏块重新进行模式选择与运动估计,但重新进行所有的模式选择估计时可不对原来的模式进行估计,因为原来的模式造成的残差能量十分大了。在MPEG2中原来的模式只有P16x16,所以在第二处理步骤中重新进行模式选择时可不对P16x16进行计算,减少了计算量。可采用RDO算法选择最优的预测模式和运动向量。
在转换编码中,有两个主要的评价标准,转换时间和视频图像质量。因此,下面从这两方面对本发明的处理方法进行测试,并与目前主要的快速转换编码的EEM算法(现有文献中曾提出的EEM算法)进行比较。EEM算法主要针对MPEG2或H.263视频流到H.264视频流之间的转换所设计的。
本发明的处理方法与EEM算法在转换时间上的效率对比见表2:
表2是EEM算法与本发明的处理方法与传统的CPDT结构下所需要的转换时间的比较。传统的CPDT结构是指输入的MPEG2或H.263视频流首先通过解码完全转换成像素域内的图像,然后在H.264中对所有可能的预测模式进行估计,通过RDO算法选择最优的宏块预测模式和运动向量,最后进行整数DCT变换,量化和编码从而得到H.264标准的视频流。
表2转换编码所需要的时间比较
从表2中可以看出,对于H.264的转换编码,EEM算法与本发明的处理方法都能节省很多的转换编码时间。但是,对于不同运动复杂度的视频序列,EEM算法与本发明的处理方法节省的转换编码时间不同。这是因为,运动复杂度较高的序列,宏块中的残差能量会比较高,这样,需要重新进行运动估计的宏块会增加,因此需要更多的转换编码时间。
本发明的处理方法与EEM算法在不同信道环境下应用的比较:
当预先已知信道的传输特性时,可通过设定α参数(即设定的自适应参数)来使得算法更匹配信道,达到更好的利用率。表3中显示了mobile序列在不同特性的α参数下得到的不同图像编码性能。
表3不同用户参数情况下算法的性能(视频模式为mobile)
由表3中可知,当α变大,视频图像的质量变差,转换编码所需要的时间变短,同时,需要的编码比特数有所增加;当α变小时,视频图像的质量有所改善,但同时转换编码所需要的时间变长,传输视频流的比特率变得更小。当在延时比较宽松的信道中传输时,可使用小于1的α值,这样能够得到更好的视频图像质量,比较严格的信道中最好使用大于或等于1的α值。
从上述介绍中可以看出,本发明实施例提供的处理方法,可以解决在CPDT结构的转换编码中,实现提高转换编码的速度,保证较少转换时间的同时尽量减少视频质量的损失。特别是针对H.264中复杂的帧间编码模式的转换编码问题,给出了一种简单的阈值判定方法,通过对重新编码复杂度的改善,可以实现从MPEG2或H.263到H.264格式的P帧的快速转换。该方法通过简单的宏块的残差能量与自适应的能量阈值之间的比较,对处理过程进行分级,简化重新编码的过程。同时,该方法中设置自适应参数,若事先可知该转换编码后视频流的传输通道特性与时间要求,可通过该自适应参数进行调整,更好的适应各种传输通道的需求。对比目前CPDT结构下的快速转换编码效率,这种方法不仅能够对转换时间和视频图像质量上提供更好的平衡之外,还能根据需要进行变化。通过调节自适应参数α来改变转换时间和视频图像质量之间的关系,从而得到多种转换时间和视频图像质量之间的搭配关系,能更好的应用于现在的转换编码的实际应用中。
实施例二
本实施例提供一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,用于实现实施例1中给出的处理方法,如图8所示,该装置包括:能量判断单元81、第一处理单元82和第二处理单元83;
其中,所述能量判断单元,用于将所读取的一帧MPEG2格式或H.263格式视频数据的 宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则由所述第一处理单元处理;若比较结果为宏块中的残差能量大于判定阈值,则由所述第二处理单元处理;
所述第一处理单元,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
所述第二处理单元,用于对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
如图9所示,上述处理装置中的能量判断单元包括:计算累加模块91和比较模块92;
所述计算累加模块,用于计算累加由所述宏块分成的四个8x8的子块的残差能量和;
所述比较模块,用于将所述计算累加模块累加的残差能量和与所述判定阈值相比较。
上述的能量判断单元还包括:
中断处理模块93,用于在所述计算累加模块92累加各子块的残差能量和过程中,依次将每次累加得到的残差能量和与所述判定阈值相比较,若累加到的某个子块的残差能量和已大于所述判定阈值,则中断累加,直接由第二处理单元83对该宏块进行处理;
自适应参数设置模块,用于对自适应参数进行设置。
如图10所示,上述处理装置中的第一处理单元包括:比较处理模块101和模式选择模块102;
其中,所述比较处理模块,用于将所述宏块的四个8×8子块的残差能量与判决阈值相比较;
所述模式选择模块,用于在所述比较处理模块比较结果为:当所述宏块的四个8×8子块的残差能量均低于判决阈值,则对所述宏块选择原有的P16×16帧间预测模式;
当存在两个子块的残差能量均低于判决阈值,若所述的两个子块在水平方向相邻,则采用P8×16帧间预测模式;若所述的两个子块在垂直方向相邻,则对所述宏块选择P16×8帧间预测模式;若所述的两个子块不相邻,则对所述宏块选择P8×8帧间预测模式;
当所述宏块的四个8×8子块的残差能量与判决阈值比较后为其它情况时,均对所述宏块选择P8×8帧间预测模式。
如图11所示,上述处理装置中的第二处理单元包括:重新计算模块111和选择模块112;
其中,所述重新计算模块,用于对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式;
所述选择模块,用于从所述重新计算模块得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
上述的第二处理单元还可以包括:删除处理模块113,用于对所述宏块重新进行运动估计计算时,删除原有的P16x16帧间预测模式。
综上所述,本发明实施例的处理方法,通过先在能量判断步骤中用阈值判定的方式实现能量分层判决来确定后续的处理步骤,再根据阈值判定的结果,采用对应的处理步骤完成从MPEG2或H.263格式到H.264格式的视频转换编码的处理。该方法通过能量分层判决的自适应快速转换编码处理,对重新编码复杂度改善,实现从MPEG2到H.264格式的P帧的快速转换。该方法不仅能够提供更好的转换编码效率,并且能够对转换时间和视频图像质量上提供更好的平衡。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法,其特征在于,包括:
能量判断步骤,将所读取的一帧MPEG2格式或H.263格式的视频数据的宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则执行第一处理步骤;若比较结果为宏块中的残差能量大于判定阈值,则执行第二处理步骤;
第一处理步骤,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
第二处理步骤,对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
2.根据权利要求1所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法,其特征在于,所述能量判断步骤中采用的判定阈值为:设定的自适应参数与残差平均能量的乘积;其中,所述的残差平均能量是根据所读取的一帧视频数据的DCT系数计算出的8×8块的残差平均能量;
所述设定的自适应参数为:
根据传输信道的带宽的大小将自适应参数设置为等于1、大于1或者小于1;
所述能量判断步骤中的将所读取的一帧视频数据的宏块中的残差能量与判定阈值相比较包括:
将所述宏块分为四个8x8的子块,计算累加四个子块的残差能量和,将累加的所述残差能量和与所述判定阈值相比较。
3.根据权利要求2所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法,其特征在于,所述能量判断步骤还包括:
中断步骤,在累加各子块的残差能量和过程中,依次将每次累加得到的残差能量和与所述判定阈值相比较,若累加到的某个子块的残差能量和已大于所述判定阈值,则中断累加,直接进入第二处理步骤对该宏块进行处理。
4.根据权利要求1所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法,其特征在于,所述第一处理步骤具体包括:
a、当所述宏块的四个8×8子块的残差能量均低于判决阈值时,则对所述宏块选择原有的P16×16帧间预测模式,选择帧间预测模式后结束第一处理步骤;若存在至少一个子块的残差能量不低于判决阈值,则执行步骤b;
b、若存在三个8×8子块的残差能量均低于判决阈值,一个子块的残差能量高于判决阈值,则分别计算该残差能量高于判决阈值的8×8子块与相邻子块的残差能量和,并对计算得到的垂直方向上的残差能量和与水平方向上的残差能量和进行比较,若垂直方向上的残差能量和大于水平方向上的残差能量和,则对所述宏块选择P16×8帧间预测模式,反之,对宏块选择P8×16帧间预测模式,选择帧间预测模式后结束第一处理步骤;若存在至少两个子块的残差能量不低于判决阈值,则进行步骤c;
c、若存在两个子块的残差能量均低于判决阈值,若所述的两个子块在水平方向相邻,则采用P8×16帧间预测模式;若所述的两个子块在垂直方向相邻,则对所述宏块选择P16×8帧间预测模式,选择帧间预测模式后结束第一处理步骤;若所述的两个子块不相邻,则对所述宏块选择P8×8帧间预测模式,选择帧间预测模式后结束第一处理步骤;
比较所述宏块的四个8×8子块的残差能量与判决阈值后的其它情况,均对所述宏块选择P8×8帧间预测模式,在选择帧间预测模式后结束第一处理步骤。
5.根据权利要求1所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理方法,其特征在于,所述第二处理步骤中,对所述宏块重新进行运动估计计算时,不对原有的P16x16帧间预测模式进行计算;
所述第二处理步骤中,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量为:采用RDO算法从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量。
6.一种从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,其特征在于,包括:
能量判断单元、第一处理单元和第二处理单元;
所述能量判断单元,用于将所读取的一帧MPEG2格式或H.263格式视频数据的宏块的残差能量与判定阈值相比较;若比较结果为宏块中的各子块的残差能量均小于或等于判定阈值,则由所述第一处理单元处理;若比较结果为宏块中的残差能量大于判定阈值,则由所述第二处理单元处理;
所述第一处理单元,对所述宏块在P16x16帧间预测模式、P16x8帧间预测模式、P8x16帧间预测模式和P8x8帧间预测模式范围内选择帧间预测模式,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
所述第二处理单元,用于对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式,从得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理。
7.根据权利要求6所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,其特征在于,所述能量判断单元包括:
计算累加模块和比较模块;
所述计算累加模块,用于计算累加由所述宏块分成的四个8x8的子块的残差能量和;
所述比较模块,用于将所述计算累加模块累加的残差能量和与所述判定阈值相比较。
8.根据权利要求7所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,其特征在于,所述能量判断单元还包括:
中断处理模块,用于在所述计算累加模块累加各子块的残差能量和过程中,依次将每次累加得到的残差能量和与所述判定阈值相比较,若累加到的某个子块的残差能量和已大于所述判定阈值,则中断累加,直接由第二处理单元对该宏块进行处理;
自适应参数设置模块,用于对自适应参数进行设置。
9.根据权利要求6所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,其特征在于,所述第一处理单元包括:
比较处理模块和模式选择模块;
所述比较处理模块,用于将所述宏块的四个8×8子块的残差能量与判决阈值相比较;
所述模式选择模块,用于在所述比较处理模块比较结果为:当所述宏块的四个8×8子块的残差能量均低于判决阈值,则对所述宏块选择原有的P16×16帧间预测模式;
当存在两个子块的残差能量均低于判决阈值,若所述的两个子块在水平方向相邻,则采用P8×16帧间预测模式;若所述的两个子块在垂直方向相邻,则对所述宏块选择P16×8帧间预测模式;若所述的两个子块不相邻,则对所述宏块选择P8×8帧间预测模式;
当所述宏块的四个8×8子块的残差能量与判决阈值比较后为其它情况时,均对所述宏块选择P8×8帧间预测模式。
10.根据权利要求6所述的从MPEG2或H.263格式到H.264格式的视频转换编码的处理装置,其特征在于,所述第二处理单元包括:
重新计算模块和选择模块;
所述重新计算模块,用于对所述宏块重新进行运动估计计算,得出所述宏块的各种帧间预测模式;
所述选择模块,用于从所述重新计算模块得到的各种帧间预测模式中重新选择最优的帧间预测模式和运动向量,使得后续能根据选择的帧间预测模式对所述宏块进行运动估计处理;
或者,所述第二处理单元还包括:
删除处理模块,用于对所述宏块重新进行运动估计计算时,删除原有的P16x16帧间预测模式。
CN 201110051527 2011-03-03 2011-03-03 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置 Active CN102143362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110051527 CN102143362B (zh) 2011-03-03 2011-03-03 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110051527 CN102143362B (zh) 2011-03-03 2011-03-03 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置

Publications (2)

Publication Number Publication Date
CN102143362A true CN102143362A (zh) 2011-08-03
CN102143362B CN102143362B (zh) 2013-01-02

Family

ID=44410550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110051527 Active CN102143362B (zh) 2011-03-03 2011-03-03 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置

Country Status (1)

Country Link
CN (1) CN102143362B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611891A (zh) * 2012-02-07 2012-07-25 中国电子科技集团公司第三研究所 一种在变换域内直接进行转换编码的方法
CN103503462A (zh) * 2011-12-06 2014-01-08 华为技术有限公司 实时转码方法及设备
CN105898333A (zh) * 2016-05-18 2016-08-24 北京奇艺世纪科技有限公司 一种基于能量剩余的部分dct变换方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068355A (zh) * 2007-06-05 2007-11-07 南京大学 Mpeg-2到h.264码的快速转换方法
WO2007148896A1 (en) * 2006-06-22 2007-12-27 Samsung Electronics Co., Ltd. Flag encoding method, flag decoding method, and apparatus thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007148896A1 (en) * 2006-06-22 2007-12-27 Samsung Electronics Co., Ltd. Flag encoding method, flag decoding method, and apparatus thereof
CN101068355A (zh) * 2007-06-05 2007-11-07 南京大学 Mpeg-2到h.264码的快速转换方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《计算机工程》 20100731 张健等 基于残差能量的H_263与H_264间的编码转换 1-3页 1-3,5-8,10 第36卷, 第14期 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103503462A (zh) * 2011-12-06 2014-01-08 华为技术有限公司 实时转码方法及设备
CN102611891A (zh) * 2012-02-07 2012-07-25 中国电子科技集团公司第三研究所 一种在变换域内直接进行转换编码的方法
CN102611891B (zh) * 2012-02-07 2014-05-07 中国电子科技集团公司第三研究所 一种在变换域内直接进行转换编码的方法
CN105898333A (zh) * 2016-05-18 2016-08-24 北京奇艺世纪科技有限公司 一种基于能量剩余的部分dct变换方法和装置
CN105898333B (zh) * 2016-05-18 2019-02-15 北京奇艺世纪科技有限公司 一种基于能量剩余的部分dct变换方法和装置

Also Published As

Publication number Publication date
CN102143362B (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
CN1179302C (zh) 使用正交变换域中的块匹配进行运动估测的方法和装置
CN101889405B (zh) 用于执行运动估计的方法和装置
CN100593955C (zh) 用于以帧间或帧内模式编码视频图像的方法和设备
CN101267556B (zh) 快速运动估计方法及视频编解码方法
CN103188496B (zh) 基于运动矢量分布预测的快速运动估计视频编码方法
CN106170093B (zh) 一种帧内预测性能提升编码方法
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
CN100574447C (zh) 基于avs视频编码的快速帧间预测模式选择方法
CN102065298A (zh) 高性能宏块编码实现方法
CN101888546B (zh) 一种运动估计的方法及装置
CN104837019B (zh) 基于支持向量机的avs到hevc优化视频转码方法
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置
CN103546749A (zh) 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
CN100401779C (zh) 用于分级运动估计的方法
CN101304529A (zh) 宏块模式的选择方法和装置
CN103384327A (zh) 基于自适应阈值的avs快速模式选择算法
CN102238383B (zh) 用于视频编解码器的多总线体系结构
CN104754337A (zh) 视频编码方法
CN103634600B (zh) 一种基于ssim评价的视频编码模式选择方法、系统
CN1194544C (zh) 基于时空域相关性运动矢量预测的视频编码方法
CN101765011A (zh) 缩放运动估计的方法和装置
CN101867818B (zh) 宏块模式的选择方法和装置
CN102143362B (zh) 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置
CN101179729A (zh) 一种基于帧间模式统计分类的h.264宏块模式选择方法
CN100444639C (zh) 一种h.264/avc的帧间运动估计的模式选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170527

Address after: 100015 science building, No. 7, Jiuxianqiao North Road, Beijing, Chaoyang District 719

Patentee after: Beijing Zhongdian wisdom Technology Co. Ltd.

Address before: 100015 Jiuxianqiao North Road, Beijing, No. B, No., No. 7

Patentee before: No.3 Institute of China Electronics Technology Group Corporation