CN102025999B - 基于支持向量机的视频转码快速帧内预测方法 - Google Patents

基于支持向量机的视频转码快速帧内预测方法 Download PDF

Info

Publication number
CN102025999B
CN102025999B CN 201010618333 CN201010618333A CN102025999B CN 102025999 B CN102025999 B CN 102025999B CN 201010618333 CN201010618333 CN 201010618333 CN 201010618333 A CN201010618333 A CN 201010618333A CN 102025999 B CN102025999 B CN 102025999B
Authority
CN
China
Prior art keywords
intra
sigma
video
pattern
transcoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010618333
Other languages
English (en)
Other versions
CN102025999A (zh
Inventor
贾克斌
吕卓逸
孙中华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN 201010618333 priority Critical patent/CN102025999B/zh
Publication of CN102025999A publication Critical patent/CN102025999A/zh
Application granted granted Critical
Publication of CN102025999B publication Critical patent/CN102025999B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

基于支持向量机的视频转码快速帧内预测方法,属于数字视频转码技术领域。本发明具体包括以下步骤:(1)将输入的高分辨率视频码流解码来提取编码信息,组成多维特征向量训练支持向量机模型,建立高分辨率视频编码信息与降尺寸视频中宏块的帧内编码模式之间的相关性;(2)构建分层式SVM分类器,对降尺寸视频中宏块的帧内预测模式进行分类,以此减少预测模式数量;(3)利用缩减后的帧内模式对降尺寸视频进行编码,实现转码再编码过程中率失真优化算法的提前终止,达到降低转码运算复杂度的目的,实现一个低复杂度的H.264视频转码器;(4)输出转码后的低分辨率视频码流。本方法既能够保证转码后视频质量,又有效解决了降尺寸视频转码实时性问题。

Description

基于支持向量机的视频转码快速帧内预测方法
技术领域
本发明属于数字视频转码技术领域,具体涉及一种基于支持向量机的视频转码快速帧内预测的方法。
背景技术
近年来,多媒体通信随着网络技术的飞速发展广泛融入到社会和个人生活中。由于网络种类的多样性(如Internet网、电信网和蜂窝无线网等),终端设备性能(如显示分辨率、处理能力和存储能力等)的差异,使得提高视频码流在不同应用环境之间的兼容性变得十分重要。转换空间分辨率的视频转码,为支持各类视频显示设备提供了有效的解决方法,它将原始分辨率的视频码流转换为适合接收端显示的目标分辨率码流。H.264在压缩高效性和传输可靠性方面优于其它视频编码标准,并在各个领域中得到了广泛应用,基于H.264的视频编码及转码技术成为近年来国内外研究的热点。
理想的视频转码器应具备低运算复杂度,高转码质量等性能。H.264帧内编码充分利用图像空间相关性,结合率失真优化技术选择最优帧内模式。高效的帧内预测编码极大降低了空间冗余,提高视频编码压缩率,同时也大大增加了编码器的计算复杂度,影响到算法的实时性。因此,如何有效利用输入码流中的编码信息来提高转码速度成为视频转码研究中的关键问题。对此,众多科研人员做了大量工作来优化帧内编码算法。包括降低率失真优化运算复杂度,以及利用边界方向分析宏块特性等等。然而,这些帧内优化算法没有充分利用输入的编码信息来提高转码效率,无法在视频转码中达到理想的效果。因此,如何提高视频转码效率,同时保证图像质量仍然是一个有待探索的课题。
发明内容
本发明的目的是充分利用从输入的高分辨率视频码流中提取的编码信息,组成多维特征向量训练支持向量机(Support Vector Machine,SVM)分类器模型,构建分层式SVM分类器,对降尺寸视频中宏块的帧内预测模式进行分类,降低转码运算复杂度。
为了解决上述技术问题,本发明提供了一种基于支持向量机的视频转码快速帧内预测方法,其特征在于:首先从输入的高分辨率视频码流中提取模式特征组成多维特征向量训练支持向量机(Support Vector Machine,SVM)分类器模型,建立高分辨率视频编码信息与降尺寸视频宏块帧内编码模式之间的相关性。然后设计构建出分层式SVM分类器,对降尺寸视频中宏块的帧内预测模式进行分类,以此减少预测模式数量,实现转码再编码过程中率失真优化算法的提前终止。具体包括下述步骤:
1)将输入的高分辨率视频码流解码来提取编码信息,包括:帧内编码模式、残差宏块和离散余弦变换系数,利用编码信息计算得到表征宏块特征的参量来组成多维特征向量训练支持向量机模型,通过该模型建立高分辨率视频编码信息与降尺寸视频中宏块的帧内编码模式之间的相关性;
2)由顶层分类器,中间层分类器和下层分类器构建成分层式SVM分类器架构,分三步对降尺寸视频中宏块的帧内预测模式进行分类,首先划分Intra 16×16和Intra 4×4,其次对Intra4×4中的模式{0,1,2}和其它模式进行划分,最后划分Intra 4×4中的垂直预测模式和水平预测模式,以此减少预测模式数量;
3)利用缩减后的帧内模式对降尺寸视频进行编码,实现率失真优化算法的提前终止,避免转码中再编码过程中的穷举式全搜索,实现一个低复杂度的H.264视频转码器;
4)输出转码后的低分辨率视频码流。本方法既能够保证转码后视频质量,又有效解决了降尺寸视频转码实时性问题。
在本发明所提供的基于支持向量机的视频转码快速帧内预测方法中,所述的支持向量机特征向量的选取,包括下述步骤:
1)顶层分类器:实验数据表明,在原始高分辨率视频的四个相邻宏块中出现频率最高的编码模式往往就是通过率失真优化算法计算获得的最优编码模式。本方法选择Intra 16×16和Intra 4×4在当前宏块所对应的原始高分辨率视频的四个相邻宏块中的出现次数作为特征向量之一。此外,鉴于残差块不为零的离散余弦变换(DCT)系数的个数(nzcoef)与宏块空间特征的紧密联系,且提取方法简单,无需进行DCT逆变换,因此将不为零的离散余弦变换系数的个数选作顶层分类器的另一个特征向量;
2)中间层分类器:本方法利用如下公式中定义的方向差值参量来衡量宏块的亮度分布特征,进而划分出采用模式{0,1,2}的宏块。
CV=|E0-E2|+|E1-E3|,CH=|E0-E1|,|E2-E3|
CP=2min{|E1-E2|,|E0-E3|},
C DC = 0.5 Σ n = 0 3 | E n - E ‾ | ,
E n = Σ i , j = 0 3 | D n ( i , j ) | , n=0,1,2 and 3
其中,CV,CH,CP和CDC分别代表垂直、水平、平面和DC的方向差值参量,Dn(i,j)表示(i,j)上的DCT系数,En表示宏块亮度值;
3)下层分类器:本方法利用DCT系数计算获得4×4块的边界方向tanθ,将与tanθ最接近的预测方向作为该块的候选预测方向。其中,θ表示边界方向与水平方向的夹角,Fu,v代表4×4块(u,v)的AC系数。
tan θ = F 0,1 + F 0,2 + F 0,3 F 1,0 + F 2,0 + F 3,0
为了得到更加准确的预测结果,将第一行的AC系数绝对值之和定义为ac_sum_h,第一列AC系数绝对值之和定义为ac_sum_v,结合边界方向tanθ对4×4块进行预测。如果ac_sum_h小于ac_sum_v,则该4×4块采用垂直预测模式的机会较小,去除模式{0,3,5,7};相反,如果ac_sum_v小于ac_sum_h,则该4×4块采用水平预测模式的机会较小,去除模式{1,4,6,8}。
ac _ sum _ h = Σ j = 1 3 | AC [ 0 , j ] | , ac _ sum _ h = Σ j = 1 3 | AC [ i , 0 ] |
在本发明所提供的基于支持向量机的视频转码快速帧内预测方法中,所述的支持向量机核函数的选择,为了选取适用于视频转码帧内预测算法的最优核函数,本方法按如下步骤定义了核函数性能参数J:
1)假设输入空间中的两类样本:(x1,x2,...,xl)和(xl+1,xl+2,...,x2l)分别属于类别C1和C2,其中l为样本数量。各类中心点在特征空间中表示为:
C 1 = 1 l Σ i = 1 l φ ( x i ) , C 2 = 1 l Σ i = l + 1 2 l φ ( x i )
2)用核函数K(xi,xj)替代映射函数Φ,计算类中心的二次范数:
| | C 1 | | 2 = < C 1 , C 1 > = 1 l 2 &Sigma; i , j = 1 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = 1 l K ( x i , x j )
| | C 2 | | 2 = < C 2 , C 2 > = 1 l 2 &Sigma; i , j = l + 1 2 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j )
3)由下式计算获得各类紧凑度参数δ2 1和δ2 2
&delta; 2 s = 1 l &Sigma; m = 1 l | | &phi; ( x m ) - C s | | 2 = 1 l &Sigma; m = 1 l K ( x m , x m ) + 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) , s=1 or 2
4)类别间的中心距离为:
| | C 1 - C 2 | | 2 = < C 1 , C 1 > + < C 2 , C 2 > - 2 < C 1 , C 2 >
= 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) + 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j ) - 2 l &Sigma; i = 1 l &Sigma; j = l + 1 2 l K ( x i , x j )
5)最后,得到核函数性能参数J,其中,分子为类别间的中心距离,分母为同类内的紧凑度,选择J值最大的作为最优核函数:
J = | | C 1 - C 2 | | 2 &delta; 1 2 + &delta; 2 2
在本发明所提供的基于支持向量机的视频转码快速帧内预测方法中,所述的分层式SVM分类器的构建,包括下述步骤:
1)顶层分类器划分Intra 16×16模式和Intra 4×4模式。如果当前宏块被划分为Intra 16×16模式,则仅预测Intra 16×16模式。换而言之,此分类器用于划分出位于纹理分布较均匀或运动平缓区域内的宏块;
2)中间层分类器划分Intra 4×4中的模式{0,1,2}和其它模式;
3)下层分类器对Intra 4×4中的9种预测模式进行细分,划分为垂直预测模式和水平预测模式。垂直预测模式仅对模式{0,3,5,7}进行预测,水平预测模式仅对模式{1,4,6,8}进行预测。
附图说明
图1是本发明采用的基于支持向量机的视频转码快速帧内预测方法的框架图;
图2是本发明采用的基于支持向量机的视频转码快速帧内预测方法的流程图;
图3是foreman序列实验结果PSNR-Bitrate曲线图;
图4是silent序列实验结果PSNR-Bitrate曲线图;
图5是耗费运算时间的实验结果对比图;
具体实施方式
本发明提供了一种基于支持向量机的视频转码快速帧内预测方法,其具体实施例详细步骤如下:
采用H.264/AVC的测试模型JM12.2,实验平台采用Visual C++6.0。首先将CIF格式(352×288)的标准测试序列缩小为QCIF格式(176×144);其次对CIF格式视频在JM12.2上编码再解码,在解码过程中读取编码信息并将其写入TXT格式的外部文件中,在对降尺寸以后的视频进行编码时通过读取外部文件获得编码信息;然后调用本发明中提到的方法来完成对降尺寸视频具体的编码工作。每个序列选取前50帧进行转码,编码方式全部采用帧内编码(I帧)。
具体实施中,在计算机中完成以下程序:
第一步:读取TXT文件中的编码信息,包括:帧内编码模式,残差宏块和离散余弦变换(DCT)系数;
第二步:支持向量机特征向量的选取按照如下步骤进行:
1)顶层分类器:实验数据表明,在原始高分辨率视频的四个相邻宏块中出现频率最高的编码模式往往就是通过率失真优化算法计算获得的最优编码模式。本方法选择Intra 16×16和Intra 4×4在当前宏块所对应的原始高分辨率视频的四个相邻宏块中的出现次数作为特征向量之一。此外,鉴于残差块不为零的离散余弦变换(DCT)系数(nzcoef)与宏块空间特征的紧密联系,且提取方法简单,无需进行DCT逆变换,因此选作顶层分类器的另一个特征向量;
2)中间层分类器:本方法利用如下公式中定义的方向差值参量来衡量宏块的亮度分布特征,进而划分出采用模式{0,1,2}的宏块。
CV=|E0-E2|+|E1-E3|,CH=|E0-E1|,|E2-E3|
CP=2min{|E1-E2|,|E0-E3|},
C DC = 0.5 &Sigma; n = 0 3 | E n - E &OverBar; | ,
E n = &Sigma; i , j = 0 3 | D n ( i , j ) | , n=0,1,2 and 3
其中,CV,CH,CP和CDC分别代表垂直、水平、平面和DC的方向差值参量,Dn(i,j)表示(i,j)上的DCT系数,En表示宏块亮度值;
3)下层分类器:本方法利用DCT系数计算获得4×4块的边界方向tanθ,将与tanθ最接近的预测方向作为该块的候选预测方向。其中,θ表示边界方向与水平方向的夹角,Fu,v代表4×4块(u,v)的AC系数。
tan &theta; = F 0,1 + F 0,2 + F 0,3 F 1,0 + F 2,0 + F 3,0
为了得到更加准确的预测结果,将第一行的AC系数绝对值之和定义为ac_sum_h,第一列AC系数绝对值之和定义为ac_sum_v,结合边界方向tanθ对4×4块进行预测。如果ac_sum_h小于ac_sum_v,则该4×4块采用垂直预测模式的机会较小,去除模式{0,3,5,7};相反,如果ac_sum_v小于ac_sum_h,则该4×4块采用水平预测模式的机会较小,去除模式{1,4,6,8}。
ac _ sum _ h = &Sigma; j = 1 3 | AC [ 0 , j ] | , ac _ sum _ h = &Sigma; j = 1 3 | AC [ i , 0 ] |
第三步:支持向量机核函数的选择,为了选取适用于视频转码帧内预测算法的最优核函数,本发明按如下步骤定义了核函数性能参数J:
1)假设输入空间中的两类样本:(x1,x2,...,xl)和(xl+1,xl+2,...,x2l)分别属于类别C1和C2,其中l为样本数量。各类中心点在特征空间中表示为:
C 1 = 1 l &Sigma; i = 1 l &phi; ( x i ) , C 2 = 1 l &Sigma; i = l + 1 2 l &phi; ( x i )
2)用核函数K(xi,xj)替代映射函数Φ,计算类中心的二次范数:
| | C 1 | | 2 = < C 1 , C 1 > = 1 l 2 &Sigma; i , j = 1 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = 1 l K ( x i , x j )
| | C 2 | | 2 = < C 2 , C 2 > = 1 l 2 &Sigma; i , j = l + 1 2 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j )
3)由下式计算获得各类紧凑度参数δ2 1和δ2 2
&delta; 2 s = 1 l &Sigma; m = 1 l | | &phi; ( x m ) - C s | | 2 = 1 l &Sigma; m = 1 l K ( x m , x m ) + 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) , s=1 o r2
4)类别间的中心距离为:
| | C 1 - C 2 | | 2 = < C 1 , C 1 > + < C 2 , C 2 > - 2 < C 1 , C 2 >
= 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) + 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j ) - 2 l &Sigma; i = 1 l &Sigma; j = l + 1 2 l K ( x i , x j )
5)最后,得到核函数性能参数J,其中,分子为类别间的中心距离,分母为同类内的紧凑度,选择J值最大的作为最优核函数:
J = | | C 1 - C 2 | | 2 &delta; 1 2 + &delta; 2 2
第四步:分层式SVM分类器的构建,包括下述步骤:
1)顶层分类器划分Intra 16×16模式和Intra 4×4模式。如果当前宏块被划分为Intra 16×16模式,则仅预测Intra 16×16模式。换而言之,此分类器用于划分出位于纹理分布较均匀或运动平缓区域的宏块;
2)中间层分类器划分Intra 4×4中的模式{0,1,2}和其它模式;
3)下层分类器对Intra 4×4中的9种预测模式进行细分,划分为垂直预测模式和水平预测模式。垂直预测模式仅对模式{0,3,5,7}进行预测,水平预测模式仅对模式{1,4,6,8}进行预测。
第五步:通过分层式SVM分类器对降尺寸视频中宏块的帧内预测模式进行分类,以此减少预测模式数量。
第六步:利用缩减后的帧内模式对降尺寸视频进行编码,实现转码再编码过程中率失真优化算法的提前终止,达到降低转码运算复杂度的目的,实现一个低复杂度的H.264视频转码器。
第七步:输出转码后的低分辨率视频码流。
为了验证本发明所提出方法的普遍适用性和高效性,以下给出实验结果。实验选取分辨率格式CIF,具有不同运动程度及纹理特征的测试序列训练SVM分类器模型。首先将高分辨率视频利用JM12.2进行编码再解码,以便提取编码信息训练SVM模型。然后将CIF格式视频Foreman,Mother-daughter,Paris和Silent以1/4尺寸缩小。编码全部采用帧内编码(I帧),QP值设置从24到32。
本发明提出的基于支持向量机的视频转码快速帧内预测算法(3-SVM),与全搜索算法(JM72.2)和参考文献中提出的主导模式(Majority Method.MM)结合HVDC修正算法(MM+HVDC)在转码质量,比特率和转码速度三方面进行比较。如图3,4,5和表1(正值表示增加,负值表示减小)所示,基于SVM的帧内预测算法比全搜索算法(JM12.2)平均节省65.29%运算时间,并保证PSNR仅下降0.065dB,比特率增加6.33%。文献提出的算法MM+HVDC比JM12.2方法平均节省55.69%运算时间,PSNR下降0.123dB,比特率增加10.52%。
表1
Figure BDA0000042329720000071
综合衡量运算复杂度、转码质量和压缩率等因素,本文提出的算法在有效提高降尺寸转码速度的同时,与现有算法相比,取得了更优的编码效果和更广泛的适用性。

Claims (4)

1.基于支持向量机的视频转码快速帧内预测方法,其特征在于:首先从输入的视频码流中提取编码信息组成多维特征向量训练支持向量机SVM分类器模型,建立高分辨率视频编码信息与降尺寸视频中宏块的编码模式之间的联系;然后搭建阶梯式SVM分类器对降尺寸视频中宏块帧内编码模式进行分层式预测,具体包括下述步骤:
1)将输入的高分辨率视频码流解码来提取编码信息,包括:帧内编码模式、残差宏块和离散余弦变换系数;
2)分别为三层SVM分类器选取特征向量,即利用编码信息计算获得表征宏块特征的参量来组成多维特征向量;
3)通过定义的核函数性能参数来选择核函数,训练支持向量机分类器模型,通过该模型建立高分辨率视频编码信息与降尺寸视频中宏块的帧内编码模式之间的相关性;
4)由顶层分类器、中间层分类器和下层分类器构建成分层式SVM分类器架构,分三步对降尺寸视频中宏块的帧内预测模式进行分类,首先划分Intra 16×16和Intra 4×4,其次对Intra 4×4中的模式{0,1,2}和其它模式进行划分,最后划分Intra 4×4中的垂直预测模式和水平预测模式;
5)利用缩减后的帧内模式对降尺寸视频进行编码,提前终止率失真优化算法,避免转码中再编码过程中的穷举式全搜索,实现一个低复杂度的H.264视频转码器;
6)输出转码后的低分辨率视频码流。
2.根据权利要求1所述的基于支持向量机的视频转码快速帧内预测方法,其特征在于所述的支持向量机特征向量的选取,包括下述步骤:
1)顶层分类器:选择Intra 16×16和Intra 4×4在当前宏块所对应的原始高分辨率视频的四个相邻宏块中的出现次数作为特征向量之一;将不为零的离散余弦变换系数的个数选作顶层分类器的另一个特征向量;
2)中间层分类器:利用如下公式中定义的方向差值参量来衡量宏块的亮度分布特征,
进而划分出采用模式{0,1,2}的宏块;
CV=|E0-E2|+|E1-E3|,CH=|E0-E1|+|E2-E3|,
C P = 2 min { | E 1 - E 2 | , | E 0 - E 3 | } , C DC = 0.5 &Sigma; n = 0 3 | E n - E &OverBar; | ,
E n = &Sigma; i , j = 0 3 | D n ( i , j ) | , n = 0,1,2 and 3 .
其中,CV,CH,CP和CDC分别代表垂直、水平、平面和DC的方向差值参量,Dn(i,j)表示位置(i,j)上的DCT系数,En表示宏块亮度值;
3)下层分类器:利用离散余弦变换系数计算获得4×4块的边界方向tanθ,将与tanθ最接近的预测方向作为该块的候选预测方向,其中,θ表示边界方向与水平方向的夹角,Fu,v代表4×4块(u,v)的交流AC系数;
tan &theta; = F 0,1 + F 0,2 + F 0,3 F 1,0 + F 2,0 + F 3,0
同时,按照下面的公式将第一行的AC系数绝对值之和定义为ac_sum_h,第一列AC系数绝对值之和定义为ac_sum_v,结合边界方向tanθ对4×4块进行预测;
ac _ sum _ h = &Sigma; j = 1 3 | AC [ 0 , j ] | , ac _ sum _ v = &Sigma; i = 1 3 | AC [ i , 0 ] |
如果ac_sum_h小于ac_sum_v,则该4×4块采用垂直预测模式的机会较小,去除模式{0,3,5,7};相反,如果ac_sum_v小于ac_sum_h,则该4×4块采用水平预测模式的机会较小,去除模式{1,4,6,8}。
3.根据权利要求1所述的基于支持向量机的视频转码快速帧内预测方法,其特征在于所述的支持向量机核函数的选择,按如下步骤定义了核函数性能参数J:
1)假设输入空间中的两类样本:(x1,x2,...,xl)和(xl+1,xl+2,...,x2l)分别属于类别C1和C2,其中l为样本数量,各类中心点在特征空间中表示为如下形式,其中Φ为映射函数:
C 1 = 1 l &Sigma; i = 1 l &phi; ( x i ) , C 2 = 1 l &Sigma; i = l + 1 2 l &phi; ( x i )
2)用核函数K(xi,xj)替代映射函数Φ,计算类中心的二次范数:
| | C 1 | | 2 = < C 1 , C 1 > = 1 l 2 &Sigma; i , j = 1 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = 1 l K ( x i , x j )
| | C 2 | | 2 = < C 2 , C 2 > = 1 l 2 &Sigma; i , j = l + 1 2 l < &phi; ( x i ) , &phi; ( x j ) > = 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j )
3)由下式计算获得各类紧凑度参数
Figure FDA0000112412910000027
&delta; 2 s = 1 l &Sigma; m = 1 l | | &phi; ( x m ) - C s | | 2 = 1 l &Sigma; m = 1 l K ( x m , x m ) + 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) , s = 1 or 2
4)类别间的中心距离为:
| | C 1 - C 2 | | 2 = < C 1 , C 1 > + < C 2 , C 2 > - 2 < C 1 , C 2 >
= 1 l 2 &Sigma; i , j = 1 l K ( x i , x j ) + 1 l 2 &Sigma; i , j = l + 1 2 l K ( x i , x j ) - 2 l &Sigma; i = 1 l &Sigma; j = l + 1 2 l K ( x i , x j )
5)最后,得到核函数性能参数J,其中,分子为类别间的中心距离,分母为同类内的紧凑度,选择J值最大的作为最优核函数:
J = | | C 1 - C 2 | | 2 &delta; 1 2 + &delta; 2 2 .
4.根据权利要求1所述的基于支持向量机的视频转码快速帧内预测方法,其特征在于所述的分层式SVM分类器的构建,包括下述步骤:
1)顶层分类器划分Intra 16×16模式和Intra 4×4模式,如果当前宏块被划分为Intra 16×16模式,则仅预测Intra 16×16模式,换而言之,此分类器用于划分出位于纹理分布较均匀或运动平缓区域内的宏块;
2)中间层分类器划分Intra 4×4中的模式{0,1,2}和其它模式;
3)下层分类器对Intra 4×4中的9种预测模式进行细分,划分为垂直预测模式和水平预测模式;垂直预测模式仅对模式{0,3,5,7}进行预测,水平预测模式仅对模式{1,4,6,8}进行预测。
CN 201010618333 2010-12-31 2010-12-31 基于支持向量机的视频转码快速帧内预测方法 Expired - Fee Related CN102025999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010618333 CN102025999B (zh) 2010-12-31 2010-12-31 基于支持向量机的视频转码快速帧内预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010618333 CN102025999B (zh) 2010-12-31 2010-12-31 基于支持向量机的视频转码快速帧内预测方法

Publications (2)

Publication Number Publication Date
CN102025999A CN102025999A (zh) 2011-04-20
CN102025999B true CN102025999B (zh) 2012-05-16

Family

ID=43866767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010618333 Expired - Fee Related CN102025999B (zh) 2010-12-31 2010-12-31 基于支持向量机的视频转码快速帧内预测方法

Country Status (1)

Country Link
CN (1) CN102025999B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9634690B2 (en) 2010-09-30 2017-04-25 Alcatel Lucent Method and apparatus for arbitrary resolution video coding using compressive sampling measurements
CN102186082B (zh) * 2011-05-13 2014-04-16 哈尔滨工业大学 基于h.264协议中对于帧内编码压缩技术的优化解码方法
US9398310B2 (en) 2011-07-14 2016-07-19 Alcatel Lucent Method and apparatus for super-resolution video coding using compressive sampling measurements
CN102281444A (zh) * 2011-09-01 2011-12-14 北京汉邦高科数字技术有限公司 一种基于avc标准的视频转换装置
CN102420990B (zh) * 2011-12-15 2013-07-10 北京工业大学 一种面向多视点视频的快速编码方法
CN103220508B (zh) 2012-01-20 2014-06-11 华为技术有限公司 编解码方法和装置
CN103533349A (zh) * 2013-09-26 2014-01-22 广东电网公司电力科学研究院 基于支持向量机的b帧快速帧间预测宏块模式选择方法
US9600899B2 (en) 2013-12-20 2017-03-21 Alcatel Lucent Methods and apparatuses for detecting anomalies in the compressed sensing domain
US9563806B2 (en) 2013-12-20 2017-02-07 Alcatel Lucent Methods and apparatuses for detecting anomalies using transform based compressed sensing matrices
US9894324B2 (en) 2014-07-15 2018-02-13 Alcatel-Lucent Usa Inc. Method and system for modifying compressive sensing block sizes for video monitoring using distance information
CN104837019B (zh) * 2015-04-30 2018-01-02 上海交通大学 基于支持向量机的avs到hevc优化视频转码方法
CN106375849B (zh) * 2015-07-23 2019-05-24 无锡天脉聚源传媒科技有限公司 一种生成模板的方法、装置、视频的更新方法及装置
CN105306947B (zh) * 2015-10-27 2018-08-07 中国科学院深圳先进技术研究院 基于机器学习的视频转码方法
CN105898316A (zh) * 2015-12-14 2016-08-24 乐视云计算有限公司 一种编码信息继承的实时转码方法及装置
CN106791864B (zh) * 2016-12-08 2019-12-27 南京理工大学 一种基于hevc标准下提高视频转码速率的实现方法
CN108184114B (zh) * 2018-01-06 2021-08-31 北京航空航天大学 一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法
CN110418197B (zh) * 2018-05-11 2022-03-08 腾讯科技(深圳)有限公司 一种视频转码方法、装置和计算机可读存储介质
CN108769736B (zh) * 2018-05-24 2019-09-17 重庆瑞景信息科技有限公司 面向显示的视频转码码率决策模型的建立及参数确定方法
CN108900198A (zh) * 2018-06-29 2018-11-27 中国石油大学(华东) 一种串行抵消列表译码参数的快速确定方法
CN111651618B (zh) * 2019-09-26 2021-01-15 上海麦克风文化传媒有限公司 智能化数据库管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026756A (zh) * 2007-03-23 2007-08-29 武汉大学 视频转码中帧间模式的快速选择方法
CN101068366A (zh) * 2007-06-05 2007-11-07 南京大学 基于h.264多路视频转码复用的方法和复用器
CN101309404A (zh) * 2007-05-15 2008-11-19 北京三星通信技术研究有限公司 降分辨率视频转码方法及其转码器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004093461A1 (en) * 2003-04-17 2004-10-28 Koninklijke Philips Electronics N.V. Video transcoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026756A (zh) * 2007-03-23 2007-08-29 武汉大学 视频转码中帧间模式的快速选择方法
CN101309404A (zh) * 2007-05-15 2008-11-19 北京三星通信技术研究有限公司 降分辨率视频转码方法及其转码器
CN101068366A (zh) * 2007-06-05 2007-11-07 南京大学 基于h.264多路视频转码复用的方法和复用器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏开娜.转码技术发展及在IPTV领域的应用研究.《电视技术》.2006,(第5期),第14-16页. *

Also Published As

Publication number Publication date
CN102025999A (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN102025999B (zh) 基于支持向量机的视频转码快速帧内预测方法
CN104811710B (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN104980744B (zh) 对视频进行解码的方法
CN101015215B (zh) 用于在视频编码解码器中实施快速模式决策的方法及设备
CN104935943B (zh) 对帧内预测模式进行解码的方法
CN105163131B (zh) 视频解码设备和方法
CN102790878B (zh) 一种视频编码的编码模式选择方法及装置
CN106375765B (zh) 通过使用任意块的帧间预测编码/解码图像的方法和装置
CN105306939B (zh) 用于对视频进行解码的方法和装置
CN101584219B (zh) 基于帧内预测进行编码和解码的方法和设备
CN103283238B (zh) 利用按照编码单元的并行帧内预测进行编码和解码的方法和装置
CN103210646B (zh) 通过有效选择帧内预测模式组来对图像编码/解码的方法和装置
CN103634606B (zh) 视频编码方法和装置
CN103188496B (zh) 基于运动矢量分布预测的快速运动估计视频编码方法
CN1658673A (zh) 视频压缩编解码方法
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置
CN103250412A (zh) 用于率失真优化的图像编码/解码方法和用于执行该方法的装置
CN101971631A (zh) 自适应帧内模式选择
CN103067704B (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
CN101022555B (zh) 帧间预测编码的模式快速选择方法
CN103152563A (zh) 视频数据的解码设备
CN101888546B (zh) 一种运动估计的方法及装置
CN103442228B (zh) 从h.264/avc标准到hevc标准的快速帧内转码方法及其转码器
CN103782600A (zh) 速率失真优化的图像编码/解码方法和执行该方法的设备
CN107566846A (zh) 视频编码跳过模式决策方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120516

Termination date: 20191231

CF01 Termination of patent right due to non-payment of annual fee