CN104320667A - 多过程最优化编转码系统及方法 - Google Patents

多过程最优化编转码系统及方法 Download PDF

Info

Publication number
CN104320667A
CN104320667A CN201410610390.4A CN201410610390A CN104320667A CN 104320667 A CN104320667 A CN 104320667A CN 201410610390 A CN201410610390 A CN 201410610390A CN 104320667 A CN104320667 A CN 104320667A
Authority
CN
China
Prior art keywords
centerdot
coding
encoding
stage
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410610390.4A
Other languages
English (en)
Other versions
CN104320667B (zh
Inventor
王志诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHEJIANG TELEMEDIA TECHNOLOGY Co Ltd
Original Assignee
ZHEJIANG TELEMEDIA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHEJIANG TELEMEDIA TECHNOLOGY Co Ltd filed Critical ZHEJIANG TELEMEDIA TECHNOLOGY Co Ltd
Priority to CN201410610390.4A priority Critical patent/CN104320667B/zh
Publication of CN104320667A publication Critical patent/CN104320667A/zh
Application granted granted Critical
Publication of CN104320667B publication Critical patent/CN104320667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种多过程最优化编码系统,包括若干个并行编码器、前瞻缓冲器和二次编码器,前瞻缓冲器的输入端与并行编码器的输出端连接,前瞻缓冲器的输出端与二次编码器的输入端连接,并公开了其方法,包括第一编码阶段、最优化选择阶段和第二编码阶段3个步骤,第一编码阶段由若干个并行编码器同时进行编码,前瞻缓冲器对第一编码阶段所得到的结果进行最优化选择以获得最优编码路径,二次编码器根据最优化选择阶段所获得的最优编码路径第二次编码,获得最终而最优的编码结果。本发明性能、质量、带宽效率更高,编码/转码结果更好,非常易于配置并且非常灵活,既可用于高视频质量的4K和超高清应用,也可用于超高效带宽的移动视频应用。

Description

多过程最优化编转码系统及方法
技术领域
本发明涉及视频编解码领域,尤其是指一种多过程最优化编转码系统及方法。 
背景技术
在高质量视频转码和编码产业领域,系统和芯片开发商会想尽办法来提高自己的视频质量和压缩效率以获得市场竞争力,如如何优化多过程编码和转码,通过多过程系统提供的高质量视频和低带宽来吸引客户,并以此获取更大的利润空间;系统使用者和服务供应商也在不断的寻求找到更高视频质量、进一步减少码率带宽、具有多过程编码/转码特征的产品,更愿意购买性能、质量、带宽效率更高的产品。 
传统的多过程编码方案是使用多个过程的第一个过程,向前获取编码信息、比特数据和即将接收的图像特征,随后通过下一个过程提高质量,即多个过程编码连续进行。 
传统的多过程编码方案有以下几个缺点:1.它会造成长编码延时,这一延时随编码过程(阶段)数量的改变而改变,并且当操作员改变编码过程数量时,所提供的服务和网络也会发生变化;2.因为视频具有时域的相关性,并且缓存器的空间也是有限的,所以过长的前向预测是不必要的;3.后续的编码过程收效甚微;4.传统结构会产生冗余并且不灵活,具有脆弱性,在编码过程的任何阶段都可能产生错误动作并且这些错误会造成累加;5.传统多过程编码系统的硬件或软件实现不易于改变和提高。 
发明内容
为了解决常规的多过程编转码方法效率低的问题,本发明提出了一种多过程最优化编转码系统及方法,性能、质量、带宽效率更高,编码/转码结果更好,非常易于配置并且非常灵活,既可用于高视频质量的4K和超高清应用,也可用于超高效带宽的移动视频应用。 
本发明所采用的技术方案是:一种多过程最优化编转码系统,包括若干个并行编码器、一个前瞻缓冲器和一个二次编码器,所述前瞻缓冲器的输入端与并行编码器的输出端连接,前瞻缓冲器的输出端与二次编码器的输入端连接。 
其中,若干个并行编码器用于对原始图像同时进行编码,前瞻缓冲器用于对 第一编码阶段得到的若干个初次编码结果进行最优化选择,二次编码器根据最优化选择阶段所获得的最优编码路径继续编码,获得最终编码结果。 
在上述基础上,本发明的另一技术方案是:一种多过程最优化编转码方法,包括如下步骤: 
(1)第一编码阶段:由若干个并行编码器对原始图像同时进行编码,即多过程编码,得到初次编码结果; 
(2)最优化选择阶段:前瞻缓冲器对第一编码阶段得到的若干个初次编码结果进行最优化选择,获得最优编码路径; 
(3)第二编码阶段:由二次编码器根据最优化选择阶段所获得的最优编码路径继续编码,获得最终编码结果。 
本发明具有灵活、编码延时可预测、功能多样、易于应用等诸多特性,针对不同内容的最优化过程以及灵活的比特率和编码控制,性能、质量、带宽效率更高,编码/转码结果更好。 
作为优选,所述步骤(1)中的并行编码器和步骤(3)中的二次编码器的编码方式均为H.265、H.264、MPEG-2或AVS的任意一种。目前国际视频压缩标准HEVC(H.265)、H.264、MPEG-2和国内AVS各版本都可应用于本发明的步骤(1)中的并行编码器和步骤(3)中的二次编码器。 
作为优选,所述步骤(1)中,并行编码器的数量为3个。 
作为优选,所述步骤(2)的最优化选择包括如下步骤: 
a.收集视频特征:根据第一编码阶段各并行编码器的每一帧的编码结果,定义N为原始图像和第一编码阶段后图像的总像素数,pi分别为原始图像和第一编码阶段后图像中像素i的像素值,i为像素的序号,原始图像包含MB个模块,原始图像信道频域的频带总数为NF,t是画面帧的时间,分别计算距离绝对值和SAD、像素均值Mp、像素方差值Vp、信道频域绝对值ΦF(f,t)、信道频域方差σF(f,t)及运动向量值MV(x,y),其中:距离绝对值和 
SAD = 1 N Σ i = 1 N | p i - p i ~ | - - - ( 1 )
像素均值 
M p = 1 N Σ i = 1 N p i - - - ( 2 )
像素方差值 
V p = 1 N Σ i = 1 N ( p i - M p ) 2 - - - ( 3 )
信道频域绝对值 
Φ F ( f , t ) = 1 M B Σ j = 1 M B | s i ( f , t ) | - - - ( 4 )
信道频域方差 
σ F ( f , t ) = 1 M B Σ j = 1 M B ( | s i ( f , t ) | - Φ F ( f , t ) ) 2 - - - ( 5 )
sj(f,t)为频域离散傅里叶变换函数, 
s j ( f , t ) = 1 N Σ i = 0 N - 1 p i e - j 2 πf · i N - - - ( 6 )
式(4)、式(5)和式(6)中,{f=0,1,...,NF-1},f为频带序数,j为模块序数, 
运动向量值为MV(x,y),定义运动向量得到叠加运动向量MV(z),其中x和y是运动向量的水平和垂直坐标; 
b.据步骤a获得的各视频特征依次计算得到各个并行编码器所得第一帧的编码结果的失真度d(t): 
d(t)=w1*SAD+w2*fΦF,Mp)+w3*fσF,Vp)+w4*MV(z)    (7) 
式(7)中,SAD为距离绝对值和,w1、w2、w3和w4均为取值范围在{0,1}的经验加权数且w1+w2+w3+w4=1,fΦF,Mp)为空间域中基于变量ΦF、Mp的均值经验方程或线性方程,fσF,Vp)为频域中基于变量σF、Vp的均值经验方程或线性方程,MV(z)是叠加运动向量; 
c.将若干个并行解码器所用的比特率分别记为rm,步骤b获得的若干个叠加失真度分别记为dm,m为1到K的自然数,K为并行编码器的数量,得到比特率/失真度比值, 
Δ d m Δ r m = d m + 1 - d m r m + 1 - r m - - - ( 8 )
将得到的若干个比特率/失真度比值进行比较,比特率/失真度比值最小的即为第一帧的最优编码途径; 
d.重复步骤a至c,获得第二帧到最后一帧的最优编码途径,从而获得整个原始图像的最优编码途径。 
本发明的有益效果是:对编码延时有预测性,使操作者的使用和服务不会受到影响,即使当编码过程的数量由于操作者的应用和需求发生改变;从应用和编码控制的角度来说,具有灵活性,并且第一阶段的编码过程仅取决于编码准则和方法的控制调节;能够提供广泛编码选项和最优化;对于大范围的不同的视频内容和网络环境具有稳固适应性;硬件和软件实施具有灵活性、稳固适应性,并且易于应用到目前的和其它的硬件平台。 
附图说明
图1是本发明中一种多过程最优化编转码系统的结构框图; 
图2是本发明中第一帧最优化选择的示意图; 
图3是本发明中最优化路径选择的示意图。 
图中,1-并行编码器,2-前瞻缓冲器,3-二次编码器,4-原始图像,5-最终编码结果。 
具体实施方式
下面结合实施例对本发明作进一步的详细说明。 
如图1所示,一种多过程最优化编转码系统,包括三个并行编码器1、一个前瞻缓冲器2和一个二次编码器3,前瞻缓冲器2的输入端与并行编码器1的输出端连接,前瞻缓冲器2的输出端与二次编码器3的输入端连接。 
多过程最优化编转码方法的步骤如下: 
(1)第一编码阶段:由若干个并行编码器对原始图像同时进行编码,即多过程编码,得到初次编码结果; 
(2)最优化选择阶段:前瞻缓冲器对第一编码阶段得到的若干个初次编码结果进行最优化选择,获得最优编码路径; 
(3)第二编码阶段:由二次编码器根据最优化选择阶段所获得的最优编码路径继续编码,获得最终编码结果。 
步骤(1)中的并行编码器和步骤(3)中的二次编码器的编码方式均为H.265、H.264、MPEG-2或AVS的任意一种。目前国际视频压缩标准H.265(HEVC)、H.264、MPEG-2和国内AVS各版本都可应用于本发明的步骤(1)中的并行编码器和步骤(3)中的二次编码器。 
步骤(2)的最优化选择包括如下步骤: 
第一步,收集视频特征:根据第一编码阶段各并行编码器的每一帧的编码结果,定义N为原始图像和第一编码阶段后图像的总像素数,pi分别为原始图像和第一编码阶段后图像中像素i的像素值,i为像素的序号,原始图像包含MB个模块,原始图像信道频域的频带总数为NF,t是画面帧的时间,分别计算距离绝对值和SAD、像素均值Mp、像素方差值Vp、信道频域绝对值ΦF(f,t)、信道频域方差σF(f,t)及运动向量值MV(x,y)。 
距离绝对值和即Sum of Absolute Distance,简称SAD,是视频图像压缩领域传统且广泛应用的测量方法。 
SAD = 1 N Σ i = 1 N | p i - p i ~ | - - - ( 1 )
像素均值 M p = 1 N Σ i = 1 N p i - - - ( 2 )
像素方差值 V p = 1 N Σ i = 1 N ( p i - M p ) 2 - - - ( 3 )
信道频域绝对值 Φ F ( f , t ) = 1 M B Σ j = 1 M B | s i ( f , t ) | - - - ( 4 )
信道频域方差 σ F ( f , t ) = 1 M B Σ j = 1 M B ( | s i ( f , t ) | - Φ F ( f , t ) ) 2 - - - ( 5 )
sj(f,t)为频域离散傅里叶变换函数, 
s j ( f , t ) = 1 N Σ i = 0 N - 1 p i e - j 2 πf · i N - - - ( 6 )
式(4)、式(5)和式(6)中,{f=0,1,...,NF-1},f为频带序数,j为模块序数, 
运动向量值为MV(x,y),定义运动向量得到叠加运动向量MV(z),其中x和y是运动向量的水平和垂直坐标。 
第二步,根据第一步获得的各视频特征依次计算得到各个并行编码器所得第一帧的编码结果的失真度d(t): 
d(t)=w1*SAD+w2*fΦF,Mp)+w3*fσF,Vp)+w4*MV(z)    (7) 
式(7)中,SAD为距离绝对值和,w1、w2、w3和w4均为取值范围在{0,1}的经验加权数且w1+w2+w3+w4=1,fΦF,Mp)为空间域中基于变量ΦF、Mp的均值经验方程或线性方程,fσF,Vp)为频域中基于变量σF、Vp的均值经验方程或线性方程,MV(z)是叠加运动向量。 
第三步,将三个并行解码器所用的比特率分别记为rm,步骤b获得的三个叠加失真度分别记为dm,m为1到3的自然数,得到比特率/失真度比值, 
Δ d m Δ r m = d m + 1 - d m r m + 1 - r m - - - ( 8 )
将得到的若干个比特率/失真度比值进行比较,比特率/失真度比值最小的即为第一帧的最优编码途径。 
第四步,重复步骤a至c,获得第二帧到最后一帧的最优编码途径,从而获得整个原始图像的最优编码途径。 
如图2所示,三个并行编码器分别以不同的比特率同时处理同样的原始图像,尽可能接近比特-失真率的极限曲线(香农信源编码定理的极限),比特率分别为r1、r2、r3且取P1、P2、P3分别为T1时刻第一帧处理后的位置,L1、L2分别为经过P1和P2、P2和P3的两条直线。 
由于比特率的取值△r1=r2-r1,△r2=r3-r2,得到△r1=△r2;分别计算失真度d1、d2、d3,△d1=d2-d1,△d2=d3-d2。具体计算步骤如式(1)至式(7),这里不加赘述。 
计算得到或者表现在图2中,就是直线L2比L1要陡。 
所以r1和r2之间的比特率是较为理想的选择,即根据比特率-失真范围在编码点P1和P2之间选择编码点,具有最低失真增长的比特率就是最优编码选择。 
如图3所示,以帧为单位计算,设格状路径深度为D(从T1到TD),在T1已有第一编码阶段计算得到的四个状态P1、P2、P3、P4及其比特率和失真度,P2为T1最佳路径;继续计算从T1到T2时间帧的各状态的累积比特率和累积失真度,并保留各路径的累积比特率和累积失真度,以此类推到格状路径深度为D为止,具有最低累积失真度增长的低累积比特率就是最优路径选择,如图3中的黑点所示。 
本发明的优点和特征:对编码延时有预测性,使操作者的使用和服务不会受到影响,即使当编码过程的数量由于操作者的应用和需求发生改变;从应用和编码控制的角度来说,具有灵活性,并且第一阶段的编码过程仅取决于编码准则和方法的控制调节;能够提供广泛编码选项和最优化;对于大范围的不同的视频内容和网络环境(特别对于转码)具有稳固适应性;硬件和软件实施具有灵活性、稳固适应性,并且易于应用到目前的和其它的硬件平台。 
为了使本发明的多过程编码/转码解决方案变的更加功能多样和灵活,一个高清的视频流(基带信号或者压缩传输流)可输入到一阶编码/转码器中转变为一个标清分辨率,并且同时进行编码和输出。在多路系统中添加了多个编码/转码特征,并且仍然带有高清编码功能和HD到HD的转码功能。有些功能例如背景改变识别、分辨率设置、噪声和熵滤波器也可以被加入到编码过程中。 
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明的保护范围之内。 

Claims (5)

1.一种多过程最优化编转码系统,其特征在于:包括若干个并行编码器、一个前瞻缓冲器和一个二次编码器,所述前瞻缓冲器的输入端与并行编码器的输出端连接,前瞻缓冲器的输出端与二次编码器的输入端连接。
2.一种基于权利要求1所述多过程最优化编转码系统的多过程最优化编转码方法,其特征在于:包括如下步骤:
(1)第一编码阶段:由若干个并行编码器对原始图像同时进行编码,即多过程编码,得到初次编码结果;
(2)最优化选择阶段:前瞻缓冲器对第一编码阶段得到的若干个初次编码结果进行最优化选择,获得最优编码路径;
(3)第二编码阶段:由二次编码器根据最优化选择阶段所获得的最优编码路径继续编码,获得最终编码结果。
3.根据权利要求2所述的多过程最优化编转码方法,其特征在于:所述步骤(1)中的并行编码器和步骤(3)中的二次编码器的编码方式均为H.265、H.264、MPEG-2或AVS的任意一种。
4.根据权利要求2或3所述的一种多过程最优化编转码方法,其特征在于:所述步骤(1)中,并行编码器的数量为3个。
5.根据权利要求2所述的多过程最优化编转码方法,其特征在于:所述步骤(2)的最优化选择包括如下步骤:
a.收集视频特征:根据第一编码阶段各并行编码器的每一帧的编码结果,定义N为原始图像和第一编码阶段后图像的总像素数,pi分别为原始图像和第一编码阶段后图像中像素i的像素值,i为像素的序号,原始图像包含MB个模块,原始图像信道频域的频带总数为NF,t是画面帧的时间,分别计算距离绝对值和SAD、像素均值Mp、像素方差值Vp、信道频域绝对值ΦF(f,t)、信道频域方差σF(f,t)及运动向量值MV(x,y),其中:
距离绝对值和
SAD = 1 N Σ i = 1 N | p i - p ~ i | · · · ( 1 )
像素均值
M p = 1 N Σ i = 1 N p i · · · ( 2 )
像素方差值
V p = 1 N Σ i = 1 N ( p i - M p ) 2 · · · ( 3 )
信道频域绝对值
Φ F ( f , t ) = 1 M B Σ j = 1 M B | s j ( f , t ) | · · · ( 4 )
信道频域方差
σ F ( f , t ) = 1 M B Σ j = 1 M B ( | s j ( f , t ) | - Φ F ( f , t ) ) 2 · · · ( 5 )
sj(f,t)为频域离散傅里叶变换函数,
s j ( f , t ) = 1 N Σ i = 0 N - 1 p i e - j 2 πf · i N · · · ( 6 )
式(4)、式(5)和式(6)中,{f=0,1,...,NF-1},f为频带序数,j为模块序数,
运动向量值为MV(x,y),定义运动向量得到叠加运动向量MV(z),其中x和y是运动向量的水平和垂直坐标;
b.根据步骤a获得的各视频特征依次计算得到各个并行编码器所得第一帧的编码结果的失真度d(t):
d(t)=w1*SAD+w2*fΦF,Mp)+w3*fσF,Vp)+w4*MV(z)  (7)
式(7)中,SAD为距离绝对值和,w1、w2、w3和w4均为取值范围在{0,1}的经验加权数且w1+w2+w3+w4=1,fΦF,Mp)为空间域中基于变量ΦF、Mp的均值经验方程或线性方程,fσF,Vp)为频域中基于变量σF、Vp的均值经验方程或线性方程,MV(z)是叠加运动向量;
c.将若干个并行解码器所用的比特率分别记为rm,步骤b获得的若干个叠加失真度分别记为dm,m为1到K的自然数,K为并行编码器的数量,得到比特率/失真度比值,
Δd m Δr m = d m + 1 - d m r m + 1 - r m · · · ( 8 )
将得到的若干个比特率/失真度比值进行比较,比特率/失真度比值最小的即为第一帧的最优编码途径;
d.重复步骤a至c,获得第二帧到最后一帧的最优编码途径,从而获得整个原始图像的最优编码途径。
CN201410610390.4A 2014-11-03 2014-11-03 多过程最优化编转码系统及方法 Active CN104320667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410610390.4A CN104320667B (zh) 2014-11-03 2014-11-03 多过程最优化编转码系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410610390.4A CN104320667B (zh) 2014-11-03 2014-11-03 多过程最优化编转码系统及方法

Publications (2)

Publication Number Publication Date
CN104320667A true CN104320667A (zh) 2015-01-28
CN104320667B CN104320667B (zh) 2017-11-03

Family

ID=52375824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410610390.4A Active CN104320667B (zh) 2014-11-03 2014-11-03 多过程最优化编转码系统及方法

Country Status (1)

Country Link
CN (1) CN104320667B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070064793A1 (en) * 2005-09-22 2007-03-22 Haohong Wang Two pass rate control techniques for video coding using rate-distortion characteristics
CN101331773A (zh) * 2005-09-22 2008-12-24 高通股份有限公司 使用速率失真特性进行视频编码的两遍速率控制技术
CN104067619A (zh) * 2012-01-20 2014-09-24 富士通株式会社 视频解码器、视频编码器、视频解码方法以及视频编码方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070064793A1 (en) * 2005-09-22 2007-03-22 Haohong Wang Two pass rate control techniques for video coding using rate-distortion characteristics
CN101331773A (zh) * 2005-09-22 2008-12-24 高通股份有限公司 使用速率失真特性进行视频编码的两遍速率控制技术
CN104067619A (zh) * 2012-01-20 2014-09-24 富士通株式会社 视频解码器、视频编码器、视频解码方法以及视频编码方法

Also Published As

Publication number Publication date
CN104320667B (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
Wagner et al. Rate region of the quadratic Gaussian two-encoder source-coding problem
CN110235444A (zh) 使用多条参考线的帧内预测
US20150189269A1 (en) Recursive block partitioning
CN101552917B (zh) 一种视频压缩码率控制方法
CN103220510A (zh) 在hevc中的采样自适应偏移中的灵活带偏移模式
US10515649B2 (en) Method for coding pulse vectors using statistical properties
US9641850B2 (en) Video compression device
US20140119456A1 (en) Encoding video into lower resolution streams
CN105898300B (zh) 一种基于恢复变换系数的改进变换系数符号位隐藏方法
US20180199058A1 (en) Video encoding and decoding method and device
CN102857760B (zh) 一种无反馈的优化码率的分布式视频编解码方法及其系统
US20140119446A1 (en) Preserving rounding errors in video coding
CN103096048A (zh) 一种可伸缩视频编码量化参数确定方法及装置
US9990931B2 (en) Method for coding pulse vectors using statistical properties
US10390025B2 (en) Method and apparatus for encoding and decoding video signal using improved prediction filter
CN104320667A (zh) 多过程最优化编转码系统及方法
EP3180863B1 (en) Method for coding pulse vectors using statistical properties
US9584833B2 (en) Method for coding pulse vectors using statistical properties
CN104052999B (zh) 平行编码系统中执行速率控制的方法及平行编码系统
CN106612434A (zh) 一种基于视频复杂度的统计复用方法
US11645079B2 (en) Gain control for multiple description coding
Yahampath Predictive vector quantizer design for distributed source coding
Xiang et al. Distortion analysis of Wyner-Ziv distributed video coding
WO2018133043A1 (zh) 量化器与量化方法
Ardestani et al. Unequal loss-protected multiple description coding of scalable source streams using a progressive approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant