CN101540908B - 视频编码处理方法和装置 - Google Patents

视频编码处理方法和装置 Download PDF

Info

Publication number
CN101540908B
CN101540908B CN 200910080948 CN200910080948A CN101540908B CN 101540908 B CN101540908 B CN 101540908B CN 200910080948 CN200910080948 CN 200910080948 CN 200910080948 A CN200910080948 A CN 200910080948A CN 101540908 B CN101540908 B CN 101540908B
Authority
CN
China
Prior art keywords
compile
waiting
coder
layer
code check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200910080948
Other languages
English (en)
Other versions
CN101540908A (zh
Inventor
刘家瑛
郭宗明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CN 200910080948 priority Critical patent/CN101540908B/zh
Publication of CN101540908A publication Critical patent/CN101540908A/zh
Priority to PCT/CN2010/000400 priority patent/WO2010111890A1/zh
Application granted granted Critical
Publication of CN101540908B publication Critical patent/CN101540908B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供了一种视频编码处理方法,包括:在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率。本发明还提供了一种视频编码处理装置。本发明解决了现有技术无法对各层次的码率实现有效地分配,因而编码性能较差的问题,从而大幅度地提高了空域可伸缩编码的编码性能,使得编码效率最大化。

Description

视频编码处理方法和装置
技术领域
本发明涉及视频处理领域,具体而言,涉及一种视频编码处理方法和装置。
背景技术
作为新一代视频压缩编码标准H.264/AVC的扩展,可伸缩视频编码(Scalable Video Coding,SVC)技术已经于2007年7月正式标准化。H.264/SVC通过压缩原始视频内容,使得同时支持多种不同比特率和显示分辨率的有效重构,从而更好地适应于现有异构、时变的网络终端环境,使得编码压缩后的视频更加灵活地满足不同的视频通信网络和终端用户的应用需要。H.264/SVC提供了可伸缩编码的有效解决方案,通过一次编码产生高码率的总码流,可以根据用户需求和应用环境,利用部分层次码流的数据,得到各自时域、空域和信噪比的解码。目前,H.264/SVC支持了时域、空域和质量域三个维度上的可伸缩性,并且基本实现了对于解码器复杂性和编码效率的平衡设计,而其中基于视频尺寸(空域)的分层是该技术的基本结构。
在空域可伸缩性编码中,H.264/SVC遵循了传统的多层次编码的方法:首先将原始尺寸的视频序列分解(进行下采样)得到若干不同空间分辨率的子序列,其中每个分辨率都对应于一个空域编码层。由于低层是由高层通过下采样得到的,因此在相同的时域分辨率情况下,每一个高层帧都有与之相对应的低层帧,两者之间存在着显而易见的相关性,我们称之为层间冗余。显然,为了获得更高的压缩效率,有必要通过各种层间预测技术来消除层间冗余,这也是空域可伸缩性技术的关键所在。为了进一步提高可伸缩各层次间的编码效率,SVC最新引入了“层间预测”的概念。通过层间帧内预测、层间帧间运动预测和层间残差预测三种预测模式,充分挖掘了层次间的相关性。而在每个空域层内,则采用了层次化B帧(Hierarchical-B)的编码结构。高时域层上的图像帧依赖于低时域层上的图像帧作为参考帧进行预测,以实现层次化帧率的时域可伸缩性编码。
由于这种层次化的结构设计,在总码流目标码率相对固定的情况下,采用不同的分配方案对各层次的码率进行分配会导致不同的编码效率。同时由于各层次间的依赖性,使得在总码率一定的情况下,各层次的失真关系呈现此消彼长的特性。所以需要同时考虑各层次的编码效率和特性,以在有效地平衡各层次间的相关性的基础上,求取码率的优化分配方案。但是,现有的SVC技术还不支持任何视频层次间的码率分配机制,编码过程采用由底向上的顺序性方式,即从最底部的基本层(Base Layer,BL)开始,依次根据编码重建后的前驱视频层作为编码增强层(Enhancement layer,EL)的预测,每一层的目标码率都是分别先验设定的。这种顺序性分配的方法忽略了待编层与参考层之间编码的相关性,损失了一定的编码效率。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的H.264/SVC码率分配方法采用由底向上的顺序性方式,无法对各层次的码率实现有效地分配,因而编码性能较差。
发明内容
本发明旨在提供一种视频编码处理方法和装置,能够解决现有技术无法对各层次的码率实现有效地分配,因而编码性能较差的问题。
在本发明的实施例中,提供了一种视频编码处理方法,包括:在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率;其中,在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型具体包括:根据空域可伸缩视频编码的结构,获取待编层编码器的输入差分序列;对输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;根据变换后系数的分布,建立变换后系数的概率密度分布函数与参考层编码器的量化步长的关系;根据概率密度分布函数与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型。
在本发明的实施例中,还提供了一种视频编码处理装置,包括:失真模型建立模块,用于在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;码率模型建立模块,用于通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;码率分配模块,用于根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率;其中,失真模型建立模块具体包括:获取单元,用于根据空域可伸缩视频编码的结构,获取待编层编码器的输入差分序列;变换单元,用于对输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;关系建立单元,用于根据变换后系数的分布,建立变换后系数的概率密度分布函数与参考层编码器的量化步长的关系;编码失真模型建立单元,用于根据概率密度分布函数与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型。
因为通过对参考层编码器具有依赖关系的待编层编码器建立去相关的率失真模型,从而将码率分配问题转化为给定总码率的前提下使得各编码层编码失真总和最小的优化问题,最终求取各编码层的码率最优解,解决了现有技术无法对各层次的码率实现有效地分配,因而编码性能较差的问题,从而大幅度地提高了空域可伸缩编码的编码性能,使得编码效率最大化。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的视频编码处理方法的流程图;
图2示出了根据本发明实施例的视频编码处理装置的示意图;
图3示出了根据本发明优选实施例一的空域可伸缩视频编码器的基本框架图;
图4示出了根据本发明优选实施例一的用于分析增强层编码器输入差分序列的信号流图;
图5示出了根据本发明优选实施例一的增强层编码器输入差分序列经离散余弦变换后的变换后系数的概率密度分布函数图;
图6示出了根据本发明优选实施例一的用于拟合变换后系数分布的柯西分布函数的参数与基本层编码器的量化步长的关系图;
图7示出了根据本发明优选实施例一的基本层编码器和增强层编码器的码率关系图;
图8示出了根据本发明优选实施例一的增强层编码器的码率抽象模型图。
具体实施方式
为了解决现有技术中存在的无法对各层次的码率实现有效地分配,编码性能较差的问题,本发明提供了一种视频编码处理方法,在空域可伸缩视频编码中,首先根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;然后通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;最后根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率。本发明还提供了一种视频编码处理装置以实现上述视频编码处理方法。本发明由于在进行码率分配的过程中,充分考虑各层次编码器之间的相关关系,采用由高向低的顺序进行码率分配。通过对参考层编码器具有依赖关系的待编层编码器建立去相关的率失真模型,从而将码率分配问题转化为给定总码率的前提下使得各编码层编码失真总和最小的优化问题,最终求取各编码层的码率最优解,实现了空域可伸缩编码的码率优化分配,从而大幅度地提高了空域可伸缩编码的编码性能,使得编码效率最大化。
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明实施例的视频编码处理方法的流程图,包括:
步骤S10,在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;
步骤S20,通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;
步骤S30,根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率。
该实施例由于通过对参考层编码器具有依赖关系的待编层编码器建立去相关的率失真模型,从而将码率分配问题转化为给定总码率的前提下使得各编码层编码失真总和最小的优化问题,最终求取各编码层的码率最优解,从而得到各个编码层的码率优化分配方案。
该实施例充分考虑了可伸缩视频编码的层次编码结构带来的各层次间的相关关系,在进行码率分配时有效地利用了编码信息,从而大幅度地提高了空域可伸缩视频编码的编码性能,使得编码效率最大化。如,与现有技术相比,采用本实施例可以使得各编码层编码器的编码失真总和最小,各编码层编码器的总码率最低。
优选地,在上述的视频编码处理方法中,步骤S10具体包括:根据空域可伸缩视频编码的结构,获取待编层编码器的输入差分序列;对输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;根据变换后系数的分布,建立变换后系数的概率密度分布函数与参考层编码器的量化步长的关系;根据概率密度分布函数与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型。
其中,变换后系数的分布满足零均值的柯西分布,变换后系数的概率密度分布函数与参考层编码器的量化步长的关系为:
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,μ为概率密度分布函数参数,η和
Figure GSB00000252994500072
为仿射模型的模型参数,Q1为参考层编码器的量化步长;
待编层编码器的编码失真模型为:
D 2 ( Q 1 , Q 2 ) ≈ ( ζ Q 1 + υ ) · Q 2 β 2 ,
其中,ζ、υ和β2为待编层编码器的编码失真模型参数,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,D2(Q1,Q2)为待编层编码器的编码失真值。
该优选实施例提供了建立待编层编码器的编码失真模型的具体实施方案。由于空域可伸缩视频编码的各层次的相关性,待编层编码器的编码失真不仅与自身的量化步长有关,还与参考层编码器的量化步长有关,因此,可以通过分析待编层编码器的输入差分序列(与参考层编码器的量化步长有关)的特性,采用本优选实施例的方案构建去相关的待编层编码器的编码失真模型。
优选地,在上述的视频编码处理方法中,待编层编码器的码率模型为:
R 2 ( Q 1 , Q 2 ) = r &CenterDot; R 1 ( Q 1 ) + ( s - r ) &CenterDot; R 1 ( Q 2 ) , Q 1 &GreaterEqual; Q 2 s &CenterDot; R 1 ( Q 2 ) , Q 1 < Q 2 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; R 1 ( Q 2 ) = a &CenterDot; Q 2 - &alpha; ,
其中,R1(Q1)为当量化步长为Q1时参考层编码器的码率,R1(Q2)为当量化步长为Q2时参考层编码器的码率,R2(Q1,Q2)为当参考层编码器的量化步长为Q1、待编层编码器的量化步长为Q2时待编层编码器的码率,待编层编码器的码率模型参数s和r分别表示当Q1=Q2和Q1>Q2时,待编层编码器和参考层编码器的码率呈线性关系的斜率值,a和α为参考层编码器的码率模型参数。
该优选实施例提供了建立待编层编码器的码率模型的具体实施方案。通过本优选实施例可以建立待编层编码器的码率与待编层编码器和参考层编码器的量化步长之间的关系。
优选地,在上述的视频编码处理方法中,步骤S30具体包括:根据待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,参考层编码器和待编层编码器的量化步长的最优值;根据参考层编码器和待编层编码器的量化步长的最优值,分配参考层编码器和待编层编码器的码率。
其中,根据待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,参考层编码器和待编层编码器的量化步长的最优值具体包括:根据待编层的编码失真模型和码率模型,建立给定总码率的条件下,参考层编码器和待编层编码器的编码失真总和最小的模型;采用拉格朗日乘数法计算编码失真总和最小的模型中,参考层编码器和待编层编码器的量化步长的最优值。
其中,给定总码率的条件下,参考层编码器和待编层编码器的编码失真总和最小的模型为:
Q * = ( Q 1 * , Q 2 * ) = arg min Q 1 , Q 2 &Element; Q [ D 1 ( Q 1 ) + D 2 ( Q 1 , Q 2 ) ] R 1 ( Q 1 ) + R 2 ( Q 1 , Q 2 ) &le; R total D 1 ( Q 1 ) = b &CenterDot; Q 1 &beta; 1 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; ,
其中,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,
Figure GSB00000252994500092
为参考层编码器和待编层编码器的最优量化矢量,Q为量化步长的备选集合,D1(Q1)和D2(Q1,Q2)分别为参考层编码器和待编层编码器的编码失真值,R1(Q1)和R2(Q1,Q2)分别为参考层编码器和待编层编码器的码率,Rtotal,为总码率,b和β1为参考层编码器的编码失真模型参数,a和α为参考层编码器的码率模型参数。
该优选实施例提供了根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率的具体实施方案。采用本优选实施例可以将码率优化分配问题转化为给定总码率的前提下,使得各编码层的编码失真总和最小的优化问题,从而实现码率的优化分配,使得总失真最小。
可选地,在上述的视频编码处理方法中,参考层编码器和待编层编码器分别为空域可伸缩视频编码的基本层编码器和增强层编码器。当采用两层的可伸缩视频编码时,可将基本层作为参考层,增强层作为待编层采用上述的优选实施例进行各视频层码率的优化分配。对于三层或以上的情况,通常采用递归的方式进行,将最高层作为待编层,其所有前驱视频层作为参考层,从而依次求解,最终实现各视频层的码率优化分配。
在本实施例的视频处理方法中使用了具有相关关系的视频层的率失真模型,它区别于以往传统视频编码中码率和失真都是量化参数的单变元函数。本实施例对于H.264/SVC中具有相关关系的视频层,其码率和失真特性都是由参考层和待编层等多个量化参数作为变元的函数关系,同时分别确定每一个参数对于失真和码率特性的具体影响,对多变元函数关系进行去相关操作,从而实现优化问题的求解。通过对具有相关性的可伸缩视频编码结构,将多变元的率失真函数关系转化为若干个单变元函数的线性组合,极大地降低了码率分配最优化问题求解的复杂性,并使用优化问题进行数值求解,最终得到该问题的最优解,从而使得编码效率最大化,进一步优化了可伸缩视频编码器的编码性能。
图2示出了根据本发明实施例的视频编码处理装置的示意图,包括:失真模型建立模块10,用于在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型;码率模型建立模块20,用于通过分析参考层编码器的码率和待编层编码器的码率的关系,建立待编层编码器的码率模型;码率分配模块30,用于根据待编层编码器的编码失真模型和码率模型,分配参考层编码器和待编层编码器的码率。
该实施例由于通过对参考层编码器具有依赖关系的待编层编码器建立去相关的率失真模型,从而将码率分配问题转化为给定总码率的前提下使得各编码层编码失真总和最小的优化问题,最终求取各编码层的码率最优解,从而得到各个编码层的码率优化分配方案。
该实施例充分考虑了可伸缩视频编码的层次编码结构带来的各层次间的相关关系,在进行码率分配时有效地利用了编码信息,从而大幅度地提高了空域可伸缩编码的编码性能,使得编码效率最大化。如,与现有技术相比,采用本实施例可以使得各编码层编码器的编码失真总和最小,各编码层编码器的总码率最低。
优选地,在上述的视频编码处理装置中,失真模型建立模块10具体包括:获取单元,用于根据空域可伸缩视频编码的结构,获取待编层编码器的输入差分序列;变换单元,用于对输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;关系建立单元,用于根据变换后系数的分布,建立变换后系数的概率密度分布函数与参考层编码器的量化步长的关系;编码失真模型建立单元,用于根据概率密度分布函数与参考层编码器的量化步长的关系,建立待编层编码器的编码失真模型。
其中,变换后系数的分布满足零均值的柯西分布,变换后系数的概率密度分布函数与参考层编码器的量化步长的关系为:
Figure GSB00000252994500111
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,μ为概率密度分布函数参数,η和
Figure GSB00000252994500112
为仿射模型的模型参数,Q1为参考层编码器的量化步长;
待编层编码器的编码失真模型为:
D 2 ( Q 1 , Q 2 ) &ap; ( &zeta; Q 1 + &upsi; ) &CenterDot; Q 2 &beta; 2 ,
其中,ζ、υ和β2为待编层编码器的编码失真模型参数,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,D2(Q1,Q2)为待编层编码器的编码失真值。
该优选实施例提供了建立待编层编码器的编码失真模型的具体实施方案。由于空域可伸缩视频编码的各层次的相关性,待编层编码器的编码失真不仅与自身的量化步长有关,还与参考层编码器的量化步长有关,因此,可以通过分析待编层编码器的输入差分序列(与参考层编码器的量化步长有关)的特性,采用本优选实施例的方案构建去相关的待编层编码器的编码失真模型。
优选地,在上述的视频编码处理装置中,待编层编码器的码率模型为:
R 2 ( Q 1 , Q 2 ) = r &CenterDot; R 1 ( Q 1 ) + ( s - r ) &CenterDot; R 1 ( Q 2 ) , Q 1 &GreaterEqual; Q 2 s &CenterDot; R 1 ( Q 2 ) , Q 1 < Q 2 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; R 1 ( Q 2 ) = a &CenterDot; Q 2 - &alpha; ,
其中,R1(Q1)为当量化步长为Q1时参考层编码器的码率,R1(Q2)为当量化步长为Q2时参考层编码器的码率,R2(Q1,Q2)为当参考层编码器的量化步长为Q1、待编层编码器的量化步长为Q2时待编层编码器的码率,待编层编码器的码率模型参数s和r分别表示当Q1=Q2和Q1>Q2时,待编层编码器和参考层编码器的码率呈线性关系的斜率值,a和α为参考层编码器的码率模型参数。
该优选实施例提供了码率模型建立模块的具体实施方案。通过本优选实施例可以建立待编层编码器的码率与待编层编码器和参考层编码器的量化步长之间的关系。
优选地,在上述的视频编码处理装置中,码率分配模块30具体包括:计算单元,用于根据待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,参考层编码器和待编层编码器的量化步长的最优值;分配单元,用于根据参考层编码器和待编层编码器的量化步长的最优值,分配参考层编码器和待编层编码器的码率。
其中,计算单元具体包括:第一单元,用于根据待编层的编码失真模型和码率模型,建立给定总码率的条件下,参考层编码器和待编层编码器的编码失真总和最小的模型;第二单元,用于采用拉格朗日乘数法计算编码失真总和最小的模型中,参考层编码器和待编层编码器的量化步长的最优值。
其中,给定总码率的条件下,参考层编码器和待编层编码器的编码失真总和最小的模型为:
Q * = ( Q 1 * , Q 2 * ) = arg min Q 1 , Q 2 &Element; Q [ D 1 ( Q 1 ) + D 2 ( Q 1 , Q 2 ) ] R 1 ( Q 1 ) + R 2 ( Q 1 , Q 2 ) &le; R total D 1 ( Q 1 ) = b &CenterDot; Q 1 &beta; 1 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; ,
其中,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,
Figure GSB00000252994500132
为参考层编码器和待编层编码器的最优量化矢量,Q为量化步长的备选集合,D1(Q1)和D2(Q1,Q2)分别为参考层编码器和待编层编码器的编码失真值,R1(Q1)和R2(Q1,Q2)分别为参考层编码器和待编层编码器的码率,Rtotal为总码率,b和β1为参考层编码器的编码失真模型参数,a和α为参考层编码器的码率模型参数。
该优选实施例提供了码率分配模块的具体实施方案。采用本优选实施例可以将码率优化分配问题转化为给定总码率的前提下,使得各编码层的编码失真总和最小的优化问题,从而实现码率的优化分配,使得总失真最小。
可选地,在上述的视频编码处理装置中,参考层编码器和待编层编码器分别为空域可伸缩视频编码的基本层编码器和增强层编码器。当采用两层的可伸缩视频编码时,可将基本层作为参考层,增强层作为待编层采用上述的优选实施例进行各视频层码率的优化分配。对于三层或以上的情况,通常采用递归的方式进行,将最高层作为待编层,其所有前驱视频层作为参考层,从而依次求解,最终实现各视频层的码率优化分配。
在本实施例的视频处理装置中使用了具有相关关系的视频层的率失真模型,它区别于以往传统视频编码中码率和失真都是量化参数的单变元函数。本实施例对于H.264/SVC中具有相关关系的视频层,其码率和失真特性都是由参考层和待编层等多个量化参数作为变元的函数关系,同时分别确定每一个参数对于失真和码率特性的具体影响,对多变元函数关系进行去相关操作,从而实现优化问题的求解。通过对具有相关性的可伸缩视频编码结构,将多变元的率失真函数关系转化为若干个单变元函数的线性组合,极大地降低了码率分配最优化问题求解的复杂性,并使用优化问题进行数值求解,最终得到该问题的最优解,从而使得编码效率最大化,进一步优化了可伸缩视频编码器的编码性能。
下面以一个给定目标总码率,两层空域可伸缩编码器为例,结合附图对上述实施例的视频编码处理方法和装置进行进一步地说明。
图3示出了根据本发明优选实施例一的空域可伸缩视频编码器的基本框架图。该空域可伸缩视频编码器中包括基本层编码器和增强层编码器。其输入视频是CIF(Common Intermediate Format,标准化图像格式,352×288像素)尺寸的视频序列,而输出的码流由两个不同分辨率尺寸的空域视频层组成。
原始视频序列经过下采样处理后,基本层编码器会首先获取到原始视频信号的低频分量为QCIF序列(Quarter CIF,176×144像素)作为输入。该低频信号经过量化步长为Q1的量化编码后会产生相应的基本层视频流。而经上采样滤波器重建后的基本层码流将作为层间预测的信息来减少增强层编码器的输入序列编码中低频信号的数据冗余。因此,对于增强层编码器而言,实际编码的输入序列是一个差分序列,它包含了以下两个部分(如图4所示,以一个图像组为例):(1)原始视频序列的高频分量;以及(2)由基本层编码器量化过程所引起的低频失真部分,其反映了基本层编码器与增强层编码器之间的编码相关性。对于固定的待编码序列(即原始视频序列),设置不同的基本层量化步长Q1,所产生的增强层编码器的输入差分序列也会随之变化。当基本层编码器的失真值远远小于高频分量值时,这种相关效应就可以被忽略。由于各层次间的相关性,为了准确表述增强层视频流产生的失真,除了需要研究与增强层编码器的量化步长Q2的关系外,还需要表征增强层编码器的输入差分信号的特性,即与基本层编码器的量化步长Q1的关系。
因为图像帧是基本的码率分配和编码单元,所以可以以每一幅图像帧为单位,分别对该帧内的各宏块进行离散余弦变换(DCT,Discrete Cosine Transform),用变换后的系数的概率密度分布来描述增强层编码器的输入差分序列的特征。图5示出了根据本发明优选实施例一的增强层编码器输入差分序列经离散余弦变换后的变换后系数的概率密度分布函数图,图中示出了两幅对应于不同Q1值的曲线拟合效果图。可以看出,一般拉普拉斯分布概率密度函数与零均值柯西分布概率密度函数对于实际数据都有较好的拟合效果。但是考虑到一般拉普拉斯分布函数含有2个参数,均衡考虑选取柯西分布概率函数来描述增强层编码器输入差分序列经离散余弦变换后的变换后系数的分布。即变换后系数的概率密度分布函数为:
p ( x ) = 1 x &mu; &mu; 2 + x 2 , x &Element; R - - - ( 1 )
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,μ为概率密度分布函数参数,η和
Figure GSB00000252994500162
为仿射模型的模型参数,Q1为基本层编码器的量化步长,参数μ控制拟合曲线的宽度以及原点峰值的高度。
由于基本层编码器的量化步长Q1与增强层编码器的输入差分序列有关,而描述差分序列的变换后系数的分布满足上述公式(1),故可知Q1与公式(1)中唯一的参数μ有关。图6示出了根据本发明优选实施例一的用于拟合变换后系数分布的柯西分布函数的参数与基本层编码器的量化步长的关系图,该图进一步验证了参数μ和基本层编码器的量化步长Q1之间的关系,可以看出对于不同的Q1值(会产生不同的增强层编码器的输入差分序列),两者的关系满足公式(2):
Figure GSB00000252994500163
其中,η和
Figure GSB00000252994500164
为仿射模型的模型参数。
使用公式(1)和(2)描述增强层编码器的输入差分序列的特征,其输出视频的编码质量只与增强层编码器的量化步长Q2有关。由于增强层编码器使用非均匀量化,其量化步长为Q2,则增强层编码器的输出码流的失真值为:
D 2 ( Q 2 ) = &Sigma; i = - &infin; + &infin; &Integral; ( i - 1 2 ) Q 2 ( i + 1 2 ) Q 2 | x - i Q 2 | 2 p ( x ) dx - - - ( 3 )
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,Q2为增强层编码器的量化步长,i为整数。
通常,取
Figure GSB00000252994500172
作为公式(3)的无穷累加和的值的边界。将公式(1)和(2)代入公式(3)可将其简化为公式(4):
D 2 ( Q 2 ) = 2 &Sigma; i = 1 M [ &mu; Q 2 &pi; - i&mu; Q 2 &pi; ln ( &mu; 2 + ( i + 1 2 ) 2 Q 2 2 &mu; 2 + ( i - 1 2 ) 2 Q 2 2 ) - &mu; 2 - i 2 Q 2 2 &pi; tan - 1 ( &mu; Q 2 &mu; 2 + ( i 2 - 1 4 ) Q 2 2 ) ]
+ [ &mu; Q 2 &pi; - 2 &mu; 2 &pi; tan - 1 ( Q 2 2 &mu; ) ] . - - - ( 4 )
其中,M为变换后系数的采样个数,i为整数。
进一步,可将公式(4)近似表示为:
D 2 ( Q 2 ) &ap; b &CenterDot; Q 2 &beta; 2 - - - ( 5 )
其中,b是只和柯西分布参数μ相关的模型参数,而β2值在给定原始视频序列后基本保持不变。b可采用最小二乘的方法离线计算。表1示出了若干对的b和μ值,可以看出对于不同的测试序列(不同的Q1值),参数b和μ值成仿射关系。
表1
Figure GSB00000252994500181
根据公式(2)和(5)、以及b和μ间的仿射关系,可以建立具有相关性的增强层编码器的编码失真模型为:
D 2 ( Q 1 , Q 2 ) &ap; ( &zeta; Q 1 + &upsi; ) &CenterDot; Q 2 &beta; 2 - - - ( 6 )
其中,ζ、υ和β2为增强层编码器的编码失真模型参数,Q1和Q2分别为基本层编码器和增强层编码器的量化步长,D2(Q1,Q2)为增强层编码器的编码失真值。
通过分析基本层编码器的码率与增强层编码器的码率之间的函数关系,可以建立增强层编码器的码率模型,记作R2(Q1,Q2)。图7示出了根据本发明优选实施例一的基本层编码器和增强层编码器的码率关系图,图中选取了两组具有代表性的公测视频序列football(“足球”序列)和mobile(“日历小车”序列),用于描述增强层编码器的码率R2(Q1,Q2)和基本层编码器的码率R1(Q1)之间的函数关系。可以看出,两者之间的关系呈现一组几乎平行不变的直线簇,即两个层次间的码率相关性比较弱。由此可以得到增强层编码器的码率模型为:
R 2 ( Q 1 , Q 2 ) = r &CenterDot; R 1 ( Q 1 ) + ( s - r ) &CenterDot; R 1 ( Q 2 ) , Q 1 &GreaterEqual; Q 2 s &CenterDot; R 1 ( Q 2 ) , Q 1 < Q 2 - - - ( 7 )
其中,R1(Q1)为当量化步长为Q1时基本层编码器的码率,R1(Q2)为当量化步长为Q2时基本层编码器的码率,R2(Q1,Q2)为当基本层编码器的量化步长为Q1、增强层编码器的量化步长为Q2时增强层编码器的码率,s和r为增强层编码器的码率模型参数,分别表示当Q1=Q2和Q1>Q2时,增强层编码器和基本层编码器的码率呈线性关系的斜率值,如图8所示。
在图7和图8中,QP为量化参数,其与量化步长Q的关系如表2所示:
表2
  QP   0   1   2   3   4   5   6   7   8   9   10   11   12   …
  Q   0.625   0.6875   0.8125   0.875   1   1.125   1.25   1.375   1.625   1.75   2   2.25   2.5   …
  QP   …   18   …   24   …   30   …   36   …   42   …   48   …   51
  Q   5   10   20   40   80   160   224
而对于SVC基本层编码器的率失真特性,可以采用H.264/AVC中经典的指数率失真关系模型:
R1(Q1)=a·Q1 D 1 ( Q 1 ) = b &CenterDot; Q 1 &beta; 1 - - - ( 8 )
其中,Q1为基本层编码器的量化步长,R1(Q1)为基本层编码器的码率,D1(Q1)为基本层编码器的编码失真值,a和α为基本层编码器的码率模型参数,b和β1为基本层编码器的编码失真模型参数。
在计算得到各层次率失真模型后,空域可伸缩视频编码的码率优化分配问题即可以表示为:在给定目标码率Rtotal条件下,使得各编码层的失真总和最小,即:
Q * = ( Q 1 * , Q 2 * ) = arg min Q 1 , Q 2 &Element; Q [ D 1 ( Q 1 ) + D 2 ( Q 1 , Q 2 ) ] R 1 ( Q 1 ) + R 2 ( Q 1 , Q 2 ) &le; R total - - - ( 9 )
其中,
Figure GSB00000252994500202
是各相关层次选取的最优量化矢量,Q是量化步长的集合。
解决这类最优化问题,通常采用拉格朗日乘数法,将有约束的优化问题转化为无约束的优化问题进行求解,即
Q * = arg min Q k &Element; Q J ( Q , &lambda; ) J ( Q , &lambda; ) = &Sigma; k = 1 2 D k ( &CenterDot; ) + &lambda; &CenterDot; ( &Sigma; k = 1 2 R k ( &CenterDot; ) - R total ) - - - ( 10 )
其中,λ是拉格朗日乘子。
将已求得的基本层编码器和增强层编码器的码率和失真模型代入公式(10),得到拉格朗日代价函数为:
J ( Q * &lambda; ) arg min Q 1 , Q 2 &Element; Q 2 J ( Q , &lambda; ) = b &CenterDot; Q 1 &beta; 1 + ( &zeta; Q 1 + &upsi; ) &CenterDot; Q 2 &beta; 2 + &lambda; &CenterDot; [ ( 1 + r ) &CenterDot; Q 0 - &alpha; + sa &CenterDot; Q 1 - &alpha; - R total ] - - - ( 11 )
分别对Q1、Q2和λ求偏微分,联立方程组后求取Q1和Q2的最优值,由于量化步长决定了各视频层的编码失真以及码率,因而最终实现了对基本层编码器和增强层编码器的码率优化分配。
上述优选实施例一仅给出了对于两层空域可伸缩视频编码器的各视频层的码率优化分配方法,对于三层或以上的情况,通常采用递归的方式进行,如给定总码率Rtotal的条件下,对于三层的空域可伸缩视频编码器,其包括基本层编码器、增强层编码器1和增强层编码器2,可以先将基本层编码器和增强层编码器1看作一个整体:参考层编码器,先利用上述优选实施例一的方法求取参考层编码器和增强层编码器2的码率最优值,分别记为R1和R2,接下来,就可以将R1作为基本层编码器和增强层编码器1的总码率继续按照优选实施例一的方法,从而最终实现三个视频层的码率最优分配。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:因为采用由高到底的顺序对各层次编码器进行码率分配,通过对参考层编码器具有依赖关系的待编层编码器建立去相关的率失真模型,从而将码率分配问题转化为给定总码率的前提下使得各编码层编码失真总和最小的优化问题,最终求取各编码层的码率最优解,解决了现有技术无法对各层次的码率实现有效地分配,因而编码性能较差的问题,从而大幅度地提高了空域可伸缩编码的编码性能,使得编码效率最大化。本发明实现了基于H.264/SVC空域可伸缩视频编码的各层次间相关性基础上的码率优化分配方案。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种视频编码处理方法,其特征在于,包括:
在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立所述待编层编码器的编码失真模型;
通过分析所述参考层编码器的码率和所述待编层编码器的码率的关系,建立所述待编层编码器的码率模型;
根据所述待编层编码器的编码失真模型和码率模型,分配所述参考层编码器和所述待编层编码器的码率;
其中,在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立所述待编层编码器的编码失真模型具体包括:
根据所述空域可伸缩视频编码的结构,获取所述待编层编码器的输入差分序列;
对所述输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;
根据变换后系数的分布,建立所述变换后系数的概率密度分布函数与所述参考层编码器的量化步长的关系;
根据所述概率密度分布函数与所述参考层编码器的量化步长的关系,建立所述待编层编码器的编码失真模型。
2.根据权利要求1所述的视频编码处理方法,其特征在于,
所述变换后系数的分布满足零均值的柯西分布,所述变换后系数的概率密度分布函数与所述参考层编码器的量化步长的关系为:
Figure FSB00000252994400021
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,μ为概率密度分布函数参数,η和
Figure FSB00000252994400022
为仿射模型的模型参数,Q1为参考层编码器的量化步长;
所述待编层编码器的编码失真模型为:
D 2 ( Q 1 , Q 2 ) &ap; ( &zeta; Q 1 + &upsi; ) &CenterDot; Q 2 &beta; 2 ,
其中,ζ、υ和β2为待编层编码器的编码失真模型参数,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,D2(Q1,Q2)为待编层编码器的编码失真值。
3.根据权利要求2所述的视频编码处理方法,其特征在于,所述待编层编码器的码率模型为:
R 2 ( Q 1 , Q 2 ) = r &CenterDot; R 1 ( Q 1 ) + ( s - r ) &CenterDot; R 1 ( Q 2 ) , Q 1 &GreaterEqual; Q 2 s &CenterDot; R 1 ( Q 2 ) , Q 1 < Q 2 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; R 1 ( Q 2 ) = a &CenterDot; Q 2 - &alpha; ,
其中,R1(Q1)为当量化步长为Q1时参考层编码器的码率,R1(Q2)为当量化步长为Q2时参考层编码器的码率,R2(Q1,Q2)为当参考层编码器的量化步长为Q1、待编层编码器的量化步长为Q2时待编层编码器的码率,待编层编码器的码率模型参数s和r分别表示当Q1=Q2和Q1>Q2时,待编层编码器和参考层编码器的码率呈线性关系的斜率值,a和α为参考层编码器的码率模型参数。
4.根据权利要求3所述的视频编码处理方法,其特征在于,根据所述待编层编码器的编码失真模型和码率模型,分配所述参考层编码器和所述待编层编码器的码率具体包括:
根据所述待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,所述参考层编码器和所述待编层编码器的量化步长的最优值;
根据所述参考层编码器和所述待编层编码器的量化步长的最优值,分配所述参考层编码器和所述待编层编码器的码率。
5.根据权利要求4所述的视频编码处理方法,其特征在于,根据所述待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,所述参考层编码器和所述待编层编码器的量化步长的最优值具体包括:
根据所述待编层的编码失真模型和码率模型,建立给定总码率的条件下,所述参考层编码器和所述待编层编码器的编码失真总和最小的模型;
采用拉格朗日乘数法计算所述编码失真总和最小的模型中,所述参考层编码器和所述待编层编码器的量化步长的最优值。
6.根据权利要求5所述的视频编码处理方法,其特征在于,给定总码率的条件下,所述参考层编码器和所述待编层编码器的编码失真总和最小的模型为:
Q * = ( Q 1 * , Q 2 * ) = arg min Q 1 , Q 2 &Element; Q [ D 1 ( Q 1 ) + D 2 ( Q 1 , Q 2 ) ] R 1 ( Q 1 ) + R 2 ( Q 1 , Q 2 ) &le; R total D 1 ( Q 1 ) = b &CenterDot; Q 1 &beta; 1 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; ,
其中,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,
Figure FSB00000252994400042
为参考层编码器和待编层编码器的最优量化矢量,Q为量化步长的备选集合,D1(Q1)和D2(Q1,Q2)分别为参考层编码器和待编层编码器的编码失真值,R1(Q1)和R2(Q1,Q2)分别为参考层编码器和待编层编码器的码率,Rtotal为总码率,b和β1为参考层编码器的编码失真模型参数,a和α为参考层编码器的码率模型参数。
7.根据权利要求1至6任一项所述的视频编码处理方法,其特征在于,所述参考层编码器和所述待编层编码器分别为空域可伸缩视频编码的基本层编码器和增强层编码器。
8.一种视频编码处理装置,其特征在于,包括:
失真模型建立模块,用于在空域可伸缩视频编码中,根据待编层编码器的输入差分序列与参考层编码器的量化步长的关系,建立所述待编层编码器的编码失真模型;
码率模型建立模块,用于通过分析所述参考层编码器的码率和所述待编层编码器的码率的关系,建立所述待编层编码器的码率模型;
码率分配模块,用于根据所述待编层编码器的编码失真模型和码率模型,分配所述参考层编码器和所述待编层编码器的码率;
其中,所述失真模型建立模块具体包括:
获取单元,用于根据所述空域可伸缩视频编码的结构,获取所述待编层编码器的输入差分序列;
变换单元,用于对所述输入差分序列以图像帧为统计单位,分别对每一图像帧内的各宏块进行离散余弦变换;
关系建立单元,用于根据变换后系数的分布,建立所述变换后系数的概率密度分布函数与所述参考层编码器的量化步长的关系;
编码失真模型建立单元,用于根据所述概率密度分布函数与所述参考层编码器的量化步长的关系,建立所述待编层编码器的编码失真模型。
9.根据权利要求8所述的视频编码处理装置,其特征在于,
所述变换后系数的分布满足零均值的柯西分布,所述变换后系数的概率密度分布函数与所述参考层编码器的量化步长的关系为:
Figure FSB00000252994400051
其中,x为变换后系数,p(x)为变换后系数的概率密度分布函数,μ为概率密度分布函数参数,η和
Figure FSB00000252994400052
为仿射模型的模型参数,Q1为参考层编码器的量化步长;
所述待编层编码器的编码失真模型为:
D 2 ( Q 1 , Q 2 ) &ap; ( &zeta; Q 1 + &upsi; ) &CenterDot; Q 2 &beta; 2 ,
其中,ζ、υ和β2为待编层编码器的编码失真模型参数,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,D2(Q1,Q2)为待编层编码器的编码失真值。
10.根据权利要求9所述的视频编码处理装置,其特征在于,所述待编层编码器的码率模型为:
R 2 ( Q 1 , Q 2 ) = r &CenterDot; R 1 ( Q 1 ) + ( s - r ) &CenterDot; R 1 ( Q 2 ) , Q 1 &GreaterEqual; Q 2 s &CenterDot; R 1 ( Q 2 ) , Q 1 < Q 2 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; R 1 ( Q 2 ) = a &CenterDot; Q 2 - &alpha; ,
其中,R1(Q1)为当量化步长为Q1时参考层编码器的码率,R1(Q2)为当量化步长为Q2时参考层编码器的码率,R2(Q1,Q2)为当参考层编码器的量化步长为Q1、待编层编码器的量化步长为Q2时待编层编码器的码率,待编层编码器的码率模型参数s和r分别表示当Q1=Q2和Q1>Q2时,待编层编码器和参考层编码器的码率呈线性关系的斜率值,a和α为参考层编码器的码率模型参数。
11.根据权利要求10所述的视频编码处理装置,其特征在于,所述码率分配模块具体包括:
计算单元,用于根据所述待编层编码器的编码失真模型和码率模型,计算给定总码率条件下,所述参考层编码器和所述待编层编码器的量化步长的最优值;
分配单元,用于根据所述参考层编码器和所述待编层编码器的量化步长的最优值,分配所述参考层编码器和所述待编层编码器的码率。
12.根据权利要求11所述的视频编码处理装置,其特征在于,所述计算单元具体包括:
第一单元,用于根据所述待编层的编码失真模型和码率模型,建立给定总码率的条件下,所述参考层编码器和所述待编层编码器的编码失真总和最小的模型;
第二单元,用于采用拉格朗日乘数法计算所述编码失真总和最小的模型中,所述参考层编码器和所述待编层编码器的量化步长的最优值。
13.根据权利要求12所述的视频编码处理装置,其特征在于,给定总码率的条件下,所述参考层编码器和所述待编层编码器的编码失真总和最小的模型为:
Q * = ( Q 1 * , Q 2 * ) = arg min Q 1 , Q 2 &Element; Q [ D 1 ( Q 1 ) + D 2 ( Q 1 , Q 2 ) ] R 1 ( Q 1 ) + R 2 ( Q 1 , Q 2 ) &le; R total D 1 ( Q 1 ) = b &CenterDot; Q 1 &beta; 1 R 1 ( Q 1 ) = a &CenterDot; Q 1 - &alpha; ,
其中,Q1和Q2分别为参考层编码器和待编层编码器的量化步长,
Figure FSB00000252994400072
为参考层编码器和待编层编码器的最优量化矢量,Q为量化步长的备选集合,D1(Q1)和D2(Q1,Q2)分别为参考层编码器和待编层编码器的编码失真值,R1(Q1)和R2(Q1,Q2)分别为参考层编码器和待编层编码器的码率,Rtotal为总码率,b和β1为参考层编码器的编码失真模型参数,a和α为参考层编码器的码率模型参数。
14.根据权利要求8至13任一项所述的视频编码处理装置,其特征在于,所述参考层编码器和所述待编层编码器分别为空域可伸缩视频编码的基本层编码器和增强层编码器。
CN 200910080948 2009-03-30 2009-03-30 视频编码处理方法和装置 Expired - Fee Related CN101540908B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200910080948 CN101540908B (zh) 2009-03-30 2009-03-30 视频编码处理方法和装置
PCT/CN2010/000400 WO2010111890A1 (zh) 2009-03-30 2010-03-30 视频编码处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910080948 CN101540908B (zh) 2009-03-30 2009-03-30 视频编码处理方法和装置

Publications (2)

Publication Number Publication Date
CN101540908A CN101540908A (zh) 2009-09-23
CN101540908B true CN101540908B (zh) 2012-03-28

Family

ID=41123855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910080948 Expired - Fee Related CN101540908B (zh) 2009-03-30 2009-03-30 视频编码处理方法和装置

Country Status (2)

Country Link
CN (1) CN101540908B (zh)
WO (1) WO2010111890A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540908B (zh) * 2009-03-30 2012-03-28 北京大学 视频编码处理方法和装置
CN102970536B (zh) * 2012-11-15 2015-10-28 上海交通大学 一种改进的带有预测残差调整的视频编码方法
CN106612434B (zh) * 2015-10-22 2019-06-21 北京博雅华录视听技术研究院有限公司 一种基于视频复杂度的统计复用方法
CN107820088A (zh) * 2017-11-01 2018-03-20 西安万像电子科技有限公司 图像数据传输方法及装置
CN112019854B (zh) * 2019-05-28 2023-01-17 北京大学 基于深度学习神经网络的环路滤波方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1434638A (zh) * 2003-03-08 2003-08-06 华中科技大学 一种视频编码比特率控制方法
CN1471319A (zh) * 2002-07-22 2004-01-28 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
CN1738424A (zh) * 2005-05-27 2006-02-22 上海大学 基于h.264的精细颗粒可伸缩编码的码率控制方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540908B (zh) * 2009-03-30 2012-03-28 北京大学 视频编码处理方法和装置
CN101562739B (zh) * 2009-06-02 2011-07-27 北京大学 视频编码处理方法和装置
CN101562740B (zh) * 2009-06-02 2011-06-22 北京大学 视频编码处理方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471319A (zh) * 2002-07-22 2004-01-28 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
CN1434638A (zh) * 2003-03-08 2003-08-06 华中科技大学 一种视频编码比特率控制方法
CN1738424A (zh) * 2005-05-27 2006-02-22 上海大学 基于h.264的精细颗粒可伸缩编码的码率控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jiaying Liu et al..Bit Allocation for Spatial Scalability in H.264/SVC.Multimedia Signal Processing, 2008 IEEE 10th Workshop on.2008,279-282. *

Also Published As

Publication number Publication date
CN101540908A (zh) 2009-09-23
WO2010111890A1 (zh) 2010-10-07

Similar Documents

Publication Publication Date Title
US8340193B2 (en) Wyner-Ziv and wavelet video coding
CN103168468B (zh) 使用压缩抽样度量的任意分辨率视频编码的方法和设备
CN101540908B (zh) 视频编码处理方法和装置
CN102625102B (zh) 一种面向h.264/svc mgs编码的率失真模式选择方法
CN100358364C (zh) 基于h.264的精细颗粒可伸缩编码的码率控制方法
CN101018333A (zh) 空域可分级信噪比精细可分级视频编码方法
Yea et al. A wavelet-based two-stage near-lossless coder
CN101668197A (zh) 一种基于线性模型的可伸缩性视频编码中的码率控制方法
CN1969564A (zh) 用于表示一组相关图像的方法与系统
CN101977323B (zh) 基于视频时空相关性约束的分布式视频编码重构方法
CN101018334A (zh) 一种快速实现双帧参考视频流的时域可伸缩编码的方法
TW420955B (en) Image compression
CN101562739B (zh) 视频编码处理方法和装置
CN102006483B (zh) 一种视频编解码方法及装置
CN101562740B (zh) 视频编码处理方法和装置
Danyali et al. Highly scalable image compression based on SPIHT for network applications
CN102075766A (zh) 视频编码、解码方法、装置及视频编解码系统
CN102088608B (zh) 一种基于部分重建的可伸缩视频编码质量优化方法
CN101146229B (zh) 一种svc视频fgs优先级调度方法
CN1633814A (zh) 存储器带宽效率高的精细可分级(fgs)编码器
CN1741612A (zh) 一种用于视频图像编码过程中的量化方法
CN100515088C (zh) 一种基于率失真函数分析模型的svc平滑重建方法
CN102148993B (zh) 一种小波图像的编码方法和装置
Wu et al. Wavelet based distributed video coding with spatial scalability
Moccagatta et al. Wavelet-based image coding: comparison of MPEG-4 and JPEG-2000

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120328

Termination date: 20190330