CN100571396C - 用于解码复杂度限制下的视频编码方法 - Google Patents
用于解码复杂度限制下的视频编码方法 Download PDFInfo
- Publication number
- CN100571396C CN100571396C CN 200810104940 CN200810104940A CN100571396C CN 100571396 C CN100571396 C CN 100571396C CN 200810104940 CN200810104940 CN 200810104940 CN 200810104940 A CN200810104940 A CN 200810104940A CN 100571396 C CN100571396 C CN 100571396C
- Authority
- CN
- China
- Prior art keywords
- decoding
- coding
- complex degree
- video
- coding side
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004891 communication Methods 0.000 claims abstract description 9
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000013139 quantization Methods 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000003044 adaptive effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 17
- 230000008859 change Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及用于解码复杂度限制下的视频编码方法,属于多媒体通信技术领域;本方法包括:解码端和编码端建立双向通信连接;解码端解码接收到的视频流,并估计自身的解码复杂度模型C(q,r)中的模型参数集S和检测所能提供的最大解码能力Cmax,并反馈给编码端;编码端接收解码端反馈的解码复杂度模型参数集S和最大解码能力Cmax,并最优化解码复杂度目标函数,再根据该目标函数的解来实时调整编码器的QP、MSR和帧率各参数设置,并进行编码及发送视频流;本发明兼容原有的视频编码标准,编码输出的码流解码复杂度可控,能够自适应于解码能力各异的移动终端。
Description
技术领域
本发明属于多媒体通信技术领域,特别涉及用于解码复杂度限制下的实时视频编码方法。
背景技术
随着移动多媒体时代的到来,越来越多的人利用手机、个人数字助理(PDA)和笔记本电脑等终端设备接入移动通信网络,并借助终端移动性和网络覆盖性,享受无处不在的视听娱乐。与固定网络业务相比,无线业务不受地点和行为的限制,只要用户愿意,就可以在任何场所、任何时间接入到无线内容提供商,获取资讯、视频、音频等服务。这种集网络技术、终端技术和视频处理技术于一体的技术形式必将主导未来的信息业务,包括手机电视、在线点播、手机视频电话、交通监控、智能家电以及汽车电子等领域。
当前各国公司都对这一前沿领域进行了实用化、产品化的探索。但是,这些方案都只是针对视频业务的数据量大、无线带宽低、无线信道具有时变、易错等特点,采用一些诸如视频压缩标准H.264和实时传输协议(RTP)、用户数据包协议(UDP)及英特网互联协议(IP)捆绑的措施来保障视频通信的进行。该方法默认移动终端在任何时候都有充足的能力来处理视频流。这显然不够合理。众所周知,移动终端一般要求体积小、待机时间长,通常都面临着各种各样严格的资源限制,如中央处理器(CPU)能力、缓存和电池能量等等,而且某些限制还会随着时间动态地改变或者依赖于当时终端的状况。这与多媒体处理这类耗费大量计算资源的应用是相抵触的。此外,基于移动互联网络的多媒体系统存在异构性因素,即节目源在压缩方式、时间和空间分辨率以及信息速率方面都存在不同,不同终端之间的处理能力也存在明显差异。所以,将视频编解码和网络协议简单组合的方法是很难对各种终端奏效的,尤其是在解码端可用资源的限制将对视频服务的质量造成重大影响的情况下。
对于一个基于变换的运动补偿视频编码方法,如H.264、MPEG-4等,解码复杂度主要由码率、零系数比例、宏块的预测模式以及帧率等因素决定;具体包括:
(a)码流解析和熵解码的计算复杂度(由耗费的时间度量)会随接收码率的增大而增加,其中码率通常由量化参数(QP)和宏块跳过率(MSR)所决定;
(b)残差系数中零系数比例(由量化参数所决定)越低,解码器中的反量化和反离散余弦变换模块所需的计算复杂度越大;
(c)视频编码中的宏块跳过(SKIP)模式不同于其它宏块模式(16x16,16x8,8x16,8x8,8x4,4x8,4x4),其处理方式是从参考帧中拷贝相同位置的宏块或者预测运动向量所指向的宏块到当前帧,不需要其它任何操作。这样就省去了其它模式中运动补偿、反量化、反离散余弦变换等计算复杂度较大的操作,大大减小了解码端的计算负荷,同时使重构视频质量的下降也处于可接受的范围内;
(d)帧率也是一个很重要的因素,它直接决定了解码端在1秒钟内需要完成解码的帧数。帧率越大,对解码端的性能要求也越高。
目前可以查到的与本发明比较相关的专利有3个,其公开了与计算复杂度控制和调整相关的视频编码方法和装置,申请号分别为200480033477.4、200580010306.4和200610155131.2。但是这些方法均是针对视频编码器计算复杂度控制而言,而非对解码器的计算能力的自适应。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一个解码复杂度限制下的视频编码方法,其通过调整QP、MSR和编码帧率等参数,使生成的码流所需的解码复杂度在解码端的解码能力范围内,同时最大化视频的重构质量。该方法主要用于带反馈信道的实时编码场景。
本发明提出了一种用于解码复杂度限制下的视频编码方法,需要编码端和解码端进行交互,包括以下步骤:
1)解码端和编码端建立双向通信连接,解码端请求视频数据,编码端发送压缩的视频码流;
2)解码端解码接收到的视频流,并估计自身的解码复杂度模型C(q,r)中的模型参数集S,并反馈给编码端。C(q,r)(表征编码端在参数{q,r}设置下编码输出的码流被解码所需的计算复杂度)中变量q为量化参数QP,变量r为宏块跳过率MSR(MSR为被编码为SKIP模式的宏块在一帧中所占的比例);
3)解码端检测所能提供的最大解码能力Cmax,并反馈给编码端;
4)编码端接收解码端反馈的解码复杂度模型参数集S和最大解码能力Cmax,并最优化解码复杂度目标函数,再根据该目标函数的解来实时调整编码器的QP、MSR和编码帧率各参数设置,并进行编码及发送视频流;
5)每隔一定周期(1~30秒),重复步骤3)、步骤4)。
上述步骤2)中解码端估计解码复杂度模型C(q,r)中的模型参数集S,包括以下步骤:
设要估计的解码复杂度模型为C(q,r)=(β·e-αq)·(a+br),该模型的模型参数集S={α,β,a,b}中的各参数为常量加权系数,其中q∈[1,51]∩Z+,Z+表示正整数集合,r∈[0,0.5],{q,r}值域的组合构成可行域;
21)记录解码过程中每个视频帧的编码参数设置{qn,rn}和解码耗费的计算复杂度Cn;其中,字母下标n∈Z+表示解码帧号;
22)用解码复杂度模型C(q,r)对记录的样点值{qn,rn,Cn},n∈Z+进行最小均方误差拟合,获得模型参数集S并反馈给编码端;
上述步骤4)中在编码端最优化解码复杂度目标函数,并根据该目标函数的解来实时调整编码器的QP、MSR和编码帧率各参数设置,包括以下步骤:
41)最小化解码复杂度目标函数:
并使其满足约束ΔC≥0。遍历QP和MSR组成的可行域{q,r},从中找到最优参数对{q*,r*},使其满足{q*,r*}=argmin{Cmax-(β·e-αq)·(a+br)},即使码流所需的解码复杂度C(q*,r*)与Cmax的差值最小,并且Cmax-C(q*,r*)≥0;
42)根据41)目标函数的解,实时调整编码器的QP、MSR和编码帧率各参数设置:
421)如果步骤41)中的目标函数存在可行解{q*,r*},则编码端按以下步骤依次调整QP和MSR这两个参数:
(a)以最优参数q*为QP编码当前帧;
(b)将当前帧编码后的M个宏块的编码失真(由均方误差度量)从小到大排序;
422)如果步骤41)中的目标函数不存在可行解,编码端则降低编码帧率,其降低幅度范围为1~5帧/秒。
本发明的特点是:
(a)本发明设计的解码复杂度模型是通用的,对于不同的解码器仅仅需要重新估计解码复杂度模型参数;
(b)本发明的方法没有对视频码流的表征语法进行修改,其输出的码流一定能够兼容原来使用的视频编码标准,解码器无需改动;
(c)本发明简单实用性,编码端仅通过调整3个编码参数的设置,就能提供对解码能力各异的移动终端的适应性。
本发明的有益效果主要包括两个方面:
(a)对于不同解码能力终端的自适应性来说,可以通过选取最优的QP、MSR以及编码帧率参数,使编码输出码流的复杂度具有可控性,能够满足解码端解码能力的限制;
(b)对于原本不具备解码播放视频能力的低端手机(处理器主频为100~200MHz)来说,可以通过以牺牲少量的视频质量为代价获得流畅的视频播放效果。
附图说明
图1为本发明用于解码复杂度限制下视频编码的总体流程图。
图2为本发明的解码端实施例的流程图。
图3为本实施例解码复杂度模型测试。
图4为编码端工作的流程图。
具体实施方式
本发明提出了一种解码复杂度限制下的视频编码方法。现以国际视频编码标准H.264为例,并结合附图对本发明的实施例进行详细的描述。
本实施例的条件如下:
移动终端采用大显CU928型号的PDA,解码器运的硬件环境为主频400MHz的英特尔Xscale PXA 263处理器和64MB容量的随机存取存储器(RAM),软件环境为针对手持电话设备的微软移动视窗操作系统的2003版本。其中,测试序列采用1/4标准化图像格式(QCIF,176x144)的Foreman序列;解码器采用H.264标准的参考软件JM;编码器图像组(GOP)的结构为IPPP...IPPP..,I帧间隔为30,参考帧数为1,运动搜索范围是16,熵编码方式是基于上下文的自适应二进制算术编码(CABAC)。
本实施例的总体流程如图1所示,它是建立在编码端和解码端周期性地进行交互的基础之上的,包括以下步骤:
1)解码端和编码端建立双向通信连接,解码端请求视频数据,编码端发送压缩的视频码流;
2)解码端解码接收到的视频流,并估计自身的解码复杂度模型C(q,r)=(β·e-αq)·(a+br)中的模型参数集S={α,β,a,b}(模型参数对于同一个硬件和编码器实现来说是固定的,所以该步骤只在通信初期进行一次),并反馈给编码端;
3)解码端检测所能提供的最大解码能力Cmax,并反馈给编码端;
4)编码端接收解码端反馈的解码复杂度模型参数集S和最大解码能力Cmax,并最优化解码复杂度目标函数,再根据该目标函数的解来调整编码器的QP、MSR和帧率各参数设置,并进行编码及发送视频流。其中,参数QP值域为22~30,MSR值域为0.19~0.58,编码帧率为1~10帧;
5)每隔5秒的周期,重复步骤3)、步骤4)。
图2为图1中解码端的步骤2)、步骤3)和步骤5)的工作流程的进一步详细说明。在视频通信初期,解码端解码接收到的视频流,并同时估计自身的解码复杂度模型参数集S,具体包括以下步骤:
(21)解码器记录解码过程中每个视频帧的编码参数{qn,rn}和解码耗费的计算复杂度Cn,其中,字母下标n∈Z+表示解码帧号。图3显示了这些记录结果,图中包括在量化参数QP分别等于22、24、26、28、30的条件下的五组值。其中,平面的横纵坐标分别为量化参数qn和宏块跳过率rn,其对应的样点值Cn由实心圆点表示。可见,在同一量化参数下,解码复杂度为MSR的近似线性函数;在同一宏块跳过率条件下,解码复杂度函数为QP的近似指数函数。
(22)用解码复杂度模型C(q,r)=(β·e-αq)·(a+br)对图3中记录的样点值{qn,rn,Cn}进行最小均方误差拟合,获得模型参数集S={α,β,a,b}并反馈给编码端。
(23)解码端检测移动终端的最大解码能力Cmax并将其反馈回编码端;
(24)解码端每隔5秒的周期,重复(23)。
图4为图1中编码端的步骤4)和步骤5)的实施例工作流程的进一步详细说明,即编码端最优化解码复杂度目标函数,并根据该目标函数的解来实时调整编码器的QP、MSR和编码帧率各参数设置,具体包括以下步骤:
(41)编码端接收来自解码端的解码复杂度模型参数集S={α,β,a,b};
(42)编码端获取周期性更新的解码端所能提供的最大解码能力Cmax;
(43)最小化解码复杂度目标函数
并使其满足约束ΔC≥0。
遍历QP(22~30)和MSR(0.19~0.58)组成的可行域{q,r},从中找到最优参数对{q*,r*},使其满足{q*,r*}=arg min{Cmax-(β·e-αq)·(a+br)},即使码流所需的解码复杂度C(q*,r*)与解码端最大解码能力Cmax的差值最小,但却不超过Cmax;
(44)如果步骤(43)中的目标函数存在可行解{q*,r*},编码端则按以下步骤依次调整QP和MSR这两个参数:
(a)以最优参数q*为量化参数编码当前帧;
(b)将当前帧编码后的99个宏块(QCIF图像)的编码失真(由均方误差度量)从小到大排序;
(45)如果步骤(43)中的目标函数没有可行解,编码端则降低编码帧率。设fn-1=10是上一周期的帧率,fc是当前周期的帧率,Δf=3是编码帧率的减少幅度,那么当前周期的编码帧率为fc=10-3=7帧/秒。
(46)编码端每隔5秒的周期,重复步骤(42)。
尽管本发明已参照具体实施方式进行描述和举例说明,但是并不意味着本发明限于这些描述的实施方式。本发明以国际视频编码标准H.264为例进行说明,但是并不局限于此,只要定义了SKIP宏块模式的标准,如MPEG-4,均可按照本思想进行改动。本领域技术人员可在本发明思想下对本发明进行多种不同的修改,但凡依本发明权利要求书范围所做的同等的变化及修饰,均属于专利保护范畴。
Claims (3)
1.一种用于解码复杂度限制下的视频编码方法,其特征在于,编码端和解码端进行交互,包括以下步骤:
1)解码端和编码端建立双向通信连接,解码端请求视频数据,编码端发送压缩的视频码流;
2)解码端解码接收到的视频流,并估计自身的解码复杂度模型C(q,r)中的模型参数集S,并反馈给编码端;C(q,r)中变量q为量化参数QP,变量r为宏块跳过率MSR,MSR为被编码为SKIP模式的宏块在一帧中所占的比例;
3)解码端检测所能提供的最大解码能力Cmax,并反馈给编码端;
4)编码端接收解码端反馈的解码复杂度模型参数集S和最大解码能力Cmax,并最优化解码复杂度目标函数,再根据该目标函数的解来实时调整编码器的QP、MSR和帧率各参数设置,并进行编码及发送视频流;
5)每隔一定周期,重复步骤3)、步骤4)。
2.如权利要求1所述方法,其特征在于,所述步骤2)中解码端估计解码复杂度模型C(q,r)中的模型参数集S,包括以下步骤:
设要估计的解码复杂度模型为C(q,r)=(β·e-αq)·(a+br),该模型的模型参数集S={α,β,a,b}中的各参数为常量加权系数;其中,q∈[1,51]∩Z+,Z+表示正整数集合,r∈[0,0.5],{q,r}值域的组合构成可行域;
21)记录解码过程中每个视频帧的编码参数设置{qn,rn}和解码耗费的计算复杂度Cn;其中,字母下标n∈Z+表示解码帧号;
22)用解码复杂度模型C(q,r)对记录的样点值{qn,rn,Cn},n∈Z+进行最小均方误差拟合,获得模型参数集S并反馈给编码端。
3.如权利要求1所述方法,其特征在于,所述步骤4)中最优化解码复杂度目标函数,实时调整编码器的QP、MSR和编码帧率各参数设置,包括以下步骤:
41)最小化解码复杂度目标函数:
并使其满足约束ΔC≥0;遍历QP和MSR组成的可行域{q,r},从中找到最优参数对{q*,r*},使其满足{q*,r*}=argmin{Cmax-(β·e-αq)·(a+br)},即使码流所需的解码复杂度C(q*,r*)与Cmax的差值最小,并且Cmax-C(q*,r*)≥0;
42)根据41)目标函数的解,实时调整编码器的QP、MSR和编码帧率各参数设置:
421)如果步骤41)中的目标函数存在可行解{q*,r*},编码端则按以下步骤依次调整QP和MSR这两个参数:
(a)以最优参数q*为QP编码当前帧;
(b)将当前帧编码后的M个宏块的编码失真从小到大排序;
422)如果步骤41)中的目标函数不存在可行解,编码端则降低编码帧率,其降低幅度范围为1~5帧/秒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810104940 CN100571396C (zh) | 2008-04-25 | 2008-04-25 | 用于解码复杂度限制下的视频编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810104940 CN100571396C (zh) | 2008-04-25 | 2008-04-25 | 用于解码复杂度限制下的视频编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101277448A CN101277448A (zh) | 2008-10-01 |
CN100571396C true CN100571396C (zh) | 2009-12-16 |
Family
ID=39996392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810104940 Expired - Fee Related CN100571396C (zh) | 2008-04-25 | 2008-04-25 | 用于解码复杂度限制下的视频编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100571396C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102427532A (zh) * | 2011-10-24 | 2012-04-25 | 成都虢电智能电力科技有限公司 | 一种受限带宽下的多路视频自适应编码传输方法及其传输系统 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8366552B2 (en) * | 2002-12-10 | 2013-02-05 | Ol2, Inc. | System and method for multi-stream video compression |
TWI543627B (zh) * | 2010-07-05 | 2016-07-21 | 聯發科技股份有限公司 | 自適應視頻解碼方法、複雜度自適應視頻解碼器以及自適應音頻/視頻播放系統 |
CN102025994B (zh) * | 2010-12-16 | 2013-07-03 | 深圳市融创天下科技股份有限公司 | 自适应解码复杂度的编码方法、装置、编解码系统和设备 |
CN102737681B (zh) * | 2012-05-02 | 2015-02-04 | 中国联合网络通信集团有限公司 | 流媒体播放器的性能测试方法及装置 |
KR102059084B1 (ko) * | 2012-10-18 | 2019-12-24 | 브이아이디 스케일, 인크. | 모바일 멀티미디어 스트리밍에 대한 디코딩 복잡도 |
CN104253967A (zh) * | 2014-09-26 | 2014-12-31 | 厦门亿联网络技术股份有限公司 | 一种实时视频通信传输控制方法 |
CN109302637B (zh) * | 2018-11-05 | 2023-02-17 | 腾讯科技(成都)有限公司 | 图像处理方法、图像处理装置和电子设备 |
-
2008
- 2008-04-25 CN CN 200810104940 patent/CN100571396C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102427532A (zh) * | 2011-10-24 | 2012-04-25 | 成都虢电智能电力科技有限公司 | 一种受限带宽下的多路视频自适应编码传输方法及其传输系统 |
CN102427532B (zh) * | 2011-10-24 | 2013-10-09 | 成都虢电智能电力科技有限公司 | 一种受限带宽下的多路视频自适应编码传输方法及其传输系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101277448A (zh) | 2008-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100571396C (zh) | 用于解码复杂度限制下的视频编码方法 | |
CN102291561B (zh) | 在视频会议中减少对周期性关键帧的使用 | |
Chen et al. | A quality-of-content-based joint source and channel coding for human detections in a mobile surveillance cloud | |
Fan et al. | Distributed soft video broadcast (DCAST) with explicit motion | |
CN101015215A (zh) | 用于在视频编码解码器中实施快速模式决策的方法及设备 | |
Ma et al. | On delayed sequential coding of correlated sources | |
CN103327325A (zh) | 基于hevc标准的帧内预测模式快速自适应选择方法 | |
CN101909211B (zh) | 基于快速模式判决的h.264/avc高效转码器 | |
CN104539948A (zh) | 视频处理系统和视频处理方法 | |
CN102572428B (zh) | 面向多媒体传感网分布式编解码的边信息估计方法 | |
Gui et al. | Compressed pseudo-analog transmission system for remote sensing images over bandwidth-constrained wireless channels | |
CN107343202A (zh) | 基于附加码率的无反馈分布式视频编解码方法及移动终端 | |
Lan et al. | A practical hybrid digital-analog scheme for wireless video transmission | |
Liu et al. | Cost-distortion optimization and resource control in pseudo-analog visual communications | |
CN100405848C (zh) | 一种用于视频图像编码过程中的量化方法 | |
Kim et al. | An optimal framework of video adaptation and its application to rate adaptation transcoding | |
CN102223537A (zh) | 基于压缩感知的多视角分布式视频编解码系统及其方法 | |
Devaux et al. | A flexible video transmission system based on JPEG 2000 conditional replenishment with multiple references | |
WO2022269469A1 (en) | Method, apparatus and computer program product for federated learning for non independent and non identically distributed data | |
Zhao et al. | Came: cloud-assisted motion estimation for mobile video compression and transmission | |
Babu et al. | Effective compressed image transmission through context aware wireless networks | |
Yang et al. | Scalable distributed video coding for wireless video sensor networks | |
Chen et al. | A frame-level encoder rate control scheme for transform domain Wyner-Ziv video coding | |
Singh et al. | Modeling and Optimization of Video Transmission in Data Compression & Source Coding | |
Samarathunga et al. | A semantic communication and VVC based hybrid video coding system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091216 |