CN100366077C - 基于实用函数描述的最优视频解码的方法和系统 - Google Patents
基于实用函数描述的最优视频解码的方法和系统 Download PDFInfo
- Publication number
- CN100366077C CN100366077C CNB038150654A CN03815065A CN100366077C CN 100366077 C CN100366077 C CN 100366077C CN B038150654 A CNB038150654 A CN B038150654A CN 03815065 A CN03815065 A CN 03815065A CN 100366077 C CN100366077 C CN 100366077C
- Authority
- CN
- China
- Prior art keywords
- practicality
- descriptor
- multimedia messages
- adaptive
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000006978 adaptation Effects 0.000 claims abstract description 21
- 238000005259 measurement Methods 0.000 claims abstract description 10
- 230000003044 adaptive effect Effects 0.000 claims description 62
- 238000003860 storage Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000000903 blocking effect Effects 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 33
- 238000007906 compression Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004304 visual acuity Effects 0.000 description 2
- 240000004859 Gamochaeta purpurea Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000009969 flowable effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
揭示了用于从经压缩的多媒体信息生成基于实用性的描述符的技术。较佳的方法包括:接收至少一段经压缩的多媒体信息;根据一个或多个适配操作确定基于实用性的描述符信息的两个或多个部分,每个对应于单独的目标速率;借助基于实用性的描述符信息的各部分的每一个适配经压缩的多媒体段,以生成适配的多媒体段;使用质量管理方法生成对每个适配的多媒体段的测量;和根据基于实用性的描述符信息的各部分和对应的质量测量生成基于实用性的描述符。
Description
技术领域
本发明涉及经过网络提交多媒体内容的技术,更具体地涉及由于透明地并适应地经过广泛范围的网络传输多媒体内容。
背景技术
在21世纪初期,因特网在交换所有形式的多媒体信息在商业和消费者中间得到广泛的使用,图形技术,文本,声频,视频和其它形式的信息在用户中不间断地共享。为了将带宽需求减少到可处理的等级,多媒体信息常常以标准格式的压缩的比特流的形式存储和传输。例如,在视听觉信息情况,广泛使用JPEG,Motion JPEG,MPEG-1,MPEG-2,MPEG-4,H.261,H.263。
不幸的是,虽然开发了许多不同类型的标准化多媒体内容,并在因特网上可用,当前不存在标准的方法对那样的内容控制其访问,提交,管理和保护。认识到此需要,电影图象专家组(“MPEG”)为了开发解决方案最近开始了MPEG-21多媒体架构开创工作。如在国际标准化组织(“ISO”)文档ISO/IECJTC1/SC29/WG11/NS231(2002)中进一步描述,MPEG-21的目标之一是开发用于以集成和协调的方式提交不同类型内容的技术,使得内容提交过程对广泛领域的多媒体用户是完全透明。
为了实现那样技术,MPEG-7的部分7提出称为“数字项目适配-DigitalItem Adaptation”的概念。此概念涉及组成数字项目的源和描述的适配,以达到对来自任何类型终端和网络的通过多媒体的可互操作的透明访问。通过实施数字项目适配,网络中的用户将不会感觉到网络和有关终端的问题,它们常常影响多媒体内容的提交,如网络拥堵,质量限制,和服务的可靠性,可以想象,社会各界的用户都能在他(她)们个人能接收的质量水平上共享多媒体的演示。
可能代码转换(transcoding)是最常见的资源适配的方法之一,它避免了必须对不同的网络带宽和不同的终端存储不同的压缩格式的内容。在MPEG-7,提出所谓的代码转换暗示(Transcoding Hints),以便通过在尽可能保持质量的同时减少计算的复杂性能更好地译码。
不幸的是,提出的MFEG-7译码暗示未提供有关可行的译码操作符和它们期望的性能的信息来满足规定的目标速率。它们看来不提供对满足为确保透明的适配的多媒体内容的提交所必须的多种要求有用的解决方案。因而,仍然需要一种技术,用于通过网络向具有不同可接收的质量等级的广泛范围的多媒体用户提交多种类型的多媒体内容。
发明内容
本发明的一个目标是提供一种技术,用于通过网络向具有不同可接收的质量等级的广泛范围的多媒体用户提交多种类型的多媒体内容。
本发明的另一个目标是提供多媒体内容描述技术,它对满足若干要求有用。
为满足这些目标和参考下面进一步描述变得明确的本发明的其他目标,本发明提供了用于从压缩的多媒体信息生成基于实用性的描述符的技术。较佳的方法包括下列步骤:接收至少一段压缩的多媒体信息的步骤;基于一个或多个适配操作确定基于实用性的描述符信息的二个或多个部分,每个对应于单独的目标速率;通过基于实用性的描述符信息的每个部分,适配经压缩的多媒体段,以生成适配的多媒体段;使用质量管理方法以生成对每个适配的多媒体段的质量测量;和根据基于实用性的描述符信息和相应的质量测量生成基于实用性的描述符。
在一较佳实施例中,压缩的多媒体信息是MPEG-4数据,且利用10到20个基于实用性的描述符信息的部分。基于实用性的描述符信息的诸部分可以均匀的或非均匀地采样。较有利的是,适配操作包括帧丢失,或者通过丢失第一B帧,或者丢失所有B帧,且还能包括系统丢失。
在另外实施例中,本发明提供用于向二个或多个用户提交压缩的多媒体信息的系统和方法,每个信息具有不同的目标比特率。在一种安排中,方法包括下列步骤:接收至少一段压缩的多媒体信息和相应的基于实用性的描述符;将该基于实用性的描述符分解成各部分,每个对应于对每个用户的单独的目标比特率;选择对应于对每个用户的单独的目标比特率的基于实用性的描述符部分;通过对每个用户选择的基于实用性的描述符部分,适配该经压缩的多媒体段。在适配步骤中,能利用来自用户或来自网络的目标比特率反馈信息。
加入本专利说明并组成其一部分的附图示出了本发明的较佳实施例,并用于解释本发明的原理。
附图说明
图1是示出在适配空间,实用空间,和资源空间之间的关系的功能图;
图2是接本发明的示例系统的方框图;
图3是示出通过帧丢失和系数丢失的组合定义的二维适配空间的原理图;
图4是示出按本发明的示例实用函数的图;
图5(a)-(c)是示出图4中所示的示例实用性函数的各种变化的图;
图6是按本发明的示例性基于实用性的描述工具的原理图;和
图7是按本发明的示例性基于实用性的描述符的原理图。
在这些图中,除非另作说明,相同的参照序号和字符采用同一标记示出实施例的类似特征,单元,组件或部分。此外,本发明将参考诸图结合示例性实施例进行详细描述。
具体实施方式
参考图1,将描述本发明的一示例性实施例。基于实用性的架构通过模型化下列关键参数之间的关系提供有效的视频适配的系统方法:适配操作、资源、和实用性。一般而言,适配操作采取空间域适配,时间域适配,或基于对象的适配的形式,空间域适配能包括空间分辨率缩减和质量或信噪比,如重新量化或DCT系数丢失。时间域适配包括帧丢失,而基于对象的适配能包括视频对象优先化和/或丢失。由那些适配方法的任一种确定的具体操作在这里被称为适配操作。
资源包括从终端设备和网络能力的可得到的支撑,如带宽,计算能力,容量,和显示尺寸等。实用性包括从具体适配操作导致的内容的质量。实用性能以客观方式质量,如通过确定峰值信噪比(“PSNR”),或如通过主观的质量打分以主观方式质量。图4示出适配、资源和实用性的多维空间和它们在应用到MPEG-4压缩视频时的互相关系。
适配空间110表示对一个或多个选定的适配方法的所有可能的适配操作的概念空间。适配空间的每一维度代表一类适配操作,并具有表示相关的适配操作的某个主要指数。例如,在帧丢失和系数丢失均被利用时,在适配空间中有两个维度:帧丢失和系数丢失。帧丢失的维度能通过帧丢失的量赋以指数,如不丢失、在图形的子组(“GOP”)中丢失的所有B帧(子GOP包括从I或P帧开始持续到下一I或P帧的一组顺序帧),在每个GOP中丢失的所有B和P帧.系数丢失维度能通过由系数丢失达到的速率减少的百分比来赋以指数,如无丢失,10%,20%等,能以这样方式定义适配空间中的一组离散点,每一点代表由帧丢失和系数丢失的具体组合指定的适配操作。
在某些应用中,资源限制能包括若干类型的资源。例如,为了对某些手持设备提供视频流服务,分辨力或计算能力等因素也应与带宽一起考虑。通常,所有满意的资源类型由多维资源空间表示。实用性空间能包括多维中的属性。除PSNR以外,如平均的看法尺度(“MOS”)的主观偏爱,时间上的光滑性能一起包括在其他维度中。
再参考图1,视频段101是经受适配操作的单位,每一点代表在适配空间中的特定适配操作。适配的视频段具有分别表示成资源和实用性空间中对应点的资源和实用性的最终值。在资源空间中打阴影的主方体代表由应用规定的资源约束。注意,可以存在满足同一资源需求的多个适配操作。映射到资源空间中一点的适配空间中的椭圆型区域示出那样的实用性值。适配空间中的矩形区域代表那样的恒定实用性组。
使用基于实用性的架构,视频适配能如下公式化:给定某些资源约束,确定最优适配操作,使得适配的视频的实用性最大化。因为大多数看来认为在UMA范式中的适配问题能如此公式化,那样受资源约束的实用性最大化能认为是多媒体适配的基本情况。虽然作为受资源约束听实用性最大化的例子,这里揭示的是针对优化帧丢失和系数丢失译码来满足可用的带宽,本专业技术人员理解,本发明的基于实用性的架构能容易地包括在实用性空间中的约束,并针对整个资源的最小化。
接着参考图2,将描述按本发明的系统。服务器计算机210适应于接收存储的视频211和/或其播的视频212。视频最好以压缩形式,如MPEG-1,MPEG-2或MPEG-4,虽然能提供未压缩的数字的视频给服务器,在那里进行压缩。服务器210包括以任何可用的编程语言书写的软件,用于根据接收的视频以基于实用性的描述符的形式生成实用性函数,按本发明及下面的详述,该描述符是对压缩的视频的某些修改的表征,如通过消除导致预定等级质量的双向预测(“B”)帧丢失或系数。压缩的域视频和相关的实用性函数经过如因特网或具有足够带宽来发送该压缩的视频以转移网络提交。发送的信息由网络计算机230接收,后者转而用作系统的视频适配引擎。
具体说来,网络计算机230包括也以任何可用的编程语言书写的软件,以便将输入的压缩视频适配到由相关接入网络240服务的若干客户机设备250、251、252、253的特定带宽需求。按本发明和下面的详述,网络计算机230使用由服务器210生成为基于实用性的描述符,以便将输入的压缩视频适配到那样的带宽需求。此外,网络计算机230能从客户机用户接收偏爱信息241,和/或从网络接收可用的带宽信息242,以便优化其适配操作。
接入网络240可以是因特网,内联网,或专有网络,如将移动电话用户终端253链接到网络计算机230的无线网络。在带宽有限的网络上的视频流的应用中,通过适配工具,拟提交的视频流的比特率实时地适配到随时变换的带宽。
在较佳安排中,服务器计算机210使用帧丢失和系数丢失的组合,用于将不能伸缩的视频适配到动态带宽。然而本专业技术人员理解,能使用其它译码技术来调节视频流的比特率,用于动态带宽适配,如重编码,DCT系统的重新变化,基于对象的译码,和图象尺寸的缩减。精细粒度可伸缩性(“FGS”-Fine-Granular-ScalabiLity)以及它的已作为MPEG-4中新的可伸缩的编码工具采用的某些变化形式也能通过选择合适数目的可伸缩流的比特平面,将FGS流动态适配到随时间变化的带宽。
帧丢失和系数丢失是用低的计算复杂性的速率适配的简单方法,因为它们涉及通过压缩的域处理,截断对应于拟丢失的具体帧的DCT系数的符号的比特序列部分。此外,对于在移动无线网络上视频流的应用,它们更适合于低延时实时操作,这是在译码代理中非常需要的。
此外,帧丢失和系数丢失的组合使能通过调节空间和时间质量适配视频流的速率;帧丢失通过丢失某些帧调节帧速率;系数丢失通过丢失与高频分量有关的某些DCT系数调节空间质量。由于组合了两个或多个译码方法,增加了速率减少的动态范围。
接着描述帧丢失。帧丢失是典型种类的时间译码,它通过从输入视频流丢失某些帧来调节帧速率。由于其有效性和简单性,它常在视频流应用中用于带宽变化的速率适配。要考虑的一个因素是拟丢失的帧的选择。例如,当由编码帧(“P帧”)被丢失时,与丢失的帧的有关帧被重新编码。
因此,较佳的是通过考虑输入视频流的序列结构,在图形(“GOP”)单位中只丢失没有解码依赖性的那些B帧和/或P帧。帧丢失只提供对目标速率的粗略近似,因为能去除的最小数据单位是一个完整的帧。因而,通过指定拟丢失的帧类型,而不是通过由丢失拟达到的减少速率来确定可能的帧丢失操作。
对于在锚定帧之间具有3个图象的子组(M=3)的GOP而言,能如下确定依赖于假定的GOP中丢失一个B帧;丢失所有B帧,和丢失所有B帧和P帧,这导致只有I帧的序列。对于在两个相继锚帧之间具有一个I图形的子组(M=1)的GOP,认为P帧从每个GOP末端丢失,使得最P帧丢失,最后两个P帧丢失,到在每个GOP中所有P帧丢失。
虽然拟丢失帧的帧选择是有限制的,由于比特率减少的量以及单独由于质量,此方法已十分足够,或可以结合系数丢失(下面讨论),以平衡帧丢失的希望的时间适配与系数丢失的空间适配。应当注意,丢失帧能引起帧跳动,因为丢失的帧通常被前面的帧替代。在锚定帧之间具有多于一个图形(M>1)的GOP结构的第一种情况,定义的译码操作均匀地将丢失的帧分布在时间范围内,导致更良好的时间质量。另一方面,需要专门的动态参与者,他在在(M=1)的GOP的情况对每个来自经译码的流的解码的帧调节演示时间,以减少由于不均匀地在GOP丢失帧引起的烦人的效果。
接着描述系数丢失。在执行DCT系数上频率域的操作的空间适配中存在两个基本方法。第一种是重新量化,即通过利用粗略的量化等级修改量化系数,以减少比特率。第二种是系数丢失,其中对图象质量不太重要的高频系数被截去。系数丢失是较佳的,因为它比重新量化更适合快速处理,而重新量化需要实行重编码类型的算法。
更具体说,假设在每块终点一组DCT系数全程码被消除,在截断后被保持的每块中的DCT系数码的数称为断点。对每块的断点能使用拉格朗日优化确定,它在逐帧的基础上满足所需目标速率的同时最小化由系数丢失引起的失真。在优化的速率失真公式中,能采用不需要存储器的算法,那样的算法不考虑由于移动补偿引起的累计误差,且由于每个图形的简单性将其处理成内编码图形。不顾累计误差没有很大影响质量且允许达到基本优化(在0.3dB内)的特性。
在给定的视频段和目标速率中,我们首先假设均匀丢失,它给出不同帧之间的均匀速率减少。然而在单个帧中,我们完成上述优化的非均匀丢失,它用块中不同的断点给出不同的速率减少,同时满足给定帧的目标速率。
与帧丢失不同,在那里因为能被去除的最小数据单位是一个完整的帧,能缩减的率是限于若干值,而系数丢失通过调节丢失的系数的量在速率缩减的上界之内提供十分精确地满足可用带宽的能力并提供可用的带宽,较佳地,只丢失AC DCT系数,以避免当所有系数丢失时引起的某些复杂的语法改变并确保最小的必须质量。速度减少的上界取决于输入的视频流。可以通过规定拟达到的速率减少的百分比,而不是直接规定丢失的系数本身来确定许多系数丢失操作。例如,系数丢失(10%)的表示通过系数丢失输入视频流的位速流的10%的减少。
接着描述帧丢失与系数丢失的组合。对较高的速率减少,单独的帧丢失或系数丢失不足以适配可用的带宽。而且,虽然通过使用系数丢失,连续速率适配虽可能的,通过帧丢失只有少数离散点是可达到的。因而,帧丢失和系数丢失的组合能够扩展可减少速率的动态范围。两者的组合通过优化空间和时间质量之间的权衡还能比单使用任一种技术产生更好的百分比质量,尤其对大的速率减少。例如,为了在很低的帧速率下减少帧跳动,在满足同一速率减少的同时,时间的分辨力能与空间质量权衡。
接着参考图3,示出由帧丢失和系数丢失的组合确定的二维适配空间。每点代表帧丢失/系数丢失组合的译码操作。注意,在系数丢失和帧丢失的组合中应考虑操作次序的影响。例如,有两种不同次序的操作的组合达到同一点310:20%的系数丢失接着B帧丢失,或B帧丢失接着20%系数丢失。若采用基于速率的均匀系数丢失,其中贯穿诸帧应用相同的速率减少,则两者情况的结果是相同的。然而,在各帧之间分配不同的减少速率,以根据速率分配达到整体优化的系数丢失的情况,不同的操作次序导致减少速率和质量的不同结果。虽然本专利揭示针对前者,本发明考虑两种情况。
接着描述实用性函数的生成。一般而言,图1中示出的适配空间,资源空是,和实用性空间之间的关系能根据实用性函数模型化。实用性函数能定义成将用户的满意指数表示成资源的函数的媒体质量的度量。在本发明的情况,适配空间是指定帧丢失和系数丢失的组合的二维空间,资源空间包括随时间变化的可用带宽,而实用性空间包括译码的视频流的信噪比测量。
接着参考图4,示出由应用到以1.5Mbps编码并在小于200Kbps的带宽范围上适配的,以前存储的MPEG-4压缩的视频数据“Coastguard”的,由组合的帧丢失/系数丢失译码方法生成的示例实用性函数。图4是画出的Kbits/(千比特/秒)的目标速率对PSNR的图,并示出四条曲线410,420,430,440,它们代表目标速率和PSNR质量之间的关系,每个对应在示例实用性函数中不同的适配操作。
在该例中,利用四个不同的帧丢失操作和六种系数丢失操作。帧丢失操作包括无帧丢失,每个子GOP中丢失一个B帧,丢失所有B帧,和丢失所有B帧和P帧。六个系数丢失操作设成原始测试视频流的比特率的0%,10%,20%,30%,40%和50%的减少。以此方式存在23种组合操作,它们采用确定的帧丢失和系数丢失操作的不同组合。那些23个操作示作在曲线420,430,440和450中的离散点,它们分别示出当不丢失帧420,丢失一个B帧430,丢失所有B帧440,和丢失所有B帧和P帧时对各种系数丢失操作的点的组。
图4还示出通过级联完全解码和重新编码获得的重编码曲线410,因而能看作对译码操作的性能比较的参照。重要的是应注意,对给定的目标带宽,具有满足同一目标速率的多个适配操作。选择带有最高视频实用性的最优操作。
如图4所示,实用性函数依赖于视频内容的类型,输入视频流的选择的编码参数,和应用的译码方法。共享同一内容类型和译码方法的给定视频段,生成实用性函数需要通过测试所有可能的操作对一族确定的适配操作重复计算PSNR质量和速率。
接着描述对直播视频的实用性函数生成。对预先记录的视频,如图4的情况实用性函数能在服务器中离线处理,其中计算开销是不重要的。然而由于需要大量的重复计算,此选择对直播视频通常是不可接受的解决方法。因而,可使用基于内容的实用性预测解决方法来预测在直播视频中的实用性函数。
通常,视频能映射到事先根据可计算的内容特征,如从压缩的流中提取的移动活动和空间活动,准备的各不相同的实用性分布类别。因而,对直播视频事先准备对应于预期的输入视频流的实用性函数。
形成对直播实用性函数的预测是两步的过程,首先利用适配的内容分类循环;第二步利用实时估计路径。在适配的内容分类循环中离线生成和分类复盖整个内容的类型的一组实用性函数。随后,当接收直播视频流时,实时估计路径对每个视频段选择相关的实用性函数,以便实时地保持相同的内容。
接着描述实用性函数的描述。在基于实用性的架构中,表示适配、资源、和实用性空间的分布的实用性函数与相关的视频流一起提交给如位于网络计算机230的适配引擎。该描述符的主要目的是描述三个空间(适配、资源、和实用性)的分布和它们之间的关系,以便以有效的方式支撑各种类型的使用情况。描述符应向适配引擎提供关于什么是满足受阻制的资源和有关的实用性的可能适配操作的足够信息。
为了描述如图4的实用性函数,将比特率的范围采样到有限的点组,然后使用采样的资源点作为索引描述能达到该资源及相关的PSNR值的所有可行的帧丢失一系数丢失组合操作。一般,多维资源空间上的有限点组在描述中被定义成索引。
能根据适配空间的分布的特征,通过考虑描述的有效性和采样点的数目选择资源空间的线性或非线性采样。在资源及对应的适配操作和实用性的两个相继的点之间的内播也以线性或非线性的方式进行。然而在适配的情况,应该注意,不象系数丢失的情况,在不同帧丢失操作之间内播是不可行的。
通过规定具体的适配方法,受限制的资源、和按照预期的应用的实用性,描述符能支撑大部分资源受限制的情况。
某些适配操作能不借助质量单独定义。例如,“在每帧中通过丢失DCT系数,10%地减少比特率[表示成系数丢失(10%)]”的操作不规定拟丢失的确切的系数组。不同的实现能选择不同的组,且导致稍为不同的实用性值。结果,关系到特定操作的实用性值是不可靠的。
另一方面,某些适配方法由于它们借助适配的明确的表示格式不引起含糊的结果。例如,如JPEG-2000和MPEG-4 FGS那样可伸缩的压缩格式提供明确定义的可伸缩的层次。只要解码器符合这些标准,这些层次的子集能以按照相同的产生的质量的方式截断。
为了着手解决此不明确的问题利用质量分级。在某些应用中,每个适配的媒体的实用性的绝对值是不重要的,但相反,在满足同一资源的不同适配操作中某些值的相对等级能是关键的。在那些情况,达到等级一致性的或然率高于绝对值的一致性。在此意义上,描述符描述等级而非实用性值,以便即使由于不明确该质量值不可靠,仍提供质量的概念。此外,描述符能包括表示分等级是否在各实现中一致的标志。假设在实际的实现中存在某些一致性,能获得该标志的经验值。
接着参考图5(a)-(c),示出为获得一致性标志的值根据系数丢失的不同实现导出的实用性函数的变化。图5(a)是图4的翻版;图5(b)示出应用于同样数据的同一曲线,不同的是选择宏块优化;图5(c)再次示出应用于同样数据的同一曲线,不同的是使用纯基于速率的均匀系统丢失,没有块之间的优化。
如图5(a)-(c)所示,在不同实现的实用性函数中有值得注意的实用性值的变化。能有若干操作,带有达到同一比特率的不同的质量。在除了图5(c)中由阴影框复盖的范围外比特率范围的某些部分中,那样借助质量的等速率操作的等级在不同的实现中是一致的。即使在阴影框中,根据操作存在等级的一致性。即,丢失所有B帧和丢失和系数丢失的操作不论什么实现具有最坏的实用性。根据此观察,描述符对每个操作符描述等级和可选的标志,以完全表示等级的一致性。
接着参考图6,示出示例性基于实用性的描述符。描述符提供一组适配描述符610,其中每一个通过包括资源和实用性单元和实用性函数描述与一适配方法相关的实用性函数。描述符使能按照通过规定由如组合的帧丢失和系数丢失的属性列举之一的预期情况,选择确定的适配方法。
资源620和实用性630描述符分别确定受限制的资源,和与拟借助名字和单位描述的实用性函数640相关的实用性。尤其是允许资源域或620的多个示例适应于多维资源空间。实用性函数(Utility Function)描述符640将一组可能的适配运算符和相关的实用性表示成资源点的函数。
接着参考图7,示出示例的实用性函数描述符640。实用性函数描述符640包括一组资源点710,其每一个包括一组适配操作符(Adaption Operator)720,以描述满足由资源值Resource Value)730描述的受限制的资源的采样值的所有可能的适配操作。通过选择对应的单元描述具体适配方法的特定适配操作。例如帧系数丢失(Frame Coeff Dropping)740能用于通过规定拟被丢失的帧的类型和数目,以及由于截断系数拟减少的比特率的百分比,描述帧丢失/系数丢失组合译码的特定操作。如上注意到,能使用如小波减少(WaveletReduction)750那样的其他操作,以便通过规定拟被截断的等级和比特平面的数目描述具体的小波减少的操作。适配操作符FGS770能用于通过规定FGS帧的比特平面的数目,和/或拟从增强的层次截断的FGST帧的比特平面的数目,描述FPEG-4的精细粒度可伸缩性(“FGS”)流的具体操作。
除了适配操作外,相关的实用性值由Utility Value(实用性值760描述。在规定适配操作中适配方法发生在明确的地方,例示了Utility Rank Information(实用性等级信息)761而非Utility Value,来描述与代表等级的一致性的可选的一致性Flag(标志)的属性相关的操作的等级。
上面仅示出本发明的原理。按这里的教义,对描述的实施例的各种修改和更改对于本专业的技术人员是显而易见的。因而可以理解,本专业技术人员能设计各种系统和方法,它们虽然不是这里明显示出或描述的,但体现了本发明的原则,因而在本发明的精神和范围之中。
Claims (47)
1.用于从经压缩的多媒体信息生成基于实用性的描述符的方法,所述方法包括下列步骤:
a)接收至少一段所述经压缩的多媒体信息;
b)根据一个或多个适配操作确定基于实用性的描述符信息的两个或多个部分,其每一个对应于对所述一个或多个适配操作的特定的一个或多个资源约束;
c)借助所述基于实用性的描述符信息的所述两个或多个部分的每一个适配所述被接收的经压缩的多媒体信息段,以生成两个或多个适配的多媒体段,其中每个适配的多媒体段分别与所述基于实用性的描述符信息的两个或多个部分中的不同者对应;
d)使用质量测量方法以生成对所述两个或多个适配的多媒体段的每一个的质量测量;和
e)根据所述基于实用性的描述符信息的两个或多个部分和与其对应的质量测量生成基于实用性的描述符。
2.如权利要求1的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-4数据。
3.如权利要求1的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-2数据。
4.如权利要求1的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-1数据。
5.如权利要求1的方法,其特征在于,所述资源约束包括目标速率信息。
6.如权利要求1的方法,其特征在于,所述确定步骤包括根据一个或多个适配操作确定基于实用性的描述符信息的5个到100个部分。
7.如权利要求6的方法,其特征在于,所述基于实用性的描述符信息的部分包括均匀采样的数据。
8.如权利要求6的方法,其特征在于,所述基于实用性的描述符信息的部分包括非均匀采样的数据。
9.如权利要求6的方法,其特征在于,所述确定步骤包括根据两个或多个适配操作确定基于实用性的描述符信息的10个或更多部分。
10.如权利要求1的方法,其特征在于,所述确定步骤包括根据两个或多个适配操作确定基于实用性的描述符信息的两个或多个部分。
11.如权利要求1的方法,其特征在于,所述一个或多个适配操作包括丢失帧。
12.如权利要求11的方法,其特征在于,所述帧包括所述接收的多媒体信息段的图形的每个子组中的第一B帧。
13.如权利要求11的方法,其特征在于,所述帧包括在所述接收的多媒体信息段的图形的每个组中的所有B帧。
14.如权利要求11的方法,其特征在于,所述一个或多个适配操作还包括DCT系数丢失。
15.如权利要求1的方法,其特征在于,所述一个或多个适配操作还包括MPEG-4精细粒度可伸缩性流的截断。
16.如权利要求15的方法,其特征在于,所述一个或多个适配操作还包括指定一系列拟截去的MPEG-4FSG帧的比特平面。
17.如权利要求15的方法,其特征在于,所述一个或多个适配操作还包括指定一系列拟截去的FGST帧的比特平面。
18.如权利要求15的方法,其特征在于,所述一个或多个适配操作还包括指定一系列拟截去的FSG帧和FGST帧的比特平面。
19.如权利要求1的方法,其特征在于,还包括在步骤c)之前,从两个或多个可用的测量方法中选择所述质量测量方法的步骤。
20.如权利要求1的方法,其特征在于,所述经压缩的多媒体信息包括存储的视频信息。
21.如权利要求1的方法,其特征在于,所述经压缩的多媒体信息包括直播的视频信息。
22.如权利要求1的方法,其特征在于,还包括在步骤e)之前将所述质量测量分等级的步骤。
23.如权利要求1的方法,其特征在于,所述基于实用性的描述符包括:
一个或多个适配描述符,其每一个描述与一个适配方法相关的实用性函数;和
一个或多个实用性函数描述符,其每一个代表一组适配操作符,所述适配操作符表示对于将经压缩的多媒体信息提交给一个或多个具有对应的一个或多个资源约束的用户的适配操作。
24.如权利要求23的方法,其特征在于,所述基于实用性的描述符还包括一个或多个资源描述符,其用于定义至少一个与所述一个或多个实用性函数描述符相关的对应的受约束的资源。
25.如权利要求23的方法,其特征在于,所述基于实用性的描述符还包括一个或多个实用性描述符,其用于定义至少一个对应的与所述一个或多个实用性函数描述符相关的受约束的实用性。
26.用于向一个或多个用户提交经压缩的多媒体信息的方法,每个用户具有一个或多个资源约束,所述方法包括下列步骤:
a)接收至少一段所述经压缩的多媒体信息和与其对应的基于实用性的描述符;
b)将所述基于实用性的描述符分解成两个或多个描述符信息部分,每个部分对应于不同的一个或多个资源约束;
c)对所述一个或多个用户的每一个,若所述两个或多个基于实用性的描述符信息部分中有一个对应于对所述用户的所述资源约束,则选择该基于实用性的描述符信息部分;和
d)对所述一个或多个用户的每一个,借助所选的基于实用性的描述符信息部分适配所述接收的经压缩的多媒体信息段。
27.如权利要求26的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-4数据。
28.如权利要求26的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-2数据。
29.如权利要求26的方法,其特征在于,所述经压缩的多媒体信息包括MPEG-1数据。
30.如权利要求26的方法,其特征在于,所述资源约束包括目标速率信息。
31.如权利要求26的方法,其特征在于,还包括:
对于在步骤c)中没有为其选择所述两个或多个基于实用性的描述符信息部分的其中一个的一个或多个用户中的每一个,在来自所述两个或多个基于实用性的描述符信息部分中的两个相继的基于实用性的描述符信息部分之间进行内插步骤,从而生成一内插的基于实用性的描述符,它近似地对应于对所述用户的资源约束。
32.如权利要求26的方法,其特征在于,所述分解步骤包括将所述接收的基于实用性的描述符分解成5个到100个部分,每部分对应于一个或多个资源约束的单独组。
33.如权利要求26的方法,其特征在于,各个基于实用性的描述符信息部分被均匀地采样。
34.如权利要求26的方法,其特征在于,各个基于实用性的描述符信息部分被非均匀地采样。
35.如权利要求26的方法,其特征在于,所述适配步骤包括丢失帧。
36.如权利要求35的方法,其特征在于,所述帧包括所述接收的多媒体信息段的图形的每个子组中的第一B帧。
37.如权利要求35的方法,其特征在于,所述帧包括所述接收的多媒体信息段的图形的每个组中的所有B帧。
38.如权利要求35的方法,其特征在于,所述帧包括在所述接收的多媒体信息段的图形的每个组的末端的一个P帧。
39.如权利要求26的方法,其特征在于,所述适配步骤还包括DCT系数丢失。
40.如权利要求26的方法,其特征在于,所述适配步骤还包括MPEG-4精细粒度可伸缩性流的截断。
41.如权利要求26的方法,其特征在于,所述资源约束包括目标速率信息,且还包括从所述一个或多个用户的至少一个接收用户偏爱信息的步骤,且其中所述适配步骤还包括对所述对应的用户使用所述的用户偏爱信息。
42.如权利要求26的方法,其特征在于,所述资源约束包括目标速率信息,且还包括从对应于所述一个或多个用户的至少一个的网络接收目标比特速率反馈的步骤,且其中所述适配步骤还包括对所述对应用户使用所述反馈。
43.如权利要求26的方法,其特征在于,所述适配步骤还包括为适配所述接收的经压缩的多媒体信息段使用预定的网络带宽参数。
44.如权利要求26的方法,其特征在于,所述经压缩的多媒体信息包括存储的视频信息。
45.如权利要求26的方法,其特征在于,所述经压缩的多媒体信息包括直播的视频信息。
46.用于将经压缩的多媒体信息提交给一个或多个用户终端的系统,每个用户终端具有不同的目标比特速率,其特征在于,所述系统包括:
a)一内容提交计算机,用于:
i)接收至少一段所述经压缩的多媒体信息和与其对应的基于实用性的描述符;
ii)将所述接收的基于实用性的描述符分解成两个或多个描述信息部分,每一部分对应于单独的目标比特速率;
iii)对所述一个或多个用户的每一个,若所述两个或多个基于实用性的描述符信息部分中有一个对应于对所述用户的所述单独的目标比特速率的描述信息部分,则选择该描述信息部分;
iv)对所述一个或多个用户的每一个,借助对应的被选择的基于实用性的描述符信息部分来适配所述被接收的经压缩的多媒体信息段;和
v)对所述一个或多个用户的每一个输出已适配的对应的经压缩的多媒体信息段;
b)一个连接到所述内容提交计算机并接收每个所述输出的已适配的经压缩的多媒体信息段的网络,以便发送所述输的已适配的经压缩的多媒体段到所述一个或多个用户终端;和
c)一个或多个用户终端,每个连接到所述网络并用于接收对应的已适配的经压缩的多媒体段。
47.如权利要求46的系统,其特征在于,所述内容提交计算机还用于内插,对于不能为其选择所述两个或多个基于实用性的描述符信息部分的其中一个的一个或多个用户中的每一个,在来自所述两个或多个基于实用性的描述符信息部分中的两个相继的基于实用性的描述符信息部分之间生成一内插的基于实用性的描述符。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37612902P | 2002-04-26 | 2002-04-26 | |
US60/376,129 | 2002-04-26 | ||
US60/384,939 | 2002-05-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1689324A CN1689324A (zh) | 2005-10-26 |
CN100366077C true CN100366077C (zh) | 2008-01-30 |
Family
ID=35306448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038150654A Expired - Fee Related CN100366077C (zh) | 2002-04-26 | 2003-04-25 | 基于实用函数描述的最优视频解码的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100366077C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105027572A (zh) * | 2013-03-15 | 2015-11-04 | 高通股份有限公司 | 用于通过丢弃视频帧来降低在网络上传送视频所需的比特率的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5694334A (en) * | 1994-09-08 | 1997-12-02 | Starguide Digital Networks, Inc. | Method and apparatus for electronic distribution of digital multi-media information |
CN1295689A (zh) * | 1998-01-30 | 2001-05-16 | 纽约市哥伦比亚大学托管会 | 交互通信中客户机-服务器交互方法和系统 |
US6356309B1 (en) * | 1995-08-02 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Video coding device and video transmission system using the same, quantization control method and average throughput calculation method used therein |
US6366314B1 (en) * | 1997-12-17 | 2002-04-02 | Telediffusion De France | Method and system for measuring the quality of digital television signals |
-
2003
- 2003-04-25 CN CNB038150654A patent/CN100366077C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5694334A (en) * | 1994-09-08 | 1997-12-02 | Starguide Digital Networks, Inc. | Method and apparatus for electronic distribution of digital multi-media information |
US6356309B1 (en) * | 1995-08-02 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Video coding device and video transmission system using the same, quantization control method and average throughput calculation method used therein |
US6366314B1 (en) * | 1997-12-17 | 2002-04-02 | Telediffusion De France | Method and system for measuring the quality of digital television signals |
CN1295689A (zh) * | 1998-01-30 | 2001-05-16 | 纽约市哥伦比亚大学托管会 | 交互通信中客户机-服务器交互方法和系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105027572A (zh) * | 2013-03-15 | 2015-11-04 | 高通股份有限公司 | 用于通过丢弃视频帧来降低在网络上传送视频所需的比特率的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1689324A (zh) | 2005-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4650868B2 (ja) | 圧縮ビデオのトランスコーディング方法 | |
US8218617B2 (en) | Method and system for optimal video transcoding based on utility function descriptors | |
US6490320B1 (en) | Adaptable bitstream video delivery system | |
KR100848310B1 (ko) | 스케일러블 비디오 코딩 기술이 적용된 비트스트림적응변환 장치 및 방법 | |
US6925120B2 (en) | Transcoder for scalable multi-layer constant quality video bitstreams | |
CN105847807B (zh) | 用于优化输入视频的编码的计算机系统、方法 | |
US6493386B1 (en) | Object based bitstream transcoder | |
WO2001058096A1 (en) | Method and apparatus for distributing compressed bit stream to user device over network | |
CN103975601A (zh) | 视频编码的速率-失真-复杂性优化 | |
US20080123749A1 (en) | Method of transmitting at varying bit rates through a transmission channel | |
CN103339934B (zh) | 视频编码 | |
CN1265645C (zh) | 运行一种算法的方法以及一种可伸缩编程的处理设备 | |
US20080253372A1 (en) | Scheduling packet transmission | |
US20110317066A1 (en) | Interactive System and Method for Transmitting Key Images Selected from a Video Stream Over a Low Bandwidth Network | |
CN100366077C (zh) | 基于实用函数描述的最优视频解码的方法和系统 | |
WO2005036893A2 (en) | Method and apparatus for converting the modality of multimedia contents to support the quality of service according to media resource | |
Kim et al. | An optimal framework of video adaptation and its application to rate adaptation transcoding | |
Gioia et al. | ISIS: Intelligent scalability for interoperable services | |
US7957309B1 (en) | Utilizing multiple distortion measures | |
Cha et al. | Adaptive scheme for streaming MPEG-4 contents to various devices | |
Bertagnolli et al. | Open loop transcoding using perceptually adaptive requantization of DCT coefficients | |
Cucchiara et al. | Semantic transcoding of videos by using adaptive quantization | |
Tung et al. | Encoding strategies for realizing MPEG-4 universal scalable video coding | |
Almaoui | Metadata driven multimedia transcoding | |
Alsrehin | Toward a general parametric model for assessing the impact of video transcoding on objective video quality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080130 Termination date: 20100425 |