CN100438415C - 利用压缩与解压缩技术的感知动态播放法及播放装置 - Google Patents
利用压缩与解压缩技术的感知动态播放法及播放装置 Download PDFInfo
- Publication number
- CN100438415C CN100438415C CNB021605955A CN02160595A CN100438415C CN 100438415 C CN100438415 C CN 100438415C CN B021605955 A CNB021605955 A CN B021605955A CN 02160595 A CN02160595 A CN 02160595A CN 100438415 C CN100438415 C CN 100438415C
- Authority
- CN
- China
- Prior art keywords
- delay
- packet
- playing
- data packet
- play
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000006835 compression Effects 0.000 title claims abstract description 63
- 238000007906 compression Methods 0.000 title claims abstract description 63
- 230000006837 decompression Effects 0.000 title claims abstract description 63
- 230000008447 perception Effects 0.000 title abstract description 4
- 239000002131 composite material Substances 0.000 claims description 77
- 230000001934 delay Effects 0.000 claims description 31
- 230000003111 delayed effect Effects 0.000 claims description 15
- 238000009499 grossing Methods 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000012935 Averaging Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- OWZREIFADZCYQD-NSHGMRRFSA-N deltamethrin Chemical compound CC1(C)[C@@H](C=C(Br)Br)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 OWZREIFADZCYQD-NSHGMRRFSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种将一数据包的播放延迟予以最佳化的方法,其利用压缩与解压缩技术的感知动态播放法,使用耗损综合意见评分,延迟综合意见评分,和平均综合意见评分,并参考网际网络声音协议或串流声音传输中压缩与解压缩的技术信息,为目前的数据包选择一最适当的播放延迟;一种利用压缩与解压缩技术的感知动态播放装置,其包含一播放控制器,由预估网络延迟及压缩与解压缩技术信息来决定数据包的播放延迟。
Description
技术领域
本发明涉及一种网络数据传输,尤其涉及将数据包的播放延迟最佳化的方法,其中该数据包在一网络中传输,且该网络于传送该数据包时会产生一网络延迟。
本发明还涉及一种播放装置,尤其涉及一种利用压缩与解压缩技术的感知动态播放装置。
背景技术
网际网络的普及及科技的发展使得实时声音和影像的传输成为可能。几乎网际网络的使用者都可听到串流声音或收看串流影像。最近,其它透过网际网络的通信方法已经被成熟的发展出,例如网际网络语音协议(VoIP,Voice overInternet Protocol)。使用能通行于网际网络语音协议的软件已经变成一个受欢迎而经济的方法,让使用者透过网际网络和其它的计算机网络彼此沟通。
在一串流传输模式下,例如网际网络语音协议,所实行的数据包通信中最大的障碍是网络延迟的变动,即是所谓的延迟扰动(jitter)。延迟扰动可依据一播放延迟借由数据包的延迟播放而大幅的降低。当网络延迟不固定,减少一传输的延迟扰动数量需要网络延迟的合理测量及播放延迟的正确判断。然而,播放延迟不能够太长,因为该传送的目的是要达到实时传送的效果,而过长的播放延迟则违背了此项目的。
图1是一声音资料20的资料数据包要跨越过一网络10被传送的示意图。资料20包含可听闻区段20a,20c,20e,其具有可辨别的声音信息,资料20还包含静声区段20b和20d,其具有不可辨别的声音信息。一传送器12,可为一个人计算机或其它的装置,在固定的时间间隔井然有序地传送数据包P1~P15,但是因为网络延迟会延迟数据包P1~P15的传输,其中抵达一接收器14的某些数据包一定要被不同的时间量更进一步的延迟形成一个内聚的声音资料22,其中接收器14可为一相似的个人计算机或装置。声音资料22包含可听闻区段22a,22c,22e和静声区段22b,22d,这些区段对应到要被传送的资料20中的区段20a~20e。
数据包P1在一个给定的时间被传送器12送出。数据包P1可能因为任何的理由而被网络10延迟了,图1中的阴影方块表示此延迟和其它更进一步的延迟因素。数据包P1还会进一步被接收器14延迟,使得该数据包P1可与已被网络10延迟的数据包P2连续播放。如果数据包P1没有被接收器14进一步的延迟,数据包P1和P2则无法连续播放,同时在资料22中则会出现一听闻中断。在资料22中的该听闻中断被在接收器14端的使用者所听到,导致播放资料22中不佳的声音质量。
数据包P2~P5全都是被网络10以相同的时间予以延迟,并且数据包P2~P5也不必然会被接收器14进一步的延迟,其中接收器14是依适当的时间安排按先后次序播放。然而,数据包P7比数据包P6早到达。在数据包P6被接收到前,接收器14必须延迟数据包P7的播放。该延迟被附加在资料22的静声区段22b上以使得可听闻区段22c不会被影响。由于网络延迟及数据包的拥塞,数据包P8及P9会和数据包P10及P11同时抵达。数据包P9及P11的播放也因此而延迟,然而,不会有更进一步的资料22的延迟发生。数据包P13及P14和数据包P6及P7一样遭受到类似的排序混乱。数据包P12及P15则依正常的顺序抵达接收器14。
以上参考图1的说明是简化后的流程。数据包P1~P15被假定依照其数据包长度的整数乘积给予延迟到达接收器的时间。实际上,在一既定的传送过程中,当网络延迟和延迟扰动在时间上被连续的传送以及数据包的长度为数字形式时,太多的数据包数是必须被延迟的。
图1显示出整个被接收的资料22是延迟三区段,这三个区段包含一网络延迟及被接收器14所附加的额外播放延迟。如果接收器14没有附加该额外延迟,某些数据包则会有播放失序的可能,进而造成其它数据包完全无法播放。现有技术已昭示了许多如何估计该被接收器14延迟的时间的方法。
在估计播放延迟上,一个基本且有效但又有所争议的方法就是平均延迟变异数法(MDV),此方法在R.Ramjee,J.Kurose,D.Towsley,及H.Schulzrinne所著的《在宽域网压缩音频应用软件中适用的播放机制》(“adaptive PlayoutMechanisms for Packetized Audio Applications in Wide-area Networks”)有叙述,于此提出作为本发明的背景技术。该平均延迟变异数法还进一步详述于Marco Roccetti,Vittorio Ghini,Giovanni Pau,Paola Salomoni,及Maria Elena Bonfigli所著的《适用于互联网中压缩音频的延迟/控制机制的设计及其实验评价》(“Design and Experimental Evaluation of an AdaptiveDelay/control Mechanism for Packetized Audio for use over theInternet”)中,其同样作为本发明的背景技术。简单的说,该平均延迟变异数法即是由一平均网络延迟的变异数结合一平滑系数去估计播放延迟。这种简易的动态方法较其它非动态的方法提供了重要、关键的改进。
其它估计播放延迟的方法描述于实时传输通讯协议(real-timetransport protocol)中。H.Schulzrinne,S.Casner,R.Frederick,及V.Jacobson所著的《RTP:实时传输协议》(“RTP:A Transport Protocol forReal-Time Applications”)中详尽叙述了实时传输通讯协议的标准规格,其也是本发明的背景技术。该用来估计延迟的实时传输通讯协议方法即是一固定平滑系数的平均延迟变异数法。虽然较平均延迟变异数法简单,但实时传输通讯协议只能提供较粗略的网络延迟的估计值。
其它用来估计播放延迟的现有技术包含一极长时间延迟(Spike)侦测法,该方法描述于《在宽域网压缩音频应用软件中适用的播放机制》(“Adaptive Playout Mechanisms for Packetized Audio Applicatiohs inWide-area Networks”)一文中,而另一利用相关时间差的方法描述于JesusPinto及Kenneth J.Christensen所著的《一种基于声脉冲无声周期自动调节的声音数据包的算法》(“An Algorithm for Playout of Packet Voice basedon Adaptive Adjustment of Talkspurt Silence Periods”)(htt p://citeseer.nj.nec.con/pinto99algorithm.html)中,该极长时间延迟侦测法以及该相关时间差侦测法虽然增加了运算的困难度,但并没有显著优于平均延迟变异数法。
最后,现有技术还提供一正规化最小均方法(normalized least meansquare),此法描述于Phillip DeLeon及Cormac J.Sreenan的《一种图象播放缓冲自动预测器》(“An Adaptive Predictor for Media Playoutbuffering”)(http://citeseer.nj.nec.com/deleon99adaptive.html)中。该正规化最小均方法是一复杂的计算方法,并无法提供明显的改善。
除此之外,在现有技术中,已有许多关于数字信息的播放以及播放质量的监控等的专利。举例来说,在US Patent 5,815,634中,Daum等人已提出串流同步(stream synchronization)方法,应用在MPEG的录放功能上。在US Patent 6,259,677中,Jain提出一实时接收器及相对应接收和播放实时数据包资料的方法,以上两个现有技术的专利是本发明的背景技术。另外,Schulman在US Patent 5,600,632中提出利用关于数据包延迟的同步网络分析仪在一网络中监控质量的方法,而agrawal等人也在US Patent 6,072,809中提供一同调预测法用来维持及更新网络延迟的统计趋势,以上两个现有技术的专利也作为本发明的背景技术。
以上所述的背景技术方法都具有一个共同的特性,也就是,他们只对来自网络统计的播放延迟予以最佳化。这些背景技术方法并没有适当地考虑将压缩与解压缩技术用于压缩播放资料上以避免失真的播放质量。因此存在一定的缺陷,有待加以改善。
发明内容
针对上述现有技术的缺陷,本发明的主要目的在于提供一运用压缩与解压缩技术的感知动态播放法来最佳化数据包通讯的播放延迟以解决上述的现有技术的缺陷问题。
简单的说,本发明中有关于方法发明部分是依据一耗损综合意见评分(LMOS,loss mean opinion score),一延迟综合意见评分(DMOS,delay meanopinion score),和一平均综合意见评分(MMOS,mean mean opinion score)并参考压缩与解压缩技术,来估计目前数据包的播放延迟。本发明从多个估计的播放延迟中选取具有最大平均综合意见评分的播放延迟,且依据被挑选的估计播放延迟去延迟目前的数据包。
一种将一数据包的播放延迟予以最佳化的方法,该方法包含有下列步骤:
(a)依据一压缩与解压缩技术,决定一先前数据包的耗损综合意见评分;
(b)依据该先前数据包的耗损综合意见评分,计算出一目前数据包的预估播放延迟,该预估播放延迟是依据该目前数据包的平均网络延迟变异数,一播放排列系数以及一先前数据包的平均综合意见评分所算得,即该预估播放延迟=目前数据包的平均网络延迟变异数×播放排列系数×先前数据包的耗损综合意见评分/先前数据包的平均综合意见评分;
(c)依据该预估播放延迟,去延迟该目前数据包的播放;
(d)计算该目前数据包的平均网络延迟变异数,该目前数据包的平均网络延迟变异数是依据一平滑系数,一先前数据包的平均网络延迟变异数以及一网络延迟变异数或延迟扰动所算得,即该目前数据包的平均网络延迟变异数=平滑系数×目前数据包的平均网络延迟变异数+(1一平滑系数)×网络延迟变异数或延迟扰动;
(e)决定该播放排列系数;
(f)计算该目前数据包的多个其它预估播放延迟;
(g)计算该多个预估播放延迟中个别预估播放延迟的平均综合意见评分,该平均综合意见评分是依据该压缩与解压缩延迟,该网络延迟,该预估播放延迟,以及一数据包耗损率的计算所得,该平均综合意见评分为播放质量的量测值,而一高的平均综合意见评分对应于一高的播放质量;以及
(h)在实行步骤(c)之前,先由该多个预估播放延迟中选择一具有最大平均综合意见评分的预估播放延迟。
所述的方法,其中该步骤(f)所计算出的该其它的预估播放延迟包含有:
一该先前数据包的播放延迟;
一被增大一定量的该先前数据包的播放延迟;以及
一被减少一定量的该先前数据包的播放延迟。
所述的方法,其中该数据包包含了声音或影像信息。
所述的方法,其中该数据包的播放可应用在网际网络声音协议,串流声音,或串流影像上。
本发明的播放装置部分包含透过一媒体输出装置可以播放经过最佳化延迟后的数据包资料的一播放装置,该播放装置包含一播放缓冲器,一播放控制器,一网络延迟估计器,以及一压缩与解压缩侦测器。播放缓冲器用于接收及暂存数据包。播放控制器由预估的网络延迟及压缩与解压缩技术信息来决定数据包的播放延迟,以及依据该播放延迟来控制该播放缓冲器。网络延迟估计器用来计算预估的数据包的网络延迟以及送出预估的网络延迟到该播放控制器。压缩与解压缩侦测器用来侦测压缩与解压缩技术信息至要被压缩的数据包,然后传送压缩与解压缩技术信息至该播放控制器。
一种可播放经过最佳化延迟后的数据包内的资料的播放装置,该数据包包含一资料,其中该资料在串流中被播放以及依据一压缩与解压缩技术被压缩,该网络于传送该数据包时会产生一网络延迟,该播放装置包含:
一播放缓冲器,用于接收及暂存该数据包;
一播放控制器,由预估网络延迟及压缩与解压缩技术信息来决定该数据包的播放延迟,以及依据所选定的播放延迟来控制该播放缓冲器;
一网络延迟估计器,用来计算数据包的预估网络延迟以及送出该预估网络延迟到该播放控制器;以及
一压缩与解压缩侦测器,用来侦测该压缩与解压缩技术至要被压缩的该数据包,然后传送该压缩与解压缩技术信息至该播放控制器。
所述的播放装置,其另包含:
一接收器,可让该播放缓冲器由该接收器从该网络接收该数据包;以及
一媒体输出装置,可让该播放缓冲器输出该数据包。
所述的播放装置,其中该播放控制器是参考由该压缩与解压缩侦测器所提供的一压缩与解压缩技术信息以决定该数据包的耗损综合意见评分,延迟综合意见评分,以及平均综合意见评分,且该播放控制器从多个预估播放延迟中挑选出一具有最大平均综合意见评分的播放延迟。
所述的播放装置,其中该预估播放延迟包含有:
一该先前数据包的播放延迟;
一被增大一定量的该先前数据包的播放延迟;
一被减少一定量的该先前数据包的播放延迟;以及
一播放延迟,其依据该先前数据包的耗损综合意见评分,该目前数据包的一平均网络延迟变异数,以及一播放排列系数所决定;
其中该预估播放延迟是依据该先前数据包的耗损综合意见评分,该目前数据包的一平均网络延迟变异数,以及一播放排列系数所决定,其中该播放排列系数更进一步依据该先前数据包的平均综合意见评分决定。
所述的播放装置,其中该播放控制器是参考一压缩与解压缩延迟,该网络延迟,该预估播放延迟,以及一数据包耗损率,为每一个预估的播放延迟决定该目前数据包的平均综合意见评分。
所述的播放装置,其中该媒体输出装置可为一网际网络声音协议播放器,串流声音播放器,或串流影像播放器。
本发明的优点是其播放是依据耗损综合意见评分,延迟综合意见评分,和平均综合意见评分来进行延迟。耗损综合意见评分,延迟综合意见评分,和平均综合意见评分,以压缩与解压缩技术为基础,提供播放质量的正确判断,并且选择一播放延迟以促进最佳的播放质量,在此同时,附加的播放延迟也可减到最少。
本发明的另一优点是其播放延迟是依据每个估计的播放延迟中的平均综合意见评分的一比较值,从多个估计的播放延迟中选取得出,如此一来,能获得最佳的播放质量。
附图简要说明
下面结合附图,通过对本发明的实施例的详细描述,将使本发明的技术方案和其他有益效果显而易见。
附图中,
图1是跨过一网络传送数据包内的声音资料的示意图;
图2是本发明一播放装置的方块图;
图3是本发明数据包播放的流程图。
具体实施方式
本发明的利用压缩与解压缩技术的感知动态播放法可结合一播放装置作为最佳的解释和实施。在所有的方程式及程序中的标记都完全相同。
请参考图2。图2为本发明一播放装置30的系统架构。播放装置30包含一接收器32,用来接收由网络10所传来的数据包;播放装置30还包含一播放缓冲器34,用来接收由接收器32所递交的数据包以及用来将该数据包的资料输出至一媒体输出装置36。播放缓冲器34可以吸收网络延迟以使该数据包得以非常平顺的及连续地播放于媒体输出装置36中。媒体输出装置36可为一典型的媒体输出装置,例如一网际网络语音协议播放器、一扬声器、一无线电话的显示器、或其它装置。播放装置30还包含一网络延迟估计器38,用来估计网络10的网络延迟;一压缩与解压缩侦测器40,用来侦测压缩与解压缩技术信息至要被压缩的数据包;以及一播放控制器42,用来控制播放缓冲器34。播放控制器42依据网络延迟估计器38所估计的网络延迟以及压缩与解压缩侦测器40所判定的压缩与解压缩技术信息去设定在播放缓冲器34中接收到的数据包的延迟。当一数据包的播放延迟到期,播放缓冲器34就会将该数据包寄至媒体输出装置36来播放。
网络延迟估计器38以及播放控制器42依据以下的方程式估计网络延迟以及平均网络延迟变异数:
Di=|(Ri-Ri-1)-(Si-Si-1)|
MDi=F×MDi-1+(1-F)×Di
Vi=|MDi-Di|
MVi=F×MVi-1+(1-F)×Vi
(式1)
其中,
D为网络延迟;
R为一接收器时间函数;
S为一传送器时间函数;
i为指向一目前数据包的下标;
i-1为指向一先前数据包的下标;
MD为平均网络延迟;
F为一平滑系数;
V为网络延迟变异数或延迟扰动;
MV为平均网络延迟变异数;
网络延迟估计器38以该目前数据包及该先前数据包的网络统计资料为基础先估计该目前数据包的网络延迟。然后网络延迟估计器38会传送该目前数据包所略估的网络延迟至播放控制器42。播放控制器42接下来利用平均网络延迟去计算该目前数据包的平均网络延迟变异数、平滑系数、以及网络延迟变异数。播放控制器42依据下述的程序进一步计算目前数据包的播放延迟:
EPDpre=PDi-1
EPDinc=PDi-1+Ua
EPDdec=PDi-1-Ub
(式2)
其中,
EPD是估计的播放延迟,而EPDpre是先前数据包的一播放延迟,EPDinc是被增大一定量(step size)的先前数据包的播放延迟,EPDdec是被减少一定量的先前数据包的播放延迟,而EPDsta是一依据压缩与解压缩技术信息所计算的播放延迟;
PD是一播放延迟;
Ua和Ub是定量;
SF是一播放排列系数;
LMOS是耗损综合意见评分;
MMOS是平均综合意见评分;
播放控制器42计算多个估计的播放延迟EPD,其中一个将被选择去延迟目前数据包的播放。估计的播放延迟EPDpre,EPDinc,以及EPDdec只是简单的依据先前数据包真实的播放延迟而决定,并且其大小分别为与先前的数据包相同,增加一定量,或减少一定量。另外,相似的方法可能用来决定更多估计的播放延迟以便在式2中包含任意的公式数。另一方面,EPDsta的决定要参考压缩与解压缩技术中特定的信息,包含耗损综合意见评分和平均综合意见评分。
给定对应的数据包耗损率,以及去延迟在压缩与解压缩技术中特定的耗损综合意见评分后,就能决定在压缩与解压缩技术中特定的延迟综合意见评分(DMOS)。先前数据包的平均综合意见评分是耗损综合意见评分和延迟综合意见评分的一个算术平均。一般说来,压缩与解压缩技术本身即决定了耗损综合意见评分,延迟综合意见评分,和平均综合意见评分,如同一信息对压缩与解压缩技术是特定的一样。举例来说,一些压缩与解压缩技术比其它压缩与解压缩技术对数据包耗损更为敏感。同样地,一些压缩与解压缩技术对数据包延迟特别敏感。每个压缩与解压缩技术因为机制的不同,压缩资料的方式不同,对数据包耗损或数据包延迟基本上就有不同的灵敏度。然而,耗损综合意见评分,延迟综合意见评分,及平均综合意见评分数值可以参考数据包耗损率和延迟从任何给定的压缩与解压缩技术中被粹取出。此外,平均综合意见评分是一不错的整体播放质量的客观衡量。
请参考式2,估计的播放延迟EPDsta是由播放控制器42依据先前数据包中耗损综合意见评分与平均综合意见评分的比率所计算得知。或者,其它耗损综合意见评分,延迟综合意见评分,或平均综合意见评分的比率也可被使用,只是,和耗损综合意见评分与平均综合意见评分的比率相比,其余比率无法显著的改良播放质量。质量上来看,当数据包的耗损综合意见评分是高且延迟综合意见评分较低的时候,目前数据包的估计播放延迟EPDsta是高的。换句话说,当数据包耗损是高的时候,就能确保播放延迟会增加而数据包耗损会减少。同样地,当耗损综合意见评分是低而延迟综合意见评分是高的时候,目前数据包的估计的播放延迟EPDsta是低的。换句话说,当数据包耗损是低的时候,减少播放延迟成为要达成的目标。如此一来,播放控制器42决定估计的播放延迟EPDsta去达成由平均综合意见评分所测量的播放质量的最大值。
接下来,为了决定在式2中的计算中,哪一个估计的播放延迟对目前的数据包播放是最适当的,播放控制器42必须比较每个估计播放延迟的平均综合意见评分。为了执行这一步骤,对每一个估计的播放延迟而言,播放控制器42需依下列方法计算一总延迟:
TDi,j=CD+Di+EPDi,j (式3)
其中,
TD是总延迟;
j是估计的播放延迟(EPD)的一个索引;
CD是一个压缩与解压缩延迟;
播放控制器42为目前的数据包计算多个总延迟,或为每个如式2中所决定的估计播放延迟EPDpre,EPDinc,EPDdec和EPDsta计算一个总延迟。每个总延迟包含一个压缩与解压缩延迟,由式1得出的目前数据包的网络延迟,及由式2得出的估计的播放延迟。其中压缩与解压缩延迟代表了压缩与解压缩过程中所需的时间。
播放控制器42也依据下列程序为每个估计播放延迟决定一个移动的平均数据包耗损率:
IF EPDi,j<Vi
PLCi,j=1
ELSE
PLCi,j=0 (式4)
PLRi,j=L×PLRi-1,j+(1-L)×PLCi,j
其中,
PLC是数据包耗损计数器;
PLR是数据包耗损率;
L是耗损平滑系数;
当估计的播放延迟在考虑后是少于目前数据包的网络延迟变异数的时候,数据包耗损计数器被设定成1,相反的,数据包耗损计数器会被设定成0。然后,参考先前数据包的数据包耗损率,播放控制器42为估计的播放延迟计算出数据包耗损率。
一旦播放控制器42为目前的数据包及每一个在式2中的估计的播放延迟,由式3决定了总延迟,以及由式4决定了数据包耗损率。播放控制器42就会参考压缩与解压缩技术,然后为目前的数据包决定估计播放延迟的每个平均综合意见评分。播放控制器42然后比较每个平均综合意见评分,选出具有最大值的平均综合意见评分,接着还进一步将目前数据包的播放延迟设定为估计的播放延迟,以符合具有最大值的平均综合意见评分。各项概述如下:
MMOSi,j=MMOS(TDi,j,PLRi,j)
PDi=OPT MOS(MMOSi,j,EPDi,j) (式5)
其中,
MMOS()是一函数式,其以总延迟和数据包耗损率为基础,传回一平均综合意见评分值。且此函数式依赖压缩与解压缩技术。实际上,压缩与解压缩侦测器40能够供应播放控制器42有关压缩与解压缩的技术信息以便播放控制器42能实行这一个功能;
OPT MOS()是一函数式,其能传回对应于最大平均综合意见评分的播放延迟;
PDi是目前数据包的播放延迟;
播放控制器42如此便能有效地决定哪一个估计的播放延迟能给最正确的平均综合意见评分以期对播放质量作最佳的衡量,而且播放控制器42将目前数据包的播放延迟设定为此值。
在实际的应用中,播放装置30及其组成的组件可利用传统的电子电路、集成电路、以及相关软件程序配合来完成。播放控制器42,网络延迟估计器38的逻辑程序,以及播放装置30的其它零件都可以微调并和相关的通讯设备兼容。这些相关的通讯设备包含网际网络语音协议播放器、串流影像电话、串流声音装置、以及其它应用在网际网络和无线网络上的通讯装置。
前述的利用播放装置30达成最佳化数据包的播放延迟的过程可以归纳成图3中的流程图,其包含下列步骤:
步骤100:激活媒体播放;
步骤102:接收器32不断地接收要被媒体输出装置36播放的数据包,并传送这些数据包到播放缓冲器34。播放控制器42从这些数据包中辨识出其中之一为要被播放的目前数据包,而其它的数据包会被视为先前的数据包,且已依据一排序法播放过;
步骤104:网络延迟估计器38估计网络延迟。播放控制器42进一步计算平均的网络延迟变异数。程序符合式1的实行程序;
步骤106:播放控制器42计算目前数据包N个估计的播放延迟。程序符合式2的实行程序;
步骤108:播放控制器42借由符合式3及式4的操作程序,为N个估计的播放延迟中的每一个播放延迟计算出数据包耗损率和总延迟;
步骤110:就N个估计的播放延迟中的任一个播放延迟而言,播放控制器42参考由压缩与解压缩侦测器40所提供的压缩与解压缩技术信息去决定目前数据包的耗损综合意见评分和延迟综合意见评分。当要执行这一程序去处理下一数据包的时候,要以目前数据包的耗损综合意见评分和延迟综合意见评分去计算式2中的估计播放延迟EPDsta;
步骤112:参考式5的程序,播放控制器42为N个估计播放延迟中的每一个估计播放延迟去计算目前数据包的平均综合意见评分。或者,每个平均综合意见评分可以当作是目前数据包中耗损综合意见评分和延迟综合意见评分的一个算术平均;
步骤114:播放控制器42直接比较N个平均综合意见评分以决定其中一个最适当的估计播放延迟。播放控制器42会挑选出符合最高平均综合意见评分的估计播放延迟作为目前数据包的播放延迟;
步骤116:播放控制器42会控制播放缓冲器34去等候挑选出的播放延迟,然后传送目前的数据包到媒体输出设备进行播放;
步骤118:播放控制器42和播放缓冲器34决定是否播放已完成,或者有更多的数据包等着被播放。如果播放完成,前进到步骤120。如果播放未完成,回到步骤102;
步骤120:结束。媒体播放完成。
在实际的应用上,上述的程序在具有大量媒体输出串流的数据包的情况下会连续地被执行且接近于实时播放。
请注意,通讯装置30内的组件可如同上述的步骤实行相同的程序而须与前述的播放装置相互协调。然而,依据本发明所示,上述的程序可以在上述甚至其它的组件内以不同的变化实行,并不局限于此例。
通常,许多参数,如平滑系数F,定量Ua和Ub,播放排列系数SF,以及耗损平滑系数L都可被设定来达到平均综合意见评分和相关播放质量的最大值。此外,这些参数能适用于各种不同的压缩与解压缩技术,且进一步成为使用者可调变的设计。
相较于现有技术,本发明的方法使用像耗损综合意见评分,延迟综合意见评分,和平均综合意见评分这样的数据包压缩与解压缩技术信息,连同像网络延迟和延迟扰动等网络延迟统计,为目前的数据包从多个估计播放延迟中选择最适当的一个播放延迟。依据本发明的方法,由于将附加和不必要的播放延迟减到了最低,相较于现有技术,能达到较高的播放质量。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术方案和技术构思作出其他各种相应的改变和变形,而所有的这些改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (10)
1.一种将一数据包的播放延迟予以最佳化的方法,该方法包含有下列步骤:
(a)依据一压缩与解压缩技术,决定一先前数据包的耗损综合意见评分;
(b)依据该先前数据包的耗损综合意见评分,计算出一目前数据包的预估播放延迟,该预估播放延迟是依据该目前数据包的平均网络延迟变异数,一播放排列系数以及一先前数据包的平均综合意见评分所算得,即该预估播放延迟=目前数据包的平均网络延迟变异数×播放排列系数×先前数据包的耗损综合意见评分/先前数据包的平均综合意见评分;
(c)依据该预估播放延迟,去延迟该目前数据包的播放;
(d)计算该目前数据包的平均网络延迟变异数,该目前数据包的平均网络延迟变异数是依据一平滑系数,一先前数据包的平均网络延迟变异数以及一网络延迟变异数或延迟扰动所算得,即该目前数据包的平均网络延迟变异数=平滑系数×目前数据包的平均网络延迟变异数+(1-平滑系数)×网络延迟变异数或延迟扰动;
(e)决定该播放排列系数;
(f)计算该目前数据包的多个其它预估播放延迟;
(g)计算该多个预估播放延迟中个别预估播放延迟的平均综合意见评分,该平均综合意见评分是依据该压缩与解压缩延迟,该网络延迟,该预估播放延迟,以及一数据包耗损率的计算所得,该平均综合意见评分为播放质量的量测值,而一高的平均综合意见评分对应于一高的播放质量;以及
(h)在实行步骤(c)之前,先由该多个预估播放延迟中选择一具有最大平均综合意见评分的预估播放延迟。
2.根据权利要求1所述的方法,其中该步骤(f)所计算出的该其它的预估播放延迟包含有:
一该先前数据包的播放延迟;
一被增大一定量的该先前数据包的播放延迟;以及
一被减少一定量的该先前数据包的播放延迟。
3.根据权利要求1所述的方法,其中该数据包包含了声音或影像信息。
4.根据权利要求1所述的方法,其中该数据包的播放可应用在网际网络声音协议,串流声音,或串流影像上。
5.一种可播放经过最佳化延迟后的数据包内的资料的播放装置,该数据包包含一资料,其中该资料在串流中被播放以及依据一压缩与解压缩技术被压缩,该网络于传送该数据包时会产生一网络延迟,该播放装置包含:
一播放缓冲器,用于接收及暂存该数据包;
一播放控制器,由预估网络延迟及压缩与解压缩技术信息来决定该数据包的播放延迟,以及依据所选定的播放延迟来控制该播放缓冲器;
一网络延迟估计器,用来计算数据包的预估网络延迟以及送出该预估网络延迟到该播放控制器;以及
一压缩与解压缩侦测器,用来侦测该压缩与解压缩技术至要被压缩的该数据包,然后传送该压缩与解压缩技术信息至该播放控制器。
6.根据权利要求5所述的播放装置,其另包含:
一接收器,可让该播放缓冲器由该接收器从该网络接收该数据包;以及
一媒体输出装置,可让该播放缓冲器输出该数据包。
7.根据权利要求5所述的播放装置,其中该播放控制器是参考由该压缩与解压缩侦测器所提供的一压缩与解压缩技术信息以决定该数据包的耗损综合意见评分,延迟综合意见评分,以及平均综合意见评分,且该播放控制器从多个预估播放延迟中挑选出一具有最大平均综合意见评分的播放延迟。
8.根据权利要求7所述的播放装置,其中该预估播放延迟包含有:
一该先前数据包的播放延迟;
一被增大一定量的该先前数据包的播放延迟;
一被减少一定量的该先前数据包的播放延迟;以及
一播放延迟,其依据该先前数据包的耗损综合意见评分,该目前数据包的一平均网络延迟变异数,以及一播放排列系数所决定;
其中该预估播放延迟是依据该先前数据包的耗损综合意见评分,该目前数据包的一平均网络延迟变异数,以及一播放排列系数所决定,其中该播放排列系数更进一步依据该先前数据包的平均综合意见评分决定。
9.根据权利要求5所述的播放装置,其中该播放控制器是参考一压缩与解压缩延迟,该网络延迟,该预估播放延迟,以及一数据包耗损率,为每一个预估的播放延迟决定该目前数据包的平均综合意见评分。
10.根据权利要求6所述的播放装置,其中该媒体输出装置可为一网际网络声音协议播放器,串流声音播放器,或串流影像播放器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021605955A CN100438415C (zh) | 2002-12-31 | 2002-12-31 | 利用压缩与解压缩技术的感知动态播放法及播放装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021605955A CN100438415C (zh) | 2002-12-31 | 2002-12-31 | 利用压缩与解压缩技术的感知动态播放法及播放装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1514581A CN1514581A (zh) | 2004-07-21 |
CN100438415C true CN100438415C (zh) | 2008-11-26 |
Family
ID=34237938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021605955A Expired - Fee Related CN100438415C (zh) | 2002-12-31 | 2002-12-31 | 利用压缩与解压缩技术的感知动态播放法及播放装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100438415C (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US625677A (en) * | 1899-05-23 | Henry leopold iieymann | ||
US5815634A (en) * | 1994-09-30 | 1998-09-29 | Cirrus Logic, Inc. | Stream synchronization method and apparatus for MPEG playback system |
-
2002
- 2002-12-31 CN CNB021605955A patent/CN100438415C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US625677A (en) * | 1899-05-23 | Henry leopold iieymann | ||
US5815634A (en) * | 1994-09-30 | 1998-09-29 | Cirrus Logic, Inc. | Stream synchronization method and apparatus for MPEG playback system |
Also Published As
Publication number | Publication date |
---|---|
CN1514581A (zh) | 2004-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7245608B2 (en) | Codec aware adaptive playout method and playout device | |
US20040066751A1 (en) | Duplex aware adaptive playout method and communications device | |
US7324444B1 (en) | Adaptive playout scheduling for multimedia communication | |
Liang et al. | Adaptive playout scheduling using time-scale modification in packet voice communications | |
EP1423930B1 (en) | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts | |
JP4838273B2 (ja) | メディア内同期化のための適応型メディア再生方法および装置 | |
TWI439086B (zh) | 顫動緩衝器調整技術 | |
JP4744444B2 (ja) | ストリームデータ受信再生装置、通信システムおよびストリームデータ受信再生方法 | |
US20100208605A1 (en) | Method and device for processing network time delay characteristics | |
WO2002052399A1 (en) | Method and a commmunication apparatus in a communication system | |
Liu et al. | Adaptive delay concealment for Internet voice applications with packet based time-scale modification | |
US7675946B2 (en) | System and method for managing playout time in packet communication network | |
US20070177625A1 (en) | Packet communication system, packet communication method, transmission apparatus, and storage medium having stored therein computer program | |
US7142517B2 (en) | Method for objective playout quality measurement of a packet based network transmission | |
CN100438415C (zh) | 利用压缩与解压缩技术的感知动态播放法及播放装置 | |
CN1929355B (zh) | 语音包丢失恢复系统以及方法 | |
JP2001352316A (ja) | データ伝送において発生する遅延ジッタを吸収する装置および方法 | |
Hoene et al. | Predicting the perceptual service quality using a trace of VoIP packets | |
TWI235565B (en) | Codec aware adaptive playout method and playout device | |
Qiao et al. | A new buffer algorithm for speech quality improvement in VoIP systems | |
CN1330151C (zh) | 一种测量封包型网络传输的目标播放质量的方法 | |
Jelassi et al. | Adaptive playout scheduling algorithm tailored for real-time packet-based voice conversations over wireless ad-hoc networks | |
TWI237481B (en) | Duplex aware adaptive playout method and communications device | |
TWI223508B (en) | Method for objective playout quality measurement of a packet based network transmission | |
CN1492649A (zh) | 双向感知动态播放法及通讯装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081126 Termination date: 20141231 |
|
EXPY | Termination of patent right or utility model |