CN1922881A - 再现可伸缩视频流的方法及设备 - Google Patents
再现可伸缩视频流的方法及设备 Download PDFInfo
- Publication number
- CN1922881A CN1922881A CNA2004800420905A CN200480042090A CN1922881A CN 1922881 A CN1922881 A CN 1922881A CN A2004800420905 A CNA2004800420905 A CN A2004800420905A CN 200480042090 A CN200480042090 A CN 200480042090A CN 1922881 A CN1922881 A CN 1922881A
- Authority
- CN
- China
- Prior art keywords
- frame
- playback speed
- bit stream
- time
- decoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000000284 extract Substances 0.000 claims description 13
- 230000001360 synchronised effect Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000002441 reversible effect Effects 0.000 claims description 8
- 238000011084 recovery Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims 2
- 230000002123 temporal effect Effects 0.000 abstract description 9
- 230000033001 locomotion Effects 0.000 description 26
- 238000001914 filtration Methods 0.000 description 14
- 238000007906 compression Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000005056 compaction Methods 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B42—BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
- B42D—BOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
- B42D3/00—Book covers
- B42D3/04—Book covers loose
- B42D3/045—Protective cases for books
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09F—DISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
- G09F23/00—Advertising on or in specific articles, e.g. ashtrays, letter-boxes
- G09F23/10—Advertising on or in specific articles, e.g. ashtrays, letter-boxes on paper articles, e.g. booklets, newspapers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B42—BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
- B42P—INDEXING SCHEME RELATING TO BOOKS, FILING APPLIANCES OR THE LIKE
- B42P2221/00—Books or filing appliances with additional arrangements
- B42P2221/06—Books or filing appliances with additional arrangements with information carrying means, e.g. advertisement
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B42—BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
- B42P—INDEXING SCHEME RELATING TO BOOKS, FILING APPLIANCES OR THE LIKE
- B42P2241/00—Parts, details or accessories for books or filing appliances
- B42P2241/20—Protecting; Reinforcing; Preventing deformations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种用于再现可伸缩视频流的方法及设备。在该方法和设备中,利用具有时间可伸缩性的视频流对时间层灵活的特性,快速搜索由视频流服务提供的多媒体数据。该设备包括:重放速度设置单元,当为位流选择了重放速度时,设置重放速度;控制单元,确定对应于由重放速度设置单元设置的重放速度的时间层,并根据确定的时间层从位流中提取待解码的帧;和定时同步单元,利用定时信号,以原始视频信号的帧速率来同步被解码的帧。
Description
技术领域
本发明涉及再现可伸缩视频流的方法及设备,更具体地,涉及视频再现方法及设备,其中,具有由可伸缩视频编码引起的时间可伸缩性的视频流能够被快速搜索。
背景技术
随着包括互联网的信息通信技术的发展,视频通信以及文本和声音通信都已急剧增长。
传统的文本通信不能满足用户的各种需求,因此,能提供各种类型的信息,如文本、图片以及音乐的多媒体服务已经增长。
因为多媒体数据的数量相对于其他类型的数据通常较大,所以多媒体数据需要大容量的存储介质和宽的带宽来传输。因此,用于传输包括文本、视频和音频的多媒体数据的压缩编码方法是必需的。例如,具有分辨率640×480的24位真彩色图像,需要640×480×24比特的容量,也就是每帧大约7.37兆比特的数据。
当以30帧每秒的速度传输像这样的图像时,需要221兆比特每秒的带宽。当存储基于这种图像的90分钟电影时,需要大约1200吉比特(Gbits)的存储空间。
因此,用于传输包括文本、视频和音频的多媒体数据的压缩编码方法是必需的。
在这种压缩编码方法中,数据压缩的基本原理在于消除数据冗余。
数据冗余一般被定义为:(1)空间冗余,其中,在图像中重复同样的颜色或对象;(2)时间冗余,其中,运动图像中相邻帧之间的变化很小,或在音频中重复同样的声音;或(3)心理视觉冗余,考虑到人类视力和感觉对高频迟钝。
通过消除这样的数据冗余,能够压缩数据。数据压缩主要可分为:有损/无损压缩,根据源数据是否损失;帧内/帧间压缩,根据单个帧是否被独立压缩;以及,对称/不对称压缩,根据压缩所需时间是否和恢复所需时间一样。
此外,数据压缩被定义为:实时压缩,当压缩/恢复时间延迟不超过50毫秒时;以及可伸缩压缩,当各个帧具有不同的分辨率时。
如示例,对于文本或医学数据,通常采用无损压缩。对于多媒体数据,通常采用有损压缩。
同时,帧内压缩通常用于消除空间冗余,而帧间压缩通常用于消除时间冗余。
取决于传输介质,传输性能有所不同。
目前利用的传输介质具有不同的传输速率。例如,超高速通信网络能够传输数十兆比特每秒的数据,而移动通信网络具有384千比特每秒的传输速率。
在相关技术视频编码方法,如运动图像专家组(MPEG)-1、MPEG-2、H.263以及H.264中,由基于运动估计及补偿的运动补偿消除时间冗余,由变换编码消除空间冗余。
这些方法具有令人满意的压缩率,但它们不具有真实可伸缩位流的灵活性(flexibility),因为它们在主算法中利用自反(reflexive)方法。
因此,为了支持传输介质具有不同的速度,或为了以适合传输环境的数据速率来传输多媒体,具有可伸缩性的数据编码方法、如小波视频编码和子带视频编码,可以适合于多媒体环境。可伸缩性表示部分解码单一压缩位流的能力,即,执行不同类型的视频再现的能力。
可伸缩性包括:空间可伸缩性,表示视频分辨率;信噪比(SNR)可伸缩性,表示视频质量水平;时间可伸缩性,表示帧速率;以及其结合。
在许多用于基于小波的可伸缩视频编码的技术中,由Ohm(欧姆)引入并由Choi(查依)和Wood(伍得)发展的运动补偿时间滤波(MCTF)是一种基本技术,用于消除时间冗余,并用于具有灵活的时间可伸缩性的视频编码。在MCTF中,对画面组(GOP)执行编码,并且,在运动方向上时间滤波一对当前帧与参考帧,下面参考图1进行说明。
图1示意性地示出在利用MCTF的可伸缩视频编码及解码期间的时间分解。
在图1中,L帧是低频帧,对应于帧平均值,而H帧是高频帧,对应于帧间差异值。
如图1所示,在编码过程中,在低时间层(temporal level)上的帧对(pair)被时间滤波,然后被分解为高时间层上的L帧与H帧对,并且,该L帧对被再次时间滤波并被分解为更高时间层上的帧。编码器对最高时间层上的一个L帧、以及H帧执行小波变换,并生成位流。附图中由阴影表示的帧是经受小波变换的帧。
更具体地,编码器从低时间层到高时间层对帧编码。
同时,解码器对由阴影表示的、由逆小波变换获得的帧,从高层到低层执行编码器的逆操作,以便重构。
即,在时间层3上的L帧和H帧,被用来重构时间层2上的两个L帧,并且,这两个L帧和时间层2上的两个H帧,被用来重构时间层1上的四个L帧。
最后,这四个L帧和时间层1上的四个H帧,被用来重构八个帧。
这种基于MCTF的视频编码具有提高灵活的时间可伸缩性的优点,但是具有如单向运动估计和低时间速率下性能差的缺点。
许多方法已经被研究并发展来克服这些缺点。其中一个是由Turaga和Mihaela提出的无约束MCTF(UMCTF),下面参考图2进行说明。
图2示意性地示出在利用UMCTF的可伸缩视频编码及解码期间的时间分解。
UMCTF允许利用多个参考帧和双向滤波,从而提供更一般的框架。
此外,在UMCTF方案中,通过适当地插入未滤波的帧,即A帧,非二叉(nondichotomous)时间滤波是可行的。
UMCTF利用A帧来取代已滤波的L帧,从而显著地提高低时间层上的画面的质量。
如上所述,因为MCTF和UMCTF都为视频编码提供了灵活的时间可伸缩性,解码器能够完全解码某些帧,而不用根据时间层解码所有帧。
换言之,当在解码期间根据视频流应用的性能控制时间层时,能可靠地提供视频流服务。
发明内容
流服务的用户通常希望自由地利用各种多媒体。然而,相关技术视频流服务仅仅将已编码多媒体数据的画面质量调整到用户环境,并不满足用户自由地调整多媒体数据重放速度的愿望。
此外,在利用对时间层灵活的时间可伸缩性的MCTF和UMCTF方案的领域中,对于改变重放速度的方法,没有已知的、充分的研究。因此,想要一种改变支持时间可伸缩性的视频解码中的重放速度的方法。
本发明提供一种方法及设备,用于快速搜索由视频流服务利用具有时间可伸缩性的视频流对时间层灵活的特性而提供的多媒体数据。
根据本发明的一个方面,提供一种再现可伸缩视频流的方法,包括:确定对应于为位流请求的重放速度的时间层;根据确定的时间层,从位流中的所有帧提取待解码的帧;以及,解码已提取的帧。
此外,控制单元生成定时信号,用于以原始视频信号的帧速率同步被解码的帧,以允许定时同步单元设置定时信号,使得能够执行快速视频搜索。
在本发明中,由于可伸缩视频编码,位流具有时间可伸缩性,并且,重放速度是为移动视频的快速搜索而显示位流中帧的图像的速度。
同时,重放速度具有方向性。在示例实施例中,重放速度是根据重放方向的倒退重放速度与前进重放速度中的一种。
附图说明
通过参考附图对示例实施例进行详细描述,本发明的上述及其他特点和优点将变得更加清楚,附图中:
图1示意性地示出在利用运动补偿时间滤波(MCTF)的可伸缩视频编码和解码期间的时间分解;
图2示意性地示出在利用无约束运动补偿时间滤波(UMCTF)的可伸缩视频编码和解码期间的时间分解;
图3为根据本发明实施例的编码器的示意框图;
图4示出程序示例,在其中,图3示出的空间变换单元利用小波变换将输入图像或帧分解为子带(sub-band);
图5为根据本发明实施例的解码器的示意框图;
图6为根据本发明实施例,利用图5所示解码器的视频流再现设备的示意框图;
图7为根据本发明实施例再现视频流的方法的示意流程图;
图8示出根据本发明的另一实施例的编码和解码程序,以解释再现视频流的方法;以及
图9到11示出在本发明的实施例中,利用MCTF再现视频流的程序。
具体实施方式
以下,在对用于根据本发明再现可伸缩视频流的设备的结构和操作的说明中,首先说明执行支持时间可伸缩性的视频编码的可伸缩视频编码器,然后,接着说明解码从编码器接收的位流的解码器,以及根据本发明实施例的时间层、用于再现可伸缩视频流的设备,其控制解码器对从编码器接收的位流的仅仅一部分解码。
此外,以下,在本发明的实施例中,利用基于运动补偿时间滤波器(MCTF)或基于无约束MCTF(UMCTF)的、支持时间可伸缩性的视频编码方法,实现再现可伸缩视频流的方法。当然,本文的实施例应当被视作只是本发明的示例实施例。本领域技术人员将理解,通过根据由用户请求的重放速度控制时间层、并对利用除基于MCTF和基于UMCTF的视频编码方法以外的其他支持时间可伸缩性的视频编码方法来编码的可伸缩视频流的一部分解码,可以进行各种改变,以实现改变重放速度的模块,以及,可以想象在本发明精神内的其他等价实施例。
另外,在本发明的实施例中,利用生成和设置定时信号的定时控制方法,改变重放速度,以便以原始视频信号的帧速率同步每个已解码帧。然而,本领域技术人员将理解,利用除定时控制方法以外的其他控制每个已解码帧的时钟时间的方法等,可以进行各种改变,来实现以由用户请求的重放速度再现已解码帧的模块,以及可以想象在本发明精神内的其他等价实施例。
图3为根据本发明实施例的编码器100的示意框图。
编码器100包括划分单元101、运动估计单元102、时间变换单元103、空间变换单元104、嵌入量化单元105以及熵编码单元106。
划分单元101将输入视频分割为基本编码单元,即画面组(GOP)。
运动估计单元102关于每个GOP中包括的帧,执行运动估计,从而获得运动矢量。
分级方法,如分级可变尺寸块匹配(HVSBM,Hierarchical Variable SizeBlock Matching),可以被用来实现运动估计。
时间变换单元103利用由运动估计单元102获得的运动矢量,在时间方向上将帧分解为低频和高频帧,从而减少时间冗余。
例如,帧的平均值可以被定义为低频成分,而两帧之间的半差值可以被定义为高频成分。以GOP为单元分解帧。通过对比两帧中同一位置的像素而不利用运动矢量,可以将帧分解为高频和低频帧。然而,未利用运动矢量的方法,相比于利用运动矢量的方法,在减少时间冗余方面效率更低。
换言之,当第一帧的一部分被移进第二帧时,许多运动能够由运动矢量表示。将第一帧的该部分,与由运动矢量将在与第一帧该部分相同位置上的第二帧的一部分移动到的部分相比较,即,时间运动被补偿。此后,第一帧和第二帧被分解为低频及高频帧。
例如,运动补偿时间滤波(MCTF)或无约束运动补偿时间滤波(UMCTF),可以被用于时间滤波。
在目前已知的小波变换技术中,帧被分解为低频和高频子带,并且获得各自帧的小波系数。
图4示出程序示例,其中,图3示出的空间变换单元104利用小波变换将输入图像或帧分解为子带。
例如,假定在两层中执行输入图像或帧的小波变换,分别在水平、垂直和对角方向有三种类型的高频子带。
低频子带,即在水平和垂直方向都具有低频的子带,被表达为‘LL’。
三种类型的高频子带,亦即,水平高频子带、垂直高频子带和水平及垂直高频子带,被分别表达为‘LH’、‘HL’和‘HH’。
低频子带被再次分解。与子带的表达式相关联的括号内的数字指示小波变换层。
图5为根据本发明实施例的解码器300的示意框图。
通常以与编码器100相反的顺序执行解码器300的操作。
解码器300包括熵解码单元301、逆嵌入量化单元302、逆空间变换单元303以及逆时间变换单元304。
解码器300以与编码器100基本相反的方向进行操作。
然而,虽然由编码器100的运动估计器102已经执行运动估计,以便确定运动矢量,但是没有由解码器300执行逆运动估计处理,因为解码器仅仅接收运动矢量102来利用。
熵解码单元301为每个小波块分解已接收的位流。
逆嵌入量化单元302执行编码器100中的嵌入量化单元105的逆操作。
换言之,从每个已分解位流来确定为每个小波块重排的小波系数。
然后,逆空间变换单元303变换已重排的小波系数,以便在空间域重构图像。
在这种情形中,逆小波变换被应用来将对应于每个GOP的小波系数变换到时间滤波的帧。
最后,逆时间变换单元304利用由编码器100生成的帧和运动矢量,来执行逆时间滤波,并创建最终输出视频。
如上面在编码器100中所述,本发明能够被应用于移动视频和静止图像。类似于移动视频,可以将从编码器100接收的位流通过熵解码单元301、逆嵌入量化单元302、逆空间变换单元303及逆时间变换单元304传递,并变换为输出图像。
图6为根据本发明的实施例,利用图5示出的解码器300的视频流再现设备500的示意框图。
如图6所示,视频流再现设备500包括重放速度设置单元501、控制单元502、定时同步单元503以及存储单元504。
当通过例如预定用户接口来请求快速视频搜索时,重放速度设置单元501为从编码器100接收的位流设置重放速度。
控制单元502确定对应于由重放速度设置单元501设置的重放速度的时间层,并利用已确定的时间层作为提取条件,从接收的位流提取某些帧,用于在解码器300中部分解码。
此外,控制单元502生成定时信号,以便以原始视频信号、亦即从编码器100接收的位流的帧速率来同步已提取的帧,从而能够以设置的重放速度来执行快速视频搜索。
重放速度是位流中的帧的图像被显示的速度,并且在用于快速视频搜索的本发明的实施例中,可以被改变为2×、4×和8×。
此外,重放速度可以被应用于倒退重放和前进重放两者。
以下,在本发明的实施例中,当根据视频编码的时间可伸缩性存在三个时间层时,重放速度8×、4×和2×被分别设置到时间层3、2和1。
定时同步单元503设置从控制单元502接收的定时信号,用于来自解码器300的输出视频的每一帧。
结果,以从编码器100接收的原始视频信号的帧速率来同步每一帧,因此,以原始视频信号的帧速率来提供快速视频。
同时,由控制单元502控制存储单元504,来存储从编码器100接收的位流。
举例来说,参考图1和2,当请求视频的2×前进重放时,控制单元502选择对应于2×重放速度的时间层1。
接着,控制单元502从根据已选时间层1的视频的位流提取四个帧(例如,单个L帧和3个H帧),用于在解码器500中进行部分解码,并确定该四个帧为待解码。
之后,控制单元502将该四个帧输入到解码器300来解码。
当该四个帧被解码时,生成4个L帧。控制单元502生成定时信息,以便以从编码器100接收的位流的帧速率来同步已解码的L帧。
然后,定时同步单元503以根据来自控制单元502的定时信号的原始信号来同步该4个已解码L帧。结果,再现该4个L帧组成的视频。
通过上述操作,根据对应于所请求重放速度的时间层、从接收自编码器100的位流提取的4个L帧被解码,并以原始视频信号的帧速率再现,因此,快速视频搜索被以2×速度执行。
在本发明的实施例中,视频流再现设备500对每个画面组(GOP)执行这些操作。
在本发明的另一实施例中,图3示出的编码器100可以在利用时间变换单元103执行时间变换之前,利用空间变换单元104执行空间变换。
在这种情形中,图5示出的解码器300也根据编码顺序改变解码顺序,从而在执行逆空间变换之前执行逆时间变换。
在编码器100、解码器300以及视频流再现设备500中,所有模块可以以硬件来实现,或者,一些或全部模块可以以软件来实现。
因此,明显的是,编码器100、解码器300以及视频流再现设备500可以以硬件或软件来实现,并且,可以根据硬件和/或软件配置来进行变化或修改,而不脱离本发明的精神。
在图6示出的实施例中,视频流再现设备500被附加到解码器300。然而,本发明不被限制于此。例如,视频流再现设备500可以被包括在编码器100中、或在远程地点提供视频流服务的独立服务器中。
现在参考附图来详细说明根据本发明实施例的、利用编码器100、解码器300和视频流再现设备500来再现视频流的方法。
图7是根据本发明实施例再现视频流的方法的示意流程图。
如图7所示,当用户请求快速搜索时,在操作S1中,重放速度设置单元501对从编码器100接收的位流设置重放速度。
然后,在操作S2中,控制单元502确定对应于重放速度的时间层。
接着,在操作S3中,控制单元502利用时间层作为提取条件,从接收自编码器100的位流中提取待解码的帧。
在操作S4中,控制单元502将已提取的帧输入到解码器300,以便解码该帧。
在操作S5中,根据由控制单元502生成的定时信号,定时同步单元503以原始视频信号、即从编码器100接收的位流的帧速率来同步已解码帧。
然后,在操作S6中,根据同步定时信息来恢复帧,并以由用户请求的重放速度来再现。
在本发明的上述实施例中,用于再现可伸缩视频流的设备和方法使用基于MCTF和UMCTF的视频编码方法。然而,本发明还能被用于由除基于MCTF和UMCTF的视频编码方法以外的其他支持时间可伸缩性的各种视频编码方法所生成的视频流。
举例来说,为保持时间可伸缩性并控制延迟时间,可以利用连续时间近似及参考(STAR)算法来执行编码和解码,通过该算法,以时间层的限定顺序来执行时间变换,将在下面说明。
在STAR算法的基本概念中,每个时间层上的所有帧被表示为节点,并且由箭头来表达参考关系。只有必要的帧能被放置在每个时间层。例如,GOP的帧中只有一个帧能被放置在最高时间层。在本发明的实施例中,帧F(0)具有最高的时间层。在随后更低的时间层上,时间分析被连续地执行,并且,从具有已编码帧索引的原始帧来预测具有高频成分的误差(error)帧。当GOP的大小为8时,将帧F(0)编码进最高时间层的I帧。在随后更低的时间层上,利用帧F(0),将帧F(4)编码进帧间(interframe)、即H帧。接着,利用帧F(0)和帧F(4),将帧F(2)和F(6)编码进帧间。最后,利用帧F(0)、F(2)、F(4)和F(6),将帧F(1)、F(3)、F(5)和F(7)编码进帧间。
在解码顺序中,帧F(0)最开始被解码。接着,参考帧F(0),对帧F(4)解码。类似地,参考帧F(0)和F(4),对帧F(2)和F(6)解码。最后,参考帧F(0)、F(2)、F(4)和F(6),对帧F(1)、F(3)、F(5)和F(7)解码。
图8示出利用STAR算法的编码和解码程序。
参考图8,根据关于帧F(k)能根据STAR算法来参考的参考帧的集合Rk的方程式,能够推断,帧F(k)能参考多个帧。
由于这种特性,STAR算法允许利用多个参考帧。
在本发明的实施例中,说明了当GOP大小为8时、帧之间的可能的关系。
从一个帧开始、并返回到该帧的箭头表示帧内模式(intra mode)下的预测。
所有具有已编码帧索引的原始帧,包括在同一时间层的H帧位置的帧,能被用作参考帧。
然而,在相关领域技术中,在H帧位置的原始帧仅能参考在同一时间层上的帧中的A帧或L帧。
例如,帧F(5)能参考帧F(3)和F(1)。
即使当利用多个参考帧时用于时间滤波和处理延迟时间的存储器的数量增加,利用多个参考帧也是有效的。
以下,将参考附图详细说明一种再现视频流的方法,其通过改变关于具有时间可伸缩性的可伸缩视频流的重放速度,使得快速视频搜索可行。
在本发明的实施例中,当包括由8个帧F(0)到F(7)所组成的GOP的视频流,如图9所示,被利用MCTF编码器编码时,编码器按时间层的升序执行对帧对的时间滤波,由此将较低时间层上的帧变换为较高时间层上的L帧和H帧,然后将已变换的L帧对变换为更高时间层上的帧,如图10所示。
此后,图10中通过时间滤波生成的深色的H帧和最高时间层上的单个L帧,被通过空间变换进行处理。结果,生成并输出位流。
然后,用户能接收从编码器输出的位流,并利用对应于编码程序的解码程序来对它解码,以便再现它,从而使用视频流服务。
当视频流服务的用户选择4×前进重放来快速搜索视频时,重放速度设置单元501响应于用户对快速视频搜索的请求,将从编码器接收的位流的重放速度设置到4×前进。
接着,控制单元502确定对应于4×前进重放的时间层2。
接着,控制单元502利用时间层2作为提取条件,提取帧H5、H6、H7及L以待解码(见图11)。
接着,控制单元502利用解码器对帧H5、H6、H7及L解码。
作为解码的结果,生成帧F(0)和F(4)。然后,定时同步单元503根据由控制单元502生成的定时信号,以原始视频信号的帧速率来同步已解码帧F(0)和F(4),从而根据已同步定时信息恢复帧F(0)和F(4)。
换言之,由定时同步单元503在时间轴上改变已解码帧F(0)和F(4)的定时信息,由此恢复帧F(0)和F(1)。结果,利用两个帧F(0)和F(1)来再现由8个帧组成的原始视频信号,并从而以4×前进重放速度将其提供给用户。
或者,当用户选择2×倒退重放速度来快速搜索视频时,重放速度设置单元501响应于用户对快速视频搜索的请求,将从编码器接收、然后存储在存储单元504中的位流的重放速度设置到2×倒退。
接着,控制单元502确定对应于2×倒退重放的时间层1。
接着,控制单元502读取存储单元504中存储的位流,并利用时间层1作为提取条件,提取帧H1、H2、H3、H4、H5、H6、H7及L以待解码(见图11)。
接着,控制单元502利用解码器对帧H1、H2、H3、H4、H5、H6、H7及L解码。
作为解码的结果,生成帧F(0)、F(2)、F(4)和F(6)。然后,控制单元502生成定时信号,以便在倒退方向上恢复帧。
然后,定时同步单元503根据由控制单元502生成的定时信号,按倒退的顺序如F(6)、F(4)、F(2)和F(0),以原始视频信号的帧速率来同步已解码的帧F(0)、F(2)、F(4)和F(6)。
换言之,按F(0)、F(1)、F(2)和F(3)的顺序改变已解码帧的定时信息,然后在时间轴的后退方向上恢复已解码帧F(0)、F(1)、F(2)和F(3)。结果,能够通过用户请求的2×倒退重放来提供快速视频搜索。
为方便使用和清楚说明,重放速度被限定在4×和2×。然而,显然的是,本发明能被用于其他速度。
通常,因为在可伸缩视频解码中一直解码到某一帧是可能的,所以以期望重放速度仅对期望数量的帧解码也是可能的。在这种情形中,通过控制待解码帧的数量,替代时间层,能够获得令人满意的结果。
工业适用性
根据本发明,因为能够实现快速搜索模式,而不增加解码图像的数量,所以能够降低解码器的功耗。
此外,能提供用户友好的流服务,其提供快速搜索模式而不会很大地改变画面质量。
总结本详细说明,本领域技术人员应当理解,只要实质不脱离本发明的原理,可以对示例实施例进行许多变更和修改。相应地,根据本发明的权利要求来诠释本发明的范围。
Claims (17)
1、一种再现可伸缩视频流的方法,包括:
确定对应于为位流请求的重放速度的时间层;
根据确定的时间层,从所述位流的所有帧中提取待解码的帧;以及
解码所提取的帧。
2、如权利要求1所述的方法,还包括:以原始视频信号的帧速率来同步已解码帧的定时。
3、如权利要求1所述的方法,其中,所述对已提取帧的解码包括:
通过关于编码帧的逆量化信息获得变换系数,所述编码帧被通过分析位流来提取;以及
依次对变换系数执行逆空间变换和逆时间变换。
4、如权利要求1所述的方法,其中,所述对已提取帧的解码包括:
通过关于编码帧的逆量化信息获得变换系数,所述编码帧被通过分析位流来提取;以及
依次对变换系数执行逆时间变换和逆空间变换。
5、如权利要求1所述的方法,其中,由于可伸缩视频编码,所述位流具有时间可伸缩性。
6、如权利要求1所述的方法,其中,根据重放方向,所述重放速度是倒退重放速度和前进重放速度之一。
7、如权利要求1所述的方法,其中,通过用户接口来请求所述重放速度。
8、一种用于再现可伸缩视频流的设备,包括:
重放速度设置单元,设置重放速度;
控制单元,确定对应于由重放速度设置单元设置的重放速度的时间层,并根据确定的时间层从位流中提取待解码的帧;以及
定时同步单元,利用定时信号,以原始视频信号的帧速率来同步被解码的帧。
9、如权利要求8所述的设备,还包括:
解码器,解码并恢复由控制单元提取的帧;以及
存储单元,被控制单元控制来存储位流。
10、如权利要求8所述的设备,其中,所述控制单元生成定时信号,用于以原始视频信号的帧速率来同步被解码的帧。
11、如权利要求8所述的设备,其中,为位流选择所述重放速度,并且,由于可伸缩视频编码,所述位流具有时间可伸缩性。
12、如权利要求8所述的设备,其中,根据重放方向,所述重放速度是倒退重放速度和前进重放速度之一。
13、如权利要求8所述的设备,其中,通过预定用户接口来请求所述重放速度。
14、一种计算机可读介质,包括用于再现可伸缩视频流的程序,所述程序包括指令,用于:
确定对应于为位流请求的重放速度的时间层;
根据确定的时间层,从所述位流的所有帧中提取待解码的帧;以及
解码已提取的帧。
15、一种再现可伸缩视频流的方法,包括:
根据为位流请求的重放速度,从位流中提取待解码的帧;
解码已提取的帧;以及
以原始视频信号的帧速率来同步已解码帧的定时,以恢复所述帧。
16、一种用于再现可伸缩视频流的设备,包括:
用户输入单元,根据用户的请求输入重放速度;
控制单元,根据重放速度从位流中提取待解码的帧;
解码器,对已提取的帧解码;以及
同步单元,以原始视频信号的帧速率来同步已解码的帧。
17、如权利要求16所述的设备,还包括:
显示单元,显示被同步的帧。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040003985 | 2004-01-19 | ||
KR1020040003985A KR100834748B1 (ko) | 2004-01-19 | 2004-01-19 | 스케일러블 비디오 스트림 재생 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1922881A true CN1922881A (zh) | 2007-02-28 |
Family
ID=36928903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800420905A Pending CN1922881A (zh) | 2004-01-19 | 2004-12-27 | 再现可伸缩视频流的方法及设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050158026A1 (zh) |
EP (1) | EP1707008A1 (zh) |
KR (1) | KR100834748B1 (zh) |
CN (1) | CN1922881A (zh) |
WO (1) | WO2005069628A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109257623A (zh) * | 2012-10-02 | 2019-01-22 | 杜比国际公司 | 发信号通知步进式时间子层访问样本的方法 |
CN113903297A (zh) * | 2021-12-07 | 2022-01-07 | 深圳金采科技有限公司 | 一种led显示屏幕的显示控制方法及系统 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100703760B1 (ko) * | 2005-03-18 | 2007-04-06 | 삼성전자주식회사 | 시간적 레벨간 모션 벡터 예측을 이용한 비디오인코딩/디코딩 방법 및 장치 |
FR2889017A1 (fr) * | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US8705617B2 (en) * | 2005-09-27 | 2014-04-22 | Qualcomm Incorporated | Multiple layer video encoding |
KR100771623B1 (ko) * | 2006-02-14 | 2007-10-31 | 엘지전자 주식회사 | 영상 복호화 및 처리 장치 및 방법 |
JP5030495B2 (ja) * | 2006-07-14 | 2012-09-19 | ソニー株式会社 | 再生装置、再生方法、プログラム、および記録媒体 |
KR100865683B1 (ko) * | 2007-06-22 | 2008-10-29 | 한국과학기술원 | 다차원 확장성 비디오 데이터의 저장 방법 |
FR2923124A1 (fr) * | 2007-10-26 | 2009-05-01 | Canon Kk | Procede et dispositif de determination de la valeur d'un delai a appliquer entre l'envoi d'un premier ensemble de donnees et l'envoi d'un second ensemble de donnees |
KR101337426B1 (ko) * | 2010-11-16 | 2013-12-05 | 한국전자통신연구원 | Jpeg2000 기반 디지털시네마 시스템에서의 컨텐츠 고배속 재생 장치 및 방법 |
TWI595770B (zh) * | 2011-09-29 | 2017-08-11 | 杜比實驗室特許公司 | 具有對稱圖像解析度與品質之圖框相容全解析度立體三維視訊傳達技術 |
WO2014112790A1 (ko) * | 2013-01-16 | 2014-07-24 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
US10021438B2 (en) | 2015-12-09 | 2018-07-10 | Comcast Cable Communications, Llc | Synchronizing playback of segmented video content across multiple video playback devices |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5852565A (en) * | 1996-01-30 | 1998-12-22 | Demografx | Temporal and resolution layering in advanced television |
US6631240B1 (en) * | 1997-07-23 | 2003-10-07 | University Of Washington | Multiresolution video |
US6594313B1 (en) * | 1998-12-23 | 2003-07-15 | Intel Corporation | Increased video playback framerate in low bit-rate video applications |
US6920175B2 (en) | 2001-01-03 | 2005-07-19 | Nokia Corporation | Video coding architecture and methods for using same |
KR100434539B1 (ko) * | 2001-03-26 | 2004-06-05 | 삼성전자주식회사 | 스케일러블 기술을 이용한 대화형 동영상 광고 방법 및 그장치 |
KR100783396B1 (ko) * | 2001-04-19 | 2007-12-10 | 엘지전자 주식회사 | 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법 |
-
2004
- 2004-01-19 KR KR1020040003985A patent/KR100834748B1/ko not_active IP Right Cessation
- 2004-12-27 EP EP04808595A patent/EP1707008A1/en not_active Withdrawn
- 2004-12-27 CN CNA2004800420905A patent/CN1922881A/zh active Pending
- 2004-12-27 WO PCT/KR2004/003466 patent/WO2005069628A1/en active Application Filing
-
2005
- 2005-01-19 US US11/037,048 patent/US20050158026A1/en not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109257623A (zh) * | 2012-10-02 | 2019-01-22 | 杜比国际公司 | 发信号通知步进式时间子层访问样本的方法 |
CN109257623B (zh) * | 2012-10-02 | 2021-02-12 | 杜比国际公司 | 用于解码图片的方法以及用于解码图片的电子设备 |
US10986355B2 (en) | 2012-10-02 | 2021-04-20 | Dolby International Ab | Method for signaling a step-wise temporal sub-layer access sample |
US11871014B2 (en) | 2012-10-02 | 2024-01-09 | Dolby International Ab | Method for signaling a step-wise temporal sub-layer access sample |
CN113903297A (zh) * | 2021-12-07 | 2022-01-07 | 深圳金采科技有限公司 | 一种led显示屏幕的显示控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
EP1707008A1 (en) | 2006-10-04 |
KR100834748B1 (ko) | 2008-06-05 |
US20050158026A1 (en) | 2005-07-21 |
KR20050076160A (ko) | 2005-07-26 |
WO2005069628A1 (en) | 2005-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1926874A (zh) | 对视频流传输业务进行视频编码、预解码和视频解码的方法和设备以及图像滤波方法 | |
CN1914921A (zh) | 在编码器中提供可分级性的可分级视频编码设备和方法 | |
KR102498725B1 (ko) | 화상 부호화 장치, 화상 부호화 방법 및 기록 매체 | |
CN1151684C (zh) | 活动图象编码译码装置及方法 | |
CN1906945A (zh) | 用于可缩放视频编码和解码的方法和装置 | |
CN1722838A (zh) | 使用基础层的可伸缩性视频编码方法和设备 | |
CN1906938A (zh) | 用于发送可缩放的视频比特流的方法和设备 | |
CN1722836A (zh) | 视频编码和解码方法以及视频编码器和解码器 | |
US20050158026A1 (en) | Method and apparatus for reproducing scalable video streams | |
CN1829326A (zh) | 色彩空间可伸缩性视频编码和解码方法及其设备 | |
CN1943244A (zh) | 视频编码中的帧间预测方法、视频编码器、视频解码方法和视频解码器 | |
CN101069430A (zh) | 分级多视角图像编码和解码装置及方法 | |
CN101076122A (zh) | 通信装置和方法、通信发送接收装置和方法 | |
CN101036388A (zh) | 对混合比特流进行预解码的方法和设备 | |
CN1930890A (zh) | 用于可缩放视频编码和解码的方法和设备 | |
CN1893666A (zh) | 视频编码和解码方法及设备 | |
CN1738438A (zh) | 使静止图像与运动图像流同步的方法 | |
CN1722831A (zh) | 对包括基本层的比特流预解码和解码的方法和设备 | |
CN1358388A (zh) | 数据传输 | |
CN1383684A (zh) | 彩色视频编码与解码方法 | |
TWI408965B (zh) | 可調節視訊編碼之改良加強層編碼之方法、設備及電腦可讀媒體 | |
CN1723710A (zh) | 用于对视频数据编码的系统和用于对视频数据解码的系统 | |
KR101032243B1 (ko) | 스케일링가능한 비트스트림 추출을 위한 방법 및 시스템 | |
CN1318950A (zh) | 图像编码装置及其方法、摄像机、录像装置和图像发送装置 | |
CN1860791A (zh) | 结合高级数据分割和精确粒度可分级以用于有效时空信噪比的可分级视频编码和流式传输的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |