CN102106156B - 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法 - Google Patents

使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法 Download PDF

Info

Publication number
CN102106156B
CN102106156B CN2009801293007A CN200980129300A CN102106156B CN 102106156 B CN102106156 B CN 102106156B CN 2009801293007 A CN2009801293007 A CN 2009801293007A CN 200980129300 A CN200980129300 A CN 200980129300A CN 102106156 B CN102106156 B CN 102106156B
Authority
CN
China
Prior art keywords
layer
svc
value
scalable
dependence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009801293007A
Other languages
English (en)
Other versions
CN102106156A (zh
Inventor
刘秀屏
吴镇宇
约翰·强·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN102106156A publication Critical patent/CN102106156A/zh
Application granted granted Critical
Publication of CN102106156B publication Critical patent/CN102106156B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2381Adapting the multiplex stream to a specific network, e.g. an Internet Protocol [IP] network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving MPEG packets from an IP network
    • H04N21/4383Accessing a communication channel
    • H04N21/4384Accessing a communication channel involving operations to reduce the access time, e.g. fast-tuning for reducing channel switching latency
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/6437Real-time Transport Protocol [RTP]

Abstract

一种设备对视频信号进行编码以提供包括基本层视频编码信号和增强层视频编码信号的可分级视频编码(SVC)信号,其中,基本层视频编码信号比增强层具有更多的随机接入点,例如,即时解码刷新(IDR)片,并且在增强层具有IDR片的那些接入单元中,基本层具有非IDR片。SVC的发送是以使用实时传输协议(RTP)的分组形式发生的,从而使得非随机接入点片在简单时间聚合分组(STAP)中被传送,每个简单时间聚合分组包括有效载荷内容可分级性信息(PACSI)网络抽取层(NAL)单元。

Description

使用可分级视频编码(SVC)的用于快速信道改变的实时传输协议(RTP)打包方法
相关申请的交叉引用
本申请要求于2008年7月16日提交的美国临时申请No.61/081,056以及于2008年7月26日提交的美国临时申请No.61/083,909的优先权。
背景技术
本发明一般地涉及通信系统,例如,诸如陆地广播、蜂窝、无线保真(Wi-Fi)、卫星等等之类的有线和无线系统。
当压缩的视频比特流被递送通过诸如无线网络之类的容易出错的通信信道时,比特流的某些部分可能被损坏或丢失。当这样的错误比特流到达接收机并且被视频解码器解码时,回放质量可能受到严重影响。源容错编码(source error resiliency coding)是用于解决此问题的一种技术。
在视频广播/多播系统中,一个压缩的视频比特流通常在常常被称为会话的指定时间段被同时递送到一群用户。由于视频编码的预测本质,对比特流的随机接入仅在比特流内的某些随机接入点(random access point)处可进行,因此正确解码仅能够从这些随机接入点开始进行。因为随机接入点一般具有较低的压缩效率,所以在比特流中仅存在有限数目的这样的点。结果,当用户将其接收机调谐到某信道并加入会话时,他必须等待所接收的比特流中的下一个可用随机接入点来开始正确解码,这导致视频内容回放中的延迟。这样的延迟被称为调入(tune-in)延迟,并且其是影响系统用户体验的一个重要因素。
在视频递送系统中,若干压缩的视频比特流常常被递送到共享共同的发送介质的端用户,在此,每个视频比特流与一个节目信道相对应。与前面的情况类似,当用户从一个信道切换到另一个信道时,他必须等待从信道所接收的比特流中的下一个可用随机接入点来开始正确解码。这样的延迟被称为信道改变延迟,并且其是影响这样的系统中的用户体验的另一个重要因素。
从视频编码的观点看,插入的随机接入点的一个优点在于提高了压缩的视频比特流的容错性。例如,被插入比特流的随机接入点定期重置解码器并完全停止错误传播,这提高了比特流相对于错误的鲁棒性。
例如,考虑H.264/AVC视频压缩标准(例如,参见ITU-TRecommendation H.264:“Advanced video coding for generic audiovisualservices”,ISO/IEC 14496-10(2005):“Information Technology-Coding ofaudio-visual objects Part 10:Advanced Video Coding”),可以通过包括IDR(instantaneous decoder refresh,即时解码刷新)片(slice)、帧内编码的宏块(MB)和SI(切换I)片在内的编码方法来实现随机接入点(也被称为切换使能点)。
关于IDR片,IDR片只包含帧内编码的MB,其不依赖于任何在先的片来进行正确解码。IDR片还重置解码器处的解码图像缓冲器,从而使得对接下来的片的解码独立于此IDR片之前的任何片。因为在IDR片后即可进行正确解码,所以其也被称为即时随机接入点。相对地,逐步随机接入操作可以基于帧内编码的MB来实现。对于多个连贯的预测图像,帧内编码的MB有规律地被编码,从而使得在这些图像被解码后,接下来的图像中的每个MB具有在这些图像中的一个图像中的帧内编码且协同定位(co-locate)的对应物。因此,这样的图像的解码不依赖于在此组图像之前的任何其它片。类似地,SI片通过将此种类型的特殊编码的片嵌入到比特流中来实现不同比特流之间的切换。遗憾的是,在H.264/AVC中,IDR片或SI片的共同缺点在于编码效率的损失,因为它们通常比其它类型的压缩图像要大。通常,嵌入切换点需要以非常大的比特率开销为代价。
类似地,随机接入点也被用在可分级视频编码(Scalable VideoCoding,SVC)中。在SVC中,依赖性表示(dependency representation)可以包括若干层表示,并且接入单元包括与一个帧编号相对应的所有依赖性表示(例如,参见Y-K.Wang,M.Hannuksela,S.Pateux,A.Eleftheriadis和S.Wenger的“System and transport interface of SVC”,IEEE Trans.Circuits and Systems for Video Technology,vol.17,no.9,Sept 2007,pp.1149-1163;以及H.Schwarz,D.Marpe和T.Wiegand的“Overview of the scalablevideo coding extension of the H.264/AVC standard”,IEEE Trans.Circuitsand Systems for Video Technology,vol.17,no.9,Sept 2007,pp.1103-1120)。
SVC嵌入接入点的常见方法是整个地使用IDR片来编码接入单元。具体地,当较高层表示(具有较大的依赖性_id值的层表示)在IDR图像中被编码时,所有的(一个或多个)较低层表示(具有(一个或多个)较小依赖性_id值的(一个或多个)层表示)也在(一个或多个)IDR图像中被编码。这是因为,当较低层表示在IDR图像中被编码时,较高层表示在其本身在IDR图像中被编码时可以潜在地利用更好的层间预测。一个示例在图1中被示出。图1的SVC编码信号具有两个依赖性表示,并且每个依赖性表示具有一个层表示。具体地,基本层与D=0相关联,并且增强层与D=1相关联(在本领域中“D”的值也被称为“依赖性_id”)。图1示出了九个接入单元,它们出现在SVC信号的帧中。如由虚框10所示,接入单元1包括用于第一层(D=1)的IDR片以及用于基本层(D=0)的IDR片。接下来的接入单元,包括两个预测(P)片。从图1可以看出,接入单元1、5和9仅包括IDR片。如此,随机接入可以发生在这些接入单元处。然而,与H.264/AVC的情况一样,以IDR片编码的每个接入单元减小了SVC编码效率,因为IDR片通常大于其它类型的压缩图像。
发明内容
我们已经注意到,当可分级视频编码(SVC)被用于支持快速信道改变时,所生成的比特流包括用于信道改变的基本层和用作常规视频流的一个或多个增强层。因为基本层和增强层被绑定到相同的信道并且被期望在信道改变时段期间一起使用,所以使用实时传输协议(RTP)传输这样的SVC比特流要求与普通SVC比特流的传输不同的考虑。
因此,根据本发明的原理,一种用于发送视频信号的方法包括:选择可分级视频编码(SVC)信号的第一可分级层作为信道改变层;第一可分级层具有相关联的依赖性_id值,此依赖性_id值小于所述可分级视频编码信号的第二可分级层的相关联的依赖性_id值;以及以使用实时传输协议(RTP)的分组形式发送所述可分级视频编码信号,从而使得非随机接入点片在简单时间聚合分组(Simple Time Aggregation Packets,STAP)中被传送,每个简单时间聚合分组包括有效载荷内容可分级性信息(PayloadContent Scalability Information,PACSI)网络抽取层(Network Abstractlayer,NAL)单元。结果,本发明以供了一种实用的RTP打包方法,该方法对于使用SVC的快速信道改变能够提高发送效率和体验质量(QoE),同时对用于执行媒体意识流选择的媒体意识网络元件(Media AwareNetwork Elements)(MANE)施加最小的影响。
在本发明的说明性实施例中,SVC信号包括基本层和增强层,并且基本层被选择为比增强层具有更多的随机接入点,例如,IDR片SVC信号的发送是以使用RTP的分组形式发生的,从而使得非随机接入点片在STAP中被传送,每个STAP分组包括PACSI NAL单元。PACSI NAL单元包括三比特依赖性_id“DID”字段,该字段被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最低值。另外,PACSI NAL单元包括二比特预留比特(RR)字段,该字段被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最高值。因此,通过比较“DID”字段值与“RR”字段值,可以快速地判断是否STAP分组中的所有NAL单元属于相同层或者是否STAP分组中的NAL单元涉及不同层。
在本发明的另一说明性实施例中,SVC编码器提供了包括基本层和增强层的SVC信号,并且基本层被选择为比增强层具有更多的随机接入点,例如,IDR片,并且其中,SVC编码器根据编码效率来决定是否在增强层具有IDR片的那些接入点中基本层具有非IDR片。SVC信号的发送是以使用RTP的分组形式发生的,从而使得非随机接入点片在STAP中被传送,每个STAP分组包括PACSI NAL单元。PACSI NAL单元包括三比特依赖性_id“DID”字段,该字段被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最低值。另外,PACSI NAL单元包括二比特预留比特(RR)字段,该字段被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最高值。因此,通过比较“DID”字段值与“RR”字段值,可以快速地判断是否STAP分组中的所有NAL单元属于相同层或者是否STAP分组中的NAL单元涉及不同层。
在考虑以上内容的情况下,并且如通过阅读详细描述将清楚的,其它实施例和特征也是可能的并且落在本发明的原理的范围内。
附图说明
图1示出具有即时解码刷新(IDR)片的现有技术可分级视频编码(SVC)信号;
图2示出用于在SVC编码中使用的说明性流程图;
图3示出说明性SVC信号;
图4示出用于在根据本发明的原理的SVC编码中使用的说明性流程图;
图5示出根据本发明的原理的设备的说明性实施例;
图6示出根据本发明的原理的说明性SVC信号;
图7示出用于在根据本发明的原理的SVC编码中使用的另一说明性流程图;
图8示出根据本发明的原理的设备的另一说明性实施例;
图9示出根据本发明的原理的另一说明性流程图;
图10示出根据本发明的原理的经过修改的PACSI NAL单元;以及
图11和图12在MANE的背景下示出本发明的原理。
具体实施方式
在发明性概念以外,在图中所示出的要素是公知的并且将不对其进行详细描述。例如,在发明性概念以外,假设对离散多音(DMT)发送(也被称为正交频分复用(OFDM)或编码正交频分复用(COFDM))是熟悉的并且在此不对其进行描述。此外,假设对电视广播、接收机和视频编码是熟悉的并且在此不对其进行描述。例如,在发明性概念以外,假设对诸如NTSC(国家电视系统委员会)、PAL(逐行倒相)、SECAM(顺序传送彩色与存储)以及ATSC(高级电视系统委员会)(ATSC)、中国数字电视系统(GB)20600-2006和DVB-H之类的针对TV标准的当前以及所提出的建议是熟悉的。类似地,在发明性概念以外,假设了诸如八级残留边带(8-VSB)、正交幅度调制(QAM)之类的其它发送概念以及诸如射频(RF)前端(例如,低噪声块、调谐器、下变频器等等)、解调器、相关器、泄漏积分器(leak integrator)和平方器之类的接收机部件。此外,在发明性概念以外,假设对诸如单向传输文件递送(FLUTE)协议、异步分层编码(ALC)协议、互联网协议(IP)和互联网协议封装器(IPE)之类的协议是熟悉的,并且在此不对其进行描述。类似地,在发明性概念以外,用于生成传输比特流的格式化和编码方法(比如运动图像专家组(MPEG)-2系统标准(ISO/IEC 13818-1)以及上述的SVC)是公知的,并且不在这里描述。应当注意,发明性概念可以使用传统的编程技术来实现,这样的编程技术将不在这里描述。最后,图中的相似标号表示类似要素。
如早前注意的,当接收机最初接通时或者甚至在信道改变期间或者甚至在相同的信道内正改变服务的情况下,接收机可能在能够处理任何所接收的数据之前必须额外地等待所需的初始化数据。结果,用户在能够接入服务或节目之前必须等待额外时间量。如在此描述的,术语“信道改变”、“调入”、“改变服务”是等同的,因为它们都表示向新节目的切换。
在SVC中,SVC信号可以包含多个依赖性(空间)层,这里每个依赖性层可以包括SVC信号的具有相同依赖性_id值的一个或多个时间和/或质量可分级层。基本层(依赖性_id=0)表示视频信号的分辨率最小的级别。其它层(依赖性_id>0)表示视频信号的分辨率增大的层。例如,如果SVC信号包括三层,则有基本层、层1和层2。每个层与不同的依赖性_id值相关联。接收机可以仅处理(a)基本层,(b)基本层和层1,或者(c)基本层、层1和层2。例如,SVC信号可以由仅支持基本信号的分辨率的装置接收,这样,此种类型的装置可以简单地忽略所接收的SVC信号的其它两层。相反,对于支持最高分辨率的装置,此种类型的装置可以处理所接收的SVC信号的所有三层。
在SVC中,IDR图像的编码是每层独立地进行的。因此,根据本发明的原理,一种用于发送视频信号的方法包括:选择可分级视频编码(SVC)信号的第一可分级层作为信道改变层;第一可分级层具有相关联的依赖性_id值,此依赖性_id值小于所述可分级视频编码信号的第二可分级层的相关联的依赖性_id值;对视频信号进行可分级视频编码以提供所述可分级视频编码信号,从而使得对于所述可分级视频编码信号的至少一部分,在第一可分级层中的随机接入点和在第二可分级层中的随机接入点出现在不同的接入单元中;以及发送所述可分级视频编码信号。结果,视频编码器可以通过在压缩的视频比特流中嵌入额外的切换使能点来减小接收机中的调入延迟和信道改变延迟,并且进而减小总体比特率。
在本发明的一个说明性实施例中,SVC信号包括基本层和增强层,并且基本层被选择为比增强层具有更多的随机接入点,例如,IDR片,并且在增强层具有IDR片的那些接入单元中,基本层具有非IDR片。虽然发明性概念是在两层的背景下说明的,但是发明性概念不限于此,并且可以存在多于两个的可分级层。
在描述发明性概念之前,在图2中示出了在可分级视频编码器中使用的用于减小调入延迟和信道改变延迟的流程图。在步骤105中,可分级视频编码器将视频信号编码成包括基本层和至少一个其它层的SVC信号。具体地,在步骤110中,可分级视频编码器对视频信号进行编码,从而使得向所得到的SVC信号的基本层比向任何其它层更频繁地插入IDR片。例如,可分级视频编码器对类似于现有编码模式IBBP或IPPP的编码参数作出响应,只是此编码参数在不同的空间层处指定不同的IDR间隔。最后,在步骤115中,SVC信号被发送。
现在参考图3,示出了由SVC编码器执行图2的流程图的步骤而形成的说明性SVC信号111。在本示例中,SVC信号111包括两层,即基本层(D=0)和增强层(D=1)。从图3可以看出,基本层在接入单元1、4、7和9中具有IDR片;而增强层仅在接入单元1和9中具有IDR片。因此,当接收装置在如箭头301所示的时间Tc改变(或者首先调谐)到传送SVC信号111的信道时,接收装置在能够开始对SVC信号111的基本层进行解码并向用户提供减小的分辨率的视频图像之前仅需要等待如箭头302表示的时间Tw。因此,接收机可以通过立即对具有较多接入点的基本层视频编码信号进行解码来减少调入延迟和信道改变延迟。从图3还可以看出,接收机在能够对增强层进行解码并且向用户提供较高的分辨率的视频图像之前需要等待如箭头303表示的时间TD
当与图1中所示的其中两层都具有相同的IDR频率的示例比较时,图2的方法提供了实现功能提高的相同集合的能力,然而在仅有限的性能损失的情况下以较低比特率来实现。这在当基本层仅占了比特流的总体比特率的一小部分时尤其突出。例如,对于通用中间格式(CIF)(372×288)分辨率作为基本层(D=0)并且标准清晰度(SD)(720×480)分辨率作为增强层(D=1),基本层仅占了总体比特率的很小的百分比(例如,约为25%)。因此,通过增大CIF分辨率处的IDR频率,比特率开销远比仅增大增强层处的IDR频率或者增大这二层处的IDR频率时小。遗憾的是,以IDR片编码的每个接入单元还是减小了SVC编码效率,因为IDR片通常大于其它类型的压缩图像。
另外,我们已经注意到,当可分级视频编码(SVC)被用于支持快速信道改变时,所生成的比特流包括用于信道改变的基本层和用作常规视频流的一个或多个增强层。因为基本层和增强层被绑定到相同的信道并且被期望在信道改变时段期间一起使用,所以使用实时传输协议(RTP)传输这样的SVC比特流要求与普通SVC比特流的传输不同的考虑。
SVC编码器的视频编码层(VCL)生成经编码的信息,此经编码的信息被存储在网络抽取层(NAL)单元中。当SVC比特流在采用实时传输协议(RTP)/用户数据报协议(UDP)/互联网协议(IP)协议栈的网络上被发送时,比特流中的NAL单元需要根据SVC分包被打包成实时传输协议(RTP)分组,如在IETF AVT草案:“RTP Payload Format for SVCvideo draft-ietf-avt-rtp-svc-13.txt”中所描述的。
上述IETF AVT草案定义了很多可用于以单会话/非交织模式发送SVC编码视频流的NAL类型。一种NAL类型是单个NAL单元(SNU)。SNU可以在RTP分组只加载一个SVC NAL单元。另一中NAL类型是简单时间聚合分组(STAP-A)。STAP-A(在此也被简称STAP分组)可以在一个RTP分组中加载具有相同呈现时间要求(或者,等同地,属于相同接入单元)的多个SVC NAL单元,加载顺序与它们的相应解码顺序相同。又一种NAL类型是非交织多时间聚合分组(Multi-Time AggregationPacket,NI-MTAP)。MI-MTAP可以在一个RTP分组中加载具有不同呈现时间要求(或者,等同的,属于不同接入单元)的多个SVC NAL单元,加载顺序与它们的相应解码顺序相同。分段单元-A(FU-A)类型被用于将过大的NAL分组分割成多个RTP分组。最后,存在有效载荷内容可分级性信息(PACSI)NAL类型。PACSI有助于打包并且指示聚合分组的有效载荷中的所有余下的NAL单元共同的可分级性信息和其他特性。然而,直到目前为止还没有建议适用于使用SVC的快速信道改变的打包格式的标准方法或规则。
在考虑以上内容的情况下,我们对现有的基于多播的快速改变解决方案进行了大量关注。首先,现有的基于多播的快速改变解决方案通常使用两个分开的RTP会话:一个用于发送常规视频流,另一个用于发送信道改变流。当信道改变发生时,端用户针对这两个多播RTP会话发送IGMP加入/离开请求。
然而,当SVC用于快速信道改变时,我们提出使用单个多播RTP会话,其中信道改变和常规视频流具有相同SSRC(同步源)、时间戳和序列号间隔。此方法不仅将所需的互联网协议(IP)地址的数目减半,而且还减少了在信道改变处理中需要交换的消息的数目。其他优点还可以包括,例如,简单的防火墙配置、解码顺序恢复处理中的复杂性较少,等等。
另外,我们还注意到,如果MTAP打包被用在上述在图2的流程图中所示的SVC编码方法中,则第一全分辨率图像的解码可能被延迟,因为在一个RTP分组中MTAP打包可具有不同的呈现时间要求(或者,等同地,属于不同的接入单元),延迟顺序与它们的解码顺序相同。因此,即使更多随机接入点被插入基本流中,MTAP也会增大调入延迟。相反,我们已经注意到,如果传送非IDR片总是要求STAP分包,则调入延迟可被减小。
具体地,STAP分组在一个RTP分组中传送具有相同呈现时间要求(或者,等同地,属于相同接入单元)的非IDR片,传送顺序与它们的相应解码顺序相同。结果,一旦单个STAP分组被接收到,解码就可以开始。因此,使用STAP NAL单元来打包非IDR片有助于减少调入延迟。另外,通过采用STAP来打包来自一个接入单元但是属于不同层的层表示,原来的解码顺序可以容易地被维持。
我们还注意到,媒体意识网络元件(MANE)必须能够对RTP头或者有效载荷进行解析以对被封包的音频/视频内容进行反应。MANE的一个示例是媒体网关,其对IP顶部的RTP/RTCP、NAL头执行处理,并且如果需要还可以复制或转换某类型NAL单元。因此,我们已经注意到,通过使用有效载荷/头信息来识别承载SVC编码视频流的RTP会话内的层,MANE可以聚合多个RTP流,并且从到来的RTP分组流执行媒体意识流稀疏化(分组或部分的选择性减少)。具体地,如果经修改的PACSI NAL单元被包括在每个STAP分组中,则MANE能够在无需将NAL头进一步解析成RTP分组的情况下提取必要的信息,诸如分层信息和依赖性信息。
因此,根据本发明的原理,一种用于发送视频信号的方法包括:选择可分级视频编码(SVC)信号的第一可分级层作为信道改变层;第一可分级层具有相关联的依赖性_id值,此依赖性_id值小于所述可分级视频编码信号的第二可分级层的相关联的依赖性_id值;以及以使用实时传输协议(RTP)的分组形式发送所述可分级视频编码信号,从而使得非随机接入点片在简单时间聚合分组(STAP)中被传送,每个简单时间聚合分组包括有效载荷内容可分级性信息(PACSI)网络抽取层(NAL)单元。结果,本发明以供了一种实用的RTP打包方法,该方法对于使用SVC的快速信道改变能够提高发送效率和体验质量(QoE),同时对用于执行媒体意识流选择的媒体意识网络元件(MANE)施加最小的影响。
在图4中示出了根据本发明的原理的说明性流程图。另外,注意力还应当暂时转到图5,图5示出了根据本发明的原理用于编码视频信号的说明性设备200。仅仅与发明性概念有关的那些部分被示出。设备200是基于处理器的系统,并且包括一个或多个处理器以及相关联的存储器,如在图5中以虚框的形式示出的处理器240和存储器245所表示的。在此背景下,计算机程序或软件被存储在存储器245中以供处理器240执行从而例如实现SVC编码器205。处理器240表示一个或多个由所存储程序控制的处理器,并且这些处理器不必专用于发送功能,例如,处理器240还可以控制发射机的其它功能。存储器245表示任何存储装置,例如,随机存取存储器(RAM)、只读存储器(ROM)等等;可以在发射机的内部和/或外部;并且根据需要是易失性的和/或非易失性的。
设备200包括SVC编码器205和调制器210。视频信号204被应用到SVC编码器205。SVC编码器205根据本发明的原理对视频信号204进行编码,并且将SVC信号206提供给调制器210。调制器210提供经过调制的信号211以供经由上变频器和天线(这二者在图5中均未示出)发送。
现在返回到图4,在步骤155中,图5的处理器240将视频信号204编码成包括基本层和增强层的SVC信号206。具体地,在步骤160中,处理器240控制图5的SVC编码器205(例如,经由图5中以虚线形式所示的信号203)从而使得向SVC信号206的基本层比向增强层更频繁地插入IDR片,并且,另外,当在同一接入单元中出现两个IDR片时,基本层被以非IDR片编码。具体地,就像指定编码模式IBBP或IPPP那样,编码参数被应用到SVC编码器205,该编码参数在不同的空间层处指定不同的IDR间隔。在步骤165中,图5的调制器210以使用RTP的分组形式发送此SVC信号,从而使得非IDR片在STAP中被传送,每个STAP包括PACSI NAL单元(下面描述)。应当注意,由于已编码的IDR图像常常占用比典型网络的MTU(最大传输单元)(例如,对于以太网而言是1500字节)多的字节,因此,IDR片很可能被打包成FU类型的RTP分组。应当注意,虽然打包功能被描述为是在调制器中执行的,但是发明性概念不限于此,并且可以在如由设备200代表的发射机的其他部分中执行。
根据本发明的原理修改的说明性PASCI NAL单元结构在图10中被示出。PASCI NAL单元包括三比特依赖性_id“DID”字段(498),该字段在图4的步骤165中被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最低值。另外,ASCI NAL单元包括二比特预留比特“RR”字段(499),根据本发明的原理,该字段在图4的步骤165中被设定为STAP分组的有效载荷中的所有余下的NAL单元的DID值中的最高值。因此,通过比较“DID”字段值与“RR”字段值,可以快速地判断是否STAP分组中的所有NAL单元属于相同层或者是否STAP分组中的NAL单元涉及不同层。因此,例如,通过检查这两个字段中的值,MANE可以总体上快速地判断是否聚合分组中的所有NAL单元属于相同层以及决定转发还是丢弃整个聚合分组。然而,在RR字段值与DD字段值不同时,这表明在STAP有效载荷中聚合了不止一个可分级层。结果,MANE需要进一步解析跟在PACSI NAL后的每个NAL单元头和NAL单元大小,以决定有效载荷的哪部分可以被转发或被丢弃。
现在参考图6,示出了由SVC编码器执行图4的流程图的步骤而形成的说明性SVC信号206。在本示例中,SVC信号206包括两层,即基本层(D=0)和增强层(D=1)。从图6可以看出,基本层在接入单元4和7中具有IDR片;而增强层在接入单元1和9中具有IDR片。根据本发明的原理,在接入单元1和9中,基本层被以非IDR片编码。应当看出,虽然SVC编码器提供了比增强层具有更多的随机接入点的基本层(例如,在增强层的接入单元9中的IDR片出现之前,在基本层的接入单元4和7中有两个IDR片),但是发明性概念不限于此。例如,SVC编码可以被执行以使得在信道改变层中的IDR片只是出现在与具有较高依赖性_id值的层中的IDR片不同的时间处。实际上,这可能使得例如基本层和增强层中的IDR片的数目相同。
继续对图6进行说明,当接收装置在如箭头401所示的时间Tc改变(或者首先调谐)到传送SVC信号206的信道时,接收装置在能够开始对SVC信号206的基本层进行解码并向用户提供减小的分辨率的视频图像之前仅需要等待如箭头402表示的时间Tw。因此,接收机可以通过立即解码具有较多接入点的基本层视频编码信号来减少调入延迟和信道改变延迟。从图6还可以看出,如果信道改变发生在如由箭头409表示的时间TF,则接收机在能够对增强层进行解码并且向用户提供较高的分辨率的视频图像之前仅需要等待如箭头403表示的时间TG
现在转到图7,示出了本发明的另一说明性实施例。图7的流程图示出这样的SVC编码器(例如,图5的SVC编码器205),其提供包括基本层和增强层的SVC信号,其中基本层被选择为与增强层相比具有更多的随机接入点,例如IDR片,并且其中,SVC编码器根据编码效率来决定是否在增强层具有IDR片的那些接入单元中基本层具有非IDR片。结果,所得到的SVC编码信号可以在SVC编码信号的至少一部分中具有较低层被以非IDR片编码而较高层被以IDR片编码的接入单元,也可以不具有这样的接入单元。在步骤505中,可分级视频编码器将视频信号编码成包括基本层和至少一个其它层的SVC信号。具体地,在步骤510中,可分级视频编码器对视频信号进行编码以使得向得到的SVC信号的基本层比向任何其它层更频繁地插入IDR片。例如,可分级视频编码器对类似于现有编码模式IBBP或IPPP的编码参数作出响应,只是此编码参数在不同的空间层处指定不同的IDR间隔。在步骤520中,SVC编码器检查所得到的编码效率,例如,检查用于将整个接入单元编码为IDR片的比特率是否高于用于将基本层编码为非IDR片并且将上部层编码为IDR片的比特率。如果此比特率并非较高,则在步骤530中SVC信号被发送。再次应当注意,IDR片很可能被打包成FU类型的RTP分组,因为编码的IDR图像需要不止MTU。然而,如果此比特率较高,则在步骤525中,在同一接入单元中出现两个IDR片的那些接入单元中,SVC编码器以非IDR片来替换基本层,以增大编码效率,并且然后,在步骤530中SVC信号被以使用RTP的分组形式发送,从而使得非IDR片在STAP分组中被传送,每个STAP分组包括具有如前面所述适当设定的DID字段和RR字段的经修改的PACSI NAL单元。
应当注意,图2、4和7的流程图表示出设备200处理较高层。例如,当视频信号的一部分被SVC编码时,SVC编码信号的部分可以同时被发送。此外,虽然在基本层和单个增强层的背景下进行了说明,但是图4和图7的流程图很容易扩展到不止一个上部层。
现在参考图8,示出了根据本发明的原理的用于接收SVC信号的说明性设备。仅仅与发明性概念有关的那些部分被示出。设备350接收根据本发明的原理的传送SVC信号的信号,如由接收信号311所表示(例如,其是由图5的设备200发送的信号的接收版本)。设备350表示例如蜂窝电话、移动TV、机顶盒、数字TV(DTV)等等。设备350包括接收机355、处理器360和存储器365。如此,设备350是基于处理器的系统。接收机355表示用于调谐到传送SVC信号的信道的前端和解调器。接收机355接收信号311并且从其中恢复出信号356,信号356被处理器360处理,即,处理器360执行SVC解码。例如,根据图9(下面描述)中所示的根据本发明的原理的用于信道切换和信道调入的流程图,处理器360经由路径366将经过解码的视频提供给存储器365。经过解码的视频被存储在存储器365中以便应用于显示器(未示出),该显示器可以是设备350的一部分或者与设备350分离。
现在转到图9,示出了用于在设备350中使用的根据本发明的原理的说明性流程图。在本示例中,所接收的SVC信号包括基本层和增强层(上部层),其中,基本层的依赖性_id值小于增强层的依赖性_id值。当切换信道或调入到某信道时,处理器360设定对初始目标依赖性层(例如,指定的信道改变层)进行解码。在本示例中,在步骤405中这由所接收的SVC信号的基本层表示。然而,发明性概念不限于此,并且其它依赖性层可以被指定为“初始目标层”。在步骤410中,处理器360接收接入单元(本领域中也被称为所接收的SVC网络提取层(NAL)单元),并且在步骤415中检查所接收的接入单元的上部层是否是IDR片。如果其不是IDR片,则在步骤425中处理器360检查在所接收的接入单元中的基本层中是否是IDR片。如果在基本层中不是IDR,则处理器360返回到步骤410以接收下一接入单元。然而,如果在步骤415中,在上部层中是IDR片,则在步骤420中,处理器360将其SVC目标表示层设定为增强层,并且当其首先从增强层(例如,正规视频流)接收到IDR图像时开始解码。
返回到步骤425,如果所接收的基本层是IDR片,则在步骤430中处理器306开始对SVC基本层解码以提供视频信号,虽然是以减小的分辨率提供的。然后,在步骤435中,处理器360接收接入单元并且在步骤440中检查所接收的接入单元的上部层是否是IDR片。如果其不是IDR片,则处理器360返回步骤435以接收下一接入单元。然而,如果所接收的接入单元的上部层是IDR片,则处理器在步骤445中开始对SVC上部层进行解码,以提供较高分辨率的视频信号。
换句话,图9的流程图的概要如下。当在具有比当前解码层的依赖性_id值大的依赖性_id值的依赖性层中检测到IDR片时,接收机对具有检测到的IDR片的依赖性层中的编码视频行进解码。否则,接收机继续对当前的依赖性层进行解码。如上所述,即使没有来自基本层的IDR,来自增强层的IDR也足以启动对增强层的解码。
应当注意,图9的流程图表示设备350处理较高层。例如,一旦在步骤430中开始对基本层解码,处理器350就继续对基本层解码,即使处理器350还在步骤435和450中针对IDR片检查上部层。最后,虽然是在基本层和单个增强层的背景下进行说明的,但是图9的流程图很容易扩展到不止一个上部层。
如上所述,根据本发明的原理,处理RTP(经SCV编码的)分组流的接收机可以快速地判断是否所接收的STAP分组中的所有NAL单元属于相同层或者是否在STAP有效载荷中不止一个层被传送,从而执行适当的处理。这在图11和图12中被进一步被图示出,其中接收机通过MANE而被图示出,虽然本发明不局限于此。MANE 700是基于处理器的系统并且包括一个或多个处理器以及相关联的存储器,如在图11中由以虚框的形式示出的处理器740和存储器745所表示的。在此背景下,计算机程序或软件被存储在存储器745中以供处理器740执行。处理器740表示一个或多个由所存储程序控制的处理器。存储器745表示存储器245表示任何存储装置,例如,随机存取存储器(RAM)、只读存储器(ROM)等等;可以在发射机的内部和/或外部;并且根据需要是易失性的和/或非易失性的。MANE 700接收RTP(经SVC编码的)分组流699,根据需要执行处理,并且将RTP(经SVC编码的)分组流701提供给其他网络元件或接收装置。
现在转到图12,用于在例如图11的MANE 700的接收机中使用的流程图被示出。在步骤705中,MANE 700接收RTP(经SVC编码的)分组流。在步骤710中,MANE 700将每个所接收的STAP分组的PACSI NAL单元中的DID和RR字段各自的值进行比较。如果DID和RR字段各自的值相同,则MANE 700以分组为基础来处理所接收的STAP分组。例如,如果存在网络拥堵,则丢弃整个分组。另一方面,如果DID和RR字段各自的值不同,则MANE 700以NAL单元为基础来处理所接收的STAP分组。例如,如果存在网络拥堵,则增强层被丢弃。因此,根据本发明的原理,MANE 700通过比较DID字段和RR字段中的值而不是查看随后的聚合NAL单元本身来确定可分级信息。结果,MANE 700可以更高效地处理所接收的RTP(经SVC编码的)流699并且在形成RTP(经SVC编码的)流701中转发、处理或丢弃封装的NAL单元。
换言之,当SVC流既包括低分辨率可分级层又包括高分辨率可分级层,用于信道改变和常规流的各个NAL单元在它们的NAL头中将使用不同的DID值。当这些NAL单元被聚合成单个RTP分组时,PACSI NAL单元中的DID和RR字段将根据本发明的原理被适当设定。然而,查看DID值本身,MANE不能告知随后的NAL单元是否来自一个可分级层。因此,如果MANE仅需要转发较低分辨率的可分级层给蜂窝电话用户时,MANE必须在转发之前解析每个余下的NAL单元。然而,通过使用根据本发明的原理的PACSI NAL单元的RR字段,MANE可以快速地知道是否所接收的STAP分组的所有余下的NAL单元属于相同的可分级层,而无需解析每个余下的NAL单元,并且例如,如果STAP分组属于较低分辨率可分级层则将其转发,或者如果不是则将该STAP分组丢弃。
如上所述,根据本发明的原理,当MPEG可分级视频编码(SVC)(例如,参见ITU-T Recommendation H.264 Amendment 3:“Advancedvideo coding for generic audiovisual services:Scalable Video Coding”)被用于快速信道改变时,比特流编码模式减小了总体比特率。结果,可以在不影响快速信道改变性能的情况下减小SVC压缩视频流的总体比特率。另外,根据本发明的原理,使用STAP分包的RTP打包方法提高了发送效率并且提高了总体信道改变体验质量(QoE)。最后,根据本发明的原理,PACSI NAL头信息被修改以确保由MANE(媒体意识网络元件)提取SVC层的灵活性。应当注意,虽然发明性概念是在两层空间可分级SVC比特流的背景下描述的,但是发明性概念不限于此并且可应用到多个空间可分级层以及在SVC标准中指定的时间和质量PSNR(信噪比)分级。
在考虑以上描述的情况下,前面仅仅例示了本发明的原理,并且因此将会理解,本领域技术人员将能够设计出许多虽然在此没有明确描述但是采用本发明的原理并且落入本发明的精神和范围内的替代布置。例如,虽然是在分离的功能性元件的背景下说明的,但是这些功能性元件可以被包含在一个或多个集成电路(IC)中。类似地,虽然被示出为分离的元件,但是这些元件中的任何元件或者所有元件可以实现在执行(例如,与在图4和图8中所示的一个或多个步骤等相对应的)相关联的软件的由所存储程序控制的处理器(例如,数字信号处理器)中。此外,本发明的原理可应用于例如卫星、无线保真(Wi-Fi)、蜂窝等其它类型的通信系统中。实际上,发明性概念还可应用于固定的接收机或移动的接收机。因此,应当明白,在不脱离本由所附权利要求所定义的本发明的精神和范围的情况下可以对说明性实施例作出许多修改并且可以设计出其它的布置。

Claims (12)

1.一种用于发送遵循H.264/AVC的视频信号的方法,包括:
选择可分级视频编码信号的第一可分级层作为信道改变层,所述第一可分级层具有相关联的依赖性_id值,此依赖性_id值小于所述可分级视频编码信号的第二可分级层的相关联的依赖性_id值;以及
以使用实时传输协议的分组形式发送所述可分级视频编码信号,从而使得非随机接入点片在简单时间聚合分组中被传送,每个简单时间聚合分组包括有效载荷内容可分级性信息网络抽取层单元;
其中所述发送步骤包括:
将所述有效载荷内容可分级性信息网络抽取层单元的DID字段设定为各个简单时间聚合分组中余下的网络抽取层单元的依赖性_id值中的最低值;并且将所述有效载荷内容可分级性信息网络抽取层单元的RR字段设定为各个简单时间聚合分组中余下的网络抽取层单元的依赖性_id值中的最高值。
2.根据权利要求1所述的方法,其中,可分级视频编码步骤在所述第一可分级层中比在所述第二可分级层中提供更多的随机接入点。
3.根据权利要求1所述的方法,其中,所述第一可分级层是所述视频编码信号的基本层。
4.根据权利要求1所述的方法,其中,所述视频编码信号包括两个以上可分级层。
5.根据权利要求1所述的方法,其中,随机接入点是即时解码刷新片。
6.一种在接收机中用于接收遵循H.264/AVC的视频信号的方法,该方法包括:
接收包括简单时间聚合分组的实时传输协议可分级视频编码分组流,每个简单时间聚合分组具有有效载荷内容可分级性信息网络抽取层单元,并且其中,所述可分级视频编码分组流遵循H.264/AVC;
将在所接收的有效载荷内容可分级性信息网络抽取层单元的DID字段和RR字段中传送的值进行比较;
如果所述DID字段和所述RR字段的值相同,则以分组为基础处理各个STAP分组;并且
如果所述DID字段和所述RR字段的值不同,则处理所述各个STAP分组的各个NAL单元。
7.根据权利要求6所述的方法,其中,所述接收机是媒体意识网络元件。
8.一种用于发送遵循H.264/AVC的视频信号的设备,包括:
可分级视频编码器,提供遵循H.264/AVC的视频编码信号,所述视频编码信号包括第一可分级层和第二可分级层,其中所述第一可分级层具有相关联的依赖性_id值,此依赖性_id值小于所述第二可分级层的相关联的依赖性_id值;以及
调制器,发送所述视频编码信号;
其中,被发送的视频编码信号是以使用实施传输协议的分组形式传送的,从而使得非随机接入点片在简单时间聚合分组中被传送,每个简单时间聚合分组包括有效载荷内容可分级性信息网络抽取层单元,
并且其中,所述有效载荷内容可分级性信息网络抽取层单元的DID字段被设定为各个简单时间聚合分组中余下的网络抽取层单元的依赖性_id值中的最低值;并且所述有效载荷内容可分级性信息网络抽取层单元的RR字段被设定为各个简单时间聚合分组中余下的网络抽取层单元的依赖性_id值中的最高值。
9.根据权利要求8所述的设备,其中,所述可分级视频编码器在所述第一可分级层中比在所述第二可分级层中提供更多的随机接入点。
10.根据权利要求8所述的设备,其中,所述第一可分级层是所述视频编码信号的基本层。
11.根据权利要求8所述的设备,其中,所述视频编码信号包括两个以上可分级层。
12.根据权利要求8所述的设备,其中,随机接入点是即时解码刷新片。
CN2009801293007A 2008-07-26 2009-01-29 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法 Expired - Fee Related CN102106156B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8390908P 2008-07-26 2008-07-26
US61/083,909 2008-07-26
PCT/US2009/000574 WO2010014123A1 (en) 2008-07-26 2009-01-29 A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc)

Publications (2)

Publication Number Publication Date
CN102106156A CN102106156A (zh) 2011-06-22
CN102106156B true CN102106156B (zh) 2013-06-19

Family

ID=41168539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801293007A Expired - Fee Related CN102106156B (zh) 2008-07-26 2009-01-29 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法

Country Status (7)

Country Link
US (1) US8582644B2 (zh)
EP (1) EP2304955B1 (zh)
JP (1) JP5155449B2 (zh)
KR (1) KR101635235B1 (zh)
CN (1) CN102106156B (zh)
BR (1) BRPI0915958A2 (zh)
WO (1) WO2010014123A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8289370B2 (en) 2005-07-20 2012-10-16 Vidyo, Inc. System and method for scalable and low-delay videoconferencing using scalable video coding
WO2007058470A1 (en) * 2005-11-15 2007-05-24 Electronics And Telecommunications Research Institute A method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same
US9578325B2 (en) * 2010-01-13 2017-02-21 Texas Instruments Incorporated Drift reduction for quality scalable video coding
EP2395505A1 (en) 2010-06-11 2011-12-14 Thomson Licensing Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
CN103416003B (zh) * 2011-01-14 2015-05-27 维德约股份有限公司 改进的nal单元头部
CA2824027C (en) 2011-01-14 2017-11-07 Vidyo, Inc. High layer syntax for temporal scalability
AU2012225513B2 (en) 2011-03-10 2016-06-23 Vidyo, Inc. Dependency parameter set for scalable video coding
US9420307B2 (en) 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
US20130138829A1 (en) * 2011-11-30 2013-05-30 Rovi Technologies Corporation Scalable video coding over real-time transport protocol
KR101876299B1 (ko) * 2012-01-20 2018-07-09 전자부품연구원 하이브리드 전송환경에서 스케일러블 초고해상도 비디오 서비스를 위한 프로그램 구성 정보 송수신 방법
US20150063463A1 (en) * 2012-04-15 2015-03-05 Samsung Electronics Co., Ltd. Method and device for coding multi-layer video, and method and device for decoding multi-layer video
US9313486B2 (en) 2012-06-20 2016-04-12 Vidyo, Inc. Hybrid video coding techniques
WO2014007590A1 (ko) * 2012-07-06 2014-01-09 삼성전자 주식회사 랜덤 억세스를 위한 멀티 레이어 비디오 부호화 방법 및 그 장치, 랜덤 억세스를 위한 멀티 레이어 비디오 복호화 방법 및 그 장치
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
EP2901688B1 (en) 2012-09-28 2019-10-23 Nokia Technologies Oy An apparatus and a method for video coding and decoding
CN103780954B (zh) * 2012-10-22 2017-05-10 上海贝尔股份有限公司 一种组合使用流媒体裁剪技术和显性拥塞通知技术的方法
US9351011B2 (en) * 2012-11-28 2016-05-24 Intel Corporation Video pipeline with direct linkage between decoding and post processing
KR20150096410A (ko) 2012-12-17 2015-08-24 톰슨 라이센싱 강건한 디지털 채널들
CA2893845C (en) 2012-12-17 2020-06-02 Thomson Licensing Robust digital channels
CN103079073A (zh) * 2013-01-16 2013-05-01 南京邮电大学 正交频分多址接入系统中面向可伸缩视频的资源分配方法
US9602973B2 (en) * 2013-02-19 2017-03-21 Qualcomm Incorporated Applying error resiliency based on speed
FR3004055A1 (fr) * 2013-03-29 2014-10-03 France Telecom Transcodage et diffusion adaptative de contenus multimedia
US9723305B2 (en) 2013-03-29 2017-08-01 Qualcomm Incorporated RTP payload format designs
US9648353B2 (en) * 2013-04-04 2017-05-09 Qualcomm Incorporated Multiple base layer reference pictures for SHVC
US9596486B2 (en) * 2013-04-05 2017-03-14 Qualcomm Incorporated IRAP access units and bitstream switching and splicing
WO2014162750A1 (en) * 2013-04-05 2014-10-09 Sharp Kabushiki Kaisha Random access point pictures
US9807421B2 (en) 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
US9674533B2 (en) 2013-04-05 2017-06-06 Qualcomm Incorporated Picture alignments in multi-layer video coding
KR102290421B1 (ko) * 2013-04-05 2021-08-17 삼성전자주식회사 랜덤 엑세스를 위한 멀티 레이어 비디오 부호화 방법 및 그 장치, 랜덤 엑세스를 위한 멀티 레이어 비디오 복호화 방법 및 그 장치
CN103313045A (zh) * 2013-05-31 2013-09-18 哈尔滨工业大学 宽带多媒体集群系统调度台h.264视频分包方法
US10003815B2 (en) 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
JP6605789B2 (ja) * 2013-06-18 2019-11-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 送信方法、受信方法、送信装置、および、受信装置
CN103402122A (zh) * 2013-06-24 2013-11-20 中国联合网络通信集团有限公司 移动流媒体服务控制方法及其装置
CA2917719C (en) * 2013-07-11 2021-12-14 Dejero Labs Inc. Systems and methods for transmission of data streams
US20150016502A1 (en) * 2013-07-15 2015-01-15 Qualcomm Incorporated Device and method for scalable coding of video information
US10264272B2 (en) * 2013-10-15 2019-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
EP3080995A4 (en) * 2013-12-15 2017-09-27 LG Electronics Inc. Broadcast transmission device and operating method thereof, and broadcast reception device and operating method thereof
US20150195549A1 (en) * 2014-01-08 2015-07-09 Qualcomm Incorporated Support of non-hevc base layer in hevc multi-layer extensions
JP2015136059A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 通信装置、通信データ生成方法、および通信データ処理方法
GB201515496D0 (en) 2015-09-01 2015-10-14 Microsoft Technology Licensing Llc Packet transmissions
KR102468763B1 (ko) 2016-02-05 2022-11-18 삼성전자 주식회사 영상처리장치 및 그 제어방법
GB201817781D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Mehods, apparatuses, computer programs and computer-readable media
US10880585B1 (en) * 2019-06-12 2020-12-29 Amazon Technologies, Inc. Split-and-stitch media content encoding
US11539957B2 (en) * 2019-06-20 2022-12-27 Tencent America LLC Layered random access with reference picture resampling
US11265357B2 (en) * 2019-10-10 2022-03-01 Microsoft Technology Licensing, Llc AV1 codec for real-time video communication
EP4104428A4 (en) 2020-03-16 2023-05-03 ByteDance Inc. DIRECT ACCESS POINT ACCESS UNIT IN SCALABLE VIDEO ENCODING
US11503289B2 (en) * 2020-05-27 2022-11-15 Tencent America LLC Bitstream structure for viewport-based streaming with a fallback bitstream
CN112533029B (zh) * 2020-11-17 2023-02-28 浙江大华技术股份有限公司 一种视频分时传输方法、摄像装置、系统和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1848954A (zh) * 2005-04-14 2006-10-18 三星电子株式会社 能够最小化随机存取延迟的视频编码/解码装置及方法
CN1973550A (zh) * 2004-07-07 2007-05-30 汤姆森许可贸易公司 使用冗余视频流的通过dsl的数字视频广播系统中的快速频道改变

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7746378B2 (en) * 2004-10-12 2010-06-29 International Business Machines Corporation Video analysis, archiving and alerting methods and apparatus for a distributed, modular and extensible video surveillance system
US20070022215A1 (en) * 2005-07-19 2007-01-25 Singer David W Method and apparatus for media data transmission
AU2007204168B2 (en) * 2006-01-11 2011-02-24 Nokia Technologies Oy Backward-compatible aggregation of pictures in scalable video coding
EP1999960A4 (en) * 2006-03-24 2011-05-18 Korea Electronics Telecomm CODING METHOD FOR REDUCING REDUNDANCY BETWEEN LAYERS USING MITION DATA OF THE FGS LAYER AND ESTABLISHMENT THEREFOR
CA2704490A1 (en) * 2007-11-05 2009-05-14 Thomson Licensing A scalable video coding method for fast channel change and increased error resilience
BRPI0915795A2 (pt) * 2008-07-16 2015-11-10 Thomson Licensing método de codificação de vídeo escalonável para mudança rápida de canal para aumentar eficácia de codificação

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973550A (zh) * 2004-07-07 2007-05-30 汤姆森许可贸易公司 使用冗余视频流的通过dsl的数字视频广播系统中的快速频道改变
CN1848954A (zh) * 2005-04-14 2006-10-18 三星电子株式会社 能够最小化随机存取延迟的视频编码/解码装置及方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Boyce,J.M..Fast efficient channel change[set-top box applications].《Consumer Electronics,2005.ICCE.2005 Digest of Technical Papers》.2005,
Fast efficient channel change[set-top box applications];Boyce,J.M.;《Consumer Electronics,2005.ICCE.2005 Digest of Technical Papers》;20050112;全文 *
S.Wenger et al..RTP Payload Format for SVC Video, draft-ietf-avt-rtp-svc-13.txt.《INTERNET ENGINEERING TASK FORCE,IETF STANDARD WORKING DRAFT》.2008, *
S.Wengeretal..RTPPayloadFormatforSVCVideo draft-ietf-avt-rtp-svc-13.txt.《INTERNET ENGINEERING TASK FORCE
STANDARD WORKING DRAFT》.2008,
System and Transport Interface of SVC;Wang Ye-Kui;《IEEE Transactions on Ciruits and Systems for Video Technology》;20070930;第17卷(第9期);全文 *
Wang Ye-Kui.System and Transport Interface of SVC.《IEEE Transactions on Ciruits and Systems for Video Technology》.2007,第17卷(第9期),

Also Published As

Publication number Publication date
US8582644B2 (en) 2013-11-12
WO2010014123A1 (en) 2010-02-04
EP2304955B1 (en) 2017-03-29
JP5155449B2 (ja) 2013-03-06
EP2304955A1 (en) 2011-04-06
KR20110042201A (ko) 2011-04-25
JP2011529321A (ja) 2011-12-01
BRPI0915958A2 (pt) 2018-06-05
CN102106156A (zh) 2011-06-22
US20110134994A1 (en) 2011-06-09
KR101635235B1 (ko) 2016-06-30

Similar Documents

Publication Publication Date Title
CN102106156B (zh) 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法
US8831039B2 (en) Time-interleaved simulcast for tune-in reduction
CN101849417A (zh) 用于快速信道改变和增加的容错性的可缩放视频编码方法
CN102100069A (zh) 用于快速信道改变以增大编码效率的可分级视频编码方法
Wenger et al. RTP payload format for H. 264 video
CN101316357B (zh) 一种频道切换的方法和终端
KR101087379B1 (ko) 패킷화 방법 및 장치, 비트스트림 표현 처리 방법 및 장치와 컴퓨터 판독 가능 매체
EP2071846A1 (en) Method, system and media server for iptv channel quickly switching
EP2478701B1 (en) Distribution of mpeg-2 ts multiplexed multimedia stream with selection of elementary packets of the stream
CN101690229A (zh) 用于指示时间层切换点的系统和方法
JP2009537078A (ja) スケーラブルビデオ符号化における、下位互換性のあるピクチャの集約
US20110109810A1 (en) Method an apparatus for fast channel change using a scalable video coding (svc) stream
US20080301742A1 (en) Time-interleaved simulcast for tune-in reduction
US20070250639A1 (en) Transmission of ip packets of contents by addition to those ip packets of information data relating to the contents
KR101656193B1 (ko) 이기종 망에서의 uhd 비디오 전송을 위한 mmt 기반 방송 시스템 및 방법
Reguant et al. Delivery of H264 SVC/MDC streams over Wimax and DVB-T networks
Wang et al. Mobile video applications and standards
Chung A novel selective frame discard method for 3D video over IP networks
WO2008149271A2 (en) Time-interleaved simulcast for tune-in reduction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130619

Termination date: 20180129