JP2011529321A - スケーラブルビデオコーディング(svc)を使用する高速チャネル変更アプリケーションのためのリアルタイムトランスポートプロトコル(rtp)パケット化方法 - Google Patents

スケーラブルビデオコーディング(svc)を使用する高速チャネル変更アプリケーションのためのリアルタイムトランスポートプロトコル(rtp)パケット化方法 Download PDF

Info

Publication number
JP2011529321A
JP2011529321A JP2011521086A JP2011521086A JP2011529321A JP 2011529321 A JP2011529321 A JP 2011529321A JP 2011521086 A JP2011521086 A JP 2011521086A JP 2011521086 A JP2011521086 A JP 2011521086A JP 2011529321 A JP2011529321 A JP 2011529321A
Authority
JP
Japan
Prior art keywords
layer
scalable
svc
random access
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011521086A
Other languages
English (en)
Other versions
JP2011529321A5 (ja
JP5155449B2 (ja
Inventor
シュウピン ルー
チェンユェ ウ
チャン リー ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2011529321A publication Critical patent/JP2011529321A/ja
Publication of JP2011529321A5 publication Critical patent/JP2011529321A5/ja
Application granted granted Critical
Publication of JP5155449B2 publication Critical patent/JP5155449B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2381Adapting the multiplex stream to a specific network, e.g. an Internet Protocol [IP] network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4383Accessing a communication channel
    • H04N21/4384Accessing a communication channel involving operations to reduce the access time, e.g. fast-tuning for reducing channel switching latency
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/6437Real-time Transport Protocol [RTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ベースレイヤビデオ符号化された信号とエンハンスメントレイヤビデオ符号化された信号とを含むスケーラブルビデオ符号化(SVC)信号を提供するために、装置がビデオ信号を符号化し、ベースレイヤビデオ符号化された信号は、エンハンスメントレイヤよりも多くのランダムアクセスポイント、例えば、即時デコーダリフレッシュ(IDR)スライスを有し、エンハンスメントレイヤがIDRスライスを有するようなアクセスユニットにおいては、ベースレイヤは、非IDRスライスを有する。SVCの送信は、非ランダムアクセスポイントスライスがシンプルタイムアグリゲーションパケット(STAP)で伝送されるように、リアルタイムトランスポートプロトコルを使用してパケット形式で行われ、各シンプルタイムアグリゲーションパケットは、ペイロードコンテンツスケーラビリティ情報(PACSI)ネットワークアブストラクションレイヤ(NAL)ユニットを含む。

Description

本発明は、一般に通信システムに、例えば、有線システム、および地上波放送、セルラ、ワイヤレスフィデリティ(Wi−Fi)、衛星などの無線システムに関する。
圧縮ビデオビットストリームが、無線ネットワークなど、誤りが発生しやすい通信チャネルを介して配信される場合、ビットストリームのある部分が、破損したり、または紛失したりすることがある。そのような誤りを起こしたビットストリームが受信機に到達し、ビデオデコーダによって復号された場合、再生品質に深刻な影響を受けることがあり得る。ソースの誤り耐性の符号化(source error resiliency coding)は、この問題に対処するために使用される技法である。
ビデオブロードキャスト/マルチキャストシステムでは、1つの圧縮ビデオビットストリームは通常、しばしばセッションと呼ばれる指定された期間内に、1グループのユーザに同時に配信される。ビデオコーディングの予測性のため、ビットストリームへのランダムアクセスは、ビットストリーム内の若干のランダムアクセスポイントにおいてのみ利用可能であり、その結果、正しい復号は、これらのランダムアクセスポイントからしか開始することができない。ランダムアクセスポイントは一般に、より低い圧縮効率を有するので、そのようなポイントは、ビットストリーム内に限られた数しか存在しない。結果として、ユーザは、自分の受信機をチャネルに同調させて、セッションに参加する場合、正しい復号を開始するために、受信ビットストリーム内の次の利用可能なランダムアクセスポイントを待たなければない。それが、ビデオコンテンツを再生するときの遅延を引き起こす。そのような遅延は、チャネル合わせの遅延(以下、チャネル合わせ遅延)(tune−in delay)と呼ばれ、システムのユーザエクスペリエンスに影響を与える重要な要因である。
ビデオ配信システムでは、いくつかの圧縮ビデオビットストリームが、しばしば共通の伝送媒体を共用してエンドユーザに配信される。各ビデオビットストリームは、番組チャネルに対応する。先のケースと同様に、ユーザは、1つのチャネルから別のチャネルに切り換える場合、復号を正しく開始するために、そのチャネルからの受信ビットストリーム内の次の利用可能なランダムアクセスポイントを待たなければならない。そのような遅延は、チャネル変更の遅延(以下、チャネル変更遅延)(channel−change delay)と呼ばれ、そのようなシステムにおけるユーザエクスペリエンスに影響を与える別の重要な要因である。
挿入されるランダムアクセスポイントの利点は、ビデオコーディングの観点から言えば、圧縮ビデオビットストリームの誤り耐性を改善することである。例えば、定期的にビットストリームに挿入されるランダムアクセスポイントは、デコーダをリセットし、誤り伝播を完全に停止させ、このことが、誤りに対するビットストリームの堅牢性を向上させる。
例えば、H.264/AVCビデオ圧縮規格(例えば、非特許文献1、非特許文献2参照)について考察すると、(切り換え可能ポイントとも呼ばれる)ランダムアクセスポイントは、IDR(即時デコーダリフレッシュ(Instantaneous Decoder Refresh))スライス、イントラ符号化マクロブロック(MB)(intra-coded macro block)、およびSI(スイッチングI(switching I))スライスを含む、符号化方法によって実施することができる。
IDRスライスに関して、IDRスライスは、イントラ符号化MBのみを含み、イントラ符号化MBは、どの先行スライスにも依存せず、正しい復号を行う。IDRスライスはまた、以降のスライスの復号が、そのIDRスライスより前のどのスライスからも独立となるように、デコーダの復号ピクチャバッファをリセットする。IDRスライスの後では、正しい復号が即座に利用可能であるので、IDRスライスは、即時ランダムアクセスポイントとも呼ばれる。対照的に、漸進的なランダムアクセス動作は、イントラ符号化MBに基づいて実現することができる。多くの連続する予測ピクチャについては、これらのピクチャを復号した後、後続のピクチャ内の各MBが、ピクチャのうちの1つに、イントラ符号化された位置を同じくする対応MB(intra-coded co-located counterpart)を有するように、イントラ符号化MBが、組織的に符号化される。したがって、ピクチャの復号は、ピクチャの組の前のいかなる他のスライスにも依存しない。同様に、SIスライスは、このタイプの特別に符号化されたスライスをビットストリーム内に埋め込むことによって、異なるビットストリーム間の切り換えを可能にする。残念なことに、H.264/AVCでは、IDRスライスまたはSIスライスは通常、他のタイプの圧縮ピクチャよりも大きいので、IDRスライスまたはSIスライスの一般的な不都合は、符号化効率の低下である。一般に、切り換えポイントを埋め込むためには、かなりの量のビットレートオーバヘッドを払わなければならない。
同様に、ランダムアクセスポイントは、スケーラブルビデオコーディング(SVC:Scalable Video Coding)でも使用される。SVCでは、依存表現(dependency representation)は、多くのレイヤ表現(layer representation)から成ることができ、アクセスユニット(access unit)は、1つのフレーム番号に対応するすべての依存表現から成る(例えば、非特許文献3および非特許文献4)。
ランダムアクセスポイントの埋め込みに関してSVCに共通する方法は、アクセスユニット全体を、IDRスライスを使用してコーディングすることである。特に、より高いレイヤ表現(より大きなdependency_id値を有するレイヤ表現)が、IDRピクチャで符号化される場合、すべてのより低いレイヤ表現(より小さなdependency_id値を有するレイヤ表現)も、IDRピクチャで符号化される。これは、より低いレイヤ表現がIDRピクチャでコーディングされる場合、より高いレイヤ表現は、それ自体がIDRピクチャで符号化されるとき、より優れたレイヤ間予測を潜在的に利用できるからである。一例が、図1に示されている。図1のSVC符号化された信号は、2つの依存表現を有し、各依存表現は、1つのレイヤ表現を有する。特に、ベースレイヤ(base layer)は、D=0に関連付けられ、エンハンスメントレイヤ(enhancement layer)は、D=1に関連付けられる(当技術分野において、「D」の値は「dependency_id」とも呼ばれる)。図1は、9つのアクセスユニットを示しており、アクセスユニットは、SVC信号のフレーム内で発生する。破線のボックス10によって示されるように、アクセスユニット1は、第1のレイヤ(D=1)のIDRスライスと、ベースレイヤ(D=0)のIDRスライスとを含む。後続のアクセスユニットは、2つの予測(P)スライスを含む。図1から、アクセスユニット1、5、9のみがIDRスライスを含むことが観察できる。そのため、これらのアクセスユニットでは、ランダムアクセスが発生することができる。しかし、H.264/AVCのケースと同様に、IDRスライスは通常、他のタイプの圧縮ピクチャよりも大きいので、IDRスライスを用いて符号化される各アクセスユニットは、SVCの符号化効率を低下させる。
ITU-T Recommendation H.264:"Advanced video coding for generic audiovisual services" ISO/IEC 14496-10 (2005):"Information Technology−Coding of audio−visual objects Part 10:Advanced Video Coding" Y−K.Wang,M.Hannuksela,S.Pateux,A.Eleftheriadis,and S.Wenger,"System and transport interface of SVC",IEEE Trans. Circuits and Systems for Video Technology,vol.17,no.9,Sept 2007,pp.1149−1163 H. Schwarz,D. Marpe and T. Wiegand,"Overview of the scalable video coding extension of the H.264/AVC standard",IEEE Trans. Circuits and Systems for Video Technology,vol.17,no.9,Sept 2007,pp.1103−1120 IETF AVT draft:"RTP Payload Format for SVC Video draft−ietf−avt−rtp−svc−13txt" ITU-T Recommendation H.264 Amendment 3:"Advanced video coding for generic audiovisual services:Scalable Video Coding"
スケーラブルビデオコーディング(SVC)を使用して、高速チャネル変更をサポートする場合、生成されるビットストリームは、チャネル変更のために使用されるベースレイヤと、通常のビデオストリームとして使用される1つまたは複数のエンハンスメントレイヤとを含むことが観察された。ベースレイヤとエンハンスメントレイヤは、同じチャネルに結び付けられ、チャネル変更期間中に一緒に使用されることが期待されるので、リアルタイムトランスポートプロトコル(RTP:Real-Time Transport Protocol)を使用するそのようなSVCビットストリームのトランスポートは、一般的なSVCビットストリームのトランスポートとは異なる考慮を必要とする。
本発明の原理によれば、ビデオ信号を送信するための方法は、スケーラブルビデオ符号化された(SVC)信号の第1のスケーラブルレイヤをチャネル変更レイヤとして選択するステップであって、第1のスケーラブルレイヤは、スケーラブルビデオ符号化された信号の第2のスケーラブルレイヤの関連付けられたdependency_id値よりも小さい関連付けられたdependency_id値を有する、ステップと、非ランダムアクセスポイントスライスがシンプルタイムアグリゲーションパケット(STAP:Simple Time Aggregation Packet)で伝送されるように、リアルタイムトランスポートプロトコル(RTP)を使用してパケット形式でスケーラブルビデオ符号化された信号を送信するステップであって、各シンプルタイムアグリゲーションパケットは、ペイロードコンテンツスケーラビリティ情報(PACSI:Payload Content Scalability Information)ネットワークアブストラクションレイヤ(NAL:Network Abstraction Layer)ユニットを含む、ステップとを含む。結果として、本発明は、メディアアウェアストリーム選択を実行するメディアアウェアネットワーク要素(MANE:Media Aware Network Element)に最小限の影響しか与えずに、SVCを使用する高速チャネル変更の伝送効率およびエクスペリエンスの質(QoE)を向上させることができる実用的なRTPパケット化方法を提供する。
本発明の例示的な実施形態では、SVC信号は、ベースレイヤと、エンハンスメントレイヤとを含み、ベースレイヤは、エンハンスメントレイヤよりも多くのランダムアクセスポイント、例えば、IDRスライスを有するように選択される。SVC信号の送信は、非ランダムアクセスポイントスライスがSTAPパケットで伝送されるように、RTPを使用してパケット形式で行われ、各STAPパケットは、PACSI NALユニットを含む。PACSI NALユニットは、3ビットのdependency_id「DID」フィールドを含み、DIDフィールドは、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値の最低値に設定される。加えて、PACSI NALユニットは、2ビットの予約ビット(RR)フィールドを含み、RRフィールドは、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値のうちで最高値のDID値に設定される。結果として、「DID」フィールド値を「RR」フィールド値と比較することによって、STAPパケット内のすべてのNALユニットが同じレイヤに属するか、それともSTAPパケット内のNALユニットが異なるレイヤに関係するかを迅速に決定することができる。
本発明の別の例示的な実施形態では、SVCエンコーダは、ベースレイヤとエンハンスメントレイヤとを含むSVC信号を提供し、ベースレイヤは、エンハンスメントレイヤよりも多くのランダムアクセスポイント、例えば、IDRスライスを有するように選択され、SVCエンコーダは、エンハンスメントレイヤがIDRスライスを有するようなアクセスユニットにおいて、ベースレイヤが非IDRスライスを有するかどうかを、符号化効率の関数として決定する。SVC信号の送信は、非ランダムアクセスポイントスライスがSTAPパケットで伝送されるように、RTPを使用してパケット形式で行われ、各STAPパケットは、PACSI NALユニットを含む。PACSI NALユニットは、3ビットのdependency_id「DID」フィールドを含み、DIDフィールドは、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値の最低値に設定される。加えて、PACSI NALユニットは、2ビットの予約ビット(RR)フィールドを含み、RRフィールドは、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値のうちで最高値のDID値に設定される。結果として、「DID」フィールド値を「RR」フィールド値と比較することによって、STAPパケット内のすべてのNALユニットが同じレイヤに属するか、それともSTAPパケット内のNALユニットが異なるレイヤに関係するかを迅速に決定することができる。
上記の点に鑑みて、また詳細な説明を読むことから明らかなように、他の実施形態および特徴も可能であり、それらは本発明の原理内に包含される。
即時デコーダリフレッシュ(IDR)スライスを有する従来技術のスケーラブルビデオ符号化された(SVC)信号を示す図である。 SVC符号化において使用するための例示的なフローチャートである。 例示的なSVC信号を示す図である。 本発明の原理によるSVC符号化において使用するための例示的なフローチャートである。 本発明の原理による装置の例示的な実施形態を示す図である。 本発明の原理による例示的なSVC信号を示す図である。 本発明の原理によるSVC符号化において使用するための別の例示的なフローチャートである。 本発明の原理による装置の別の例示的な実施形態を示す図である。 本発明の原理による別の例示的なフローチャートである。 本発明の原理による変更されたPACSI NALユニットを示す図である。 MANEに関連した本発明の原理を示す図である。 MANEに関連した本発明の原理を示す図である。
本発明の概念を除き、図に示される構成要素はよく知られており、詳細には説明されない。例えば、本発明の概念を除き、(直交周波数分割多重(OFDM:Orthogonal Frequency Division Multiplexing)または符号化直交周波数分割多重(COFDM:Coded Orthogonal Frequency Division Multiplexing)とも呼ばれる)離散マルチトーン(DMT:Discrete Multi tone)伝送には精通していることが前提とされ、それらについて本明細書では説明されない。また、テレビジョン放送、受信機、およびビデオ符号化には精通していることが前提とされ、それらについて本明細書では詳細に説明されない。例えば、本発明の概念を除き、NTSC(米国テレビジョン方式委員会(National Television Systems Committee))、PAL(Phase Alternation Line)、SECAM(順次式カラーメモリ(Sequential Couleur Avec Memoire))およびATSC(高度テレビジョン方式委員会(Advanced Television Systems Committee))(ATSC)、中国デジタルテレビジョンシステム(Chinese Digital Television System)(GB)20600−2006およびDVB−Hなど、テレビジョン規格のための現行の勧告および勧告案には精通していることが前提とされる。同様に、本発明の概念を除き、8レベル残留側波帯(8−VSB:eight-level vestigial sideband)、直交振幅変調(QAM:Quadrature Amplitude Modulation)などの他の伝送概念、ならびに無線周波数(RF)フロントエンド(低雑音ブロック、チューナ、ダウンコンバータなど)、復調器、相関器、リーク積分器、および平方器などの受信機コンポーネントが想定される。さらに、本発明の概念を除き、単方向トランスポート上でのファイル配信(FLUTE:File Delivery over Unidirectional Transport)プロトコル、非同期階層符号化(ALC:Asynchronous Layered Coding)プロトコル、インターネットプロトコル(IP)、およびインターネットプロトコルエンカプスレータ(IPE:Internet Protocol Encapsulator)には精通していることが前提とされ、それらについて本明細書では説明されない。同様に、本発明の概念を除き、トランスポートビットストリームを生成するための(ムービングピクチャエキスパートグループ(MPEG)−2システム規格(ISO/IEC 13818−1)および上述のSVCなどの)フォーマッティングおよび符号化方法はよく知られており、本明細書では説明されない。本発明の概念は、従来のプログラミング技法を使用して実施することができ、それらのプログラミング技法は、従来技法であるので、本明細書では説明されないことにも留意されたい。最後に、図における同じ番号は、同様の構成要素を表す。
先に述べたように、受信機が最初にオンになったとき、またはチャネル変更中もしくは同じチャネル内でサービスを変更するだけの場合であっても、受信機は、どのような受信データであれ、それを処理できるようになる前に、必要とされる初期化データを追加的に待たなければならないことがある。結果として、ユーザは、サービスまたは番組にアクセスできるようになる前に、追加的な長さの時間を待たなければならない。本明細書で説明するように、「チャネル変更」、「チャネル合わせ」、「サービスの変更」という用語は、そのすべてが新しい番組への切り換えを表すので、等価的である。
SVCでは、SVC信号は、多くの依存(空間)レイヤ(dependency (spatial) layer)を含むことができ、各依存レイヤは、同じdependency_id値を有する、SVC信号の1つまたは複数の時間および/または品質スケーラブルレイヤから成ることができる。ベースレイヤ(dependency_id=0)は、ビデオ信号の最低レベルの解像度を表す。他のレイヤ(dependency_id>0)は、ビデオ信号の解像度が増加したレイヤを表す。例えば、SVC信号が3つのレイヤを含む場合、ベースレイヤと、レイヤ1と、レイヤ2が存在する。各レイヤは、異なるdependency_id値に関連付けられる。受信機は、(a)ベースレイヤ、(b)ベースレイヤとレイヤ1、または(c)ベースレイヤとレイヤ1とレイヤ2だけを処理することができる。例えば、SVC信号は、ベース信号の解像度だけをサポートするデバイスによって受信することができ、そのため、このタイプのデバイスは、受信SVC信号の他の2つのレイヤを単に無視することができる。反対に、最も高い解像度をサポートするデバイスの場合、このタイプのデバイスは、受信SVC信号の3つすべてのレイヤを処理することができる。
SVCでは、IDRピクチャの符号化は、レイヤ毎に独立に行われる。そのため、本発明の原理によれば、ビデオ信号を送信するための方法は、スケーラブルビデオ符号化された(SVC)信号の第1のスケーラブルレイヤをチャネル変更レイヤとして選択するステップであって、第1のスケーラブルレイヤは、スケーラブルビデオ符号化された信号の第2のスケーラブルレイヤの関連付けられたdependency_id値よりも小さい関連付けられたdependency_id値を有しているステップと、スケーラブルビデオ符号化された信号の少なくとも一部について、第1のスケーラブルレイヤ内のランダムアクセスポイントおよび第2のスケーラブルレイヤ内のランダムアクセスポイントが、異なるアクセスユニット内で発生するように、スケーラブルビデオ符号化された信号を提供するために、ビデオ信号をスケーラブルビデオ符号化するステップと、スケーラブルビデオ符号化された信号を送信するステップとを含む。結果として、ビデオエンコーダは、圧縮ビデオビットストリーム内に追加的な切り換え可能ポイントを埋め込むことによって、受信機におけるチャネル合わせ遅延およびチャネル変更遅延を短縮することができ、さらに全体的なビットレートを低減することができる。
本発明の例示的な実施形態では、SVC信号は、ベースレイヤと、エンハンスメントレイヤとを含み、ベースレイヤは、エンハンスメントレイヤよりも多くのランダムアクセスポイント、例えば、IDRスライスを有するように選択され、エンハンスメントレイヤがIDRスライスを有するようなアクセスユニットでは、ベースレイヤは、非IDRスライスを有する。本発明の概念は、2つのレイヤに関連して説明されるが、そのようには限定されず、3つ以上のスケーラブルレイヤが存在しても良い。
図2には、本発明の概念を説明する前に、チャネル合わせ遅延およびチャネル変更遅延を短縮するための、スケーラブルビデオエンコーダにおいて使用するフローチャートが示されている。ステップ105において、スケーラブルビデオエンコーダは、ビデオ信号を、ベースレイヤと少なくとも1つの他のレイヤとを含むSVC信号に符号化する。特に、ステップ110において、スケーラブルビデオエンコーダは、IDRスライスが、結果のSVC信号の他のどのレイヤよりも高い頻度でベースレイヤに挿入されるように、ビデオ信号を符号化する。例えば、スケーラブルビデオエンコーダは、符号化パラメータに応答し、この符号化パラメータは、異なる空間レイヤにおいて異なるIDR間隔を指定することを除いて、既存の符号化パターンIBBPまたはIPPPと同様である。最後にステップ115において、SVC信号が送信される。
ここで図3を参照すると、図2のフローチャートのステップを実行するSVCエンコーダによって形成される例示的なSVC信号111が示されている。この例では、SVC信号111は、2つのレイヤ、ベースレイヤ(D=0)とエンハンスメントレイヤ(D=1)とを含む。図3から観察できるように、ベースレイヤは、アクセスユニット1、4、7、9内にIDRスライスを有し、エンハンスメントレイヤは、アクセスユニット1、9内だけにIDRスライスを有する。そのため、受信デバイスは、矢印301によって示される時刻TCにおいて、SVC信号111を伝送するチャネルに変更(または初めて同調)した場合、SVC信号111のベースレイヤの復号を開始して、解像度の低いビデオピクチャをユーザに提供できるようになる前に、矢印302によって表される時間TWだけ待ちさえすれば良い。したがって、受信機は、より多くのランダムアクセスポイントを有する、ベースレイヤビデオ符号化信号を即座に復号することによって、チャネル合わせ遅延およびチャネル変更遅延を短縮することができる。図3からさらに観察できるように、受信機は、エンハンスメントレイヤを復号して、解像度のより高いビデオピクチャをユーザに提供できるようになる前に、矢印303によって表される時間TDだけ待たなければならない。
両方のレイヤが同じIDR頻度を有する、図1に示された例と比較した場合、図2の方法は、同じ1組の機能改善を実現する能力を提供するが、ビットレートはより低く、限られた性能低下しかもたらさない。これは、ベースレイヤが、ビットストリームの全ビットレートのうちの僅かな部分しか占めない場合に特に当てはまる。例えば、ベースレイヤ(D=0)が共通中間フォーマット(CIF:Common Intermediate Format)(372×288)解像度、エンハンスメントレイヤ(D=1)が標準画質(SD:standard definition)(720×480)解像度である場合、ベースレイヤは、全ビットレートのうちの僅かなパーセンテージ(例えば、約25%)を占めるにすぎない。そのため、CIF解像度においてIDR頻度を増加させることによって、エンハンスメントレイヤだけまたは両方のレイヤにおいてIDR頻度を増加させる場合と比較して、ビットレートオーバヘッドははるかに小さくなる。残念なことに、IDRスライスは通常、他のタイプの圧縮ピクチャよりも大きいので、IDRスライスを用いて符号化された各アクセスユニットは、SVC符号化効率を依然として低下させる。
加えて、スケーラブルビデオコーディング(SVC)を使用して、高速チャネル変更をサポートする場合、生成されたビットストリームは、チャネル変更のために使用されるベースレイヤと、通常のビデオストリームとして使用される1つまたは複数のエンハンスメントレイヤとを含むことが観察された。ベースレイヤとエンハンスメントレイヤは、同じチャネルに結び付けられ、チャネル変更期間中に一緒に使用されることが期待されるので、リアルタイムトランスポートプロトコル(RTP)を使用するそのようなSVCビットストリームのトランスポートは、一般的なSVCビットストリームのトランスポートとは異なる考慮を必要とする。
SVCエンコーダのビデオコーディングレイヤ(VCL:Video Coding Layer)は、ネットワークアブストラクションレイヤ(NAL)ユニット内に保存される符号化情報を生成する。SVCビットストリームが、リアルタイムトランスポートプロトコル(RTP)/ユーザデータグラムプロトコル(UDP)/インターネットプロトコル(IP)プロトコルスタックを利用するネットワークを介して送信される場合、ビットストリーム内のNALユニットは、IETF AVTドラフト(非特許文献5)で説明されているようなSVCパケット化に従って、リアルタイムトランスポートプロトコル(RTP)パケットにパケット化されなければならない。
上述のIETF AVTドラフトは、単一セッション/非インタリーブモードでSVC符号化されたビデオストリームを送信するために使用できる、多くのNALタイプを定義する。1つのNALタイプは、シングルNALユニット(SNU:Single NAL unit)である。SNUは、RTPパケット内に、1つのSVC NALユニットだけをロードすることができる。別のNALタイプは、シンプルタイムアグリゲーションパケット(STAP−A)である。(本明細書では単にSTAPパケットとも呼ばれる)STAP−Aは、1つのRTPパケット内に、対応する復号順序と同じ順序で、同じ提示時刻(presentation time)インスタンスを有する(または等価的に同じアクセスユニットに属する)複数のSVC NALユニットをロードすることができる。また別のNALタイプは、非インタリーブのマルチタイムアグリゲーションパケット(NI−MTAP:Non-interleaved Multi-Time Aggregation Packet)である。NI−MTAPは、1つのRTPパケット内に、対応する復号順序と同じ順序で、異なる提示時刻インスタンスを有する(または等価的に異なるアクセスユニットに属する)複数のSVC NALユニットをロードすることができる。分割ユニット−A(FU−A:Fragmentation Unit-A)NALタイプは、過度に大きなNALユニットを複数のRTPパケットに分割するために使用される。最後に、ペイロードコンテンツスケーラビリティ情報(PACSI)NALタイプが存在する。PACSIは、パケット化を容易にし、スケーラビリティ情報と、アグリゲーションパケットのペイロード内の残りのすべてのNALユニットに共通する他の特性とを示す。しかしこれまでのところ、SVCを使用する高速チャネル変更に適したパケット化フォーマットを提案する標準的な方法または規則は、存在していない。
上記の点に鑑みて、既存のマルチキャストベースの高速チャネル変更ソリューションに関して、多くの観察が行われた。第1に、既存のマルチキャストベースの高速チャネル変更ソリューションは、しばしば2つの別個のRTPセッションを使用し、一方は、通常のビデオストリームを送信するためのものであり、他方は、チャネル変更ストリームを送信するためのものである。チャネル変更が発生した場合、エンドユーザは、両方のマルチキャストRTPセッションについて、IGMP参加/離脱要求を送信する。
しかし、高速チャネル変更のためにSVCが使用される場合、チャネル変更および通常のビデオストリームの両方のために、同じSSRC(同期ソース(synchronization source))、タイムスタンプ、およびシーケンス番号空間を有する単一のマルチキャストRTPセッションを使用することを発明者らは提案する。この手法は、必要とされるインターネットプロトコル(IP)アドレスの数を半分に減少させるばかりでなく、チャネル変更プロセス中に交換する必要があるメッセージの数も減少させる。他の利点としては、例えば、簡単なファイアウォール構成、復号順序回復プロセスにおけるより低い複雑さなども含むことができる。
加えて、図2のフローチャートで示された上述のSVC符号化方法において、MTAPパケット化が使用される場合、MTAPパケット化は、1つのRTPパケット内に、対応する復号順序と同じ順序で、異なる提示時刻インスタンスを有する(または等価的に異なるアクセスユニットに属する)ことができるので、最初のフル解像度ピクチャの復号を遅延させることがあり得ることが観察された。したがって、復号を開始できるようになる前に、複数のMTAPパケットを受信しなければならないことがある。結果として、MTAPパケット化は、より多くのランダムアクセスポイントがベースストリーム内に挿入されたとしても、チャネル合わせ遅延を増加させる。対照的に、非IDRスライスを伝送するために、STAPパケット化を使用する必要が常にある場合、チャネル合わせ遅延を短縮させることができることが観察された。
特に、STAPパケットは、1つのRTPパケット内に、対応する復号順序と同じ順序で、同じ提示時刻インスタンスを有する(または等価的に同じアクセスユニットに属する)非IDRスライスを伝送する。結果として、単一のSTAPパケットが受信されると直ちに、復号を開始することができる。したがって、STAP NALユニットを使用して非IDRスライスをパケット化することは、チャネル合わせ遅延を短縮するのに役立つ。加えて、STAPを採用して、1つのアクセスユニットに属するが、異なるレイヤに属するレイヤ表現をパケット化することによって、元の復号順序を容易に維持することができる。
メディアアウェアネットワーク要素(MANE)は、カプセル化されたオーディオ/ビデオコンテンツに対処するために、RTPヘッダまたはペイロードを解析可能でなければならないことも観察された。MANEの一例は、IPの最上部でNALヘッダ、RTP/RTCPの処理を実行し、必要であればあるタイプのNALユニットを複製または変換できる、メディアゲートウェイである。したがって、ペイロード/ヘッダ情報を使用して、SVC符号化ビデオストリームを伝送するRTPセッション内でレイヤを識別することによって、MANEは、複数のRTPストリームを集約し、着信RTPパケットストリームからのメディアアウェアストリームの間引き(media-aware stream thinning)(パケットまたは部分の選択的排除)を実行できることが観察された。特に、各STAPパケット内に、変更されたPACSI NALユットが含まれる場合、MANEは、おそらくはNALヘッダをさらにRTPパケットに解析することなく、階層化および依存性などの必要な情報を抽出することができる。
したがって、本発明の原理によれば、ビデオ信号を送信するための方法は、スケーラブルビデオ符号化された(SVC)信号の第1のスケーラブルレイヤをチャネル変更レイヤとして選択するステップであって、第1のスケーラブルレイヤが、スケーラブルビデオ符号化された信号の第2のスケーラブルレイヤの関連付けられたdependency_id値よりも小さい関連付けられたdependency_id値を有しているステップと、非ランダムアクセスポイントスライスがシンプルタイムアグリゲーションパケット(STAP)で伝送されるように、リアルタイムトランスポートプロトコル(RTP)を使用してパケット形式でスケーラブルビデオ符号化された信号を送信するステップであって、各シンプルタイムアグリゲーションパケットが、ペイロードコンテンツスケーラビリティ情報(PACSI)ネットワークアブストラクションレイヤ(NAL)ユニットを含んでいるステップとを含む。結果として、本発明は、メディアアウェアストリーム選択を実行するメディアアウェアネットワーク要素(MANE)に最小限の影響しか与えずに、SVCを使用する高速チャネル変更の伝送効率およびエクスペリエンスの質(QoE)を向上させることができる実用的なRTPパケット化方法を提供する。
図4は、本発明の原理による例示的なフローチャートを示している。図5にも簡単に注意を払うと、図5は、本発明の原理による、ビデオ信号を符号化するための例示的な装置200を示している。本発明の概念に関係するような部分だけが示されている。装置200は、プロセッサベースのシステムであり、図5において破線ボックスの形態で示されるプロセッサ240およびメモリ245によって表されるような、1つまたは複数のプロセッサと、関連付けられたメモリとを含む。これに関連して、コンピュータプログラムまたはソフトウェアが、プロセッサ240による実行のためにメモリ245内に保存され、例えば、SVCエンコーダ205を実施する。プロセッサ240は、1つまたは複数のストアドプログラム制御プロセッサを表し、これらは、送信機機能に専用される必要はなく、例えば、プロセッサ240は、送信機のための他の機能を制御することもできる。メモリ245は、例えば、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)などの、任意の記憶デバイスを表し、送信機の内部および/または外部にあってよく、必要に応じて揮発性および/または不揮発性である。
装置200は、SVCエンコーダ205と、変調器210とを含む。ビデオ信号204は、SVCエンコーダ205に与えられる。SVCエンコーダ205は、本発明の原理に従ってビデオ信号204を符号化し、SVC信号206を変調器210に提供する。変調器210は、アップコンバータおよびアンテナ(ともに図5には図示せず)を介して送信を行うために、変調信号211を提供する。
ここで図4を参照すると、ステップ155において、図5のプロセッサ240は、ビデオ信号204を、ベースレイヤとエンハンスメントレイヤとを含むSVC信号206に符号化する。特に、ステップ160において、プロセッサ240は、IDRスライスが、SVC信号206のエンハンスメントレイヤよりも高い頻度でベースレイヤに挿入され、加えて、2つのIDRスライスが同じアクセスユニット内で発生した場合には、ベースレイヤが非IDRスライスを用いて符号化されるように、(例えば、図5において破線形式で示される信号203を介して)図5のSVCエンコーダ205を制御する。特に、ちょうど符号化パターンIBBPまたはIPPPを指定するように、異なる空間レイヤにおいて異なるIDR間隔を指定する符号化パラメータが、SVCエンコーダ205に適用される。ステップ165において、図5の変調器210は、非IDRスライスがSTAPパケットで伝送されるように、RTPを使用してパケット形式でSVC信号を送信し、各STAPパケットは、(以下で説明される)変更されたPACSI NALユニットを含む。符号化されたIDRピクチャは、典型的なネットワークのMTU(最大転送単位(Maximum Transmission Unit))バイト(例えば、イーサネット(登録商標)の場合、1500バイト)よりもしばしば大きくなるので、IDRスライスは、FUタイプのRTPパケットにパケット化される可能性がきわめて高いことに留意されたい。パケット化機能は、変調器で実行されるものとして説明されたが、本発明の概念は、そのようには限定されず、装置200によって表される送信機の他の部分において実行することもできることに留意されたい。
図10は、本発明の原理に従って変更された例示的なPACSI NALユニット構造を示している。PACSI NALユニットは、3ビットのdependency_id「DID」フィールド(498)を含み、DIDフィールドは、図4のステップ165において、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値の最低値に設定される。加えて、PACSI NALユニットは、2ビットの予約ビット(RR)フィールド(499)を含み、RRフィールドは、本発明の原理に従って、図4のステップ165において、STAPパケットのペイロード内の残りのすべてのNALユニットのDID値のうちで最高値のDID値に設定される。結果として、「DID」フィールド値を「RR」フィールド値と比較することによって、STAPパケット内のすべてのNALユニットが同じレイヤに属するか、それともSTAPパケット内のNALユニットが異なるレイヤに関係するかを迅速に決定することができる。したがって、例えば、これら2つのフィールド内の値を検査することによって、MANEは、アグリゲーションパケット内のすべてのNALユニットが同じレイヤに属するかどうかを迅速に決定し、全アグリゲーションパケットを全体として転送するか、それとも廃棄するかを決定することができる。しかし、RRフィールド値がDIDフィールド値と異なる場合、これは、2つ以上のスケーラブルレイヤがSTAPペイロードに集約されていることを表す。結果として、MANEは、PACSI NALユニットに後続する各NALユニットヘッダおよびNALユニットサイズをさらに解析して、ペイロードのどの部分を転送でき、またはどの部分を廃棄できるかを決定する必要がある。
図6をここで参照すると、図4のフローチャートのステップを実行するSVCエンコーダによって形成される例示的なSVC信号206が示されている。この例では、SVC信号206は、2つのレイヤ、ベースレイヤ(D=0)とエンハンスメントレイヤ(D=1)とを含む。図6から観察できるように、ベースレイヤは、アクセスユニット4、7内にIDRスライスを有し、エンハンスメントレイヤは、アクセスユニット1、9内にIDRスライスを有する。本発明の原理によれば、アクセスユニット1、9内では、ベースレイヤは、非IDRスライスを用いて符号化される。SVCエンコーダは、エンハンスメントレイヤよりも多くのランダムアクセスポイントを有するベースレイヤを提供したが(例えば、エンハンスメントレイヤのアクセスユニット9におけるIDRスライスの出現前に、ベースレイヤのアクセスユニット4、7において2つのIDRスライスが存在する)、本発明の概念は、そのようには限定されないことを観察されたい。例えば、SVC符号化は、チャネル変更レイヤ内のIDRスライスが、より高いdependency_id値を有するレイヤ内のIDRスライスとは異なる時刻だけに発生するように、実行することができる。これは、実質的に、例えば、ベースレイヤとエンハンスメントレイヤ内のIDRスライスの数が同じになる結果をもたらすことができる。
図6の説明をさらに続けると、受信デバイスは、矢印401によって示される時刻TCにおいて、SVC信号206を伝送するチャネルに変更(または初めて同調)した場合、SVC信号206のベースレイヤの復号を開始して、解像度の低いビデオピクチャをユーザに提供できるようになる前に、矢印402によって表される時間TWだけ待ちさえすれば良い。したがって、受信機は、より多くのランダムアクセスポイントを有する、ベースレイヤビデオ符号化信号を即座に復号することによって、チャネル合わせ遅延およびチャネル変更遅延を短縮することができる。図6からさらに観察できるように、矢印409によって表される時刻TFにおいて、チャネル変更が発生した場合、受信機は、エンハンスメントレイヤを復号して、解像度のより高いビデオピクチャをユーザに提供できるようになる前に、矢印403によって表される時間TGだけ待ちさえすれば良い。
ここで図7を参照すると、本発明の別の例示的な実施形態が示されている。図7のフローチャートは、ベースレイヤとエンハンスメントレイヤとを含むSVC信号を提供するSVCエンコーダ(例えば、図5のSVCエンコーダ205)であって、ベースレイヤがエンハンスメントレイヤよりも多くのランダムアクセスポイント、例えば、IDRスライスを有するように選択される、SVCエンコーダを示しており、SVCエンコーダは、エンハンスメントレイヤがIDRスライスを有するようなアクセスユニットにおいて、ベースレイヤが非IDRスライスを有するかどうかを、符号化効率の関数として決定する。結果として、結果のSVC符号化信号は、SVC符号化信号の少なくとも一部に、より下位のレイヤが非IDRスライスを用いて符号化され、より上位のレイヤがIDRスライスを用いて符号化されるアクセスユニットを有することもあり、または有さないこともある。ステップ505において、スケーラブルビデオエンコーダは、ビデオ信号を、ベースレイヤと少なくとも1つの他のレイヤとを含むSVC信号に符号化する。特に、ステップ510において、スケーラブルビデオエンコーダは、IDRスライスが、結果のSVC信号の他のどのレイヤよりも高い頻度でベースレイヤに挿入されるように、ビデオ信号を符号化する。例えば、スケーラブルビデオエンコーダは、符号化パラメータに応答し、この符号化パラメータは、異なる空間レイヤにおいて異なるIDR間隔を指定することを除いて、既存のコーディングパターンIBBPまたはIPPPと同様である。ステップ520において、SVCエンコーダは、結果の符号化効率をチェックし、例えば、アクセスユニット全体をIDRスライスとして符号化するためのビットレートが、ベースレイヤを非IDRスライスとして、またより上位のレイヤをIDRスライスとして符号化するビットレートよりも高いかどうかをチェックする。ビットレートがより高くない場合、ステップ530において、SVC信号が送信される。符号化されたIDRピクチャは、MTUよりもしばしば大きくなるので、IDRスライスは、FUタイプのRTPパケットにパケット化される可能性がきわめて高いことにやはり留意されたい。しかし、ビットレートがより高い場合、ステップ525において、SVCエンコーダは、2つのIDRスライスが同じアクセスユニット内で発生するようなアクセスユニットにおいて、ベースレイヤを非IDRスライスで置き換えて、符号化効率を高め、その後、SVC信号は、ステップ530において、非IDRスライスがSTAPパケットで伝送されるように、RTPを使用してパケット形式で送信され、各STAPパケットは、先に説明されたように適切に設定されたDIDフィールドとRRフィールドとを有する、変更されたPACSI NALユニットを含む。
図2、図4および図7のフローチャートは、装置200によるより高いレイヤの処理を表していることに留意されたい。例えば、ビデオ信号の一部がSVC符号化されている間に、SVC符号化信号の一部を、同時に送信することができる。また、ベースレイヤと単一のエンハンスメントレイヤに関連して説明されたが、図4および図7のフローチャートは、2つ以上の上位レイヤに容易に拡張可能である。
ここで図8を参照すると、本発明の原理に従ってSVC信号を受信するための例示的な装置が示されている。本発明の概念に関連するような部分だけが示されている。装置350は、受信信号311によって表されるような、本発明の原理によるSVC信号を伝送する信号を受信する(例えば、これは、図5の装置200によって送信された信号の受信バージョンである)。装置350は、例えば、セルラフォン、モバイルTV、セットトップボックス、デジタルTV(DTV)などを表す。装置350は、受信機355と、プロセッサ360と、メモリ365とを含む。そのため、装置350は、プロセッサベースのシステムである。受信機355は、SVC信号を伝送するチャネルに同調するためのフロントエンドおよび復調器を表す。受信機355は、信号311を受信し、信号311から信号356を回復し、信号356は、プロセッサ360によって処理され、すなわち、プロセッサ360は、SVC復号を実行する。例えば、本発明の原理によるチャネル切り換えおよびチャネル合わせのための、(以下で説明される)図9に示されるフローチャートによれば、プロセッサ360は、復号されたビデオをパス366を介してメモリ365に提供する。復号されたビデオは、ディスプレイ(図示せず)に適用するために、メモリ365内に保存され、ディスプレイは、装置350の一部とすること、または装置350とは別個とすることができる。
図9をここで参照すると、装置350において使用するための、本発明の原理による例示的なフローチャートが示されている。この例では、受信SVC信号は、ベースレイヤと、エンハンスメントレイヤ(上位レイヤ)とを含み、ベースレイヤのdependency_id値は、エンハンスメントレイヤのdependency_id値よりも小さい。チャネル切り換えまたはチャネル合わせのとき、プロセッサ360は、最初に対象とする依存レイヤ、例えば、指定されたチャネル変更レイヤに復号を設定する。この例では、これは、ステップ405において、受信SVC信号のベースレイヤによって表される。しかし、本発明の概念は、そのようには限定されず、他の依存レイヤを「最初に対象とするレイヤ」として指定することもできる。プロセッサ360は、ステップ410において、(当技術分野において、受信SVCネットワークアブストラクションレイヤ(NAL)ユニットとも呼ばれる)アクセスユニットを受け取り、ステップ415において、受け取ったアクセスユニットの上位レイヤがIDRスライスであるかどうかをチェックする。IDRスライスではない場合、プロセッサ360は、ステップ425において、受け取ったアクセスユニットのベースレイヤ内にIDRスライスが存在するかどうかをチェックする。ベースレイヤ内にIDRスライスが存在しない場合、プロセッサ360は、次のアクセスユニットを受け取るために、ステップ410に戻る。しかし、ステップ415において、上位レイヤ内にIDRスライスが存在する場合、プロセッサ360は、そのSVCターゲット表現レイヤをエンハンスメントレイヤに設定し、ステップ420において、エンハンスメントレイヤから最初にIDRピクチャを受け取ったときに、例えば、通常のビデオストリームの復号を開始する。
ステップ425に戻ると、受け取ったベースレイヤがIDRスライスである場合、プロセッサ360は、ステップ430において、低い解像度ながらビデオ信号を提供するために、SVCベースレイヤの復号を開始する。その後、ステップ435において、プロセッサ360は、アクセスユニットを受け取り、ステップ440において、受け取ったアクセスユニットの上位レイヤがIDRスライスであるかどうかをチェックする。IDRスライスではない場合、プロセッサ360は、次のアクセスユニットを受け取るために、ステップ435に戻る。しかし、受け取ったアクセスユニットの上位レイヤがIDRスライスである場合、プロセッサ360は、ステップ445において、より高い解像度でビデオ信号を提供するために、SVC上位レイヤの復号を開始する。
図9のフローチャートの概要は、言い換えると以下の通りである。依存レイヤにおいて、現在の復号レイヤの値よりも大きなdependency_idの値を有するIDRスライスを検出した場合、受信機は、検出されたIDRスライスを用いて、その依存レイヤにおいて符号化されたビデオを復号する。そうでない場合、受信機は、現在の依存レイヤを復号し続ける。上で説明したように、ベースレイヤのIDRを用いなくても、エンハンスメントレイヤのIDRだけで、そのエンハンスメントレイヤの復号を開始するには十分である。
図9のフローチャートは、装置350によるより高いレイヤの処理を表していることに留意されたい。例えば、ステップ430において、ベースレイヤの復号が開始すると、プロセッサ360は、これを継続するばかりでなく、ステップ435、450において、IDRスライスに関して上位レイヤのチェックも行う。最後に、ベースレイヤと単一のエンハンスメントレイヤに関連して説明されたが、図9のフローチャートは、2つ以上の上位レイヤに容易に拡張可能である。
上で述べたように、本発明の原理によれば、RTP(SVC符号化)パケットストリームを処理する受信機は、受信STAPパケット内のすべてのNALユニットが同じレイヤに属するか、それともSTAPペイロード内で2つ以上のレイヤが伝送されているかを迅速に決定することができ、結果として、適切な処理を実行する。これが、図11および図12においてさらに説明され、図11においては、受信機は、MANEによって示されるが、本発明の概念は、そのようには限定されない。MANE 700は、プロセッサベースのシステムであり、図11において破線ボックスの形態で示されるプロセッサ740およびメモリ745によって表されるような、1つまたは複数のプロセッサと、関連するメモリとを含む。これに関連して、コンピュータプログラムまたはソフトウェアが、プロセッサ740による実行のためにメモリ745内に保存される。プロセッサ740は、1つまたは複数のストアドプログラム制御プロセッサを表す。メモリ745は、例えば、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)などの、任意の記憶デバイスを表し、送信機の内部および/または外部にあってよく、必要に応じて揮発性および/または不揮発性である。MANE 700は、RTP(SVC符号化)パケットストリーム699を受信し、必要な処理を実行し、RTP(SVC符号化)パケットストリーム701を他のネットワーク要素または受信デバイスに提供する。
図12をここで参照すると、受信機、例えば、図11のMANE 700において使用するための例示的なフローチャートが示されている。ステップ705において、MANE 700は、RTP(SVC符号化)パケットストリームを受信する。ステップ710において、MANE 700は、各受信STAPパケットのPACSI NALユニット内の個々のDIDフィールドとRRフィールドの値を比較する。個々のDID値とRR値が同じである場合、MANE 700は、受信STAPパケットをパケットベースで処理する。例えば、ネットワーク輻輳が存在する場合、パケット全体をドロップする。他方、個々のDID値とRR値が異なる場合、MANE 700は、受信STAPパケットをNALユニットベースで処理する。例えば、ネットワーク輻輳が存在する場合、エンハンスメントレイヤをドロップすることができる。したがって、本発明の原理によれば、MANE 700は、後続の集約されたNALユニット自体を調べる代わりに、DIDフィールドとRRフィールドの値を比較することによって、スケーラビリティ情報を決定する。結果として、MANE 700は、受信RTP(SVC符号化)ストリーム699をより効率的に処理することができ、RTP(SVC符号化)ストリーム701を形成する際に、カプセル化されたNALユニットを転送、処理、または廃棄することができる。
言い換えると、SVCストリームが、低解像度および高解像度のスケーラブルレイヤをともに含む場合、チャネル変更および通常ストリームのための個々のNALユニットは、それらのNALヘッダ内で異なるDID値を使用する。これらのNALユニットが単一のRTPパケットに集約された場合、PACSI NALユニット内のDIDフィールドおよびRRフィールドは、本発明の原理に従って適切に設定される。しかし、DID値自体を見た場合、MANEは、以降のNALユニットが1つのスケーラブルレイヤからのものであるかどうかを見分けることができない。そのため、MANEは、より低い解像度のスケーラブルレイヤだけをセルフォンユーザに転送する必要がある場合でも、転送の前に、残りの各NALユニットを解析しなければならない。しかし、本発明の原理に従って、PACSI NALユニットのRRフィールドを使用することによって、MANEは、残りの各NALユニットを解析する必要なしに、受信STAPパケットの残りのすべてのNALユニットが同じスケーラブルレイヤに属するかどうかを迅速に知ることができ、例えば、それがより低い解像度のスケーラブルレイヤに属する場合は、STAPパケットを転送することができ、または属さない場合は、STAPパケットを廃棄することができる。
上で説明したように、本発明の原理によれば、高速チャネル変更のために、MPEGスケーラブルビデオコーディング(SVC)(例えば、非特許文献6)が使用される場合、ビットストリーム符号化パターンは、全体的なビットレートを低減させる。結果として、SVC圧縮ビデオストリームの全体的なビットレートは、高速チャネル変更の性能に影響を与えることなく、低減させることができる。加えて、本発明の原理によれば、STAPパケット化を使用するRTPパケット化の方法は、伝送効率を改善し、全体的なチャネル変更のエクスペリエンスの質(QoE)を改善する。最後に、本発明の原理によれば、MANE(メディアアウェアネットワーク要素)によって、SVCレイヤを抽出する際の柔軟性を保証するために、PACSIヘッダ情報が変更される。本発明の概念は、2レイヤ空間スケーラブルSVCビットストリームに関連して説明された。しかしながら、本発明の概念はそのようには限定されず、複数の空間スケーラブルレイヤばかりでなく、SVC規格において規定された時間および品質PSNR(信号対雑音比)スケーラビリティにも適用できることに留意されたい。
上記の点に鑑みると、上述の説明は本発明の原理を示しているに過ぎない。したがって、本明細書で明示的に説明されてはいないが、本発明の原理を具現しその主旨および範囲内にある多くの代替的な構成を、当業者が考案できることが理解されよう。例えば、機能的要素が個々別々である状況において説明されたが、これらの機能的要素は、1つまたは複数の集積回路(IC)内に具現することができる。同様に、別々の要素として示されているが、要素のいずれかまたはすべては、例えば図4および図8などに示されたステップの1つまたは複数に例えば対応する関連するソフトウェアを実行する、ストアドプログラム制御プロセッサ、例えば、デジタル信号プロセッサにおいて、実施することができる。さらに、本発明の原理は、他のタイプの通信システム、例えば、衛星、ワイヤレスフィデリティ(Wi−Fi)、セルラなどにも適用可能である。実際、本発明の概念は、固定受信機または移動受信機にも適用可能である。したがって、添付の特許請求の範囲によって確定される本発明の主旨および範囲から逸脱することなく、例示的な実施形態に多くの変更を施すことができ、また他の構成を考案することができることを理解されたい。

Claims (16)

  1. ビデオ信号を送信する方法であって、
    スケーラブルビデオ符号化された信号の第1のスケーラブルレイヤをチャネル変更レイヤとして選択するステップであって、前記第1のスケーラブルレイヤは、前記スケーラブルビデオ符号化された信号の第2のスケーラブルレイヤの関連付けられたdependency_id値よりも小さい関連付けられたdependency_id値を有しているステップと、
    非ランダムアクセスポイントスライスがシンプルタイムアグリゲーションパケットで伝送されるように、リアルタイムトランスポートプロトコルを使用してパケット形式で前記スケーラブルビデオ符号化された信号を送信するステップであって、各シンプルタイムアグリゲーションパケットは、ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットを含んでいるステップと
    を備えることを特徴とする方法。
  2. スケーラブルビデオ符号化するステップが、
    前記第1のスケーラブルレイヤ内のランダムアクセスポイントおよび前記第2のスケーラブルレイヤ内のランダムアクセスポイントが、符号化効率の関数として、異なるアクセスユニット内で発生するように、前記ビデオ信号を符号化することを決定するステップ
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記スケーラブルビデオ符号化するステップは、前記第1のスケーラブルレイヤにおいて、前記第2のスケーラブルレイヤよりも多くのランダムアクセスポイントを提供することを特徴とする請求項1に記載の方法。
  4. 前記第1のスケーラブルレイヤは、前記ビデオ符号化された信号のベースレイヤであることを特徴とする請求項1に記載の方法。
  5. 前記ビデオ符号化された信号は、3つ以上のスケーラブルレイヤを含むことを特徴とする請求項1に記載の方法。
  6. ランダムアクセスポイントは、即時デコーダリフレッシュスライスであることを特徴とする請求項1に記載の方法。
  7. 前記送信するステップは、
    それぞれのシンプルタイムアグリゲーションパケットにおいて、前記ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットのDIDフィールドを、残りのネットワークアブストラクションレイヤユニットの前記dependency_id値の最低値に設定するステップと、
    それぞれのシンプルタイムアグリゲーションパケットにおいて、前記ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットのRRフィールドを、前記残りのネットワークアブストラクションレイヤユニットの前記dependency_id値の最高値に設定するステップと
    を含むことを特徴とする請求項1に記載の方法。
  8. 受信機において使用する方法であって、
    シンプルタイムアグリゲーションパケットを含むリアルタイムトランスポートプロトコルスケーラブルビデオ符号化パケットストリームを受信するステップであって、各シンプルタイムアグリゲーションパケットは、ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットを有しているステップと、
    受信したペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットのDIDフィールドと、RRフィールド内で伝送された値を比較するステップと、
    前記DIDフィールドと前記RRフィールドの前記値が同じである場合、それぞれのSTAPパケットをパケットベースで処理するステップと、
    前記DIDフィールドと前記RRフィールドの前記値が異なる場合、前記それぞれのSTAPパケットのそれぞれのNALユニットを処理するステップと
    を備えることを特徴とする方法。
  9. 前記受信機は、メディアアウェアネットワーク要素であることを特徴とする請求項8に記載の方法。
  10. 第1のスケーラブルレイヤおよび第2のスケーラブルレイヤを含むビデオ符号化信号を提供するスケーラブルビデオエンコーダであって、前記第1のスケーラブルレイヤは、前記第2のスケーラブルレイヤの関連付けられたdependency_id値よりも小さい関連付けられたdependency_id値を有し、前記ビデオ符号化信号の少なくとも一部について、前記第1のスケーラブルレイヤ内のランダムアクセスポイントおよび前記第2のスケーラブルレイヤ内のランダムアクセスポイントは、異なるアクセスユニット内で発生する、スケーラブルビデオエンコーダと、
    前記ビデオ符号化された信号を送信する変調器と
    を備え、
    前記送信されたビデオ符号化信号は、非ランダムアクセスポイントスライスがシンプルタイムアグリゲーションパケットで伝送されるように、リアルタイムトランスポートプロトコルを使用してパケット形式で伝送され、各シンプルタイムアグリゲーションパケットは、ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットを含む
    ことを特徴とする装置。
  11. 前記スケーラブルビデオエンコーダは、前記第1のスケーラブルレイヤ内のランダムアクセスポイントおよび前記第2のスケーラブルレイヤ内のランダムアクセスポイントが、符号化効率の関数として、異なるアクセスユニット内で発生するように、前記ビデオ信号を符号化することを特徴とする請求項10に記載の装置。
  12. 前記スケーラブルビデオエンコーダは、前記第1のスケーラブルレイヤにおいて、前記第2のスケーラブルレイヤよりも多くのランダムアクセスポイントを提供することを特徴とする請求項10に記載の装置。
  13. 前記第1のスケーラブルレイヤは、前記ビデオ符号化信号のベースレイヤであることを特徴とする請求項10に記載の装置。
  14. 前記ビデオ符号化信号は、3つ以上のスケーラブルレイヤを含むことを特徴とする請求項10に記載の装置。
  15. ランダムアクセスポイントは、即時デコーダリフレッシュスライスであることを特徴とする請求項10に記載の装置。
  16. それぞれのシンプルタイムアグリゲーションパケットにおいて、前記ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットのDIDフィールドは、残りのネットワークアブストラクションレイヤユニットの前記dependency_id値の最低値に設定され、それぞれのシンプルタイムアグリゲーションパケットにおいて、前記ペイロードコンテンツスケーラビリティ情報ネットワークアブストラクションレイヤユニットのRRフィールドは、前記残りのネットワークアブストラクションレイヤユニットの前記dependency_id値の最高値に設定されることを特徴とする請求項10に記載の装置。
JP2011521086A 2008-07-26 2009-01-29 スケーラブルビデオコーディング(svc)を使用する高速チャネル変更アプリケーションのためのリアルタイムトランスポートプロトコル(rtp)パケット化方法 Expired - Fee Related JP5155449B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8390908P 2008-07-26 2008-07-26
US61/083,909 2008-07-26
PCT/US2009/000574 WO2010014123A1 (en) 2008-07-26 2009-01-29 A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc)

Publications (3)

Publication Number Publication Date
JP2011529321A true JP2011529321A (ja) 2011-12-01
JP2011529321A5 JP2011529321A5 (ja) 2012-02-16
JP5155449B2 JP5155449B2 (ja) 2013-03-06

Family

ID=41168539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011521086A Expired - Fee Related JP5155449B2 (ja) 2008-07-26 2009-01-29 スケーラブルビデオコーディング(svc)を使用する高速チャネル変更アプリケーションのためのリアルタイムトランスポートプロトコル(rtp)パケット化方法

Country Status (7)

Country Link
US (1) US8582644B2 (ja)
EP (1) EP2304955B1 (ja)
JP (1) JP5155449B2 (ja)
KR (1) KR101635235B1 (ja)
CN (1) CN102106156B (ja)
BR (1) BRPI0915958A2 (ja)
WO (1) WO2010014123A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016519509A (ja) * 2013-04-05 2016-06-30 クゥアルコム・インコーポレイテッドQualcomm Incorporated Irapアクセスユニットおよびビットストリーム切替えおよびスプライシング
US10003815B2 (en) 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
JP2020031447A (ja) * 2013-06-18 2020-02-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置および受信装置

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8289370B2 (en) 2005-07-20 2012-10-16 Vidyo, Inc. System and method for scalable and low-delay videoconferencing using scalable video coding
WO2007058470A1 (en) * 2005-11-15 2007-05-24 Electronics And Telecommunications Research Institute A method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same
US9578325B2 (en) * 2010-01-13 2017-02-21 Texas Instruments Incorporated Drift reduction for quality scalable video coding
EP2395505A1 (en) 2010-06-11 2011-12-14 Thomson Licensing Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
JP5752268B2 (ja) 2011-01-14 2015-07-22 ヴィディオ・インコーポレーテッド 時間スケーラビリティのための高いレイヤのシンタックス
AU2012205650B2 (en) * 2011-01-14 2016-08-11 Vidyo, Inc. Improved NAL unit header
WO2012122246A1 (en) 2011-03-10 2012-09-13 Vidyo, Inc. Dependency parameter set for scalable video coding
US9420307B2 (en) 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
US20130138829A1 (en) * 2011-11-30 2013-05-30 Rovi Technologies Corporation Scalable video coding over real-time transport protocol
KR101876299B1 (ko) * 2012-01-20 2018-07-09 전자부품연구원 하이브리드 전송환경에서 스케일러블 초고해상도 비디오 서비스를 위한 프로그램 구성 정보 송수신 방법
KR102094503B1 (ko) * 2012-04-15 2020-03-30 삼성전자주식회사 다계층 비디오 부호화 방법 및 장치, 다계층 비디오 복호화 방법 및 장치
US9313486B2 (en) 2012-06-20 2016-04-12 Vidyo, Inc. Hybrid video coding techniques
US20150215632A1 (en) * 2012-07-06 2015-07-30 Samsung Electronics Co., Ltd. Method and apparatus for multilayer video encoding for random access, and method and apparatus for multilayer video decoding for random access
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
US9706199B2 (en) 2012-09-28 2017-07-11 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
CN103780954B (zh) * 2012-10-22 2017-05-10 上海贝尔股份有限公司 一种组合使用流媒体裁剪技术和显性拥塞通知技术的方法
US9351011B2 (en) * 2012-11-28 2016-05-24 Intel Corporation Video pipeline with direct linkage between decoding and post processing
MX355266B (es) 2012-12-17 2018-04-12 Thomson Licensing Canales digitales robustos.
WO2014098789A1 (en) 2012-12-17 2014-06-26 Thomson Licensing Robust digital channels
CN103079073A (zh) * 2013-01-16 2013-05-01 南京邮电大学 正交频分多址接入系统中面向可伸缩视频的资源分配方法
US9602973B2 (en) * 2013-02-19 2017-03-21 Qualcomm Incorporated Applying error resiliency based on speed
US9667959B2 (en) 2013-03-29 2017-05-30 Qualcomm Incorporated RTP payload format designs
FR3004055A1 (fr) * 2013-03-29 2014-10-03 France Telecom Transcodage et diffusion adaptative de contenus multimedia
US9648353B2 (en) * 2013-04-04 2017-05-09 Qualcomm Incorporated Multiple base layer reference pictures for SHVC
US9807421B2 (en) 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
JP2016519855A (ja) * 2013-04-05 2016-07-07 シャープ株式会社 ランダムアクセスポイント・ピクチャ
US10045021B2 (en) 2013-04-05 2018-08-07 Samsung Electronics Co., Ltd. Multi-layer video coding method for random access and device therefor, and multi-layer video decoding method for random access and device therefor
US9674533B2 (en) 2013-04-05 2017-06-06 Qualcomm Incorporated Picture alignments in multi-layer video coding
CN103313045A (zh) * 2013-05-31 2013-09-18 哈尔滨工业大学 宽带多媒体集群系统调度台h.264视频分包方法
CN103402122A (zh) * 2013-06-24 2013-11-20 中国联合网络通信集团有限公司 移动流媒体服务控制方法及其装置
EP3800893B1 (en) * 2013-07-11 2023-09-06 Dejero Labs Inc. Systems and methods for transmission of data streams
US20150016502A1 (en) * 2013-07-15 2015-01-15 Qualcomm Incorporated Device and method for scalable coding of video information
US10264272B2 (en) * 2013-10-15 2019-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
EP3080995A4 (en) * 2013-12-15 2017-09-27 LG Electronics Inc. Broadcast transmission device and operating method thereof, and broadcast reception device and operating method thereof
US9794558B2 (en) * 2014-01-08 2017-10-17 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
JP2015136059A (ja) 2014-01-17 2015-07-27 ソニー株式会社 通信装置、通信データ生成方法、および通信データ処理方法
GB201515496D0 (en) 2015-09-01 2015-10-14 Microsoft Technology Licensing Llc Packet transmissions
KR102468763B1 (ko) 2016-02-05 2022-11-18 삼성전자 주식회사 영상처리장치 및 그 제어방법
GB201817781D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Mehods, apparatuses, computer programs and computer-readable media
US10880585B1 (en) * 2019-06-12 2020-12-29 Amazon Technologies, Inc. Split-and-stitch media content encoding
US11539957B2 (en) * 2019-06-20 2022-12-27 Tencent America LLC Layered random access with reference picture resampling
US11265357B2 (en) * 2019-10-10 2022-03-01 Microsoft Technology Licensing, Llc AV1 codec for real-time video communication
CN115299053A (zh) 2020-03-16 2022-11-04 字节跳动有限公司 可缩放视频编解码中的随机访问点访问单元
US11503289B2 (en) * 2020-05-27 2022-11-15 Tencent America LLC Bitstream structure for viewport-based streaming with a fallback bitstream
CN112533029B (zh) * 2020-11-17 2023-02-28 浙江大华技术股份有限公司 一种视频分时传输方法、摄像装置、系统和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006295927A (ja) * 2005-04-14 2006-10-26 Samsung Electronics Co Ltd ランダムアクセスの遅延を最小化するビデオ復号化/符号化装置及び方法
WO2007080502A2 (en) * 2006-01-11 2007-07-19 Nokia Corporation Backward-compatible aggregation of pictures in scalable video coding

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006016950A1 (en) 2004-07-07 2006-02-16 Thomson Licensing S.A. Fast channel change in digital video broadcast systems over dsl using redundant video streams
US7746378B2 (en) * 2004-10-12 2010-06-29 International Business Machines Corporation Video analysis, archiving and alerting methods and apparatus for a distributed, modular and extensible video surveillance system
US20070022215A1 (en) * 2005-07-19 2007-01-25 Singer David W Method and apparatus for media data transmission
JP2009531940A (ja) * 2006-03-24 2009-09-03 韓國電子通信研究院 Fgsレイヤーの動きデータを利用してインターレイヤーリダンダンシを除去するコーディング方法及びその装置
KR20100097124A (ko) * 2007-11-05 2010-09-02 톰슨 라이센싱 신속한 채널 변경 및 향상된 오류 복원성을 위한 스케일러블 비디오 코딩 방법
WO2010008416A1 (en) * 2008-07-16 2010-01-21 Thomson Licensing A scalable video coding method for fast channel change to increase coding efficiency

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006295927A (ja) * 2005-04-14 2006-10-26 Samsung Electronics Co Ltd ランダムアクセスの遅延を最小化するビデオ復号化/符号化装置及び方法
WO2007080502A2 (en) * 2006-01-11 2007-07-19 Nokia Corporation Backward-compatible aggregation of pictures in scalable video coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016519509A (ja) * 2013-04-05 2016-06-30 クゥアルコム・インコーポレイテッドQualcomm Incorporated Irapアクセスユニットおよびビットストリーム切替えおよびスプライシング
US10003815B2 (en) 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
JP2020031447A (ja) * 2013-06-18 2020-02-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置および受信装置

Also Published As

Publication number Publication date
EP2304955A1 (en) 2011-04-06
KR20110042201A (ko) 2011-04-25
WO2010014123A1 (en) 2010-02-04
EP2304955B1 (en) 2017-03-29
KR101635235B1 (ko) 2016-06-30
JP5155449B2 (ja) 2013-03-06
BRPI0915958A2 (pt) 2018-06-05
US20110134994A1 (en) 2011-06-09
CN102106156B (zh) 2013-06-19
CN102106156A (zh) 2011-06-22
US8582644B2 (en) 2013-11-12

Similar Documents

Publication Publication Date Title
JP5155449B2 (ja) スケーラブルビデオコーディング(svc)を使用する高速チャネル変更アプリケーションのためのリアルタイムトランスポートプロトコル(rtp)パケット化方法
US20100232520A1 (en) Scalable video coding method for fast channel change and increased error relilience
US8396082B2 (en) Time-interleaved simulcast for tune-in reduction
US8767818B2 (en) Backward-compatible aggregation of pictures in scalable video coding
Schierl et al. Using H. 264/AVC-based scalable video coding (SVC) for real time streaming in wireless IP networks
US20110110418A1 (en) Scalable video coding method for fast channel change to increase coding efficiency
JP5791893B2 (ja) 以前の伝送データを用いた、ビデオ・コンテンツ及びサービスのブロードキャストの受信のための方法及びデバイス
US20110109810A1 (en) Method an apparatus for fast channel change using a scalable video coding (svc) stream
CN1893364A (zh) 广播多媒体流中的关键信息同步
WO2008037218A1 (fr) Procédé, système et serveur multimédia permettant une commutation rapide d'un canal de télévision sur internet (iptv)
JP2008543142A (ja) デジタル放送における階層的な送受信のための方法および装置
US20080301742A1 (en) Time-interleaved simulcast for tune-in reduction
Reguant et al. Delivery of H264 SVC/MDC streams over Wimax and DVB-T networks
Wang et al. Mobile video applications and standards
WO2008149271A2 (en) Time-interleaved simulcast for tune-in reduction

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111216

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121031

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees