JP5114495B2 - ビデオストリームのスプライシングのための方法及び装置 - Google Patents

ビデオストリームのスプライシングのための方法及び装置 Download PDF

Info

Publication number
JP5114495B2
JP5114495B2 JP2009544943A JP2009544943A JP5114495B2 JP 5114495 B2 JP5114495 B2 JP 5114495B2 JP 2009544943 A JP2009544943 A JP 2009544943A JP 2009544943 A JP2009544943 A JP 2009544943A JP 5114495 B2 JP5114495 B2 JP 5114495B2
Authority
JP
Japan
Prior art keywords
video stream
delay
syntax element
spliced video
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009544943A
Other languages
English (en)
Other versions
JP2010516103A5 (ja
JP2010516103A (ja
Inventor
ルオ,ジアンコン
ズー,リ,ホア
イン,ペン
ゴミラ,クリスティーナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010516103A publication Critical patent/JP2010516103A/ja
Publication of JP2010516103A5 publication Critical patent/JP2010516103A5/ja
Application granted granted Critical
Publication of JP5114495B2 publication Critical patent/JP5114495B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6336Control signals issued by server directed to the network components or client directed to client directed to decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/015High-definition television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本原理は、概して、ビデオエンコード及びデコード、より具体的に、ビデオストリームのスプライシング(splicing)のための方法及び装置に関する。
ビデオストリームのスプライシングは、頻繁に用いられるプロシージャである。ストリーム・スプライシングの典型的な用途には、例えば、ビデオ編集、並列エンコード、及び広告挿入等がある。
圧縮ビデオストリームは、しばしばチャネルを通って送信されるので、ビットレートの変化は、エンコーダ及びデコーダでのバッファリングメカニズムを用いて平滑化される必要がある。物理バッファのサイズは有限であり、従って、エンコーダは、無理にビットレートの変化をバッファ限界の範囲内に合わせなければならない。ビデオエンコード標準は、特定のエンコーダ又はデコーダバッファリングメカニズムを要求せず、所与のバッファサイズの仮想基準デコーダ(HRD(Hypothetical Reference Decoder))がバッファのオーバーフロー又はアンダーフローに苦しむことなくビデオビットストリームをデコードするようにエンコーダがビットレートの変動を制御することを定める。
仮想基準デコーダは理想的なデコーダモデルに基づく。仮想基準デコーダの目的は、符号化されているストリームでの時間にわたるビットレートの変化に必要最小限のバッファリング制約を課すことである。かかる制約は、より高いレイヤがストリームをマルチプレクスし、費用効果的なデコーダが実時間でストリームをデコードすることを可能にする。仮想基準デコーダの適合性は、国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−4Part10AVC標準/国際電気通信連合電気通信標準化部門(ITU−T)H.264提言(以下、「MPEG−4 AVC標準」)の規範部分であり、従って、如何なるソースMPEG−4 AVC標準準拠のストリームも、本質的に、仮想基準デコーダに必要条件を満足する。MPEG−4 AVC標準に準拠するビデオストリーム(以下、「MPEG−4 AVC標準ストリーム」)をスプライシングする大きな課題の1つは、2つの独立したソースストリームをつなぎ合わせたストリームが、MPEG−4 AVC標準によって定義されるように、依然として仮想基準デコーダの必要条件を満足することを確かにすることである。しかし、現在の仕様を用いると、予めHRDに準拠するソースストリームによって結合されるストリームが依然としてHRFに準拠するであろう保証はない。従って、MPEG−4 AVC標準ストリームのスプライシングは、単にカットアンドペースト動作ではない。
仮想基準デコーダは、MPEG−4 AVC標準で仕様を定められている。そこで定義されるように、仮想基準デコーダモデルは、順次にエンコードされているMPEG−4 AVCストリームがデコーダでバッファオーバーフロー又はアンダーフローを引き起こすことを防ぐ。しかし、我々は、スプライスドストリームが仮想基準デコーダに適合することを妨げる現在の仮想基準デコーダモデルにおける3つの課題を確認している。これらの課題は:
1.連結点の後での第1のピクチャの符号化ピクチャバッファからのリムーバル(removal)に係る不正確な時間;
2.異なる初期復号化ピクチャバッファ遅延を有してソースストリームと連結する場合の不正確なピクチャ出力タイミング;
3.バッファのアンダーフロー又はオーバーフローを引き起こしうる、式C−15及びC−16の違背。
従って、本原理に従って、ここで提供される方法及び装置は、先行技術の少なくとも上記欠点を解決して、スプライスドストリームが仮想基準デコーダに適合することを確かにする。
ここで、本原理に関連する幾つかの用語及びその対応する定義を与える。
r,n(n):アクセスユニットnの公称リムーバル時間。すなわち、符号化ピクチャバッファ(CPB)からアクセスユニットnを除くための公称時間。
(n):アクセスユニットnの実際のリムーバル時間。すなわち、符号化ピクチャバッファからアクセスユニットnを除き、即座にデコードするための実際の時間。
ai(n):アクセスユニットnの最初の到達時間。すなわち、アクセスユニットnの最初のビットが符号化ピクチャバッファに入り始める時間。
af(n):アクセスユニットnの最終の到達時間。すなわち、アクセスユニットnの最後のビットが符号化ピクチャバッファに入る時間。
o,dpb(n):デコードされたピクチャバッファ(DBP)の出力時間。すなわち、アクセスユニットnが復号化ピクチャバッファから出力される時間。
num_units_in_tickは、クロックチック・カウンタの1インクリメント(クロックチックと呼ばれる。)に対応する周波数time_scaleHz(ヘルツ)で動作するクロックの時間ユニットの数を特定するシーケンスパラメータ設定での構文要素である。num_units_in_tickは0より大きくなければならない。クロックチックは、符号化データで表され得る最小時間間隔である。例えば、ビデオ信号のクロック周波数が6000÷1001Hzである場合に、time_scaleは60,000に等しく、num_units_in_tickは1001に等しい。
time_scaleは、1秒間に過ぎる時間ユニットの数である。例えば、27MHzクロックを用いて時間を測定する時間座標系は、27000000のtime_scaleを有する。time_scaleは0より大きくなければならない。
ピクチャタイミングSEIメッセージ:例えば、cpb_removal_delayや、dpb_output_delay等のピクチャタイミング情報を格納する構文構造。
バッファリング期間SEIメッセージ:例えば、initial_cpb_removal_delay等のバッファリング期間情報を格納する構文構造。
バッファリング期間:デコード順でのバッファリング期間付加拡張情報メッセージの2つのインスタンスの間のアクセスユニットの組。
SchedSelldx:仮想基準デコーダパラメータのどの組(送信レート、バッファサイズ、及び初期バッファ充填率)が選択されるかを示すインデックス。ビットストリームは、仮想基準デコーダパラメータの複数の組に適合することができる。
[スプライシング点でのcpb_removal_delayの不正確な値]
現在の仮想基準デコーダ要件では、cpb_removal_delayは、ピクチャタイミング付加拡張情報メッセージに関連するデータをアクセスユニットから除く前に、つい最近のバッファリング期間付加拡張情報メッセージと関連するアクセスユニットの符号化ピクチャバッファからのリムーバルの後で幾つのクロックチックを待つべきかを特定する。符号化ピクチャバッファからのアクセスユニットnの公称リムーバル時間は、下記の式によって特定される:
r,n(n)=tr,n(n)+t*cpb_removal_delay(n) (C−8)
ここで、変数tは、下記の式:
=num_units_in_tick*time_scale (1)
によって導出され、クロックチックと呼ばれる。
バッファリング期間の第1のアクセスユニットに関して、tr,n(n)は、前のバッファリング期間の第1のアクセスユニットの公称リムーバル時間である。このことは、それが、ピクチャタイミング付加拡張情報メッセージでcpb_removal_delayを正確に設定するために前のバッファリング期間の長さの認識を必要とすることを意味する。ソースストリームが独立してエンコードされる場合に、ソースストリームの単純な連結は、問題のある符号化ピクチャバッファリムーバルタイミングを作る。一例が図1に示される。
図1を参照すると、不正確なcpb_removal_delayによって引き起こされる、例となる問題のあるエンコードタイミングシナリオが、概して、参照符号100で示されている。
図1のシナリオでは、我々は、ソースストリーム1からセグメントAを、更に、ソースストリーム2からセグメントDを取り出す。ストリーム1及びストリーム2の夫々は、独立してHRDに従うストリームである。セグメントA及びセグメントDは、新しいストリームを形成するよう連結される。セグメントの夫々は、セグメントの開始から始まる唯1つのバッファリング期間を有するとする。スプライスドストリームで、セグメントDの第1のアクセスユニットの公称リムーバル時間は、それがセグメントCから得られるcpb_removal_delayと共にセグメントAでの第1のアクセスユニットの公称リムーバル時間から得られることから、問題がある。
[合致しない初期dpb_output_delay]
MPEG−4 AVC標準の現在のバージョンで、復号化ピクチャバッファからのピクチャ出力タイミングは、以下のように定義される。
ピクチャnの復号化ピクチャバッファ出力時間は、下記の式:
o,dpb(n)=t(n)+t*dpb_output_delay(n) (C−12)
から得られる。ここで、dpb_output_delayは、デコードされたピクチャが復号化ピクチャバッファから出力され得る前に、符号化ピクチャバッファからのアクセスユニットリムーバルの後で幾つのクロックチックを待つべきかを特定する。
ストリームの第1のアクセスユニットのdpb_output_delayは、初期dpb_output_delayである。最小初期dpb_output_delayは、デコード及び出力の因果関係を確かにするために使用される。初期dpb_output_delayの最小限の要件は、シーケンス全体でのピクチャ並べ替え関係に依存する。
一例として、GOPタイプIIIII....によりエンコードされるシーケンスに関して、初期dpb_output_delayの最小限の要件は、図2に示されるように、0フレームである。図2を参照すると、ストリームAの例となるデコードタイミングと表示タイミングとの間の関係が、概して、参照符号200で示されている。特に、デコードタイミングは参照符号210で示され、表示タイミングは参照符号220で示されている。
当然のことながら、図2乃至6で、塗り潰しハッチングはIピクチャを示し、斜線ハッチングはPピクチャを示し、平行線ハッチングはBピクチャを示す。
他の例として、GOPタイプIbPbP...によりエンコードされるシーケンスに関して、それは、図3に示されるように、最低1フレームのdpb_output_delayを必要とする。図3を参照すると、ストリームBの例となるデコードタイミングと表示タイミングとの間の関係が、概して、参照符号300で示されている。特に、デコードタイミングは参照符号310で示され、表示タイミングは参照符号320で示される。
ストリーム・スプライシングで、全てのソースストリームの初期dpb_output_delayは同一である必要がある。さもなければ、初期dpb_output_delayの不一致は、例えば、2つのフレームが同じ間で出力されること(重複)や、余分の空隙がフレーム間に挿入されること等の、出力タイミングの問題を引き起こす。
図4を参照すると、ストリームA及びストリームBの連結の例となるデコードタイミングと表示タイミングとの間の関係は、概して、参照符号400で示されている。特に、デコードタイミングは参照符号410で示され、表示タイミングは参照符号420で示されている。
図5を参照すると、ストリームB及びストリームAの他の連結の例となるデコードタイミングと表示タイミングとの間の関係は、概して、参照符号500によって示されている。特に、デコードタイミングは参照符号510で示され、表示タイミングは参照符号520で示されている。
図4及び図5は、初期dpb_output_delayの不一致の値に伴う出力タイミングの問題を表す。
因果関係を満足するよう、全てのソースストリームの初期dpb_output_delayの値は、図6に示されるように、全てのソースストリームの最大初期dpb_output_delayより小さくなく且つ同じでなければならない。
図6を参照すると、最大初期dpb_output_delayより小さく同じ値の初期dpb_output_delayを有する全てのソースストリームの例となるデコードタイミングと表示タイミングとの間の関係は、概して、参照符号600で示されている。特に、デコードタイミングは参照符号610で示され、表示タイミングは参照符号620で示されている。
[式C−15/C−16の違背]
現在の仮想基準デコーダは、以下のように、バッファリング期間付加拡張情報メッセージでのinitial_cpb_removal_delayに制約を設定する。
n>0を有して、バッファリング期間SEIメッセージと関連して、tg,90(n)が
Δtg,90(n)=90000*(tr,n(n)−taf(n−1)) (C−14)である各アクセスユニットnについて、
・cbr_flag[SchedSelldx]が0に等しい場合は、
initial_cpb_removal_delay[SchedSelldx]<=Ceil(Δtg,90(n)) (C−15)
・他の場合(cbr_flag[SchedSelldx]が1に等しい場合)は、
Floor(Δtg,90(n))<=initial_cpb_removal_delay[SchedSelldx]<=Ceil(Δtg,90(n))
(C−16)。
ソースストリームが独立してエンコードされる場合に、スプライスドストリームは、後のソースストリームのinitial_cpb_removal_delayに課された制約(Δtg,90(n))が変更されるので、容易にこれらの条件を破る。図7を参照すると、initial_cpb_removal_delayの制約を破るスプライスドストリームの例が、概して、参照符号700で示されている。特に、第1のソースストリームは参照符号710で示され、第2のソースストリームは参照符号720で示されている。
例えば、国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−2標準(以下、「MPEG−2 AVC標準」)のような従前のビデオ符号化標準規格で、ストリーム・スプライシングは課題ではない。これは、MPEG−2ビデオバッファベリファイア(MPEG−4 AVC標準での仮想基準デコーダに類似する概念)の挙動が、実施において、及び最終的にMPEG−4 AVC標準での仮想基準デコーダからの最終結果において相違するためである。MPEG−4 AVC標準に関してHRD動作によって引き起こされる問題は、以下の理由により、MPEG−2標準に関するビデオ実施には存在しない:
1.ピクチャのデコード時間が前のピクチャのタイプによって導出され、従って、デコード時間は単純な連結に伴う問題を有さない;
2.ピクチャ出力タイミングに関する必要条件はない;
3.initial_cpb_removal_delayの制限はない。初期バッファ充填率は、夫々のピクチャとともに送信されるvbv_delayに基づく。バッファのアンダーフロー及びオーバーフローは、零スタッフィングビット又は余分の待機時間を挿入することによって防がれる。
MPEG−2エレメンタリストリームは、また、伝送のためにトランスポートストリームに詰め込まれ得る。米国映画テレビ技術者協会(SMPTE)は、MPEG−2トランスポートストリームのスプライシングを標準化した。基本的な考えは、MPEG−2トランスポートストリームに含まれるパケット化されたエレメンタリストリーム(PES)のパケットのペイロードを変更することなしにスプライシングすることが可能なMPEG−2トランスポートストリームに対する制約を定義することである。
なお、MPEG−4 AVCストリームのスプライシングのための解決法は存在せず、上記のそれに関連する問題を解決することはできない。
[本発明の概要]
先行技術のこれらの及び他の欠点及び不都合が本原理によって扱われる。本原理は、ビデオストリームのスプライシングのための方法及び装置を対象とする。
本原理の様相に従って、装置が提供される。当該装置は、仮想基準デコーダパラメータによりスプライスドビデオストリームを作り出すスプライスドビデオストリーム発生器を有する。
本原理の他の様相に従って、装置が提供される。当該装置は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって、スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぐよう前記スプライスドビデオストリームを作り出すスプライスドビデオストリーム発生器を有する。
本原理の更なる他の様相に従って、方法が提供される。当該方法は、仮想基準デコーダパラメータによりスプライスドビデオストリームを作るステップを有する。
本原理の更なる他の様相に従って、方法が提供される。当該方法は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって、スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぐ前記スプライスドビデオストリームを作るステップを有する。
本原理の更なる様相に従って、装置が提供される。当該装置は、スプライスドビデオストリームに係る仮想基準デコーダパラメータを受け取って、該仮想基準デコーダパラメータにより前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有する。
本原理の更なる様相に従って、装置が提供される。当該装置は、スプライスドビデオストリームに対応する少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の変更された標準値を受け取って、前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の前記変更された標準値により前記スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぎながら前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有する。
本原理の更なる様相に従って、方法が提供される。当該方法は、スプライスドビデオストリームに係る仮想基準デコーダパラメータを受け取るステップを有する。当該方法は、更に、前記仮想基準デコーダパラメータにより前記スプライスドビデオストリームを再生するステップを有する。
本原理の更なる様相に従って、方法が提供される。当該方法は、スプライスドビデオストリームに対応する少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の変更された標準値を受け取るステップを有する。当該方法は、更に、前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の前記変更された標準値により前記スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぎながら前記スプライスドビデオストリームを再生するステップを有する。
本原理のこれらの及び他の様相、特徴及び利点は、添付の図面に関連して読まれるべきである例となる実施形態に係る以下の詳細な記載から明らかになるであろう。
先行技術に従って、不正確なcpb_removal_delayによって引き起こされる例となる問題のあるデコードタイミングシナリオを示す図である。 先行技術に従って、ストリームAの例となるデコードタイミングと表示タイミングとの間の関係を示す図である。 先行技術に従って、ストリームBの例となるデコードタイミングと表示タイミングとの間の関係を示す図である。 先行技術に従って、ストリームA及びストリームBの連結の例となるデコードタイミングと表示タイミングとの間の関係を示す図である。 先行技術に従って、ストリームB及びストリームAの他の連結の例となるデコードタイミングと表示タイミングとの間の関係を示す図である。 先行技術に従って、最大初期dpb_output_delayより小さくない同じ値の初期dpb_output_delayを有する全てのソースストリームに係る例となるデコードタイミングと表示タイミングとの間の関係を示す図である。 先行技術に従って、initial_cpb_removal_delayの制約を破るスプライスドビデオの例を示す図である。 本原理の実施例に従う、本原理が適用される例となるビデオエンコーダのブロック図である。 本原理の実施例に従う、本原理が適用される例となるビデオデコーダのブロック図である。 本原理の実施例に従う例となるHRD適合性ベリファイアのブロック図である。 本原理の実施例に従ってスプライシング付加拡散情報(SEI)メッセージを挿入する例となる方法のフロー図である。 本原理の実施例に従ってスプライシング付加拡散情報(SEI)メッセージを挿入する他の例となる方法のフロー図である。 本原理の実施例に従ってスプライシング付加拡散情報(SEI)メッセージをデコードする例となる方法のフロー図である。 本原理の実施例に従って公称リムーバル時間tr,n(n)を導出する例となる方法のフロー図である。 本原理の実施例に従って復号化ピクチャバッファ(DPB)出力時間to,dpb(n)を導出する例となる方法のフロー図である。 本原理の実施例に従って復号化ピクチャバッファ(DPB)出力時間to,dpb(n)を導出する他の例となる方法のフロー図である。 本原理の実施例に従って付加拡散情報(SEI)メッセージを挿入する更なる他の例となる方法のフロー図である。 本原理の実施例に従って付加拡散情報(SEI)メッセージをデコードする他の例となる方法のフロー図である。 本原理の実施例に従う例となるスプライスドストリーム発生器のブロック図である。 本原理の実施例に従ってスプライスドビデオストリームを生成する例となる方法のフロー図である。 本原理の実施例に従ってスプライスドビデオストリームを再生する例となる方法のフロー図である。 本原理の実施例に従ってスプライスドビデオストリームを生成する他の例となる方法のフロー図である。 本原理の実施例に従ってスプライスドビデオストリームを再生する他の例となる方法のフロー図である。
本原理は、添付の図面に従ってより良く理解され得る。
本原理は、ビデオストリームのスプライシングのための方法及び装置を対象とする。
本明細書は、本原理について説明するものである。よって、明らかなように、当業者は、たとえここで明示的に記載又は図示されていなくとも、本開示の原理を具現し且つその精神及び適用範囲の中に包含される様々な配置を考え出すことができる。
ここに挙げられている全ての例及び条件付きの用語は、当該技術の促進に発明者によって寄与される開示及び概念の原理を理解する際に読み手を助ける教育的な目的を対象とし、このような具体的に挙げられている例及び条件に限定されないと考えられるべきである。
更に、ここで本原理の原理、様相及び実施形態並びにそれらの具体例を挙げる全ての記述は、構造上及び機能上の両方でそれらと等価なものを包含するよう意図される。更に、かかる等価なものは、現在知られているもの及び将来開発されるもの、すなわち、構造に関わらず同じ機能を実行する開発されたあらゆる要素を含むことが意図される。
よって、例えば、当業者には明らかなように、ここで提示されるブロック図は、本原理を具現する例となる回路の概念図を表す。同様に、如何なるフローチャート、フロー図、状態遷移図及び擬似コード等も、実質的にコンピュータ読取可能な媒体で表され且つコンピュータ又はプロセッサによって(かかるコンピュータ又はプロセッサが明示的に示されていようとなかろうと)そのように実行される様々な処理を表すことは明らかである。
図示される様々な要素の機能は、専用のハードウェア及び、適切なソフトウェアに関連してソフトウェアを実行可能なハードウェアの使用を通して提供されてよい。プロセッサによって提供される場合に、かかる機能は、単一の専用プロセッサによって、単一の共用プロセッサによって、又は複数の個別プロセッサ(これらの幾つかは共有されてよい。)によって提供されてよい。更に、用語“プロセッサ”又は“コントローラ”の明示的な使用は、排他的にソフトウェアを実行可能なハードウェアをいうと解釈されるべきではなく、暗に、制限なく、デジタル信号プロセッサ(“DSP”)ハードウェア、ソフトウェアを記憶する読出専用メモリ(“ROM”)、ランダムアクセスメモリ(“RAM”)、及び不揮発性記憶装置を含みうる。
従来の及び/又はカスタムの他のハードウェアも含まれてよい。同様に、図示される如何なるスイッチも単なる概念に過ぎない。それらの機能は、プログラムロジックの演算を通して、専用ロジックを通して、プログラム制御及び専用ロジックの相互作用を通して、又は手動で、実行されてよい。具体的な技術は、文脈からより具体的に理解されるように、実施者によって選択可能である。
本願の特許請求の範囲で、特定の機能を実行する手段として表される如何なる要素も、例えば、a)その機能を実行する回路要素の組合せ、又はb)あらゆる形態をとり、従って、ファームウェアや、マイクコード等を含むソフトウェアであって、機能を実行するためにそのソフトウェアを実行する適切な回路と組み合わされるソフトウェアを含め、その機能を実行するあらゆる方法を包含するよう意図される。特許請求の範囲によって定義される本原理は、様々な列挙されている手段によって提供される機能性が、特許請求の範囲が要求するように組み合わされて1つにされるという事実にある。よって、それらの機能性を提供することができる如何なる手段も、ここに示されるものと等価であると考えられる。
明細書における本原理の“一実施形態”又は“実施例”との参照は、その実施形態に関連して記載される特定の機能、構成及び特性等が本原理の少なくとも1つの実施形態に含まれることを意味する。よって、明細書の全体を通して様々な場所に現れる“一実施形態で”又は“実施例で”というフレーズの出現は、必ずしも全て同じ実施形態を参照しているわけではない。
当然のことながら、例えば、“A及び/又はB”といった場合のように、語“及び/又は”の使用は、最初に挙げられている選択肢(A)の選択、次に挙げられている選択肢(B)の選択、又は両方の選択肢(A)及び(B)の選択を包含するよう意図される。更なる例として、“A、B、及び/又はC”の場合に、かかる言い回しは、最初に挙げられている選択肢(A)の選択、2番目に挙げられている選択肢(B)の選択、3番目に挙げられている選択肢(C)の選択、最初及び2番目に挙げられている選択肢(A及びB)の選択、最初及び3番目に挙げられている選択肢(A及びC)の選択、2番目及び3番目に挙げられている選択肢(B及びC)の選択、又は3つ全ての選択肢(A及びB及びC)の選択を包含するよう意図される。これは、当該及び関連する技術で通常の知識を有する者によって容易に理解されるように、挙げられている項目の数だけ広げられ得る。
更に、当然のことながら、本原理の1又はそれ以上の実施形態は、MPEG−4 AVC標準に関してここでは記載されるが、本原理は、単にこの標準にのみ限定されず、よって、本原理の精神を保ちながら、他のビデオ符号化標準規格、推奨、及びMPEG−4 AVC標準の拡張を含むそれらの拡張に関して利用されてよい。
図8を参照すると、本原理が適用され得る例となるビデオエンコーダが、概して、参照符号800で示されている。
ビデオエンコーダ800は、結合器885の非反転入力と通信を行う出力を有するフレーム順序付けバッファ810を有する。結合器885の出力は、変換器及び量子化器825の第1入力と通信接続されている。変換器及び量子化器825の出力は、エントロピ符号器845の第1入力並びに逆変換器及び逆量子化器850の第1入力と通信接続されている。エントロピ符号器845の出力は、結合器890の第1非反転入力と通信接続されている。結合器890の出力は、出力バッファ835の第1入力と通信接続されている。
エンコーダ制御器805の第1出力は、フレーム順序付けバッファ810の第2入力、逆変換器及び逆量子化器850の第2入力、ピクチャタイプ決定モジュール815の入力、マクロブロックタイプ(MBタイプ)決定モジュール820の第1入力、イントラ予測モジュール860の第2入力、デブロッキングフィルタ865の第2入力、モーション補償器870の第1入力、モーション推定器875の第1入力、並びに基準ピクチャバッファ880の第2入力と通信接続されている。
エンコーダ制御器805の第2出力は、付加拡張情報(SEI(Supplemental Enhancement Information))挿入器830の第1入力、変換器及び量子化器825の第2入力、エントロピ符号器845の第2入力、出力バッファ835の第2入力、並びにシーケンスパラメータ設定(SPS(Sequence Parameter Set))及びピクチャパラメータ設定(PPS(Picture Parameter Set))挿入器840の入力と通信接続されている。
ピクチャタイプ決定モジュール815の第1出力は、フレーム順序付けバッファ810の第3入力と通信接続されている。ピクチャタイプ決定モジュール815の第2出力は、マクロブロックタイプ決定モジュール820の第2入力と通信接続されている。
シーケンスパラメータ設定(SPS)及びピクチャパラメータ設定(PPS)挿入器840の出力は、結合器890の第3非反転入力と通信接続されている。
逆量子化器及び逆変換器850の出力は、結合器819の第1非反転入力と通信接続されている。結合器819の出力は、イントラ予測モジュール860の第1入力及びデブロッキングフィルタ865の第1入力と通信接続されている。デブロッキングフィルタ865の出力は、基準ピクチャバッファ880の第1入力と通信接続されている。基準ピクチャバッファ880の出力は、モーション推定器875の第2入力と通信接続されている。モーション推定器875の第1出力は、モーション補償器870の第2入力と通信接続されている。モーション推定器875の第2出力は、エントロピ符号器845の第3入力と通信接続されている。
モーション補償器870の出力は、スイッチ897の第1入力と通信接続されている。イントラ予測モジュール860の出力は、スイッチ897の第2入力と通信接続されている。マクロブロックタイプ決定モジュール820の出力は、スイッチ897の第3入力と通信接続されている。スイッチ897の第3入力は、(制御入力、すなわち、第3入力と比較される)スイッチの“データ”入力がモーション補償器870又はイントラ予測モジュール860によって提供されるべきか否かを決定する。スイッチ897の出力は、結合器819の第2非反転入力及び結合器885の反転入力と通信接続されている。
フレーム順序付けバッファ810の第1入力及びエンコーダ制御器805の入力は、入力ピクチャ801を受け取るために、エンコーダ800の入力部として利用可能である。更に、付加拡張情報(SEI)挿入器830の第2入力は、メタデータを受け取るために、エンコーダ800の入力部として利用可能である。出力バッファ835の出力は、ビットストリームを出力するために、エンコーダ800の出力部として利用可能である。
図9を参照すると、本原理が適用され得る例となるビデオデコーダが、概して、参照符号900で示されている。
ビデオデコーダ900は、エントロピデコーダ945の第1入力及び付加拡張情報(SEI)パーサー(parser)907の第1入力と通信接続される出力を有する入力バッファ910を有する。エントロピデコーダ945の第1出力は、逆変換器及び逆量子化器950の第1入力と通信接続されている。逆変換器及び逆量子化器950の出力は、結合器925の第2非反転入力と通信接続されている。結合器925の出力は、デブロッキングフィルタ965の第2入力及びイントラ予測モジュール960の第1入力と通信接続されている。デブロッキングフィルタ965の第2出力は、基準ピクチャバッファ980の第1入力と通信接続されている。基準ピクチャバッファ980の出力は、モーション補償器970の第2入力と通信接続されている。
エントロピデコーダ945の第2出力は、モーション補償器970の第3入力及びデブロッキングフィルタ965の第1入力と通信接続されている。エントロピデコーダ945の第3出力は、デコーダ制御器905の第1入力と通信接続されている。SEIパーサー907の出力は、デコーダ制御器905の第2入力と通信接続されている。デコーダ制御器905の第1出力は、エントロピデコーダ945の第2入力と通信接続されている。デコーダ制御器905の第2出力は、逆変換器及び逆量子化器950の第2入力と通信接続されている。デコーダ制御器905の第3出力は、デブロッキングフィルタ965の第3入力と通信接続されている。デコーダ制御器905の第4出力は、イントラ予測モジュール960の第2入力、モーション補償器970の第1入力及び基準ピクチャバッファ980の第2入力と通信接続されている。
モーション補償器970の出力は、スイッチ997の第1入力と通信接続されている。イントラ予測モジュール960の出力は、スイッチ997の第2入力と通信接続されている。スイッチ997の出力は、結合器925の第1非反転入力と通信接続されている。
入力バッファ910の入力は、入力ビットストリームを受け取るために、デコーダ900の入力として利用可能である。デブロッキングフィルタ965の第1出力は、出力ピクチャを出力するために、デコーダ900の出力として利用可能である。
上述されるように、本原理は、ビデオストリームのスプライシングのための方法及び装置を対象とする。本原理は、主に、MPEG−4 AVC標準に準拠する1又はそれ以上のストリームに対するストリーム・スプライシングに関して記載されている。なお、当然のことながら、本原理は、MPEG−4 AVC標準に準拠するストリームに限定されず、本原理の精神を保ちながら、MPEG−4 AVC標準に伴って生ずる先行技術のストリーム・スプライシングと同様の問題を抱える他のビデオ符号化標準及び推奨と共に用いられてよい。
仮想基準デコーダ(HRD)適合性は、MPEG−4 AVC標準の規範的部分である。MPEG−4 AVC標準に伴って生ずるストリーム・スプライシングにおける主たる問題は、独立してHRDに従うソースストリームによりスプライシングされるストリームが依然としてHRDに従うという保証がないことである。
従って、本原理は、スプライスドストリームがMPEG−4 AVC標準に従うことを確かにしながらスプライスドストリームを作ることができる方法及び装置を提供する。本原理に従う方法及び装置は、仮想基準デコーダ(HRD)に従うソースストリームによって作られるストリームが依然としてHRDに従うことを確かにする。1又はそれ以上の実施形態で、このことは、バッファリング期間付加拡張情報(SEI)メッセージ及びピクチャタイミング付加拡張情報メッセージに置かれている仮想基準デコーダパラメータを変更することによって、及び/又はMPEG−4 AVC標準で定められている仮想基準デコーダの動作をストリーム・スプライシングをサポートするよう変更することによって、行われる。
以下、ここで用いられる様々な用語に関して定義する。
インポイント:スプライシング境界直後のアクセスユニット。インポイントはIDRピクチャでなければならず、それに関連するバッファリング期間SEIメッセージがなければならない。
アウトポイント:スプライシング境界直前のアクセスユニット。
スプライスタイプ:2つのタイプのスプライシング、すなわち、シームレスなスプライシング及びシームレスでないスプライシングがある。シームレスなスプライシングは、ストリームのクリーンな瞬時切替を可能にする。スプライシングをされるビデオストリームは、適合した仮想基準デコーダバッファ特性を接合部で有するよう作られる。古いストリームが終わり、最後の古いピクチャがデコードされるときの間の時間は、正確に、新しいストリームのスタートアップ遅延に満たない1フレームでなければならない。シームレスでないスプライシングは、2つのストリームの間に短い不感時間を挿入することによって、デコーダバッファのオーバーフローを回避する。これは、新しいストリームが空のバッファから始まることを確かにする。スプライシング装置は、デコーダのバッファが空であることを確実にしてオーバーフローの機会を防ぐよう、新しいストリームを挿入するまえに待機する。デコーダのピクチャは、新しいストリームのスタートアップ遅延の間は停止すべきである。
以下、本原理に従うビデオストリームのスプライシングのための方法について記載する。
この方法に従って、後述される新しい仮想基準デコーダは、ストリーム・スプライシング動作を単純化することができる。
現在のバージョンのMPEG−4 AVC標準での仮想基準デコーダと比べて、ここに記載される仮想基準デコーダは、連結の位置を示す新しい構文要素と、スプライシングのタイプ(すなわち、シームレスな又は非シームレスなスプライシング)に基づいて新しいストリームの第1のアクセスユニットの符号ピクチャバッファ(CPB(Coded Picture Buffer))からのリムーバルの時間を導出する新しい規則と、スプライスドストリームでの復号ピクチャバッファ(DPB(Decoded Picture Buffer))を導出する新しい規則とを加えることを有する/伴う。
インポイントの位置を示し且つデコード及び出力タイミングを得るために用いられるパラメータは、例えば、帯域内又は帯域外で、ストリームの部分として高レベル構文を通して伝えられる。
かかる構文要素の1つの実施例は、スプライシングのために新しいタイプの付加拡張情報(SEI)メッセージを加えることである。スプライシング付加拡張情報(SEI)メッセージの存在は、新しいソースストリームの開始を示す。スプライシング付加拡張情報メッセージは、スプライシング装置によってインポイント・アクセスユニットに加えられる。
以下、かかる方法の実施例について記載する。
スプライシング付加拡張情報メッセージの構文は表1に示される。
Figure 0005114495
dpb_output_delay_offsetは、ピクチャタイミング付加拡張情報メッセージでdpb_output_delayと組み合わせて復号ピクチャバッファ出力遅延を特定するために使用される。
この実施例で、dpb_output_delay_offsetは明示的に送信される。
欠点は、スプライシング装置が、dpb_output_delay_offsetの値を得るためにソースストリームを構文解析する必要があることである。これは、スプライシング装置に更なる作業負荷を加える。よって、或る状況では、それは、オンラインの又は生のスプライシングにとって最良の選択でないことがある。
次に、かかる方法の他の実施例について記載する。
スプライシング付加拡張情報メッセージの構文は表2に示される。
Figure 0005114495
この実施例で、dpb_output_delay_offsetは送信されず、暗に得られる。
利点は、スプライシング装置がソースストリームを構文解析する必要がないことである。dpb_output_delay_offsetの値はデコーダ側で導出される。
上記の方法に関して、仮想基準デコーダの対応する挙動について記載する。
目下の仮想基準デコーダと比較して、仮想基準デコーダの挙動は、後述されるように、スプライスドストリームに対して変更されている。
インポイントでのピクチャの公称リムーバル時間が導出される。アクセスユニットがインポイントである場合に、cpb_removal_delayは、ピクチャタイミングSEIメッセージに関連するアクセスユニットをバッファから除く前に、前のアクセスユニットのCPBからのリムーバルの後で幾つのクロックチックを待つべきかを定める。
cpb_removal_delay(ns)は、以下のように導出される:
Figure 0005114495
この場合に、nはインポイントである。
この導出は、式(C−15)又は(C−16)が乱されないことを保証する。
連結は、cpb_removal_delay(ns)=NumClockTSである場合にシームレスであり、そうでない場合は非シームレスである点に留意すべきである。
復号ピクチャバッファ出力時間は、スプライシング付加拡張情報メッセージから導出される。スプライスドストリームで、アクセス時間の復号ピクチャバッファ出力時間は、以下のように導出される:
Figure 0005114495
この場合に、nは最も近い前のインポイントである。
上記の方法の最初の実施例が適用される場合は、dpb_output_delay_offsetは、付加拡張情報メッセージで構文要素によって伝えられる。
dpb_output_delay_offsetは、以下のようにスプライシング装置によって導出される:
Figure 0005114495
この場合に、max_initial_delayは、全てのインポイントのdpb_output_delayの最大値に劣らない。
上記の方法の第2の実施例が適用される場合は、dpb_output_delay_offsetは、以下のように導出される:max_initial_delayを0に初期化;各インポイントで、max_initial_delay<dpb_output_dalayである場合に、max_initial_delay=dpb_output_delay;dpb_output_delay_offset(ns)=max_initial_delay−dpb_output_delay(ns)。
max_initial_delayが全てのインポイントのdpb_output_delayの最大値に劣らない値で初期化される場合は、スプライシングはシームレスである点に留意すべきである。
このように、目下の仮想基準デコーダに従って、スプライスドストリームが依然としてHRDに従おうとする保証はない。
これは以下の理由による:現在の標準でのcpb_removal_delayのセマンティクスは、独立した符号ソースストリームのスプライシングと互換性がないこと;異なるソースストリームでの不一致の初期復号ピクチャバッファ出力遅延は不正確な出力タイミングを引き起こしうること;及び、initial_cpb_removal_delayは式C−15/C−16の違背を引き起こしうること。
本原理に従って、我々は、ビデオのスプライシングをサポートするよう現在の仮想基準デコーダを改良する。スプライシング点で新たな付加拡張情報メッセージを加えることによってスプライスドストリームの仮想基準デコーダ適合性を確保する解決法が提案されている。現在の仮想基準デコーダによって引き起こされる問題は解決され得、ストリーム・スプライシング動作は単純化される。
以下、本原理に従うビデオストリーム・スプライシングのための他の方法について記載する。
cpb_removal_delay及びdpb_output_delayによって引き起こされる問題は、最終のスプライスドストリームについてcpb_removal_delay及びdpb_output_delayを再計算し、スプライスドストリームが作られた後に然るべくバッファリング期間付加拡張情報メッセージ及びピクチャタイミング付加拡張情報メッセージを変更することによって、解決され得る。
しかし、この方法は、全てのソースストリームの開始時のバッファリング期間付加拡張情報メッセージと、ほとんど全てのピクチャタイミング付加拡張情報メッセージとを置換/変更することを要する。これは、スプライシング装置にピクチャの全てを構文解析することを求める。方法は、スプライシング装置でより高い複雑性を必要とし、実時間ビデオスプライシング用途には適さない。
initial_cpb_removal_delayによって引き起こされる問題を対象とする如何なる解決法も、式C−15/C−16で課される条件を満たすよう単にバッファリング期間付加拡張情報メッセージでinitial_cpb_removal_delayの値を変更することによっては機能しない。
initial_cpb_removal_delayを減じることは、続くピクチャの最終到達時間の遅延及びバッファのアンダーフローを引き起こしうる。また、これは、続くバッファリング期間で式C−15/C−16の新たな違背となりうる。
図10を参照すると、第1の方法に対応する例となるHRD適合性ベリファイアが、概して、参照符号1000で示されている。
HRD適合性ベリファイア1000は、CPB到達及びリムーバル時間計算器1050の第1入力と通信接続される第1出力を有するシーケンスメッセージフィルタ1010を有する。ピクチャ及びバッファリングメッセージフィルタ1020の出力は、CPB到達及びリムーバル時間計算器1050の第2入力と通信接続されている。ピクチャサイズ計算器1030の出力は、CPB到達及びリムーバル時間計算器1050の第3入力と通信接続されている。スプライシングメッセージフィルタ1040の出力は、CPB到達及びリムーバル時間計算器1050の第4入力と通信接続されている。
CPB到達及びリムーバル時間計算器1050の第1出力は、制約チェッカ1060の第1入力と通信接続されている。CPB到達及びリムーバル時間計算器1050の第2出力は、制約チェッカ1060の第2入力と通信接続されている。CPB到達及びリムーバル時間計算器1050の第3出力は、制約チェッカ1060の第3入力と通信接続されている。
シーケンスメッセージフィルタ1010の第2出力は、制約チェッカ1060の第4入力と通信接続されている。
シーケンスメッセージフィルタ1010、ピクチャ及びバッファリングメッセージフィルタ1020、ピクチャサイズ計算器1030、並びにスプライシングメッセージフィルタ1040の各入力は、入力ビットストリームを受け取るために、HRD適合性ベリファイア1000への入力として利用可能である。
制約チェッカ1060の出力は、適合性インジケータを出力するために、HRD適合性ベリファイア1000の出力として利用可能である。
図11Aを参照すると、スプライシング付加拡張情報(SEI)メッセージを挿入する例となる方法が、概して、参照符号1100で示されている。
方法1100は開始ブロック1105を有する。開始ブロック1105は、制御を決定ブロック1110へ渡す。決定ブロック1110は、このアクセスポイントがインポイントであるか否かを決定する。アクセスポイントがインポイントである場合は、制御は機能ブロック1115へ渡される。アクセスポイントがインポイントでない場合は、制御は終了ブロック1149へ渡される。
機能ブロック1115は、dpb_output_delay_offset(ns)を(max_initial_delay−dpb_output_delay(ns))に等しく設定し、制御を機能ブロック1120へ渡す。機能ブロック1120は、スプライシング付加拡張情報(SEI)ネットワークアブストラクションレイヤ(NAL)ユニットをビットストリームに書き込み、制御を終了ブロック1149へ渡す。
図11Bを参照すると、スプライシング付加拡張情報(SEI)メッセージを挿入する他の例となる方法が、概して、参照符号1150で示されている。
方法1150は開始ブロック1155を有する。開始ブロック1155は、制御を決定ブロック1160へ渡す。決定ブロック1160は、このアクセスポイントがインポイントであるか否かを決定する。アクセスポイントがインポイントである場合は、制御は機能ブロック1165へ渡される。アクセスポイントがインポイントでない場合は、制御は終了ブロック1199へ渡される。
機能ブロック1165は、スプライシング付加拡張情報(SEI)ネットワークアブストラクションレイヤ(NAL)ユニットをビットストリームに書き込み、制御を終了ブロック1199へ渡す。
図12を参照すると、スプライシング付加拡張情報(SEI)メッセージをデコードする例となる方法が、概して、参照符号1200で示されている。
方法1200は開始ブロック1205を有する。開始ブロックは、制御を機能ブロック1210へ渡す。機能ブロック1210は、ビットストリームからネットワークアブストラクションレイヤ(NAL)ユニットを読み出し、制御を決定ブロック1215へ渡す。決定ブロック1215は、NALユニットがスプライシング付加拡張情報(SEI)メッセージであるか否かを決定する。NALユニットがスプライシングSEIメッセージである場合は、制御は機能ブロック1220へ渡される。NALユニットがスプライシングSEIメッセージでない場合は、制御は機能ブロック1225へ渡される。
機能ブロック1220は、アクセスポイントをインポイント・アクセスポイントと指定し、制御を終了ブロック1299へ渡す。
機能ブロック1225は、アクセスポイントを非インポイント・アクセスポイントと指定し、制御を終了ブロック1299へ渡す。
図13を参照すると、公称リムーバル時間tr,n(n)を導出する例となる方法が、概して、参照符号1300で示されている。
方法1300は開始ブロック1305を有する。開始ブロック1305は、制御を決定ブロック1310へ渡す。決定ブロック1310は、現在のアクセスユニットがインポイント・アクセスユニットであるか否かを決定する。現在のアクセスユニットがインポイント・アクセスユニットである場合は、制御は機能ブロック1315へ渡される。現在のアクセスユニットがインポイント・アクセスユニットでない場合は、制御は機能ブロック1325へ渡される。
機能ブロック1315は、cpb_removal_delay(ns)をMax(DeltaTfiDivisor,Ceil((initial_cpb_removal_delay[SchedSelldx].*90000)+taf(ns−1)−tr,n(ns−1).*tc)に等しく設定し、制御を機能ブロック1320へ渡す。機能ブロック1320は、tr,n(n)をtr,n(n−1)+tc*cpb_removal_delay(n)に等しく設定し、制御を終了ブロック1399へ渡す。
機能ブロック1325は、ビットストリームからcpb_removal_delay(n)を読み出し、制御を機能ブロック1330へ渡す。機能ブロック1330は、tr,n(n)をtr,n(nb)+tc*cpb_removal_delay(n)に等しく設定し、制御を終了ブロック1399へ渡す。
図14Aを参照すると、復号ピクチャバッファ(DPB)出力時間to,dpb(n)を導出する例となる方法が、概して、参照符号1400で示されている。
方法1400は開始ブロック1405を有する。開始ブロック1405は、制御を決定ブロック1410へ渡す。決定ブロック1410は、現在のアクセスユニットが最初のアクセスユニットであるか否かを決定する。現在のアクセスユニットが最初のアクセスユニットである場合は、制御は機能ブロック1415へ渡される。現在のアクセスユニットが最初のアクセスユニットでない場合は、制御は決定ブロック1420へ渡される。
機能ブロック1415は、dpb_output_delay_offset(ns)を0に等しく設定し、制御を決定ブロック1420へ渡す。決定ブロック1420は、現在のアクセスポイントがインポイント・アクセスポイントであるか否かを決定する。現在のアクセスポイントがインポイント・アクセスポイントである場合は、制御は機能ブロック1425へ渡される。現在のアクセスポイントがインポイント・アクセスポイントでない場合は、制御は機能ブロック1430へ渡される。
機能ブロック1425は、スプライシング付加拡張情報(SEI)からdpb_output_delay_offset(ns)を読み出し、制御を機能ブロック1430へ渡す。
機能ブロック1430は、to,dpb(n)をtr(n)+tc*(dpb_output_delay(n)+dpb_output_delay_offset(ns))に等しく設定し、制御を終了ブロック1449へ渡す。
図14Bを参照すると、復号ピクチャバッファ(DPB)出力時間to,dpb(n)を導出する他の例となる方法が、概して、参照符号1450で示されている。
方法1450は開始ブロック1455を有する。開始ブロック1455は、制御を決定ブロック1460へ渡す。決定ブロック1460は、現在のアクセスユニットが最初のアクセスユニットであるか否かを決定する。現在のアクセスユニットが最初のアクセスユニットである場合は、制御は機能ブロック1465へ渡される。現在のアクセスユニットが最初のアクセスユニットでない場合は、制御は決定ブロック1470へ渡される。
機能ブロック1465は、max_initial_delayを0に等しく且つdpb_output_delay_offset(ns)を0に等しく設定し、制御を決定ブロック1470へ渡す。
決定ブロック1470は、現在のアクセスユニットがインポイント・アクセスユニットであるか否かを決定する。現在のアクセスユニットがインポイント・アクセスユニットである場合は、制御は決定ブロック1475へ渡される。現在のアクセスユニットがインポイント・アクセスユニットでない場合は、制御は機能ブロック1490へ渡される。
決定ブロック1475は、max_initial_delayがdpb_output_delay(n)より小さいか否かを決定する。max_initial_delayがdpb_output_delay(n)より小さい場合は、制御は機能ブロック1480へ渡される。max_initial_delayがdpb_output_delay(n)より小さくない場合は、制御は機能ブロック1485へ渡される。
機能ブロック1480は、max_initial_delayをdpb_output_delay(n)に等しく設定し、制御を機能ブロック1485へ渡す。
機能ブロック1485は、dpb_output_delay_offset(ns)をmax_initial_delay−dpb_output_delay(n)に等しく設定し、制御を機能ブロック1490へ渡す。機能ブロック1490は、to,dpb(n)=tr(n)+tc*(dpb_output_delay(n)+dpb_output_delay_offset(ns))と設定し、制御を終了ブロック1449へ渡す。
図15Aを参照すると、付加拡張情報(SEI)メッセージを挿入するための例となる方法が、概して、参照符号1500で示されている。
方法1500は開始ブロック1505を有する。開始ブロック1505は、制御を決定ブロック1510へ渡す。決定ブロック1510は、いずれかのHRD規則が違反されているか否かを決定する。HRD規則が違反されている場合は、制御は機能ブロック1520へ渡される。HRD規則が違反されていない場合は、制御は終了ブロック1549へ渡される。
機能ブロック1520は、cpb_removal_delay及びdpb_output_delayについて新しい値を計算し、制御を機能ブロック1525へ渡す。機能ブロック1525は、ピクチャタイミングSEIメッセージを置き換え、制御を機能ブロック1530へ渡す。機能ブロック1530は、initial_cpb_removal_delay及びinitial_cpb_removal_delay_offsetについて新しい値を計算し、制御を機能ブロック1535へ渡す。機能ブロック1535は、バッファリング期間SEIメッセージを置き換え、制御を終了ブロック1549へ渡す。
図15Bを参照すると、付加拡張情報(SEI)メッセージをデコードするための例となる方法が、概して、参照符号1550で示されている。
方法1550は開始ブロック1555を有する。開始ブロック1555は、制御を機能ブロック1560へ渡す。機能ブロック1560は、新しいピクチャタイミングSEIメッセージから変更されたcpb_removal_delay及びdpb_output_delayを読み出し、制御を機能ブロック1565へ渡す。機能ブロック1565は、新しいバッファリング期間SEIメッセージから変更されたinitial_cpb_removal_delay及びinitial_cpb_removal_delay_offsetを読み出し、制御を終了ブロック1599へ渡す。
図16を参照すると、例となるスプライスドストリーム発生器が、概して、参照符号1600で示されている。スプライスドストリーム発生器1600は、ビットストリーム1乃至nを受け取る入力部1乃至nを有する。スプライスドストリーム発生器1600は、スプライスドストリームを出力する出力部を有する。
各入力ビットストリーム(1乃至n)は、例えば図8のエンコーダ800のようなエンコーダの出力ビットストリームに対応する。スプライスドストリーム発生器1600によって供給される出力ビットストリームは、コンプライアンス確認のために、例えば図10のHRD適合性ベリファイア1000のようなHRDベリファイアへ入力され、及び/又は、例えば図9のデコーダ900のようなデコーダへ入力される。
図17を参照すると、スプライスドビデオストリームを生成する例となる方法が、概して、参照符号1700で示されている。
方法1700は開始ブロック1705を有する。開始ブロック1705は、制御を機能ブロック1710へ渡す。機能ブロック1710は、前のアクセスユニットのリムーバル時間及び時間オフセットに基づいて、スプライスドストリームを形成する少なくとも2つのストリームのうちの少なくとも1つのアクセスユニットのリムーバル時間を計算し、制御を機能ブロック1715へ渡す。時間オフセットは、ピクチャタイミングSEIメッセージに含まれるcpb_removal_delayフィールドで伝えられても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。
機能ブロック1715は、アクセスユニットのリムーバル時間及び所与の時間オフセットに基づいてアクセスユニットの出力時間を計算し、制御を機能ブロック1720へ渡す。所与の時間オフセットは、dpb_output_delay構文要素及び他の時間オフセットの和に等しくても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。他の時間オフセットは、max_initial_delay構文要素とdpb_output_delay構文要素との間の差に等しくても、SEIメッセージで伝えられても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。
機能ブロック1720は、機能ブロック1710及び1715で計算されたような仮想基準デコーダパラメータを用いてスプライスドビデオストリームを生成し、制御を機能ブロック1725へ渡す。
機能ブロック1725は、帯域内及び/又は帯域外でスプライスドビデオストリームのスプライシング位置を示し、制御を終了ブロック1799へ渡す。
図18を参照すると、仮想基準デコーダパラメータを用いてスプライスドビデオストリームを再生する例となる方法が、概して、参照符号1800で示されている。
方法1800は開始ブロック1805を有する。開始ブロック1805は、制御を機能ブロック1810へ渡す。機能ブロック1810は、帯域内及び/又は帯域外でスプライスドビデオストリームのスプライシング位置を受け取り、制御を機能ブロック1815へ渡す。
機能ブロック1815は、前のアクセスユニットのリムーバル時間及び時間オフセットに基づく先の計算から、スプライスドストリームを形成する少なくとも2つのストリームのうちの少なくとも1つのアクセスユニットのリムーバル時間を決定し、制御を機能ブロック1820へ渡す。時間オフセットは、ピクチャタイミングSEIメッセージに含まれるcpb_removal_delayフィールドから決定されても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。
機能ブロック1820は、アクセスユニットのリムーバル時間及び所与の時間オフセットに基づく先の計算からアクセスユニットの出力時間を決定し、制御を機能ブロック1825へ渡す。所与の時間オフセットは、dpb_output_delay構文要素及び他の時間オフセットの和に等しくても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。他の時間オフセットは、max_initial_delay構文要素とdpb_output_delay構文要素との間の差に等しくても、SEIメッセージで受け取られても、且つ/あるいは、スプライスドビデオストリームをデコードする対応するデコーダで計算されてもよい。
機能ブロック1825は、機能ブロック1815及び1820で決定及び/又は別な方法で取得されたような仮想基準デコーダパラメータを用いてスプライスドビデオストリームを再生し、制御を終了ブロック1899へ渡す。
図19を参照すると、スプライスドビデオストリームを生成する他の例となる方法が、概して、参照符号1900で示されている。
方法1900は開始ブロック1905を有する。開始ブロック1905は、制御を機能ブロック1910へ渡す。機能ブロック1910は、別々のビットストリームを連結させることによってスプライスドビデオストリームを生成し、制御を機能ブロック1915へ渡す。
機能ブロック1915は、スプライスドビットストリームに関連するその後のデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぐためにスプライスドビットストリームにおいて仮想基準デコーダパラメータ構文値を調整し、制御を終了ブロック1999へ渡す。
図20を参照すると、スプライスドビデオストリームを再生する他の例となる方法が、概して、参照符号2000で示されている。
方法2000は開始ブロック2005を有する。開始ブロック2005は、制御を機能ブロック2010へ渡す。機能ブロック2010は、スプライスドビットストリームを構文解析し、それから取り出される仮想基準デコーダパラメータを受け取り、制御を機能ブロック2015へ渡す。
機能ブロック2015は、仮想基準デコーダ適合性を確かめ、制御を終了ブロック2099へ渡す。
ここで、本発明の多くの付随する利点/特徴の幾つかについて記載する。これらの一部は上述されている。例えば、1つの利点/特徴は、仮想基準デコーダパラメータによりスプライスドビデオストリームを作り出すスプライスドビデオストリーム発生器を有する装置である。
他の利点/特徴は、スプライスドビデオストリームのスプライシング位置が帯域内又は帯域外を示される、前述のスプライスドビデオストリーム発生器を有する装置である。
更なる他の利点/特徴は、上記のようにスプライスドビデオストリームのスプライシング位置が帯域内又は帯域外を示される、前述のスプライスドビデオストリーム発生器を有する装置であって、このスプライシング位置がネットワークアブストラクションレイヤユニットにより示される装置である。
更なる他の利点/特徴は、上記のようにスプライシング位置がネットワークアブストラクションレイヤユニットにより示される、前述のスプライスドビデオストリーム発生器を有する装置であって、ネットワークアブストラクションレイヤユニットが付加拡張情報メッセージ、又はストリームネットワークアブストラクションレイヤユニットの端部である装置である。
更に、他の利点/特徴は、スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットのリムーバル時間が前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、上記のようにスプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットのリムーバル時間が前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットがピクチャタイミング付加拡張情報メッセージにあるcpb_removal_delayフィールドで伝えられる装置である。
また、他の利点/特徴は、スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットの出力時間が該アクセスユニットのリムーバル時間とタイミングオフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置である。
加えて、他の利点/特徴は、上記のようにスプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットの出力時間が該アクセスユニットのリムーバル時間とタイミングオフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される装置である。
更に、他の利点/特徴は、上記のように時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい装置である。
更に、他の利点/特徴は、上記のように時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される装置である。
また、他の利点/特徴は、上記のように他の時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、前記他の時間オフセットがmax_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい装置である。
加えて、他の利点/特徴は、上記のように時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットが付加拡張情報メッセージで伝えられる装置である。
更に、他の利点/特徴は、上記のように他の時間オフセットが付加拡張情報メッセージで伝えられる、前述のスプライスドビデオストリーム発生器を有する装置であって、前記他の時間オフセットは、max_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい装置である。
更に、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって、スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぐよう前記スプライスドビデオストリームを作り出すスプライスドビデオストリーム発生器を有する装置である。
また、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がピクチャタイミング付加拡張情報メッセージにcpb_removal_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
加えて、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がピクチャタイミング付加拡張情報メッセージにdpb_output_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がバッファリング期間付加拡張情報メッセージにinitial_cpb_removal_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、スプライスドビデオストリーム発生器(1600)が国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−4Part10AVC標準/国際電気通信連合電気通信標準化部門(ITU−T)H.264提言に準拠するビットストリームを作る、前述のスプライスドビデオストリーム発生器を有する装置である。
また、他の利点/特徴は、スプライスドビデオストリームに係る仮想基準デコーダパラメータを受け取って、該仮想基準デコーダパラメータにより前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有する装置である。
加えて、他の利点/特徴は、スプライスドビデオストリームのスプライシング位置が帯域内又は帯域外を示される、前述のスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、上記のようにスプライスドビデオストリームのスプライシング位置が帯域内又は帯域外を示される、前述のスプライスドビデオストリーム発生器を有する装置であって、スプライシング位置がネットワークアブストラクションレイヤユニットにより示される装置である。
更に、他の利点/特徴は、上記のようにスプライシング位置がネットワークアブストラクションレイヤユニットにより示される、前述のスプライスドビデオストリーム発生器を有する装置であって、ネットワークアブストラクションレイヤユニットが付加拡張情報メッセージ、又はストリームネットワークアブストラクションレイヤユニットの端部である装置である。
また、他の利点/特徴は、スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットのリムーバル時間が前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置である。
加えて、他の利点/特徴は、上記のようにスプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットのリムーバル時間が前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットがピクチャタイミング付加拡張情報メッセージにあるcpb_removal_delayフィールドで伝えられる装置である。
更に、他の利点/特徴は、上記のように時間オフセットがピクチャタイミング付加拡張情報メッセージにあるcpb_removal_delayフィールドで伝えられる、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される装置である。
更に、他の利点/特徴は、スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットの出力時間は、該アクセスユニットのリムーバル時間とタイミングオフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置である。
また、他の利点/特徴は、上記のようにスプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも1つのアクセスユニットの出力時間は、該アクセスユニットのリムーバル時間とタイミングオフセットとに基づいて計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい装置である。
加えて、他の利点/特徴は、上記のように時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される装置である。
更に、他の利点/特徴は、上記のように他の時間オフセットが前記スプライスドビデオストリームをデコードする対応するデコーダで計算される、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットがmax_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい装置である。
更に、他の利点/特徴は、上記のように時間オフセットが、ピクチャタイミング付加拡張情報メッセージに置かれているdpb_output_delay構文要素と他の時間オフセットとの和に等しい、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットが付加拡張情報メッセージで伝えられる装置である。
また、他の利点/特徴は、上記のように他の時間オフセットが付加拡張情報メッセージで伝えられる、前述のスプライスドビデオストリーム発生器を有する装置であって、他の時間オフセットがmax_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい装置である。
加えて、他の利点/特徴は、スプライスドビデオストリームに対応する少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の変更された標準値を受け取って、前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の前記変更された標準値により前記スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー及びアンダーフロー状態を防ぎながら前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がピクチャタイミング付加拡張情報メッセージにcpb_removal_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
更に、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がピクチャタイミング付加拡張情報メッセージにdpb_output_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
また、他の利点/特徴は、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素がバッファリング期間付加拡張情報メッセージにinitial_cpb_removal_delay構文要素を有する、前述のスプライスドビデオストリーム発生器を有する装置である。
加えて、前記スプライスドビデオストリーム発生器が国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−4Part10AVC標準/国際電気通信連合電気通信標準化部門(ITU−T)H.264提言に準拠するビットストリームを作る、前述のスプライスドビデオストリーム発生器を有する装置である。
本原理のこれらの及び他の特徴及び利点は、本願の教示に基づいて当業者により容易に確かめられ得る。当然のことながら、本原理の教示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、特別の目的のプロセッサ、又はそれらの組合せで実施されてよい。
最も望ましくは、本原理の教示はハードウェア及びソフトウェアの組合せとして実施される。更に、ソフトウェアは、プログラム記憶ユニットで具体的に現されるアプリケーションプログラムとして実施されてよい。アプリケーションプログラムは、何れかの適切なアーキテクチャを有する機械にアップロードされて、その機械によって実行されてよい。望ましくは、機械は、1又はそれ以上の中央処理ユニット(“CPU”)、ランダムアクセスメモリ(“RAM”)、及び入出力(“I/O”)インターフェース等のハードウェアを有するコンピュータプラットフォームに実装される。コンピュータプラットフォームは、また、オペレーティングシステム及びマイクロインストラクションコードを有してよい。ここに記載される様々な処理及び機能は、CPUによって実行され得るマイクロインストラクションコードの部分若しくはアプリケーションプログラムの部分の何れか一方又はそれらの何らかの組合せであってよい。更に、補助データ記憶ユニット及び印刷ユニット等の様々な他の周辺ユニットがコンピュータプラットフォームへ接続されてよい。
更に、当然のことながら、添付の図面に表されている構成システム要素及び方法の幾つかは望ましくはソフトウェアで実施されるので、システム要素又は処理機能ブロックの間の実際の接続は、本原理がプログラムされる方法に依存して異なることがある。本願の教示を鑑み、当業者は、本原理のこれらの及び類似する実施又は構成を意図することができるであろう。
例となる実施形態が添付の図面を参照して記載されてきたが、当然のことながら、本原理はこれらの厳密な実施形態に限られず、且つ、様々な変更及び修正は、本原理の適用範囲又は精神から外れることなく当業者によってそれらの実施形態において行われ得る。全てのかかる変更及び修正は、添付の特許請求の範囲に挙げられている本原理の適用範囲内に包含されるよう意図される。
[関連出願の相互参照]
本願は、2007年6月8日に出願した米国仮出願第60/883,852号に基づく優先権を主張するものであり、同米国出願の全内容を本願に参照により援用する。

Claims (24)

  1. 仮想基準デコーダパラメータによりスプライスドビデオストリームを作り出し、又はスプライスドビデオストリームに係る仮想基準デコーダパラメータを受け取って、該仮想基準デコーダパラメータを用いて前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有し、
    前記スプライスドビデオストリームを形成する少なくとも2つのストリームのうちの少なくとも一方のアクセスユニットの出力時間は、前記アクセスユニットリムーバル時間と時間オフセットとに基づいて前の計算から決定され、前記時間オフセットは、dpb_output_delay構文要素及び他の時間オフセットの和に等しく、前記他の時間オフセットは、max_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい、装置。
  2. 前記スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも一方のアクセスユニットのリムーバル時間は、前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて前の計算から決定される、請求項1載の装置。
  3. 前記時間オフセットは、ピクチャタイミング付加拡張情報メッセージにあるcpb_removal_delayフィールドで伝達又は受信をされる、請求項記載の装置。
  4. 前記dpb_output_delay構文要素は、ピクチャタイミング付加拡張情報メッセージから決定される、請求項記載の装置。
  5. 前記他の時間オフセットは、前記スプライスドビデオストリームをデコードする対応するデコーダで計算される、請求項3又は4記載の装置。
  6. 前記他の時間オフセットは付加拡張情報メッセージから決定される、請求項記載の装置。
  7. 少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって、スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー状態及びアンダーフロー状態を防ぐよう前記スプライスドビデオストリームを作り出し、又は前記スプライスドビデオストリームに対応する前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の変更された前記標準値を受け取って、前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の前記変更された標準値を用いて前記スプライスドビデオストリームに関連する前記デコーダバッファのオーバーフロー状態及びアンダーフロー状態を防ぎながら前記スプライスドビデオストリームを再生するスプライスドビデオストリーム発生器を有し、
    前記スプライスドビデオストリームは、max_initial_delay構文要素である他の構文要素に基づいて生成又は再生される、装置。
  8. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、ピクチャタイミング付加拡張情報メッセージにcpb_removal_delay構文要素を有する、請求項記載の装置。
  9. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、ピクチャタイミング付加拡張情報メッセージにdpb_output_delay構文要素を有する、請求項記載の装置。
  10. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、バッファリング期間付加拡張情報メッセージにinitial_cpb_removal_delay構文要素を有する、請求項記載の装置。
  11. 前記スプライスドビデオストリームは、国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−4Part10AVC標準/国際電気通信連合電気通信標準化部門(ITU−T)H.264提言に準拠するよう再生される、請求項記載の装置。
  12. 仮想基準デコーダパラメータによりスプライスドビデオストリームを作るステップ、又は
    スプライスドビデオストリームに係る仮想基準デコーダパラメータを受け取って、該仮想基準デコーダパラメータを用いて前記スプライスドビデオストリームを再生するステップ
    を有し、
    前記スプライスドビデオストリームを形成する少なくとも2つのストリームのうちの少なくとも一方のアクセスユニットの出力時間は、前記アクセスユニットリムーバル時間と時間オフセットとに基づいて前の計算から決定され、前記時間オフセットは、dpb_output_delay構文要素及び他の時間オフセットの和に等しく、前記他の時間オフセットは、max_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい、
    方法。
  13. 前記スプライスドビデオストリームを形成する少なくとも2つのストリームのうち少なくとも一方のアクセスユニットのリムーバル時間は、前のアクセスユニットのリムーバル時間と時間オフセットとに基づいて前の計算から決定される、請求項12載の方法。
  14. 前記時間オフセットは、ピクチャタイミング付加拡張情報メッセージにあるcpb_removal_delayフィールドで伝達又は受信をされる、請求項13記載の方法。
  15. 前記dpb_output_delay構文要素は、ピクチャタイミング付加拡張情報メッセージから決定される、請求項12記載の方法。
  16. 前記他の時間オフセットは、前記スプライスドビデオストリームをデコードする対応するデコーダで計算される、請求項14又は15記載の方法。
  17. 前記他の時間オフセットは付加拡張情報メッセージから決定される、請求項15記載の方法。
  18. 少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって、スプライスドビデオストリームに関連するデコーダバッファのオーバーフロー状態及びアンダーフロー状態を防ぐ前記スプライスドビデオストリームを作るステップ、又は
    前記スプライスドビデオストリームに対応する前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の変更された前記標準値を受け取って、前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の前記変更された標準値を用いて前記スプライスドビデオストリームに関連する前記デコーダバッファのオーバーフロー状態及びアンダーフロー状態を防ぎながら前記スプライスドビデオストリームを再生するステップ
    を有し、
    前記スプライスドビデオストリームは、max_initial_delay構文要素である他の構文要素に基づいて生成又は再生される、方法。
  19. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、ピクチャタイミング付加拡張情報メッセージにcpb_removal_delay構文要素を有する、請求項18記載の方法。
  20. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、ピクチャタイミング付加拡張情報メッセージにdpb_output_delay構文要素を有する、請求項18記載の方法。
  21. 前記少なくとも1つの仮想基準デコーダに関連する高レベル構文要素は、バッファリング期間付加拡張情報メッセージにinitial_cpb_removal_delay構文要素を有する、請求項18記載の方法。
  22. 前記スプライスドビデオストリームは、国際標準化機構(ISO)/国際電気標準会議(IEC)MPEG−4Part10AVC標準/国際電気通信連合電気通信標準化部門(ITU−T)H.264提言に準拠するよう再生される、請求項18記載の方法。
  23. エンコードをされているビデオ信号データを有する記憶媒体であって、
    プライスドビデオストリームに関連するデコーダバッファのオーバーフロー状態及びアンダーフロー状態を防ぐスプライスドビデオストリームを有し、
    前記スプライスドビデオストリームは、少なくとも1つの仮想基準デコーダに関連する高レベル構文要素の標準値を変更することによって作られ
    前記スプライスドビデオストリームは、max_initial_delay構文要素である他の構文要素に基づいて生成又は再生される、記憶媒体。
  24. エンコードをされているビデオ信号データを有する記憶媒体であって、
    仮想基準デコーダパラメータにより作られるスプライスドビデオストリームを有し、
    前記スプライスドビデオストリームを形成する少なくとも2つのストリームのうちの少なくとも一方のアクセスユニットの出力時間は、前記アクセスユニットリムーバル時間と時間オフセットとに基づいて前の計算から決定され、前記時間オフセットは、dpb_output_delay構文要素及び他の時間オフセットの和に等しく、前記他の時間オフセットは、max_initial_delay構文要素と前記dpb_output_delay構文要素との間の差に等しい、記憶媒体。
JP2009544943A 2007-01-08 2008-01-07 ビデオストリームのスプライシングのための方法及び装置 Expired - Fee Related JP5114495B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US88385207P 2007-01-08 2007-01-08
US60/883,852 2007-01-08
PCT/US2008/000187 WO2008085935A1 (en) 2007-01-08 2008-01-07 Methods and apparatus for video stream splicing

Publications (3)

Publication Number Publication Date
JP2010516103A JP2010516103A (ja) 2010-05-13
JP2010516103A5 JP2010516103A5 (ja) 2011-02-24
JP5114495B2 true JP5114495B2 (ja) 2013-01-09

Family

ID=39461914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009544943A Expired - Fee Related JP5114495B2 (ja) 2007-01-08 2008-01-07 ビデオストリームのスプライシングのための方法及び装置

Country Status (6)

Country Link
US (1) US20100074340A1 (ja)
EP (1) EP2123044A1 (ja)
JP (1) JP5114495B2 (ja)
KR (1) KR101455161B1 (ja)
CN (2) CN102984544A (ja)
WO (1) WO2008085935A1 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8875199B2 (en) 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US20090180546A1 (en) * 2008-01-09 2009-07-16 Rodriguez Arturo A Assistance for processing pictures in concatenated video streams
US8804845B2 (en) 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8958486B2 (en) 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
US8718388B2 (en) 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
US8345774B2 (en) * 2008-01-11 2013-01-01 Apple Inc. Hypothetical reference decoder
US20100118941A1 (en) * 2008-04-28 2010-05-13 Nds Limited Frame accurate switching
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
WO2010021665A1 (en) * 2008-08-20 2010-02-25 Thomson Licensing Hypothetical reference decoder
EP2356812B1 (en) * 2008-11-12 2015-06-10 Cisco Technology, Inc. Processing of a video program having plural processed representations of a single video signal for reconstruction and output
US20100218232A1 (en) * 2009-02-25 2010-08-26 Cisco Technology, Inc. Signalling of auxiliary information that assists processing of video according to various formats
US8782261B1 (en) 2009-04-03 2014-07-15 Cisco Technology, Inc. System and method for authorization of segment boundary notifications
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
EP2472866A1 (en) 2011-01-04 2012-07-04 Alcatel Lucent Method for providing an HTTP adaptive streaming service
CA2840427C (en) * 2011-06-30 2018-03-06 Microsoft Corporation Reducing latency in video encoding and decoding
US9131245B2 (en) 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US9578326B2 (en) 2012-04-04 2017-02-21 Qualcomm Incorporated Low-delay video buffering in video coding
JP6019824B2 (ja) * 2012-07-02 2016-11-02 富士通株式会社 動画像符号化装置及び動画像符号化方法ならびに動画像符号化用コンピュータプログラム
JP5891975B2 (ja) * 2012-07-02 2016-03-23 富士通株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
US9654802B2 (en) * 2012-09-24 2017-05-16 Qualcomm Incorporated Sequence level flag for sub-picture level coded picture buffer parameters
US8989508B2 (en) * 2012-09-28 2015-03-24 Sharp Kabushiki Kaisha Electronic device for signaling a sub-picture buffer parameter
CN103959796B (zh) * 2012-09-29 2017-11-17 华为技术有限公司 数字视频码流的解码方法拼接方法和装置
JP6094126B2 (ja) * 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
US9154785B2 (en) 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US9661341B2 (en) * 2013-01-07 2017-05-23 Microsoft Technology Licensing, Llc Syntax and semantics for buffering information to simplify video splicing
CN109379603A (zh) 2013-04-07 2019-02-22 杜比国际公司 用信号通知输出层集的改变
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
CN104519370B (zh) * 2013-09-29 2018-06-08 中国电信股份有限公司 一种视频流的拼接方法和系统
JP6558246B2 (ja) 2013-10-11 2019-08-14 ソニー株式会社 送信装置、送信方法および受信装置
US10375406B2 (en) 2014-03-07 2019-08-06 Sony Corporation Image encoding device and method, and image processing device and method for enabling bitstream concatenation
US10187650B2 (en) * 2014-06-17 2019-01-22 Stmicroelectronics International N.V. Video encoders/decoders and video encoding/decoding methods for video surveillance applications
CN104778957B (zh) * 2015-03-20 2018-03-02 广东欧珀移动通信有限公司 一种歌曲音频处理的方法及装置
US20170332096A1 (en) * 2016-05-11 2017-11-16 Advanced Micro Devices, Inc. System and method for dynamically stitching video streams
JP6202141B2 (ja) * 2016-05-30 2017-09-27 富士通株式会社 動画像符号化復号システム
JP6202140B2 (ja) * 2016-05-30 2017-09-27 富士通株式会社 動画像符号化装置
CN106210560A (zh) * 2016-07-17 2016-12-07 合肥赑歌数据科技有限公司 基于流形的视频拼接方法
JP6399189B2 (ja) * 2017-10-11 2018-10-03 富士通株式会社 動画像符号化方法
CN111294644B (zh) 2018-12-07 2021-06-25 腾讯科技(深圳)有限公司 视频拼接方法、装置、电子设备及计算机可读存储介质
CN112514384A (zh) * 2019-01-28 2021-03-16 株式会社 Xris 视频信号编码/解码方法及其装置
CN110164242B (zh) * 2019-06-04 2020-12-08 平顶山学院 一种声乐演唱模拟训练平台
CN114503164A (zh) * 2019-10-07 2022-05-13 华为技术有限公司 基于视频的点云压缩(v-pcc)分量同步
US11741634B2 (en) 2019-10-09 2023-08-29 Sony Group Corporation Synchronization of decoded frames before point cloud reconstruction
US20230101262A1 (en) * 2021-09-29 2023-03-30 At&T Intellectual Property I, L.P. Application-level network slicing for high quality of experience

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3721972B2 (ja) * 2000-09-27 2005-11-30 日本ビクター株式会社 Mpeg画像データ記録方法
AU2002363194B2 (en) * 2001-10-29 2008-04-17 Shinji Gotou Recycled lumber producing method
JP4875285B2 (ja) * 2002-04-26 2012-02-15 ソニー株式会社 編集装置および方法
US7532670B2 (en) * 2002-07-02 2009-05-12 Conexant Systems, Inc. Hypothetical reference decoder with low start-up delays for compressed image and video
JP3534742B1 (ja) * 2002-10-03 2004-06-07 株式会社エヌ・ティ・ティ・ドコモ 動画像復号方法、動画像復号装置、及び動画像復号プログラム
JP2004193687A (ja) * 2002-12-06 2004-07-08 Sony Corp 非初期化バッファモデルを用いた方法
US7317404B2 (en) * 2004-01-14 2008-01-08 Itron, Inc. Method and apparatus for collecting and displaying consumption data from a meter reading system
WO2005071970A1 (en) * 2004-01-16 2005-08-04 General Instrument Corporation Method and apparatus for determining timing information from a bit stream
US7826536B2 (en) * 2005-12-29 2010-11-02 Nokia Corporation Tune in time reduction

Also Published As

Publication number Publication date
CN101606389B (zh) 2013-06-12
WO2008085935A1 (en) 2008-07-17
EP2123044A1 (en) 2009-11-25
CN102984544A (zh) 2013-03-20
CN101606389A (zh) 2009-12-16
KR101455161B1 (ko) 2014-10-28
JP2010516103A (ja) 2010-05-13
KR20090101457A (ko) 2009-09-28
US20100074340A1 (en) 2010-03-25

Similar Documents

Publication Publication Date Title
JP5114495B2 (ja) ビデオストリームのスプライシングのための方法及び装置
KR101749472B1 (ko) 서브픽처 버퍼 파라미터를 시그널링하기 위한 전자 장치
JP5072893B2 (ja) 画像符号化方法および画像復号化方法
US20200177907A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
US8724710B2 (en) Method and apparatus for video encoding with hypothetical reference decoder compliant bit allocation
KR20140130433A (ko) 가상 레퍼런스 디코더의 초-저지연 모드를 사용하기 위한 방법 및 장치
CN104519370B (zh) 一种视频流的拼接方法和系统
JP5201201B2 (ja) 復号装置及び復号方法
JP5152316B2 (ja) 符号化装置及び符号化方法
JP2004193687A (ja) 非初期化バッファモデルを用いた方法
JP2008125120A (ja) 符号化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees