JP2021145343A - 効率的な適応ストリーミング - Google Patents
効率的な適応ストリーミング Download PDFInfo
- Publication number
- JP2021145343A JP2021145343A JP2021078695A JP2021078695A JP2021145343A JP 2021145343 A JP2021145343 A JP 2021145343A JP 2021078695 A JP2021078695 A JP 2021078695A JP 2021078695 A JP2021078695 A JP 2021078695A JP 2021145343 A JP2021145343 A JP 2021145343A
- Authority
- JP
- Japan
- Prior art keywords
- video
- stream
- layer
- video stream
- media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 71
- 239000010410 layer Substances 0.000 claims abstract description 326
- 230000007704 transition Effects 0.000 claims abstract description 88
- 230000014509 gene expression Effects 0.000 claims abstract description 47
- 239000011229 interlayer Substances 0.000 claims abstract description 35
- 230000002123 temporal effect Effects 0.000 claims description 132
- 238000000034 method Methods 0.000 claims description 63
- 230000001419 dependent effect Effects 0.000 claims description 40
- 238000005562 fading Methods 0.000 claims description 32
- 238000009826 distribution Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 9
- 239000002356 single layer Substances 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 6
- 230000005012 migration Effects 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 17
- 230000011664 signaling Effects 0.000 description 17
- 239000000284 extract Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000153 supplemental effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 101710084218 Master replication protein Proteins 0.000 description 3
- 101000708578 Milk vetch dwarf virus (isolate N) Para-Rep C3 Proteins 0.000 description 3
- 101710112083 Para-Rep C1 Proteins 0.000 description 3
- 101710112078 Para-Rep C2 Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- 241000906446 Theraps Species 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 208000021017 Weight Gain Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000004584 weight gain Effects 0.000 description 1
- 235000019786 weight gain Nutrition 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/438—Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
- H04N21/4383—Accessing a communication channel
- H04N21/4384—Accessing a communication channel involving operations to reduce the access time, e.g. fast-tuning for reducing channel switching latency
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440227—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
た第2の層を有する、階層されたビデオストリームまたは高い空間分解能ストリームの形式でビデオを出力することを切り替えることをサポートする。この手段により、RASLピクチャのようなランダムアクセス依存ピクチャの前述の欠落参照ピクチャを置換するための情報がクライアントで容易に利用可能になる。ランダムアクセス依存ピクチャの参照ピクチャが残余符号化なしで符号化された階層化されたビデオを使用して利用可能になる第2のストリームは、層間予測を使用して符号化された階層化されたビデオの層であってもよく、すなわち、層間予測なしに符号化された層である。後者の場合、層間予測は、利用可能なランダムアクセス依存ピクチャの参照ピクチャを作成するためにのみ使用されることを意味する。
クライアントは、第1および第2のメディアストリームと共に補助メディアストリームを取り出し、第2の補助ストリームの代わりに補助メディアストリームを再生するフェーディングフェーズによって、第1の表現から第2の表現に切り替えるときに、フェードするために同じものを使用することができる。
すなわち、ピクチャ番号2,3および4のセットは、共通して以下を有する。
1)それらは、時間的予測によって、ランダムアクセスポイントピクチャ、ここでは例
示的ピクチャ番号5を直接的または間接的に参照し、
2)提示時間順序及び復号順序に先行する参照ピクチャを時間的予測により直接的又は間接的に参照し、直接的または間接的に参照されるランダムアクセスポイントピクチャであり、図2では例示的な参照ピクチャ番号1である。ランダムアクセスポイントピクチャ番号5がビデオデータストリームにランダムにアクセスするために使用される場合、ピクチャのこのセットはスキップされる可能性があるこのピクチャ番号2,3および4のセットに対する参照ピクチャ番号1が存在するため欠落しているので、ビデオ10はオープンGOP構造を使用して符号化され、復号順では、ランダムアクセスポイントピクチャ番号5の上流にある。
の@mediaStreamStructure属性で既に通知することが可能である。
でビデオを出力することとの間の切り替えをサポートするという事実は、例えば、クライアントの能力に現れ、特定の表現を出力装置20に要求することによって異なる空間分解能でビデオ24を出力装置20から取り出すために、後で説明する実施形態を使用することができる。後で説明するように、出力装置20は、例えば、一方では適切に概念化されたデータ構造を記憶する記憶装置32と、他方ではマニフェストプロバイダ34との組み合わせであってもよい。マニフェストプロバイダ34は、例えば、クライアントがそれぞれの要求によってストレージ32にどのようにアクセスする可能性があるかを記述するマニフェストをクライアントに提供することができる。そうすることで、クライアントは、マニフェストに基づいて、第1の空間解像度でビデオにエンコードされた時間セグメントと、第2の空間解像度でビデオにエンコードされた時間セグメントとの間で選択する。この点に関する詳細は以下に述べる。
をそれぞれ他のものに有する場合を示している。これは代替の実施形態による場合である必要はないことに留意されたい。出力装置20の動作モードが、このストリームのランダムアクセス依存ピクチャを失うことなく、増大した空間解像度ビデオストリーム38を形成するためのオープンGOP構造の使用をどのように可能にするかを説明するためであり、出力装置20の説明は、図6に示す対応するクライアント装置の記述によって短時間中断されなければならない。
取り出すか、サーバにおいて、第3の時間的部分62または位相内で、クライアント装置50は、サーバにおいて提供された、またはダウンロード可能な他のストリームの時間セグメントを取り出す。その間に、第2の時間的部分64、すなわち、時間的部分62の前にあり、次の時間的部分60がある。この時間的部分内で、クライアント装置50は、矢印66で示すように、第1の空間解像度から第2の空間解像度へアップサンプリングすることによって、第2の空間解像度の第2のピクチャの代替を取得する。この測定によって、クライアント装置50は、第2の空間解像度のピクチャ、すなわち代替ピクチャ68の代替または補足推定値68を取得する。これらの代替ピクチャ68のうち、その一部は、時間的部分62内のビデオ24のランダムアクセス依存ピクチャのランダムアクセス依存ピクチャの参照ピクチャの代替として使用することができる。これらの代替ピクチャ68のうち、それらのうちの幾つかは、時間的部分62内のビデオ24のランダムアクセス依存ピクチャのランダムアクセス依存ピクチャの参照ピクチャの代替として使用されてもよい。すなわち、時間フェーズ62の間にクライアント装置50によってダウンロードされた表現は、オープンGOP構造を使用して符号化されてもよく、それにもかかわらず、ランダムアクセス依存ピクチャが失われるのを防ぐことができる。
置50は、層L1およびL2の両方をビデオデコーダ58に送り、そしてそれは、上述のように層間予測44を用いて第2の層L2が符号化されるときに第2の層L2を復号する際にアップサンプリング66を実行する。この対策により、ビデオデコーダ58は、内部復号ピクチャバッファを第2の空間解像度のピクチャで満たし、そしてそれは、次に、クライアント装置50が、後続の時間部分62の間に、対応する時間セグメントを取得することによって取り出される空間分解能の高いビデオストリーム38のランダムアクセス依存ピクチャのための参照ピクチャとして働くことができる。先行する時的部分60において、クライアント装置50は、復号化のために第1の層をビデオデコーダ58に、すなわち第2の層なしで単に提出するだけでよい。クライアント装置50は、時的部分60中に第2の層を取り出してもよいし、例えば、出力装置20は、階層化されたビデオストリーム36の層L1および層L2を別個に取り出しまたは取得することを可能にする。
、すなわち、データストリーム52の第1のセグメントは、階層化されたビデオストリーム36の層L1およびL2を搬送し、それに続く時間的セグメントは、ストリーム38と独立して符号化された層L2を運ぶ。理解されるように、層間のアップサンプリングによって得られた階層化されたデータストリーム36の層L2のピクチャは、ストリーム38の次のセグメントのRASLピクチャに対する参照ピクチャとして機能し、このセグメントは、層間予測なしで符号化され、すなわち、ストリーム38の独立した層L2内のRASLピクチャの参照ピクチャは、デコーダ58の復号ピクチャバッファ(DPB)内に正しい解像度で存在することが要求されるが、これは、上記の方法で異なる空間分解能を切り替える可能性を妨げるものではありません。
しかし、サーバおよびクライアント、すなわち装置20および50は、時間的部分64の移行フェーズにデフォルトの一時的な名前を使用することができ、そのため、上述の信号伝達は、例えば、移行フェーズに関するマニフェストが、単に、所定の長さの移行フェーズの必要性と、各移行フェーズの離脱とを切り換えるという意味でのバイナリ信号化に対応するだけであり、あるいは、サーバが、移行フェーズの長さおよび時間的な部分64の長さにそれぞれクライアントに通知することも可能である。長さは、サーバとクライアントとの間で合意された複数の所定の長さ値のうちの1つをインデックス付けすることによって示すことができ、ビデオがアダプティブストリーミングプロトコルによって取り出し可能な時間セグメントの長さおよび単位の表示、またはピクチャ順序カウントなどのような時間単位での表示を含む。例えば、サーバまたは装置20からクライアントまたは装置50に送信されるマニフェストまたはメディアプレゼンテーション記述は、スイッチング時間シフトまたはnumSwitchRepSegmentsのような時間的部分64の長さの指示を提供され得る。
・・36Nと示される。時間整合された時間セグメント38iおよび36iは、ビデオの対
応する時間的部分に関連し、またはその中に符号化されている。図11の実施形態によれば、階層化されたビデオストリーム36の層L2は、クライアントによる別個に取り出しは可能ではない。むしろ、層L2は、ストリーム36の層L1が搬送される同じセグメン
ト36i内に追加のトラックとして含まれる。したがって、82で示すように、クライア
ントまたはクライアント装置50は、サーバまたは装置20からデータストリーム38の形態でビデオを取り出す任意の開始86の前に移行フェーズ84をスケジュールする。移行フェーズ84内で、ストリーム22/52は、ストリーム36の対応する時間セグメントのシーケンスを含む。すなわち、移行フェーズ84の間に、装置50は、階層化されたビデオストリーム36のセグメントから移行フェーズ84に属するセグメントを取り出し、それによって時間的部分64を形成する。86以降、装置50は、高い空間解像度からより低い空間解像度に切り替えるまで、ストリーム38のセグメントのシーケンスから時間セグメントを取り出す。移行フェーズ84の間の装置50の動作モードと前の時間との間の差は以下の通りである。
マニフェスト90は、例えば、ビデオデコーダ58が必要とする、層L2を復号するための復号能力を知らせ、そしてそれは、層L1に依存し、すなわち、「補助スイッチングトラック」を復号化し、ビデオデコーダ58が階層化されたビデオストリーム36の低解像度の層L1だけを復号するための復号能力を示す。
らに、@switchingMimeTypeの属性は、「補助スイッチングトラック」が復号化されたと
きに必要な機能を記述するように定義する必要がある。最後に、「補助スイッチングトラック」を復号化する必要があるスイッチの前に、DASHのクライアントがより高い解像度の表示にシームレスに切り替えることができるかどうかを判断できるように信号を送る必要がある(@switchingTimeShift/@numSwitchRepSegments)。このような高い解像度表現に切り替えるには、(@switchingTimeShift/@numSwitchRepSegments)で記述された時間よりも早く、SAPから下位表現にランダムアクセスする必要がある。具体的なシグナリングは次のように見ることができる。
イアントのようなマニフェストファイルに通知するために使用され得る。
た2つの値のリストである。
に切り替え可能であるかを示すことができることを示している。そのような表現を明示的に示すこの記述子とは無関係に、記述子はそのMPD内に存在することによって可能であり、表現L2に切り替える前に予め完全化された1つのセグメントは、例えばオープンG
OP構造のためにスイッチングポイントに先行するすべての時間的参照を有することが十分であることを示す。言い換えれば、デフォルトでは、[TEPT、TDEC]内の提示時間を有するセグメントN内の全てのアクセスユニットが制約されない限り、それらは、セグメントNまたはセグメントN−1のアクセスユニットにのみ依存する。したがって、この記述子が存在するセグメントNで表現が変更された場合、セグメントN−1の間に追加のメディアストリームを復号する必要があり、すなわち、図11では、「switch-from」の表
現で示された@codecsの属性に一致する階層化されたストリームのエンハンスメント層が存在し、その存在はswitchingMimeTypeの存在によって示され、第1のSAP(すなわち
、インターバル[TEPT、TDEC]内の)に先行する全てのアクセスユニットを復号することができるようにするために、図11では、単一の層の高品質ストリームを使用する。
したがって、この記述子が存在するセグメントNで表現が変更された場合、セグメントN−1の間に追加のメディアストリームを復号する必要があり、つまり、図11では、階層化されたストリームのエンハンスメントレイヤーであり、「switch-from」の表現で示
される@codecs属性に適合する層とは異なる。その存在はswitchingMimeTypeの存在によ
って示され、第1のSAP(すなわち、インターバル[TEPT、TDEC]内の)に先行する全てのアクセスユニットを復号することができるようにするために、図11では単一の層の高品質ストリームを使用する。
ント装置50によって個々に取得可能である。ここで、クライアント装置50は、移行フェーズ84に先行する時間部分の間に、出力装置20からセグメント361 iを単に取り出すだけである。移行フェーズ84の間に、クライアント装置50は、出力装置20から時間セグメント361 iおよび362 iの両方のビデオの各時間セグメントiを取り出し、層L1だけでなく層L2にもビデオデコーダ58に転送される。時間86から、クライアント装置50は、空間解像度の高いビデオストリーム38の時間セグメント38iを取り出し
または取り込み、ビデオデコーダ58にそれを転送する。再び、図12は、情報88がクライアント装置50を制御して移行フェーズ84を適用するか適用しないかを示すことができることを示している。
senationを使用して「切り替え専用」としてマークする必要がある。前の場合に関しては、タイミング情報が含まれて、その時点以降、他の表現に切り替えることができるように、そのような表現を復号する必要があるか、またはRep2の切り替えポイントより前のRep1のSAPから復号されている限り、すべての必要な参照が利用できるように制限することができる。
イント)と、より高い解像度のオープンOpen GOP RAPのみを有することからなる。これにより、使用可能なすべてのRAPで最低品質にシームレスに切り替えることができる。あるいは、より多くの解像度が利用可能な場合、例えば3、最も低い解像度はGOP RAPを閉じただけであり、最も高い解像度はOpen GOP RAPsのみであ
り、中間解像度表現は、両方の混合を有する。切り替えは、RAPが存在する場合には可能であるが、クローズドGOPの現在の場合にのみ切り替わる。そのような場合、既存の@switchingPeriodをupSwitchingとdownSwitchingとを区別するように拡張する必要があ
る。
る場合において、有効範囲は、SPSのもの、すなわち次の有効なSPSによって置換されるまでのピクチャのシーケンスであってもよく、SEIにおいて構文要素を伝達する場合において、スコープは、そのソートの次のSEI、すなわちconstrained_skipped_leading_pictures SEIメッセージによって置換されるまでピクチャのシーケンスであってもよい。すなわち、そのスコープの間、ビデオは、max_reference_poc_difference [i] に関して約束に従うビデオストリームにコード化される。「サブレイヤ」は、異なる時間レイヤを区別し、例えば減少するサブレイヤIDiでは、増加するピクチャ数が放棄される。そのため、上位サブレイヤから下位サブレイヤへの時間的なピクチャ相互依存性の消失のために、max_reference_poc_difference [i] は、iが減少するにつれて単調に減少する。あるいは、max_reference_poc_difference [i] ≦max_reference_poc
_difference [i+1]である。しかし、他の構造も想像できるかも知れません。しかしながら、上記シグナリングは単なる例として理解されるべきであり、長さ表示max_reference_poc_difference [i] のサブレイヤ依存性は、中断されている可能性があることに注意して下さい。例えば、時間的スケーラビリティをまったくサポートしていないか、または最高のサブレイヤに対する単なるシグナリングmax_reference_poc_differenceであっ
てもよい。max_reference_poc_differenceは、例えばPOCの数、すなわちピクチャ
の数において、最初に参照された後続のRASLと最初に参照されるRASLとの間の興味深い時間差を測定する。その差または長さは、提示時間順に測定される。
て、すなわち図2に例示的に示されるようなオープンGOP構造における時間的予測を使用して符号化される。すなわち、ピクチャは、表示/表示順にRAピクチャに先行するRAD(ランダムアクセス依存)ピクチャによって、デコード順に従うRA(ランダムアクセス)ピクチャをそれぞれ含むGOPにグルーピングされる構成と、復号化順に先行するRAピクチャに先行するRAM(潜在的にはMissingのランダムアクセスの場合)はもち
ろん、RAピクチャも参照する。階層化されたビデオストリーム36は、第1の空間解像度でビデオを符号化した第1の層L1と、第2の空間解像度および第2の品質よりも低い第1の品質のビデオのピクチャを符号化し、層間アップサンプリングによって、予測残差符号化なしで第1の層から第2の層への層間予測(44)を使用する第2の層L2と、を含む。
上記の例に示すように、第2の層L2は、層間アップサンプリングによって、すなわち予測残差符号化なしでかつ時間予測なしで、第1の層から第2の層への層間予測(44)を単に使用してビデオのピクチャを符号化することができる。つまり、L2のピクチャは、層L1の時間的に対応するピクチャのアップサンプリングされたバージョンとして単に符号化される。
ト50に通知するように構成される。図10および図11に示すような共通セグメントを使用する場合、出力装置は、第1のビデオストリーム36の形態の第1の空間解像度でクライアントのビデオの可用性を記述するマニフェストをクライアントに提供し、そして、第2のビデオストリーム38の形態の第2の空間解像度で、第1のビデオストリームの時間セグメントおよび第2の層L2の目的の中に第2の層L2が存在することを示し、第2のビデオストリーム(38)に切り替える前に、移送区間の間に第1の空間解像度から第2の空間解像度に切り替えるときに再生されることを意味する。次いで、マニフェストは、それぞれ、第1のビデオストリームおよび第2のビデオストリームの時間セグメントを取り出すためのアドレスを計算する計算ルールを示す。別個のセグメントを使用する場合には、装置20は、第3のビデオストリーム、すなわち層L1によって表されるストリームの形態で取り出すためにビデオをクライアントに提供する。装置20は、第3のビデオストリームL1の形態の第1の空間解像度で、第2のビデオストリーム38の形態の第2の空間解像度のクライアントのためのビデオの可用性を記述するマニフェストをクライアントに提供する。次に、マニフェストは、第1の空間解像度から第2の空間解像度に切り替える際に、第1のビデオストリームの時間セグメント、すなわちL2が、移行フェーズ64の間に第3のビデオストリームL1の時間セグメントとともに取り出されることを示し、すなわち第3のビデオストリームから第1のビデオストリームに、次に、第1のビデオストリームから第2のビデオストリームへの切換えの間に行われる。マニフェストは、第1、第2および第3のビデオストリームの時間セグメントを取り出すためのアドレスを計算する計算ルールを示す。付加的に、ビデオは、さらなるビデオストリームの形態で、第1の空間解像度よりもさらに高い追加の第3の空間解像度でクライアントに提供されてもよいことが示されており、しかしながら、第2のビデオストリーム44は、閉状態および開状態のGOP構造を使用して交互に符号化される。次いで、装置は、さらに、第3の空間解像度でクライアントのためのビデオの可用性を記述するマニフェストを有する更なるビデオストリームの形態で取り出すためにクライアントにビデオを提供するように構成されてもよく、更なるビデオストリームの形態で第1および第2の空間分解能よりも高く、更なるビデオストリームの時間的セグメントを取り出すためのアドレスを計算する計算ルールをマニフェストに示すと共に、装置20は、第3の空間解像度から第2の空間解像度に切り替えるためのダウンスイッチング時にクライアントに通知してもよく、第1または第3のビデオストリームから第2のビデオストリームへの切り換えのために、別々の時間インスタンス上に落ちる可能性があるので、アップ−スイッチングの機会を提供する。一般に、例えば、ダウンスイッチングは、クローズドGOP構造のランダムアクセスポイントにおいてのみ許可されてもよく、第2のビデオストリームをアップスイッチングすることは、オープンGOP構造のランダムアクセスポイントにおいても可能である。すなわち、第1のビデオストリームL2使用し、時間シフトまたは移行フェーズの長さに従う上記の輪郭を描いたやり方で可能であり、装置20は、マニフェスト内に指示することができる。第1のビデオストリームL2および第2のビデオストリームは、1つのデコーダに供給されるように一緒にスプライスされることが可能である。これは、L1のクローズドGOP構造へのダウンスイッチングを制限する場合にL1およびストリーム38を一緒にスプライシングする場合にも当てはまる。
計する場合には、アップサンプリング66が、スケーラブルビデオデコーダによって実行されるように、ストリーム36とストリーム38とを切り替える接合部においてストリーム36と38とを容易に連結することができる。装置50は、第1のビデオストリームの形式のビデオの取り出しから第2のビデオストリームの形態のビデオの取り出しに切り替える前に、移行フェーズ64をスケジュールするように構成される。これは、アップサンプリング66を用いてRAMピクチャを置換するのに十分な時間を提供する。
リームのSEIから移行フェーズの長さを導出するように構成することができる。これに関して、上記の説明はまた、例えば図2に例示されているオープンGOP構造における時間的予測を使用するやり方で、ピクチャのシーケンスを符号化したビデオストリームを明らかにし、すなわち、時間的予測により、提示時間順序に関して直接的または間接的に参
照する少なくとも1つのRADピクチャがピクチャのシーケンスの中に存在するようにし、ピクチャのシーケンスの後続するRAピクチャと、ランダムアクセスポイントピクチャを、提示時間順序および復号順序の点で先行するRAM参照ピクチャとに分割する。ビデオストリームは、少なくとも1つのランダムアクセス依存ピクチャの参照ピクチャと、少なくとも1つのランダムアクセス依存ピクチャによって直接的または間接的に参照される参照ピクチャとの間の最大時間的距離を示すmax_reference_poc_differenceなどの構
文要素を含む。ビデオストリームは、階層化されたビデオストリームであってもよく、ピクチャのシーケンスは、階層化されたビデオストリームの層の1つのピクチャであってもよい。ストリーム38は、例えば、そのようなビデオストリームであってもよい。対応するピクチャのシーケンスをビデオストリームに符号化するビデオエンコーダは、シンタックス要素をデータストリームに挿入することができる。そのようなエンコーダは、図2の19に例示的に示されている。したがって、構文要素は、最大時間距離を示す情報である。それは、POC(ピクチャ順序数)または他の適切な単位で距離を測定することができる。
い。装置50は、次に、第1および第2の層を含む時間的セグメント内の階層化されたビデオストリームを取り出す。装置50は、第2の層に、第1の層と共に、移行フェーズの間の時間を復号することを制限することができる。移行フェーズの外では、取り出されたストリーム36のセグメント内で、層L2が搬送されているにもかかわらず、第1の層L1のみが復号される可能性がある。
て装置20から送信されてもよい。このように、装置50は、オープンGOP構造の符号化されたビデオストリームではペナルティなしで可能になるので、2つのビデオストリームの間の切り替えを伴うが、あるビデオストリームから別のビデオストリームへの切り替え前の移行フェーズのスケジューリングを伴わずに、同じサーバまたは別のビデオから別のビデオを取り出すことができる。情報および/または信号はマニフェストに含まれていてもよい。
レイヤの表現にほとんど必要とされない基本層の基本層セグメントを取り出す能力をクライアントに提供する。
@dependencyPattern=412
これは、インデックス1+4*nまたは2+4*nを有するセグメントが復号に必要であることを意味する。
したがって、このインデックスを持たない他のすべてのセグメントは、@dependencyIdのみを使用する場合と比較して、ダウンロードしたビットレートを向上させることができませんでした。
@rapOffsetまたは@switchingOffsetである。
dwidthに追加して、記述された@bandwidth attributeの意味を変更することができる。
ば、マニフェスト内でシグナリングされた対応するセグメントテンプレートに基づいてセグメント106のアドレスを計算し、出力装置100は、リクエスタ122によって対応するリクエストをクライアント装置120に送信する。バッファー124によってバッファーされると、クライアント装置120は、取り出されたセグメント106のシーケンスを、メディアコンテンツがビデオである場合に、ビデオデコーダなどのメディアデコーダに転送する。
メント110について調べる。
テンツをクライアントに送信する。前記データ構造は、メディアコンテンツの第1の表現と、第1の表現に依存してメディアコンテンツを符号化した第2の表現と、を含み、前記データ構造は、前記第2の表現の時間セグメントの第1のセットと、前記第2の表現の時間セグメントの第2のセットとを識別する情報を含む。第2の表現の時間セグメントの第1のセットは、時間セグメントの第1のセットに時間的に対応する第1の表現の第1の部分に依存してメディアコンテンツを符号化し、第2の表現の時間セグメントの第2のセットは、時間セグメントの第2のセットに時間的に対応する第1の表現の第2の部分から独立してメディアコンテンツを符号化する。そのため、第2の表現からのメディアコンテンツの首尾良い再構成は、第2の部分なしで第1の表現に沿って得られる。ここでは、メディアコンテンツは、第2の表現の時間セグメントの第1のセットおよび/または第2のセットの所定の時間的セグメントにおけるマニフェストまたはヒントを含むことができる。
第1の実施形態
−RAPオフセットまたは同様のもの
○ 上記で定義した@rapOffsetまたは@switchingOffset
○ これは、上記のタイル型のユースケースや散在したRAP/スイッチングポイントを使った高速チューンに使用できる。したがって、各表現のビットレートは小さくなりますが、より頻繁なRAP/スイッチングポイント
■ それが同等の表現であることを示す。
第2の実施形態
−調整に必要な調整済みのRAPのみ−散乱したRAPのみを提供するRepsおよびドリフト付きのRAPを整列させた追加の「非完全」のReps
第3の実施形態
−ピークレート低減測定
○ @peakBitrateReductionを記述する属性。ピークビットレートは、@minBufferTimeおよび@bandwidthを使用して導き出すことができる。スケジューラは、このピークビットレートの導出に基づいて動作する。このような属性は、スケジューラが実際の分散レートを考慮に入れるのに役立つ。これは、高品質のストリームで時間を延長するのに役立つ。今までどおり整列したRAPは、スイッチングまたはランダムアクセスに使用できる。
ンダムアクセスポイントの時間的分布は、そのような、各チャネルの各表現内において、時間セグメントを担持するランダムアクセスポイントが、全体的なメディアシーンの初めから一定のオフセットjでi番目の時間セグメントごとに周期的に配置される。1つのチャネル内で、周期性iおよび/またはオフセットjは、それぞれのチャネルの表現の間で変化し得る。
(1)メディアシーン、すなわちすべてのチャネルを1つまたは複数の所定の表現の集合でダウンロードしてチャネルごとに1つの表現を選択する際に必要な平均ビットレート、
(2)これらの1つまたは複数の所定のコレクションのダウンロードに関連するビットレートのピーク、および
(3)RAP数分散回避方法における表現間の各チャネルの切り替え時に、メディアシーンのダウンロードに関連するビットレートピーク。
代わりの方法も実現可能であろう。
示的に示される。このようにして、クライアントは、第2の表現に関するセグメントに加えて、補助要求290および表現1の時間的に対応するセグメントに加えて、移行フェーズ中に取得し、この移行フェーズ292中に補助トラック290の再構成を行い、移行フェーズの後に、単に、第2の表現を取り出して再生することに進む。補助トラック290のピクチャは、例えば、第2の表現のピクチャおよび第1の表現のピクチャからそれぞれ導出された予測子の線形結合として、双方向予測された形で符号化することができる。線形結合は、移行フェーズの間に、2つのプレディクタの重みを時間的に変化させることができ、そのような中で、第1の表現のピクチャが線形コンビネーションにますます少なく寄与する一方、第2の表現のピクチャは移行フェーズの間に線形コンビネーションにますます寄与する。例えば、補助トラック290のピクチャは、第1の表現の時間的に対応するピクチャの層間予測コピーを第1の係数倍したものと、第2の表現の時間的に対応するピクチャの層間コピーバージョンを第2の係数倍したものと、の線形結合によって形成され、第1の係数は、フェーディングフェーズ中に1から0へ単調に減少し、第2の係数はフェーディングフェーズ中に0から1へ単調に増加する。これは、図22に例示的に示されており、第1および第2の因子の時間的変化に関する別々のグラフを示し、それぞれ、時間軸における中括弧は移行フェーズ292を示している。
アント装置に関して上述したのと同じ方法で実装することができ、クライアント装置320が任意にリクエスタ322とバッファ324とを備えることができる内部構造に関して、クライアント装置320と通信することができる。図24のクライアント装置は、排他的ではないがDASHなどのアダプティブストリーミングプロトコルを使用して、サーバからの排他的ではないビデオなどのメディアコンテンツを受信し、この目的のために、少なくとも、図23の出力装置などのサーバから第1のメディアストリームまたは第2のメディアストリームを取り出すことを切り替える。クライアント装置は、装置320が、第1および第2のメディアストリームを有する補助メディアストリームを取り出し、第2の補助ストリームの代わりに補助メディアストリームを再生するその中で、第1のメディアストリームを取り出すことから第2のメディアストリームを取り出すことに切り替える際にフェーディングフェーズ292をスケジューリングするように構成される。例えば、図24は、フェーディングフェーズに先行する時間フェーズ326中のクライアント装置320が、サーバからの第1のメディアストリーム306を単に取り出し、セグメント化し、または取り出し、それぞれのデコーダによって復号化することと同様であるように、第1の表現から独立した第2の表現308の場合を示す。フェーディングフェーズ292の間、クライアント装置320は、メディアストリーム306および308の時間的に対応する時間的セグメントと共に、補助メディアストリーム310のフェーディングフェーズ292内の時間セグメントを取得し、フェーディングフェーズ292に続いて時間的フェーズ328にある間に、対応するデコーダによってそれらすべてに復号する。クライアント装置320は、第2のメディアストリーム308を再生してサーバから取り出すことにより補助メディアストリーム310を取り出すことを控える。第2の表現が第1の表現に依存する表現である場合、クライアント装置320は、メディアストリーム306の時間的に対応するセグメントと共に、時間フェーズ328の間に第2のメディアストリーム308の時間セグメントを取り出す。
* トラックの1つには、重畳前に影響を受ける符号化ドリフト(例えば、オープンGOPエンコーディングが使用された場合など)が高品質(例えば、元のものより高い解像度またはより高い忠実度)でビデオが含まれる。
* 1つのそのような重み付けは、あるトラックから他のトラックへの漸進的な移行を可能にする。
* 重畳は、コーデックドメイン外で実現される。
* 重畳は、コーデックドメイン内で以下の図に従い、ここでは、Rep1とRep2(破線のオレンジ色の矢印)からの単なる重み付け予測を特徴とする追加の表現「重み付け」として示された第3の「層」が再生される。
いくつかの実施形態では、最も重要な方法ステップの1つまたは複数は、そのような装置によって実行されてもよい。
を有するデータキャリアを備える。
Claims (115)
- アダプティブストリーミングプロトコルを用いてクライアントにビデオ(24)を出力する装置であって、
前記装置は、少なくとも、
階層化されたビデオストリーム(36)の形態での前記ビデオ(24)の出力と、
オープンGOP構造を用いて符号化され、前記ビデオを第2の空間解像度および第2の品質で符号化した空間解像度の高いビデオストリーム(38)の形態での前記ビデオ(24)の出力
の切り替えをサポートし、
前記階層化されたビデオストリーム(36)は、
前記ビデオを第1の空間解像度で符号化した第1の層(L1)と、
前記ビデオを第2の空間解像度および前記第2の品質よりも低い第1の品質で、層間のアップサンプリングによる前記第1から前記第2の層への層間予測(44)を用いて、ただし予測残差の符号化がなしで符号化した第2の層(L2)と、を含む、装置。 - 前記空間解像度の高いビデオストリーム(38)は、更なる階層化されたビデオストリームであり、
前記更なる階層化されたビデオストリームは、
前記ビデオを前記第1の空間解像度で符号化した更なる第1の層(L1)と、
前記オープンGOP構造における時間的予測を用い、そして層間のアップサンプリングによる、且つ予測残差の符合化を用いる前記更なる第1の層(L1)から更なる第2の層(L2)への層間予測を用いて、前記ビデオを第2の空間解像度で符号化した更なる第2の層(L2)と、を含む、請求項1に記載の装置。 - 前記第1の層および前記さらなる第1の層は、スプライスポイントで一緒にスプライスされる前記階層化されたビデオストリーム(36)および前記更なる階層化されたデータストリームに基づいての前記ビデオの前記第1の空間解像度での再構成が、前記階層化されたビデオストリームおよび前記更なる階層化されたデータストリームのいずれかに基づいての前記ビデオの第1の空間解像度での再構成に等しくなるように、それぞれ、前記ビデオを前記第1の空間解像度で均質に符号化している、請求項2に記載の装置。
- 前記第1の層、前記更なる第1の層および前記更なる第2の層は、オープンGOP構造を用いて符号化される、請求項2または請求項3に記載の装置。
- 前記空間解像度の高いビデオストリームは、前記オープンGOP構造における時間予測を用いて、および予測残差符号化を使用して、且つ層間予測なしで、前記ビデオを前記第2の空間解像度で符号化した更なる第2の層を含む更なる階層化されたビデオストリームである、請求項1に記載の装置。
- 前記第1の層は、閉じたGOP構造を用いて符号化される、請求項2、請求項3および請求項5のいずれか1項に記載の装置。
- 前記第2の層および前記更なる第2の層は共通の層IDを使用してラベル付けされて、前記階層化されたビデオストリームと前記更なる階層化されたビデオストリームとのスプライスすることによって、前記ビデオを前記第2の空間解像度で符号化した、前記共通の層IDを有する層を含むスプライスされた階層化されたビデオストリームが得られる、請求項2〜請求項6のいずれか1項に記載の装置。
- 前記空間解像度の高いビデオストリーム(38)は、前記ビデオを前記第2の空間解像
度で符号化した更なる第2の層を含む更なる階層化されたビデオストリームであり、前記第2の層および前記更なる第2の層は前記共通の層IDを使用してラベル付けされて、前記階層化されたビデオストリームおよび前記更なる階層化されたデータストリームをスプライスすることによって、前記ビデオを前記第2の空間解像度で符号化した、前記共通の層IDを有する層を含むスプライスされた階層化されたビデオストリームが得られる、請求項1に記載の装置。 - 前記装置は、前記クライアントに、前記階層化されたビデオストリームから前記空間解像度の高いビデオストリームへの切り替えの前に、前記クライアントが、前記階層化されたビデオストリームの前記第2の層を使用して、前記第2の空間解像度での前記ビデオの補足推定値を導出する移行フェーズを前記クライアントがスケジューリングするよう通知する、請求項1〜請求項8のいずれか1項に記載の装置。
- 前記移行フェーズの長さは、
提示時間順序において後続する、前記空間解像度の高いビデオストリームのランダムアクセスポイントピクチャ、および、提示時間順序およびデコード順序において、前記ランダムアクセスポイントピクチャに先行する参照ピクチャをそれぞれ直接的又は間接的に参照する、前記空間解像度の高いビデオストリームのランダムアクセス依存ピクチャと、
前記ランダムアクセス依存ピクチャが直接的または間接的に参照する前記参照ピクチャとの間の最大距離
を超えるか、またはそれに等しい、請求項9に記載の装置。 - 前記装置は、前記移行フェーズの長さを、前記階層化されたビデオストリームおよび前記空間解像度の高いビデオストリームの時間セグメント単位で、または時間単位で、前記クライアントに示すように構成される、請求項9または請求項10に記載の装置。
- 前記装置は、
前記クライアントにとっての前記ビデオの可用性を、前記階層化されたビデオストリーム(36)の形態での前記第1の空間解像度と、前記空間解像度の高いビデオストリーム(38)の形態での前記第2の空間解像度とで記述し、
前記階層化されたビデオストリームの時間セグメントにおける前記階層化されたビデオストリーム(36)の前記第1の層(L1)と共に前記階層化されたビデオストリーム(36)の前記第2の層(L2)の存在、および前記第2の空間解像度で前記ビデオの補足推定値を導出して前記階層化されたビデオストリームから前記空間解像度の高いビデオストリームに切り替えるための手段としての前記第2の層(L2)の目的を示し、且つ
前記階層化されたビデオストリームおよび前記空間解像度の高いビデオストリームの時間セグメントを取り出すためのアドレスを計算する計算ルールを示すマニフェストを、
前記クライアントに提供するように構成される、請求項1〜請求項11のいずれか1項に記載の装置。 - サーバは、前記階層化されたビデオストリームから前記空間解像度の高いビデオストリームに切り替える前に、前記クライアントが、第1のストリームの前記第2の層を使用して、前記第2の空間解像度の前記ビデオの補足的な推定値を導き出す、移行フェーズを前記クライアントがスケジュールことになることを示す情報を前記マニフェストに挿入するように構成される、請求項9〜請求項12のいずれか1項に記載の装置。
- 前記装置は、前記空間解像度の高いビデオストリームのSEIから前記移行フェーズの長さを導き出すように構成されている、請求項13に記載の装置。
- 前記装置は、少なくとも、
前記階層化されたビデオストリームの形態での前記ビデオの出力と、
前記空間解像度の高いビデオストリームの形態での前記ビデオの出力と、
前記ビデオを前記第1の空間解像度で符号化した、空間解像度の低いビデオストリームの形態での前記ビデオの出力、
の間での切り替えをサポートする、請求項1〜請求項14のいずれか1項に記載のスイッチ。 - 前記空間解像度の低いビデオストリームは、前記ビデオを前記第1の空間解像度で符号化した、
単一レイヤビデオストリームであるか、または、
更なる別の第1の層を含む更なる符号化されたビデオストリームである、請求項15に記載の装置。 - 前記空間解像度の低いビデオストリームは、更なる別の第1の層を含む更なる別の階層化されたビデオストリームであって、
前記第1の層および前記更なる別の第1の層は、それぞれ、前記ビデオを前記第1の空間解像度で均質的に符号化して、スプライスポイントで一緒にスプライスされる、前記階層化されたビデオストリームおよび前記更なる別の階層化されたビデオストリームに基づいて、前記第1の空間解像度で符号化される前記ビデオの再構成が、前記階層化されたビデオストリームおよび前記更なる別の階層化されたビデオストリームのいずれかに基づいた、前記第1の空間解像度での前記ビデオの再構成に等しい、請求項15に記載の装置。 - 前記更なる別の第1の層は、閉じたGOP構造を使用して符号化される、請求項17に記載の装置。
- 前記装置は、前記クライアントにとっての前記サーバにおける前記ビデオの前記第1の空間解像度および前記第2の空間解像度での可用性を記述し、且つ、前記第1の層、前記第2の層および前記空間解像度の高いビデオストリームに関しては異なるが、更なる別の第1の層および前記第1の層については等しい、前記第1の層、前記第2の層、前記更なる別の第1の層および前記空間解像度の高いビデオストリームの時間セグメントを取り出すためのアドレスを計算する計算ルールを示すマニフェストを前記クライアントに提供するように構成される、請求項17または請求項18に記載の装置。
- 前記装置は、前記クライアントにとっての前記サーバにおける前記ビデオの前記第1の空間解像度および前記第2の空間解像度での可用性を記述し、且つ、
前記空間解像度の高いビデオストリームと、前記第1の層と、前記第2の層と、前記空間解像度の低いビデオストリームとで異なる、前記空間解像度の高いビデオストリーム、前記第1の層、前記第2の層および前記空間解像度の低いビデオストリームの時間セグメントを取り出すためのアドレスを計算する計算ルールを示すマニフェストを前記クライアントに提供するように構成される、請求項15〜請求項19のいずれか1項に記載の装置。 - アダプティブストリーミングプロトコルを使用してビデオを取り出すための装置であって、
前記装置は、
第1のビデオストリーム(36)の形態での前記ビデオの取り出しと、
第2のビデオストリーム(38)の形態での前記ビデオの取り出し、
との切り替えをサポートし、
前記装置は、前記第1のビデオストリーム(36)の形態での前記ビデオの取り出しから前記第2のビデオストリーム(38)の形態での前記ビデオの取り出しとの切り替えの
前に、移行フェーズ(64)をスケジューリングするように構成される、装置。 - 前記第2のビデオストリーム(38)はオープンGOPを使用して符号化され、前記装置は、前記第1のビデオストリーム(36)と第2のビデオストリーム(38)をまとめてスプライシングして符号化させて、前記第1のビデオストリームからデコードされたピクチャが、提示時間順序において後続の前記第2のビデオストリームのランダムアクセスポイントピクチャと、提示時間順序およびデコード順序において、前記ランダムアクセスポイントピクチャに先行する参照ピクチャをそれぞれ直接的または間接的に参照する前記第2のビデオストリームのランダムアクセス依存ピクチャについて、前記参照ピクチャを代替するものを形成するように構成される、請求項21に記載の装置。
- 前記第1のビデオストリームは、階層化されたビデオストリームであり、
前記階層化されたビデオストリームは、
前記ビデオを前記第1の空間解像度で符号化した第1の層、および
前記ビデオを前記第1の空間解像度より大きい第2の空間解像度で、且つ、層間アップサンプリングによる前記第1の層から前記第2の層への層間予測を使用して、しかし残差符号化なしで符号化した第2の層を含む、請求項21または請求項22に記載の装置。 - 前記装置は、前記階層化されたビデオストリームを、前記第1および第2の層を含む時間セグメントで取り出すように構成されている、請求項23に記載の装置。
- 前記装置は、前記第2の層および前記第1の層のデコードを前記移行フェーズ中の時間に制限するように構成されている、請求項24に記載の装置。
- 前記装置は、前記階層化されたビデオストリームを、前記第1および前記第2の層を別々に含む時間的セグメントで取り出すように構成される、請求項23に記載の装置。
- 前記装置は、前期移行フェーズ外では、前記第2の層を含む時間的セグメントの取り出しを控えるように構成される、請求項26に記載の装置。
- 前記第2のビデオストリームは、前記ビデオを層間予測なしに前記第2の空間解像度で符号化した更なる第2の層を含む更なる階層化されたビデオストリームであり、
前記装置は、前記移行フェーズにおいて、前記第1および第2の層にスケーラブルビデオデコーダによるデコードを施し、前記移行フェーズの直後に、前記更なる階層化されたビデオストリームを前記スケーラブルビデオデコーダによるデコードを施して、前記スケーラブルビデオデコーダが、提示時間順序において後続の前記さらなる階層化されたビデオストリームのランダムアクセスポイントピクチャと、提示時間順序およびデコード順序において、前記ランダムアクセスポイントピクチャに先行する参照ピクチャを直接的または間接的に参照する前記更なる階層化されたビデオストリームの前記第2の空間解像度のランダムアクセス依存ピクチャについて、前記階層化されたビデオストリームの前記第2の層から、前記参照ピクチャを代替するものを取得するように構成されている、請求項23〜請求項27のいずれか1項に記載の装置。 - 前記第1の層は、閉じたGOP構造を使用して符号化され、
前記装置は、前記第2のビデオストリームの形態での前記ビデオの取り出しから前記第1のビデオストリームの形態での前記ビデオの取り出しに切り替える際に、
前記ビデオの第2の部分に関連する階層化されたビデオストリームの第2の部分の前記第1の層に続く前記第2の空間解像度で前記ビデオの前記第1の部分を取り出すように、前記第1の部分の次に位置し、前記第1の空間解像度で前記ビデオの前記第2の部分を取り出すように、前記スケーラブルビデオデコーダに、前記ビデオの第1の部分に関連する
前記更なる階層化されたビデオストリームの部分を前記スケーラブルビデオデコーダにかけて前記ビデオの前記第1の部分を前記第2の空間解像度で取り出し、続いて、前記第1の部分の直後の前記ビデオの第2の部分に関連する前記階層化されたビデオストリームの第2の部分の前記第1のレイヤを前記スケーラブルビデオデコーダに直ちに連続してかけて、前記ビデオの前記第2の部分を前記第1の空間解像度で取り出す、請求項28に記載の装置。 - 前記ビデオが取り出されるサーバから、前記移行フェーズの長さの情報を取得するように構成された、請求項21から請求項29のいずれか1項に記載の装置。
- 前記ビデオが取り出されるサーバから、信号を取得し、前記信号に応じて、前記スケジューリングを非アクティブ化するか、または前記スケジューリングをアクティブにするように構成された、請求項21〜請求項29のいずれか1項に記載の装置。
- 前記サーバから、前記クライアントにとっての前記ビデオの前記第1のビデオストリームの形態及び前記第2のビデオストリームの形態での可用性を記述するマニフェストを要求し、前記マニフェストから前記移行フェーズの長さまたは前記信号に関する情報を取得するように構成された、請求項30または請求項31に記載の装置。
- ビデオを表すデータ構造であって、
前記データ構造は、クライアントが少なくとも第1の空間解像度での取り出しと前記第1の空間解像度よりも大きい第2の空間解像度での取り出しとの間で切り替えることによって、アダプティブストリーミングプロトコルを使用した前記ビデオの取り出しについて概念化されており、
前記データ構造は、オープンGOP構造を使用して前記ビデオを前記第2の空間解像度および第2の品質で符号化した空間解像度の高いビデオストリームと、階層化されたビデオストリームと、を含み、
前記階層化されたビデオストリームは、
前記ビデオを前記第1の空間解像度で符号化した第1の層、および
前記ビデオを前記第2の空間解像度および前記第2の品質に比べて低い第1の品質で、層間のアップサンプリングによる前記第1の層から前記第2の層への層間予測を使用するが、残差符号化なしで符号化した第2の層を含む、データ構造。 - 前記空間解像度の高いビデオストリームは、更なる階層化されたビデオストリームであり、前記更なる階層化されたビデオストリームは、
前記ビデオを前記第1の空間解像度で符号化した更なる第1の層、および
層間のアップサンプリングによる、残差符号化を使用した前記更なる第1の層から前記更なる第2の層までの層間予測を使用して、前記ビデオを前記第2の空間解像度で符号化した更なる第2の層を含む、請求項33に記載のデータ構造。 - 前記第1の層および前記更なる第1の層は、前記ビデオを前記第1の空間解像度でそれぞれ均質的に符号化していて、スプライシングポイントで一緒にスプライスされた前記階層化されたビデオストリームおよび前記更なる階層化されたデータストリームに基づく前記ビデオの前記第1の空間解像度での再構成が、前記第1のストリームおよび前記第2のストリームのいずれかに基づく前記ビデオの前記第1の空間解像度での再構成に等しくなる、請求項34に記載のデータ構造。
- 前記第1の層、前記更なる第1の層および前記更なる第2の層は、オープンGOP構造を用いて符号化される、請求項34または請求項35に記載のデータ構造。
- 前記空間解像度の高いビデオストリームは、層間予測なしに前記ビデオを前記第2の空間解像度で符号化した更なる第2の層を含む更なる階層化されたビデオストリームである、請求項33に記載のデータ構造。
- 前記第1の層は、閉じたGOP構造を使用して符号化される、請求項34〜請求項37のいずれか1項に記載のデータ構造。
- 前記第2の層と前記更なる第2の層は共通の層IDを用いて符号化され、前記階層化されたビデオストリームおよび更なる階層化されたビデオストリームをスプライスすることにより、前記ビデオを前記第2の空間解像度で符号化した、共通の層IDを有する層を含むスプライスされ階層化されたビデオストリームがもたらされる、請求項35〜請求項38のいずれか1項に記載のデータ構造。
- 前記空間解像度の高いビデオストリームは、前記ビデオを前記第2の空間解像度で符号化した更なる第2の層を含む更なる階層化されたビデオストリームであり、
前記第2の層および前記更なる第2の層は、共通の層IDを使用してラベル付けされ、前記階層化されたビデオストリームおよび前記更なる階層化されたデータストリームをスプライスすることにより、前記ビデオを前記第2の空間解像度で符号化した、共通の層IDを備えた層を含むスプライスされ階層化されたビデオストリームがもたらされる、請求項33に記載のデータ構造。 - アダプティブストリーミングプロトコルを使用してビデオをクライアントに出力するための装置であって、
前記装置は、少なくとも、第1のビデオストリーム(36)および第2のビデオストリーム(38)の形態での取り出しのために前記ビデオを前記クライアントに提供するように構成され、
前記装置は前記クライアントに対し、前記第1のビデオストリーム(36)の形態での前記ビデオの取り出しから前記第2のビデオストリーム(38)の形態での前記ビデオの取り出しへと切り替える前に、移行フェーズ(64)をスケジューリングする必要性を通知するように構成されている、装置。 - 前記装置は、
前記クライアントにとっての前記ビデオの可用性を、前記第1のビデオストリーム(36)の形態での前記第1の空間解像度と、前記第2のビデオストリーム(38)の形態での前記第1の空間解像度よりも高い第2の空間解像度とで記述し、
前記第1のビデオストリームの時間セグメントにおける第2の層(L2)の存在、および前記第2のビデオストリーム(38)に切り替える前の前記移行フェーズ中に前記第1の空間解像度から前記第2の空間解像度に切り替える際に再生されるという前記第2の層(L2)の目的を示し、
前記第1のビデオストリームおよび前記第2のビデオストリームの時間的セグメントを取り出すためのアドレスをそれぞれ計算する計算ルールを示す、
マニフェストを前記クライアントに提供するように構成される、請求項41に記載の装置。 - 前記装置は、さらに第3のビデオストリームの形態での取り出しのために前記ビデオを前記クライアントに提供するように構成され、
前記装置は、
前記クライアントにとっての前記ビデオの可用性を、第3のビデオストリーム(L1)の形態での第1の空間解像度と、第2のビデオストリーム(38)の形態での前記第1の空間解像度よりも高い第2の空間解像度とで記述し、および
前記第3のビデオストリームから前記第1のビデオストリームを介して前記第2のビデオストリームに切り替える間に前記第1の空間解像度から前記第2の空間解像度に切り替える際に、前記第1のビデオストリームの時間的セグメントが、前記第3のビデオストリームの時間的セグメントと共に前記移行フェーズの間に取り出されることを示し、
前記第1、第2および第3のビデオストリームの時間的セグメントを取り出すためのアドレスを計算する計算ルールを示す、
マニフェストを提供するように構成される、請求項41に記載の装置。 - 前記装置は、前記マニフェストが前記クライアントにとっての前記ビデオの可用性を前記更なるビデオストリームの形態で前記第1および第2の空間解像度よりも高い第3の空間解像度で記述する、更なるビデオストリームの形態での取り出しのために前記クライアントに前記ビデオをさらに提供するように構成され、
前記第3の空間解像度から前記第2の空間解像度へ切り替えるダウンスイッチングの機会、および
前記第1または第3のビデオストリームから前記第2のビデオストリームに切り替えるアップ−スイッチングの機会を知らせる、請求項42および請求項43のいずれか1項に記載の装置。 - 前記装置は、前記マニフェストにおいて、前記第1のビデオストリームと前記第2のビデオストリームとを一緒にスプライスして1つのデコーダに供給されることがあることを示す、請求項42〜請求項44のいずれか1項に記載の装置。
- 前記装置は、前記移行フェーズの長さをクライアントに知らせる、請求項41〜請求項45のいずれか1項に記載の装置。
- ピクチャのシーケンスを、前記ピクチャのシーケンスの中に、提示時間順序において後続の前記ピクチャのシーケンスのランダムアクセスポイントピクチャと、提示時間順序および復号順序において前記ランダムアクセスポイントに先行する参照ピクチャを時間的予測によって直接的また間接的に参照する少なくとも1つのランダムアクセス依存ピクチャが存在するように符号化したビデオストリームであって、
前記ビデオストリームは、
前記少なくとも1つのランダムアクセス依存ピクチャと、前記少なくとも1つのランダムアクセス依存ピクチャが直接的または間接的に参照する前記参照ピクチャとの間の最大時間的距離を示すシンタックス要素とを含む、ビデオストリーム。 - ピクチャのシーケンスを、前記ピクチャのシーケンスの中に、提示時間順序において後続の前記ピクチャのシーケンスのランダムアクセスポイントピクチャと、提示時間順序および復号順序において前記ランダムアクセスポイントピクチャに先行する参照ピクチャを時間的予測によって直接的または間接的に参照する少なくとも1つのランダムアクセス依存ピクチャが存在するように、ビデオストリームに符号化し、
少なくとも1つのランダムアクセス依存ピクチャ参照ピクチャと、前記少なくとも1つのランダムアクセス依存ピクチャが直接的または間接的に参照する前記参照ピクチャとの間の保証された最大時間距離を示すシンタックス要素を前記データストリームに挿入するように構成される、ビデオエンコーダ。 - アダプティブストリーミングプロトコルを使用して、クライアントにメディアコンテンツを出力する装置であって、前記装置は、少なくとも、
第1の表現と、前記第1の表現に依存する前記ビデオを符号化した第2の表現と、の間の時間セグメントの単位での切り替えをサポートし、
前記装置は、前記クライアントに対し、
前記第2の表現の時間セグメントの第1のセットと、前記第2の表現の時間セグメントの第2のセットとを区別する情報を提供し、
前記第2の表現の時間セグメントの第1のセットには、時間的セグメントの前記第1のセットに時間的に対応する前記第1の表現の第1の部分に依存してメディアコンテンツが符号化されており、
前記第2の表現の時間セグメントの第2のセットには、時間セグメントの前記第2のセットに時間的に対応する前記第1の表現の第2の部分から独立したメディアコンテンツが符号化されていて、前記第2の表現からの前記メディアコンテンツの再構成が前記第1の表現の前記第2の部分なしで成功するようになっている、装置。 - 前記クライアントに対し、それを使用すれば前記第1の部分および前記第2の部分内にそれぞれ存在する前記第1の表現の時間的セグメントのアドレスを区別することが可能な計算ルールを提供するように構成される、請求項49に記載の装置。
- 前記計算ルールを前記クライアントに送信されたマニフェストに挿入するように構成される、請求項50に記載の装置。
- 前記第2の表現の時間的セグメントの前記第1のセットおよび/または前記第2のセットの所定の時間的セグメントにおけるヒントを使用して、前記所定の時間的セグメントに続く前記第2の表現の1つ以上の後続の時間的セグメントを、時間セグメントの前記第1のセットおよび第2のセットのうちの1つに割り当てるように構成される、請求項49〜請求項51のいずれか1項に記載の装置。
- 前記クライアントに対し、
前記第2の表現の前記第1および第2の時間的セグメントに加えての、前記第1の表現の前記第1および第2の部分の伝送に対応する、前記第2の表現のための第1の伝送ビットレートと、
前記第2の表現の前記第1および第2の時間的セグメントに加えて、前記第1の表現の前記第2の部分なしでの前記第1の表現の前記第1の部分の伝送に対応する、前記第2の表現のための第2の伝送ビットレート
についての情報を含むマニフェストを提供するように構成された、請求項49〜請求項52のいずれか1項に記載の装置。 - アダプティブストリーミングプロトコルを使用して、メディアコンテンツを取り出すための装置であって、前記装置は、少なくとも、
第1の表現の取り出しと、
前記第1の表現に依存してメディアコンテンツが符号化された第2の表現の取り出し、
との間での、時間的セグメントの単位での切り替えをサポートし、
前記装置は、前記第2の表現を取り出す際に、
前記第2の表現の時間的セグメントの第1のセットに時間的に対応する前記第1の表現の第1の部分に依存して前記メディアコンテンツが符号化された前記第2の表現の時間的セグメントの第1のセットを前記第1の表現の前記第1の部分と共に取り出し、
前記第1の表現の前記第2の部分なしで、時間的セグメントの前記第2のセットに時間的に対応する前記第1の表現の第2の部分から独立して前記メディアコンテンツが符号化された前記第2の表現の時間的セグメントの第2のセットを取り出す
ように構成された、装置。 - 計算ルールを使用して、前記第1の部分および前記第2の部分内にそれぞれ存在する前記第1の表現の時間的セグメントのアドレスを区別するように構成される、請求項54に
記載の装置。 - 前記メディアコンテンツが取り出されるサーバから送信されたマニフェストから前記計算ルールを導くように構成される、請求項55に記載の装置。
- 前記第2の表現の時間的セグメントの前記第1のセットおよび/または前記第2のセットの所定の時間的セグメントにおけるヒントを使用して、前記所定の時間的セグメントに続く前記第2の表現の1つ以上の後続の時間的セグメントを、時間的セグメントの前記第1のセットおよび前記第2のセットのうちの1つに割り当てるように構成される、請求項54〜請求項56のいずれか1項に記載の装置。
- 前記所定の時間的セグメント内のヒントを使用して、前記メディアコンテンツが取り出されるサーバから送信されたマニフェストにおける信号に応答して、前記所定の時間的セグメントに続く前記第2の表現の前記1つ以上の後続の時間的セグメントを、時間的セグメントの前記第1のセットおよび第2のセットのうちの1つに割り当てるように構成される、請求項57に記載の装置。
- メディアコンテンツを記述する、アダプティブストリーミングプロトコルで使用するためのマニフェストであって、
前記マニフェストは前記メディアコンテンツが、
前記メディアコンテンツの第1の表現、および
前記第1の表現に依存して前記メディアコンテンツを符号化した第2の表現
の形態で、利用可能であるとして記述し、
前記マニフェストは、
前記第2の表現の時間セグメントの第1のセットであって、時間セグメントの前記第1のセットに時間的に対応する前記第1の表現の第1の部分に依存して前記メディアコンテンツが符号化された前記第2の表現の時間セグメントの第1のセットと、
前記第2の表現の時間セグメントの第2のセットであって、前記メディアコンテンツが時間セグメントの前記第2のセットに時間的に対応する前記第1の表現の前記第2の部分とは独立して符号化され、前記第2の表現からの前記メディアコンテンツの再構成が前記第1の表現の前記第2の部分なしに成功するようになっている、前記第2の表現の時間セグメントの第2のセット
を区別する情報を含む、マニフェスト。 - メディアコンテンツを表し、アダプティブストリーミングプロトコルを使用して前記メディアコンテンツをクライアントにストリーミングするために概念化されたデータ構造であって、前記データ構造は、
前記メディアコンテンツを符号化した第1の表現と、
前記第1の表現に依存して前記メディアコンテンツを符号化した第2の表現と、
を含み、
前記データ構造は、
前記第2の表現の時間セグメントの第1のセットであって、時間セグメントの前記第1のセットに対応する前記第1の表現の第1の部分に依存して前記メディアコンテンツが符号化された、前記第2の表現の時間セグメントの第1のセットと、
前記第2の表現の時間セグメントの第2のセットであって、前記メディアコンテンツが時間セグメントの前記第2のセットに時間的に対応する前記第1の表現の第2の部分から独立して符号化され、前記第2の表現からの前記メディアコンテンツの再構成が、前記第2の部分なしで成功する、前記第2の表現の時間セグメントの第2のセット
を区別する情報を含む、データ構造。 - ビデオを第1および第2の層(L1,L2)に、前記第1の層から前記第2の層への層間予測を用いて符号化した階層化されたビデオストリームであって、
前記階層化されたビデオストリームは、前記第2の層のピクチャのシーケンスを、前記第1の層から独立して符号化されたピクチャのサブシーケンス、および前記第1の層に依存して符号化されたピクチャのサブシーケンスへの交互での時間的再分割を示す情報を含む、階層化されたビデオストリーム。 - 階層化されたビデオストリームが第1および第2の層(L1,L2)を有するように、前記第1の層から前記第2の層への相関予測を使ってビデオを前記階層化されたビデオストリームに符号化して、前記第2の層のピクチャのシーケンスが、前記第2の層の前記ピクチャのシーケンスの第2のサブシーケンスが間に存在する、前記第1の層から独立して符号化された第1のピクチャのサブシーケンスを含むようにし、且つ、
前記階層化されたビデオストリームに、前記第1の層から独立して符号化された前記第1のピクチャのサブシーケンスおよび前記第2のピクチャのサブシーケンスへの前記第2の層の前記ピクチャのシーケンスの時間的再分割を示す情報を提供する
ように構成される、ビデオエンコーダ。 - ビデオを第1の層および前記第2の層(L1,L2)に、前記第1の層から前記第2の層への層間予測を用いて符号化した階層化ビデオストリームを受信し、
前記階層化されたビデオストリームから、前記第1の層から独立して符号化されたピクチャのサブシーケンスと、前記第1の層に依存して符号化されたピクチャのサブシーケンスへの交互での、前記第2の層のピクチャのサブシーケンスの時間的再分割を示す情報を読み出し、
前記情報を利用して、アダプティブストリーミングプロトコルを使用して前記ビデオをストリーミングするように構成される、ネットワーク装置。 - アダプティブストリーミングプロトコルを使用して、メディアシーンのチャネルをクライアントに出力する装置であって、前記装置は、各チャネルについて、ランダムアクセスポイントの時間的分布が異なる前記各チャネルの表現のセットの間の切り替えをサポートする、装置。
- 断続的に発生する時間インスタンスにおいて、前記チャネルの表現の前記セットのうちの少なくとも1つのセットのランダムアクセスポイントが時間的に整列される、請求項63に記載の装置。
- 前記チャネルの表現の前記セットにおけるランダムアクセスポイントの前記時間的分布を明らかにする情報を前記クライアントに提供するように構成された、請求項63または請求項64に記載の装置。
- マニフェスト内の前記情報を提供するように構成された、請求項65に記載の装置。
- 前記チャネルの表現の前記セットの所定の時間的セグメントにおけるヒントを使用して前記情報を提供するように構成された、請求項66に記載の装置。
- 各チャネルについて、前記チャネルの表現の前記セットにおけるランダムアクセスポイントの前記時間的分布に応じて、前記各チャネルのための表現の前記セットの中から前記各チャネルのために現在取り出されるべき表現を選択して、ランダムアクセスポイントを含む前記選択された時間的セグメントのうちのいくつかの時間的セグメントが可能な限り最小限に時間的に変化することによる、前記メディアシーンの取り出しによって達成可能なビットレートピークの低減について、前記クライアントに通知するように構成される、
請求項63〜請求項67のいずれか1項に記載の装置。 - アダプティブストリーミングプロトコルを使用して、メディアシーンのチャネルを取り出すための装置であって、各チャネルについて、ランダムアクセスポイントの時間的分布が異なる前記各チャネルの表現のセットの間で切り替えるように構成された装置。
- 前記各チャネルについて、前記各チャネルの表現の前記セットの中のランダムアクセスポイントの前記時間的分布に依存して、前記各チャネルのための表現の前記セットの中から前記各チャネルについて現在取り出されるべき表現を選択するように構成される、請求項70に記載の装置。
- 前記チャネルの表現の前記セット内のランダムアクセスポイントの前記時間的分布を明らかにする情報を前記メディアシーンが取り出されるサーバから取り出すように構成された、請求項70または請求項71に記載の装置。
- 前記情報を前記サーバから送信されたマニフェストから取り出すように構成された、請求項72に記載の装置。
- 前記チャネルの表現の前記セットの所定の時間的セグメント内のヒントを使用して前記情報を取り出すように構成された、請求項72に記載の装置。
- メディアシーンを表し、前記メディアシーンのチャネルを、アダプティブストリーミングプロトコルを使用してクライアントにストリーミングするために概念化されたデータ構造であって、
前記データ構造は、各チャネルについて、ランダムアクセスポイントの時間的分布が異なる前記各チャネルの表現のセットを含む、データ構造。 - アダプティブストリーミングプロトコルを使用して、メディアコンテンツをクライアントに出力するための装置であって、
前記デバイスは、少なくとも、
前記メディアコンテンツを第1の品質で符号化した第1のメディアストリーム、
前記メディアコンテンツを第2の品質で符号化した第2のメディアストリーム、および
前記第1および第2のメディアストリームに依存して前記メディアコンテンツを符号化した補助メディアストリーム
の形態で、前記メディアを取り出しのために前記クライアントに提供する、装置。 - 前記装置は、前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替えるときに、前記第2のメディアストリームではなく前記補助メディアストリームが再生されることになるフェーディングフェーズをスケジューリングする可能性について前記クライアントに通知するように構成される、請求項76に記載の装置。
- 前記装置は、前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替えるときに前記クライアントがスケジューリングし、前記第2のメディアストリームではなく前記補助メディアストリームが再生されることになるフェーディングフェーズの長さに関して、前記クライアントに通知するように構成される、請求項76または請求項77に記載の装置。
- 前記第1のメディアストリーム、前記第2のメディアストリームおよび前記補助メディ
アストリームは、階層化されたメディアストリームの別々の層を示し、
前記補助メディアストリームの前記層は、前記第1および第2のメディアストリームの層から層間予測によって別々に導出された予測子の線形結合によって符号化される、請求項76〜請求項78のいずれか1項に記載の装置。 - 前記第2のメディアストリームには、前記メディアコンテンツが前記第1のメディアストリームに依存して符号化されている、請求項76〜請求項79のいずれか1項に記載の装置。
- 前記第2のメディアストリームには、前記メディアコンテンツが前記第1のメディアストリームとは独立して符号化されている、請求項76〜請求項79のいずれか1項に記載の装置。
- 前記第3のメディアストリームは、前記第1のメディアストリームおよび前記第2のメディアストリームの時間的セグメントから別個の時間的セグメントで、前記クライアントが前記装置から取り出すことができる、請求項76〜請求項81のいずれか1項に記載の装置。
- 前記装置は前記クライアントに対し前記メディアコンテンツを、前記第1のメディアストリームに依存して前記メディアコンテンツを符号化したスイッチングメディアストリームの形態で、取り出しのために追加して提供するように構成される、請求項76〜請求項82のいずれか1項に記載の装置。
- 前記装置は、前記第1のメディアストリームの形態での前記ビデオの取り出しから前記第2のメディアストリームの形態での前記ビデオの取り出しに切り替える前に、移行フェーズ(64)をスケジューリングする必要性を前記クライアントに通知するように構成され、前記移行フェーズは前記フェーディングフェーズの前にある、請求項83に記載の装置。
- アダプティブストリーミングプロトコルを使用して、サーバからメディアコンテンツを取り出すための装置であって、
前記装置は、少なくとも、
前記メディアコンテンツを第1の品質で符号化した第1のメディアストリームの取り出しと、
前記メディアコンテンツを第2の品質で符号化した第2のメディアストリームの取り出し
との切り替えをサポートし、
前記装置は、前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替えるときに、前記装置が、前記第1および第2のメディアストリームとともに、前記第1および前記第2のメディアストリームに依存して前記メディアコンテンツを符号化した補助メディアストリームを取り出し、前記第2の補助ストリームの代わりに前記補助メディアストリームを再生する、フェーディングフェーズをスケジューリングするように構成された、装置。 - 前記装置は、前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替えるときに、前記サーバからの信号に依存して、前記フェージィングフェーズのスケジューリングをアクティブ化または非アクティブ化するように構成される、請求項85に記載の装置。
- 前記装置は、前記フェーディングフェーズの長さに関する情報を前記サーバから受信し
、それに応じて前記フェーディングフェーズの長さを設定するように構成される、請求項85または請求項86に記載の装置。 - 前記第1のメディアストリーム、前記第2のメディアストリームおよび前記補助メディアストリームは、階層化されたメディアストリームの別々の層を示し、
前記補助メディアストリームの層は、前記第1および第2のメディアストリームの層から層間予測によって別々に導出された予測子の線形結合によって符号化され、
前記装置は、前記フェーディングフェーズ中に、前記第1のメディアストリーム、前記第2のメディアストリーム、および前記補助メディアストリームの前記層をメディアデコーダにまとめて入力するとともに、前記フェーディングフェーズ外は前記補助メディアストリームを前記メディアデコーダに入力しないように構成される、請求項85〜請求項87のいずれか1項に記載の装置。 - 前記第2のメディアストリームには、前記第1のメディアストリームに依存して前記メディアコンテンツが符号化され、
前記装置は、前記フェーディングフェーズ外では、
前記第2のメディアストリームの取り出しに前記第1のメディアストリームの取り出しを付随させ、そして、
前記第1のメディアストリームの取り出しの間には、前記第2のメディアストリームの取り出しを控える、
ように構成された、請求項85〜請求項88のいずれか1項に記載の装置。 - 前記第2のメディアストリームには、前記第1のメディアストリームから独立して前記メディアコンテンツが符号化され、
前記装置は、前記フェーディングフェーズ外では、
前記第2のメディアストリームの取り出しの間には、前記第1のメディアストリームの取り出しを控え、そして、
前記第1のメディアストリームの取り出しの間には、前記第2のメディアストリームの取り出しを控える、
ように構成された、請求項85〜請求項89のいずれか1項に記載の装置。 - 前記フェーディングフェーズの間に、前記第1および第2のメディアストリームの時間的セグメントとは別個に、且つこれらに加えて、前記第3のメディアストリームを取り出すように構成された、請求項85〜請求項89のいずれか1項に記載の装置。
- 前記装置は、前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替える前に、移行フェーズにおいて、前記サーバから前記第1のメディアストリームに加えてスイッチングメディアストリームを取り出すように構成され、
前記スイッチングメディアストリームには、前記第1のメディアストリームに依存して前記メディアコンテンツが符号化され、そして、提示時間順序において後続の前記第2のメディアストリームの後続するランダムアクセスポイントピクチャおよび、提示時間順序および復号順序において前記ランダムアクセスポイントに先行する、前記第2のメディアストリームの参照ピクチャを時間的予測によって直接的または間接的にそれぞれ参照する前記第2のメディアストリームのランダムアクセス依存ピクチャについて、前記参照ピクチャを代替するものに使用するように構成される、請求項85〜請求項91のいずれか1項に記載の装置。 - 前記装置は、前記サーバから送信された情報に応じて、前記移行フェーズ(64)の長さを設定するように構成されている、請求項92に記載の装置。
- メディアコンテンツを表し、アダプティブストリーミングプロトコルを使用して前記メディアコンテンツをクライアントにストリーミングするために概念化されたデータ構造であって、
前記データ構造は、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリーム、
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリーム、および
前記第1および第2のメディアストリームに依存して前記メディアコンテンツが符号化された補助メディアストリーム
を含む、データ構造。 - アダプティブストリーミングプロトコルを使用して、前記メディアコンテンツをクライアントに出力するための装置であって、
前記装置は、少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリーム、および
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリーム、
の形態での引き出しのために、前記メディアコンテンツを前記クライアントに提供し、
前記装置は前記クライアントに対し、前記第1のメディアストリームと前記第2のメディアストリームを切り替えるときに、前記クライアントにおけるフェーディングを制御するメタデータを提供するように構成された、装置。 - アダプティブストリーミングプロトコルを使用して、サーバからメディアコンテンツを取り出すための装置であって、
前記装置は、少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリームの取り出し、および
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリームの取り出し
の間の切り替えをサポートし、
前記装置は、前記サーバからメタデータを受信し、前記第1および第2のメディアストリームを切り替えるときに、前記メタデータを使用してフェーディングを制御するように構成される、装置。 - アダプティブストリーミングプロトコルを使用して、ビデオ(24)をクライアントに出力するための方法であって、
前記方法は、少なくとも、
階層化されたビデオストリーム(36)の形態での前記ビデオ(24)の出力と、
オープンGOP構造を使用して符号化され、前記ビデオが第2の空間解像度および第2の品質で前記ビデオを符号化された空間解像度の高いビデオストリーム(38)の形態での前記ビデオ(24)の出力
との間で切り替えるステップを含み、
前記階層化されたビデオストリーム(36)は、
前記ビデオが第1の空間解像度で符号化された第1の層(L1)、および
前記ビデオが第2の空間解像度および前記第2の品質よりも低い第1の品質で、且つ、予測残差符号化をすることなく、層間のアップサンプリングによる前記第1の層から第2の層への層間予測(44)を用いて符号化された、第2の層(L2)
を含む、方法。 - アダプティブストリーミングプロトコルを使用してビデオを取り出す方法であって、
前記方法は、少なくとも、
第1のビデオストリーム(36)の形態での前記ビデオの取り出し、および
第2のビデオストリーム(38)の形態での前記ビデオの取り出し
を、切り替えるステップを含み、
前記方法は、前記第1のビデオストリーム(36)の形態での前記ビデオの取り出しから前記第2のビデオストリーム(38)の形態での前記ビデオの取り出しに切り替える前に移行フェーズ(64)をスケジュールするステップを含む方法。 - 請求項33〜請求項40、請求項60および請求項94のいずれか1項に記載のデータ構造を格納するデジタル記憶媒体。
- アダプティブストリーミングプロトコルを使用してビデオをクライアントに出力する方法であって、
前記方法は、少なくとも、
第1のビデオストリーム(36)と、
第2のビデオストリーム(38)
の形態で、前記クライアントに取り出しのために前記ビデを提供するステップと、
前記第1のビデオストリーム(36)の形態での前記ビデオの取り出しから、前記第2のビデオストリーム(38)の形態での前記ビデオの取り出しに切り替える前に、移行フェーズ(64)をスケジュールする必要性をクライアントに通知するステップ
を含む、方法。 - 請求項47に記載のビデオストリームを格納するデジタル記憶媒体。
- 提示時間順序において後続の、ピクチャのシーケンスのランダムアクセスポイントピクチャと、提示時間順序および復号順序において前記ランダムアクセスポイントピクチャに先行する参照ピクチャを時間的予測によって直接的または間接的に参照する少なくとも1つのランダムアクセス依存ピクチャが、前記ピクチャのシーケンスの中に存在するように、ビデオストリームに前記ピクチャのシーケンスを符号化するステップと、
少なくとも1つのランダムアクセス依存ピクチャ参照ピクチャと、前記少なくとも1つ
のランダムアクセス依存ピクチャが直接的または間接的に参照する前記参照ピクチャとの間の保証された最大時間的距離を示すシンタックス要素を前記データストリームに挿入するステップ
を含む、方法。 - アダプティブストリーミングプロトコルを使用して、メディアコンテンツをクライアントに出力する方法であって、前記方法は、
少なくとも、
第1の表現と、
前記第1の表現に依存して前記ビデオを符号化した第2の表現
と、の間を時間的セグメント単位で切り替えるステップと、
前記クライアントに対し、
前記第2の表現の時間的セグメントの第1のセットであって、時間的セグメントの前記第1のセットに時間的に対応する前記第1の表現の第1の部分に依存して前記メディアコンテンツが符号化された、前記第2の表現の時間的セグメントの第1のセットと、
前記第2の表現の時間セグメントの第2のセットであって、時間セグメントの前記第2のセットに時間的に対応する前記第1の表現の第2の部分から独立して前記メディアコンテンツが符号化されて、前記第2の表現からの前記メディアコンテンツの再構成が、前記第1の表現の前記第2の部分なしで成功する、前記第2の表現の時間セグメントの第2のセット
を区別する情報を提供するステップを含む、方法。 - アダプティブストリーミングプロトコルを用いて、メディアコンテンツを取り出す方法であって、前記方法は、
少なくとも、
第1の表現の取り出しと、
前記第1の表現に依存して前記メディアコンテンツを符号化した第2の表現の取り出し
との間を時間的セグメント単位での切り替えをサポートするステップを含み、
前記第2の表現を取り出すときに、
前記第2の表現の時間的セグメントの第1のセットに時間的に対応する前記第1の表現の第1の部分に依存して、前記メディアコンテンツを符号化した前記第2の表現の時間的セグメントの第1のセットを、前記第1の表現の前記第1の部分とともに取り出すステップ、および
時間的セグメントの前記第2のセットに時間的に対応する前記第1の表現の第2の部分とは独立して前記メディアコンテンツを符号化した前記第2の表現の時間的セグメントの第2のセットを、前記第1の表現の前記第2の部分なしで取り出すステップ、
を含む、方法。 - 請求項59に記載のマニフェストを格納するデジタル記憶媒体。
- 請求項61に記載の階層化されたビデオストリームを格納するデジタル記憶媒体。
- 階層化されたビデオストリームが第1および第2の層(L1,L2)を有するように、前記階層化されたビデオストリームに前記第1の層から前記第2への層の層間予測を使用してビデオを符号化して、前記第2の層のピクチャのシーケンスが、前記第1の層から独立して符号化された、間に前記第2の層の前記ピクチャのシーケンスの第2のサブシーケンスが存在する、ピクチャの第1のサブシーケンスを含むようにするステップ、および
前記階層化されたビデオストリームに対し、前記第1の層から独立して符号化された前記ピクチャの第1のサブシーケンスおよび前記ピクチャの第2のサブシーケンスへの、前記第2の層の前記ピクチャのシーケンスの時間的再分割を示す情報を前記階層化されたビデオストリームに供給するステップ
を含む、ビデオ符号化方法。 - ビデオを第1及び第2の層(L1,L2)に、前記第1の層から前記第2の層への層間予測を用いて符号化した階層化されたビデオストリームを受信し、
前記階層化されたビデオストリームから、前記第2の層のピクチャのシーケンスの、前記第1の層とは独立して符号化されたピクチャのサブシーケンスと、前記第1の層に依存して符号化されたピクチャのサブシーケンスへの交互の時間的再分割を示す情報を読み出し、
前記情報を使用して、前記ビデオを、アダプティブストリーミングプロトコルを用いてストリーミングするように構成される、ネットワーク装置。 - アダプティブストリーミングプロトコルを使用して、メディアシーンのチャネルをクライアントに出力する方法であって、各チャネルについて、ランダムアクセスポイントの時間的分布が異なる各チャネルの表現のセットの間で切り替えるステップを含む、方法。
- アダプティブストリーミングプロトコルを使用して、メディアシーンのチャネルを取り出す方法であって、各チャネルについて、ランダムアクセスポイントの時間的分布が異なる各チャネルの表現のセットの間で切り替えるステップを含む、方法。
- アダプティブストリーミングプロトコルを使用して、メディアコンテンツをクライアントに出力する方法であって、前記方法は、少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリーム、
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリーム、および
前記メディアコンテンツが前記第1および第2のメディアストリームに依存して符号化された補助メディアストリーム
の形態での取り出しのために、前記メディアコンテンツを前記クライアントに提供するステップを含む、方法。 - アダプティブストリーミングプロトコルを使用して、サーバからメディアコンテンツを取り出す方法であって、前記方法は、
少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリームの取り出し、および
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリームの取り出し
の間で切り替えるステップと、
前記第1のメディアストリームの取り出しから前記第2のメディアストリームの取り出しに切り替えるときに、前記第1および第2のメディアストリームに依存して前記メディアコンテンツを符号化した補助メディアストリームを前記第1および第2のメディアストリームと共に取り出し、前記第2の補助ストリームの代わりに前記補助メディアストリームを再生するフェーディングフェーズをスケジューリングするステップ、
を含む方法。 - アダプティブストリーミングプロトコルを使用して、メディアコンテンツをクライアントに出力する方法であって、この方法は、
少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリーム、および
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリーム
の形態での取り出しのために、前記クライアントに前記メディアコンテンツを提供するステップと、
前記クライアントに対し、前記第1のメディアストリームと前記第2のメディアストリームとを切り替える際に、前記クライアントにおけるフェーディングを制御するメタデータを提供するステップと、
を含む、方法。 - アダプティブストリーミングプロトコルを用いて、サーバからメディアコンテンツを取り出す方法であって、前記方法は、
少なくとも、
前記メディアコンテンツが第1の品質で符号化された第1のメディアストリームの取り出しと、
前記メディアコンテンツが第2の品質で符号化された第2のメディアストリームの取り出し
を切り替えるステップ、および
前記サーバからメタデータを受信し、前記メタデータを使用して、前記第1のメディアストリームと前記第2のメディアストリームとを切り替える際のフェーディングを制御するステップ
を含む、方法。 - コンピュータ上で実行される時に、請求項97〜請求項114のいずれか1項に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16156015.6 | 2016-02-16 | ||
EP16156015 | 2016-02-16 | ||
JP2018543327A JP7026627B2 (ja) | 2016-02-16 | 2017-02-14 | 効率的な適応ストリーミング |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543327A Division JP7026627B2 (ja) | 2016-02-16 | 2017-02-14 | 効率的な適応ストリーミング |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021145343A true JP2021145343A (ja) | 2021-09-24 |
JP7483657B2 JP7483657B2 (ja) | 2024-05-15 |
Family
ID=55361405
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543327A Active JP7026627B2 (ja) | 2016-02-16 | 2017-02-14 | 効率的な適応ストリーミング |
JP2021078695A Active JP7483657B2 (ja) | 2016-02-16 | 2021-05-06 | 効率的な適応ストリーミング |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543327A Active JP7026627B2 (ja) | 2016-02-16 | 2017-02-14 | 効率的な適応ストリーミング |
Country Status (8)
Country | Link |
---|---|
US (1) | US10986383B2 (ja) |
EP (1) | EP3417625A1 (ja) |
JP (2) | JP7026627B2 (ja) |
KR (1) | KR102287703B1 (ja) |
CN (1) | CN109076252B (ja) |
CA (1) | CA3014370A1 (ja) |
TW (1) | TWI670974B (ja) |
WO (1) | WO2017140685A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114466227A (zh) * | 2021-12-22 | 2022-05-10 | 天翼云科技有限公司 | 一种视频分析方法、装置、电子设备及存储介质 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9264508B2 (en) | 2011-08-19 | 2016-02-16 | Time Warner Cable Enterprises Llc | Apparatus and methods for reduced switching delays in a content distribution network |
KR102177990B1 (ko) * | 2014-05-02 | 2020-11-12 | 엘지전자 주식회사 | 압축기 및 스크롤 압축기 |
US10652594B2 (en) | 2016-07-07 | 2020-05-12 | Time Warner Cable Enterprises Llc | Apparatus and methods for presentation of key frames in encrypted content |
US10958948B2 (en) * | 2017-08-29 | 2021-03-23 | Charter Communications Operating, Llc | Apparatus and methods for latency reduction in digital content switching operations |
SE542242C2 (en) * | 2017-09-04 | 2020-03-24 | Divideon Ab | Compression of segmented video |
US10863250B2 (en) | 2017-09-15 | 2020-12-08 | Imagine Communications Corp. | Systems and methods for production of fragmented video content |
CN117857812A (zh) * | 2018-02-20 | 2024-04-09 | 弗劳恩霍夫应用研究促进协会 | 支持变化的分辨率和/或有效地处理区域级打包的图片/视频编码 |
US10939142B2 (en) | 2018-02-27 | 2021-03-02 | Charter Communications Operating, Llc | Apparatus and methods for content storage, distribution and security within a content distribution network |
US10963697B2 (en) * | 2018-06-05 | 2021-03-30 | Philip Martin Meier | Systems and methods for generating composite media using distributed networks |
CN109218763A (zh) * | 2018-11-12 | 2019-01-15 | 青岛海信传媒网络技术有限公司 | 一种流媒体视频切换的方法及智能电视 |
US11381867B2 (en) * | 2019-01-08 | 2022-07-05 | Qualcomm Incorporated | Multiple decoder interface for streamed media data |
GB201905400D0 (en) * | 2019-04-16 | 2019-05-29 | V Nova Int Ltd | Video coding technology |
CN111836076B (zh) * | 2019-04-18 | 2023-01-20 | 腾讯科技(深圳)有限公司 | 视频分辨率切换方法及装置、电子设备 |
CN111031385B (zh) * | 2019-12-20 | 2022-03-08 | 北京爱奇艺科技有限公司 | 视频播放的方法及装置 |
CN114946192A (zh) | 2020-01-15 | 2022-08-26 | 杜比国际公司 | 利用比特率切换自适应流式传输媒体内容 |
US11196795B2 (en) * | 2020-03-25 | 2021-12-07 | Arris Enterprises Llc | Method and apparatus for predicting video decoding time |
KR20220032938A (ko) * | 2020-09-08 | 2022-03-15 | 삼성전자주식회사 | 전자 장치 및 그 동작 방법 |
WO2022136313A2 (en) * | 2020-12-21 | 2022-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | File parser, file generator, encoder, decoder, client, server, and methods using parameter sets for coded video sequences |
CN113438512A (zh) * | 2021-05-28 | 2021-09-24 | 福州市拾联信息科技有限公司 | 一种视频数据快速切换画质及低码流控制系统及其控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246643A1 (en) * | 2011-08-31 | 2013-09-19 | Qualcomm Incorporated | Switch signaling methods providing improved switching between representations for adaptive http streaming |
WO2013163224A1 (en) * | 2012-04-24 | 2013-10-31 | Vid Scale, Inc. | Method and apparatus for smooth stream switching in mpeg/3gpp-dash |
JP2015019329A (ja) * | 2013-07-12 | 2015-01-29 | 富士通株式会社 | ストリーム配信システム、ストリーム作成装置、ストリーム配信方法およびストリーム作成方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7369610B2 (en) * | 2003-12-01 | 2008-05-06 | Microsoft Corporation | Enhancement layer switching for scalable video coding |
US20080022331A1 (en) * | 2006-06-30 | 2008-01-24 | Microsoft Corporation | Multi-DVR Media Stream Transition |
CN101742324A (zh) | 2008-11-14 | 2010-06-16 | 北京中星微电子有限公司 | 视频编解码方法、视频编解码系统及编解码器 |
US20130298170A1 (en) * | 2009-06-12 | 2013-11-07 | Cygnus Broadband, Inc. | Video streaming quality of experience recovery using a video quality metric |
CN108337521B (zh) | 2011-06-15 | 2022-07-19 | 韩国电子通信研究院 | 存储由可伸缩编码方法生成的比特流的计算机记录介质 |
EP2547062B1 (en) * | 2011-07-14 | 2016-03-16 | Nxp B.V. | Media streaming with adaptation |
US9161039B2 (en) | 2012-09-24 | 2015-10-13 | Qualcomm Incorporated | Bitstream properties in video coding |
JP6290924B2 (ja) | 2013-01-07 | 2018-03-07 | ノキア テクノロジーズ オサケユイチア | ビデオ・コーディングおよびデコーディングのための方法と装置 |
US9900629B2 (en) * | 2013-03-13 | 2018-02-20 | Apple Inc. | Codec techniques for fast switching with intermediate sequence |
GB2516224A (en) * | 2013-07-11 | 2015-01-21 | Nokia Corp | An apparatus, a method and a computer program for video coding and decoding |
JP6094688B2 (ja) | 2013-12-27 | 2017-03-15 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
WO2016108188A1 (en) * | 2014-12-31 | 2016-07-07 | Nokia Technologies Oy | Inter-layer prediction for scalable video coding and decoding |
-
2017
- 2017-02-14 WO PCT/EP2017/053310 patent/WO2017140685A1/en active Application Filing
- 2017-02-14 CA CA3014370A patent/CA3014370A1/en active Pending
- 2017-02-14 KR KR1020187026849A patent/KR102287703B1/ko active IP Right Grant
- 2017-02-14 EP EP17704040.9A patent/EP3417625A1/en active Pending
- 2017-02-14 JP JP2018543327A patent/JP7026627B2/ja active Active
- 2017-02-14 CN CN201780023999.3A patent/CN109076252B/zh active Active
- 2017-02-15 TW TW106104881A patent/TWI670974B/zh active
-
2018
- 2018-08-17 US US15/999,044 patent/US10986383B2/en active Active
-
2021
- 2021-05-06 JP JP2021078695A patent/JP7483657B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246643A1 (en) * | 2011-08-31 | 2013-09-19 | Qualcomm Incorporated | Switch signaling methods providing improved switching between representations for adaptive http streaming |
JP2014529970A (ja) * | 2011-08-31 | 2014-11-13 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 適応httpストリーミングのための表示の改善された切り替えを提供する切替シグナリング方法 |
WO2013163224A1 (en) * | 2012-04-24 | 2013-10-31 | Vid Scale, Inc. | Method and apparatus for smooth stream switching in mpeg/3gpp-dash |
JP2015518350A (ja) * | 2012-04-24 | 2015-06-25 | ヴィド スケール インコーポレイテッド | Mpeg/3gpp−dashにおける滑らかなストリーム切り換えのための方法および装置 |
JP2015019329A (ja) * | 2013-07-12 | 2015-01-29 | 富士通株式会社 | ストリーム配信システム、ストリーム作成装置、ストリーム配信方法およびストリーム作成方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114466227A (zh) * | 2021-12-22 | 2022-05-10 | 天翼云科技有限公司 | 一种视频分析方法、装置、电子设备及存储介质 |
CN114466227B (zh) * | 2021-12-22 | 2023-08-04 | 天翼云科技有限公司 | 一种视频分析方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2019509672A (ja) | 2019-04-04 |
CN109076252A (zh) | 2018-12-21 |
JP7026627B2 (ja) | 2022-02-28 |
KR102287703B1 (ko) | 2021-08-10 |
EP3417625A1 (en) | 2018-12-26 |
US20190014363A1 (en) | 2019-01-10 |
CA3014370A1 (en) | 2017-08-24 |
WO2017140685A1 (en) | 2017-08-24 |
JP7483657B2 (ja) | 2024-05-15 |
KR20180113593A (ko) | 2018-10-16 |
US10986383B2 (en) | 2021-04-20 |
CN109076252B (zh) | 2022-07-01 |
TWI670974B (zh) | 2019-09-01 |
TW201731295A (zh) | 2017-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021145343A (ja) | 効率的な適応ストリーミング | |
JP7273766B2 (ja) | ビデオストリーミングにおけるシーンセクションと関心領域の処理 | |
US11265562B2 (en) | Transmitting method and receiving method | |
US9357248B2 (en) | Method and apparatus for adaptive bit rate content delivery | |
JP6054398B2 (ja) | 適応httpストリーミングのための表示の改善された切り替えを提供する切替シグナリング方法 | |
JP6105717B2 (ja) | 低レイテンシストリーミングを処理するための改善されたブロック要求ストリーミングシステム | |
US9992555B2 (en) | Signaling random access points for streaming video data | |
EP2754302B1 (en) | Network streaming of coded video data | |
KR101701182B1 (ko) | 청크로 스트리밍된 컨텐츠를 복구하기 위한 방법 | |
CA2844648C (en) | Method and apparatus for adaptive transcoding of multimedia stream | |
US20120030723A1 (en) | Method and apparatus for streaming video | |
KR20220163474A (ko) | 비디오 코딩을 위한 파일 포맷 개념 | |
EP4264948A2 (en) | File parser, file generator, encoder, decoder, client, server, and methods using parameter sets for coded video sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7483657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |