JP2013153523A - 拡張されたビデオストリームを復号するための方法および装置 - Google Patents

拡張されたビデオストリームを復号するための方法および装置 Download PDF

Info

Publication number
JP2013153523A
JP2013153523A JP2013076263A JP2013076263A JP2013153523A JP 2013153523 A JP2013153523 A JP 2013153523A JP 2013076263 A JP2013076263 A JP 2013076263A JP 2013076263 A JP2013076263 A JP 2013076263A JP 2013153523 A JP2013153523 A JP 2013153523A
Authority
JP
Japan
Prior art keywords
video
enhancement layer
layer
access unit
syntax structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013076263A
Other languages
English (en)
Other versions
JP5748234B2 (ja
Inventor
A Narasimhan Mandayam
エイ. ナラシマン、マンダヤム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arris Technology Inc
Original Assignee
Arris Technology Inc
General Instrument Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arris Technology Inc, General Instrument Corp filed Critical Arris Technology Inc
Publication of JP2013153523A publication Critical patent/JP2013153523A/ja
Application granted granted Critical
Publication of JP5748234B2 publication Critical patent/JP5748234B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

【課題】H.264/AVC標準規格においてもMPEG−2システム標準規格において、基本層および拡張層アクセスユニットがどのように再アセンブルされるかについて規定すること。
【解決手段】拡張層プログラムストリームに区切シンタックス構造を挿入することによって、拡張層プログラムストリームのアクセスユニットを区切る。
【選択図】図6B

Description

本発明は、拡張ビデオストリームを復号するための方法および装置に関する。
図面の図1を参照する。ビデオエンコーダ10は、カメラなどのソースから、生ビデオデータ(通常、SMPTE−292Mにおいて規定されたHD−SDIフォーマットである)を受信する。ビデオエンコーダは、HD−SDIデータを利用してビデオ・エレメンタリストリームを生成するとともに、ビデオ・エレメンタリストリームをビデオパケット化器14に供給する。ビデオパケット化器14は、様々な長さのパケットから構成されたビデオパケット化エレメンタリストリーム(PES)を生成する。通常、ビデオPESの各パケットは、1つ以上のビデオフレームを含んでいる。同様に、オーディオエンコーダ(図示せず)は、例えば、マイクロホンから生オーディオデータを受信して、オーディオパケット化器にオーディオ・エレメンタリストリームを供給し、オーディオパケット化器は、様々な長さのパケットから構成されたオーディオPESを生成する。
ビデオおよびオーディオパケット化器はトランスポートストリーム・マルチプレクサ18にビデオおよびオーディオPESを供給する。トランスポートストリーム・マルチプレクサ18は、ビデオPESおよびオーディオPESにそれぞれ異なるプログラム識別子(PID)を割り当て、ビデオおよびオーディオPESの可変長パケットを、PESのPIDを含むヘッダとPESビデオ(またはオーディオ)データを含むペイロードとを各々有する、固定長のMPEG−2・トランスポートストリーム(TS)パケットに編成する。
トランスポートストリーム・マルチプレクサによって出力されるシングルプログラム・トランスポートストリーム(SPTS)は、プログラム・マルチプレクサ22に供給される場合がある。プログラム・マルチプレクサ22は、SPTSを他のプログラムを運ぶ他のトランスポートストリームと結合し、マルチプログラム・トランスポートストリーム(MPTS)を生成する。MPTSはチャネルを通じて受信器に送信され、受信器において、プログラム・デマルチプレクサ26は選択されたSPTSをMPTSから分離し、それをトランスポートストリーム・デマルチプレクサ30に供給する。トランスポートストリーム・マルチプレクサによって出力されるSPTSは、最初に他のトランスポートストリームと結合してMPTSを生成することなく、トランスポートストリーム・デマルチプレクサに直接送信される場合もあるが、しかしいずれの場合においても、トランスポートストリーム・デマルチプレクサは、選択されたSPTSのトランスポートストリーム・パケットを受信して、それらをPIDに基づき分離し、トランスポートストリーム・パケットを分解(depacketize)してPESパケットを再生成し、いわゆるビデオ・システムターゲットデコーダ(T−STD)34にビデオPESを宛て、オーディオT−STD38にオーディオPESを宛てることが当業者には認められる。本出願の主題はビデオビットストリームの復号に関するので、オーディオデコーダについてさらには説明しない。
ビデオT−STD34は、システムターゲットデコーダ・バッファ40およびビデオデコーダ42を備える。STDバッファ40は、トランスポート・バッファTb、多重化バッファMb、およびエレメンタリストリーム・バッファEbに機能的に等しい。トランスポート・バッファTbは、可変ビットレートでビデオPESを受信し、一定なビットレートで多重化バッファMbにデータを出力する。多重化バッファMbは、ビデオPESを分解し、符号化されたビットストリームを一定なビットレートでエレメンタリストリーム・バッファEbに供給する。エレメンタリストリーム・バッファ(デコーダ・バッファまたは符号化ピクチャ・バッファ(CPB)と呼ばれることがある)は、CBRビットストリームを受信すると、画像を復号するために、ピクチャ復号時間にビデオデコーダによってビットがすべて直ちに除去されるまで、それらのビットを保持する。
デコーダが適切に動作するには、デコーダ・バッファがオーバフロー(ビットが失われ、ピクチャの復号は不可能)やアンダーフロー(デコーダにビットが足りず、適切な時間でピクチャを復号することは不可能)を起こさないことが重要である。デコーダ・バッファに対するビットの供給は、ビデオエンコーダ10からビットストリームを受信する、圧縮データバッファ(CDB)46によって制御される。ビデオエンコーダは、CDBが満たされるのに応じたレートで、CDBにビットを供給する。CDBは一定なレートでビデオパケット化器14にビットを供給し、多重化バッファはその同じレートでデコーダ・バッファにビットを供給するので、したがって、CDBが満たされることは、デコーダ・バッファが満たされることを反映している。CDBのオーバフロー/アンダーフローを防止するようにCDBに対するビットの供給を調節することによって、デコーダ・バッファのアンダーフロー/オーバフローが回避される。
エンコーダの動作を支配するビデオ圧縮標準規格は、CDBが仮定的な基準デコーダのデコーダ・バッファより大きくないと指定する場合がある。
MPEG−2トランスポートストリームは、エラーの生じがちなチャネルを通じた符号化ビデオの送達に広く用いられている。また、MPEG−2システム層は、エラーのない環境においてプログラムストリーム(PS)による符号化ビデオの送信を行う。図1には、ビデオPESについて、ビデオT−STD34に対するトランスポートストリームとしての送達に代わる、ビデオP−STD50に対するプログラムストリームとしての送信を示す。
ビデオエンコーダ10によって生成されたビットストリームは、ISO/IEC14496−10(MPEG−4、パート10)AVC(Advanced Video Coding)により指定されるビデオ圧縮標準規格に準拠する場合がある(一般にH.264/AVCと呼ばれる)。H.264/AVCは、フレームまたはフィールドの集合語として、ピクチャを用いる。H.264/AVCでは、アクセスユニットを1組のネットワーク抽象化層(NAL)ユニットとして定義し、アクセスユニットの復号によって復号されたピクチャが常に生じると指定される。AVCエンコーダによって生成されるアクセスユニットのNALユニットは、ピクチャ情報を含むビデオ符号化層(VCL)ユニットであるか、クローズドキャプションおよびタイミングなど他の情報を含む非VCLユニットである。
H.264/AVCの補遺Gでは、スケーラブル・ビデオ符号化またはSVCとして知られているH.264/AVCの拡張について規定されている。SVCはAVC基本層にスケーラビリティの拡張を提供し、このスケーラビリティには、空間のスケーラビリティ、時間のスケーラビリティ、SNRのスケーラビリティ、およびビット深度のスケーラビリティが含まれる。SVCエンコーダは、H.264/AVC−コンフォーマント基本層を生成し、その基本層に1つ以上の拡張層によって拡張を追加することが期待される。SVCの特定の実装において用いられる各種のスケーラビリティは、それ自身の拡張層を利用することができる。例えば、生ビデオデータが1920×1088ピクセルのフレームから構成された1080HDとして知られるフォーマットである場合、基本層は、704×480ピクセルのピクチャとして復号可能なアクセスユニットから構成されたサブビットストリームによって運ばれるのに対し、拡張層は、基本層アクセスユニットを拡張層アクセスユニットと組み合わせることによって、適切なデコーダが1920×1088ピクセルのピクチャを提示することを可能とするアクセスユニットから構成されたサブビットストリームによって運ばれる。
基本層および1つ以上の拡張層の両方を復号する性能を有するデコーダを本明細書ではSVCデコーダと呼び、拡張層を認識可能でなく、基本層アクセスユニットのみを復号可能、したがってSVC性能を有していないデコーダを、本明細書ではAVCデコーダと呼ぶ。
SVCエンコーダによって生成されるアクセスユニットは、上述の基本層NALユニット(簡便のためAVC−NALユニットと呼ばれる場合がある)のみならず、SVC−VCL−NALユニットおよびSVC−非VCL−NALユニット。図2には、SVC標準規格によって規定されるようなSVCアクセスユニットにおける、AVC−NALユニットおよびSVC−NALユニットのシーケンスを示す。エンコーダが、例えば、2つの拡張層を生成する場合、2つの拡張層における非VCL−NALユニットは図2に示すシーケンスの隣接したブロック、すなわち、AVC非VCL−NALユニットおよびAVC−VCL−NALユニットを含むブロック間にあり、2つの拡張層におけるSVC−VCL−NALユニットはAVC−VCL−NALユニットを含むブロックの後のシーケンスの隣接したブロックにある。
アクセスユニットから基本層NALユニットを抽出するSVCデコーダは、AVC非VCL−NALユニットおよびAVC−VCL−NALユニットのみを選択する。
H.264/AVCでは、5ビットのパラメータであるnalユニット型(nal_unit_type)、すなわち、NUTが指定される。H.264/AVCの下では、AVC−NALユニットはすべて、1〜13の範囲のNUT値を有する。SVCでは、NUT値14,20,15が追加される。しかしながら、5または1に等しいNUTを有するNALユニットの直前の14に等しいNUTを有するNALユニットは、それらのNALユニット(非VCL−NALユニットである)がAVCとの互換性を有し、AVCデコーダによって復号可能であるように、基本層スライスのシグナリングを行う。
図3を参照すると、SVCエンコーダ10’は、基本層と、例えば、2つの拡張層ENH1,ENH2とを運ぶ、ユニタリ・ビットストリームを生成する。その性能に応じて、デコーダは、基本層のみを、または基本層および拡張層ENH1を、または基本層ならびに拡張層ENH1,ENH2の両方を受信すること、および復号することを期待する。SVC用のMPEG−2システム標準規格およびユースケースの下では、エンコーダは、3つのビットストリーム(それぞれ基本層のみを、基本層および拡張層ENH1を、基本層ならびに拡張層ENH1,ENH2の両方を、運ぶビットストリーム)を提供することはできず、デコーダの復号可能なビットストリームがいずれであっても、デコーダにビットストリームを選択させることはできない。エンコーダは、別個のビットストリームにより基本層アクセスユニットと各拡張層の一部とを提供する必要がある。NAL分離器48を用いて、NALユニットのNUT値に基づきユニタリ・ビットストリームを3つのサブビットストリームへと分離することによって、原理的には、MPEG−2システム標準規格に準拠することが可能である。1つのサブビットストリームは基本層NALユニットを運ぶ、他の2つのサブビットストリームはそれぞれ、2つの拡張層用のNALユニットを運ぶ。3つのサブビットストリームは、それぞれのビデオパケット化器(一般に14で表す)に渡され、ビデオパケット化器はそれぞれのビデオPESを生成する。3つのビデオPESは、3つのパケット化器の出力を一緒に多重化する目的で、SVC−T−STDに含まれたバッファにT−STDバッファ均等物を含む、トランスポートストリーム・マルチプレクサ18に供給される。マルチプレクサ18は、3つのPESに異なるPIDを割り当てて、3つの層を運ぶトランスポートストリームを出力する。
米国特許出願公開第2007/0230564号明細書
図1に示すビデオT−STD34は、基本層および拡張層アクセスユニットを再アセンブルし、SVCデコーダによって復号可能な完全なSVCアクセスユニットを生成する性能を提供しないので、図3に示すトランスポートストリーム・マルチプレクサ18’によって生成されるトランスポートストリームによって運ばれるビットストリームを復号することは不可能である。H.264/AVC標準規格においてもMPEG−2システム標準規格においても、基本層および拡張層アクセスユニットがどのように再アセンブルされるかについて規定されてない。したがって、図3に示すアーキテクチャには、従来、実用的な用途が欠けていた。
開示の主題の第1の態様では、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成された拡張ビデオストリームを復号する方法において、各アクセスユニットは複数のシンタックス構造を含む方法、が提供される。この方法は、基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造のシーケンスを再結合して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む。
開示の主題の第2の態様では、拡張されたビデオ信号を生成する方法が提供される。この方法は、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程と、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む。
開示の主題の第3の態様では、拡張されたビデオ信号を生成する方法が提供される。この方法は、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程であって、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む工程と、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む。
開示の主題の第4の態様では、拡張ビデオストリームの一連の基本層アクセスユニットを運ぶ基本層プログラムストリームと、該拡張ビデオストリームの一連の拡張層アクセスユニットを運ぶ1つ以上の拡張層プログラムストリームとを復号するための復号装置が提供される。各アクセスユニットは複数のシンタックス構造を含み、復号装置は、基本層プログラムストリームを受信して、各基本層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている基本層バッファと、拡張層プログラムストリームを受信して、各拡張層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている拡張層バッファと、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造を受信して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成するように接続されている再アセンブリ機能部と、を備える。
開示の主題の第5の態様では、拡張されたビデオ信号を生成するための装置が提供される。この装置は、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するための分離器と、拡張層プログラムストリームに区切シンタックス構造を挿入するための挿入器と、を備える。
開示の主題の第6の態様では、拡張されたビデオ信号を生成するための装置が提供される。この装置は、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む。この装置は、さらに、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するためと、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含め、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含むための分離器と、を備える。
開示の主題の第7の態様では、基本層アクセスユニットおよび拡張層アクセスユニットを運ぶ拡張ビデオストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各アクセスユニットは複数のシンタックス構造を含む、コンピュータ可読媒体を提供する。この方法は、基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造のシーケンスを再結合して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む。
開示の主題の第8の態様では、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体を提供する。この方法は、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む。
開示の主題の第9の態様では、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含むコンピュータ可読媒体を提供する。この方法は、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む。
プレゼンテーション用の圧縮ビデオマテリアルを供給するための第1のシステムのアーキテクチャの概略ブロック図。 基本層および1つの拡張層を有するSVCアクセスユニットの構造を示す図。 復号およびプレゼンテーション用の圧縮したSVCビデオマテリアルの送信用のアーキテクチャおよびユースケースの概略ブロック図。 プレゼンテーション用の圧縮ビデオマテリアルを供給するための第2のシステムのアーキテクチャの概略ブロック図。 プレゼンテーション用の圧縮ビデオマテリアルを供給するための第3のシステムのアーキテクチャの概略ブロック図。 図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。 図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。 図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。 図4および図5に関連して記載した処理の一部を実装するために用いられ得るコンピュータの概略ブロック図。
図4に示すSVCエンコーダ10’は、基本層と1つの拡張層とを運ぶビットストリームを生成する。NAL分離器52は、このビットストリームを、基本層NALユニットおよび拡張層NALユニットをそれぞれ運ぶ2つのサブビットストリームに分け、この2つのサブビットストリームは、基本層ビデオパケット化器140および拡張層ビデオパケット化器141に渡される。図3に関連して記載したように、2つのパケット化器はそれぞれビデオPESを生成する。トランスポートストリーム・マルチプレクサ54は、2つのPESに異なるPIDを割り当てて、2つの層を運ぶトランスポートストリームを出力する。トランスポートストリーム・マルチプレクサ54は、SVC−T−STDモデルに準拠するT−STDバッファを含む。トランスポートストリームは、SPTSとしてトランスポートストリーム・デマルチプレクサ56に対し直接送信されるか、他のトランスポートストリームと多重化され、プログラム・デマルチプレクサ(図示せず)を介してトランスポートストリーム・デマルチプレクサ56に対しMPTSの一部として供給される。
従来のように、トランスポートストリーム・デマルチプレクサ56は、PIDに基づきトランスポートストリーム・パケットを分離し、トランスポートストリーム・パケットを分解してPESパケットを再生成する。このようにして、トランスポートストリーム・デマルチプレクサは、基本層PESおよび拡張層PESの両方や1つ以上のオーディオPESを出力する。図4に示すように、基本層PESおよび拡張層PESは、ビデオT−STD60に対し供給される。ビデオT−STD60は、基本層T−STDバッファ64および拡張層T−STDバッファ68を含む。基本層T−STDバッファ64は、図1に示したT−STDバッファ40と同様、トランスポート・バッファTb0および多重化バッファMb0を含む。多重化バッファは、エレメンタリストリーム・バッファセグメントESb0に対し、基本層アクセスユニット(AVC非VCL−NALユニットおよびAVC−VCL−NALユニット)を含む符号化ビットストリームを出力する。バッファセグメントESb0のサイズは、H.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。
また、拡張層T−STDバッファ68は、トランスポート・バッファTb1、多重化バッファMb1、およびエレメンタリストリーム・バッファセグメントESb1も含む。多重化バッファMb0と同様、バッファMb1は、拡張層アクセスユニット(SVC−非VCL−NALユニットおよびSVC−VCL−NALユニット)を含む符号化ビットストリームを出力し、この符号化ビットストリームは、基本層アクセスユニットと適切に組み合わされると、H.264の補遺Gにより規定されているようなSVCアクセスユニットを生成する。
バッファセグメントESb0,ESb1の結合したサイズは、基本層および1つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。しかしながら、許可される総バッファサイズは、バッファセグメントESb0のサイズがAVCデコーダ用のH.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えない限り、デコーダの性能を最適化するようにバッファセグメント間に割り当てられてよい。
トランスポートストリーム・デマルチプレクサ56によって受信されるアクセスユニットのNALユニットは、アクセスユニットを復号するために必要な順序になっていない場合もあることが、当業者には認められる。エレメンタリストリーム・バッファセグメント(多重化バッファによって提供される符号化ビットストリームを受信する)は、各アクセスユニットのNALユニットが復号に適切な順序により出力されることを保証する。再アセンブリ機能部Re−Aは、2つのT−STDバッファによってそれぞれ出力されるAVCおよびSVC−NALユニットを受信し、それらのNALユニットを適切なシーケンスにより結合して、図2に示すSVCアクセスユニット構造を再作成する。再アセンブリ機能部は、それぞれの適切な時間で復号を行うために、SVCデコーダにSVCアクセスユニットを供給する。このようにして、T−STD60は、SVCによってサポートされる拡張を含むピクチャを出力することが可能である。
バッファ管理(すなわち、トランスポート・バッファ、多重化バッファ、および結合したエレメンタリストリーム・バッファセグメントのサイズや、バッファ間の転送レート)は、従来のMPEG−2のT−STDにおけるのと同じである。データは、従来のMPEG−2のT−STDモデルにおける多重化バッファからのデータの出力用に指定されたレートでエレメンタリストリーム・バッファセグメントに入り、所与のSVCアクセスユニットの基本層NALユニットおよび拡張層NALユニットの両方が、それぞれのエレメンタリストリーム・バッファセグメントに存在した後、即座に再アセンブリ機能部に対し転送され、そこで結合されて、即座にSVCデコーダに対し転送される。したがって、エレメンタリストリーム・バッファセグメントおよび再アセンブリ機能部は、多重化バッファとSVCデコーダとの間のレイテンシを生じない。
トランスポートストリーム・マルチプレクサ54によって出力されるトランスポートストリームは、トランスポートストリーム・デマルチプレクサ30を介してAVC−T−STD34’にも供給される場合がある。トランスポートストリーム・マルチプレクサ30は、基本層PESをトランスポートストリームから分離し、基本層PESをT−STD34’に供給する。拡張層PESがT−STD34’に対して供給されないので、T−STD34’は、基本層アクセスユニットの復号に不要なNALユニットを処理することが必要となることによる負担を受けない。
ここで図5を参照すると、別の実施形態では、SVCエンコーダ10’によって生成されたビットストリームは基本層および2つの拡張層ENH1,ENH2を運ぶ。NAL分離器52は、NALユニットのNUT値に基づきビットストリームを3つのサブビットストリームに分離するが、図4の場合と異なり、基本層ビットストリームは、AVC−NALユニットだけでなく、SVC−非VCL−NALユニット(上述のように、AVCに対する互換性を有するNALユニットを含む)も含む。NAL分離器によって生成される基本層ビットストリームは、図6Aに示す構造を有する。2つの各拡張層サブビットストリームは各々、それぞれのSVCアクセスユニット用のSVC−VCL−NALユニットを含む。また、NAL分離器は、図6Bに示すように、各拡張層サブビットストリームの各アクセスユニットの開始部に、SVC区切(delim)NALユニットを挿入する。SVC区切NALユニットは非常に小さくすることができ、23または24など、予約済みのNUT値を有する。このSVC区切NALユニットは、MPEG−2のシステム標準規格によって定められるように、アクセスユニットデリミタに加え、9に等しいNUTを有する。
3つのサブビットストリームがそれぞれパケット化器140,141,142に供給され、パケット化器は、それぞれPESを生成し、そのPESをトランスポートストリーム・マルチプレクサ72に供給する。トランスポートストリーム・マルチプレクサ72(SVC−T−STDモデルに準拠するバッファを含む)は、この3つのPESに対し異なるPIDを割り当て、3つの層を運ぶ1つのトランスポートストリームを出力する。基本層PESは、基本層アクセスユニットを復号するのに必要なAVC−NALユニットを全て含むことが認められる。
トランスポートストリーム・マルチプレクサ72によって生成されたトランスポートストリームは、トランスポートストリーム復号機能部74に対し供給される。トランスポートストリーム復号機能部は、トランスポートストリーム・デマルチプレクサ76を含み、トランスポートストリーム・デマルチプレクサ76は、PIDに基づき基本層PESおよび2つの拡張層PESを分離して、それぞれのT−STDバッファ80,81,82に対しそれらを供給する。各T−STDバッファは、トランスポート・バッファTb、多重化バッファMb、およびエレメンタリストリーム・バッファセグメントESbを含む。バッファセグメントESb0,ESb1,ESb2の結合したサイズは、基本層および2つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。しかしながら、許可される総バッファサイズは、バッファセグメントESb0,ESb1の結合したサイズが、基本層および1つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えず、バッファセグメントESb0のサイズが、AVCデコーダ用のH.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えない限り、デコーダの性能を最適化するようにバッファセグメント間に割り当てられてよい。
各T−STDバッファは、図4に関連して記載したのと同様にして受信したビットストリームを、バッファDRB0が図6Aに示す構造を有するアクセスユニットを出力し、バッファDRB1およびDRB2が各々図6Bに示す構造を有するアクセスユニットを出力するように、処理する。バッファ構造の出力は、図6Cに示す各アクセスユニットについてのNALユニットのシーケンスを生成するように、再アセンブリ機能部Re−Aによって連結される。再アセンブリ機能部の出力は、図4に関連して記載したように、エレメンタリストリーム・バッファに渡される。
図5には、図4に関連して記載したように、マルチプレクサ54によって出力されるトランスポートストリームがトランスポートストリーム・デマルチプレクサ30を介してAVC−T−STD34’に供給され得ることを示す。
また、図5には、エラーのない媒体を通じて、プログラムストリーム復号機能部90に供給されている3つのビデオPESを示す。基本層PESが基本層AVC−P−STD(バッファおよびデコーダを含む)に対し供給されるのに対し、基本層PESおよび2つの拡張層PES(ENH1,ENH2)は、プログラムストリーム・マルチプレクサに対し供給される。プログラムストリーム・マルチプレクサは、SVC−P−STDモデルに準拠するバッファを備える。プログラムストリーム・マルチプレクサは、基本層PESおよび拡張層PES(ENH1)をSVCデコーダ91に供給する。これは、基本層PESおよび拡張層PESからPESヘッダを除去し、エレメンタリストリーム・バッファセグメントESb0に基本層ビットストリームを宛て、エレメンタリストリーム・バッファセグメントESb1に拡張層ENH1ビットストリームを宛てる、プログラムストリーム・デマルチプレクサを含む。バッファセグメントESb0,ESb1の出力は、再アセンブリ機能部に渡される。バッファセグメントESb0,ESb1のサイズは、バッファ80,81におけるエレメンタリストリーム・バッファセグメントのサイズと同様に変化し得る。SVCデコーダ91の動作は、したがって、プログラムストリームに関してはバッファ80,81の動作に相当し、トランスポートストリームに関しては再アセンブリ機能部に相当する。
プログラムストリーム・マルチプレクサは、基本層PESと2つの拡張層PES(ENH1,ENH2)とをSVCデコーダ92に供給する。SVCデコーダ92はデコーダ91と同様であるが、T−STDバッファ82におけるエレメンタリストリーム・バッファに対応するエレメンタリストリーム・バッファセグメントESb2だけ増大している。プログラムストリーム復号機能部90は、したがって、基本層のみを、または基本層および拡張層ENH1を、または基本層ならびに拡張層ENH1および拡張層ENH2の両方を、復号することが可能である。
図4に示した実施形態および図5に示した実施形態の両方において、利用可能なバッファサイズは、補遺Gを含むH.264/AVC標準規格における制限に基づき、エンコーダによって生成されるビットストリームの様々な層に対し、必要に応じて動的に割り当てられてよい。このようにして様々な層に対するバッファサイズの動的で柔軟な割当を可能とすることによって、デコーダは、例えば、アクセスユニットの複雑さに基づき、基本層に対するバッファサイズの割当を減少させるとともに、拡張層のうちの1つ以上に対するバッファサイズの割当を増加させて、適切な復号を行うことができる。
SVC区切NALユニットは、トランスポートストリーム・デマルチプレクサ76によって容易に検出され、SVC−VCL−NALユニットの分離を容易にする。SVC区切NALユニットは、デコーダによって認識されず、したがって、拡張層アクセスユニットの復号に影響を与えない。
図4に関連して記載したように、NAL分離器は、基本層PESが図2に示すアクセスユニット構造のAVC−NALユニットのみを含み、拡張層PESがSVC−NALユニットを全て含むように、SVC−非VCL−NALユニットおよびSVC−VCL−NALユニットの両方をSVCアクセスユニットから分離することができる。一方、図5の場合には、NAL分離器は、基本層PESがSVC−非VCL−NALユニットを含むように、AVC−NALユニットによってSVC−非VCL−NALユニットをグループ化する。この手法によって、基本層PESを送信するのに必要な帯域幅はわずかに増大するが、図2に示すSVCアクセスユニット構造に対する考察から、基本層PESにSVC−非VCL−NALユニットを含めることで、基本層PESおよび拡張層PESにそれぞれ含まれるNALユニットの単純な連結によってSVCアクセスユニットの再アセンブリを行うことが可能であることが認められる。他の場合には、再アセンブリバッファではデータの構文解析(パース)が必要となり、処理にレイテンシおよび複雑さが加わる。SVCアクセスユニットの再アセンブリが単純であるため、基本層PESを送信するのにわずかに大きな帯域幅が必要であるという小さな不利は相殺される。
図6を参照すると、図4または図5に示したNAL分離器およびパケット化器、図4に示したトランスポートストリーム・デマルチプレクサ56およびビデオT−STD60、または図5に示したプログラムストリームまたはトランスポートストリームの復号機能部は、一般に従来のアーキテクチャにより構成された、1つ以上のプロセッサ161、ランダムアクセスメモリ162、リードオンリメモリ163、I/Oデバイス164(ビットストリームの送受信のための適切なアダプタを含む)、ユーザ・インタフェース165、CD−ROMドライブ166、およびハードディスクドライブ167を備える、コンピュータを用いて実装できる。このコンピュータは、ハードディスクドライブ167またはCD−ROM168などコンピュータ可読媒体に記憶され、実行のためにランダムアクセスメモリ162へロードされるプログラムによって、動作する。このプログラムは、コンピュータが、入力アダプタを介して含まれる特定の入力信号を運ぶビットストリームを受信するとき、コンピュータが適切なバッファにメモリを割り当てるとともに他の適切な資源を利用し、図4および5に関連して記載した様々な動作を実行するように機能して、特定の出力信号を運ぶビットストリームを出力アダプタを介して送信する命令から構成されている。
1つまたは2つの拡張層に関連してスケーラブルなビデオストリームについて記載したが、H.264/AVCに対する補遺Gでは7つまでの拡張層が可能であることが、当業者には認められる。また、スケーラブルなビデオに関して拡張層について記載したが、AVC基本層に対する他の種類の拡張も可能であることも認められる。
添付の特許請求の範囲では、H.264/AVCに関する参照文献において用いられる用語(シンタックス構造など)も用いているが、それは読手の簡便のためのものであり、H.264/AVCに記載されている特定のビデオ符号化に依存した方法、装置、およびコンピュータ可読媒体に、特許請求の範囲を限定することを意図したものではない。

Claims (10)

  1. 拡張されたビデオ信号を生成する方法であって、前記方法は、
    基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程と、
    ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
    前記拡張層プログラムストリームに区切シンタックス構造を挿入することによって、前記拡張層プログラムストリームのアクセスユニットを区切る工程と
    を有する方法。
  2. 拡張されたビデオ信号を生成する方法であって、前記方法は、
    基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程であって、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む工程と、
    ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
    前記拡張層アクセスユニットの非ビデオ層シンタックス構造を前記基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と
    を有し、
    前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含まない、方法。
  3. 多重化トランスポートストリームの一連の基本層アクセスユニットを運ぶ基本層プログラムストリームと、前記多重化トランスポートストリームの一連の拡張層アクセスユニットを運ぶ1つ以上の拡張層プログラムストリームとを復号するための復号装置において、各アクセスユニットは複数のシンタックス構造を含み、各拡張層は、ビデオ層シンタックス構造と非ビデオ層シンタックス構造とを含み、前記復号装置は、
    前記基本層プログラムストリームと前記非ビデオ層シンタックス構造とを受信するように接続され、各基本層アクセスユニットのシンタックス構造と前記非ビデオ層シンタックス構造とを所定のシーケンスにより出力するように構成されている基本層バッファと、
    前記拡張層プログラムストリームと前記ビデオ層シンタックス構造とを受信するように、かつ各拡張層アクセスユニットの前記ビデオ層シンタックス構造を所定のシーケンスにより出力するように接続されている拡張層バッファと、
    前記基本層バッファおよび前記拡張層バッファによってそれぞれ出力されるシンタックス構造を受信して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成するように接続されている再アセンブリ機能部と
    を備え、
    前記非ビデオ層シンタックス構造は、前記拡張層バッファによって受信されない、復号装置。
  4. 前記復号装置はさらに、完全な拡張アクセスユニットを受信するように接続されているビデオデコーダを備え、
    前記ビデオデコーダは、拡張アクセスユニットを復号してビデオ表現ユニットを形成するように動作する、
    請求項3に記載の復号装置。
  5. 前記基本層プログラムストリームと前記拡張層プログラムストリームは、トランスポートストリームによりカプセル化されており、
    前記復号装置は、トランスポートストリームを受信するための、かつ基本層プログラムストリームと拡張層プログラムストリームとを分離して出力するためのトランスポートストリーム・デマルチプレクサを備える、
    請求項3に記載の復号装置。
  6. 各拡張層アクセスユニットに含まれるシンタックス構造は、ビデオ符号化層拡張層アクセスユニットを含み、
    トランスポートストリームによりカプセル化された前記拡張層プログラムストリームの各拡張層アクセスユニットは、前記拡張層アクセスユニットに含まれるビデオ符号化層アクセスユニットの境界を示す区切シンタックス構造を運び、
    前記トランスポートストリーム・デマルチプレクサは、前記区切シンタックス構造に基づきトランスポートストリームから前記拡張層アクセスユニットを抽出する、
    請求項5に記載の復号装置。
  7. 拡張されたビデオ信号を生成するための装置であって、前記装置は、
    基本層アクセスユニットと拡張層アクセスユニットとを有するユニタリ・ビットストリームを受信するための入力アダプタに通信可能に接続された少なくとも1つのプロセッサを備え、
    前記少なくとも1つのプロセッサは、前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するための分離器を提供するように構成され、
    前記少なくとも1つのプロセッサはさらに、前記拡張層プログラムストリームのアクセスユニットを区切るために、前記拡張層プログラムストリームに区切シンタックス構造を挿入するための挿入器を提供するように構成される装置。
  8. 拡張されたビデオ信号を生成するための装置であって、前記装置は、
    基本層アクセスユニットと拡張層アクセスユニットとを有するユニタリ・ビットストリームを受信するための入力アダプタに通信可能に接続された少なくとも1つのプロセッサを備え、各拡張層アクセスユニットは、ビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、
    前記少なくとも1つのプロセッサは、分離器を提供するように構成され、
    前記分離器は、前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離し、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を、前記基本層プログラムストリームに含め、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含み、それによって前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオシンタックス構造を含まない、装置。
  9. 基本層アクセスユニットと拡張層アクセスユニットとを有するユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含む固定されたコンピュータ可読媒体において、前記方法は、
    前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
    拡張層プログラムストリームに区切シンタックス構造を挿入することによって、前記拡張層プログラムストリームのアクセスユニットを区切る工程と
    を有する、コンピュータ可読媒体。
  10. 基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、前記方法は、
    前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
    拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含み、前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオシンタックス構造を含まない工程と
    を有する、コンピュータ可読媒体。
JP2013076263A 2008-03-06 2013-04-01 拡張されたビデオストリームを復号するための方法および装置 Active JP5748234B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US3437008P 2008-03-06 2008-03-06
US61/034,370 2008-03-06
US12/395,056 2009-02-27
US12/395,056 US8369415B2 (en) 2008-03-06 2009-02-27 Method and apparatus for decoding an enhanced video stream

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010548941A Division JP5238827B2 (ja) 2008-03-06 2009-03-04 拡張されたビデオストリームを復号するための方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015095098A Division JP6040282B2 (ja) 2008-03-06 2015-05-07 拡張されたビデオストリームを復号するための方法および装置

Publications (2)

Publication Number Publication Date
JP2013153523A true JP2013153523A (ja) 2013-08-08
JP5748234B2 JP5748234B2 (ja) 2015-07-15

Family

ID=41053556

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010548941A Active JP5238827B2 (ja) 2008-03-06 2009-03-04 拡張されたビデオストリームを復号するための方法および装置
JP2013076263A Active JP5748234B2 (ja) 2008-03-06 2013-04-01 拡張されたビデオストリームを復号するための方法および装置
JP2015095098A Active JP6040282B2 (ja) 2008-03-06 2015-05-07 拡張されたビデオストリームを復号するための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010548941A Active JP5238827B2 (ja) 2008-03-06 2009-03-04 拡張されたビデオストリームを復号するための方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015095098A Active JP6040282B2 (ja) 2008-03-06 2015-05-07 拡張されたビデオストリームを復号するための方法および装置

Country Status (7)

Country Link
US (1) US8369415B2 (ja)
EP (2) EP2253070B1 (ja)
JP (3) JP5238827B2 (ja)
KR (2) KR101501333B1 (ja)
CN (3) CN104202600B (ja)
ES (1) ES2530218T3 (ja)
WO (1) WO2009111519A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9167246B2 (en) 2008-03-06 2015-10-20 Arris Technology, Inc. Method and apparatus for decoding an enhanced video stream
US8300705B2 (en) * 2008-12-08 2012-10-30 Electronics And Telecommunications Research Institute Method for generating and processing hierarchical PES packet for digital satellite broadcasting based on SVC video
KR101216329B1 (ko) * 2009-12-16 2012-12-27 한국전자통신연구원 복수 계층 영상의 품질 측정 방법 및 시스템
WO2011084913A2 (en) 2010-01-06 2011-07-14 Dolby Laboratories Licensing Corporation Complexity-adaptive scalable decoding and streaming for multi-layered video systems
WO2011097755A1 (zh) * 2010-02-11 2011-08-18 上海贝尔股份有限公司 基于svc的e-mbms流传输方法和设备
KR20110124161A (ko) * 2010-05-10 2011-11-16 삼성전자주식회사 계층 부호화 영상의 송수신 방법 및 장치
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
JP2012095053A (ja) * 2010-10-26 2012-05-17 Toshiba Corp ストリーム伝送システム、送信装置、受信装置、ストリーム伝送方法及びプログラム
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
KR20130085987A (ko) * 2012-01-20 2013-07-30 한국전자통신연구원 이종망 네트워크에서 미디어 프래그먼트 유닛으로 나누어진 액세스 유닛을 가지는 미디어 데이터를 전송하는 방법
AU2013243822B2 (en) * 2012-04-06 2016-06-23 Vidyo, Inc. Level signaling for layered video coding
JP5979948B2 (ja) * 2012-04-11 2016-08-31 キヤノン株式会社 画像データ送信装置及び画像データ受信装置
JP5979949B2 (ja) 2012-04-11 2016-08-31 キヤノン株式会社 画像データ送信装置及び画像データ受信装置
CN103533404B (zh) * 2012-07-04 2016-12-21 扬智电子科技(上海)有限公司 数字广播电视的接收方法
US9154785B2 (en) * 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US20140301436A1 (en) * 2013-04-05 2014-10-09 Qualcomm Incorporated Cross-layer alignment in multi-layer video coding
US10063868B2 (en) 2013-04-08 2018-08-28 Arris Enterprises Llc Signaling for addition or removal of layers in video coding
WO2015009693A1 (en) * 2013-07-15 2015-01-22 Sony Corporation Layer based hrd buffer management for scalable hevc
KR102416235B1 (ko) 2013-07-15 2022-07-05 지이 비디오 컴프레션, 엘엘씨 다계층식 비디오 코딩에서의 저지연 개념
CN103338410B (zh) * 2013-07-19 2016-05-11 西安电子科技大学 多路径并行传输下基于svc的实时流媒体重组算法
US10291922B2 (en) 2013-10-28 2019-05-14 Arris Enterprises Llc Method and apparatus for decoding an enhanced video stream
CA2949823C (en) 2014-05-21 2020-12-08 Arris Enterprises Llc Individual buffer management in transport of scalable video
US10205949B2 (en) 2014-05-21 2019-02-12 Arris Enterprises Llc Signaling for addition or removal of layers in scalable video
CN107925776B (zh) * 2015-08-25 2021-06-08 索尼公司 发送装置、发送方法、接收装置和接收方法
GB2598255B (en) 2016-02-17 2022-07-27 V Nova Int Ltd Physical adapter, signal processing equipment, methods and computer programs
JP7178907B2 (ja) * 2017-02-03 2022-11-28 ソニーグループ株式会社 送信装置、送信方法、受信装置および受信方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050180512A1 (en) * 2004-01-16 2005-08-18 Narasimhan Mandayam A. Method and apparatus for determining timing information from a bit stream
JP2007006298A (ja) * 2005-06-27 2007-01-11 Hitachi Ltd 映像信号伝送方法、及び映像処理装置
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
KR20060123362A (ko) * 2003-12-22 2006-12-01 코닌클리케 필립스 일렉트로닉스 엔.브이. 계층화된 비디오에 대한 디스크 할당/스케줄링
US20050201471A1 (en) * 2004-02-13 2005-09-15 Nokia Corporation Picture decoding method
US7852353B1 (en) * 2005-03-31 2010-12-14 Apple Inc. Encoding a transparency (alpha) channel in a video bitstream
US20060227871A1 (en) * 2005-03-31 2006-10-12 Madhukar Budagavi Video thumbnail method
KR100763181B1 (ko) * 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
WO2007080223A1 (en) * 2006-01-10 2007-07-19 Nokia Corporation Buffering of decoded reference pictures
CN101390399B (zh) * 2006-01-11 2010-12-01 诺基亚公司 可伸缩视频编码中的图片的后向兼容聚合
US8767836B2 (en) 2006-03-27 2014-07-01 Nokia Corporation Picture delimiter in scalable video coding
JP4660408B2 (ja) * 2006-03-27 2011-03-30 三洋電機株式会社 符号化方法
US20080095228A1 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
US8467449B2 (en) * 2007-01-08 2013-06-18 Qualcomm Incorporated CAVLC enhancements for SVC CGS enhancement layer coding
JP2009010649A (ja) * 2007-06-27 2009-01-15 Sharp Corp スケーラブルビデオストリーム復号装置およびスケーラブルビデオストリーム生成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050180512A1 (en) * 2004-01-16 2005-08-18 Narasimhan Mandayam A. Method and apparatus for determining timing information from a bit stream
JP2007006298A (ja) * 2005-06-27 2007-01-11 Hitachi Ltd 映像信号伝送方法、及び映像処理装置
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability

Also Published As

Publication number Publication date
EP2253070A4 (en) 2011-07-27
JP5748234B2 (ja) 2015-07-15
CN104967869A (zh) 2015-10-07
ES2530218T3 (es) 2015-02-27
US20090225870A1 (en) 2009-09-10
KR101303480B1 (ko) 2013-09-05
EP2253070B1 (en) 2015-01-21
CN101960726B (zh) 2015-07-01
CN101960726A (zh) 2011-01-26
EP2253070A1 (en) 2010-11-24
JP5238827B2 (ja) 2013-07-17
KR20120125655A (ko) 2012-11-16
EP2899972B1 (en) 2021-12-08
KR101501333B1 (ko) 2015-03-11
JP2015144493A (ja) 2015-08-06
CN104202600A (zh) 2014-12-10
EP2899972A1 (en) 2015-07-29
JP2011514080A (ja) 2011-04-28
US8369415B2 (en) 2013-02-05
WO2009111519A1 (en) 2009-09-11
CN104967869B (zh) 2018-06-05
KR20100119002A (ko) 2010-11-08
CN104202600B (zh) 2018-05-15
JP6040282B2 (ja) 2016-12-07

Similar Documents

Publication Publication Date Title
JP6040282B2 (ja) 拡張されたビデオストリームを復号するための方法および装置
US11722702B2 (en) Method and apparatus for decoding an enhanced video stream
KR102003925B1 (ko) 스케일러빌리티 및 뷰 정보를 제공하는 스트리밍 서비스를 위한 방법 및 장치
US20040066846A1 (en) Data processing system for stereoscopic 3-dimensional video based on MPEG-4 and method thereof
JP7200329B2 (ja) 送信方法、受信方法、送信装置及び受信装置
JP7067653B2 (ja) 復号装置
US10291922B2 (en) Method and apparatus for decoding an enhanced video stream
CN113747209A (zh) 多路ts流节目的重组方法及装置
JP7306527B2 (ja) 復号装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140701

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150507

R150 Certificate of patent or registration of utility model

Ref document number: 5748234

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250