JP5876083B2 - ランダムアクセスの後に従属ピクチャをコード化するためのビデオコード化技法 - Google Patents

ランダムアクセスの後に従属ピクチャをコード化するためのビデオコード化技法 Download PDF

Info

Publication number
JP5876083B2
JP5876083B2 JP2013557901A JP2013557901A JP5876083B2 JP 5876083 B2 JP5876083 B2 JP 5876083B2 JP 2013557901 A JP2013557901 A JP 2013557901A JP 2013557901 A JP2013557901 A JP 2013557901A JP 5876083 B2 JP5876083 B2 JP 5876083B2
Authority
JP
Japan
Prior art keywords
picture
random access
pictures
video
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013557901A
Other languages
English (en)
Other versions
JP2014513456A (ja
Inventor
チェン、イン
コバン、ムハンメド・ゼイド
チェン、ペイソン
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014513456A publication Critical patent/JP2014513456A/ja
Application granted granted Critical
Publication of JP5876083B2 publication Critical patent/JP5876083B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本開示は、ビデオコード化に関し、より詳細には、ランダムアクセスのためのビデオコード化技法に関する。
デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップ又はデスクトップコンピュータ、デジタルカメラ、デジタル記録機器、デジタルメディアプレーヤ、ビデオゲーム機器、ビデオゲームコンソール、セルラー電話又は衛星無線電話、ビデオ遠隔会議機器などを含む、広範囲にわたる機器に組み込まれ得る。デジタルビデオ機器は、デジタルビデオ情報をより効率的に送信、受信及び記憶するための、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part10,Advanced Video Coding(AVC)によって定義された規格、現在開発中の高効率ビデオコード化(HEVC:High Efficiency Video Coding)規格、及びそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実施する。
ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減又は除去するために空間的(イントラピクチャ)予測及び/又は時間的(インターピクチャ)予測を含み得る。ブロックベースのビデオコード化の場合、ビデオスライスが、ツリーブロック、コード化単位(CU)及び/又はコード化ノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の近隣ブロックにおける参照サンプルに関する空間的予測を使用して符号化される。ピクチャのインターコード化(P又はB)スライス中のビデオブロックは、同じピクチャ中の近隣ブロックにおける参照サンプルに関する空間的予測、又は他の参照ピクチャ中の参照サンプルに関する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
空間的予測又は時間的予測は、コード化されるべきブロックのための予測ブロックを使用する。残差データは、コード化されるべき元のブロックと予測ブロックとの間の画素差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコード化モードと残差データとに従って符号化される。更なる圧縮のために、残差データは、画素領域から変換領域に変換され得、次いで量子化され得る残差変換係数を生じる。最初は2次元アレイに構成される量子化された変換係数は、エントロピーコード化のための変換係数の1次元ベクトルを生成するために、特定の順序で走査され得る。
本出願は、その全体がともに参照により本明細書に組み込まれる、2011年3月10日に出願された米国仮出願第61/451,453号、及び2011年3月20日に出願された米国仮出願第61/454,548号の優先権を主張する。
概して、本開示では、ランダムアクセスのためのビデオデータをコード化するための技法について説明する。特に、本開示は、潜在的に不要なピクチャが、クリーン復号リフレッシュ(CDR:clean decoding refresh)ピクチャへのランダムアクセス要求が生じた場合に正常に復号され得る従属ピクチャであるかどうかを示すシンタックス要素をコード化することを提案する。従属ピクチャは、表示順序でクリーン復号リフレッシュ(CDR)ピクチャに後続するピクチャを復号するために使用されるピクチャである。
本開示の一例では、ビデオデータを符号化する方法が、クリーン復号リフレッシュ(CDR)ピクチャと、表示順序でCDRピクチャに後続するピクチャによって必要とされ得る1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することと、CDRピクチャがランダムアクセスのために使用される場合に従属ピクチャが復号可能であるかどうかを決定することと、CDRピクチャがランダムアクセスのために使用される場合に従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達することとを備える。
本開示の別の例では、ビデオデータを復号する方法が、クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、1つ以上の潜在的に不要なピクチャのいずれかが、CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信することとを備える。復号する本方法は、CDRピクチャへのランダムアクセスのための要求を受信することと、ランダムアクセスのための要求に応答してCDRピクチャを復号することと、受信したシンタックス要素に対応する従属ピクチャを復号することと、受信したシンタックス要素によって従属ピクチャであると示されない1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップすることとをさらに備え得る。
上記で説明した符号化及び復号方法はまた、(例えば、ビデオエンコーダ又はビデオデコーダによって)装置として実施されるか、又はコンピュータ可読媒体に記憶された命令を通して実施され得る。
1つ以上の例の詳細を添付の図面及び以下の説明に記載する。他の特徴、目的、及び利点は、その説明及び図面、並びに特許請求の範囲から明らかになろう。
クリーン復号リフレッシュ(CDR)ピクチャとイントラ予測された従属ピクチャとをもつピクチャグループの例示的な復号順序を示す概念図。 クリーン復号リフレッシュピクチャ(CDR)とインター予測された従属ピクチャとをもつピクチャグループの例示的な復号順序を示す概念図。 本開示で説明する技法を利用し得る例示的なビデオ符号化及び復号システムを示すブロック図。 本開示で説明する技法を実施し得る例示的なビデオエンコーダを示すブロック図。 本開示で説明する技法を実施し得る例示的なビデオデコーダを示すブロック図。 本開示の技法よるビデオ符号化方法の例示的なフローチャート。 本開示の技法によるビデオ復号方法の例示的なフローチャート。 例示的なISOベースメディアファイルフォーマットの概念図。
ビデオコード化におけるランダムアクセスは、ビデオデコーダが、前のビデオフレームを殆んど又は全く参照せずに特定の時間インスタンスにおいてビデオを復号することを可能にする。事実上、ビデオコード化は、ランダムアクセスポイントとして設計されたピクチャにおいて「再開」される。クリーン復号リフレッシュ(CDR)ランダムアクセスポイントピクチャの一例を図1に示す。図1中のピクチャは表示順序で示されている。現在のピクチャグループ(GOP)1は、ランダムアクセスポイントピクチャを含む、141から156までのピクチャオーダーカウント(POC:picture order count)をもつピクチャを含む。この例では、ランダムアクセスポイントピクチャはクリーン復号リフレッシュ(CDR)ピクチャ148である。CDRピクチャは、他のピクチャと無関係に復号され得るピクチャである。例えば、CDRピクチャは、イントラ予測されたスライスのみを含んでいるピクチャであり得る。CDRピクチャは、別のタイプの「クリーン」ランダムアクセスピクチャである瞬時復号リフレッシュ(IDR:instantaneous decoding refresh)ピクチャとは異なる。IDRピクチャがランダムアクセスのために使用されるとき、復号ピクチャバッファ(DPB:decoded picture buffer)は直ちにリセットされる。CDRピクチャがランダムアクセスのために使用されるとき、DPBは直ちにリセットされない。これは、IDRピクチャランダムアクセスに対するコード化効率を改善する。
図1では、小文字「b」(即ち、ピクチャ139、141、143、145、及び147)で標示されたピクチャは、矢印によって示されるように、2つの他のピクチャから双方向にインター予測されるピクチャである。矢印の終点のピクチャは、インター予測コード化プロセスにおける予測子(predictor)として矢印の始点のピクチャを使用する。小文字「b」をもつピクチャは、他のピクチャを予測するために使用されない。大文字「B」(即ち、ピクチャ140、142、144、及び156)で標示されたピクチャも、2つの他のピクチャから双方向にインター予測されるピクチャである。「b」ピクチャとは対照的に、大文字「B」で標示されたピクチャは、矢印によって示されるように、他のピクチャのための予測子として使用される。ピクチャI146は、イントラ予測されたピクチャである。即ち、ピクチャI146は、他のピクチャを参照して符号化されるのではなく、内部空間的予測を使用してそのピクチャをコード化する。但し、ピクチャI146は、他のピクチャ(例えば、図1に示すピクチャb147及びb145)を予測するために使用され得る。
前のGOP2からのピクチャがインター予測のために利用可能でないので、現在のGOP1(例えば、POC141〜147をもつピクチャ)中の幾つかのピクチャは、ランダムアクセスの後に復号がCDR148において開始される場合に正常に復号され得ない。即ち、復号がCDR148から開始される場合、前のGOPからのピクチャは復号されていることも復号されていないこともある。従って、前のGOPからのピクチャはインター予測のために利用可能でないことがある。ピクチャ141〜147は、出力順序でCDRピクチャに後続するピクチャ(POC>148をもつピクチャ)によってインター予測のために必要とされることも必要とされないこともある。表示順序でCDRに先行するピクチャは、しばしば、「潜在的に不要なピクチャ」3(図1中のピクチャ141〜147)と呼ばれる。
図1の例では、CDR148がランダムアクセスのために使用される場合でも、正常に復号され得る、1つの潜在的に不要なピクチャI146がある。I146は、復号されるべき他のピクチャに依拠しないイントラ予測されたピクチャであるので、依然として復号可能である。幾つかの状況では、ピクチャ(例えば、出力順序でCDR148に後続するB156)が、インター予測のために潜在的に不要なピクチャ(この場合、I146)を使用し得る。復号順序及び表示順序でCDRの後のピクチャのためのインター予測のために使用される潜在的に不要なピクチャは、従属ピクチャ4と呼ばれる。図1の例では、B156は、復号順序と表示順序の両方でCDRピクチャの後の第1のピクチャである。I146は、復号順序と出力順序の両方でCDR148の後のピクチャ(例えば、ピクチャB156)を復号するために必要とされるので、I146の復号が保証される場合、CDR148は、依然としてランダムアクセスポイントとして使用され得る。従属ピクチャ4がイントラ予測されたピクチャである場合、デコーダは、そのようなピクチャが復号可能であると容易に決定し得る。
図2は、クリーン復号リフレッシュピクチャとインター予測された従属ピクチャとをもつピクチャグループの例示的な復号順序を示す概念図である。図2の例では、従属ピクチャ4はインター予測されたピクチャ(P246又はB246)である。高効率ビデオコード化(HEVC)規格におけるCDRの現在の定義に基づいて、そのような状況は許されない。これは、従属P又はBピクチャの復号が保証されないからである。ビデオ復号がランダムアクセスの後にCDRピクチャにおいて開始される場合、従属ピクチャを含む潜在的に不要なピクチャが、前のGOP中のピクチャを含む予測チェーンからインター予測されるか、又は前のGOP中のピクチャに依拠する現在のGOP中のピクチャからインター予測され得るので、それらの潜在的に不要なピクチャが復号可能であるかどうかは未決定である。この場合も、CDRピクチャへのランダムアクセスの後に、前のGOP中のピクチャは利用不可能であり得る。
現在のビデオコーデック(エンコーダ/デコーダ)設計は従属ピクチャの復号をサポートしない。従って、現在のビデオコーデック設計は、従属ピクチャからのインター予測をもサポートせず、他の潜在的に不要なピクチャをも復号しない。ランダムアクセスの後に潜在的に不要なピクチャが正常に復号され得るか否かを決定することが極めて困難であるので、潜在的に不要なピクチャの復号は可能にされない。潜在的に不要なピクチャがIピクチャである場合、Iピクチャが他のピクチャを使用せずに復号され得るので復号は可能である。但し、潜在的に不要なピクチャがB又はPピクチャ(例えば、図2中のP246又はB246)である場合、ビデオデコーダは、最初に、潜在的に不要なピクチャが復号可能か否かを識別するために複雑な予測チェーンを決定しなければならない。例えば、ビデオデコーダは、最初に、それらの潜在的に不要なピクチャのいずれかが正常に復号され得るかどうかを決定するために、図2中のピクチャ239〜248の予測チェーンを決定しなければならない。また、現在のビデオコード化設計は、デコーダが、潜在的に不要なピクチャが復号順序でCDRに後続するピクチャのためのインター予測において使用されるかどうかを決定すること(即ち、潜在的に不要なピクチャが従属ピクチャであるかどうかを決定すること)を可能にするための機構を与えない。
上記で説明した欠点に鑑みて、本開示は、潜在的に不要なピクチャが復号可能であり、復号順序でCDRに後続するピクチャのためのインター予測のために使用され得るという指示としてピクチャレベルシンタックス及び/又はスライスヘッダシンタックス中に追加されるべきシンタックス要素(例えば、フラグ)の使用を提案する(即ち、フラグは、潜在的に不要なピクチャが復号可能である従属ピクチャであることを示す)。エンコーダが、潜在的に不要なピクチャのための予測チェーンがランダムアクセスの後に正常な復号を可能にするか否かを決定し、潜在的に不要なピクチャが復号順序でCDRの後のピクチャのためのインター予測のために使用され得るか否かを決定し得るので、フラグは、符号化ビデオビットストリーム中でエンコーダによって信号伝達され得る。
エンコーダは、ピクチャが符号化される際に予測チェーンを追跡し、ピクチャがCDRと同じGOP中にあるときに、それらのピクチャを潜在的に不要なピクチャであるとして識別し得る。次いで、特定の潜在的に不要なピクチャに、それらがCDRへのランダムアクセスの後に復号可能であり、復号順序でCDRの後のピクチャのためのインター予測のために使用され得ることを示すためにフラグ(例えば、従属ピクチャフラグ)が割り当てられ得る(即ち、フラグは、潜在的に不要なピクチャが従属ピクチャであることを示す)。一例では、追加の指示フラグ(例えば、従属指示フラグ)が、CDRピクチャを含む各GOPについて信号伝達され得る。1の値をもつ従属指示フラグは、例えば、GOP中の潜在的に不要なピクチャのうちの少なくとも1つが従属ピクチャであることを示す。そうである場合、従属ピクチャフラグが各潜在的に不要なピクチャについて信号伝達される。従属ピクチャフラグは、特定の潜在的に不要なピクチャが従属ピクチャであるか否かを示す。従属指示フラグが0の値を有する場合、これは、潜在的に不要なピクチャがGOP中の従属ピクチャでないことを示す。従って、従属ピクチャフラグは、そのGOPについて信号伝達される必要はない。別の例では、従属指示フラグは使用されない。代わりに、従属ピクチャフラグは、CDRピクチャを有するGOP中の全ての潜在的に不要なピクチャについて信号伝達される。
例として、従属指示フラグ及び従属ピクチャフラグは、ネットワーク抽象化レイヤ(NAL: network abstraction layer)ユニットヘッダ、ピクチャレベル補足エンハンスメント情報(SEI:supplemental enhancement information)メッセージ、スライスヘッダ、又は潜在的に不要なピクチャが従属ピクチャであることを示すための別のピクチャレベルシンタックス要素又はメッセージ中で信号伝達され得る(即ち、それは、復号可能であるとともに、ランダムアクセスの後にインター予測のために使用され得る)。NALユニットは、スライスの一部分中に含まれている複数のピクチャのためのビデオデータを含んでいるビデオデータの個別パケットである。ピクチャレベルSEIメッセージは、ピクチャの復号に適用し得る補足情報である。
現在のGOP中のCDRが丁度ランダムアクセスのために選択された場合、デコーダは、現在のGOP中の潜在的に不要なピクチャが正常に復号可能であり得、復号順序及び出力順序でCDRに後続するピクチャによってインター予測のために使用され得るかどうかを決定する(即ち、潜在的に不要なピクチャが従属ピクチャであると決定する)ために、このフラグを使用し得る。
本開示の別の例では、従属指示フラグ及び/又は従属ピクチャフラグは、HTTPに基づくビデオストリーミングなどの適用シナリオにおける送信のためにファイルがカプセル化された場合に、従属ピクチャではないピクチャが復号される必要があり、及び/又はそれらが送信される必要がないように、ファイルフォーマット、例えば、ISOファイルフォーマットに追加され得る。
ISOベースメディアファイルフォーマットは、メディアの交換、管理、編集、及びプレゼンテーションを可能にする、フレキシブルで拡張可能なフォーマットにおけるプレゼンテーションのための時限メディア情報を含んでいるように設計される。ISOベースメディアファイルフォーマット(ISO/IEC14496−12:2004)は、時間ベースメディアファイルのための一般的な構造を定義するMPEG−4 Part12において規定されている。それは、H.264/MPEG−4AVCビデオ圧縮のサポートを定義した最新ビデオコード化(AVC)ファイルフォーマット(ISO/IEC14496−15)、3GPPファイルフォーマット、及びどちらもAVCファイルフォーマットの拡張であるSVCファイルフォーマット並びにMVCファイルフォーマットなど、ファミリー中の他のファイルフォーマットに対する基準として使用される。ISOメディアファイルフォーマットはまた、概して、HEVCなどの他のビデオコード化規格に拡張され得る。
ISOベースメディアファイルフォーマットは、オーディオビジュアルプレゼンテーションなどのメディアデータの時限シーケンスのためのタイミング、構造、及びメディア情報を含んでいることがある。ファイル構造はオブジェクト指向である。ファイルは、非常に簡単に基本オブジェクトに分解され得、オブジェクトの構造はそれらのタイプから暗示される。
プレゼンテーション(動きシーケンス)が、幾つかのファイル中に含まれていることがある。タイミング及びフレーミング(位置及びサイズ)情報はISOベースメディアファイル中にあり、補助ファイルは本質的に任意のフォーマットを使用し得る。このプレゼンテーションは、プレゼンテーションを含んでいるシステムに対して「ローカル」であり得るか、あるいはネットワーク又は他のストリーム配信機構を介して行われ得る。
ISOベースメディアファイルフォーマットに準拠するファイルは、「ボックス」と呼ばれる一連のオブジェクトとして形成される。一例では、全てのデータはボックス中に含まれており、ファイル内に他のデータはない。これは、特定のファイルフォーマットによって必要とされる初期特徴(initial signature)を含む。「ボックス」は、一意のタイプ識別子と長さとによって定義されるオブジェクト指向ビルディングブロック(object-oriented building block)である。
ISOベースメディアファイルフォーマットに従う例示的なファイル構造を図8に示す。一般に、プレゼンテーションは1つのファイル300中に含まれ、メディアプレゼンテーションは独立型(self-contained)である。ムービーコンテナ302(例えば、ムービーボックス)はメディアのメタデータを含んでおり、ビデオ及びオーディオフレームは、メディアデータコンテナ350中及び/又は他のファイル中に含まれている。
ムービーコンテナ302は、ビデオトラック304のためのメタデータを含んでいることがある。ムービーコンテナ302はまた、オーディオトラック(図示せず)などの他のトラックを含んでいることがある。ビデオトラック304中のメタデータはメディア情報コンテナ308に記憶され得る。メディア情報はサンプル記述310を含み得る。サンプル記述310は、厳密なメディアタイプ(例えば、ストリームを復号するために必要とされるデコーダのタイプ)の「名前」と、必要とされるそのデコーダのパラメータ表示を含んでいることがある。名前はまた、4文字コード、例えば、「moov」、又は「trak」の形態をとり得る。MPEG−4メディアについてだけでなく、このファイルフォーマットファミリーを使用する他の編成によって使用されるメディアタイプについても、定義済みのサンプルエントリフォーマットがある。
メディアデータコンテナ350は、インターリーブされた時間順序ビデオサンプルとオーディオフレームとを含み得る。特に、メディアデータコンテナ350は、複数のビデオデータチャンク(塊)(例えば、ビデオデータチャンク352及び362)を含み得る。各ビデオデータチャンクは、複数のビデオサンプル(例えば、ビデオサンプル353a〜c及び363a〜c)を含み得る。
ファイルは、論理構造と時間構造と物理構造とを有する。これらの構造は結合される必要はない。ファイルの論理構造は、時間並列トラックのセットを含んでいるムービーである。ファイルの時間構造は、トラックが時間的なサンプルのシーケンスを含んでおり、それらのシーケンスは、随意のエディットリストによってムービー全体のタイムラインにマッピングされるものである。
ファイルの物理構造は、メディアデータサンプル自体から、論理、時間、及び構造的分解のために必要とされるデータを分離する。この構造的情報は、ムービーボックス中に集められ、場合によってはムービーフラグメントボックスによって時間的に拡張される。ムービーボックスは、サンプルの論理関係及びタイミング関係をドキュメント化し、また、サンプルが配置される場所へのポインタを含んでいる。それらのポインタは、URLによって参照される同じファイル又は別のファイルへのものであり得る。
メタデータのサポートは2つの形態をとる。第1に、時限メタデータが、必要に応じて、それが表しているメディアデータ(例えば、メディアコンテナ350中のビデオデータチャンク)と同期される、適切なトラックに記憶され得る。第2に、ムービー又は個々のトラックにアタッチされた非時限メタデータの全般的サポートがある。構造的サポートは、全般的であり、メディアデータの場合のように、ファイル中の他の場所又は別のファイル中でのメタデータリソースの記憶を可能にする。さらに、これらのリソースは名前付きであり得、保護され得る。
ISOベースメディアファイルフォーマットでは、サンプルグルーピングは、1つのサンプルグループのメンバーであるべきトラック中のサンプルの各々の割当てである。サンプルグループ中のサンプルは連続する必要はない。例えば、AVCファイルフォーマットにおけるH.264/AVCを提示するとき、1つの時間レベルのビデオサンプルは、1つのサンプルグループにサンプリングされ得る。サンプルグループは、SampleToGroupホ゛ックス(sbdp)とSampleGroupDescriptionボックスとの2つのデータ構造によって表される。SampleToGroupボックスは、サンプルグループへのサンプルの割当てを表す。このグループのプロパティについて説明するために、各サンプルグループエントリのための第2のボックスの一例がある。
ISOベースメディアファイルフォーマットでは、ランダムアクセスポイント(RAP)312サンプルグルーピングと呼ばれる第2のグループが定義される。ランダムアクセスポイント(例えば、CDRピクチャ)であるように同期サンプルが指定され、その後、復号順序での全てのサンプルが正しく復号され得る。しかしながら、「オープン」ランダムアクセスポイントを符号化することが可能であり得、その後、出力順序での全てのサンプルが正しく復号され得るが、復号順序でランダムアクセスポイントに後続し、出力順序でランダムアクセスポイントに先行する幾つかのサンプルは、正しく復号可能である必要はない。例えば、オープンピクチャグループを開始するイントラピクチャに、出力順序でイントラピクチャに先行する(双方向)予測ピクチャが復号順序で後続し得る。復号がイントラピクチャから開始し、従って、そのような(双方向)予測ピクチャが必要でない場合、それらは正しく復号され得ない可能性がある。
そのような「オープン」ランダムアクセスサンプルは、(図8中のRAP312からビデオチャンク352及び362中のビデオサンプルへの矢印によって示される)このグループのメンバーであることによってマークされ得る。このグループによってマークされたサンプルは、ランダムアクセスポイントであり、また、同期ポイントであり得る(即ち、同期サンプルテーブルによってマークされたサンプルが除外される必要はない)。
ISOベースファイルフォーマットのためのランダムアクセスシンタックスの一例を以下に示す。
1に等しいシンタックス要素num_leading_samples_knownは、同期ポイント(例えば、CDRピクチャ)の前の先行サンプルの数がこのグループ中の各サンプルについて知られていることを示し、その数はシンタックス要素num_leading_samplesによって指定される。先行サンプルは、「オープン」ランダムアクセスポイント(RAP)に関連するサンプルである。それは、表示順序でRAP(例えば、CDRピクチャ)に先行し、復号順序でRAP又は別の先行サンプルに後続する。復号がRAPから開始するとき、そのサンプルは正しく復号され得ない。シンタックス要素num_leading_samplesは、このグループ中の各サンプルのための先行サンプルの数を指定する。num_leading_samples_knownが0に等しいとき、このフィールドは無視されるべきである。従属フラグ(dependent_flag)の信号伝達をさらに可能にするために、以下のシンタックスを提案する。
上記の例では、先行ピクチャのdependent_indication_flag314値は、復号順序で信号伝達される。dependent_indication_flag314は、先行サンプル(例えば、潜在的に不要なピクチャ)のいずれかが、RAP(例えば、CDRピクチャ)へのランダムアクセスに後続する、正しく復号可能である従属ピクチャであり、出力順序でRAPに後続するピクチャを復号するために使用されるかどうかを示す。dependent_indication_flag314が真である(例えば、1の値を有する)場合、dependent_flag316は、特定のピクチャが従属であるか否かを示すために潜在的に不要なピクチャの各々について信号伝達される。dependent_indication_flag314が偽である(例えば、0の値を有する)場合、dependent_flag316は信号伝達される必要はない。
本開示の別の例では、dependent_indication_flag314は信号伝達されず、代わりに、dependent_flag316が、RAP(例えば、CDRピクチャ)を有するグループ中の全ての潜在的に不要なピクチャについて信号伝達される。例えば、異なるボックスが各サンプルに関連し得、そのボックスは、そのようなdependent_flag316を含んでいることがある。dependent_flag316が真であり、従って、ランダムアクセスの後に現在のピクチャが従属ピクチャである場合、フラグは、最も近接したCDRがランダムアクセスのために使用される場合、従属ピクチャが正常に復号可能であり、出力順序でCDRに後続するピクチャによってインター予測のために使用され得ることを示す。dependent_flag316が偽である場合、そのピクチャは、出力順序でCDRに後続するピクチャのためのインター予測のために必要でなく、さらに、CDRを使用してランダムアクセスが生じるときに必要とされない。
それに応じてCDR定義が修正される場合、全ての他の潜在的に不要なピクチャは、従属ピクチャ(例えば、図1及び図2中のピクチャI146/P246/B246)を除いて、CDRがランダムアクセスのために使用されるときに復号される必要はない。復号可能な従属ピクチャでないとしてフラグを付けられる潜在的に不要なピクチャは、復号を簡略化することができる、ランダムアクセスのためのCDRピクチャを使用するときに復号される必要はない。
図3は、本開示で説明するランダムアクセスコード化技法を利用し得る例示的なビデオ符号化及び復号システム10を示すブロック図である。図3に示すように、システム10は、宛先機器14によって後で復号されるべき符号化ビデオデータを生成する発信源12を含む。発信源12及び宛先機器14は、デスクトップコンピュータ、ノートブック(即ち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、所謂「スマート」フォン、所謂「スマート」パッドなどの電話ハンドセット、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソールなどを含む、広範囲にわたる機器のいずれかを備え得る。場合によっては、発信源12及び宛先機器14は、ワイヤレス通信のために装備され得る。
宛先機器14は、リンク16を介して復号されるべき符号化ビデオデータを受信し得る。リンク16は、発信源12から宛先機器14に符号化ビデオデータを移動することが可能な任意のタイプの媒体又は機器を備え得る。一例では、リンク16は、発信源12が、符号化ビデオデータをリアルタイムで宛先機器14に直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先機器14に送信され得る。通信媒体は、無線周波数(RF)スペクトル又は1つ以上の物理伝送線路など、任意のワイヤレス又はワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、発信源12から宛先機器14への通信を可能にするのに有用であり得るルータ、スイッチ、基地局、又は任意の他の機器を含み得る。
別の例では、符号化ビデオはまた、記憶媒体34又はファイルサーバ36に記憶され得、必要に応じて宛先機器14によってアクセスされ得る。記憶媒体は、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、又は符号化ビデオデータを記憶するための他の好適なデジタル記憶媒体など、様々なローカルにアクセスされたデータ記憶媒体のいずれかを含み得る。記憶媒体34又はファイルサーバ36は、発信源12によって生成される符号化ビデオを保持し得、宛先機器14が必要に応じてストリーミング又はダウンロードを介してアクセスし得る、任意の他の介在する記憶機器であり得る。ファイルサーバは、符号化ビデオデータを記憶することと、その符号化ビデオデータを宛先機器14に送信することとが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(例えば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)機器、又はローカルディスクドライブを含む。宛先機器14は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル(例えば、Wi−Fi接続)、有線接続(例えば、DSL、ケーブルモデムなど)、又はその両方の組合せを含み得る。ファイルサーバからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はその両方の組合せであり得る。
本開示の技法は、必ずしもワイヤレス適用例又は設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、例えばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、又は他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコード化に適用され得る。幾つかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、及び/又はビデオテレフォニーなどの適用例をサポートするために、一方向又は双方向のビデオ送信をサポートするように構成され得る。
図3の例では、発信源12は、ビデオ発信源18と、ビデオエンコーダ20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)及び/又は送信機を含み得る。発信源12において、ビデオ発信源18は、例えばビデオカメラなどの撮像装置、以前に撮影されたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、及び/又は発信源ビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどの発信源、又はそのような発信源の組合せを含み得る。一例として、ビデオ発信源18がビデオカメラである場合、発信源12及び宛先機器14は、所謂カメラフォン又はビデオフォンを形成し得る。但し、本開示で説明する技法は、概してビデオコード化に適用可能であり得、ワイヤレス及び/又は有線適用例に適用され得る。
撮影されたビデオ、以前に撮影されたビデオ、又はコンピュータ生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオ情報は、ワイヤレス通信プロトコルなどの通信規格に従ってモデム22によって変調され、送信機24を介して宛先機器14に送信され得る。モデム22は、信号変調のために設計された様々なミキサ、フィルタ、増幅器又は他の構成要素を含み得る。送信機24は、増幅器、フィルタ、及び1つ以上のアンテナを含む、データを送信するために設計された回路を含み得る。
図3の例では、宛先機器14は、受信機26と、モデム28と、ビデオデコーダ30と、表示装置32とを含む。宛先機器14の受信機26はチャネル16を介して情報を受信し、モデム28はその情報を復調して、ビデオデコーダ30のための復調されたビットストリームを生成する。チャネル16を介して通信される情報は、ビデオデータを復号する際にビデオデコーダ30が使用する、ビデオエンコーダ20によって生成された様々なシンタックス情報を含み得る。そのようなシンタックスはまた、記憶媒体34又はファイルサーバ36に記憶された符号化ビデオデータとともに含まれ得る。ビデオエンコーダ20及びビデオデコーダ30の各々は、ビデオデータを符号化又は復号することが可能であるそれぞれのエンコーダデコーダ(コーデック)の一部を形成し得る。
表示装置32は、宛先機器14と一体化されるか又はその外部にあり得る。幾つかの例では、宛先機器14は、一体型表示装置を含み、また、外部表示装置とインターフェースするように構成され得る。他の例では、宛先機器14は表示装置であり得る。概して、表示装置32は、復号されたビデオデータをユーザに対して表示し、液晶表示器(LCD)、プラズマ表示器、有機発光ダイオード(OLED)表示器、又は別のタイプの表示装置など、様々な表示装置のいずれかを備え得る。
ビデオエンコーダ20及びビデオデコーダ30は、現在開発中の高効率ビデオコード化(HEVC)規格などのビデオ圧縮規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。HEVC規格の現在のドラフトバージョンは、JCTVC-H1003、2012年2月17日付けの、B.Bross、W.-J.Han、G.J.Sullivan、J.-R.Ohm、T.Wiegandによって編集された「High Efficiency Video Coding (HEVC) text specification draft 6」、バージョン21中で提示されている。代替的に、ビデオエンコーダ20及びビデオデコーダ30は、代替的にMPEG-4,Part 10,Advanced Video Coding(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格又は業界規格、あるいはそのような規格の拡張に従って動作し得る。但し、本開示の技法は、いかなる特定のコード化規格にも限定されない。ビデオ圧縮規格の他の例には、MPEG−2及びITU−T H.263がある。
図3には示されていないが、幾つかの態様では、ビデオエンコーダ20及びビデオデコーダ30は、それぞれオーディオエンコーダ及びデコーダと統合され得、適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含んで、共通のデータストリーム又は別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、幾つかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、又はユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
ビデオエンコーダ20及びビデオデコーダ30はそれぞれ、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ及び/又はデコーダ回路のいずれかを備える1つ以上のプロセッサ、若しくはそれらの任意の組合せとして実施され得る。本技法がソフトウェアで部分的に実施されるとき、機器は、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つ以上のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20及びビデオデコーダ30の各々は1つ以上のエンコーダ又はデコーダ中に含まれ得、そのいずれも、それぞれの機器において複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
ビデオエンコーダ20は本開示の技法のいずれか又は全てを実施し得る。同様に、ビデオデコーダ30はこれらの技法のいずれか又は全てを実施し得る。一例として、ビデオエンコーダ20は、クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することと、CDRピクチャがランダムアクセスのために使用される場合に従属ピクチャが復号可能であるかどうかを決定することと、CDRピクチャがランダムアクセスのために使用される場合に従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達することとを行うように構成され得る。
別の例として、ビデオデコーダ30は、クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、1つ以上の潜在的に不要なピクチャのいずれかが、CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信することとを行うように構成され得る。ビデオデコーダ30は、CDRピクチャへのランダムアクセスのための要求を受信することと、ランダムアクセスのための要求に応答してCDRピクチャを復号することと、受信したシンタックス要素に対応する従属ピクチャを復号することとを行うようにさらに構成され得る。
本開示で説明するビデオコーダは、ビデオエンコーダ又はビデオデコーダを指し得る。同様に、ビデオエンコーダ及びビデオデコーダは、それぞれビデオ符号化ユニット及びビデオ復号ユニットと呼ばれることがある。同様に、ビデオコード化はビデオ符号化又はビデオ復号を指し得る。
Joint Collaborative Team on Video Coding(JCT−VC)は、現在、HEVC規格の開発に取り組んでいる。HEVCの規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコード化機器の発展的モデルに基づく。現在のHMは、例えば、ITU−T H.264/AVCに従う既存の機器に対するビデオコード化機器の幾つかの追加の能力を仮定する。例えば、H.264は9つのイントラ予測符号化モードを与えるが、HMは33個ものイントラ予測符号化モードを与え得る。
概して、HMの作業モデルは、ビデオフレーム又はピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロック又は最大コード化単位(LCU)に分割され得ることを記述する。ツリーブロックは、H.264規格のマクロブロックと同様の目的を有する。スライスは、コード化順序での幾つかの連続するツリーブロックを含む。ビデオフレーム又はピクチャは、1つ以上のスライスに区分され得る。各ツリーブロックは、4分木に従ってコード化単位(CU)に分割され得る。例えば、4分木のルートノードとしてのツリーブロックは、4つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードとしての、最終的な、分割されていない子ノードは、コード化ノード、即ち、コード化ビデオブロックを備える。コード化ビットストリームに関連するシンタックスデータは、ツリーブロックが分割され得る最大回数を定義し得、コード化ノードの最小サイズをも定義し得る。
CUは、コード化ノードと、コード化ノードに関連する予測単位(PU)及び変換単位(TU)とを含む。CUのサイズは、コード化ノードのサイズに対応し、正方形である。CUのサイズは、8×8画素から最大64×64以上の画素を有するツリーブロックのサイズまでに及び得る。各CUは、1つ以上のPUと、1つ以上のTUとを含み得る。CUに関連するシンタックスデータは、例えば、CUを1つ以上のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化又はダイレクトモード符号化されるか、イントラ予測モード符号化されるか、若しくはインター予測モード符号化されるかによって異なり得る。PUは非正方形に区分され得る。CUに関連するシンタックスデータは、例えば、4分木に従ってCUを1つ以上のTUに区分することも記述し得る。TUは、正方形又は非正方形であり得る。
一般に、PUは、予測プロセスに関係するデータを含む。例えば、PUがイントラモード符号化されるとき、PUは、PUのイントラ予測モードを記述するデータを含み得る。別の例として、PUがインターモード符号化されるとき、PUは、PUの動きベクトルを定義するデータを含み得る。PUの動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(例えば、1/4画素精度又は1/8画素精度)、動きベクトルが指す参照ピクチャ、及び/又は動きベクトルの参照ピクチャリスト(例えば、リスト0、リスト1、又はリストC)を記述し得る。
一般に、TUは、変換プロセスと量子化プロセスとに使用される。1つ以上のPUを有するCUは、1つ以上の変換単位(TU)をも含み得る。予測の後に、ビデオエンコーダ20は、PUに対応する残差値を計算し得る。残差値は、ビデオデータの現在のブロックとビデオデータの予測ブロックとの間の画素差分値を備える。残差値は、エントロピーコード化のためのシリアル化変換係数(serialized transform coefficient)を生成するために、TUを使用して変換係数に変換され、量子化され、走査され得る。本開示は、一般に、CUのコード化ノードを指すために「ビデオブロック」という用語を使用する。特定の場合において、本開示は、コード化ノード並びにPU及びTUを含む、ツリーブロック、即ち、LCU又はCUを指す「ビデオブロック」という用語も使用し得る。
ビデオシーケンスは、一般に、一連のビデオフレーム又はピクチャを含む。グループ・オブ・ピクチャ(GOP)は、概して、一連の1つ以上のビデオフレームを備える。GOPは、GOP内に含まれる幾つかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、1つ以上のピクチャのヘッダ中、又は他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはCU内のコード化ノードに対応し得る。ビデオブロックは、固定サイズ又は可変サイズを有し得、指定のコード化規格に応じてサイズが異なり得る。
一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2N又はN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、又はN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、及びnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向が25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、又は「Right」という表示によって示される。従って、例えば「2N×nU」は、上部に2N×0.5N PUと下部に2N×1.5N PUとで水平方向に区分される2N×2N CUを指す。
本開示では、「N×N(NxN)」及び「N×N(N by N)」は、垂直寸法及び水平寸法に関するビデオブロックの画素寸法、例えば、16×16(16x16)画素又は16×16(16 by 16)画素を指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16画素を有し(y=16)、水平方向に16画素を有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にN画素を有し、水平方向にN画素を有し、Nは、非負整数値を表す。ブロック中の画素は行と列に構成され得る。さらに、ブロックは、必ずしも、水平方向に垂直方向と同じ数の画素を有する必要はない。例えば、ブロックは、N×M画素を備え得、Mは必ずしもNに等しいとは限らない。
CUのPUを使用したイントラ予測コード化又はインター予測コード化の後に、ビデオエンコーダ20は残差データを計算し得る。PUは、(画素領域とも呼ばれる)空間領域において画素データを備え得る。TUは、変換、例えば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、又は概念的に同様の変換の適用後の、変換領域中の係数を備え得る。残差データは、非符号化ピクチャ(unencoded picture)の画素と予測ビデオブロックとの間の画素差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUのための変換係数を生成し得る。
変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は変換係数の量子化を実行し得る。量子化は、概して、更なる圧縮を行う、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。例えば、量子化中にnビット値がmビット値に切り捨てられ得、nはmよりも大きい。
幾つかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応走査を実行し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、例えば、コンテキスト適応型可変長コード化(CAVLC:context adaptive variable length coding)、コンテキスト適応型バイナリ算術コード化(CABAC:context adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応型バイナリ算術コード化(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率区間区分エントロピーコード化(PIPE:probability interval partitioning entropy coding)又は別のエントロピー符号化方法に従って1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用する、符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
CABACを実行するために、ビデオエンコーダ20は、送信されるべきシンボルにコンテキストモデル内のコンテキストを割り当て得る。コンテキストは、例えば、シンボルの隣接値が非0か否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルのための可変長コードを選択し得る。VLCにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構築され得る。このようにして、VLCの使用は、例えば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率決定は、シンボルに割り当てられるコンテキストに基づき得る。
図4は、本開示で説明する技法を実施し得る例示的なビデオエンコーダ20を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコード化及びインターコード化を実行し得る。イントラコード化は、所与のビデオフレーム又はピクチャ内のビデオの空間的冗長性を低減又は除去するために空間的予測に依拠する。インターコード化は、ビデオシーケンスの隣接フレーム又はピクチャ内のビデオの時間的冗長性を低減又は除去するために時間的予測に依拠する。イントラモード(Iモード)は、幾つかの空間ベースの圧縮モードのいずれかを指すことがある。単方向予測(Pモード)又は双方向予測(Bモード)などのインターモードは、幾つかの時間ベースの圧縮モードのいずれかを指し得る。
図4の例では、ビデオエンコーダ20は、予測モジュール41と、参照ピクチャメモリ64と、加算器50と、変換モジュール52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。予測モジュール41は、モード選択ユニット40と、動き推定ユニット42と、動き補償ユニット44と、イントラ予測モジュール46とを含む。その中に含まれているモード選択ユニット40と、動き推定ユニット42と、動き補償ユニット44と、イントラ予測モジュール46とを含む、予測モジュール41は、ビデオエンコーダ回路全体の一部分と見なされ得る。ビデオエンコーダ20について説明したモジュール又はユニットは、1つ以上のプログラマブルプロセッサとして、ハード論理、又はそれらの任意の組合せとして構造化され得る。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換モジュール60と、加算器62とを含む。再構成されたビデオからブロック歪み(blockiness artifacts)を除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図4に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理するであろう。
図4に示すように、ビデオエンコーダ20は、符号化されるべきビデオスライス内の現在のビデオブロックを受信する。スライスは複数のビデオブロックに分割され得る。モード選択ユニット40は、誤差結果に基づいて現在のビデオブロックのためのコード化モード、イントラ又はインターのうちの1つを選択し得、予測モジュール41は、残差ブロックデータを生成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器50に与え、参照ピクチャとして使用するための符号化ブロックを再構成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器62に与え得る。
予測モジュール41(又はビデオエンコーダ20の別の構造ユニット)はまた、現在のGOPが従属ピクチャを含んでいるかどうかを決定するように構成され得る。上記で説明したように、従属ピクチャは、コード化順序でCDRピクチャに後続するピクチャであるが、コード化順序と表示順序の両方でCDRに後続する別のピクチャのための予測ピクチャとしても使用される。予測モジュール41は、CDRを含んでいるGOPのための予測チェーンを追跡し得る。ピクチャが従属ピクチャであると決定された場合、予測モジュール41は、さらに、CDRへのランダムアクセスが生じる場合に従属ピクチャが復号可能であるかどうかを決定し得る。従属ピクチャは、従属ピクチャのための予測チェーンが前のGOPからのピクチャ(例えば、CDRからインター予測される、インター予測されたB又はPピクチャあるいはCDRへのランダムアクセスの場合の他の復号可能なピクチャ)に依存しない場合に、あるいは従属ピクチャがイントラ予測されたピクチャ(例えば、図1のピクチャI146)である場合に復号可能であると決定される。
予測モジュール41は、特定の潜在的に不要なピクチャが、CDRピクチャへのランダムアクセスの場合に復号可能である従属ピクチャであるか否かを示すために、符号化ビデオビットストリーム中で従属ピクチャシンタックス要素63(例えば、従属フラグ)を信号伝達し得る。従属ピクチャシンタックス要素63は、符号化ビデオビットストリームに含めるためにエントロピーコード化ユニット56によってエントロピーコード化され得る。上記で説明したように、従属ピクチャシンタックス要素は、ネットワークアブストラクションレイヤ(NAL)ユニットヘッダ、ピクチャレベル補足エンハンスメント情報(SEI)メッセージ、スライスヘッダ、又は別のピクチャレベルシンタックス要素又はメッセージ中で信号伝達され得る。従属ピクチャシンタックス要素63はまた、上記で説明したようにファイルフォーマットに記憶され得る。
予測モジュール41は、従属ピクチャシンタックス要素63を生成し得るビデオエンコーダ20の構造構成要素の一例にすぎないことを理解されたい。ビデオエンコーダ20の他の構造ユニット又は機能ユニットは、単独又は組合せのいずれかで、上記で説明した技法を使用して従属ピクチャシンタックス要素を生成するように構成され得る。
予測モジュール41内のイントラ予測モジュール46は、空間圧縮を行うために、コード化されるべき現在のブロックと同じフレーム又はスライス中の1つ以上の隣接ブロックに対する現在のビデオブロックのイントラ予測コード化を実行し得る。予測モジュール41内の動き推定ユニット42及び動き補償ユニット44は、時間圧縮を行うために、1つ以上の参照ピクチャ中の1つ以上の予測ブロックに対する現在のビデオブロックのインター予測コード化を実行する。
動き推定ユニット42は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、シーケンス中のビデオスライスをPスライス、Bスライス、又はGPBスライスに指定し得る。動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、参照ピクチャ内の予測ブロックに対する現在のビデオフレーム又はピクチャ内のビデオブロックのPUの変位を示し得る。
予測ブロックは、絶対値差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、又は他の差分メトリックによって決定され得る画素差分に関して、コード化されるべきビデオブロックのPUにぴったり一致することがわかるブロックである。幾つかの例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャのサブ整数画素位置の値を計算し得る。例えば、ビデオエンコーダ20は、参照ピクチャの1/4画素位置、1/8画素位置、又は他の分数画素位置の値を計算し得る。従って、動き推定ユニット42は、フル画素位置と分数画素位置とに対する動き探索を実行し、分数画素精度で動きベクトルを出力し得る。
動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのPUの動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)又は第2の参照ピクチャリスト(リスト1)から選択され得、その各々は、参照ピクチャメモリ64に記憶された1つ以上の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
動き補償ユニット44によって実行される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することを伴い得る。現在のビデオブロックのPUの動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストのうちの1つの中で動きベクトルが指す予測ブロックの位置を特定し得る。ビデオエンコーダ20は、コード化されている現在のビデオブロックの画素値から予測ブロックの画素値を減算し、画素差分値を形成することによって残差ビデオブロックを形成する。画素差分値は、ブロックの残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器50は、この減算演算を実行する1つ以上の構成要素を表す。動き補償ユニット44はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用する、ビデオブロック及びビデオスライスに関連するシンタックス要素を生成し得る。
動き補償ユニット44が現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ20は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、1つ以上のTU中に含まれ、変換モジュール52に適用され得る。変換モジュール52は、離散コサイン変換(DCT)又は概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換モジュール52は、残差ビデオデータを画素領域から周波数領域などの変換領域に変換し得る。
変換モジュール52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。幾つかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット56が走査を実行し得る。
量子化の後に、エントロピー符号化ユニット56は量子化変換係数をエントロピー符号化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コード化(CAVLC)、コンテキスト適応型バイナリ算術コード化(CABAC)、又は別のエントロピー符号化技法を実行し得る。エントロピー符号化ユニット56によるエントロピー符号化の後に、符号化ビットストリームは、ビデオデコーダ30に送信されるか、あるいはビデオデコーダ30が後で送信するか又は取り出すためにアーカイブされ得る。エントロピー符号化ユニット56はまた、コード化されている現在のビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。
逆量子化ユニット58及び逆変換モジュール60は、それぞれ逆量子化及び逆変換を適用して、参照ピクチャの参照ブロックとして後で使用するために、画素領域において残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つ以上の補間フィルタを適用して、動き推定において使用するサブ整数画素値を計算し得る。加算器62は、再構成された残差ブロックを動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ64に記憶するための参照ブロックを生成する。参照ブロックは、後続のビデオフレーム又はピクチャ中のブロックをインター予測するために、動き推定ユニット42及び動き補償ユニット44によって参照ブロックとして使用され得る。
図5は、本開示で説明する技法を実施し得る例示的なビデオデコーダ30を示すブロック図である。図5の例では、ビデオデコーダ30は、エントロピー復号ユニット80と、予測モジュール81と、逆量子化ユニット86と、逆変換ユニット88と、加算器90と、参照ピクチャメモリ92とを含む。予測モジュール81は、動き補償ユニット82と、イントラ予測モジュール84とを含む。予測モジュール81は、ビデオデコーダ回路全体の一部分と見なされ得る。ビデオデコーダ30について説明したモジュール又はユニットは、1つ以上のプログラマブルプロセッサとして、ハード論理、又はそれらの任意の組合せとして構造化され得る。ビデオデコーダ30は、幾つかの例では、図4のビデオエンコーダ20に関して説明した符号化パスとは概して逆の復号パスを実行し得る。
復号プロセス中に、ビデオデコーダ30は、符号化されたビデオスライスのビデオブロックと、ビデオエンコーダ(例えば、ビデオエンコーダ20)によって生成された、従属ピクチャシンタックス要素63を含む、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット80は、量子化係数、動きベクトル、及び他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット80は、予測モジュール81に動きベクトルと他のシンタックス要素とを転送する。ビデオデコーダ30は、ビデオピクチャレベル、ビデオスライスレベル及び/又はビデオブロックレベルにおいてシンタックス要素を受信し得る。上記で説明したように、従属ピクチャシンタックス要素は、ネットワークアブストラクションレイヤ(NAL)ユニットヘッダ、ピクチャレベル補足エンハンスメント情報(SEI)メッセージ、スライスヘッダ、あるいは別のピクチャレベルシンタックス要素又はメッセージ中で信号伝達され得る。従属ピクチャシンタックス要素63はまた、上記で説明したようにファイルフォーマットに記憶され得る。
符号化ビデオビットストリーム中でビデオデコーダ30によって受信された幾つかのピクチャグループは、CDRピクチャを含み得る。また、CDRピクチャをもつGOP中のピクチャは、潜在的に不要なピクチャのいずれかがGOP中の従属ピクチャであり、そのGOP中のCDRへのランダムアクセスのための要求の場合に復号可能であるかどうかを示す、従属ピクチャシンタックス要素63を含み得る。ランダムアクセス要求83が、例えば、ビデオ再生を行うコンピュータ機器のユーザインターフェースを介してユーザから受信された場合、ビデオデコーダ30は、GOPに関連するCDRにおいて復号を開始し得、受信した従属ピクチャシンタックス要素63に従って従属ピクチャを復号し得る。即ち、関連する潜在的に不要なピクチャが、ランダムアクセスの場合に復号可能である従属ピクチャであることを、従属ピクチャシンタックス要素63が示す場合、その従属ピクチャは復号される。関連する潜在的に不要なピクチャが復号可能な従属ピクチャでないことを、従属ピクチャシンタックス要素63が示す場合、その潜在的に不要なピクチャは、廃棄され、復号され得ない。この場合も、潜在的に不要なピクチャは、デコーダ30によってCDRと同じGOP中のピクチャとして識別され得るが、それは表示順序でCDRに先行する。
ビデオスライスがイントラコード化(I)スライスとしてコード化されるとき、予測モジュール81のイントラ予測モジュール84は、信号伝達されたイントラ予測モードと、現在のフレーム又はピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(即ち、B、P又はGPB)スライスとしてコード化されるとき、予測モジュール81の動き補償ユニット82は、エントロピー復号ユニット80から受信された動きベクトル及び他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ92に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、即ち、リスト0及びリスト1を構成し得る。
動き補償ユニット82は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックのための予測情報を決定し、その予測情報を使用して、復号されている現在のビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット82は、受信したシンタックス要素の幾つかを使用して、ビデオスライスのビデオブロックをコード化するために使用される予測モード(例えば、イントラ予測又はインター予測)、インター予測スライスタイプ(例えば、Bスライス、Pスライス、又はGPBスライス)、スライスのための参照ピクチャリストの1つ以上のための構成情報、スライスの各インター符号化ビデオブロックの動きベクトル、スライスの各インターコード化ビデオブロックのインター予測状況、及び現在のビデオスライス中のビデオブロックを復号するための他の情報を決定する。
動き補償ユニット82はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット82は、ビデオブロックの符号化中にビデオエンコーダ20によって使用される補間フィルタを使用して、参照ブロックのサブ整数画素の補間値を計算し得る。動き補償ユニット82は、受信したシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
逆量子化ユニット86は、ビットストリーム中で与えられ、エントロピー復号ユニット80によって復号された量子化変換係数を逆量子化(inverse quantize)、即ち、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中の各ビデオブロックについてビデオエンコーダ20によって計算される量子化パラメータの使用を含み得る。逆変換モジュール88は、画素領域において残差ブロックを生成するために、逆変換、例えば、逆DCT、逆整数変換、又は概念的に同様の逆変換プロセスを変換係数に適用する。
動き補償ユニット82が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換モジュール88からの残差ブロックを動き補償ユニット82によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器90は、この加算演算を実行する1つ以上の構成要素を表す。また、所望される場合、ブロック歪みを除去するために、デブロッキングフィルタを適用して、復号ブロックをフィルタ処理し得る。次いで、所与のフレーム又はピクチャ中の復号されたビデオブロックは、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ92に記憶される。参照ピクチャメモリ92はまた、図3の表示装置32などの表示装置上での後の提示のために、復号されたビデオを記憶する。
図6は、上記で説明した本開示の技法よるビデオ符号化方法の例示的なフローチャートである。図6の技法は、図4のビデオエンコーダ20などのビデオエンコーダによって実施され得る。ビデオエンコーダ20は、クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化する(110)ように構成され得る。1つ以上の潜在的に不要なピクチャは、復号順序でCDRピクチャに後続し、表示順序でCDRピクチャに先行する。ビデオエンコーダ20はまた、1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定する(112)。従属ピクチャは、復号順序と表示順序の両方でCDRピクチャに後続するピクチャのインター予測のために使用される。
潜在的に不要なピクチャのいずれかが従属ピクチャである場合、ビデオエンコーダ20は、さらに、図4を参照しながら上記で説明したように、CDRピクチャがランダムアクセスのために使用される場合に従属ピクチャが復号可能であるかどうかを決定する(114)。ビデオエンコーダ20は、さらに、符号化ビデオデータビットストリーム中で、潜在的に不要なピクチャが、CDRピクチャがランダムアクセスのために使用される場合に復号可能であると決定される従属ピクチャであることを示すシンタックス要素を信号伝達する(116)。一例では、シンタックス要素は、ネットワーク抽象化レイヤ単位ヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの1つ以上の中で信号伝達され得る。別の例では、シンタックス要素は、上記で説明したようにファイルフォーマットで信号伝達される。
図7は、上記で説明した本開示の技法によるビデオ復号方法の例示的なフローチャートである。図7の技法は、図5のビデオデコーダ30などのビデオデコーダによって実施され得る。ビデオデコーダ30は、クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信する(120)ように構成され得る。ビデオデコーダ30は、潜在的に不要なピクチャが、従属ピクチャであり、CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能であることを示すシンタックス要素を受信する(122)ようにさらに構成され得る。従属ピクチャは、復号順序と表示順序の両方でCDRピクチャに後続するピクチャのインター予測のために使用される。
ビデオデコーダ30は、CDRピクチャへのランダムアクセスのための要求を受信する(124)ようにさらに構成され得る。ランダムアクセス要求が受信された場合、ビデオデコーダ30は、ランダムアクセスのための要求に応答してCDRピクチャを復号し(126)、受信したシンタックス要素に対応する従属ピクチャを復号する(128)ようにさらに構成され得る。さらに、ビデオデコーダ30はまた、シンタックス要素によって従属ピクチャでないとして示される1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップする(130)ように構成され得る。一例では、シンタックス要素は、ネットワーク抽象化レイヤ単位ヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの1つ以上の中で受信される。別の例では、シンタックス要素は、上記で説明したようにファイルフォーマットに記憶される。
1つ以上の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実施され得る。ソフトウェアで実施した場合、機能は、1つ以上の命令又はコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、例えば、通信プロトコルに従ってある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体又は通信媒体など、有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実施のための命令、コード及び/又はデータ構造を取り出すために1つ以上のコンピュータあるいは1つ以上のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD−ROM又は他の光ディスクストレージ、磁気ディスクストレージ、又は他の磁気ストレージ機器、フラッシュメモリ、あるいは命令又はデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。但し、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、及びブルーレイディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
命令は、1つ以上のデジタル信号プロセッサ(DSP)などの1つ以上のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路又はディスクリート論理回路によって実行され得る。従って、本明細書で使用する「プロセッサ」という用語は、前述の構造、又は本明細書で説明した技法の実施に好適な他の構造のいずれかを指し得る。さらに、幾つかの態様では、本明細書で説明した機能は、符号化及び復号のために構成された専用ハードウェア及び/又はソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つ以上の回路又は論理要素において完全に実施され得る。
本開示の技法は、ワイヤレスハンドセット、集積回路(IC)又はICのセット(例えば、チップセット)を含む、多種多様な機器又は装置において実施され得る。本開示では、開示した技法を実行するように構成された機器の機能的態様を強調するために、様々な構成要素、モジュール、又はユニットについて説明したが、それらの構成要素、モジュール、又はユニットを必ずしも異なるハードウェアユニットによって実現する必要はない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェア及び/又はファームウェアとともに、上記で説明した1つ以上のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、又は相互動作ハードウェアユニットの集合によって与えられ得る。
様々な例について説明した。これら及び他の例は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを符号化する方法であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達することと
を備える、方法。
[C2]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C1に記載の方法。
[C3]
前記従属ピクチャが、復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、C1に記載の方法。
[C4]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を信号伝達することをさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C1に記載の方法。
[C5]
前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達することをさらに備える、C1に記載の方法。
[C6]
ビデオデータを復号する方法であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが、前記CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信することと
を備える、方法。
[C7]
前記CDRピクチャへのランダムアクセスのための要求を受信することと、
ランダムアクセスのための前記要求に応答して前記CDRピクチャを復号することと、
前記受信したシンタックス要素に対応する前記従属ピクチャを復号することと
をさらに備える、C6に記載の方法。
[C8]
前記受信したシンタックス要素によって従属ピクチャであると示されない前記1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップすること
をさらに備える、C7に記載の方法。
[C9]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C6に記載の方法。
[C10]
復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用することをさらに備える、C6に記載の方法。
[C11]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を受信することをさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C6に記載の方法。
[C12]
前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、C6に記載の方法。
[C13]
ビデオデータを符号化するように構成された装置であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達することと
を行うように構成されたビデオエンコーダ
を備える、装置。
[C14]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C13に記載の装置。
[C15]
前記従属ピクチャが、復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、C13に記載の装置。
[C16]
前記ビデオエンコーダが、ネットワーク抽象化レイヤ単位中で前記シンタックス要素を信号伝達するようにさらに構成され、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C13に記載の装置。
[C17]
前記ビデオエンコーダが、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達するようにさらに構成された、C13に記載の装置。
[C18]
ビデオデータを復号するように構成された装置であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが、前記CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信することと
を行うように構成されたビデオデコーダ
を備える、装置。
[C19]
前記ビデオデコーダが、
前記CDRピクチャへのランダムアクセスのための要求を受信することと、
ランダムアクセスのための前記要求に応答して前記CDRピクチャを復号することと、
前記受信したシンタックス要素に対応する前記従属ピクチャを復号することと
を行うようにさらに構成された、C18に記載の装置。
[C20]
前記ビデオデコーダが、
前記受信したシンタックス要素によって従属ピクチャであると示されない前記1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップすること
を行うようにさらに構成された、C19に記載の装置。
[C21]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C18に記載の装置。
[C22]
前記ビデオデコーダが、復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用するようにさらに構成された、C18に記載の装置。
[C23]
前記ビデオデコーダが、ネットワーク抽象化レイヤ単位中で前記シンタックス要素を受信するようにさらに構成され、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C18に記載の装置。
[C24]
前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、C18に記載の装置。
[C25]
ビデオデータを符号化するように構成された装置であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化するための手段と、
前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定するための手段と、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であるかどうかを決定するための手段と、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達するための手段と
を備える、装置。
[C26]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C25に記載の装置。
[C27]
前記従属ピクチャが、復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、C25に記載の装置。
[C28]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を信号伝達するための手段をさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C25に記載の装置。
[C29]
前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達するための手段
をさらに備える、C25に記載の装置。
[C30]
ビデオデータを復号するように構成された装置であって、
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信するための手段と、
前記1つ以上の潜在的に不要なピクチャのいずれかが、前記CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信するための手段と
を備える、装置。
[C31]
前記CDRピクチャへのランダムアクセスのための要求を受信するための手段と、
ランダムアクセスのための前記要求に応答して前記CDRピクチャを復号するための手段と、
前記受信したシンタックス要素に対応する前記従属ピクチャを復号するための手段と
をさらに備える、C30に記載の装置。
[C32]
前記受信したシンタックス要素によって従属ピクチャであると示されない前記1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップするための手段をさらに備える、C31に記載の装置。
[C33]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C30に記載の装置。
[C34]
復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用するための手段をさらに備える、C30に記載の装置。
[C35]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を受信するための手段をさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C30に記載の装置。
[C36]
前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、C30に記載の装置。
[C37]
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であるかどうかを決定することと、
前記CDRピクチャがランダムアクセスのために使用される場合に前記従属ピクチャが復号可能であると決定されることを示すシンタックス要素を信号伝達することと
を、ビデオデータを符号化するように構成されたプロセッサに行わせるための命令を記憶するコンピュータ可読媒体。
[C38]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C37に記載のコンピュータ可読媒体。
[C39]
前記従属ピクチャが、復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、C37に記載のコンピュータ可読媒体。
[C40]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を信号伝達することをプロセッサに行わせるための命令をさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C37に記載のコンピュータ可読媒体。
[C41]
前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達することをプロセッサに行わせるための命令をさらに備える、C37に記載のコンピュータ可読媒体。
[C42]
クリーン復号リフレッシュ(CDR)ピクチャと1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
前記1つ以上の潜在的に不要なピクチャのいずれかが、前記CDRピクチャへのランダムアクセスのための要求が受信された場合に復号可能である従属ピクチャであるか否かを示すシンタックス要素を受信することと
を、ビデオデータを復号するように構成されたプロセッサに行わせるための命令を記憶するコンピュータ可読媒体。
[C43]
前記命令が、
前記CDRピクチャへのランダムアクセスのための要求を受信することと、
ランダムアクセスのための前記要求に応答して前記CDRピクチャを復号することと、
受信した前記シンタックス要素に対応する前記従属ピクチャを復号することと
を前記プロセッサにさらに行わせる、C42に記載のコンピュータ可読媒体。
[C44]
前記命令が、
受信した前記シンタックス要素によって従属ピクチャであると示されない前記1つ以上の潜在的に不要なピクチャのいずれかのための復号をスキップすること
を前記プロセッサにさらに行わせる、C43に記載のコンピュータ可読媒体。
[C45]
前記1つ以上の潜在的に不要なピクチャが、復号順序で前記CDRピクチャに後続し、表示順序で前記CDRピクチャに先行する、C42に記載のコンピュータ可読媒体。
[C46]
復号順序と表示順序の両方で前記CDRピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用することをプロセッサに行わせるための命令をさらに備える、C42に記載のコンピュータ可読媒体。
[C47]
ネットワーク抽象化レイヤ単位中で前記シンタックス要素を受信することをプロセッサに行わせるための命令をさらに備え、前記ネットワーク抽象化レイヤ単位が、スライスヘッダとピクチャレベル補足エンハンスメント情報(SEI)メッセージとのうちの少なくとも1つを含む、C42に記載のコンピュータ可読媒体。
[C48]
前記シンタックス要素がファイルフォーマットに記憶される、C42に記載のコンピュータ可読媒体。

Claims (40)

  1. ビデオデータを符号化する方法であって、
    ビデオエンコーダが、ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
    前記ビデオエンコーダが、前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に、前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であるかどうかを決定することと、
    前記ビデオエンコーダが、前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に前記潜在的に不要なピクチャのうちの1つが復号可能であると決定されるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで信号伝達することと
    を備える、方法。
  2. 復号可能であると決定される前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを、前記ビデオエンコーダを用いて決定することをさらに備え、前記従属ピクチャが、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、請求項1に記載の方法。
  3. 前記ビデオエンコーダが、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達することをさらに備える、請求項1に記載の方法。
  4. ビデオデータを復号する方法であって、
    ビデオデコーダが、ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
    前記ビデオデコーダが、前記ランダムアクセスピクチャへのランダムアクセスのための要求が受信された場合に、記潜在的に不要なピクチャのうちの1つが復号可能であるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで受信することと
    を備える、方法。
  5. 前記ビデオデコーダが、前記ランダムアクセスピクチャへのランダムアクセスのための要求を受信することと、
    前記ビデオデコーダが、ランダムアクセスのための前記要求に応答して前記ランダムアクセスピクチャを復号することと、
    前記ビデオデコーダが、前記受信したシンタックス要素に従って前記1つの潜在的に不要なピクチャを復号することと
    をさらに備える、請求項に記載の方法。
  6. 前記ビデオデコーダが、前記受信したシンタックス要素によって前記1つの潜在的に不要なピクチャが復号可能であると示されない場合に、前記1つの潜在的に不要なピクチャのための復号をスキップすることをさらに備える、請求項に記載の方法。
  7. 前記1つの潜在的に不要なピクチャが復号可能であり、かつ従属ピクチャであるかどうかを、前記ビデオデコーダを用いて決定することと、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用することと、をさらに備える、請求項に記載の方法。
  8. 前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、請求項に記載の方法。
  9. ビデオデータを符号化するように構成された装置であって、
    ビデオデータを記憶するように構成されたメモリと、
    ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に、前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であるかどうかを決定することと、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に前記潜在的に不要なピクチャのうちの1つが復号可能であると決定されるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで信号伝達することと
    を行うように構成されたビデオエンコーダ
    を備える、装置。
  10. 前記ビデオエンコーダが、復号可能であると決定される前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定するようにさらに構成され、前記従属ピクチャが、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、請求項に記載の装置。
  11. 前記ビデオエンコーダが、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達するようにさらに構成された、請求項に記載の装置。
  12. ビデオデータを復号するように構成された装置であって、
    ビデオデータを記憶するように構成されたメモリと、
    ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
    前記ランダムアクセスピクチャへのランダムアクセスのための要求が受信された場合に、記潜在的に不要なピクチャのうちの1つが復号可能であるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで受信することと
    を行うように構成されたビデオデコーダ
    を備える、装置。
  13. 前記ビデオデコーダが、
    前記ランダムアクセスピクチャへのランダムアクセスのための要求を受信することと、
    ランダムアクセスのための前記要求に応答して前記ランダムアクセスピクチャを復号することと、
    受信した前記シンタックス要素にしたがって前記潜在的に不要なピクチャのうちの前記1つを復号することと
    を行うようにさらに構成された、請求項12に記載の装置。
  14. 前記ビデオデコーダが、
    受信した前記シンタックス要素によって前記1つの潜在的に不要なピクチャが復号可能であると示されない場合に、前記1つの潜在的に不要なピクチャのための復号をスキップすること
    を行うようにさらに構成された、請求項13に記載の装置。
  15. 前記ビデオデコーダが、前記1つの潜在的に不要なピクチャが復号可能であり、かつ従属ピクチャであるかどうかを決定し、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用するようにさらに構成された、請求項12に記載の装置。
  16. 前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、請求項12に記載の装置。
  17. ビデオデータを符号化するように構成された装置であって、
    ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化するための手段と、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に、前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であるかどうかを決定するための手段と、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に前記潜在的に不要なピクチャのうちの1つが復号可能であると決定されるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで信号伝達するための手段と
    を備える、装置。
  18. 復号可能であると決定される前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定するための手段をさらに備え、前記従属ピクチャが、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、請求項17に記載の装置。
  19. 前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達するための手段をさらに備える、請求項17に記載の装置。
  20. ビデオデータを復号するように構成された装置であって、
    ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信するための手段と、
    前記ランダムアクセスピクチャへのランダムアクセスのための要求が受信された場合に、記潜在的に不要なピクチャのうちの1つが復号可能であるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダ中で受信するための手段と
    を備える、装置。
  21. 前記ランダムアクセスピクチャへのランダムアクセスのための要求を受信するための手段と、
    ランダムアクセスのための前記要求に応答して前記ランダムアクセスピクチャを復号するための手段と、
    前記受信したシンタックス要素にしたがって前記1つの潜在的に不要なピクチャを復号するための手段と
    をさらに備える、請求項20に記載の装置。
  22. 前記受信したシンタックス要素によって前記1つの潜在的に不要なピクチャが復号可能であると示されない場合に、前記1つの潜在的に不要なピクチャのための復号をスキップするための手段をさらに備える、請求項21に記載の装置。
  23. 前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であり、かつ従属ピクチャであるかどうかを決定するための手段と、
    復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用するための手段
    をさらに備える、請求項20に記載の装置。
  24. 前記シンタックス要素が、前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナに記憶される、請求項20に記載の装置。
  25. ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを符号化することと、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に、前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であるかどうかを決定することと、
    前記ランダムアクセスピクチャがランダムアクセスのために使用される場合に前記潜在的に不要なピクチャのうちの1つが復号可能であると決定されるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダ中で信号伝達することと
    を、ビデオデータを符号化するように構成されたデバイスの1つ以上のプロセッサに行わせるための命令を記憶するコンピュータ可読媒体。
  26. 前記命令が、復号可能であると決定される前記1つ以上の潜在的に不要なピクチャのいずれかが従属ピクチャであるかどうかを決定することを、前記1つ以上のプロセッサにさらに行わせ、前記従属ピクチャが、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために使用される、請求項25に記載のコンピュータ可読媒体。
  27. 前記1つ以上の潜在的に不要なピクチャのためのファイルフォーマットコンテナ中で前記シンタックス要素を信号伝達することを前記1つ以上のプロセッサに行わせるための命令をさらに備える、請求項25に記載のコンピュータ可読媒体。
  28. ランダムアクセスピクチャと前記ランダムアクセスピクチャに表示順序で先行する1つ以上の潜在的に不要なピクチャとを含むピクチャグループを受信することと、
    前記ランダムアクセスピクチャへのランダムアクセスのための要求が受信された場合に記潜在的に不要なピクチャのうちの1つが復号可能であるか否かを示すシンタックス要素をネットワークアブストラクションレイヤ(NAL)ユニットヘッダで受信することと
    を、ビデオデータを復号するように構成されたデバイスの1つ以上のプロセッサに行わせるための命令を記憶するコンピュータ可読媒体。
  29. 前記命令が、
    前記ランダムアクセスピクチャへのランダムアクセスのための要求を受信することと、
    ランダムアクセスのための前記要求に応答して前記ランダムアクセスピクチャを復号することと、
    受信した前記シンタックス要素にしたがって前記1つの潜在的に不要なピクチャを復号することと
    を前記1つ以上のプロセッサにさらに行わせる、請求項28に記載のコンピュータ可読媒体。
  30. 前記命令が、
    受信した前記シンタックス要素によって前記1つの潜在的に不要なピクチャが復号可能であると示されない場合に、前記1つの潜在的に不要なピクチャのための復号をスキップすること
    を前記1つ以上のプロセッサにさらに行わせる、請求項29に記載のコンピュータ可読媒体。
  31. 前記1つ以上の潜在的に不要なピクチャのいずれかが復号可能であり、かつ従属ピクチャであるかどうかを決定し、復号順序と表示順序の両方で前記ランダムアクセスピクチャに後続する少なくとも1つのピクチャのインター予測のために前記従属ピクチャを使用することを前記1つ以上のプロセッサに行わせるための命令をさらに備える、請求項28に記載のコンピュータ可読媒体。
  32. 前記シンタックス要素がファイルフォーマットに記憶される、請求項28に記載のコンピュータ可読媒体。
  33. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項1に記載の方法。
  34. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項4に記載の方法。
  35. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項9に記載の装置。
  36. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項12に記載の装置。
  37. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項17に記載の装置。
  38. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項20に記載の装置。
  39. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項25に記載のコンピュータ可読媒体。
  40. 前記ランダムアクセスピクチャがクリーン復号リフレッシュ(CDR)ピクチャである、請求項28に記載のコンピュータ可読媒体。
JP2013557901A 2011-03-10 2012-03-09 ランダムアクセスの後に従属ピクチャをコード化するためのビデオコード化技法 Active JP5876083B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161451453P 2011-03-10 2011-03-10
US61/451,453 2011-03-10
US201161454548P 2011-03-20 2011-03-20
US61/454,548 2011-03-20
US13/415,453 US9706227B2 (en) 2011-03-10 2012-03-08 Video coding techniques for coding dependent pictures after random access
US13/415,453 2012-03-08
PCT/US2012/028490 WO2012122480A1 (en) 2011-03-10 2012-03-09 Video coding techniques for coding dependent pictures after random access

Publications (2)

Publication Number Publication Date
JP2014513456A JP2014513456A (ja) 2014-05-29
JP5876083B2 true JP5876083B2 (ja) 2016-03-02

Family

ID=46795585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013557901A Active JP5876083B2 (ja) 2011-03-10 2012-03-09 ランダムアクセスの後に従属ピクチャをコード化するためのビデオコード化技法

Country Status (15)

Country Link
US (1) US9706227B2 (ja)
EP (1) EP2684364A1 (ja)
JP (1) JP5876083B2 (ja)
KR (1) KR101617504B1 (ja)
CN (1) CN103430542B (ja)
AU (1) AU2012225307B2 (ja)
BR (1) BR112013023033A2 (ja)
CA (1) CA2828776C (ja)
IL (1) IL228061B (ja)
MY (1) MY167061A (ja)
RU (1) RU2566972C2 (ja)
SG (1) SG192898A1 (ja)
TW (1) TWI544782B (ja)
WO (1) WO2012122480A1 (ja)
ZA (1) ZA201307540B (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3439299A1 (en) * 2011-07-02 2019-02-06 Samsung Electronics Co., Ltd. Apparatus for multiplexing and demultiplexing video data to identify reproducing state of video data
US9237356B2 (en) 2011-09-23 2016-01-12 Qualcomm Incorporated Reference picture list construction for video coding
US9264717B2 (en) 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US10447990B2 (en) 2012-02-28 2019-10-15 Qualcomm Incorporated Network abstraction layer (NAL) unit header design for three-dimensional video coding
US9351016B2 (en) 2012-04-13 2016-05-24 Sharp Kabushiki Kaisha Devices for identifying a leading picture
US9532055B2 (en) * 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
US9979958B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Decoded picture buffer processing for random access point pictures in video sequences
US9225978B2 (en) 2012-06-28 2015-12-29 Qualcomm Incorporated Streaming adaption based on clean random access (CRA) pictures
US9479776B2 (en) 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
JP6319083B2 (ja) 2012-07-10 2018-05-09 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
KR102185384B1 (ko) * 2012-07-11 2020-12-02 한국전자통신연구원 Mpeg 데이터의 랜덤 억세스를 지원하는 방법 및 시스템
WO2014010894A1 (ko) 2012-07-11 2014-01-16 한국전자통신연구원 Mpeg 데이터의 랜덤 억세스를 지원하는 방법 및 시스템
US9374583B2 (en) 2012-09-20 2016-06-21 Qualcomm Incorporated Video coding with improved random access point picture behaviors
US9491456B2 (en) * 2012-09-24 2016-11-08 Qualcomm Incorporated Coded picture buffer removal times signaled in picture and sub-picture timing supplemental enhancement information messages
SG11201500316PA (en) 2012-09-28 2015-02-27 Intel Corp Inter-layer intra mode prediction
KR101812615B1 (ko) * 2012-09-28 2017-12-27 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
CN103716607B (zh) * 2012-09-28 2017-02-08 中兴通讯股份有限公司 一种应用于HEVC‑based 3DVC的编码方法和装置
US20140098868A1 (en) * 2012-10-04 2014-04-10 Qualcomm Incorporated File format for video data
US20140307803A1 (en) * 2013-04-08 2014-10-16 Qualcomm Incorporated Non-entropy encoded layer dependency information
US9860540B2 (en) * 2014-01-03 2018-01-02 Qualcomm Incorporated Inference of nooutputofpriorpicsflag in video coding
US9911460B2 (en) 2014-03-24 2018-03-06 Microsoft Technology Licensing, Llc Fast and smart video trimming at frame accuracy on generic platform
US10136152B2 (en) * 2014-03-24 2018-11-20 Qualcomm Incorporated Use of specific HEVC SEI messages for multi-layer video codecs
JP2017522767A (ja) * 2014-06-18 2017-08-10 テレフオンアクチーボラゲット エルエム エリクソン(パブル) ビデオビットストリームにおけるランダムアクセス
US10484711B2 (en) * 2014-06-18 2019-11-19 Telefonaktiebolaget Lm Ericsson (Publ) Dependent random access point pictures
CN107005704B (zh) * 2014-10-16 2020-07-24 三星电子株式会社 处理编码视频数据的方法和装置及生成编码视频数据的方法和装置
US9928297B2 (en) * 2015-02-11 2018-03-27 Qualcomm Incorporated Sample grouping signaling in file formats
US11418812B2 (en) * 2015-02-11 2022-08-16 Qualcomm Incorporated Placement of parameter sets and sync samples in video coding
CN108028948B (zh) * 2015-08-07 2021-05-07 联发科技股份有限公司 用于多媒体应用的比特流随机访问与同步的方法及装置
US11395007B2 (en) * 2019-12-12 2022-07-19 Tencent America LLC Method for signaling dependent and independent picture header

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842033A (en) 1992-06-30 1998-11-24 Discovision Associates Padding apparatus for passing an arbitrary number of bits through a buffer in a pipeline system
US8300690B2 (en) 2002-07-16 2012-10-30 Nokia Corporation Method for random access and gradual picture refresh in video coding
JP3513148B1 (ja) 2002-10-11 2004-03-31 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
TWI249356B (en) 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
JP4324844B2 (ja) * 2003-04-25 2009-09-02 ソニー株式会社 画像復号化装置及び画像復号化方法
US8175154B2 (en) 2003-06-03 2012-05-08 General Instrument Corporation Method for restructuring a group of pictures to provide for random access into the group of pictures
RU2368095C1 (ru) 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
US8306112B2 (en) 2005-09-20 2012-11-06 Mitsubishi Electric Corporation Image encoding method and image decoding method, image encoder and image decoder, and image encoded bit stream and recording medium
JP4885964B2 (ja) * 2005-09-27 2012-02-29 クゥアルコム・インコーポレイテッド チャネル交換フレーム
US8229983B2 (en) * 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
RU2406254C2 (ru) * 2006-03-29 2010-12-10 Квэлкомм Инкорпорейтед Видеообработка с масштабируемостью
US8416859B2 (en) 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
CN101198052B (zh) 2006-12-04 2010-05-19 华为技术有限公司 一种视频编码方法、解码方法及其装置
WO2008086423A2 (en) 2007-01-09 2008-07-17 Vidyo, Inc. Improved systems and methods for error resilience in video communication systems
EP2119187B1 (en) * 2007-02-23 2017-07-19 Nokia Technologies Oy Backward-compatible characterization of aggregated media data units
CN101257624B (zh) * 2007-02-27 2011-08-24 华为技术有限公司 实现随机访问的方法及解码器
JP5023739B2 (ja) 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
JP2010041354A (ja) 2008-08-05 2010-02-18 Victor Co Of Japan Ltd 動画像符号化方法、符号化装置及び符号化プログラム
TW201032597A (en) * 2009-01-28 2010-09-01 Nokia Corp Method and apparatus for video coding and decoding
US8930562B2 (en) 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data

Also Published As

Publication number Publication date
SG192898A1 (en) 2013-09-30
BR112013023033A2 (pt) 2016-12-13
CA2828776C (en) 2016-06-28
WO2012122480A1 (en) 2012-09-13
KR20130129468A (ko) 2013-11-28
CA2828776A1 (en) 2012-09-13
MY167061A (en) 2018-08-02
AU2012225307B2 (en) 2015-12-03
RU2566972C2 (ru) 2015-10-27
TWI544782B (zh) 2016-08-01
ZA201307540B (en) 2022-03-30
IL228061A0 (en) 2013-09-30
IL228061B (en) 2019-02-28
JP2014513456A (ja) 2014-05-29
US9706227B2 (en) 2017-07-11
CN103430542A (zh) 2013-12-04
KR101617504B1 (ko) 2016-05-02
US20120230433A1 (en) 2012-09-13
EP2684364A1 (en) 2014-01-15
CN103430542B (zh) 2016-11-23
TW201244494A (en) 2012-11-01
RU2013145305A (ru) 2015-04-20
AU2012225307A1 (en) 2013-09-19

Similar Documents

Publication Publication Date Title
JP5876083B2 (ja) ランダムアクセスの後に従属ピクチャをコード化するためのビデオコード化技法
JP6495390B2 (ja) ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング
JP6235026B2 (ja) 誤り耐性のある復号単位関連付け
JP5859581B2 (ja) ビデオコーデックにおけるバッファ管理
TWI587708B (zh) 用於視訊寫碼之交錯視訊資料之指示
JP6234997B2 (ja) ビデオシーケンスにおけるランダムアクセスポイントピクチャのための復号ピクチャバッファ処理
JP6174139B2 (ja) タイル及び波面並列処理
JP6169689B2 (ja) ビデオコーディングにおける長期参照ピクチャのランダムアクセスおよびシグナリング
JP6266605B2 (ja) 映像コーディングにおけるロスレスコーディングモード及びパルスコード変調(pcm)モードのシグナリングの統一
JP6169723B2 (ja) ビデオコーディングにおけるランダムアクセスのためのビデオバッファリング動作
JP6585096B2 (ja) マルチレイヤビデオコーディング
JP6333949B2 (ja) 改善されたrtpペイロードフォーマット設計
JP2017195607A (ja) パラメータセットコーディング
JP2015517278A5 (ja)
JP6345675B2 (ja) ビデオコーダの動作点のためのレイヤ識別子の向上したシグナリング
KR101870546B1 (ko) 서브-레이어 참조 예측 종속성에 기초한 인터-레이어 rps 도출을 위한 시스템들 및 방법들
JP2016506159A (ja) ビデオコード化における低遅延バッファリングモデル
JP2015526023A (ja) クリーンランダムアクセス(cra)ピクチャに基づくストリーミング適合化

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160120

R150 Certificate of patent or registration of utility model

Ref document number: 5876083

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250