JP2014526180A - クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 - Google Patents

クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 Download PDF

Info

Publication number
JP2014526180A
JP2014526180A JP2014520163A JP2014520163A JP2014526180A JP 2014526180 A JP2014526180 A JP 2014526180A JP 2014520163 A JP2014520163 A JP 2014520163A JP 2014520163 A JP2014520163 A JP 2014520163A JP 2014526180 A JP2014526180 A JP 2014526180A
Authority
JP
Japan
Prior art keywords
image
random access
access point
encoder
point image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014520163A
Other languages
English (en)
Other versions
JP5993453B2 (ja
Inventor
リキャルド フェーバリ,
ヨナタン サムエルソン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2014526180A publication Critical patent/JP2014526180A/ja
Application granted granted Critical
Publication of JP5993453B2 publication Critical patent/JP5993453B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明の実施形態は、CRA画像と称される自己完結型画像を管理するための符号器およびその方法に関し、CRA画像は、ランダムアクセスポイントとして識別される。CRA画像は、最下レイヤ識別情報を割り当てられる。

Description

H.264は、Moving Picture Experts Group−4(MPEG−4)Advanced Video Coding (AVC)とも称される動画像符号化方式である。時間的予測および空間的予測を利用するブロックベースのハイブリッド動画符号化方式からなる。
高効率動画符号化(HEVC)は、Joint Collaborative Team−Video Coding(JCT−VC)で現在開発されている新しい動画符号化規格である。JCT−VCは、MPEGと国際電気通信連合電気通信標準化セクタ(ITU−T)との共同プロジェクトである。現在、作業原案(WD)が、大きなマクロブロック(最大符号化単位(Largest Coding Unit)をLCUと略す)と多数の他の新しいツールとを備えるように定義され、H.264/AVCよりも有効である。
動画伝送では、受信器の復号器は、画像を表すビットストリーム、すなわち、圧縮データの動画データパケットを受信する。圧縮データは、ペイロードおよび制御情報を備える。制御情報は、例えば、どの参照画像を参照画像バッファ内に格納すべきかについての情報を備える。この情報は、以前に受信した画像に対する相対参照(relative reference)である。さらに、復号器は、受信したビットストリームを復号化し、復号化した画像を表示する。さらに、復号化した画像は、制御情報に従い、参照画像バッファに格納される。これらの格納された参照画像は、後続の画像を復号化する場合に、復号器によって使用される。
H.264/AVCで設計されるような受信器で実行される方式の簡易フローチャートを図1に示す。画像が実際に復号化される前に、スライスヘッダ内のframe_numが100でパースされ、シーケンスパラメータセット(SPS:Sequence Parameter Set)構文要素gaps_in_frame_num_value_allowed_flagが1である場合、110でframe_numにおいて起こり得るギャップを検出する。frame_numは、復号化順序を示す。frame_numにおけるギャップが検出された場合、「存在しない」フレームが120および130で作り出され、復号画像バッファ(DPB:Decoded Picture Buffer)とも称される参照画像バッファに挿入される。その場合、スライディングウィンドウ処理およびバンピング処理が適用される。
frame_num内にギャップがあろうとなかろうと、次のステップは、現在の画像を160で実際に復号化することである。170で、画像のスライスヘッダが、メモリ管理制御操作(MMCO:Memory Management Control Operation)コマンドを含む場合、参照画像バッファに格納される画像に対する相対参照を取得するために画像を復号化した後、適応メモリ管理制御処理(adaptive memory control process)が180で適用され、そうでない場合、参照画像バッファに格納される画像に対する相対参照を取得するために、スライディングウィンドウ処理が190で適用される。最終ステップとして、「バンピング」処理が200で適用され、正しい順序で画像を送出する。
HEVCはまた、画像が属する時間レイヤに対応する、各画像に対するtemporal_idを定義する。temporal_id tIdAを有する画像Aは、temporal_id tIdBがtIdAよりも高い場合の参照として、tIdBを有する画像Bを使用することができない。
さらに、HEVCは、時間レイヤ交換点の概念を備える。時間レイヤ交換点は、交換点より前のより高い時間レイヤからの画像が復号化されなかった場合でさえも、より高い時間レイヤからの画像の復号化を開始することが可能である、符号化されたビットストリーム内の画像である。このことは、時間レイヤ交換点が復号化された場合、「予測には不使用」としてより高い時間レイヤ内のすべての画像をマーキングすることによって、HEVCで実現される。したがって、時間レイヤ交換点とは、符号器が制御情報を送信して、予測には不使用としてより高い画像をマーキングすることを符号器から復号器に対して保証する。時間レイヤ交換点に関連する復号器の動作はない。
HEVC作業原案は、クリーンランダムアクセス(CRA:clean random access)アクセスユニットを含む。クリーンランダムアクセス(CRA)アクセスユニットとは、符号化画像がCRA画像であるアクセスユニットである。CRA画像はまた、クリーン復号リフレッシュ(CDR:Clean Decoding Refresh)画像または遅延復号リフレッシュ(DDR:Deferred Decoding Refresh)画像と称される可能性もあることに留意されたい。さらに、クリーンランダムアクセス(CRA)画像は、すべてのブロックに対してイントラ予測を使用する自己完結型符号化画像であり、それにより、CRA画像は、参照画像に依存することなく復号化されるのに十分な情報を備える。CRA画像は、対応するネットワークアダプションレイヤ(NAL:Network Adaptation Layer)ユニット種類を有するHEVCに導入される新しい画像種類である。CRA画像は、復号器が正確にCRA画像、および復号化順序と表示順序の両方でCRA画像に続くすべての画像の復号化を開始することを可能にする、ビットストリーム内のポイントを示すために使用される、ランダムアクセスポイントである。
画像がCRA画像として符号化された場合、標準の復号器動作を、CRA画像である画像の検出に対して実行しないことが提案される。前述のように、時間レイヤ交換点とは、符号器が制御情報を送信して、予測には不使用としてより高い画像をマーキングすることを符号器から復号器に対して保証する。
各CRAは、独自のNALユニット種類を有し、各NALユニットは、時間識別子などのレイヤ識別子と関連づけられる。レイヤ識別情報Aを有するNALユニットは、A<Bである場合、レイヤ識別情報Bを有するNALユニットを参照のために使用しない可能性がある。
本文では、表示順序は、表示順序に関連した値を扱う可変画像順序カウント(POC:Picture Order Count)によって示され、復号化順序は、可変復号化順序によって示されることに留意されたい。CRA画像Aが、frame_num fA、POC pAおよびtemporal_id tIdAを有する符号器で符号化される場合、復号器は、frame_num fB>fAおよびPOC pB>pAである第1の画像Bを復号化する前に、A以外のすべての参照画像を「参照には不使用」としてマーキングする。temporal_id tIdC<tIdA、frame_num fC>fAおよびPOC pC>pAを満たす第1の画像Cが復号化される場合、参照に使用可能な参照画像は存在しない。これは、Cより高いtemporal_idを有しており、さらにtIdC以下のtemporal_idを有する他のすべての画像が、Bが復号化される前に、「予測には不使用」のマーキングをされているため、Aを使用することができないためである。この例におけるBは、Cと同じ画像であるか、または、tIdA以上のtemporal_idを有する他の画像である可能性がある。
Cが予測のために使用可能な画像を有しないため、イントラ予測のみを使用して符号化しなければならず、したがって、非常にコストがかかる。
したがって、上記の問題を解決することが望まれる。
上記の問題は、CRA画像、またはランダムアクセスポイントとして識別可能な対応する自己完結型画像が最下レイヤに属さなければならない、という要件をビットストリームに課すことによって解決される。自己完結型画像は、本明細書では、参照画像を使用することなく復号化可能である画像を意味する。しかしながら、自己完結型画像は、復号化するための情報をすべて備える必要はない。自己完結型画像はまた、イントラ画像とも称される可能性がある。
時間レイヤ構造に対し、このことは、CDR NALに設定されたNALユニット種類を有するどんなNALユニットも、temporal_id=0となる可能性があることを意味する。
したがって、本発明の実施形態の第1の態様によれば、動画ストリームの画像を符号化する方法が提供される。前記方法では、レイヤ識別子は、自己完結型であり、一種のランダムアクセスポイント画像として識別可能である画像に割り当てられ、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像は、出力順序で前記種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない。ここでは、レイヤ識別子は、最下レイヤ識別情報に設定される。
したがって、本発明の実施形態の第2の態様によれば、動画ストリームの画像を符号化する符号器が提供される。前記符号器は、自己完結型であり、さらに一種のランダムアクセスポイント画像として識別可能である画像にレイヤ識別子を割り当てるためのプロセッサを備え、ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類のランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、プロセッサは、最下レイヤ識別情報に設定されるレイヤ識別子を設定するよう構成される。
本発明の実施形態を用いる利点は、CDR画像の使用をよりクリアにするという要件をビットストリームに課すことである。実施形態はまた、予測のために利用可能な参照画像が存在するので、CDR画像に続く他の画像をイントラ予測のみを使用して符号化する必要がなくなるため、動画シーケンスを符号化するために必要なビットレートを減らすことができる。
先行技術によるH.264/AVC参照バッファ方式の簡易フローチャートである。 先行技術による2つの時間レイヤを有する符号化構造の一例である。 一実施形態による符号器によって実行される方法のフローチャートである。 一実施形態による画像の符号化表現である。 本発明の実施形態による符号器の模式図である。
図面全体を通して、同じ参照番号は、同様または対応する要素に対して使用される。
本実施形態は、一般に、動画ストリームの、本技術ではフレームとも称される画像の符号化に関し、さらに、特に、実施形態は、CRA画像とも称されるIスライスのみを含む自己完結型画像の管理に関する。CRA画像は、一種のランダムアクセスポイント画像として識別可能であり、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像は、出力順序でその種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない。
H.264/MPEG−4AVCおよびHEVCによって表されるような動画符号化は、予測または基準として参照画像を使用して、現在の画像のピクセルデータを符号化および復号化する。このことは、一般に、インター符号化と称され、画像は、そのような参照画像を基準として符号化および復号化される。それにより、符号化画像を復号化することを可能にするために、復号器は、どの参照画像を現在の符号化画像に対して使用するかを認識する必要があり、これらの参照画像にアクセスする必要がある。
動画符号化および復号化は、スケーラブルまたはレイヤ状に行うことができる。例えば、時間スケーラビリティは、サブシーケンスの定義、SVCにおけるtemporal_idの使用、および「存在しない」フレームの挿入を通じてH.264/MPEG−4AVCおよびスケーラブル映像符号化(SVC:Scalable Video Coding)でサポートされる。しかしながら、時間スケーラビリティをサポートするために、より高い時間レイヤ内の画像は、メモリ管理制御操作(MMCO)を使用する場合に制限される。符号器は、1つの時間レイヤ内のMMCOが、時間レイヤが欠落し、「存在しない」画像が挿入され、スライディングウィンドウ処理が適用された場合に比較されるさまざまなより下の時間レイヤの画像に影響しないことを確実にする役割を担う。
このことは、符号化構造の選択および参照画像の使用時に符号器に制限を課す。例えば、図2の例を考える。参照画像バッファ内の参照フレームの最大数(max_num_ref_frames)は、各画像がインター予測のために2つの参照画像のみを使用するにもかかわらず、3であるとする。これは、各画像が、次の画像によるインター予測のために使用される他の時間レイヤから1つの余分な画像を保持しなければならないからである。
画像POC=4を復号化する場合に利用可能な画像POC=0および画像POC=2を有するために、画像POC=3は、利用不可能なものとしてコマンドマーキング画像1をマーキングする明確な参照画像を有する必要があるc。
しかしながら、時間レイヤ1が、(例えば、ネットワークノードによって)除去された場合、すべての奇数番号のframe_numにギャップが生じる。「存在しない」画像がこれらの画像に対して作られ、スライディングウィンドウ処理が適用されるであろう。それにより、利用不可能なものとして画像POC=0をマーキングする「存在しない」画像POC=3を有することになる。したがって、画像POC=4を復号化する場合、予測のために利用することができない。符号器は、この2つの場合に対して復号化処理を同じにすることができないため、すべての画像が復号化される場合、および最下レイヤのみが復号化される場合、図2の符号化構造例は、先行技術による時間スケーラビリティに対して使用することができない。
複数のレイヤにグループ化された画像を有するスケーラブル動画ストリームの場合では、画像識別子および時間レイヤ情報により、参照画像が属する複数のレイヤの1レイヤを識別することが提供される。バッファ記述情報とも称される参照画像セットは、その場合、参照画像の少なくとも1つの画像識別子および時間レイヤ情報に基づいて生成される。このことは、参照画像セットが、参照画像の少なくとも1つの画像識別子および時間レイヤ情報を定義することを意味する。
例えば、temporal_idなどの時間レイヤ情報は、参照画像セットを含むバッファ記述内の各画像に対して含まれ、temporal_idの通知を行うために上限(log2(max_temporal_layers_minus1))ビットを使用して通知される。時間スケーラビリティは、本実施形態を適用可能なマルチレイヤ動画の単なる一例である。他の種類にはマルチビュー動画があり、各画像が画像識別子およびビュー識別子を有する。
さらに、上記のように、CRA画像の現在の定義は、temporal_idに対する制限または規則を含まない。
CRA画像Aが、frame_num fA、POC pAおよびtemporal_id tIdAを有する符号器で符号化される場合、符号器は復号器に対し、復号器が、frame_num fB>fAおよびPOC pB>pAである第1の画像Bを復号化する前に、A以外のすべての参照画像を「参照には不使用」としてマーキングするよう通知する。temporal_id tIdC<tIdA、frame_num fC>fAおよびPOC pC>pAを満たす第1の画像Cが復号化される場合、参照に使用可能な参照画像は存在しない。これは、Cより高いtemporal_idを有しており、さらにtIdC以下のtemporal_idを有する他のすべての画像が、Bが復号化される前に、「予測には不使用」のマーキングをされているため、Aを使用することができないためである。(この例におけるBは、Cと同じ画像であるか、または、tIdA以上のtemporal_idを有する他の画像である可能性がある)。
Cが予測のために使用可能な画像を有しないため、イントラ予測のみを使用して符号化しなければならず、したがって、非常にコストがかかる。
上記の問題は、ビットストリームに、CRA画像が最下レイヤに属さなければならないという要件を課すことによって解決される。
したがって、符号器によって実行される方法は、図3のフローチャートに描かれるように提供される。本方法では、動画ストリームの画像は符号化される。画像が、自己完結型であり、一種のランダムアクセスポイント画像(RAP)として識別可能であり、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が300で出力順序で前記種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない場合、レイヤ識別子は、画像に301で割り当てられ、ここでは、レイヤ識別子は、最下レイヤ識別情報、例えば、0に設定される。他の画像には、302で、レイヤが除去され、画像を復号化することをそれでも可能とする他の規則に従って、レイヤ識別子を割り当てることができる。これらの他の規則は、本発明の実施形態の範囲内ではない。
画像がCRA画像として符号化されたかどうかを示す情報は、図4で示すようにNALユニットヘッダで搬送することができ、レイヤ識別子情報もまた、NALユニットヘッダで搬送することができる。NALユニットヘッダは、符号器から復号器へ送信される制御情報の一種である。したがって、図4は、画像の符号化表現60の一例を示す。符号化表現60は、スライス内のピクセルブロックの符号化ピクセルデータを表す動画ペイロードデータを備える。符号化表現60はまた、制御情報を搬送するスライスヘッダ65を備える。スライスヘッダ65は、動画ペイロード、およびネットワーク抽出レイヤ(NAL:Network Abstraction Layer)ヘッダ64と共に符号器から出力される要素であるNALユニットを形成する。これに対し、リアルタイムトランスポートプロトコル(RTP:Real−time Transport Protocol)ヘッダ63、ユーザデータグラムプロトコル(UDP:User Datagram Protocol)ヘッダ62およびインターネットプロトコル(IP:Internet Protocol)ヘッダ61といったNALユニット追加ヘッダを、符号器から復号器に送信することができるデータパケットを形成するために追加することができる。
Iスライスのみを含む自己完結型画像であるCRA画像は、nal_unit_type=4であるCRA画像のスライスのNALユニットを符号化することによってCRA画像として識別することができる。したがって、復号化順序および出力順序の両方でCRA画像に続くすべての符号化画像は、復号化順序または出力順序のいずれかでCRA画像に先行するどんな画像に基づくインター予測も使用するべきではなく、復号化順序でCRA画像に先行するどんな画像も、出力順序でCRA画像に先行する。
CRAアクセスユニットは、符号化画像がCRA画像であるアクセスユニットとして定義することができる。(アクセスユニットは、画像を含み、さらに、SEIまたはパラメータセットNALユニットなどの非画像NALユニットを含むこともできる)。したがって、CRA画像は、すべてのブロックに対してイントラ予測を使用する符号化画像であり、ランダムアクセスポイントとして識別可能であり、各スライスがnal_unit_type=4を有することができる。復号化順序および出力順序の両方でCRA画像に続くすべての符号化画像は、復号化順序または出力順序のいずれかでCRA画像に先行するどんな画像に基づくインター予測も使用するべきではなく、復号化順序でCRA画像に先行するどんな画像も、出力順序でCRA画像に先行する。
以下の表は、NALユニット種類コードおよびNALユニット種類クラスを示す。
Figure 2014526180
Figure 2014526180
Figure 2014526180
これに応じて、nal_unit_type=4で示された画像は、本明細書において、CRA画像と称される。特定の画像のスライスを含むNALユニットに対して、nal_unit_typeの値が4である場合、その特定の画像のVCL NALユニットのすべては、nal_unit_type=4を有する。
一実施形態によれば、temporal_idまたはlayer_idと称されるパラメータは、NALユニットのレイヤ識別情報を示し、temporal_idは、NALユニットに対する時間識別子を特定する。temporal_idの値は、アクセスユニットの全NALユニットに対して同じにしなければならない。アクセスユニットが、nal_unit_type=4を有する任意のNALユニットを含む場合、アクセスユニットの全NALユニットに対するtemporal_idは、0に等しくしなければならない。さらに、IDR画像として識別される5のnal_unit_typeを有する任意のNALユニットを含むアクセスユニットは、temporal_id=0であるべきである。しかしながら、nal_unit_type=5を有するアクセスユニットは、復号器を「リセットする」IDR画像を含む。IDR画像、および復号化順序でそれに続くすべては、復号化順序でIDR画像に先行するデータ無しに正確に復号化することができる(すなわち、参照のための画像を使用しない)。したがって、IDR画像とCRA画像との差は、異なるNALユニット種類であり、参照画像バッファが空であることをIDR画像が受け取り、したがって、IDR画像には参照画像セットがない場合、IDR画像はPOC=0である。さらに、復号化順序および出力順序でIDR画像に続く画像は、復号化順序でIDR画像に続く参照画像である可能性があるが、出力順序で進む。それは、CRA画像に対しては不可能である。上記の表によれば、nal_unit_typeが3に等しい場合、時間レイヤアクセス(TLA:Temporal Layer Access)画像であることを意味し、temporal_idが0であってはならない。
前述のように、符号器は、CRA画像として符号化されたすべての画像が、layer_id=0とされ、ビットストリーム要件を確実に満たすように構成される。
「予測には不使用」という画像のマーキングは、復号化順序および表示順序でCRA画像に続く第1の画像を復号化する前には実行されない可能性がある。代わりに、「予測には不使用」という画像のマーキングは、復号化順序および表示順序でCRA画像に続く第1の画像を復号化した後に復号器によって実行され、復号化順序および表示順序でCRA画像に続く第1の画像は、参照のためにCRA画像のみを使用するという追加の規則がある。このマーキングは、符号器および復号器の両方によって実行され、これは、符号器が内部復号器を有し、符号器が送信したビットストリームについて復号器が行ったことを追跡するためであることに留意されたい。
CRA画像に対して現在使用されているNALユニット種類の解釈は変更することができ、その結果、そのNALのlayer_idがゼロになった場合にCRA画像のみを示すことにも留意されたい。CRA画像に対して現在使用されているNALユニット種類の解釈が変更され、その結果、layer_idがゼロになった場合にCRA画像のみを示した場合、CRAを定義するために現在使用されているNALユニット種類は、layer_idがゼロより大きい場合に、レイヤ交換点を示すことができる。この場合、復号器は、これらの構文要素の両方をパースし、画像がCRA画像であるかどうかを推定しなければならず、さらに復号器は、これらの要素両方をパースし、画像がレイヤ交換点を構成するかどうかを推定しなければならない。layer_idがCRA画像に対して0ではないことを復号器が検出した場合、復号器は、ビットストリームが有効ではないことを検出する。その場合、復号器は、ビットストリームが無効であることを隠す、または報告することができる。あるいは、復号器は、その画像を非CRA画像として扱い、復号化を続けることができる。
代替として、CRA指示、すなわち、画像がCRA画像であるとNALユニット種類が示すことは、復号器について規範的効果を有しない。代わりに、CRA指示は符号器によって使用されて、復号器またはネットワークノードに対し、復号化順序および表示順序でCRA画像に続く画像は、符号化順序または表示順序でCRA画像に先行する基準のための参照画像を使用しないことを示す。
さらに、符号器および復号器は、HEVC符号器および各HEVC復号器とすることができるが、本実施形態は、HEVCコーデックおよび/またはNALユニットに限定されないことに留意されたい。通知は、NALユニットヘッダを介して行われることに限定されないが、スライスヘッダ、スライスパラメータセット、画像ヘッダ、または画像パラメータセットを含むがこれらに限定されない、任意の適切なデータ構造で行うことができる。
本発明の代替実施形態において、動画コーデックは、時間レイヤ動画コーデックであり、上記layer_idは、temporal_idによって置き換えられ、レイヤ交換点は時間レイヤ交換点である。
本発明のさらなる代替実施形態では、動画コーデックは、マルチビューコーデックであり、view_idは、上記において、layer_idと置き換わる。それに対応して、レイヤは、ビューによって置き換えられる。
同様に、本実施形態は、任意のレイヤ化された動画符号化スキーム、例えば、これらに限定されないが、空間スケーラビリティ、SNRスケーラビリティ、ビット深度スケーラビリティ、およびクロマフォーマットスケーラビリティに適用することができる。ここでの画像は、バッファ記述における構文要素を通じてレイヤと関連づけられ、レイヤは並べられ、レイヤがより高いレイヤに属する画像を認識しないという特性を有する。レイヤの組合せは、上記のlayer_idが、すべてのレイヤ化されたID(例えば、temporal_idおよびview_id)が画像に対するレイヤの種類に対して最下レイヤを示す場合に、ゼロに設定された変数によって置き換えられることを意味する。
図5は、例えば、上記の機能を実行するよう構成されたビデオカメラの符号器500を示す。
図5の符号器500は、符号化対象のビットストリーム506を受け取るよう構成された入力部501を備える。符号器のプロセッサ502は、300で、自己完結型であり、さらに一種のランダムアクセスポイント画像(例えば、NALユニット種類=4)として識別可能である画像にレイヤ識別子を割り当てるよう構成され、ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類のランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、301で、レイヤ識別子が画像に割り当てられ、プロセッサは、最下レイヤ識別情報にレイヤ識別子を設定するよう構成される。さらに、符号器500は、符号化ビットストリーム505を出力するよう構成された出力部503を備える。符号器はまた、参照画像セットの情報などの符号化処理で使用される情報を格納するメモリ504を備えることもできる。さらに、例えば、ビデオカメラ内の復号器はまた、符号器と関連づけることができ、符号器は、符号器が送信したビットストリームについて復号器が行ったことを追跡することができる。
一実施形態によれば、プロセッサは、すべてのブロックに対してイントラ予測で符号化された、すなわち、自己完結型、およびCRA画像としてランダムアクセスポイントとして識別可能な画像を符号化するよう構成することができる。
符号器は、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むNALユニットと、画像がCRA画像であるかどうかを示す情報とを出力し、NALユニットヘッダにレイヤ識別子挿入するよう構成することができ、
一実施形態によれば、符号器は、FIEVC符号器であり、レイヤ識別子は、時間識別子である。代替実施形態によれば、符号器は、マルチビュー符号器であり、レイヤ識別子は、ビュー識別子である。
図6の復号器は、復号対象の符号化ビットストリームを受け取るよう構成された入力部を備える。復号器のプロセッサは、復号化機能を実行するよう構成され、出力部は、表示対象の復号化ビットストリームを出力する。復号器はまた、復号化プロセスで使用される情報、例えば、参照画像を格納するメモリも備えることができる。

Claims (14)

  1. 動画ストリームの画像を符号化する方法であって、
    自己完結型であり、かつ一種のランダムアクセスポイント画像として識別可能である画像にレイヤ識別子を割り当てるステップ(301)を含み、前記ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像が、前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、ここで、前記レイヤ識別子は最下レイヤ識別情報に設定される、方法。
  2. 自己完結型であり、かつ一種のランダムアクセスポイント画像として識別可能である前記画像が、クリーンランダムアクセス画像、CRA画像として符号化され、前記ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像が、前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができない、請求項1に記載の方法。
  3. 前記符号器は、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むネットワーク抽出レイヤ(NAL)ユニットを出力し、前記画像が、自己完結型でかつ一種のランダムアクセスポイント画像として識別可能であって、前記ランダムアクセスポイント画像に対し、復号化順序ならびに出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができないかどうかを示す情報と、レイヤ識別子情報とが、前記NALユニットヘッダ中に含まれて送信される、請求項1または2に記載の方法。
  4. 前記符号器がHEVC符号器である、請求項1から3のいずれか一項に記載の方法。
  5. 前記レイヤ識別子が時間識別子である、請求項1から4のいずれか一項に記載の方法。
  6. 前記符号器がマルチビュー符号器である、請求項1から3のいずれか一項に記載の方法。
  7. 前記レイヤ識別子がビュー識別子である、請求項6に記載の方法。
  8. 動画ストリームの画像を符号化するための符号器(500)であって、レイヤ識別子を、自己完結型であり、かつ一種のランダムアクセスポイント画像として識別可能である画像に割り当てるプロセッサ(501)を備え、前記ランダムアクセスポイント画像に対し、復号化順序ならびに出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像は、出力順序で前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、前記プロセッサ(501)は前記レイヤ識別子を最下レイヤ識別情報に設定するよう構成される、符号器。
  9. 自己完結型で、かつ一種のランダムアクセスポイント画像として識別可能である前記画像が、クリーンランダムアクセス画像、CRA画像として符号化され、前記ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像が、前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができない、請求項8に記載の符号器。
  10. 前記符号器は、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むネットワーク抽出レイヤ(NAL)ユニットを出力するように構成され、前記画像が自己完結型で、かつ一種のランダムアクセスポイント画像として識別可能であって、前記ランダムアクセスポイント画像に対し、復号化順序ならびに出力順序の両方で前記種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類の前記ランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができないかどうかを示す情報と、レイヤ識別子情報とが、前記NALユニットヘッダ中に含まれて送信される、請求項8または9に記載の符号器。
  11. 前記符号器がHEVC符号器である、請求項8から10のいずれか一項に記載の符号器。
  12. 前記レイヤ識別子が時間識別子である、請求項8から11のいずれか一項に記載の符号器。
  13. 前記符号器がマルチビュー符号器である、請求項8から10のいずれか一項に記載の符号器。
  14. 前記レイヤ識別子がビュー識別子である、請求項13に記載の符号器。
JP2014520163A 2011-07-15 2012-06-26 クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 Active JP5993453B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161508179P 2011-07-15 2011-07-15
US61/508,179 2011-07-15
PCT/SE2012/050712 WO2013012372A1 (en) 2011-07-15 2012-06-26 An encoder and method thereof for assigning a lowest layer identity to clean random access pictures

Publications (2)

Publication Number Publication Date
JP2014526180A true JP2014526180A (ja) 2014-10-02
JP5993453B2 JP5993453B2 (ja) 2016-09-14

Family

ID=46548792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014520163A Active JP5993453B2 (ja) 2011-07-15 2012-06-26 クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法

Country Status (6)

Country Link
US (1) US20130064284A1 (ja)
EP (1) EP2732626A1 (ja)
JP (1) JP5993453B2 (ja)
KR (1) KR20140057533A (ja)
WO (1) WO2013012372A1 (ja)
ZA (1) ZA201400252B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014524196A (ja) * 2011-07-02 2014-09-18 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199396A (ja) * 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
JP5341952B2 (ja) * 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
US9131245B2 (en) 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
JP6078927B2 (ja) * 2012-01-10 2017-02-15 サン パテント トラスト 動画像符号化方法、動画像符号化装置、動画像復号方法、及び、動画像復号装置
US10491913B2 (en) * 2012-04-24 2019-11-26 Telefonaktiebolaget L M Ericsson (Publ) Identifying a parameter set for decoding a multi-layer video representation
US9253487B2 (en) 2012-05-31 2016-02-02 Qualcomm Incorporated Reference index for enhancement layer in scalable video coding
EP4436173A2 (en) * 2012-06-25 2024-09-25 Huawei Technologies Co., Ltd. Method for signaling a gradual temporal layer access picture
US9225978B2 (en) 2012-06-28 2015-12-29 Qualcomm Incorporated Streaming adaption based on clean random access (CRA) pictures
WO2014010300A1 (ja) * 2012-07-10 2014-01-16 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
US9374583B2 (en) 2012-09-20 2016-06-21 Qualcomm Incorporated Video coding with improved random access point picture behaviors
KR20140122202A (ko) * 2013-04-05 2014-10-17 삼성전자주식회사 계층 식별자 확장에 따른 비디오 스트림 부호화 방법 및 그 장치, 계층 식별자 확장에 따른 따른 비디오 스트림 복호화 방법 및 그 장치
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
SG10201913539SA (en) 2013-04-07 2020-02-27 Dolby Int Ab Signaling change in output layer sets
US9756335B2 (en) * 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
US9807406B2 (en) * 2014-03-17 2017-10-31 Qualcomm Incorporated Picture flushing and decoded picture buffer parameter inference for multi-layer bitstreams
US11395006B2 (en) * 2019-03-06 2022-07-19 Tencent America LLC Network abstraction layer unit header
US11153583B2 (en) 2019-06-07 2021-10-19 Qualcomm Incorporated Spatial scalability support in video encoding and decoding
JP2022549011A (ja) * 2019-09-24 2022-11-22 華為技術有限公司 ビデオコーディングにおけるピクチャーヘッダーのシグナリング

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267287A1 (en) * 2007-04-24 2008-10-30 Nokia Corporation System and method for implementing fast tune-in with intra-coded redundant pictures
JP2014511652A (ja) * 2011-03-08 2014-05-15 クゥアルコム・インコーポレイテッド ビデオコーデックにおけるバッファ管理

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9131033B2 (en) * 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9484952B2 (en) * 2011-11-03 2016-11-01 Qualcomm Incorporated Context state and probability initialization for context adaptive entropy coding
US8867852B2 (en) * 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
WO2013158020A1 (en) * 2012-04-16 2013-10-24 Telefonaktiebolaget L M Ericsson (Publ) Arrangements and methods thereof for processing video

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267287A1 (en) * 2007-04-24 2008-10-30 Nokia Corporation System and method for implementing fast tune-in with intra-coded redundant pictures
JP2014511652A (ja) * 2011-03-08 2014-05-15 クゥアルコム・インコーポレイテッド ビデオコーデックにおけるバッファ管理

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN5014008657; Heiko SCHWARZ,et.al.: 'Defect report for ITU-T Rec.H.264|ISO/IEC 14496-10(revision 3)' 31ST JVT MEETING (DOCUMENT: JVT-AE011R3) JVT-AE011r3, 20090705, P.1-P.22, JVT *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014524196A (ja) * 2011-07-02 2014-09-18 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
US9788003B2 (en) 2011-07-02 2017-10-10 Samsung Electronics Co., Ltd. Method and apparatus for multiplexing and demultiplexing video data to identify reproducing state of video data

Also Published As

Publication number Publication date
ZA201400252B (en) 2015-05-27
KR20140057533A (ko) 2014-05-13
US20130064284A1 (en) 2013-03-14
EP2732626A1 (en) 2014-05-21
WO2013012372A1 (en) 2013-01-24
JP5993453B2 (ja) 2016-09-14

Similar Documents

Publication Publication Date Title
JP5993453B2 (ja) クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法
US10841619B2 (en) Method for decoding a video bitstream
Sjoberg et al. Overview of HEVC high-level syntax and reference picture management
TWI652940B (zh) 於視訊寫碼中用於基於子解碼圖像緩衝器(sub-dpb)之解碼圖像緩衝器操作之傳信
EP3022929B1 (en) Decoded picture buffer operations for video coding
US10158873B2 (en) Depth component removal for multiview video coding (MVC) compatible three-dimensional video coding (3DVC)
US8165216B2 (en) System and method for implementing efficient decoded buffer management in multi-view video coding
JP6594967B2 (ja) 階層化されたhevcビットストリームの搬送のための動作点
US8929462B2 (en) System and method for implementing low-complexity multi-view video coding
KR101724222B1 (ko) 멀티-레이어 비디오 코딩을 위한 다중-해상도 디코딩된 픽처 버퍼 관리
JP2017079480A (ja) Hevcおよび拡張のためのビデオパラメータセット
JP2016529781A (ja) 高効率ビデオコーディング拡張におけるターゲット出力レイヤの選択
WO2008084443A1 (en) System and method for implementing improved decoded picture buffer management for scalable video coding and multiview video coding
EP4138401A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
Sjöberg et al. HEVC high-level syntax
US20240357106A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
EP4300984A1 (en) A method, an apparatus and a computer program product for mapping media bitstream partitions in real-time streaming
EP4388749A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
WO2015008266A1 (en) Apparatus, method, and computer product for inter-layer reference picture list construction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160819

R150 Certificate of patent or registration of utility model

Ref document number: 5993453

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250