JP2017225159A - ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング - Google Patents

ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング Download PDF

Info

Publication number
JP2017225159A
JP2017225159A JP2017152454A JP2017152454A JP2017225159A JP 2017225159 A JP2017225159 A JP 2017225159A JP 2017152454 A JP2017152454 A JP 2017152454A JP 2017152454 A JP2017152454 A JP 2017152454A JP 2017225159 A JP2017225159 A JP 2017225159A
Authority
JP
Japan
Prior art keywords
isp
picture
gdr
video
enabled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017152454A
Other languages
English (en)
Other versions
JP6495390B2 (ja
Inventor
イェ−クイ・ワン
Ye-Kui Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017225159A publication Critical patent/JP2017225159A/ja
Application granted granted Critical
Publication of JP6495390B2 publication Critical patent/JP6495390B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ピクチャの漸次デコーダリフレッシュ(GDR)が有効化されているかどうかを示す情報をコーディングして利用するシステム、方法、および装置を提供する。【解決手段】GDRが有効化されているとき、コーディングプロセス、システム、方法および装置は、ピクチャの1つまたは複数のスライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングする。また、コーディングプロセス中に、ピクチャのスライスについてのISPのうちの1つについてのISP識別(ISP ID)に対応するビデオデータを復号する。ISPを使って、ROIに対応するビデオデータを復号する。【選択図】図6

Description

[0001] 本出願は、その内容全体が参照により本明細書に組み込まれる、2012年9月28日に出願された米国仮出願第61/707,729号の利益を主張する。
[0002] 本開示は、ビデオコーディングに関し、より詳細には、ビデオコーディングにおける関心領域(regions of interest)および漸次復号リフレッシュ(gradual decoding refresh)のシグナリングに関する。
[0003] デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part 10,Advanced Video Coding(AVC)、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法のような、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を含む。ブロックベースのビデオコーディングの場合、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)が、ツリーブロック、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間的予測、または他の参照ピクチャの中の参照サンプルに対する時間的予測を使用することができる。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0005] 空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと、予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数をもたらすことができ、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初に2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査することができ、なお一層の圧縮を達成するためにエントロピーコーディングを適用することができる。
[0006] 概して、本開示は、ビデオコーディング技法について記載する。具体的には、それらの技法は、関心領域(ROI)、漸次復号リフレッシュ(GDR)動作、または両方に関する情報をシグナリングし、処理することを含む符号化および復号プロセスに関する。技法は、様々なビデオコーディングプロセスにおいて使うことができ、現在開発中である、上で言及した高効率ビデオコーディング(HEVC)規格に準拠するとともに、他のビデオコーディング規格を用いるコーディングプロセスにおいて特に有用であり得る。
[0007] 一例では、開示は、ビデオデータをコーディングする方法について記載し、この方法は、独立サブピクチャ(independent sub-pictures)(ISP)が有効化されているかどうかを示す情報をコーディングすることと、独立サブピクチャが有効化されているとき、ISPのうちの1つについてのISP識別(ISP ID)を示す情報をコーディングすることと、関心領域(ROI)に対応するビデオデータを、ISPのうちの1つとしてコーディングすることとを備える。
[0008] 別の例では、本開示は、ビデオデータをコーディングする方法について記載し、この方法は、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングすることと、GDRが有効化されているとき、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることとを備える。フォアグラウンド領域はリフレッシュ領域と呼ばれる場合もあり、バックグラウンド領域(フォアグラウンド領域ではない領域)は、非リフレッシュ領域と呼ばれる場合もある。
[0009] 本開示は、方法を実施するように構成されたビデオエンコーダを含む、方法を実施するためのデバイス、方法を実施するように構成されたビデオデコーダ、方法を実施するための手段を有するデバイス、ならびに1つまたは複数のプロセッサに方法を実施させるための命令を備えるコンピュータ可読媒体についても記載する。
[0010] 1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。
[0011] 本開示に記載される、関心領域(ROI)、漸次復号リフレッシュ(GDR)、または両方をシグナリングするための技法を使用することができる例示的なビデオ符号化および復号システムを示すブロック図。 [0012] ROIをシグナリングするための技法を使用することができるビデオエンコーダの例を示すブロック図。本開示に記載されるGDR、または両方。 [0013] 本開示に記載される、ROI、GDR、または両方をシグナリングするための技法を使用することができるビデオデコーダの例を示すブロック図。 [0014] ブロック図であって、バックグラウンドおよびフォアグラウンド領域を示すための、本開示に記載される技法を使用する例示的な一連の補足強調情報(SEI)メッセージ。 [0015] GDRに関連し、本開示の1つまたは複数の態様を実施する例示的な方法を示す流れ図。 [0016] ROIに関連し、本開示の1つまたは複数の態様を実施する例示的な方法を示す流れ図。
[0017] 本開示は、ビデオコーディングプロセスにおける、関心領域(ROI)、漸次復号リフレッシュ(GDR)、または両方の操作に関する情報のシグナリングおよび処理のための様々な技法について記載する。したがって、いくつかの例示的実装形態は、GDRに関連した情報をシグナリングすることができる。他の例示的実装形態は、ROIに関連した情報をシグナリングすることができる。さらに別の例では、本明細書に記載されるように、いくつかの例示的実装形態は、GDRとROIの両方に関連した情報をシグナリングすることができる。これらの技法は、いくつかの態様では、ビデオエンコーダによって実施することができる。他の態様では、これらの技法は、ビデオデコーダによって実施することができる。さらに、そのような方法は、たとえばトランスコーダ、メディアアウェアネットワーク要素(MANE)など、他のデバイスにおいて実施することができる。本開示では、技法は、説明のために、ビデオエンコーダおよびデコーダを参照して記載される。
[0018] 本開示によると、一例では、コーディングプロセス中に、システム、方法、および装置が、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングし、GDRが有効化されているとき、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることができる。フォアグラウンド領域は、リフレッシュ領域とも呼ばれ得る。別の例では、コーディングプロセス中に、システム、方法、および装置が、1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングすることができる。
[0019] 別の例では、独立サブピクチャが有効化されているとき、これらのシステム、方法、および装置は、ISPのうちの1つについてのISP IDを示す情報をコーディングし、ROIに対応するビデオデータを、ISPのうちの1つとしてコーディングすることができる。したがって、エンコーダは、ROIについてのISP IDを指定し、ROI情報をビットストリームに含めることができ、ここでROI情報は、どのISP IDがROIに対応するかを示し得る。さらに、各ROIはISPとしてコーディングされ得るので、ROIに対応する特定のISPが、所望される唯一の領域であるとき、各ピクチャ中のISPに属さないスライスは破棄され得る。
[0020] いくつかの例示的システム、方法、および装置は、これらの両方を実施することができる。
[0021] ビデオコーディング規格には、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2
Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、および、そのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)の拡張を含む(ISO/IEC MPEG−4 AVCとしても知られている)ITU−T H.264が含まれる。
[0022] さらに、高効率ビデオコーディング(HEVC)規格は、ITU−T Video Coding Experts Group(VCEG)およびISO/IEC Motion Picture Experts Group(MPEG)のJoint Collaboration Team on Video Coding(JCT−VC)によって開発中である。「HEVC Working Draft 8」または「WD8」と呼ばれるHEVC規格の最近のドラフトは、文書JCTVC−J1003v7、Brossら、「High efficiency video coding(HEVC) text specification draft 8」、ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11のJoint Collaborative Team on Video Coding(JCT−VC)、第10回会合:スウェーデン ストックホルム、2012年7月11〜20日に記載されており、この文書は、2013年5月1日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC−J1003−v8.zipのリンクからダウンロード可能である。
[0023] 「HEVC Working Draft 9」または「WD9」と呼ばれるHEVC規格の別のドラフトは、文書JCTVC−K1003v13、Brossら、「High efficiency video coding(HEVC) text specification draft 9」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11のJoint Collaborative Team on Video Coding(JCT−VC)、第11回会合:上海、中国、2012年10月10日〜19日に記載されており、2012年12月27日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC−K1003−v13.zipのリンクからダウンロード可能であり、その内容全体は参照により本明細書に組み込まれる。HEVC WD8およびWD9の内容全体は、参照によって本明細書に組み込まれている。
[0024] ビデオコーディングプロセスにおいて、補足強調情報(SEI)メッセージは、出力ピクチャのサンプル値の正確な復号には要求されないが、ピクチャ出力タイミングおよび表示、ならびに損失検出および隠蔽など、他の様々な目的に使うことができるメタデータを、エンコーダがビットストリームに含めることを可能にする。エンコーダは、任意の数のSEIネットワークアブストラクションレイヤ(NAL)ユニットをアクセスユニットに含めてよく、各SEI NALユニットは、1つまたは複数のSEIメッセージを含むことができる。
[0025] HEVC規格は、たとえば、HEVC WD8において提示されているように、いくつかのSEIメッセージについてのシンタックスとセマンティクスとを含むが、SEIメッセージは標準的復号プロセスに影響しないので、SEIメッセージの扱いについては指定されていない。HEVC規格にSEIメッセージが載っている1つの理由は、補足データが、HEVCを使う異なるシステムにおいて同一に解釈されることを可能にするためである。HEVCを使う仕様およびシステムは、エンコーダに、いくつかのSEIメッセージを生成するよう要求する場合もあり、特定のタイプの受信SEIメッセージの特殊な扱いを定義する場合もある。
[0026] 以下のテーブル1は、HEVC WD8において指定されるSEIメッセージを列挙し、それらの目的を簡潔に記述している。
[0027] SEIメッセージの中で、サブピクチャピクチャSEIメッセージは、復号順序で、SEIメッセージを含むアクセスユニット中の最初のVCL NALユニットに後続し得るが、いくつかの例では、復号順序で、アクセスユニット中の最後のVCL NALユニットに後続してはならない。他のSEIメッセージはすべて、SEIメッセージを含むSEI NALユニットについて、nuh_reserved_zero_6bitsが0に等しいとき、アクセスユニット中の最初のVCL NALユニットに先行してよい。
[0028] 一例では、ピクチャのサブセットであるROIは、ROIのみが所望通りに送信され、復号され、表示され得るように、持続時間を通して独立してコーディングされてよい。
[0029] 別の例では、非イントラピクチャからのランダムアクセスが可能であり、数ピクチャ後に、ピクチャ領域全体が、ある位置において、およびその後に、表示/出力順序で正しく復号され得るように、ビデオシーケンスが符号化されてもよい。この挙動は、漸次復号リフレッシュ(GDR)と呼ばれる。GDRは、ランダムアクセス可能性とエラー耐性向上の両方を提供する。
[0030] HEVC WD8では、HEVCにおける関心領域ROIのシグナリングのための機構がなかった。HEVCにおける回復点SEIメッセージは、GDR開始点と、対応する回復点とをシグナリングするのに使うことができる。ただし、GDR開始点においてランダムアクセスが実施された場合、どのNALユニットが必要とされるかをシグナリングする方法はない。いくつかの例では、本開示は、ROIのシグナリング向上のための方法を提供する。他の例では、本開示は、GDRのシグナリング向上のための方法を提供する。本開示による他の例は、ROIのシグナリング向上と、GDRのシグナリング向上の両方のための方法を提供し得る。
[0031] 1つの例示的方法では、フラグが、ISPが有効化されているかどうかを示すために、たとえば、シーケンスパラメータセット(SPS)中でシグナリングされる。代替として、フラグは、他の場所、たとえば、ビデオパラメータセット(VPS)またはピクチャパラメータセット(PPS)中でシグナリングされてよい。フラグは、符号化ビデオビットストリーム中でビデオエンコーダによってシグナリングされ得る。次に、デコーダが、このようなフラグを符号化ビデオビットストリーム中で受信し、ROI機能をサポートするのにフラグを使うことができる。
[0032] 有効化されているとき、各ISPのISP識別(ISP ID)は、スライスヘッダ中またはSEIメッセージ中のいずれかにおいてシグナリングされる。このシグナリングは、ISPへのスライスの関連付けも可能にする。コード化ビデオシーケンス中のISPの数ならびにISPの位置およびサイズを運ぶためのシーケンスレベルSEIメッセージが定義される。これらの情報項目は、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセット中でもシグナリングすることができる。各ROIは、ISPとしてコーディングされ得る。ROIに対応する特定のISPが、所望される唯一の領域であるとき、各ピクチャ中のISPに属さないスライスは、たとえば、ビデオデコーダによって破棄されてよい。
[0033] 別の方法では、フラグが、GDRが有効化されているかどうかを示すために、たとえば、シーケンスパラメータセット中でシグナリングされる。代替として、フラグは、他の場所、たとえば、ビデオパラメータセットまたはピクチャパラメータセット中でシグナリングされてよい。フラグは、符号化ビデオビットストリーム中でビデオエンコーダによってシグナリングされ得る。次に、デコーダが、このようなフラグを符号化ビデオビットストリーム中で受信し、GDR機能をサポートするのにフラグを使うことができる。
[0034] 有効化されているとき、スライスがピクチャ中のフォアグラウンド領域に属すかどうかが、スライスヘッダ中またはSEIメッセージ中のいずれかでシグナリングされる。回復点SEIメッセージを含む非RAPアクセスユニットであるGDR開始点からランダムアクセスするとき、フォアグラウンド領域に属さない、開始点から回復点まで(ただし、回復点は含まない)のすべてのピクチャ中のスライスは破棄され得る。
[0035] 上述した方法は、汎用であると見なすことができ、様々な異なるタイプのビデオエンコーダデコーダ(コーデック)に適用され得る。方法のうちのいくつかの、詳細な実装形態の例が以下に挙げられる。
[0036] スライスヘッダ中での、独立サブピクチャIDフォアグラウンドフラグのシグナリングのための方法についての例示的実装形態が、ここで記載される。以下のテーブル2は、この方法の実装形態向けのシーケンスパラメータセットローバイトシーケンスペイロード(RBSP)シンタックスの例を挙げる。
[0037] 表2中のシンタックス要素のセマンティクスは、次のようになる。1に等しいindependent_sub_picture_enabled_flagシンタックス要素は、コード化ビデオシーケンス中のコード化ピクチャのスライスヘッダにおけるisp_idシンタックス要素(セマンティクスについては、後で説明する)の存在を指定する。0に等しいindependent_sub_picture_enabled_flagシンタックス要素は、コード化ビデオシーケンス中のコード化ピクチャのスライスヘッダ中にisp_idシンタックス要素がないことを指定する。
[0038] 1に等しいgradual_decoding_refresh_enabled_flagシンタックス要素は、コード化ビデオシーケンス中のコード化ピクチャのスライスヘッダにおけるgdr_foreground_flagシンタックス要素(セマンティクスについては、後で説明する)の存在を指定する。0に等しいgradual_decoding_refresh_enabled_flagは、コード化ビデオシーケンス中のコード化ピクチャのスライスヘッダ中にgdr_foreground_flagシンタックス要素がないことを指定する。
[0039] 以下のテーブル3は、この方法の実装形態向けのスライスヘッダシンタックス要素の例を挙げる。
[0040] 表3中のシンタックス要素のセマンティクスは、次のようになる。isp_idシンタックス要素は、スライスが属す独立サブピクチャのアイデンティファ(identifer)を指定する。isp_idの値は、両端値を含む0〜255の範囲内であり得る。
[0041] ある例では、特定の値ispIDによって識別される独立サブピクチャ(ISP)は、同じピクチャ中に、ispIDに等しいisp_idをもつすべてのスライスを含むとともに、それらのみを含むものとする。ISPによって表される領域は、矩形領域であり得る。また、いくつかの例では、ピクチャ中の異なるISPによってリペゼント(repesented)される領域は、オーバーラップしないものとする。ある例では、ISPは、同じピクチャ中のISP中にない他のスライスから独立して復号可能であるとし、すなわち、スライスがISPに属し、1に等しいdependent_slice_flagを有するとき、0に等しいdependent_slice_flagを有する、復号順序で前のスライスは、同じISPに属し得る。したがって、ISPは、同じピクチャ中のISP中にないどのスライスにも依存せずに、すなわち、参照せずに、復号可能である。
[0042] コード化ビデオシーケンス内で、independent_sub_picture_enabled_flagが1に等しいとき、コード化ピクチャすべてからの、特定のisp_idによって識別される独立サブピクチャは、まとめてISPシーケンスと呼ばれる。ISPシーケンスは、ISPシーケンスに属さないコード化スライスから、独立して復号可能であってよく、すなわち、ISP中のスライスの復号において、ISPシーケンスに属さないスライスからのどのサンプルも、インター予測プロセスにおいて使われなくてよい。したがって、ISPシーケンスは、ISPシーケンス中にないどのコード化スライスにも依存せずに、すなわち、参照せずに、復号可能である。
[0043] 1に等しいgdr_foreground_flagシンタックス要素は、現在のピクチャ中のフォーグラウンド(forground)領域にスライスが属すことを示す。0に等しいgdr_foreground_flagシンタックス要素は、現在のピクチャ中のバックグラウンド領域にスライスが属すことを示す。
[0044] ピクチャ中のフォアグラウンド領域は、ピクチャ中の、1に等しいgdr_foreground_flagをもつすべてのスライスを含むとともに、それらのみを含むだけでもよく、他のスライスは、ピクチャのバックグラウンド領域に属す。フォアグラウンド領域は、同じピクチャ中のバックグラウンド領域から、独立して復号可能であってよく、すなわち、スライスがフォアグラウンド領域に属し、1に等しいdependent_slice_flagを有するとき、0に等しいdependent_slice_flagを有する、復号順序で前のスライスも、フォアグラウンド領域に属し得る。したがって、フォアグラウンド領域は、バックグラウンド領域から、独立して復号可能である。
[0045] gradual_decoding_refresh_enabled_flagが1に等しく、現在のピクチャがランダムアクセスポイント(RAP)ピクチャであるとき。現在のピクチャに関連付けられた回復点SEIメッセージの存在は、以下のすべてを示し、すなわち(a)ピクチャ中のフォアグラウンド領域は、イントラコード化コーディングブロックのみを含む、(b)関連付けられたピクチャから始まり、回復点までの、両端を含む、ピクチャセット中のフォアグラウンド領域は、復号順序で、関連付けられたピクチャに先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すコード化スライスから、独立して復号可能である、(c)復号順序で回復点に後続するピクチャ中のすべてのスライスは、復号順序で、関連付けられたピクチャに先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すスライスから、独立して復号可能であり得る。したがって、gradual_decoding_refresh_enabled_flagが1に等しく、現在のピクチャがランダムアクセスポイント(RAP)ピクチャであるとき、デコーダは、関連付けられたピクチャに復号順序で先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すコード化スライスを独立して復号することができる。デコーダは、関連付けられたピクチャに復号順序で先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すスライスも独立して復号することができる。
[0046] 独立サブピクチャシーケンス情報SEIメッセージについてのシンタックスおよびセマンティクスが、以下のテーブル4を参照してここで記載される。
[0047] 表4中のシンタックス要素のセマンティクスについて、以下で説明する。独立サブピクチャシーケンス情報SEIメッセージは、独立サブピクチャシーケンス情報SEIメッセージを含むコード化ビデオシーケンス中のISPの数、ならびにISPの位置およびサイズを提供する。
[0048] num_isps_minus1+1は、独立サブピクチャシーケンス情報SEIメッセージを含むコード化ビデオシーケンス中の各ピクチャ中のISPの数を指定する。num_isps_minus1の値は、両端値を含む0〜255の範囲内であり得る。
[0049] isp_top_left[i]およびisp_bottom_right[i]は、それぞれ、コード化ビデオシーケンス中の各ピキュチャ(picuture)中の、iに等しいisp_idをもつISPの左上および右下隅を指定する。top_left[i]およびbottom_right[i]は、ピクチャのコーディングツリーブロックラスタースキャン中のコーディングツリーブロックアドレスである。top_left[i]およびbottom_right[i]によってそれぞれ指定される左上および右下隅をもつISPは、コード化ビデオシーケンス中の内部ピクチャであってよく、他のどのISPともオーバーラップし得ない。
[0050] SEIメッセージ中での、独立サブピクチャIDフォアグラウンドフラグのシグナリングのための方法についての例示的実装形態が、ここで記載される。以下のテーブル5は、この方法の実装形態向けのシーケンスパラメータセットローバイトシーケンスペイロード(RBSP)シンタックスの例を挙げる。SEIメッセージ中の独立サブピクチャIDフォアグラウンドフラグのシグナリングのこの例についてのテーブル5は、上述したスライスヘッダ中の独立サブピクチャIDフォアグラウンドフラグのシグナリングの例における、上のテーブル2と同じである。
[0051] 表5中のシンタックス要素のセマンティクスについて、以下で説明する。1に等しいindependent_sub_picture_enabled_flagシンタックス要素は、コード化ビデオシーケンス中のISPおよびGDR情報SEIメッセージにおけるisp_idシンタックス要素の存在を指定する。0に等しいindependent_sub_picture_enabled_flagシトナクス(sytnax)要素は、コード化ビデオシーケンス中のISPおよびGDR情報SEIメッセージ中にisp_idシンタックス要素がないことを指定する。
[0052] 1に等しいgradual_decoding_refresh_enabled_flagは、デコーダに対して、コード化ビデオシーケンスにおけるgdr_foreground_flagシンタックス要素ISPおよびGDR情報SEIメッセージの存在を指定する。0に等しいgradual_decoding_refresh_enabled_flagは、デコーダに対して、コード化ビデオシーケンス中にgdr_foreground_flagシンタックス要素ISPおよびGDR情報SEIメッセージがないことを指定する。
[0053] SEIメッセージ中の独立サブピクチャIDフォアグラウンドフラグのシグナリングの方法についての独立サブピクチャシーケンス情報SEIメッセージシンタックスおよびセマンティクスは、SEIメッセージ中の独立サブピクチャIDフォアグラウンドフラグのシグナリングのための方法に関して上述したのと同じか、または実質的に同じであり得る。具体的には、テーブル4に関して記載したシンタックスおよびセマンティクスが、以下に繰り返される。
[0054] 表6中のシンタックス要素のセマンティクスについて、以下で説明する。
[0055] 独立サブピクチャシーケンス情報SEIメッセージは、独立サブピクチャシーケンス情報SEIメッセージを含むコード化ビデオシーケンス中のISPの数、ならびにISPの位置およびサイズを提供する。
[0056] num_isps_minus1+1は、独立サブピクチャシーケンス情報SEIメッセージを含むコード化ビデオシーケンス中の各ピクチャ中のISPの数を指定する。num_isps_minus1の値は、両端値を含む0〜255の範囲内であり得る。
[0057] isp_top_left[i]およびisp_bottom_right[i]は、それぞれ、コード化ビデオシーケンス中の各ピキュチャ(picuture)中の、iに等しいisp_idをもつISPの左上および右下隅を指定する。top_left[i]およびbottom_right[i]は、ピクチャのコーディングツリーブロックラスタースキャン中のコーディングツリーブロックアドレスである。top_left[i]およびbottom_right[i]によってそれぞれ指定される左上および右下隅をもつISPは、コード化ビデオシーケンス中の内部ピクチャであってよく、他のどのISPともオーバーラップしなくてよい。
[0058] 独立サブピクチャおよびGDR情報SEIメッセージについてのシンタックスおよびセマンティクスが、以下のテーブル7を参照してここで記載される。
[0059] ISPおよびGDR情報SEIメッセージは、現在のSEIメッセージが該当するスライスを含むISPの識別子、および/または現在のSEIメッセージが該当するスライスが、アクセスユニットが現在のSEIメッセージをそれに対して含む現在のピクチャのフォアグラウンド領域に属すかどうかを提供する。
[0060] ISPおよびGDR情報SEIメッセージが、アクセスユニット中の最後のISPおよびGDR情報SEIメッセージでない場合、SEIメッセージが該当するスライスは、復号順序で、SEIメッセージを含むSEI NALユニットに復号順序で後続するとともに、ISPおよびGDR情報SEIメッセージを含む次のSEI NALユニットに復号順序で先行するすべてのスライスからなる。そうでない場合、ISPおよびGDR情報SEIメッセージが該当するスライスは、SEIメッセージを含むSEI NALユニットに復号順序で続くすべてのスライスからなる。
[0061] ISPおよびGDR情報SEIメッセージが該当するスライスは、ISPおよびGDR情報SEIメッセージに関連付けられたスライスとも呼ばれる。
[0062] isp_idシンタックス要素は、現在のSEIメッセージに関連付けられたスライスが属す独立サブピクチャのアイデンティファ(identifer)を指定する。isp_idの値は、両端値を含む0〜255の範囲内であり得る。
[0063] 特定の値ispIDによって識別されるISPは、同じピクチャ中の、ispIDに等しいisp_idを有するISPおよびGDR情報SEIメッセージに関連付けられたすべてのスライスを含むとともに、それらだけを含めばよい。ISPによって表される領域は、矩形領域であり得る。また、ピクチャ中の異なるISPによってリペゼント(repesented)される領域は、オーバーラップしなくてもよい。ISPは、同じピクチャ中のISP中にない他のスライスから独立して復号可能である場合があり、すなわち、スライスがISPに属し、1に等しいdependent_slice_flagを有するとき、0に等しいdependent_slice_flagを有する、復号順序で前のスライスは、同じISPに属し得る。したがって、ISPは、同じピクチャ中のISP中にないスライスに依存せずに、すなわち、参照せずに、復号可能である。
[0064] コード化ビデオシーケンス内で、independent_sub_picture_enabled_flagが1に等しいとき、コード化ピクチャすべてからの、特定のisp_idによって識別される独立サブピクチャは、まとめてISPシーケンスと呼ばれる。ISPシーケンスは、ISPシーケンスに属さないコード化スライスから、独立して復号可能であってよく、すなわち、ISP中のスライスの復号において、ISPシーケンスに属さないスライスからのどのサンプルも、インター予測プロセスにおいて使われなくてよい。
[0065] 1に等しいgdr_foreground_flagシンタックス要素は、現在のSEIメッセージに関連付けられたスライスが現在のピクチャ中のフォアグラウンド領域に属すことを示す。0に等しいgdr_foreground_flag要素は、現在のSEIメッセージに関連付けられたスライスが現在のピクチャ中のバックグラウンド領域に属すことを示す。
[0066] ピクチャ中のフォーグラウンド(forground)領域は、ピクチャ中の、1に等しいgdr_foreground_flagを有するISPおよびGDR情報SEIメッセージに関連付けられたすべてのスライスを含むとともに、それらだけを含めばよく、他のスライスは、ピクチャのバックグラウンド領域に属す。フォアグラウンド領域は、同じピクチャ中のバックグラウンド領域から、独立して復号可能であってよく、すなわち、スライスがフォアグラウンド領域に属し、1に等しいdependent_slice_flagを有するとき、0に等しいdependent_slice_flagを有する、復号順序で前のスライスも、フォアグラウンド領域に属し得る。したがって、フォアグラウンド領域は、同じピクチャ中のバックグラウンド領域に依存せずに、すなわち、参照せずに、復号可能であり得る。
[0067] gradual_decoding_refresh_enabled_flagが1に等しく、現在のピクチャがRAPピクチャであるとき、現在のピクチャに関連付けられた回復点SEIメッセージの存在は、以下のすべてを示し、すなわち、(a)ピクチャ中のフォアグラウンド領域は、イントラコード化コーディングブロックのみを含む、(b)関連付けられたピクチャから始まり、回復点までの、両端を含む、ピクチャセット中のフォアグラウンド領域は、復号順序で、関連付けられたピクチャに先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すコード化スライスから、独立して復号可能である、(c)復号順序で回復点に後続するピクチャ中のすべてのスライスは、復号順序で、関連付けられたピクチャに先行するコード化ピクチャに属すか、または同じピクチャセット中のバックグラウンド領域に属すスライスから、独立して復号可能であり得る。
[0068] 上述した技法を使って、エンコーダは、たとえば、1つもしくは複数のISPに関連付けられたスライス内の、またはフォアグラウンド領域に属すものとして指定されたスライス内の、ROIに対応するビデオデータを符号化し、本開示に記載されるシンタックス要素などの情報をシグナリングして、デコーダが、そのようなROIビデオデータを抽出し、復号できるようにすることができる。たとえば、ビデオデコーダは、ビットストリームを解析し、復号して、本開示に記載されるシンタックス要素などのシグナリング情報を取得し、たとえば、ROIに関連付けられた、選択されたスライスが、本明細書に記載されるように、ISPまたはフォアグラウンド領域指定に基づいて識別され得る場合、そのようなスライスを復号することができる。いくつかの例では、たとえば、ROIの一部ではない選択されたスライスが特定のISPに属さないか、またはフォアグラウンド領域に属さない場合、情報を使っても、デコーダは、そのようなスライスを復号することができない場合もある。代わりに、デコーダは、そのようなスライスを破棄してよい。
[0069] 本開示に記載される方法は、図1〜図3の例を参照して記載されるビデオエンコーダ20またはビデオデコーダ30などのビデオエンコーダまたはビデオデコーダによって実施することができる。上述したシンタックス要素を使って、一例では、デコーダは、本明細書に記載されるように、ISP情報またはGDRフォアグラウンド情報を使って、ROIビデオデータを運ぶスライスを識別し、ROI情報を、ISPとして、またはGDRプロセスの途中で、選択的に復号することができる。
[0070] 本開示に記載するように、一例では、ビデオエンコーダ20またはビデオデコーダ30は、ビデオデータをコーディングする方法を実施するように構成されてよく、この方法は、ISPが有効化されているかどうかを示す情報をコーディングすることと、独立サブピクチャが有効化されているとき、ISPのうちの1つについてのISP IDを示す情報をコーディングすることと、ROIに対応するビデオデータを、ISPのうちの1つとしてコーディングすることとを備える。
[0071] ISPが有効化されているかどうかを示すための情報をコーディングすることは、情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つの中でコーディングすることを備え得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ、または個々のピクチャについてISPが有効化されていることを示し得る。1つまたは複数のISPの各々についてのISP IDを示す情報をコーディングすることは、情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたは補足強調情報(SEI)メッセージ中でコーディングすることを備え得る。
[0072] 1つまたは複数のビデオデータスライスが、ISPに関連付けられ得る。たとえば、所与のスライスが、所与のISPに関連付けられ得る。いくつかの例では、コード化ビデオシーケンス中の、ISPの数と、ISPの位置と、ISPのサイズとを含むISP特性がコーディングされ得る。ISP特性は、たとえば、SEIメッセージ中でコーディングされ得る。いくつかの例では、ISP特性は、シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つの中でコーディングされ得る。
[0073] 本明細書で使用する「コーディング」という用語は、所与のコンテキストにおいて適用可能なように、符号化または復号を指すことができ、多くの場合は汎用的意味のいずれかにおいて、特に、ビデオ符号化および復号プロセッサのいくつかの態様の互換的性質を考慮して、指すことができる。したがって、コーディングは、ビデオエンコーダ20を用いた符号化も、ビデオデコーダ30を用いた復号も指し得る。
[0074] 復号の場合、デコーダは、符号化ビデオビットストリーム中の情報を受信し、情報を復号し、情報を使ってビデオデータを復号することができる。たとえば、ビデオデコーダは、ISPに属すスライスを復号すればよく、ISPに属さないスライスは復号しなくて(たとえば、破棄すれば)よい。デコーダは、ISPに属す復号スライスに基づいて、ROIに対応するビデオデータを生成することができる。
[0075] 本開示に記載するように、別の例では、ビデオエンコーダ20またはビデオデコーダ30は、ビデオデータをコーディングする方法を実施するように構成されてよく、この方法は、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングすることと、GDRが有効化されているとき、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることとを備える。
[0076] 一例では、方法は、GDR開始点およびGDR回復点に対応するピクチャを示す情報をコーディングすることを備え得る。別の例では、方法は、ROIに対応するビデオデータを、フォアグラウンド領域に属すスライス中でコーディングすることを備え得る。さらなる一例として、方法は、ROIに対応するビデオデータを、GDR開始点とGDR回復点との間の、フォアグラウンド領域に属すスライス中でコーディングすることを備え得る。
[0077] GDRが有効化されているかどうかを示すための情報をコーディングすることは、情報を、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つの中でコーディングすることを備え得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ、または個々のピクチャについてGDRが有効化されているかどうかを示し得る。スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることは、情報を、スライスがピクチャのフォアグラウンド領域に属すかどうかを示すように、スライスヘッダまたはSEIメッセージ中でコーディングすることを備え得る。
[0078] 繰り返しになるが、この方法は、いくつかの例では、ビデオエンコーダ20によって、またはビデオデコーダ30によって実施することができる。復号の場合、方法は、符号化ビデオビットストリーム中で、ピクチャのスライスが、それぞれのピクチャのフォアグラウンド領域に属すかどうかを示す情報を受信することと、その情報を復号することと、その情報を使ってビデオデータを復号することとをさらに備え得る。さらに、方法は、フォアグラウンド領域に属すスライスを復号することと、フォアグラウンド領域に属さないスライスを破棄することと、フォアグラウンド領域に属す復号スライスに基づいて、ROIに対応するビデオデータを生成することとを備え得る。さらなる一例として、方法は、GDR開始点からランダムアクセスを実施することと、フォアグラウンド領域に属す、GDR開始点からGDR回復点までのピクチャ中のスライスを復号することと、フォアグラウンド領域に属さない、GDR開始点からGDR回復点までのピクチャ中のスライスを破棄することとを備え得る。
[0079] 図1は、ROIに関する情報、GDRに関する情報、または両方をシグナリングおよび/または受信するための技法を使用することができる例示的ビデオ符号化および復号システム10を示すブロック図である。図1に示されるように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを与えるソースデバイス12を含む。特に、ソースデバイス12は、コンピュータ可読媒体16を介してビデオデータを宛先デバイス14に与える。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信に対応し得る。
[0080] 宛先デバイス14は、コンピュータ可読媒体16を介して、復号されるべき符号化ビデオデータを受信することができる。コンピュータ可読媒体16は、符号化ビデオデータをソースデバイス12から宛先デバイス14に移動することが可能な任意のタイプの媒体またはデバイスを備えることができる。一例では、コンピュータ可読媒体16は、ソースデバイス12が、符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルまたは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
[0081] いくつかの例では、符号化データは、出力インターフェース22からストレージデバイスに出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイスからアクセスされ得る。ストレージデバイスは、ハードドライブ、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイスは、ソースデバイス12によって生成された符号化ビデオを記憶し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介して、ストレージデバイスから記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブを含む。宛先デバイス14は、インターネット接続を含む、任意の標準的なデータ接続を通じて符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。
[0082] 本開示の技法は、必ずしもワイヤレスの適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH)などのインターネットストリーミングビデオ送信、データ記憶媒体に符号化されるデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、種々のマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、単方向または二方向のビデオ送信をサポートするように構成され得る。
[0083] 図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。本開示によると、ソースデバイス12のビデオエンコーダ20は、ROIに関する情報、GDRに関する情報、または両方をシグナリングするための技法を実施するように構成され得る。たとえば、ビデオエンコーダ20は、シグナリング情報を符号化ビデオビットストリーム中で符号化して、ビデオ復号プロセスにおいて使用するために、ビデオデコーダ30などのビデオデコーダに、ROIに関する情報、GDRに関する情報、または両方を提供するように構成され得る。ビデオデコーダ30は、ビットストリームを復号し、解析して、ROIに関するシグナリング情報、GDRに関する情報、または両方を取得し、そのような情報をビデオ復号プロセスにおいて使うように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは、他の構成要素または構成を含み得る。たとえば、ビデオソース18は、ソースデバイス12が、外部カメラなどの外部ビデオソースからビデオデータを受信し得るように外部ビデオソースであってよい。同様に、宛先デバイス14は、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。
[0084] 本開示によると、ビデオデータをコーディングするためのシステム、方法、または装置は、一例では、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングすることができる。いくつかの例では、GDRが有効化されているとき、1つのプロセッサまたは複数のプロセッサは、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることができる。たとえば、ビデオデータをコーディングするためのシステムまたは装置は、方法の1つまたは複数のステップを実施するように構成された1つのプロセッサまたは複数のプロセッサを含み得る。このようなプロセッサまたは複数のプロセッサは、いくつかの例では、ビデオエンコーダ20またはビデオデコーダ30の一部であってよい。
[0085] 本開示によると、ビデオデータをコーディングするためのシステム、方法、または装置は、別の例では、1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングすることができる。独立サブピクチャが有効化されているとき、これらのシステム、方法、または装置は、ISPのうちの1つについてのISP IDを示す情報をコーディングし、ROIに対応するビデオデータを、ISPのうちの1つとしてコーディングすることができる。本明細書に記載されるように、いくつかの例は、ピクチャのGDRが有効化されているかどうかと、1つまたは複数のISPが有効化されているかどうかとを示す両方の情報をコーディングすることができる。
[0086] 本開示によると、いくつかの例では、コーディングは符号化を備えてよく、本明細書に記載される方法のうちの1つまたは複数を実装する装置は、ビデオエンコーダ20を用いて符号化するように構成されてよい。別の例では、ビデオエンコーダ20は、本明細書に記載される方法のうちの1つまたは複数を実装する装置であってよい。本開示によると、いくつかの例では、コーディングは復号を備えてよく、本明細書に記載される方法のうちの1つまたは複数を実装する装置は、ビデオデコーダ30を用いて復号するように構成されてよい。別の例では、エンコーダ20は、本明細書に記載される方法のうちの1つまたは複数を実装する装置であってよい。
[0087] 図1の図示のシステム10は一例にすぎない。ROI、GDR、または両方に関する情報をシグナリングおよび/または受信するための技法は、どのデジタルビデオ符号化および/または復号デバイスによって実施されてもよい。一般に、本開示の技法はビデオ符号化デバイスによって実施されるが、本技法は、通常「コーデック」と呼ばれるビデオエンコーダ/デコーダによっても実施され得る。さらに、本開示の技法は、ビデオプリプロセッサによって実施することもできる。ソースデバイス12および宛先デバイス14は、ソースデバイス12が宛先デバイス14に送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、デバイス12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、デバイス12、14は、実質的に対称的に動作し得る。したがって、システム10は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャストまたはビデオ電話のための、ビデオデバイス12とビデオデバイス14との間の一方向または双方向のビデオ送信をサポートすることができる。
[0088] ソースデバイス12のビデオソース18は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース18は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブされたビデオとコンピュータにより生成されたビデオとの組合せを生成し得る。場合によっては、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラ付き電話またはビデオ電話を形成することができる。ただし、上述のように、本開示で説明する技法は、一般にビデオコーディングに適用可能であり、ワイヤレスおよび/またはワイヤードアプリケーションに適用可能であり得る。各々の場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータで生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0089] コンピュータ可読媒体16は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時媒体、あるいはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、または他のコンピュータ可読媒体などの記憶媒体(すなわち、非一時的記憶媒体)を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、ソースデバイス12から符号化ビデオデータを受信し、たとえば、ネットワーク送信を介して、その符号化ビデオデータを宛先デバイス14に与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイス12から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成し得る。したがって、コンピュータ可読媒体16は、様々な例において、様々な形態の1つまたは複数のコンピュータ可読媒体を含むことが理解されよう。
[0090] 宛先デバイス14の入力インターフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義され、またビデオデコーダ30によって使用される、ブロックおよび他のコード化ユニット、たとえば、GOPの特性および/または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス32は、復号されたビデオデータをユーザに対して表示し、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0091] ビデオエンコーダ20およびビデオデコーダ30は、現在開発中のHigh Efficiency Video Coding(HEVC)規格などのビデオコーディング規格に従って動作することができ、HEVCテストモデル(HM)に準拠し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4,Part 10,Advanced Video Coding(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオコーディング規格の他の例には、MPEG−2およびITU−T H.263が含まれる。図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は各々、オーディオエンコーダおよびオーディオデコーダと統合されてよく、適切なMUX−DEMUXユニット、または他のハードウェアとソフトウェアとを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理することができる。適用可能な場合、MUX−DEMUXユニットはITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠することができる。
[0092] ITU−T H.264/MPEG−4(AVC)規格は、Joint Video Team(JVT)として知られる共同パートナーシップの成果として、ISO/IEC Moving Picture Experts Group(MPEG)とともにITU−T Video Coding Experts Group(VCEG)によって策定された。いくつかの態様では、本開示で説明する技法は、H.264規格に概して準拠するデバイスに適用され得る。H.264規格は、ITU−T Study Groupによる2005年3月付のITU−T勧告H.264「Advanced Video Coding for generic audiovisual services」に記載されており、本明細書ではH.264規格またはH.264仕様、あるいはH.264/AVC規格または仕様と呼ぶことがある。Joint Video Team(JVT)は、H.264/MPEG−4 AVCに対する拡張に取り組み続けている。
[0093] ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法がソフトウェアで部分的に実施されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実施し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれてよく、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合されてよい。
[0094] JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。HMは、(たとえば、ITU−T H.264/AVC)に従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、H.264は9個のイントラ予測符号化モードを提供するが、HMは33個ものイントラ予測符号化モードを提供し得る。
[0095] 概して、HMのワーキングモデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット(LCU)に分割され得ることを記載している。次回のHEVC規格も、LCUを「コーディングツリーユニット」と呼ぶ。ビットストリーム内のシンタックスデータは、ピクセルの数に関して最大コーディングユニットであるLCU用のサイズを確定することができる。スライスは、コーディング順序でいくつかの連続的なツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、四分木によるコーディングユニット(CU)に分けることができる。一般に、4分木データ構造はCUごとに1つのノードを含み、ルートノードはツリーブロックに対応する。CUが4つのサブCUに分割された場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。
[0096] 4分木データ構造の各ノードは、対応するCUにシンタックスデータを提供することができる。たとえば、4分木のノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUのシンタックス要素は、再帰的に定義されてよく、CUがサブCUに分割されるかどうかに依存し得る。CUがこれ以上分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的な分割が存在しない場合でも、リーフCUの4つのサブCUをリーフCUとも呼ぶ。たとえば、16×16サイズのCUがさらに分割されない場合、この16×16CUが決して分割されなくても、4つの8×8サブCUをリーフCUとも呼ぶ。
[0097] CUは、CUがサイズ差異を有しないことを除いて、H.264規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、4つの子ノード(サブCUとも呼ばれる)に分割されてよく、各子ノードは、今度は親ノードとなり、別の4つの子ノードに分割されてよい。4分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフCUとも呼ばれるコーディングノードを備える。コード化ビットストリームに関連するシンタックスデータは、最大CU深度と呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、また、コーディングノードの最小サイズを定義し得る。それに応じて、ビットストリームは最小コーディングユニット(SCU)も定義することができる。本開示は、HEVCのコンテキストにおけるCU、PU、もしくはTU、または他の規格のコンテキストにおける同様のデータ構造(たとえば、H.264/AVCにおけるマクロブロックおよびそのサブブロック)のいずれかを指すために「ブロック」という用語を使用する。
[0098] CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU)および変換ユニット(TU)とを含む。CUのサイズは、コーディングノードのサイズに対応し、正方形でなければならない。CUのサイズは、8×8ピクセルから最大64×64以上のピクセルをもつツリーブロックのサイズまでに及び得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含んでいることがある。CUに関連するシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモードもしくはダイレクトモードで符号化されるか、イントラ予測モードで符号化されるか、またはインター予測モードで符号化されるかの間で異なる場合がある。PUは、形状が非正方形になるように区分され得る。CUに関連するシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分することも記述し得る。TUは、形状が正方形または非正方形(たとえば、矩形)であり得る。
[0099] HEVC規格は、CUごとに異なり得るTUに従った変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT)として知られる4分木構造を使用してより小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれ得る。TUに関連するピクセル差分値は、変換係数を生成するように変換されてよく、その変換係数は量子化され得る。
[0100] リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。概して、PUは、対応するCUの全部または一部分に対応する空間的エリアを表し、そのPUの参照サンプルを取り出すためのデータを含み得る。その上、PUは、予測に関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUのデータは、PUに対応するTUのイントラ予測モードを記述するデータを含み得る、残差4分木(RQT)中に含まれ得る。別の例として、PUがインターモード符号化されるとき、PUは、PUのための1つまたは複数の動きベクトルを定義するデータを含み得る。PUについての動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルの参照ピクチャリスト(たとえば、リスト0、リスト1またはリストC)を記述し得る。
[0101] 1つまたは複数のPUを有するリーフCUはまた、1つまたは複数の変換ユニット(TU)を含むことができる。変換ユニットは、上記で説明したように、(TU4分木構造とも呼ばれる)RQTを使用して指定され得る。たとえば、分割フラグは、リーフCUが4つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットはさらに、さらなるサブTUに分割され得る。TUがこれ以上分割されないとき、そのTUはリーフTUと呼ぶことができる。一般に、イントラコーディングの場合、リーフCUに属するすべてのリーフTUは同じイントラ予測モードを共有する。すなわち、一般に、リーフCUのすべてのTUの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダ20は、イントラ予測モードを使用して各リーフTUの残差値を、TUに対応するCUの一部と元のブロックとの間の差分として計算し得る。TUは、必ずしもPUのサイズに制限されるとは限らない。したがって、TUは、PUよりも大きいことも小さいこともある。イントラコーディングの場合、PUは、同じCUの対応するリーフTUとコロケートされ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに該当する場合がある。
[0102] その上、リーフCUのTUはまた、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造に関連付けられ得る。すなわち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含み得る。TU4分木のルートノードは一般にリーフCUに対応し、CU4分木のルートノードは一般にツリーブロック(またはLCU)に対応する。分割されないRQTのTUはリーフTUと呼ばれる。全般に、本開示では、別段明記されない限り、リーフCUおよびリーフTUに言及するためにそれぞれCUおよびTUという用語を使用する。
[0103] ビデオシーケンスは通常、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、一般に、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。
[0104] 一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、またはN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という表示によって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5N PUと下部の2N×1.5N PUとで水平方向に区分された2N×2N CUを指す。
[0105] 本開示では、「N×N(NxN)」および「N×N(N by N)」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、16×16(16x16)ピクセルまたは16×16(16 by 16)ピクセルを指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16ピクセルを有し(y=16)、水平方向に16ピクセルを有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にNピクセルを有し、水平方向にNピクセルを有し、ここでNは非負整数値を表す。ブロック中のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはN×Mのピクセルを備える場合があり、ここで、Mは必ずしもNに等しいとは限らない。
[0106] CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備えてよく、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後の、変換領域における係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CU用の残差データを含むTUを形成し、次いで、TUを変換して、CU用の変換係数を生成することができる。
[0107] 変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は、変換係数の量子化を実施し得る。量子化は、概して、さらなる圧縮を提供する、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減させることができる。たとえば、量子化中にnビット値がmビット値に切り捨てられてよく、ただし、nはmよりも大きい。
[0108] 量子化の後に、ビデオエンコーダ20は、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、より高いエネルギー(したがってより低い周波数)の係数をアレイの前方に配置し、より低いエネルギー(したがってより高い周波数)の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ20は、あらかじめ定義された走査順序を利用して、量子化された変換係数を走査し、エントロピー符号化され得る直列化されたベクトルを生成し得る。他の例では、ビデオエンコーダ20は適応走査を実施し得る。量子化された変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応可変長コーディング(CAVLC)、コンテキスト適応バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディング、または別のエントロピー符号化方法に従って、1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための、符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
[0109] CABACを実施するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非0であるか否かに関係し得る。CAVLCを実施するために、ビデオエンコーダ20は、送信されるべきシンボルの可変長コードを選択し得る。VLCにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、VLCの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられるコンテキストに基づき得る。
[0110] ビデオエンコーダ20は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびGOPベースのシンタックスデータなどのシンタックスデータを、たとえば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはGOPヘッダ中でビデオデコーダ30に送り得る。GOPシンタックスデータは、それぞれのGOP内のフレームの数を記述することができ、フレームシンタックスデータは、対応するフレームを符号化するために使用される符号化/予測モードを示すことができる。
[0111] ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、適用可能なとき、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダまたはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも複合ビデオエンコーダ/デコーダ(コーデック)の一部として統合され得る。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを備え得る。
[0112] 図2は、ROIの情報指示、GDRの情報指示、または両方をシグナリングするための技法を実装することができるビデオエンコーダ20の例を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実施し得る。イントラコーディングは、空間的予測を利用して、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去する。インターコーディングは、時間的予測を利用して、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去する。イントラモード(Iモード)は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。
[0113] 図2に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在ビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット40と、参照フレームメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、区分ユニット48とを含む。ビデオブロックの再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。再構築されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図2に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタリングすることになる。追加のフィルタ(ループ内またはループ後)もデブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡潔のために示されていないが、必要な場合、(ループ内フィルタとして)加算器50の出力をフィルタリングすることができる。
[0114] 符号化プロセス中に、ビデオエンコーダ20はコーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは、複数のビデオブロックに分割され得る。動き推定ユニット42および動き補償ユニット44は、時間的予測を行うために、1つまたは複数の参照フレーム中の1つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実施する。イントラ予測ユニット46は、代替的に、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コーディングを実施し得る。ビデオエンコーダ20は、たとえば、ビデオデータの各ブロックのための適切なコーディングモードを選択するために、複数のコーディングパスを実施し得る。
[0115] その上、区分ユニット48は、以前のコーディングパスにおける以前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。たとえば、区分ユニット48は、初めにフレームまたはスライスをLCUに区分し、レートひずみ分析(たとえば、レートひずみ最適化)に基づいてLCUの各々をサブCUに区分し得る。モード選択ユニット40は、LCUをサブCUに区分することを示す4分木データ構造をさらに生成し得る。4分木のリーフノードCUは、1つまたは複数のPUと、1つまたは複数のTUとを含む場合がある。
[0116] モード選択ユニット40は、たとえば、誤差結果に基づいてコーディングモード、すなわち、イントラまたはインターのうちの1つを選択し、残差ブロックデータを生成するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器50に与え、参照フレームとして使用するための符号化ブロックを再構成するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器62に与え得る。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピー符号化ユニット56に与える。
[0117] 動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実施される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム(または他のコード化ユニット)内でコーディングされている現在のブロックに対する参照フレーム(または他のコード化ユニット)内の予測ブロックに対して現在のビデオフレームまたはピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対値差分和(SAD)、2乗差分和(SSD)、または他の差分尺度によって決定され得るピクセル差分に関して、コーディングされるブロックに精密に一致することがわかっているブロックである。いくつかの例では、ビデオエンコーダ20は、参照フレームメモリ64に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間することができる。したがって、動き推定ユニット42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実施し、分数ピクセル精度で動きベクトルを出力し得る。
[0118] 動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのPUについての動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択されてよく、それらの参照ピクチャリストの各々は、参照フレームメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0119] 動き補償ユニット44によって実施される動き補償は、動き推定ユニット42によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット42と動き補償ユニット44とは機能的に統合され得る。現在のビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、動きベクトルが参照ピクチャリストのうちの1つにおいて指す予測ブロックの位置を特定し得る。加算器50は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット42はルーマ成分に対して動き推定を実施し、動き補償ユニット44は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
[0120] イントラ予測ユニット46は、上に記述したように、動き推定ユニット42および動き補償ユニット44によって実施されたインター予測の代替として、現在のブロックをイントラ予測することができる。特に、イントラ予測ユニット46は、現在のブロックを符号化するために使用するためにイントラ予測モードを決定することができる。いくつかの例では、イントラ予測ユニット46は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット46(または、いくつかの例では、モード選択ユニット40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。
[0121] たとえば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、一般に、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化ブロックを生成するために使用されるビットレート(すなわち、ビット数)を決定する。イントラ予測ユニット46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比を計算し得る。
[0122] ブロックのイントラ予測モードを選択した後、イントラ予測ユニット46は、ブロックのために選択されたイントラ予測モードを示す情報を、エントロピー符号化ユニット56に提供することができる。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化することができる。ビデオエンコーダ20は、送信ビットストリーム中に構成データを含み得る。構成データは、複数のイントラ予測モードインデックステーブルおよび複数の修正されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)を含み得る。構成データはまた、様々なブロックの符号化コンテキストの定義と、コンテキストの各々に対して使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および修正されたイントラ予測モードインデックステーブルの指示とを含み得る。
[0123] ビデオエンコーダ20は、コーディングされている元のビデオブロックから、モード選択ユニット40からの予測データを減算することによって、残差ビデオブロックを形成する。加算器50は、この減算演算を実施する1つまたは複数の構成要素を表す。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換など、変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット52は、DCTと概念的に同様である他の変換を実施することができる。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から、周波数領域などの変換領域に変換することができる。変換処理ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減させることができる。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実施し得る。代替的に、エントロピー符号化ユニット56が走査を実施し得る。
[0124] 量子化の後、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピーコーディング技法を実施することができる。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット56によるエントロピーコーディングの後、符号化ビットストリームは、別のデバイス(たとえば、ビデオデコーダ30)に送信されてよく、または後で送信するかもしくは取り出すために保管され得る。
[0125] 逆量子化ユニット58および逆変換ユニット60は、それぞれ逆量子化および逆変換を適用して、たとえば、参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照フレームメモリ64のフレームのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するためのサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照フレームメモリ64に記憶するための再構成されたビデオブロックを生成する。再構築されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
[0126] 図2のビデオエンコーダ20は、本開示で説明される様々な方法を実施するように構成されたビデオエンコーダの例を表す。本開示に記載される方法に従って、ビデオエンコーダ20は、本明細書に記載されるシンタックス要素を使うことができる。ビデオエンコーダ20は、ISP情報またはGDRフォアグラウンド情報を使って、ROIまたはフォアグラウンド領域ビデオデータを運ぶスライスを識別し、ROIまたはフォアグラウンド領域情報を、本明細書に記載されるように、ISPとして、またはGDRプロセスの途中でのいずれかで、選択的に復号することができる。
[0127] 一例では、ビデオエンコーダ20は、ビデオデータをコーディングする方法を実施するように構成され得る。この方法は、ISPが有効化されているかどうかを示す情報をコーディングすることを含み得る。独立サブピクチャが有効化されているとき、ビデオエンコーダ20は、ISPのうちの1つについてのISP IDを示す情報をコーディングすることができる。ビデオエンコーダ20は、ROIに対応するビデオデータを、ISPのうちの1つとしてコーディングすることもできる。
[0128] ISPが有効化されているかどうかを示すための情報を符号化することは、情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つの中で符号化することを含み得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ、または個々のピクチャについてISPが有効化されていることを示し得る。1つまたは複数のISPの各々についてのISP ISP IDを示す情報を符号化することは、情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたはSEIメッセージ中でコーディングすることを備え得る。
[0129] 本開示に記載するように、別の例では、ビデオエンコーダ20は、ビデオデータをコーディングする方法を実施するように構成されてよく、この方法は、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングすることと、GDRが有効化されているとき、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることとを備える。
[0130] 方法は、GDR開始点およびGDR回復点に対応するピクチャを示す情報を符号化することを含み得る。いくつかの例では、方法は、フォアグラウンド領域に属すスライスに対応するビデオデータをコーディングすることを備え得る。さらなる一例として、方法は、GDR開始点とGDR回復点との間の、フォアグラウンド領域に属すスライスに対応するビデオデータをコーディングすることを備え得る。
[0131] GDRが有効化されているかどうかを示すための情報を符号化することは、情報を、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つの中でコーディングすることを備え得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ、または個々のピクチャについてGDRが有効化されているかどうかを示し得る。スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を符号化することは、情報を、スライスがピクチャのフォアグラウンド領域に属すかどうかを示すように、スライスヘッダまたはSEIメッセージ中でコーディングすることを備え得る。いくつかの例では、SEIメッセージは、スライスがフォアグラウンドそれともバックグラウンドであるかを示すことができる。ある例では、フォアグラウンドを示すSEIメッセージの後のすべてのスライスは、後続するスライスがバックグラウンドであることを示す以降のSEIメッセージが受信されるまで、フォアグラウンドである。別の実装形態例では、システムまたは方法は、SEIメッセージを、あらゆるスライスについての、または所定の数のスライスについてのインジケータとして使うことができる。
[0132] ビデオデータを符号化する例示的方法において、ビデオエンコーダ20は、ピクチャのGDRが有効化されているかどうかを示す情報を符号化することができる。たとえば、これは、エントロピー符号化ユニット56によって実施することができる。さらに、GDRが有効化されているとき、ビデオエンコーダ20のエントロピー符号化ユニット56は、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を符号化することができる。他の例では、ビデオエンコーダ20の他のシステムまたはサブシステムが、本明細書に記載される方法の1つまたは複数の態様を実施することができる。
[0133] いくつかの例では、ビデオエンコーダ20のエントロピー符号化ユニット56または何らかの他の処理ユニットが、GDR開始点およびGDR回復点に対応するピクチャを示す情報を符号化することができる。エントロピー符号化ユニット56は、フォアグラウンド領域に属すスライス中のROIに対応するビデオデータを符号化することができる。一例では、エントロピー符号化ユニット56は、この情報を、GDR開始点とGDR回復点との間の、フォアグラウンド領域に属すスライスセットの第1のスライス中で符号化することができる。したがって、フラグまたはSEIメッセージは、フォアグラウンド領域またはバックグラウンド領域における一連のスライスの開始を示すことができる。
[0134] 情報は、たとえば、SEIメッセージ、スライスヘッダ中のフラグもしくはシンタックス要素によって、またはいずれか、パラメータセットもしくはピクチャデリミタにおいて示すことができる。スライスがピクチャのフォアグラウンド領域に属すかどうかを示すのに、SEIメッセージを使う例は、スライスごとに1つのSEIメッセージを送ればよく、またはSEIメッセージが一連のスライスに該当してもよい。いくつかの例では、所定の数のスライスが、SEIメッセージによって示され得る。別の例では、あるSEIメッセージが、次のSEIメッセージが受信されるまで、一連のスライスに該当してもよい。スライスヘッダ中のフラグが、同様の機能性を有する場合もある。フラグは、各スライスについて一度送られればよく、またはフラグは、一連のスライスまたは既知の数のスライスに該当する場合もある。
[0135] 別の例では、エントロピー符号化ユニット56は、この情報を、GDR開始点とGDR回復点との間の、フォアグラウンド領域に属すスライス中で符号化することができる。したがって、いくつかの例は、各スライス中のフォアグラウンドフラグを、そのスライスがフォアグラウンド領域それともバックグラウンド領域にあるのかを示すようにセットすればよい。フォアグラウンド領域はリフレッシュ領域と呼ばれる場合もあり、バックグラウンド領域(フォアグラウンド領域ではない領域)は、非リフレッシュ領域と呼ばれる場合もある。いくつかの例では、GDRが有効化されているかどうかを示すための情報を符号化することは、情報を、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つの中で符号化することを含み得る。情報は、たとえば、フラグまたはSEIメッセージを含むことができ、シーケンス全体に対してGDRが有効化されていることを示すことができる。
[0136] いくつかの例では、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を符号化することは、情報を、スライスがピクチャのフォアグラウンド領域に属すかどうかを示すように、スライスヘッダまたはSEIメッセージ中で符号化することを含み得る。たとえば、スライスヘッダまたはフォアグラウンドSEIメッセージ中のフラグは、フラグまたはSEIメッセージに後続するすべてのスライスが、バックグラウンドを示す次のSEIメッセージが受信されるまで、フォアグラウンドであることを示し得る。他の例では、スライス中のフラグまたはSEIメッセージ中のフラグは、ある程度の所定の数のフォアグラウンドスライスを示し得る。スライス中のフラグを使う例では、複数のスライスについてのフォアグラウンドまたはバックグラウンドを示すために、単一のスライス中の単一のフラグを使うのではなく、あらゆるスライスがフラグを有し得る。いくつかの例では、ビデオエンコーダ20のエントロピー符号化ユニット56は、1つまたは複数のISPが有効化されているかどうかを示す情報を符号化することができる。独立サブピクチャが有効化されているとき、エントロピー符号化ユニット56は、ISPのうちの1つについてのISP IDを示す情報を符号化し、ROIに対応するビデオデータをISPのうちの1つとして符号化することができる。ISPが有効化されているかどうかを示すための情報を符号化することは、情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて符号化することを含み得る。さらに、1つまたは複数のISPの各々についてのISP IDを示す情報を符号化することは、情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたはSEIメッセージ中で符号化することを備える。いくつかの例では、ビデオエンコーダ20は、1つまたは複数のビデオデータスライスをISPに関連付けることができる。さらに、エントロピー符号化ユニット56は、ISPの数と、ISPの位置と、ISPのサイズとを含むISP特性をコード化ビデオシーケンス中で符号化し、ISP特性をSEIメッセージ中で符号化し、またはISP特性をシーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおいて符号化することができる。
[0137] 図3は、ROIの情報指示、GDRフォアグラウンド領域の情報指示、または両方を処理するための技法を実装することができるビデオデコーダ30の例を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変形ユニット78と、参照フレームメモリ82と、加算器80とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図2)に関して説明された符号化パスとは全般に逆の復号パスを実施し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成することができ、イントラ予測ユニット74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測データを生成することができる。
[0138] 復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルをおよび他の予測シンタックス要素に動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0139] ビデオスライスがイントラコード化(I)スライスとしてコーディングされるとき、イントラ予測ユニット74は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(すなわち、B、PまたはGPB)スライスとしてコーディングされるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストの1つの中の参照ピクチャの1つから生成され得る。ビデオデコーダ30は、参照フレームメモリ82に記憶された参照ピクチャに基づいて、デフォルト構成技法を使用して、参照フレームリスト、すなわち、リスト0とリスト1とを構成し得る。動き補償ユニット72は、動きベクトルと他のシンタックス要素とを解析することによって現在ビデオスライスのビデオブロックについての予測情報を判断し、予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット72は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、PスライスまたはGPBスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコード化ビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。
[0140] 動き補償ユニット72はまた、補間フィルタに基づいて補間を実施し得る。動き補償ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルのための補間された値を計算し得る。この場合、動き補償ユニット72は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。
[0141] 逆量子化ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された、量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を判断し、同様に、適用されるべき逆量子化の程度を判断するための、ビデオスライス中のビデオブロックごとにビデオエンコーダ30によって計算される量子化パラメータQPYの使用を含み得る。
[0142] 逆変換ユニット78は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
[0143] 動き補償ユニット72が、動きベクトルおよび他のシンタックス要素に基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器80は、この加算演算を実施する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタリングするためのデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、(コーディングループ内またはコーディングループ後の)他のループフィルタも使用され得る。所与のフレームまたはピクチャ中の復号ビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照フレームメモリ82に記憶される。参照フレームメモリ82はまた、図1のディスプレイデバイス32などのディスプレイデバイス上に後で表示するために、復号ビデオを記憶する。
[0144] 図3のビデオデコーダ30は、本開示で説明される様々な方法を実施するように構成されたビデオデコーダの例を表す。本開示で説明する方法は、ビデオデコーダ30によって実施され得る。たとえば、エントロピー復号ユニット70は、ビデオデコーダ30内にあってよく、本開示に記載される1つまたは複数の態様を実施することができる。たとえば、上述したシンタックス要素を使うと、ビデオデコーダ30は、本明細書に記載されるように、ISP情報またはGDRフォアグラウンド領域情報を使って、ROIまたはGDRフォアグラウンド領域ビデオデータを運ぶスライスを識別し、ROIまたはGDRフォアグラウンド領域情報を、ISPまたはGDRフォアグラウンド領域のいずれかとして選択的に復号することができる。本開示で説明するように、一例では、ビデオデコーダ30は、ビデオデータをコーディングする方法を実施するように構成され得る。この方法は、ISPが有効化されているかどうかを示す情報を復号することを含み得る。言い換えると、この情報は、ISPが存在するとともに、ISPによってカバーされる領域のみの処理が可能であるときを示すことができる。独立サブピクチャが有効化されているとき、方法は、ISPのうちの1つについてのISP IDを示す情報をコーディングすることと、ROIに対応するビデオデータをISPのうちの1つとして復号することとを含み得る。たとえば、可能性としてはROIまたはGDRシンタックス要素の復号の一部または全部は、エントロピー復号ユニット70内で起こり得る。概して、ただし、復号は、たとえば、イントラ予測ユニット74または他の処理ユニットなど、ビデオデコーダ30の別の処理ユニット内で起こってもよい。
[0145] ISPが有効化されているかどうかを示すための情報を復号することは、情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて復号することを含み得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ、または個々のピクチャについてISPが有効化されていることを示し得る。たとえば、いくつかの場合、ISPは使われなくてよい。他の場合、ISPが、シーケンス中のすべてのピクチャ、シーケンスの層の中のすべてのピクチャ中で、または個々のピクチャについて使われ得る。1つまたは複数のISPの各々についてのISP IDを示す情報を復号することは、情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたはSEIメッセージ中で復号することを備え得る。このようにして、各ISPのISP IDは、たとえば、スライスヘッダ中またはSEIメッセージ中のいずれかでシグナリングされ得る。このシグナリングは、ISPへのスライスの関連付けも可能にし得る。さらに、ROIに対応する特定のISPが、所望される唯一の領域であるとき、各ピクチャ中のISPに属さないスライスは破棄されてよく、ISPに属すスライスは、ROIビデオデータとして復号され、処理され得る。
[0146] 本開示に記載するように、別の例では、ビデオデコーダ30、たとえば、エントロピー復号ユニット70またはビデオデコーダ30の他の部分は、ビデオデータを復号する方法を実施するように構成され得る。方法は、ピクチャのGDRが有効化されているかどうかを示す情報を復号することと、GDRが有効化されているとき、スライスがピクチャのフォアグラウンド領域それともバックグラウンド領域に属すかを示す情報を復号することとを含み得る。フォアグラウンド領域はリフレッシュ領域と呼ばれる場合もあり、バックグラウンド領域(フォアグラウンド領域ではない領域)は、非リフレッシュ領域と呼ばれる場合もある。回復点SEIメッセージを含む非RAPアクセスユニットであるGDR開始点からランダムアクセスするとき、フォアグラウンド領域に属さない、開始点から回復点まで(ただし、回復点は含まない)の、すべてのピクチャ中のスライスは破棄され得る。
[0147] いくつかの例では、ビデオデコーダ30は、GDR開始点およびGDR回復点に対応するピクチャを示す情報を復号することを含むビデオデータを復号する方法を実施するように構成され得る。方法は、フォアグラウンド領域に属すスライスに対応するビデオデータを復号することを含み得る。さらなる一例として、方法は、GDR開始点とGDR回復点との間のフォアグラウンド領域に属すスライスに対応するビデオデータを復号することを含み得る。
[0148] GDRが有効化されているかどうかを示すための情報を復号することは、情報を、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて復号することを含み得る。いくつかの例では、この情報は、シーケンス中のすべてのピクチャ(コード化ビデオシーケンスとも呼ばれる)、シーケンスの層の中のすべてのピクチャ、またはシーケンス中の個々のピクチャについてGDRが有効化されているかどうかを示すことができる。スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することは、スライスヘッダ中の情報、たとえば、特定のスライスがフォアグラウンドもしくはバックグラウンドであることを示すフラグ、またはSEIメッセージに関連付けられたスライスがピクチャのフォアグラウンド領域に属すかどうかを示すためのSEIメッセージを復号することを備え得る。スライスがピクチャのフォアグラウンド領域に属すかどうかを示すのに、SEIメッセージを使う例は、スライスごとに1つのSEIメッセージを送ればよく、またはSEIメッセージが一連のスライスに該当してもよい。いくつかの例では、所定の数のスライスが示され得る。別の例では、あるSEIメッセージが、次のSEIメッセージが受信されるまで、一連のスライスに該当してもよい。したがって、連続するSEIメッセージの間に、複数のスライスがあり得る。
[0149] 繰り返しになるが、この方法は、いくつかの例では、ビデオデコーダ30によって実施することができる。復号の場合、方法は、符号化ビデオビットストリーム中で、ピクチャのスライスが、それぞれのピクチャのフォアグラウンド領域に属すかどうかを示す情報を受信することと、ピクチャのスライスが、それぞれのピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することと、情報を使ってビデオデータを復号することとをさらに含み得る。さらに、方法は、たとえば、SEIメッセージまたはスライスヘッダ中のフラグもしくはシンタックス要素によって示されるように、フォアグラウンド領域に属すスライスを復号し、フォアグラウンド領域に属さないスライスを破棄することと、フォアグラウンド領域に属す復号スライスに基づいて、フォアグラウンド領域に対応するビデオデータを生成することとを含み得る。さらなる一例として、ビデオデコーダ30によって実装される方法は、GDR開始点からランダムアクセスを実施することと、フォアグラウンド領域に属す、GDR開始点からGDR回復点までのピクチャ中のスライスを復号することと、フォアグラウンド領域に属さない、GDR開始点からGDR回復点までのピクチャ中のスライスを破棄することとを含み得る。
[0150] 本開示に記載するように、一例では、ビデオデータを復号するシステム、装置、および方法は、ピクチャのGDRが有効化されているかどうかを示す情報を復号することを含み得る。GDRが有効化されているとき、これらのシステム、装置、および方法は、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することができる。そのようなシステム、装置、および方法は、GDR開始点およびGDR回復点に対応するピクチャを示す情報を復号することをさらに含み得る。
[0151] いくつかの例では、ビデオデコーダ30は、回復点SEIメッセージによって示されるように、GDR開始点とGDR回復点との間のフォアグラウンド領域に属すスライスに対応するビデオデータを復号することができる。GDRが有効化されているかどうかを示すための情報を復号することは、いくつかの例では、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて、ピクチャのスライスが、それぞれのピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することを含み得る。スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することは、いくつかの例では、情報を、スライスがピクチャのフォアグラウンド領域に属すかどうかを示すように、スライスヘッダまたはSEIメッセージ中で復号することを含み得る。情報は、たとえば、SEIメッセージ、またはスライスヘッダ中のフラグもしくはシンタックス要素によって示すことができる。エントロピー復号ユニット70は、図3に関して記載される復号の一部または全部を実施することができる。
[0152] 例示的ビデオデコーダ30中で、たとえば、エントロピー復号ユニット70が、符号化ビデオビットストリーム中の情報を受信することができる。エントロピー復号ユニット70は、情報を復号し、情報を使ってビデオデータを復号することができる。ビデオデコーダ30はさらに、フォアグラウンド領域に属すスライスを復号することができ、フォアグラウンド領域に属さないスライスを破棄する。いくつかの例では、ビデオデコーダ30は、フォアグラウンド領域に属す復号スライスに基づいて、フォアグラウンド領域に対応するビデオデータを生成することができる。ビデオデコーダ30は、また、GDR開始点からランダムアクセスを実施し、フォアグラウンド領域に属す、GDR開始点からGDR回復点までのピクチャ中のスライスを復号し、フォアグラウンド領域に属さない、GDR開始点からGDR回復点までのピクチャ中のスライスを破棄することができる。いくつかの例では、この範囲は、開始点と回復点との間であり得る。他の例では、この範囲は、開始点と回復点との間であり、一方、他方、または両方を含み得る。概して、一実装形態では、回復点SEIメッセージを含む非RAPアクセスユニットであるGDR開始点からランダムアクセスするとき、フォアグラウンド領域に属さない、開始点から回復点まで(ただし、回復点は含まない)のすべてのピクチャ中のスライスは破棄され得る。
[0153] 図4は、ブロック図、本開示に記載される技法を使用する例示的な一連のSEIメッセージである。本明細書に記載されるように、SEIメッセージまたはスライスヘッダ中のシンタックス要素は、GDRプロセスの目的で、スライスがフォアグラウンドそれともバックグラウンドであるかを示すのに、またはROI処理のために、スライスのISP IDを示すのに使われ得る。図4の図示される例において、SEIメッセージは、次のSEIメッセージが受信されるまで、GDR目的で、SEIメッセージに後続するすべてのスライスがフォアグラウンドスライスであることを示すか、またはROI目的で、SEIメッセージに後続するすべてのスライスのISP IDを示すシンタックス要素を含み得る。次のSEIメッセージが受信された後、バックグラウンドもしくはフォアグラウンドステータスまたは次のSEIメッセージに後続するスライスのISP IDが、次のSEIメッセージ中の指示に基づいて判断され得る。たとえば、図4において、第1のSEIメッセージ(SEI1)は、最初のSEIメッセージに後続するスライス(スライス1および2)が、バックグラウンド領域に属すスライスであることを示す。図4の図示される例において、SEI1は、「0」に等しい、SEIメッセージ中でのフラグの、この使用を示す。ただし、「1」に等しいフラグは、このような指示を与えるのに使われてよいことが理解されよう。
[0154] 第2のSEIメッセージ(SEI2)は、第2のSEIメッセージに後続するスライス(スライス3および4)が、フォアグラウンド領域に属すスライスであることを示す。図4の図示される例において、SEI2は、「1」に等しいフラグの、この使用を示す。ただし、繰り返しになるが、「0」に等しいフラグは、このような指示を与えるのに使われてよいことが理解されよう。
[0155] 第3のSEIメッセージ(SEI3)は、第3のSEIメッセージに後続するスライス(スライス5および6)が、バックグラウンド領域に属すスライスであることを示す。図4の図示される例において、SEI3は、「0」に等しいフラグの、この使用を示す。ただし、繰り返しになるが、「1」に等しいフラグは、このような指示を与えるのに使われてよいことが理解されよう。したがって、SEI1に後続するスライスは、別のSEIメッセージ(SEI2)が受信されるまで、バックグラウンドであり、このことは、SEI2に後続するスライスがフォアグラウンドスライスであることを示す。SEI3は、SEI3に後続するスライスがバックグラウンドスライスであることを示す。したがって、SEI2とSEI3との間のスライスは、フォアグラウンドスライスである。各SEIメッセージの間に2つのスライスが示されているが、任意の数のスライスがSEIメッセージの間に提供されてよい。特定のSEIメッセージに後続するスライスは、そのSEIメッセージによって示されるフォアグラウンドまたはバックグラウンドステータスを有する。フォアグラウンドまたはバックグラウンドステータスは、次のSEIメッセージが受信されるまで、SEIメッセージに後続するスライスに対して同じままであり、その時点で、次のSEIメッセージに後続するスライスは、次のSEIメッセージによって指定されるフォアグラウンドまたはバックグラウンドステータスを有する。
[0156] したがって、要約すると、図4の図示される例において、スライスヘッダまたはフォアグラウンドSEIメッセージ中のフラグは、フラグまたはSEIメッセージに後続するすべてのスライスが、スライスがバックグラウンドであることをSEIメッセージが示す、たとえば、フラグが「0」を等しい場合、バックグラウンドスライスであるか、または、スライスがフォアグラウンドであることをSEIメッセージが示す、たとえば、フラグが「1」に等しい場合、フォアグラウンドスライスであることのいずれかを示し得る。図4に示されるように、SEIメッセージ中のフラグは、このような指示を含む次のSEIメッセージまで、フォアグラウンドまたはバックグラウンドのインジケータとして使うことができる。図4の図示される例において、「0」に等しいフラグはバックグラウンドを示し、「1」に等しいフラグはフォアグラウンドを示す。ただし、逆も使われてよいことが理解されよう。言い換えると、「1」に等しいフラグは、バックグラウンドを示すのに使うことができ、「0」に等しいフラグはフォアグラウンドを示すことができる。
[0157] 図5および図6は、本開示の1つまたは複数の態様を実装する例示的方法を示す流れ図である。本明細書で説明するように、いくつかの例示的実装形態は、GDRに関連した情報をシグナリングすることができる。他の例示的実装形態は、ROIに関連した情報をシグナリングすることができる。図5は、本開示のGDR態様に関し、図6は、本開示のROI態様に関する。さらに、本明細書に記載されるように、いくつかの例示的実装形態は、GDRとROIの両方に関連した情報をシグナリングすることができる。
[0158] 図5は、GDRに関連し、本開示の1つまたは複数の態様を実施する例示的な方法を示す流れ図である。本明細書に記載されるシステムおよび方法による様々な例では、ビデオエンコーダ20またはビデオデコーダ30は、ピクチャのGDRが有効化されているかどうかを示す情報をコーディングすることができる(500)。たとえば、ビデオエンコーダ20中のエントロピー符号化ユニット56が、ピクチャのGDRが有効化されているかどうかを示す情報を符号化してもよく、ビデオデコーダ30のエントロピー復号ユニット70が、ピクチャのGDRが有効化されているかどうかを示す情報を復号してもよい。したがって、コーディングは、符号化または復号を指す。いくつかの例では、GDRが有効化されているとき、ビデオエンコーダ20またはビデオデコーダ30は、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングすることができる(502)。いくつかの例では、GDRが有効化されている場合、たとえば、ビデオデコーダ30は、(たとえば、スライスヘッダ中またはSEIメッセージ中のフォアグラウンド情報を探す。ビデオエンコーダ20中のエントロピー符号化ユニット56が、ある例では、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングしてもよく、ビデオデコーダ30のエントロピー復号ユニット70が、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングしてもよい。いくつかの例は、そのような情報を、スライスヘッダの一部として、たとえば、フラグまたは他のシンタックス要素として、SEIメッセージ中でコーディングすることができる。いくつかの例では、方法を実装する装置内の1つのプロセッサまたは複数のプロセッサが、これらのステップのうちの1つまたは複数を実施するように構成され得る。
[0159] いくつかの例では、ビデオエンコーダ20またはビデオデコーダ30は、GDR開始点およびGDR回復点に対応するピクチャを示す情報をコーディングすることができる(504)。さらに、いくつかの例では、ビデオエンコーダ20またはビデオデコーダ30は、GDR開始点とGDR回復点との間のフォアグラウンド領域に属すスライスに対応するビデオデータをコーディングすることができる。
[0160] いくつかの例では、ビデオエンコーダ20またはビデオデコーダ30は、GDRが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて情報をコーディングすることによって、GDRが有効化されているかどうかを示すための情報をコーディングすることができる。
[0161] いくつかの例では、ビデオコーダは、情報を、スライスがピクチャのフォアグラウンド領域に属すかどうかを示すように、スライスヘッダまたはSEIメッセージ中でコーディングすることによって、スライスがピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングするようにさらに構成され得る。情報は、たとえば、SEIメッセージ、またはスライスヘッダ中のフラグもしくはシンタックス要素によって示すことができる。スライスがピクチャのフォアグラウンド領域に属すかどうかを示すのに、SEIメッセージを使う例は、スライスごとに1つのSEIメッセージを送ればよく、またはSEIメッセージが一連のスライスに該当してもよい。いくつかの例では、所定の数のスライスが、SEIメッセージによって示され得る。別の例では、あるSEIメッセージが、次のSEIメッセージが受信されるまで、一連のスライスに該当してもよい。たとえば、SEIメッセージ中のフォアグラウンドフラグは、次のSEIメッセージの前に受信された1つまたは複数の後続スライスについてのステータスを示し得る。スライスヘッダ中のフラグが、同様の機能性を有する場合もある。フラグは、各スライスについて一度送られればよく、またはフラグは、一連のスライスまたは既知の数のスライスに該当する場合もある。いくつかの例では、SEIメッセージ中のフラグまたはスライスヘッダ中のフラグ、フォアグラウンドまたはバックグラウンドを使うことが、明示的に示され得る。ビデオコーダは、ビデオエンコーダ20またはビデオデコーダ30であってよい。
[0162] 本明細書に記載されるいくつかの例によると、システム、方法、および装置は、符号化ビデオビットストリーム中で情報を受信し、その情報を復号し、情報を使ってビデオデータを復号することができる。これらの例は、フォアグラウンド領域に属すスライスを復号し、フォアグラウンド領域に属さないスライスを破棄することもできる。
[0163] 別の例では、システム、方法、および装置は、フォアグラウンド領域に属す復号スライスに基づいて、フォアグラウンド領域に対応するビデオデータを生成するようにさらに構成され得る。別の例では、システム、方法、および装置は、GDR開始点からランダムアクセスを実施するように構成されてよく、フォアグラウンド領域に属す、GDR開始点からGDR回復点までのピクチャ中のスライスを復号し、フォアグラウンド領域に属さない、GDR開始点からGDR回復点までのピクチャ中のスライスを破棄する。
[0164] 図6は、ROIに関連し、本開示の1つまたは複数の態様を実施する例示的な方法を示す流れ図である。図示される例において、ビデオエンコーダ20やビデオデコーダ30など、ビデオデータをコーディングするための装置は、特定のスライスについて、1つまたは複数のISPの使用が有効化されているかどうかを示す情報をコーディングする(600)ように構成された1つのプロセッサまたは複数のプロセッサを含み得る。さらに、独立サブピクチャが有効化されているとき、装置は、ISPのうちの1つについてのISP IDを示す情報をコーディングする(602)。1つのプロセッサまたは複数のプロセッサは、ROIに対応するビデオデータを、ISPのうちの1つとしてコーディングする(604)ようにも構成され得る。一例では、SEIメッセージまたはスライスヘッダは、SEIメッセージの場合、1つのスライスまたは複数の連続するスライスについてのISP IDを示す。ビデオデコーダ30は、そのISP IDを使って、ROIに対応するスライスを識別し、復号する。いくつかの例は、ISP IDを使って、ROI
ISP中にあるスライスを示すことができる。SEIメッセージは、ISP IDをスライスに関連付けることもできる。
[0165] 本開示によると、ビデオデータをコーディングするためのシステム、方法、または装置は、ISPが有効化されているかどうかを示すための情報をコーディングすることができ、情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいてコーディングすることを備える。ビデオデータをコーディングするためのシステム、方法、または装置は、1つまたは複数のISPの各々についてのISP IDを示す情報をコーディングすることもでき、情報を、1つまたは複数のISPの各々についてのISP
IDを示すように、スライスヘッダまたはSEIメッセージ中でコーディングすることを備える。情報は、たとえば、SEIメッセージ、またはスライスヘッダ中のフラグもしくはシンタックス要素によって示すことができる。いくつかの例では、SEIメッセージ中またはスライスヘッダ中でISP IDが提供され得る。したがって、いくつかの例示的システムは、ISP IDに基づいて、ROIを判断することができる。たとえば、いくつかのシステムは、ISP IDに基づいて、スライスのうちの1つまたは複数がROIそれとも非ROIスライスであるか判断することができる
[0166] ビデオデータをコーディングするためのこれらのシステム、方法、または装置は、1つまたは複数のビデオデータスライスをISPに関連付けることができる。本開示によると、ビデオデータをコーディングするためのシステム、方法、または装置は、ISPの数と、ISPの位置と、ISPのサイズとを含むISP特性を、コード化ビデオシーケンス中でコーディングすることができる。これらのシステム、方法、または装置は、ISP特性を、SEIメッセージ、シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおいてコーディングすることができる。
[0167] いくつかの例では、ビデオデコーダ30は、ROIを復号する際、ISP IDを使うことができる。たとえば、SEIメッセージが、ISP IDを示し得る。SEIメッセージに後続するスライスは、次のSEIメッセージまで、同じISPに関連付けられ得る。これは、図4を参照して論じたGDRに関して使われる方法論と同様であり得る。いくつかの例では、ROI中のスライスすべてに対して、ISP IDが使われ得る。ISP IDの特殊な値(たとえば、無効値)をもつスライスが使われてもよい。たとえば、ヌル値も、ROI中にないスライスを示すのに使われ得る。例によっては、本明細書で説明した技法のうちいずれかの、いくつかの作用またはイベントは、異なるシーケンスで実装されてよく、追加、マージ、または完全に除外され得る(たとえば、すべての説明した作用またはイベントが、本技法の実施のために必要であるとは限らない)ことを認識されたい。さらに、いくつかの例では、作用またはイベントは、連続的にではなく、同時に、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して実施され得る。
[0168] 1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されてよく、あるいは、コンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を支援する任意の媒体を含む、データ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のための命令、コードおよび/またはデータ構造を取り出すために、1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0169] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的な有形記憶媒体を対象とすることを理解されたい。本明細書で使用する場合、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル多用途ディスク(DVD)、フロッピー(登録商標)ディスク、およびブルーレイディスクを含み、ディスク(disk)は、通常、磁気的にデータを再生し、ディスク(disc)は、レーザーで光学的にデータを再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
[0170] 命令は、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、または他の等価な集積回路もしくはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のハードウェアおよび/もしくはソフトウェアモジュール内に与えられ得、または複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素中に十分に実装され得る。
[0171] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実施するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要はない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
[0172] 様々な例について説明してきた。これらおよび他の例は、以下の特許請求の範囲内である。
[0172] 様々な例について説明してきた。これらおよび他の例は、以下の特許請求の範囲内である。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを復号する方法であって、
ピクチャの漸次デコーダリフレッシュ(GDR)が有効化されているかどうかを示す情報を復号することと、
GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することとを備える方法。
[C2]
前記情報は、補足強調情報(SEI)メッセージおよびスライスヘッダのうちの1つの中のフラグを備える、C1に記載の方法。
[C3]
前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記方法は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を復号することをさらに備える、C1に記載の方法。
[C4]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータを復号することをさらに備える、C3に記載の方法。
[C5]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄することをさらに備える、C4に記載の方法。
[C6]
前記ピクチャの前記1つまたは複数のスライスが前記ピクチャの前記フォアグラウンド領域に属すことに基づいて、前記ピクチャの前記フォアグラウンド領域に対応するビデオデータを生成することをさらに備える、C1に記載の方法。
[C7]
GDRが有効化されているかどうかを示すための情報を復号することは、GDRが有効化されているかどうかを示すための前記情報を、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいて復号することを備える、C1に記載の方法。
[C8]
前記GDR開始点からランダムアクセスを実施することをさらに備える、C7に記載の方法。
[C9]
前記SEIメッセージ中のフォアグラウンドフラグは、次のSEIメッセージの前に受信された1つまたは複数の後続スライスについてのステータスを示す、C8に記載の方法。
[C10]
ビデオデータを符号化する方法であって、
ピクチャのGDRが有効化されているかどうかを示す情報を符号化することと、
GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報を符号化することとを備える方法。
[C11]
前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、C10に記載の方法。
[C12]
前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記方法は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を符号化することをさらに備える、C10に記載の方法。
[C13]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータを符号化することをさらに備える、C12に記載の方法。
[C14]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄することをさらに備える、C13に記載の方法。
[C15]
GDRが有効化されているかどうかを示すための情報を符号化することは、GDRが有効化されているかどうかを示すための前記情報を、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいて符号化することを備える、C10に記載の方法。
[C16]
ビデオデータをコーディングするための装置であって、
ピクチャのGDRが有効化されているかどうかを示す情報をコーディングし、
GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングするように構成された1つまたは複数のプロセッサを備える装置。
[C17]
前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、C16に記載の装置。
[C18]
前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記1つまたは複数のプロセッサは、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報をコーディングするようにさらに構成される、C16に記載の装置。
[C19]
前記1つまたは複数のプロセッサは、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングするようにさらに構成される、C18に記載の装置。
[C20]
前記1つまたは複数のプロセッサは、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄するようにさらに構成される、C19に記載の装置。
[C21]
前記1つまたは複数のプロセッサは、GDRが有効化されているかどうかを示すための情報をコーディングするようにさらに構成され、GDRが、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいてコーディング中であるかどうかを示すための前記情報をコーディングすることを備える、C16に記載の装置。
[C22]
ピクチャのGDRが有効化されているかどうかを示す前記情報、およびスライスが前記ピクチャの前記フォアグラウンド領域に属すかどうかを示す前記情報のうちの少なくとも1つを符号化するように構成されたビデオエンコーダを備える、C16に記載の装置。
[C23]
ピクチャのGDRが有効化されているかどうかを示す前記情報、およびスライスが前記ピクチャの前記フォアグラウンド領域に属すかどうかを示す前記情報のうちの少なくとも1つを復号するように構成されたビデオデコーダを備える、C16に記載の装置。
[C24]
前記1つまたは複数のプロセッサは、前記ピクチャの前記1つまたは複数のスライスが前記ピクチャの前記フォアグラウンド領域に属すことに基づいて、前記ピクチャの前記フォアグラウンド領域に対応するビデオデータを生成するようにさらに構成される、C16に記載の装置。
[C25]
前記1つまたは複数のプロセッサは、前記GDR開始点からランダムアクセスを実施するようにさらに構成される、C24に記載の装置。
[C26]
SEIメッセージ中のフォアグラウンドフラグは、次のSEIメッセージの前に受信された1つまたは複数の後続スライスについてのステータスを示す、C25に記載の装置。
[C27]
ビデオデータをコーディングするための装置であって、
ピクチャのGDRが有効化されているかどうかを示す情報をコーディングするための手段と、
GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングするための手段とを備える装置。
[C28]
前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、C27に記載の装置。
[C29]
前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記装置は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報をコーディングするための手段をさらに備える、C27に記載の装置。
[C30]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングするための手段をさらに備える、C29に記載の装置。
[C31]
前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄するための手段をさらに備える、C30に記載の装置。
[C32]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されると、デバイスの1つまたは複数のプロセッサに、
ピクチャのGDRが有効化されているかどうかを示す情報をコーディングさせ、
GDRが有効化されているとき、1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングさせる、コンピュータ可読記憶媒体。
[C33]
前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、C32に記載のコンピュータ可読記憶媒体。
[C34]
前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記1つまたは複数のプロセッサは、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を復号するようにさらに構成される、C32に記載のコンピュータ可読記憶媒体。
[C35]
前記1つまたは複数のプロセッサに、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングさせるようにさらに構成された、C34に記載のコンピュータ可読記憶媒体。
[C36]
前記1つまたは複数のプロセッサに、前記GDR開始点と前記GDR回復点との間の、ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄させるようにさらに構成された、C35に記載のコンピュータ可読記憶媒体。
[C37]
ビデオデータを復号する方法であって、
ピクチャのスライスについて、前記ISPのうちの1つについてのISP識別(ISP
ID)に対応するビデオデータを復号することと、
前記ISPを使って、ROIに対応するビデオデータを復号することとを備える方法。
[C38]
ISPが有効化されているかどうかを示すための情報を復号することをさらに備えることは、ISPが有効化されているかどうかを示すための情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて復号することを備える、C37に記載の方法。
[C39]
1つまたは複数のISPの各々についてのISP IDを復号することは、スライスヘッダまたはSEIメッセージ中の、ISPが有効化されているかどうかを示すための情報を復号して、前記部分に与えられた前記ISP IDに基づいて、ISPに対応する、前記ピクチャの部分を識別することを備える、C37に記載の方法。
[C40]
前記ISP IDに基づくISPに対応する、前記ピクチャの前記部分はスライスを備える、C37に記載の方法。
[C41]
前記ROIに対応しないビデオデータが破棄され得るように、復号ビデオシーケンス中の、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を復号することをさらに備える、C37に記載の方法。
[C42]
SEIメッセージ中の前記ISP特性を復号することをさらに備える、C41に記載の方法。
[C43]
シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性を復号することをさらに備える、C41に記載の方法。
[C44]
2つ以上のISPがあり、少なくとも1つのISP中の1つまたは複数のスライスはフォアグラウンドスライスであり、別のISP中の1つまたは複数のスライスはバックグラウンドスライスである、C41に記載の方法。
[C45]
前記ISP IDのスライスを復号することと、
前記ISP IDに基づいて、前記スライスのうちの1つまたは複数が、ROIそれとも非ROIスライスであるか判断することとをさらに備える、C37に記載の方法。
[C46]
ビデオデータを符号化する方法であって、
前記ISPのうちの1つについてのISP IDを示す情報を符号化することと、
ROIに対応するビデオデータを前記ISPのうちの1つとして符号化することとを備える方法。
[C47]
ISPが有効化されているかどうかを示すための情報を符号化することは、ISPが有効化されているかどうかを示すための前記情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて符号化することを備える、C46に記載の方法。
[C48]
1つまたは複数のISPの各々についてのISP IDを示す情報を符号化することは、1つまたは複数のISPの各々についてのISP IDを示す前記情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたはSEIメッセージ中で符号化することを備える、C46に記載の方法。
[C49]
1つまたは複数のビデオデータスライスを前記ISPに関連付けることをさらに備える、C46に記載の方法。
[C50]
前記ROIに対応しないビデオデータが破棄され得るように、コード化ビデオシーケンス中の、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を符号化することをさらに備える、C46に記載の方法。
[C51]
前記ISP特性をSEIメッセージ中で符号化することをさらに備える、C50に記載の方法。
[C52]
シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性を符号化することをさらに備える、C50に記載の方法。
[C53]
ビデオデータをコーディングするための装置であって、
1つのプロセッサまたは複数のプロセッサを備え、前記プロセッサが、
1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングし、
独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
IDを示す情報をコーディングし、
ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングするように構成される装置。
[C54]
前記1つのプロセッサまたは複数のプロセッサは、ISPが有効化されているかどうかを示すための情報をコーディングするようにさらに構成され、ISPが有効化されているかどうかを示すための前記情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいてコーディングすることを備える、C53に記載の装置。
[C55]
前記1つのプロセッサまたは複数のプロセッサは、1つまたは複数のISPの各々についてのISP IDを示す情報をコーディングするようにさらに構成され、スライスヘッダまたはSEIメッセージ中の1つまたは複数のISPの各々についてのISP IDを示す前記情報をコーディングして、1つまたは複数のISPの各々についてのISP IDを示すことを備える、C53に記載の装置。
[C56]
前記1つのプロセッサまたは複数のプロセッサは、1つまたは複数のビデオデータスライスを前記ISPに関連付けるようにさらに構成される、C53に記載の装置。
[C57]
前記1つのプロセッサまたは複数のプロセッサは、前記ROIに対応しないビデオデータが破棄され得るように、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を、コード化ビデオシーケンス中でコーディングするようにさらに構成される、C53に記載の装置。
[C58]
前記1つのプロセッサまたは複数のプロセッサは、SEIメッセージ中の前記ISP特性をコーディングするようにさらに構成される、C57に記載の装置。
[C59]
前記1つのプロセッサまたは複数のプロセッサは、シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性をコーディングするようにさらに構成される、C57に記載の装置。
[C60]
前記1つのプロセッサまたは複数のプロセッサは、ビデオをコーディングするようにさらに構成される、C57に記載の装置。
[C61]
前記1つのプロセッサまたは複数のプロセッサは、ビデオを復号するようにさらに構成される、C57に記載の装置。
[C62]
前記1つのプロセッサまたは複数のプロセッサは、
コード化ビデオビットストリーム中で前記情報を受信し、
前記情報をコーディングし、
前記情報を使ってビデオデータをコーディングするようにさらに構成される、C53に記載の装置。
[C63]
前記1つのプロセッサまたは複数のプロセッサは、
前記ISPに属すスライスをコーディングし、
前記ISPに属さないスライスを破棄するようにさらに構成される、C62に記載の装置。
[C64]
前記1つのプロセッサまたは複数のプロセッサは、前記ISPに属す前記コード化スライスに基づいて、前記ROIに対応するビデオデータを生成するようにさらに構成される、C63に記載の装置。
[C65]
ビデオデータをコーディングするための装置、
1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングするための手段、
独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
IDを示す情報をコーディングするための手段、
ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングするための手段。
[C66]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されると、デバイスの1つまたは複数のプロセッサに、
1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングさせ、
独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
IDを示す情報をコーディングさせ、
ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングさせる、コンピュータ可読記憶媒体。
[C67]
ビデオデータをコーディングする方法であって、
ピクチャのスライスについての独立サブピクチャ識別(ISP ID)をコーディングすることと、
ROIに対応するISPと同じISP IDを有するスライスをコーディングすることとを備える方法。

Claims (67)

  1. ビデオデータを復号する方法であって、
    ピクチャの漸次デコーダリフレッシュ(GDR)が有効化されているかどうかを示す情報を復号することと、
    GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報を復号することとを備える方法。
  2. 前記情報は、補足強調情報(SEI)メッセージおよびスライスヘッダのうちの1つの中のフラグを備える、請求項1に記載の方法。
  3. 前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記方法は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を復号することをさらに備える、請求項1に記載の方法。
  4. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータを復号することをさらに備える、請求項3に記載の方法。
  5. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄することをさらに備える、請求項4に記載の方法。
  6. 前記ピクチャの前記1つまたは複数のスライスが前記ピクチャの前記フォアグラウンド領域に属すことに基づいて、前記ピクチャの前記フォアグラウンド領域に対応するビデオデータを生成することをさらに備える、請求項1に記載の方法。
  7. GDRが有効化されているかどうかを示すための情報を復号することは、GDRが有効化されているかどうかを示すための前記情報を、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいて復号することを備える、請求項1に記載の方法。
  8. 前記GDR開始点からランダムアクセスを実施することをさらに備える、請求項7に記載の方法。
  9. 前記SEIメッセージ中のフォアグラウンドフラグは、次のSEIメッセージの前に受信された1つまたは複数の後続スライスについてのステータスを示す、請求項8に記載の方法。
  10. ビデオデータを符号化する方法であって、
    ピクチャのGDRが有効化されているかどうかを示す情報を符号化することと、
    GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報を符号化することとを備える方法。
  11. 前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、請求項10に記載の方法。
  12. 前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記方法は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を符号化することをさらに備える、請求項10に記載の方法。
  13. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータを符号化することをさらに備える、請求項12に記載の方法。
  14. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄することをさらに備える、請求項13に記載の方法。
  15. GDRが有効化されているかどうかを示すための情報を符号化することは、GDRが有効化されているかどうかを示すための前記情報を、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいて符号化することを備える、請求項10に記載の方法。
  16. ビデオデータをコーディングするための装置であって、
    ピクチャのGDRが有効化されているかどうかを示す情報をコーディングし、
    GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングするように構成された1つまたは複数のプロセッサを備える装置。
  17. 前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、請求項16に記載の装置。
  18. 前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記1つまたは複数のプロセッサは、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報をコーディングするようにさらに構成される、請求項16に記載の装置。
  19. 前記1つまたは複数のプロセッサは、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングするようにさらに構成される、請求項18に記載の装置。
  20. 前記1つまたは複数のプロセッサは、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄するようにさらに構成される、請求項19に記載の装置。
  21. 前記1つまたは複数のプロセッサは、GDRが有効化されているかどうかを示すための情報をコーディングするようにさらに構成され、GDRが、シーケンスパラメータセット、ビデオパラメータセット、ピクチャパラメータセット、またはSEIメッセージのうちの1つにおいてコーディング中であるかどうかを示すための前記情報をコーディングすることを備える、請求項16に記載の装置。
  22. ピクチャのGDRが有効化されているかどうかを示す前記情報、およびスライスが前記ピクチャの前記フォアグラウンド領域に属すかどうかを示す前記情報のうちの少なくとも1つを符号化するように構成されたビデオエンコーダを備える、請求項16に記載の装置。
  23. ピクチャのGDRが有効化されているかどうかを示す前記情報、およびスライスが前記ピクチャの前記フォアグラウンド領域に属すかどうかを示す前記情報のうちの少なくとも1つを復号するように構成されたビデオデコーダを備える、請求項16に記載の装置。
  24. 前記1つまたは複数のプロセッサは、前記ピクチャの前記1つまたは複数のスライスが前記ピクチャの前記フォアグラウンド領域に属すことに基づいて、前記ピクチャの前記フォアグラウンド領域に対応するビデオデータを生成するようにさらに構成される、請求項16に記載の装置。
  25. 前記1つまたは複数のプロセッサは、前記GDR開始点からランダムアクセスを実施するようにさらに構成される、請求項24に記載の装置。
  26. SEIメッセージ中のフォアグラウンドフラグは、次のSEIメッセージの前に受信された1つまたは複数の後続スライスについてのステータスを示す、請求項25に記載の装置。
  27. ビデオデータをコーディングするための装置であって、
    ピクチャのGDRが有効化されているかどうかを示す情報をコーディングするための手段と、
    GDRが有効化されているとき、前記ピクチャの1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングするための手段とを備える装置。
  28. 前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、請求項27に記載の装置。
  29. 前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記装置は、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報をコーディングするための手段をさらに備える、請求項27に記載の装置。
  30. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングするための手段をさらに備える、請求項29に記載の装置。
  31. 前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄するための手段をさらに備える、請求項30に記載の装置。
  32. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されると、デバイスの1つまたは複数のプロセッサに、
    ピクチャのGDRが有効化されているかどうかを示す情報をコーディングさせ、
    GDRが有効化されているとき、1つまたは複数のスライスが前記ピクチャのフォアグラウンド領域に属すかどうかを示す情報をコーディングさせる、コンピュータ可読記憶媒体。
  33. 前記情報は、SEIメッセージおよびスライスヘッダのうちの1つの中のフラグを備える、請求項32に記載のコンピュータ可読記憶媒体。
  34. 前記ピクチャは、複数のピクチャのうちの1つを備え、前記フォアグラウンド領域は、複数のフォアグラウンド領域のうちの1つを備え、前記複数のピクチャの各々は、フォアグラウンド領域を有し、これらのフォアグラウンド領域の各々は、1つまたは複数のスライスを有し、前記1つまたは複数のプロセッサは、GDR開始点およびGDR回復点に対応する前記それぞれのピクチャを示す情報を復号するようにさらに構成される、請求項32に記載のコンピュータ可読記憶媒体。
  35. 前記1つまたは複数のプロセッサに、前記GDR開始点と前記GDR回復点との間の、前記ピクチャ中の前記フォアグラウンド領域に属す前記スライスに対応するビデオデータをコーディングさせるようにさらに構成された、請求項34に記載のコンピュータ可読記憶媒体。
  36. 前記1つまたは複数のプロセッサに、前記GDR開始点と前記GDR回復点との間の、ピクチャ中の前記フォアグラウンド領域に属さない前記スライスに対応するビデオデータを破棄させるようにさらに構成された、請求項35に記載のコンピュータ可読記憶媒体。
  37. ビデオデータを復号する方法であって、
    ピクチャのスライスについて、前記ISPのうちの1つについてのISP識別(ISP
    ID)に対応するビデオデータを復号することと、
    前記ISPを使って、ROIに対応するビデオデータを復号することとを備える方法。
  38. ISPが有効化されているかどうかを示すための情報を復号することをさらに備えることは、ISPが有効化されているかどうかを示すための情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて復号することを備える、請求項37に記載の方法。
  39. 1つまたは複数のISPの各々についてのISP IDを復号することは、スライスヘッダまたはSEIメッセージ中の、ISPが有効化されているかどうかを示すための情報を復号して、前記部分に与えられた前記ISP IDに基づいて、ISPに対応する、前記ピクチャの部分を識別することを備える、請求項37に記載の方法。
  40. 前記ISP IDに基づくISPに対応する、前記ピクチャの前記部分はスライスを備える、請求項37に記載の方法。
  41. 前記ROIに対応しないビデオデータが破棄され得るように、復号ビデオシーケンス中の、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を復号することをさらに備える、請求項37に記載の方法。
  42. SEIメッセージ中の前記ISP特性を復号することをさらに備える、請求項41に記載の方法。
  43. シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性を復号することをさらに備える、請求項41に記載の方法。
  44. 2つ以上のISPがあり、少なくとも1つのISP中の1つまたは複数のスライスはフォアグラウンドスライスであり、別のISP中の1つまたは複数のスライスはバックグラウンドスライスである、請求項41に記載の方法。
  45. 前記ISP IDのスライスを復号することと、
    前記ISP IDに基づいて、前記スライスのうちの1つまたは複数が、ROIそれとも非ROIスライスであるか判断することとをさらに備える、請求項37に記載の方法。
  46. ビデオデータを符号化する方法であって、
    前記ISPのうちの1つについてのISP IDを示す情報を符号化することと、
    ROIに対応するビデオデータを前記ISPのうちの1つとして符号化することとを備える方法。
  47. ISPが有効化されているかどうかを示すための情報を符号化することは、ISPが有効化されているかどうかを示すための前記情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいて符号化することを備える、請求項46に記載の方法。
  48. 1つまたは複数のISPの各々についてのISP IDを示す情報を符号化することは、1つまたは複数のISPの各々についてのISP IDを示す前記情報を、1つまたは複数のISPの各々についてのISP IDを示すように、スライスヘッダまたはSEIメッセージ中で符号化することを備える、請求項46に記載の方法。
  49. 1つまたは複数のビデオデータスライスを前記ISPに関連付けることをさらに備える、請求項46に記載の方法。
  50. 前記ROIに対応しないビデオデータが破棄され得るように、コード化ビデオシーケンス中の、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を符号化することをさらに備える、請求項46に記載の方法。
  51. 前記ISP特性をSEIメッセージ中で符号化することをさらに備える、請求項50に記載の方法。
  52. シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性を符号化することをさらに備える、請求項50に記載の方法。
  53. ビデオデータをコーディングするための装置であって、
    1つのプロセッサまたは複数のプロセッサを備え、前記プロセッサが、
    1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングし、
    独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
    IDを示す情報をコーディングし、
    ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングするように構成される装置。
  54. 前記1つのプロセッサまたは複数のプロセッサは、ISPが有効化されているかどうかを示すための情報をコーディングするようにさらに構成され、ISPが有効化されているかどうかを示すための前記情報を、ISPが有効化されているかどうかを示すように、シーケンスパラメータセット、ビデオパラメータセットまたはピクチャパラメータセットのうちの1つにおいてコーディングすることを備える、請求項53に記載の装置。
  55. 前記1つのプロセッサまたは複数のプロセッサは、1つまたは複数のISPの各々についてのISP IDを示す情報をコーディングするようにさらに構成され、スライスヘッダまたはSEIメッセージ中の1つまたは複数のISPの各々についてのISP IDを示す前記情報をコーディングして、1つまたは複数のISPの各々についてのISP IDを示すことを備える、請求項53に記載の装置。
  56. 前記1つのプロセッサまたは複数のプロセッサは、1つまたは複数のビデオデータスライスを前記ISPに関連付けるようにさらに構成される、請求項53に記載の装置。
  57. 前記1つのプロセッサまたは複数のプロセッサは、前記ROIに対応しないビデオデータが破棄され得るように、前記ISPの数と、前記ISPの位置と、前記ISPのサイズとを含むISP特性を、コード化ビデオシーケンス中でコーディングするようにさらに構成される、請求項53に記載の装置。
  58. 前記1つのプロセッサまたは複数のプロセッサは、SEIメッセージ中の前記ISP特性をコーディングするようにさらに構成される、請求項57に記載の装置。
  59. 前記1つのプロセッサまたは複数のプロセッサは、シーケンスパラメータセット、ビデオパラメータセット、またはピクチャパラメータセットのうちの1つにおける前記ISP特性をコーディングするようにさらに構成される、請求項57に記載の装置。
  60. 前記1つのプロセッサまたは複数のプロセッサは、ビデオをコーディングするようにさらに構成される、請求項57に記載の装置。
  61. 前記1つのプロセッサまたは複数のプロセッサは、ビデオを復号するようにさらに構成される、請求項57に記載の装置。
  62. 前記1つのプロセッサまたは複数のプロセッサは、
    コード化ビデオビットストリーム中で前記情報を受信し、
    前記情報をコーディングし、
    前記情報を使ってビデオデータをコーディングするようにさらに構成される、請求項53に記載の装置。
  63. 前記1つのプロセッサまたは複数のプロセッサは、
    前記ISPに属すスライスをコーディングし、
    前記ISPに属さないスライスを破棄するようにさらに構成される、請求項62に記載の装置。
  64. 前記1つのプロセッサまたは複数のプロセッサは、前記ISPに属す前記コード化スライスに基づいて、前記ROIに対応するビデオデータを生成するようにさらに構成される、請求項63に記載の装置。
  65. ビデオデータをコーディングするための装置、
    1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングするための手段、
    独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
    IDを示す情報をコーディングするための手段、
    ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングするための手段。
  66. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されると、デバイスの1つまたは複数のプロセッサに、
    1つまたは複数のISPが有効化されているかどうかを示す情報をコーディングさせ、
    独立サブピクチャが有効化されているとき、前記ISPのうちの1つについてのISP
    IDを示す情報をコーディングさせ、
    ROIに対応するビデオデータを、前記ISPのうちの1つとしてコーディングさせる、コンピュータ可読記憶媒体。
  67. ビデオデータをコーディングする方法であって、
    ピクチャのスライスについての独立サブピクチャ識別(ISP ID)をコーディングすることと、
    ROIに対応するISPと同じISP IDを有するスライスをコーディングすることとを備える方法。
JP2017152454A 2012-09-28 2017-08-07 ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング Active JP6495390B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261707729P 2012-09-28 2012-09-28
US61/707,729 2012-09-28
US14/010,054 2013-08-26
US14/010,054 US9491457B2 (en) 2012-09-28 2013-08-26 Signaling of regions of interest and gradual decoding refresh in video coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015534501A Division JP2015534775A (ja) 2012-09-28 2013-08-27 ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング

Publications (2)

Publication Number Publication Date
JP2017225159A true JP2017225159A (ja) 2017-12-21
JP6495390B2 JP6495390B2 (ja) 2019-04-03

Family

ID=50385163

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015534501A Withdrawn JP2015534775A (ja) 2012-09-28 2013-08-27 ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング
JP2017152454A Active JP6495390B2 (ja) 2012-09-28 2017-08-07 ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015534501A Withdrawn JP2015534775A (ja) 2012-09-28 2013-08-27 ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング

Country Status (9)

Country Link
US (1) US9491457B2 (ja)
EP (1) EP2901677B1 (ja)
JP (2) JP2015534775A (ja)
KR (1) KR101743852B1 (ja)
CN (1) CN104823449B (ja)
DK (1) DK2901677T3 (ja)
ES (1) ES2884723T3 (ja)
HU (1) HUE055955T2 (ja)
WO (1) WO2014051915A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526173A (ja) * 2019-12-30 2022-05-23 テンセント・アメリカ・エルエルシー 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3122048T3 (pl) 2012-09-26 2018-07-31 Velos Media International Limited Sposób kodowania obrazów oraz urządzenie kodujące obrazy
US9706199B2 (en) 2012-09-28 2017-07-11 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US10178398B2 (en) * 2013-10-11 2019-01-08 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
US10567765B2 (en) * 2014-01-15 2020-02-18 Avigilon Corporation Streaming multiple encodings with virtual stream identifiers
US9787986B2 (en) * 2014-06-30 2017-10-10 Intel Corporation Techniques for parallel video transcoding
CN104469395B (zh) * 2014-12-12 2017-11-07 华为技术有限公司 图像传输方法和装置
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
KR20170091323A (ko) * 2016-02-01 2017-08-09 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
US10582201B2 (en) * 2016-05-19 2020-03-03 Qualcomm Incorporated Most-interested region in an image
EP3485643B1 (en) 2016-07-14 2023-09-06 Koninklijke KPN N.V. Video coding
CN109997310B (zh) * 2016-10-14 2022-12-09 奥罗技术公司 通过用修改后的有效载荷校验和加扰有效载荷来避免错误同步的记录和回放设备
US11290755B2 (en) 2017-01-10 2022-03-29 Qualcomm Incorporated Signaling data for prefetching support for streaming media data
CN107734331A (zh) * 2017-11-17 2018-02-23 南京理工大学 一种基于hevc标准的视频转码方法
CN108600863A (zh) * 2018-03-28 2018-09-28 腾讯科技(深圳)有限公司 多媒体文件处理方法和装置、存储介质及电子装置
US10567781B2 (en) * 2018-05-01 2020-02-18 Agora Lab, Inc. Progressive I-slice reference for packet loss resilient video coding
AU2019268844B2 (en) * 2018-05-15 2022-09-29 FG Innovation Company Limited Image encoding device, encoded stream extraction device, and image decoding device
EP3836541A4 (en) * 2018-08-06 2022-06-22 Sharp Kabushiki Kaisha MOVING PICTURE DECODING APPARATUS AND MOVING PICTURE CODING APPARATUS
JPWO2020045248A1 (ja) * 2018-08-29 2021-08-12 シャープ株式会社 動画像復号装置および動画像符号化装置
GB201817784D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media
CN109618186B (zh) * 2018-11-15 2021-01-01 中国航空工业集团公司洛阳电光设备研究所 一种采用fpga实现的h264/avc视频辅助增强信息封装电路
US10972755B2 (en) * 2018-12-03 2021-04-06 Mediatek Singapore Pte. Ltd. Method and system of NAL unit header structure for signaling new elements
SG11202106524PA (en) 2018-12-20 2021-07-29 Ericsson Telefon Ab L M Normative indication of recovery point
AU2020206246B2 (en) * 2019-01-09 2024-01-04 Huawei Technologies Co., Ltd. Sub-picture layout signaling in video coding
MX2021009140A (es) * 2019-02-01 2021-10-13 Fraunhofer Ges Forschung Codec de video que permite el acceso aleatorio a subimágenes o regiones y concepto para la composición de video usando el mismo.
CN113348671A (zh) 2019-02-05 2021-09-03 北京达佳互联信息技术有限公司 使用帧内子分区编码模式的视频编码
CN111263156B (zh) * 2019-02-20 2022-03-25 北京达佳互联信息技术有限公司 视频解码方法、视频编码方法及装置
MX2021011016A (es) * 2019-03-11 2021-11-12 Huawei Tech Co Ltd Un codificador, un decodificador y métodos correspondientes.
EP3928511A4 (en) 2019-03-11 2022-06-22 Huawei Technologies Co., Ltd. STEP-BY-STEP DECODE REFRESH IN VIDEO ENCODING
CN113924784A (zh) * 2019-03-12 2022-01-11 现代自动车株式会社 用于编码和解码影像的方法和装置
CN118018726A (zh) 2019-03-13 2024-05-10 Oppo广东移动通信有限公司 图像编码/解码方法和装置以及发送比特流的方法
EP3910952B1 (en) 2019-04-23 2023-06-21 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image decoding method, decoder and storage medium
US11581022B2 (en) * 2019-05-29 2023-02-14 Nokia Technologies Oy Method and apparatus for storage and signaling of compressed point clouds
CN114270831A (zh) 2019-08-10 2022-04-01 北京字节跳动网络技术有限公司 视频处理中的子图片尺寸定义
WO2021039578A1 (ja) * 2019-08-29 2021-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
JP7304419B2 (ja) * 2019-09-06 2023-07-06 株式会社ソニー・インタラクティブエンタテインメント 送信装置、送信方法及びプログラム
WO2021045147A1 (ja) * 2019-09-06 2021-03-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
KR20220063262A (ko) 2019-09-23 2022-05-17 후아웨이 테크놀러지 컴퍼니 리미티드 서브픽처 기반 비디오 코딩에서 서브픽처당 하나의 슬라이스의 지시
EP4026097A4 (en) * 2019-09-24 2023-01-25 Huawei Technologies Co., Ltd. SIGNALING AN IMAGE HEAD IN VIDEO ENCODING
CA3152298A1 (en) * 2019-09-24 2021-04-01 Ye-Kui Wang Support of mixed irap and non-irap pictures within an access unit in multi-layer video bitstreams
US11936880B2 (en) * 2019-09-27 2024-03-19 Tencent America LLC Method for signaling output subpicture layer set
MX2022003765A (es) 2019-10-02 2022-04-20 Beijing Bytedance Network Tech Co Ltd Sintaxis para la se?alizacion de subimagen en un flujo de bits de video.
JP7482220B2 (ja) 2019-10-18 2024-05-13 北京字節跳動網絡技術有限公司 サブピクチャのパラメータセットシグナリングにおける構文制約
KR20220114555A (ko) * 2019-12-25 2022-08-17 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 비트스트림에서 서브픽처 레벨의 파라미터들의 시그널링
CN114830662B (zh) * 2019-12-27 2023-04-14 阿里巴巴(中国)有限公司 用于对图像执行逐步解码刷新处理的方法和系统
US11330305B2 (en) * 2020-02-24 2022-05-10 Qualcomm Incorporated Signaling constraints and sequence parameter set sharing in video coding
JP7450747B2 (ja) * 2020-03-05 2024-03-15 エルジー エレクトロニクス インコーポレイティド 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
KR20220156831A (ko) * 2020-03-20 2022-11-28 바이트댄스 아이엔씨 서브픽처의 레퍼런스 픽처 목록에 대한 제약
KR20220161411A (ko) * 2020-04-01 2022-12-06 엘지전자 주식회사 Gdr에 대한 리커버리 포인트 관련 정보의 시그널링 기반 영상 또는 비디오 코딩
KR20230002534A (ko) * 2020-04-13 2023-01-05 오피 솔루션즈, 엘엘씨 결합된 무손실 및 손실 코딩을 위한 방법들 및 시스템들
KR20230002395A (ko) 2020-04-20 2023-01-05 바이트댄스 아이엔씨 레퍼런스 픽처 목록에 대한 제약

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252218A1 (en) * 2008-04-07 2009-10-08 Fujitsu Limited Moving image coding apparatus, moving image decoding apparatus, moving image coding method and moving image decoding method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI114679B (fi) * 2002-04-29 2004-11-30 Nokia Corp Satunnaisaloituspisteet videokoodauksessa
KR100754419B1 (ko) 2002-07-16 2007-08-31 노키아 코포레이션 비디오 코딩시 랜덤 액세스 및 점진적 화상 리프레시를위한 방법
US20040260827A1 (en) * 2003-06-19 2004-12-23 Nokia Corporation Stream switching based on gradual decoder refresh
US20080095228A1 (en) 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
EP2392138A4 (en) * 2009-01-28 2012-08-29 Nokia Corp METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING
TW201210325A (en) * 2010-07-21 2012-03-01 Nokia Corp Method and apparatus for indicating switching points in a streaming session
US8723914B2 (en) 2010-11-19 2014-05-13 Cisco Technology, Inc. System and method for providing enhanced video processing in a network environment
CN103907347B (zh) * 2011-08-31 2018-01-30 诺基亚技术有限公司 多视图视频编码和解码
KR101862329B1 (ko) * 2012-01-20 2018-05-29 지이 비디오 컴프레션, 엘엘씨 병렬 처리, 전송 디멀티플렉서 및 비디오 비트스트림을 허용하는 코딩 개념
RU2625534C2 (ru) * 2012-07-02 2017-07-14 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252218A1 (en) * 2008-04-07 2009-10-08 Fujitsu Limited Moving image coding apparatus, moving image decoding apparatus, moving image coding method and moving image decoding method
JP2009272660A (ja) * 2008-04-07 2009-11-19 Fujitsu Ltd 動画像符号化装置、動画像復号化装置及びその符号化、復号化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YE-KUI WANG TICSP TAMPERE UNIV. OF TECHNOLOGY P.O. BOX 553 FIN-33101 TAMPERE FINLAND: "On Random Access[online]", JVT-D JVT-D097, JPN6018028604 *
YE-KUI WANG TICSPTAMPERE UNIV. OF TECHNOLOGY P.O. BOX 553 FIN-33101 TAMPERE FINLAND: "Gradual Decoder Refresh Using Isolated Regions[online]", JVT-C JVT-C074, JPN6018028606 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526173A (ja) * 2019-12-30 2022-05-23 テンセント・アメリカ・エルエルシー 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム
JP7319384B2 (ja) 2019-12-30 2023-08-01 テンセント・アメリカ・エルエルシー 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム
US11765373B2 (en) 2019-12-30 2023-09-19 Tencent America LLC Method for layerwise random access in a coded video stream

Also Published As

Publication number Publication date
KR101743852B1 (ko) 2017-06-05
CN104823449A (zh) 2015-08-05
EP2901677A1 (en) 2015-08-05
JP6495390B2 (ja) 2019-04-03
HUE055955T2 (hu) 2022-01-28
DK2901677T3 (da) 2021-08-30
JP2015534775A (ja) 2015-12-03
EP2901677B1 (en) 2021-07-28
ES2884723T3 (es) 2021-12-10
CN104823449B (zh) 2018-04-20
KR20150065762A (ko) 2015-06-15
US9491457B2 (en) 2016-11-08
WO2014051915A1 (en) 2014-04-03
US20140092963A1 (en) 2014-04-03

Similar Documents

Publication Publication Date Title
JP6495390B2 (ja) ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング
JP6903644B2 (ja) ビデオコーディングのために位置依存の予測組合せを使用する改善されたビデオイントラ予測
JP6169689B2 (ja) ビデオコーディングにおける長期参照ピクチャのランダムアクセスおよびシグナリング
JP6162236B2 (ja) ビデオコード化のためのseinalのコード化
US9973782B2 (en) Signaling layer identifiers for operation points in video coding
JP6242913B2 (ja) ビデオコーディングにおける時間的スケーラビリティサポートを用いた漸次復号リフレッシュ
JP6285024B2 (ja) マルチレイヤビデオコーディングのためのレイヤ間予測シグナリングに対する最適化
JP6046246B2 (ja) 3dビデオコーディングのための深度マップのイントラコーディング
JP2020074547A (ja) インター色成分残差予測
JP5859581B2 (ja) ビデオコーデックにおけるバッファ管理
JP6337010B2 (ja) ビデオコーディングにおけるビデオタイミングについてのタイミング情報に対するピクチャ順序カウントの関係性のシグナリング
JP2018125863A (ja) ビデオプロパティの指示
JP6239609B2 (ja) ビデオコーディングのための長期参照ピクチャをシグナリングすること
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP2017522799A (ja) ビットストリームパーティションのためのhrdパラメータを信号伝達すること
JP2016535490A (ja) 適応インター色成分残差予測
JP6345675B2 (ja) ビデオコーダの動作点のためのレイヤ識別子の向上したシグナリング
JP2016513913A (ja) 異なるアスペクト比を伴う空間スケーラビリティのためのレイヤ間の参照ピクチャの構築

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190306

R150 Certificate of patent or registration of utility model

Ref document number: 6495390

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250