JP2022538551A - ビデオコーディングレイヤアップスイッチング指示 - Google Patents
ビデオコーディングレイヤアップスイッチング指示 Download PDFInfo
- Publication number
- JP2022538551A JP2022538551A JP2021576024A JP2021576024A JP2022538551A JP 2022538551 A JP2022538551 A JP 2022538551A JP 2021576024 A JP2021576024 A JP 2021576024A JP 2021576024 A JP2021576024 A JP 2021576024A JP 2022538551 A JP2022538551 A JP 2022538551A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- layer
- indication
- identifier value
- layer identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000002123 temporal effect Effects 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 230000003139 buffering effect Effects 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 claims description 3
- 239000010410 layer Substances 0.000 description 297
- 238000010586 diagram Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 6
- 239000011449 brick Substances 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000019395 ammonium persulphate Nutrition 0.000 description 1
- 238000000261 appearance potential spectroscopy Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
- H04N19/895—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
高効率ビデオコーディング(HEVC)は、ITU-TおよびMPEGによって標準化されたブロックベースのビデオコーデックである。HEVCビデオコーデックは時間予測と空間予測の両方を利用する。空間予測は、現在ピクチャ内からのイントラ(I)予測を使用して達成される。時間予測は、前に復号された参照ピクチャからのブロックレベルの単方向(P)インター予測または双方向(B)インター予測を使用して達成される。エンコーダにおいて、残差(residual)と呼ばれる、元のピクセルデータと予測ピクセルデータとの間の差は、周波数領域に変換され、量子化され、次いで、同じくエントロピーコーディングされる、たとえば、予測モードおよび動きベクトルなど、必要な予測パラメータと一緒に送信される前に、エントロピーコーディングされる。デコーダは、残差を取得するために、エントロピー復号、逆量子化、および逆方向変換を実行し、次いで、ピクチャを再構成するために残差をイントラ予測またはインター予測に加算する。
HEVCとVVCの両方がネットワークアブストラクションレイヤ(NAL)を定義する。HEVCおよびVVCにおけるすべてのデータ(すなわち、ビデオコーディングレイヤ(VCL)データまたは非VCLデータの両方)がNALユニット中にカプセル化される。VCL NALユニットは、サンプル値を表すデータを含んでいる。非VCL NALユニットは、パラメータセットおよび補助拡張情報(supplemental enhancement information)(SEI)メッセージなど、追加の関連付けられたデータを含んでいる。
HEVCにおいて、すべてのピクチャは、そのピクチャが属する時間レイヤを指定するTemporalId値に関連付けられる。TemporalId値は、NALユニットヘッダ中のnuh_temporal_id_plus1シンタックス要素から復号される。HEVCにおいて、エンコーダは、上位時間レイヤが廃棄されたときに、下位レイヤに属するピクチャが完全に復号可能であるように、TemporalId値を設定することが必要とされる。たとえば、エンコーダが、時間レイヤ0と、時間レイヤ1と、時間レイヤ2とを使用するビットストリームを出力したと仮定する。その場合、すべてのレイヤ2NALユニットを削除するか、またはすべてのレイヤ1NALユニットとレイヤ2NALユニットとを削除すると、いかなる問題もなしに復号され得るビットストリームが得られる。このことは、エンコーダがそれに準拠しなければならないHEVC仕様における制限によって保証される。たとえば、時間レイヤのピクチャが上位時間レイヤのピクチャを参照することは許容されない。
HEVC(および現行のVVCドラフト)では、段階的時間サブレイヤアクセス(step-wise temporal sub-layer access)(STSA)ピクチャと呼ばれるピクチャタイプがある。HEVCでは、2つのタイプのSTSAピクチャ、すなわち、参照ピクチャでもあるSTSAピクチャであるSTSA_Rと、非参照ピクチャであるSTSAピクチャであるSTSA_Nとがある。現行のVVCドラフトでは、ただ1つのタイプのSTSAピクチャが指定されており、STSAピクチャが参照ピクチャであるのか非参照ピクチャであるのかに関する区別はなされない。
HEVCはまた、時間サブレイヤアクセス(TSA)ピクチャを指定する。STSAピクチャと同様に、HEVCでは、2つのタイプのTSAピクチャ、すなわち、参照ピクチャでもあるTSAピクチャであるTSA_Rと、非参照ピクチャであるTSAピクチャであるTSA_Nとがある。TSAピクチャは現行のVVCドラフトにおいて指定されていない。
HEVCにおける単一レイヤコーディングの場合、アクセスユニット(AU)は単一ピクチャのコード化表現である。AUは、いくつかのビデオコーディングレイヤ(VCL)NALユニット、ならびに非VCL NALユニットからなり得る。
HEVCは、i)ピクチャパラメータセット(PPS)、ii)シーケンスパラメータセット(SPS)、およびiii)ビデオパラメータセット(VPS)という、3つのタイプのパラメータセットを指定する。PPSは、ピクチャ全体に共通であるデータを含んでおり、SPSは、コード化ビデオシーケンス(CVS)に共通であるデータを含んでおり、VPSは、複数のCVSに共通であるデータを含んでいる。
ドラフトVVCビデオコーディング規格は、ピクチャを矩形の空間的に独立した領域に分割する、タイルと呼ばれるツールを含む。ドラフトVVCコーディング規格におけるタイルは、HEVCにおいて使用されるタイルと同様であるが、2ステップ区分機構をもつ。タイルを使用すると、VVCにおけるピクチャは、タイルが行と列との交差部である、サンプルの行と列とに区分され得る。たとえば、ピクチャは、そのピクチャについて合計20個のタイルを生じる、4つのタイル行と5つのタイル列とに分割され得る。
HEVCにおけるスライスの概念は、ピクチャを個別にコード化されたスライスに分割し、ピクチャ中の1つのスライスの復号は同じピクチャ中の他のスライスとは無関係である。異なるコーディングタイプが同じピクチャのスライスのために使用され得る、すなわち、スライスは、Iスライス、Pスライス、またはBスライスであり得る。スライスの主要な目的は、データ損失の場合に再同期を可能にすることである。
HEVCにおけるピクチャは、フルPOC値としても知られる、それらのピクチャ順序カウント(POC)値によって識別される。各スライスはコードワードpic_order_cnt_lsbを含んでおり、pic_order_cnt_lsbはピクチャ中のすべてのスライスについて同じであるとする。pic_order_cnt_lsbは、それが固定長コードワードであるので、フルPOCの最下位ビット(lsb)としても知られており、フルPOCの最下位ビットのみがシグナリングされる。エンコーダとデコーダの両方が、POCを追跡し、符号化/復号される各ピクチャにPOC値を割り当てる。pic_order_cnt_lsbは4~16ビットによってシグナリングされ得る。最大pic_order_cnt_lsb値+1に設定される、HEVCにおいて使用される変数MaxPicOrderCntLsbがある。このことは、pic_order_cnt_lsbをシグナリングするために8ビットが使用される場合、最大値は255であり、MaxPicOrderCntLsbは28=256に設定されることを意味する。ピクチャのピクチャ順序カウント値は、HEVCではPicOrderCntValと呼ばれる。通常、現在ピクチャのためのPicOrderCntValは単にPicOrderCntValと呼ばれる。
HEVCは、スケーラブルHEVC(SHVC)拡張およびマルチビューHEVC(MV-HEVC)拡張を含む、いくつかの拡張を指定する。
一実施形態では、レイヤアップスイッチング指示がもたらされる。レイヤアップスイッチング指示を本明細書ではレイヤアクセス(LA)指示と呼ぶ。アップスイッチが段階的(step-wise)に実行されなければならないいくつかの実施形態では、LA指示は「段階的LA」(SLA)指示と呼ばれることがある。
一実施形態では、ターゲットレイヤidは、LAピクチャのレイヤid値に等しいとして導出され、ソースレイヤidはターゲットレイヤid値-1として導出される。そのような実施形態では、LAピクチャ、またはLAピクチャと同じレイヤに属する、復号順序においてLAピクチャに後続するピクチャのいずれかを復号するときに、LA位置に先行する、LAピクチャと同じレイヤのデータは使用されることが許容されないこととして、ルールが表され得る。このルールは、代替的に、以下の2つのルールを使用して表され得る。
上記のように、LA位置はLA指示から導出される。たとえば、一実施形態では、LA位置は、ビットストリーム中のLA指示の位置に基づいて(たとえば、ビットストリーム中のLA指示の位置のみに基づいて、またはビットストリーム中のLA指示の位置に部分的に基づいて)決定される。別の実施形態では、LA位置は、ビットストリーム中のLA指示の位置と、1つまたは複数のシンタックス要素との組合せに基づいて決定される。
上記のように、様々な実施形態において、a)特定のタイプを有し、b)LAピクチャのレイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)LA位置に先行する、パラメータセットは、LAピクチャ、または、LAピクチャと同じレイヤidを有する、LAピクチャに後続する他のピクチャのいずれかを復号するために使用されない。
デコーダ(または他のネットワークノード)は、どこでアップスイッチが可能であるかを決定するために、LA指示を探索しながらビットストリームを監視し得る。LA指示の位置およびLA位置は、ビットストリーム中の同じ位置であることもあり、ないこともある。しかしながら、上記で説明したように、LA位置はLA指示に基づいて決定される。
一実施形態では、LA指示は、アクセスユニットデリミタNALユニットの1つまたは複数のシンタックス要素から、またはVCL NALユニットの1つまたは複数のシンタックス要素から導出され得る。たとえば、ビットストリームが、LA指示をもつアクセスユニットを含んでいる場合、アクセスユニット中のすべてのVCL NALユニットはLA指示を搬送する。さらに、LA指示をもつアクセスユニットがアクセスユニットデリミタNALユニットを含んでいる場合、アクセスユニットデリミタNALユニットもLA指示を搬送する。
2(a)-アップスイッチが行われた場合、NALユニットがターゲットレイヤid値以下のレイヤid値を有する場合にのみ、NALユニットを復号または転送する。
2(b)-アップスイッチが行われておらず、NALユニットがアクセスユニットデリミタである場合、以下を行う。
2(b)(i)アクセスユニットデリミタがLA指示を含んでいるかどうかを決定するために、アクセスユニットデリミタ中の1つまたは複数のシンタックス要素を検査する。
2(b)(ii)アクセスユニットデリミタがLA指示を含んでいる場合、アクセスユニットデリミタの1つまたは複数のシンタックス要素からアクセスユニットデリミタのレイヤidを決定し、レイヤid値がターゲットレイヤidに等しいかどうかを検査する。
2(b)(iii)レイヤid値がターゲットレイヤidに等しい場合、アクセスユニットNALユニットを復号および/または転送し、アップスイッチが行われたものとみなす。
2(c)他の場合、すなわち、アップスイッチが行われておらず、NALユニットがVCL NALユニットである場合、以下を行う。
2(c)(i)VCL NALユニットがLA指示を含んでいるかどうかを決定するために、VCL NALユニットの1つまたは複数のシンタックス要素を検査する。
2(c)(ii)VCL NALユニットがLA指示を含んでいる場合、VCL NALユニットの1つまたは複数のシンタックス要素からVCL NALユニットのレイヤidを決定し、レイヤid値がターゲットレイヤidに等しいかどうかを検査する。
2(c)(iii)レイヤid値がターゲットレイヤidに等しい場合、VCL NALユニットを復号および/または転送し、アップスイッチが行われたものとみなす。
一実施形態では、以下のように導出される少なくとも3つのLA指示がある。第1のLA指示は、VCL NALユニットの1つまたは複数のシンタックス要素から導出される。第2のLA指示は、APS NALユニットの1つまたは複数のシンタックス要素から導出される。第3のLA指示は、PPS NALユニットの1つまたは複数のシンタックス要素から導出される。アクセスユニットがLA指示を搬送する場合、すべてのVCL NALユニットがLA指示を搬送しなければならない。アクセスユニットがAPSを含んでいる場合、そのAPSもLA指示を搬送しなければならない。同様に、アクセスユニットがPPSを含んでいる場合、そのPPSもLA指示を搬送しなければならない。アクセスユニットがLA指示を搬送しない場合、そのアクセスユニット中のNALユニットはLA指示を搬送しないものとする。
一実施形態では、レイヤ識別子は、スケーラブルまたはマルチビューレイヤ識別子である、時間レイヤ識別子である。
この実施形態では、LA指示は、SPSまたはVPS中のフラグなど、パラメータセット中の1つまたは複数のシンタックス要素から導出され得、LA指示は、ビットストリーム中のいくつかのLA位置を導出するために使用され、したがって、たとえば、特定のNALユニットタイプ、もしくは特定のレイヤid値、または特定のNALユニットタイプと特定のレイヤidとの組合せをもつ、ビットストリーム中のアクセスユニットの第1のNALユニットがビットストリーム中のそれらのLA位置として導出され、ビットストリーム中のそれらのアクセスユニット中のピクチャがLAピクチャとして導出される。
アップスイッチは段階的に実行される必要がない、すなわち、1レイヤのみの増分である必要がない。そのような実施形態では、どの時間レイヤにアップスイッチすることが可能であるか、すなわち、可能なターゲットレイヤはどれであるかが明示的に指定され得る。ターゲットレイヤのセットは、特定のルールによって定義されるか、または、ビットストリーム中、たとえば、アクセスユニットデリミタ中、新しいLA非VCL NALユニット中、またはSEIメッセージ中の1つまたは複数のシンタックス要素によって示され得る。
一実施形態では、アクセスユニットは、LA指示を含んでいるNALユニットを含み、パラメータセットを含んでいるNALユニットをさらに含み、プロセス600は、デコーダが、LA指示を含んでいるNALユニットを受信する前に、パラメータセットを含んでいるNALユニットを受信することと、デコーダがパラメータセットをバッファする(すなわち記憶する)こととをさらに含む。いくつかの実施形態では、LA位置は、パラメータセットを含んでいるNALユニットのビットストリーム中の位置である。
ALF 適応ループフィルタ
APS 適応パラメータセット
AUD アクセスユニットデリミタ
BLA 切断リンクアクセス
CRA クリーンランダムアクセス
CVS コード化ビデオシーケンス
CVSS CVS開始
CU コーディングユニット
DPS デコーダパラメータセット
GRA 漸進的ランダムアクセス
HEVC 高効率ビデオコーディング
IDR 瞬時復号リフレッシュ
IRAP イントラランダムアクセスポイント
JVET ジョイントビデオエクスプロラトリーチーム
LA レイヤアクセス
LMCS ルーママッピングおよびクロマスケーリング
MPEG モーションピクチャエキスパーツグループ
NAL ネットワークアブストラクションレイヤ
PES パケット化エレメンタリストリーム
PPS ピクチャパラメータセット
RADL ランダムアクセス復号可能リーディング
RASL ランダムアクセススキップリーディング
SPS シーケンスパラメータセット
STSA 段階的時間サブレイヤアクセス
TSA 時間サブレイヤアクセス
VCL ビデオコーディングレイヤ
VPS ビデオパラメータセット
VVC 汎用ビデオコーディング
SEI 補助拡張レイヤ
Claims (30)
- ビットストリームからのピクチャのセットを復号するための方法(600)であって、前記方法は、
アクセスユニット中のレイヤアクセス(LA)ピクチャを識別するLA指示を取得すること(s602)であって、i)前記LAピクチャが、レイヤを識別するレイヤ識別子値を有し、ii)前記LAピクチャが復号順序において他のピクチャに先行する、LA指示を取得すること(s602)と、
前記LA指示に基づいて前記ビットストリーム中のLA位置を決定すること(s604)と、
前記LAピクチャと、前記復号順序において前記LAピクチャに後続する前記他のピクチャとを復号すること(s606)と
を含み、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャを復号するために使用されない、方法(600)。 - 前記LA指示が段階的LA(SLA)指示であり、前記LAピクチャがSLAピクチャである、請求項1に記載の方法。
- a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、i)前記復号順序において前記LAピクチャに後続し、かつ、ii)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有する、いかなる他のピクチャをも復号するために使用されない、請求項1または2に記載の方法。
- ビットストリームからピクチャのセットを復号するための方法(700)であって、前記方法は、
アクセスユニット中のレイヤアクセス(LA)ピクチャを識別するLA指示を取得すること(s702)であって、i)前記LAピクチャが、レイヤを識別するレイヤ識別子値を有し、ii)前記LAピクチャが、復号順序において少なくとも1つのピクチャに先行し、前記LAピクチャに後続する前記ピクチャが、前記LAピクチャの前記レイヤ識別子値以上のレイヤ識別子値を有する、LA指示を取得すること(s702)と、
前記LA指示に基づいて前記ビットストリーム中のLA位置を決定すること(s704)と、
前記LAピクチャ、または前記LAピクチャに後続する前記ピクチャが、a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットを使用することを決定すること(s706)と
前記LAピクチャ、または前記復号順序において前記LAピクチャに後続する前記ピクチャが、前記パラメータセットを使用することを決定したことに応答して、エラー状態が存在することを決定すること(s708)と
を含む、方法(700)。 - 前記エラー状態が存在することを決定したことの結果として、
前記エラー状態を報告すること、および/または
エラー隠蔽動作を実行すること
をさらに含む、請求項4に記載の方法。 - ピクチャを符号化するための方法(800)であって、前記方法は、
レイヤアクセス(LA)ピクチャを符号化すること(s802)であって、前記LAピクチャが、レイヤを識別するレイヤ識別子値を有する、LAピクチャを符号化すること(s802)と、
前記LAピクチャがデコーダによってLA指示から識別され得るように、前記LAピクチャを示す前記LA指示を符号化することであって、ビットストリーム中のLA位置が前記LA指示に基づいて識別され得る、前記LAピクチャを示す前記LA指示を符号化することと
を含み、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャを符号化するために使用されない、方法(800)。 - エンコーダが、前記LAピクチャと、前記LAピクチャを識別する前記LA指示と、復号順序において前記LAピクチャに後続する他のピクチャとを出力することをさらに含む、請求項6に記載の方法。
- 復号順序において前記LAピクチャに後続する他のピクチャを符号化すること(s806)をさらに含み、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有する、前記復号順序において前記LAピクチャに後続する前記他のピクチャのうちのいかなる1つをも符号化するために使用されない、請求項6または7に記載の方法。 - 前記アクセスユニットがNALユニットの順序付けされたシーケンスを含み、
前記LA位置が、NALユニットの前記順序付けされたシーケンス中の第1のNALユニットの位置であるように決定される、請求項1から8のいずれか一項に記載の方法。 - 前記特定のタイプが、1つまたは複数の特定のタイプのセット中に含まれる任意のタイプであり、1つまたは複数の特定のタイプの前記セットが適応パラメータセット(APS)タイプを含む、請求項1から9のいずれか一項に記載の方法。
- 前記特定のタイプが、1つまたは複数の特定のタイプのセット中に含まれる任意のタイプであり、1つまたは複数の特定のタイプの前記セットがピクチャパラメータセット(PPS)タイプを含む、請求項1から10のいずれか一項に記載の方法。
- 前記LA指示を取得することが、VCL NALユニットタイプから前記LA指示を導出することを含む、請求項1から11のいずれか一項に記載の方法。
- 前記LA指示を導出することが、前記LAピクチャの前記レイヤ識別子値を導出することを含む、請求項12に記載の方法。
- 前記LAピクチャの前記レイヤ識別子値が、時間レイヤを識別する時間レイヤ識別子値である、請求項1から13のいずれか一項に記載の方法。
- 前記LAピクチャの前記レイヤ識別子値が、スケーラブルレイヤを識別するスケーラブルレイヤ識別子値、または、マルチビューレイヤを識別するマルチビューレイヤ識別子値である、請求項1から13のいずれか一項に記載の方法。
- 前記LAピクチャの前記レイヤ識別子値は、前記LAピクチャが属するレイヤのレイヤ値に等しい、実施形態1から15のいずれか一項に記載の方法。
- 前記LAピクチャの前記レイヤ識別子値は、前記LAピクチャが属するレイヤのレイヤ値に等しくない、実施形態1から15のいずれか一項に記載の方法。
- 前記アクセスユニットが、前記LA指示を含んでいるNALユニットを含み、パラメータセットを含んでいるNALユニットをさらに含み、
前記方法は、前記デコーダが、前記LA指示を含んでいる前記NALユニットを受信する前に、前記パラメータセットを含んでいる前記NALユニットを受信することと、前記デコーダが、前記パラメータセットをバッファすることとをさらに含む、請求項1から17のいずれか一項に記載の方法。 - 前記LA位置が、前記パラメータセットを含んでいる前記NALユニットのビットストリーム中の位置である、請求項18に記載の方法。
- 前記アクセスユニット中の前記ピクチャが前記バッファされたパラメータセットを使用することを決定することと、前記アクセスユニット中の前記ピクチャが前記バッファされたパラメータセットを使用することを決定した後に、前記バッファされたパラメータセットを復号することとをさらに含む、請求項18または19に記載の方法。
- ビデオデコーダ(260、900、1001)であって、前記ビデオデコーダは、
アクセスユニット中のレイヤアクセス(LA)ピクチャを識別するLA指示を取得することであって、i)前記LAピクチャが、レイヤを識別するレイヤ識別子値を有し、ii)前記LAピクチャが復号順序において他のピクチャに先行する、LA指示を取得することと、
前記LA指示に基づいて前記ビットストリーム中のLA位置を決定することと、
前記LAピクチャと、復号順序において前記LAピクチャに後続する前記他のピクチャとを復号することと
を行うように適応され、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャを復号するために使用されない、ビデオデコーダ(260、900、1001)。 - 前記LA指示が段階的LA(SLA)指示であり、前記LAピクチャがSLAピクチャである、請求項21に記載のビデオデコーダ。
- a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、i)前記復号順序において前記LAピクチャに後続し、かつ、ii)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有する、いかなる他のピクチャをも復号するために使用されない、請求項21または22に記載のビデオデコーダ。
- ビデオデコーダ(260、900、1001)であって、前記ビデオデコーダは、
アクセスユニット中のレイヤアクセス(LA)ピクチャを識別するLA指示を取得することであって、i)前記LAピクチャが、レイヤを識別するレイヤ識別子値を有し、ii)前記LAピクチャが、復号順序において少なくとも1つのピクチャに先行し、前記LAピクチャに後続する前記ピクチャが、前記LAピクチャの前記レイヤ識別子値以上のレイヤ識別子値を有する、LA指示を取得することと、
前記LA指示に基づいて前記ビットストリーム中のLA位置を決定することと、
前記LAピクチャ、または前記LAピクチャに後続する前記ピクチャが、a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットを使用するかどうかを決定することと、
前記LAピクチャ、または復号順序において前記LAピクチャに後続する前記ピクチャが、前記パラメータセットを使用することを決定したことに応答して、エラー状態が存在することを決定することと
を行うように適応されている、ビデオデコーダ(260、900、1001)。 - 前記エラー状態が存在することを決定したことの結果として、
前記エラー状態を報告すること、および/または
エラー隠蔽動作を実行すること
を行うようにさらに適応されている、請求項24に記載のビデオデコーダ。 - ビデオエンコーダ(140、900、1021)であって、前記ビデオエンコーダは、
レイヤアクセス(LA)ピクチャを符号化することであって、前記LAピクチャが、レイヤを識別するレイヤ識別子値を有する、LAピクチャを符号化することと、
前記LAピクチャがデコーダによってLA指示から識別され得るように、前記LAピクチャを示す前記LA指示を符号化することであって、ビットストリーム中のLA位置が前記LA指示に基づいて識別され得る、前記LAピクチャを示す前記LA指示を符号化することと
を行うように適応され、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャを符号化するために使用されない、ビデオエンコーダ(140、900、1021)。 - 前記LAピクチャと、前記LAピクチャを識別する前記LA指示と、復号順序において前記LAピクチャに後続する他のピクチャとを出力するようにさらに適応されている、請求項26に記載のビデオエンコーダ。
- 復号順序において前記LAピクチャに後続する他のピクチャを符号化することを行うようにさらに適応され、
a)特定のタイプを有し、b)前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有し、かつ、c)前記LA位置に先行する、パラメータセットが、前記LAピクチャの前記レイヤ識別子値に等しいレイヤ識別子値を有する、前記復号順序において前記LAピクチャに後続する前記他のピクチャのうちのいかなる1つをも符号化するために使用されない、請求項26または27に記載のビデオエンコーダ。 - 命令(944)を含むコンピュータプログラム(943)であって、処理回路(902)によって実行されるとき、前記処理回路(902)に請求項1から20のいずれか一項に記載の方法を実行させる、コンピュータプログラム(943)。
- 請求項29に記載のコンピュータプログラムを含んでいるキャリアであって、前記キャリアが、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体(942)のうちの1つである、キャリア。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962864683P | 2019-06-21 | 2019-06-21 | |
US62/864,683 | 2019-06-21 | ||
PCT/SE2020/050522 WO2020256615A1 (en) | 2019-06-21 | 2020-05-20 | Video coding layer up-switching indication |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022538551A true JP2022538551A (ja) | 2022-09-05 |
JP7414856B2 JP7414856B2 (ja) | 2024-01-16 |
Family
ID=74040621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021576024A Active JP7414856B2 (ja) | 2019-06-21 | 2020-05-20 | ビデオコーディングレイヤアップスイッチング指示 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220360787A1 (ja) |
EP (1) | EP3987792A4 (ja) |
JP (1) | JP7414856B2 (ja) |
CN (1) | CN114009032A (ja) |
BR (1) | BR112021024418A2 (ja) |
MX (1) | MX2021015641A (ja) |
WO (1) | WO2020256615A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160044309A1 (en) * | 2013-04-05 | 2016-02-11 | Samsung Electronics Co., Ltd. | Multi-layer video coding method for random access and device therefor, and multi-layer video decoding method for random access and device therefor |
JP2016540414A (ja) * | 2013-10-23 | 2016-12-22 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチレイヤビデオファイルフォーマットの設計 |
WO2019069968A1 (ja) * | 2017-10-06 | 2019-04-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法および復号方法 |
JP2019520742A (ja) * | 2016-05-24 | 2019-07-18 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | サンプルエントリーおよびランダムアクセス |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014003379A1 (ko) * | 2012-06-24 | 2014-01-03 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
WO2014053517A1 (en) * | 2012-10-01 | 2014-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Scalable video coding using derivation of subblock subdivision for prediction from base layer |
US10375405B2 (en) * | 2012-10-05 | 2019-08-06 | Qualcomm Incorporated | Motion field upsampling for scalable coding based on high efficiency video coding |
CN109982078B (zh) * | 2012-12-14 | 2023-03-28 | Lg 电子株式会社 | 编码视频的方法、解码视频的方法以及使用其的装置 |
US9906804B2 (en) * | 2014-01-16 | 2018-02-27 | Qualcomm Incorporated | Reference layer sample position derivation for scalable video coding |
US9641851B2 (en) * | 2014-04-18 | 2017-05-02 | Qualcomm Incorporated | Conformance window information in multi-layer coding |
CN112511837A (zh) * | 2014-08-20 | 2021-03-16 | 弗劳恩霍夫应用研究促进协会 | 视频合成系统、视频合成方法及计算机可读存储介质 |
US10284867B2 (en) * | 2014-12-18 | 2019-05-07 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
WO2016180486A1 (en) * | 2015-05-12 | 2016-11-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Composite scalable video streaming |
GB2539462B (en) * | 2015-06-16 | 2019-04-03 | Canon Kk | Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set |
CA2988107A1 (en) * | 2015-06-19 | 2016-12-22 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
US10349067B2 (en) * | 2016-02-17 | 2019-07-09 | Qualcomm Incorporated | Handling of end of bitstream NAL units in L-HEVC file format and improvements to HEVC and L-HEVC tile tracks |
US10419768B2 (en) * | 2016-03-30 | 2019-09-17 | Qualcomm Incorporated | Tile grouping in HEVC and L-HEVC file formats |
US11102495B2 (en) * | 2016-05-17 | 2021-08-24 | Qualcomm Incorporated | Methods and systems for generating and processing content color volume messages for video |
US10979691B2 (en) * | 2016-05-20 | 2021-04-13 | Qualcomm Incorporated | Circular fisheye video in virtual reality |
US10623755B2 (en) * | 2016-05-23 | 2020-04-14 | Qualcomm Incorporated | End of sequence and end of bitstream NAL units in separate file tracks |
US10291923B2 (en) * | 2016-05-24 | 2019-05-14 | Qualcomm Incorporated | Mapping of tile grouping and samples in HEVC and L-HEVC file formats |
US10587934B2 (en) * | 2016-05-24 | 2020-03-10 | Qualcomm Incorporated | Virtual reality video signaling in dynamic adaptive streaming over HTTP |
KR102170550B1 (ko) * | 2016-05-24 | 2020-10-29 | 노키아 테크놀로지스 오와이 | 미디어 콘텐츠를 인코딩하는 방법, 장치 및 컴퓨터 프로그램 |
US10778999B2 (en) * | 2016-09-30 | 2020-09-15 | Qualcomm Incorporated | Frame rate up-conversion coding mode with affine motion model |
US10951912B2 (en) * | 2016-10-05 | 2021-03-16 | Qualcomm Incorporated | Systems and methods for adaptive selection of weights for video coding |
US10917564B2 (en) * | 2016-10-12 | 2021-02-09 | Qualcomm Incorporated | Systems and methods of generating and processing files for partial decoding and most interested regions |
US10506230B2 (en) * | 2017-01-04 | 2019-12-10 | Qualcomm Incorporated | Modified adaptive loop filter temporal prediction for temporal scalability support |
US10701390B2 (en) * | 2017-03-14 | 2020-06-30 | Qualcomm Incorporated | Affine motion information derivation |
US10701400B2 (en) * | 2017-03-21 | 2020-06-30 | Qualcomm Incorporated | Signalling of summarizing video supplemental information |
US10679415B2 (en) * | 2017-07-05 | 2020-06-09 | Qualcomm Incorporated | Enhanced signaling of regions of interest in container files and video bitstreams |
WO2019115865A1 (en) * | 2017-12-13 | 2019-06-20 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
WO2019197712A1 (en) * | 2018-04-09 | 2019-10-17 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
-
2020
- 2020-05-20 US US17/621,160 patent/US20220360787A1/en active Pending
- 2020-05-20 WO PCT/SE2020/050522 patent/WO2020256615A1/en active Application Filing
- 2020-05-20 CN CN202080045127.9A patent/CN114009032A/zh active Pending
- 2020-05-20 EP EP20827363.1A patent/EP3987792A4/en active Pending
- 2020-05-20 JP JP2021576024A patent/JP7414856B2/ja active Active
- 2020-05-20 BR BR112021024418A patent/BR112021024418A2/pt unknown
- 2020-05-20 MX MX2021015641A patent/MX2021015641A/es unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160044309A1 (en) * | 2013-04-05 | 2016-02-11 | Samsung Electronics Co., Ltd. | Multi-layer video coding method for random access and device therefor, and multi-layer video decoding method for random access and device therefor |
JP2016540414A (ja) * | 2013-10-23 | 2016-12-22 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチレイヤビデオファイルフォーマットの設計 |
JP2019520742A (ja) * | 2016-05-24 | 2019-07-18 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | サンプルエントリーおよびランダムアクセス |
WO2019069968A1 (ja) * | 2017-10-06 | 2019-04-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法および復号方法 |
Non-Patent Citations (1)
Title |
---|
RICKARD SJOBERG, MITRA DAMGHANIAN, AND MARTIN PETTERSSON: "AHG17: Ensuring temporal switching with STSA pictures", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-O0235, JPN6023014313, June 2019 (2019-06-01), pages 1 - 3, ISSN: 0005034520 * |
Also Published As
Publication number | Publication date |
---|---|
EP3987792A1 (en) | 2022-04-27 |
CN114009032A (zh) | 2022-02-01 |
WO2020256615A1 (en) | 2020-12-24 |
US20220360787A1 (en) | 2022-11-10 |
JP7414856B2 (ja) | 2024-01-16 |
EP3987792A4 (en) | 2022-09-28 |
MX2021015641A (es) | 2022-02-03 |
BR112021024418A2 (pt) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3123726B1 (en) | Generic use of hevc sei messages for multi-layer codecs | |
US10212435B2 (en) | Device and method for scalable coding of video information | |
US9565437B2 (en) | Parameter set designs for video coding extensions | |
JP6284924B2 (ja) | ストリーム適応およびスプライシングに対するサポートが強化されたビデオコーディング | |
US10091532B2 (en) | Bitstream conformance constraints in scalable video coding | |
US20180316916A1 (en) | Alignment of picture order count | |
US10116948B2 (en) | System for temporal identifier handling for hybrid scalability | |
US20130089154A1 (en) | Adaptive frame size support in advanced video codecs | |
CN115174899B (zh) | 视频解码器和相关解码方法 | |
EP3162066B1 (en) | Recovery point sei message in multi-layer video codecs | |
US11936882B2 (en) | Sub-picture based random access | |
US9848199B2 (en) | Device and method for scalable coding of video information | |
JP6312838B2 (ja) | マルチレイヤコード化においてレイヤ間参照ピクチャセット(RPS)をコード化し、ビットストリーム終端(EoB)ネットワークアクセスレイヤ(NAL)単位をコード化するための方法 | |
JP7414856B2 (ja) | ビデオコーディングレイヤアップスイッチング指示 | |
US20240187610A1 (en) | Sub-Picture Based Random Access | |
JP2022549799A (ja) | セグメント存在情報を提供すること |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7414856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |