JP2023529198A - マルチレイヤビデオコーディングのピクチャヘッダ制約 - Google Patents
マルチレイヤビデオコーディングのピクチャヘッダ制約 Download PDFInfo
- Publication number
- JP2023529198A JP2023529198A JP2022575907A JP2022575907A JP2023529198A JP 2023529198 A JP2023529198 A JP 2023529198A JP 2022575907 A JP2022575907 A JP 2022575907A JP 2022575907 A JP2022575907 A JP 2022575907A JP 2023529198 A JP2023529198 A JP 2023529198A
- Authority
- JP
- Japan
- Prior art keywords
- video
- picture
- layer
- bitstream
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 139
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 239000010410 layer Substances 0.000 claims description 160
- 230000004044 response Effects 0.000 claims description 18
- 239000011229 interlayer Substances 0.000 claims description 14
- 238000009795 derivation Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000033001 locomotion Effects 0.000 description 67
- 239000013598 vector Substances 0.000 description 17
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000003672 processing method Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 238000012952 Resampling Methods 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- 239000002356 single layer Substances 0.000 description 7
- 241001482237 Pica Species 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 1
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002490 spark plasma sintering Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
- H04N9/8045—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
適用可能な特許法及び/又はパリ条約に基づく規則の下で、本出願は、2020年6月12日に出願された米国仮特許出願第63/038,601号の優先権及び利益を適時に主張するために行われる。法の下のすべての目的のために、前述の出願の開示全体は、参照によって本出願の開示の一部として組み込まれる。
本特許文書は、画像及びビデオのコーディング及び復号に関する。
本文書は、ビデオコーディング技術に関する。具体的には、シングルレイヤビデオコーディングとマルチレイヤビデオコーディングの両方をサポートするビデオコーデックのレベル及びビットストリーム適合性を定義することに関する。これは、シングルレイヤビデオコーディング及びマルチレイヤビデオコーディングをサポートする任意のビデオコーディング標準又は非標準ビデオコーデック、例えば開発中のVVC(Versatile Video Coding)に適用され得る。
2. 略語
APS 適応パラメータセット(Adaptation Parameter Set)
AU アクセスユニット(Access Unit)
AUD アクセスユニットデリミタ(Access Unit Delimiter)
AVC アドバンスドビデオコーディング(Advanced Video Coding)
CLVS コーディングされたレイヤビデオシーケンス(Coded Layer Video Sequence)
CLVSS コーディングされたレイヤビデオシーケンス開始(Coded Layer Video Sequence Start)
CPB コーディングされたピクチャバッファ(Coded Picture Buffer)
CRA クリーンランダムアクセス(Clean Random Access)
CTU コーディングツリーユニット(Coding Tree Unit)
CVS コーディングされたビデオシーケンス(Coded Video Sequence)
DCI 復号能力情報(Decoding Capability Information)
DPB 復号されたピクチャバッファ(Decoded Picture Buffer)
EOB エンドオブビットストリーム(End Of Bitstream)
EOS エンドオブシーケンス(End Of Sequence)
GDR 漸次復号リフレッシュ(Gradual Decoding Refresh)
HEVC 高効率ビデオコーディング(High Efficiency Video Coding)
HRD 仮想参照デコーダ(Hypothetical Reference Decoder)
IDR 即時復号リフレッシュ(Instantaneous Decoding Refresh)
ILP インターレイヤ予測(Inter-Layer Prediction)
ILRP インターレイヤ参照ピクチャ(Inter-Layer Reference Picture)
JEM 共同探査モデル(Joint Exploration Model)
LTRP 長期参照ピクチャ(Long-Term Reference Picture)
MCTS 動き制約タイルセット(Motion-Constrained Tile Sets)
NAL ネットワーク抽象化レイヤ(Network Abstraction Layer)
OLS 出力レイヤセット(Output Layer Set)
PH ピクチャヘッダ(Picture Header)
POC ピクチャ順序カウント(Picture Order Count)
PPS ピクチャパラメータセット(Picture Parameter Set)
PTL プロファイル、層及びレベル(Profile, Tier and Level)
PU ピクチャユニット(Picture Unit)
RAP ランダムアクセスポイント(Random Access Point)
RBSP 生バイトシーケンスペイロード(Raw Byte Sequence Payload)
SEI 補足強化情報(Supplemental Enhancement Information)
SLI サブピクチャレベル情報(Subpicture Level Information)
SPS シーケンスパラメータセット(Sequence Parameter Set)
STRP 短期参照ピクチャ(Short-Term Reference Picture)
SVC スケーラブルビデオコーディング(Scalable Video Coding)
VCL ビデオコーディングレイヤ(Video Coding Layer)
VPS ビデオパラメータセット(Video Parameter Set)
VTM VVCテストモデル(VVC Test Model)
VUI ビデオユーザビリティ情報(Video Usability Information)
VVC Versatile Video Coding
ビデオコーディング規格は、主に、周知のITU-T及びISO/IEC規格の開発を通して発展してきた。ITU-TはH.261及びH.263を作り、ISO/IECはMPEG-1及びMPEG-4 Visualを作り、2つの組織は共同で、H.262/MPEG-2 Video及びH.264/MPEG-4 アドバンスドビデオコーディング(AVC)及びH.265/HEVC規格を作り出した。H.262から、ビデオコーディング規格は、時間的予測と変換コーディングが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越える将来のビデオコーディング技術を探求するために、VCEGとMPEGによって共同でJVET(Joint Video Exploration Team)が2015年に設立された。それ以来、JVETによって多くの新たな方法が採用されており、JEM(Joint Exploration Model)と名付けられた基準ソフトウェアに入れられている。JVET会議は四半期に1回同時開催されており、新たなコーディング規格はHEVCと比較して50%のビットレート低減を目指している。新たなビデオコーディング規格は、2018年4月のJVET会議においてVVC(Versatile Video Coding)として正式に命名され、そのときにVVCテストモデル(VTM)の最初のバージョンがリリースされた。VVC標準化に寄与する継続的な努力が行われているため、JVET会議ごとに新たなコーディング技術がVVC規格に採用されている。VVCワーキングドラフト及びテストモデルVTMは、その後、毎回会議後に更新される。VVCプロジェクトは現在、2020年7月の会議で技術的完成(FDIS)を目指している。
ランダムアクセスは、復号順序でビットストリームの最初のピクチャではないピクチャから、ビットストリームのアクセスと復号を開始することを指す。ブロードキャスト/マルチキャスト及びマルチパーティ・ビデオ会議におけるチューニングとチャネル切り替え、ローカル再生とストリーミングにおけるシーク、並びにストリーミングにおけるストリーム適応をサポートするために、ビットストリームは、頻繁なランダムアクセスポイントを含む必要があり、そのようなランダムアクセスポイントは、典型的には、イントラコーディングされたピクチャであるが、(例えば漸次復号リフレッシュの場合)インターコーディングされたピクチャであってもよい。
AVC及びHEVCでは、新たなSPSを使用する新たなシーケンスがIRAPピクチャで開始しない限り、ピクチャの空間解像度は変化しない可能性がある。VVCは、常にイントラコーディングされるIRAPピクチャを符号化することなく、ある位置においてシーケンス内でピクチャ解像度の変更を可能にする。この特徴は、参照ピクチャが、復号されている現在のピクチャとは異なる解像度を有するときに、インター予測のために使用される当該参照ピクチャの再サンプリングを必要とするので、この特徴は、参照ピクチャ再サンプリング(RPR:reference picture resampling)と称されることがある。
スケーラブルビデオコーディング(SVC、単にビデオコーディングにおけるスケーラビリティと称されることもある)は、参照レイヤ(RL:reference layer)と称されることもあるベースレイヤ(BL:base layer)及び1つ以上のスケーラブルエンハンスメントレイヤ(EL:enhancement layer)が使用されるビデオコーディングを指す。SVCでは、ベースレイヤは、ベースレベルの品質でビデオデータを担持することができる。1つ以上のエンハンスメントレイヤは、例えばより高い空間、時間及び/又は信号対雑音(SNR)レベルをサポートするために、追加のビデオデータを担持することができる。エンハンスメントレイヤは、以前に符号化されたレイヤに対して定義され得る。例えば下部レイヤがBLとして機能してよく、上部レイヤがELとして機能してもよい。中間レイヤは、EL又はRLのいずれか又はその両方として機能し得る。例えば中間レイヤ(例えば最下位レイヤでも最上位レイヤでもないレイヤ)は、中間レイヤの下にあるレイヤ、例えばベースレイヤ又は任意の介在するエンハンスメントレイヤについてのELであってよく、同時に、中間レイヤの上にある1つ以上のエンハンスメントレイヤについてのRLとして機能し得る。同様に、HEVC規格のマルチビュー又は3D拡張では、複数のビューが存在してもよく、あるビューの情報が、別のビューの情報(例えば動き推定、動きベクトル予測及び/又は他の冗長性)をコーディング(例えば符号化又は復号)するために利用され得る。
AVC、HEVC及びVVCは、パラメータセットを指定する。パラメータセットのタイプは、SPS、PPS、APS及びVPSを含む。SPS及びPPSは、AVC、HEVC及びVVCのすべてにおいてサポートされる。VPSはHEVCから導入されており、HEVCとVVCの両方に含まれる。APSはAVCにもHEVCにも含まれていなかったが、最新のVVCドラフトテキストには含まれる。
APSは、コーディングにかなりのビットを必要とするこのようなピクチャレベル又はスライスレベルの情報を担持するために導入され、複数のピクチャによって共有されることができ、シーケンスにおいては、非常に多くの異なるバリエーションが存在する可能性がある。
VVCにおけるPOC、GDR、EOS及び静止画プロファイルの最新の設計は、以下の問題を有する:
1)vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagは0に等しくなければならないことが要求される。しかしながら、参照レイヤ内のそのようなピクチャは、C.6節で指定される一般的なサブビットストリーム抽出プロセスによって除去される可能性がある。したがって、POCの導出は正しくない。
2)ph_poc_msb_cycle_present_flagの値がPOC導出プロセスで使用されるが、フラグが存在しない可能性があり、その場合は推定される値は存在しない。
3)GDR機能は、主に、使用される低エンドツーエンド遅延アプリケーションに有益である。したがって、低エンドツーエンド遅延アプリケーションに適さない方法でビットストリームが符号化されるとき、その使用を許容しないことは理にかなっている。
4)レイヤのEOS NALユニットが、マルチレイヤビットストリームのAU内に存在するとき、これは、このAUへジャンプするシーク操作があったこと又はこのAUがビットストリーム・スプライシングポイントであることを意味する。2つの状況のいずれにとっても、レイヤ間にインターレイヤ依存性があるかどうかにかかわらず、同じビットストリームの別のレイヤではコンテンツは連続的であるのに、このレイヤは同じコンテンツに対して連続的ではないということは意味がない。
5)出力すべきピクチャを持たないビットストリームを有する可能性がある。これは、一般にすべてのプロファイルに対して又は静止画プロファイルのみに対して、許容されるべきではない。
上記の問題点及び他の問題を解決するために、以下に要約される方法が開示される。項目は、一般的な概念を説明するための例と見なされるべきであり、狭義に解釈されるべきではない。さらに、これらの項目を、個々に又は任意の方法で組み合わせて適用することができる。
1)問題1を解決するために、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagが0に等しいことを要求する代わりに、より厳しい条件下で、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求され得る。
a)一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のピクチャのスライスのRefPicList[ 0 ]又はRefPicList[ 1 ]内にILRPエントリが存在するとき、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求される。
b)一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にあるrefpicLayerIdに等しいnuh_layer_idを有し、かつMax( 0, vps_max_tid_il_ref_pics_plus1[ currLayerIdx ][ refLayerIdx ] - 1 )以下のTemporalIdを有する、ピクチャが存在するとき、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求され、ここで、currLayerIdx及びrefLayerIdxは、それぞれ、GeneralLayerIdx[ nuh_layer_id ]及びGeneralLayerIdx[ refpicLayerId ]に等しい。
c)一例では、ph_poc_msb_cycle_present_flagの値が0に等しいことは全く要求されない。
2)問題2を解決するために、POC導出プロセスで「ph_poc_msb_cycle_present_flagが1(0)に等しいこと」を使用する代わりに、「ph_poc_msb_cycle_valが存在する(存在しない)」を使用する。
3)問題3を解決するために、GDRピクチャが低エンドツーエンド遅延アプリケーションにおいてのみ使用されることが想定され、GDRピクチャは、AUの出力順序と復号順序が異なるときは許容され得ない。
a)一例では、sps_gdr_enabled_flagが1に等しいとき、CLVSのすべてのピクチャの復号順序と出力順序は同じであるべきことが要求される。この制約はまた、AUの復号順序と出力順序が、マルチレイヤビットストリームにおいて同じであることも義務付けることに注意されたい。なぜなら、AU内のすべてのピクチャは復号順序において連続することが要求され、AU内のすべてのピクチャが同じ出力順序を有するからである。
b)一例では、sps_gdr_enabled_flagが、CVS内のピクチャによって参照されるSPSについて1に等しいとき、CVS内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
c)一例では、sps_gdr_enabled_flagが、ピクチャによって参照されるSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
d)一例では、sps_gdr_enabled_flagが、ビットストリーム内に存在するSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
e)一例では、sps_gdr_enabled_flagが、(ビットストリーム内にあることによって又は外部の手段を通して提供される)ビットストリームのSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
4)問題4を解決するために、レイヤのEOS NALユニットがマルチレイヤビットストリームのAU内に存在するとき、すべて又は特定の上位レイヤの各々における次のピクチャがCLVSSピクチャであることが要求される。
a)一例では、AU auAが、レイヤ layerA内にEOS NALユニットを含むとき、CVSに存在し、かつlayerAを参照レイヤとして有する、各レイヤ layerBごとに、復号順序でauAに続くAUにおいて復号順序でlayerB内の第1ピクチャが、CLVSSピクチャであるべきことが指定される。
b)一例では、代替的に、AU auAが、レイヤ layerA内にEOS NALユニットを含むとき、CVS内に存在し、かつlayerAよりも上位レイヤである、レイヤ layerBごとに、復号順序でauAに続くAUにおいて復号順序でlayerB内の第1ピクチャが、CLVSSピクチャであるべきことが指定される。
c)一例では、代替的に、AU auA内の1つのピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
d)一例では、代替的に、AU auA内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBより上位である、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
e)一例では、代替的に、AU auA内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBを参照レイヤとして有する、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
f)一例では、代替的に、AU内にEOS NALユニットが存在するとき、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
g)一例では、代替的に、AU内のレイヤ layerB内にEOS NALユニットが存在するとき、layerBよりも上位である、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
h)一例では、代替的に、AU内のレイヤ layerB内にEOS NALユニットが存在するとき、layerBを参照レイヤとして有する、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
i)一例では、代替的に、AU内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AU内のすべてのピクチャが、CLVSSピクチャであるべきことが指定される。
j)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBより上位のすべてのレイヤ内のAU内のピクチャが、CLVSSピクチャであるべきことが指定される。
k)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBを参照レイヤとして有する、すべてのレイヤ内のAU内のピクチャが、CLVSSピクチャであるべきことが指定される。
l)一例では、代替的に、AU内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在する各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
m)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在するlayerBより上位の各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
n)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在するlayerBを参照レイヤとして有する各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
5)問題5を解決するために、ビットストリームは、出力される少なくとも1つのピクチャを有するべきであることが指定される。
a)一例では、ビットストリームが1つのピクチャのみを含むとき、ピクチャは、1に等しいph_pic_output_flagを有するべきであることが指定される。
b)一例では、ビットストリームは、出力レイヤ内にあり、かつ1に等しいph_pic_output_flagを有する、少なくとも1つのピクチャを有するべきであることが指定される。
c)例では、上記制約のいずれかは、1つ以上の静止画プロファイルの定義の一部として、例えばMain 10静止画プロファイル(Main 10 Still Picture profile)及びMain 4:4:4 10静止画プロファイル(Main 4:4:4 10 Still Picture profile)として指定される。
d)例では、上記制約のいずれかは、プロファイルの定義の一部ではなく、それが任意のプロファイルに当てはまるよう指定される。
6. 実施形態
この実施形態は、項目1~項目5及びそれらの副項目の一部についてのものである。
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに準拠し、該フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、第2構文要素は、現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する。
第1構文要素の値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ(ILRP)エントリが現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、フラグは、インデックス化レイヤ(indexed layer)がインターレイヤ予測を使用するかどうかを指定する。
参照ピクチャリストは、第1参照ピクチャリスト(RefPicList[ 0 ])又は第2参照ピクチャリスト(RefPicList[ 1 ])を備える。
ゼロに等しい第1構文要素の値は、第2構文要素がピクチャヘッダ構文構造内に存在しないことを指定する。
ゼロに等しいフラグの値は、インデックス化レイヤがインターレイヤ予測を使用することを許容されることを指定する。
第1構文要素の値は、フラグの値がゼロに等しく、かつピクチャが、(i)現在のレイヤの参照レイヤ内の現在のアクセスユニット(AU)内にある第2識別子に等しい第1識別子と、(ii)閾値以下の第3識別子とを有することに応答して、ゼロに等しく、フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、第1識別子は、ビデオコーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが属するレイヤを指定し、第2識別子は、参照ピクチャが属するレイヤを指定し、第3識別子は、時間的識別子であり、閾値は、イントラランダムアクセスピクチャ(IRAP)ピクチャでもなく、漸次復号リフレッシュ(GDR)ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ(IRLP)として使用されるかどうかを指定する第2構文要素に基づく。
第1識別子はnuh_layer_idであり、第2識別子はrefpicLayerIdであり、第3識別子はTemporalIdであり、第2構文要素はvps_max_tid_il_ref_pics_plus1である。
第1構文要素は、ゼロであることは全く要求されない。
第1構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、第2構文要素はph_poc_msb_cycle_valである。
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、構文要素が存在しない場合に、ピクチャ順序カウント(POC)の導出を指定し、構文要素は、現在のピクチャのPOC最上位ビット(MSB)サイクルの値を指定する。
構文要素はph_poc_msb_cycle_valである。
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、ルールは、AUの出力順序がAUの復号順序と異なることに応答して、ビットストリームでは漸次復号リフレッシュ(GDR)ピクチャが許容されないことを指定する。
コーディングされたレイヤビデオシーケンス(CLVS)内のすべてのピクチャの出力順序と復号順序は、フラグが1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
AUの出力順序と復号順序は、フラグが、コーディングされたビデオシーケンス(CVS)内のピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
AUの出力順序と復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
フラグは、sps_gdr_enabled_flagである。
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1レイヤについてのエンドオブシーケンス(EOS)ネットワーク抽象化レイヤ(NAL)ユニットが、ビットストリーム内の第1アクセスユニット(AU)内に存在することに応答して、ビットストリーム内の第1AUに続くAU内の第1レイヤの1つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることを指定する。
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤを参照レイヤとして使用する第2レイヤについての復号順序において、第1ピクチャがCLVSS画像であることを更に指定する。
1つ以上の上位レイヤは、すべて又は特定の上位レイヤを備える。
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤよりも上位レイヤである第2レイヤについての復号順序において、第1ピクチャがCLVSSピクチャであることを更に指定する。
フォーマットルールは、EOS NALユニットが、ビットストリーム内のコーディングされたビデオシーケンス(CVS)の各レイヤ内に存在することを更に指定する。
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤより上位レイヤである第2レイヤが、EOS NALユニットを備えることを更に指定する。
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤを参照レイヤとして使用する第2レイヤが、EOS NALユニットを備えることを更に指定する。
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1アクセスユニット内の第1ピクチャが、クリーンランダムアクセス(CRA)ピクチャ又は漸次復号リフレッシュ(GDR)ピクチャであるコーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることに応答して、第2ピクチャがCLVSSピクチャであることを指定する。
第2ピクチャは、第1アクセスユニット内のレイヤのピクチャである。
第1レイヤは第1ピクチャを備え、第2ピクチャは、第1レイヤより上位である第2レイヤ内のピクチャである。
.第1レイヤは第1ピクチャを備え、第2ピクチャは、第1レイヤを参照レイヤとして使用する第2レイヤ内のピクチャである。
第2ピクチャは、第1アクセスユニットに続く第2アクセスユニットの復号順序において第1ピクチャである。
第2ピクチャは、第1アクセスユニット内の任意のピクチャである。
CLVSSピクチャは、1に等しいフラグを有する(IRAP)ピクチャ又は(GDR)ピクチャである、コーディングされたピクチャであり、1に等しいフラグは、関連するピクチャが、ビットストリーム内に存在しないピクチャへの参照を備えるという決定があると、関連するピクチャがデコーダによって出力されないことを指示する。
ルールに従って、1つ以上のピクチャを備えるビデオと、ビデオのビットストリームとの間の変換を実行するステップを備え、ルールは、ビットストリームが少なくとも、出力される第1ピクチャを備えることを指定し、第1ピクチャは出力レイヤ内にあり、第1ピクチャは、1に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ(HRD)に関連付けられる除去プロセスとに影響を及ぼす。
ルールはすべてのプロファイルに当てはまり、ビットストリームは任意のプロファイルに準拠することが許容される。
構文要素はph_pic_output_flagである。
プロファイルは、Main 10静止画プロファイル又はMain 4:4:4 10静止画プロファイルである。
変換は、ビットストリームからビデオを復号することを含む。
変換は、ビデオをビットストリームに符号化することを含む。
上記解決策のいずれか1つ以上に記載される方法に従って、ビデオからビットストリームを生成するステップと、ビットストリームをコンピュータ読取可能記録媒体に記憶するステップと、を備える。
命令は、実行されると、プロセッサに上記解決策の1つ以上に記載される方法を実装させる、コンピュータ読取可能媒体。
当該ビデオ処理装置は、上記解決策のいずれか1つ以上に記載される方法を実装するよう構成される。
1つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオのピクチャ内のピクチャ順序カウントの最上位ビットサイクルの存在を示す構文要素の値に対する制約を指定する。
フォーマットルールは、独立値フラグがゼロ値に設定され、かつピクチャの少なくとも1つのスライスがその参照リスト内のインターレイヤ参照ピクチャを使用するとき、構文要素の値が0であることを指定する。
フォーマットルールは、コーディングされた表現内に構文要素を含まないことによって構文要素のゼロの値が指示されることを指定する。
1つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、変換は、アクセスユニットの出力順序がアクセスユニットの復号順序と異なる場合に、漸次復号リフレッシュピクチャが許容されないことを指定するルールに準拠する。
1つ以上のビデオピクチャを備えるビデオレイヤを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオシーケンスの終了(end of a video sequence)を示す第1ネットワーク抽象化レイヤユニット(NAL)が、レイヤのアクセスユニット内に存在する場合、コーディングされた表現内の上位レイヤの各々の次のピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有さなければならないことを指定する。
フォーマットルールは、レイヤを参照レイヤとして使用する第2レイヤの復号順序における第1ピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有するべきことを更に指定する。
変換を実行するステップは、ビデオを符号化してコーディングされた表現を生成するステップを含む。
変換を実行するステップは、コーディングされた表現を解析及び復号してビデオを生成するステップを含む。
コードは、プロセッサによって実行されると、プロセッサに、解決策P1~P8のいずれかに記載される方法を実装させる。
本出願は、2020年6月12日に出願された米国仮特許出願第63/038,601号の優先権及び利益を主張する、2021年6月11日に出願された国際特許出願第PCT/US2021/037118号に基づく。上述の特許出願は全て、その全体が参照により本明細書に組み込まれる。
Claims (24)
- ビデオ処理の方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームはフォーマットルールに準拠し、
前記フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、
前記第2構文要素は、前記現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する、
方法。 - 前記第1構文要素の前記値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ(ILRP)エントリが前記現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定する、
請求項1に記載の方法。 - 前記参照ピクチャリストは、第1参照ピクチャリスト(RefPicList[ 0 ])又は第2参照ピクチャリスト(RefPicList[ 1 ])を備える、
請求項2に記載の方法。 - ゼロに等しい前記第1構文要素の前記値は、前記第2構文要素が前記ピクチャヘッダ構文構造内に存在しないことを指定する、
請求項2に記載の方法。 - ゼロに等しい前記フラグの前記値は、前記インデックス化レイヤが前記インターレイヤ予測を使用することを許容されることを指定する、
請求項2に記載の方法。 - 前記第1構文要素の前記値は、フラグの値がゼロに等しく、かつピクチャが(i)現在のレイヤの参照レイヤ内の現在のアクセスユニット(AU)内にある第2識別子に等しい第1識別子と、(ii)閾値以下の第3識別子とを有することに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、前記第1識別子は、ビデオコーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが属するレイヤを指定し、前記第2識別子は、参照ピクチャが属するレイヤを指定し、前記第3識別子は、時間的識別子であり、前記閾値は、イントラランダムアクセスピクチャ(IRAP)ピクチャでも漸次復号リフレッシュ(GDR)ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ(IRLP)として使用されるかどうかを指定する第2構文要素に基づく、
請求項1に記載の方法。 - 前記第1識別子はnuh_layer_idであり、前記第2識別子はrefpicLayerIdであり、前記第3識別子はTemporalIdであり、前記第2構文要素はvps_max_tid_il_ref_pics_plus1である、
請求項6に記載の方法。 - 前記第1構文要素は、ゼロであることは全く要求されない、
請求項1に記載の方法。 - 前記第1構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、前記第2構文要素はph_poc_msb_cycle_valである、
請求項2乃至8のいずれかに記載の方法。 - ビデオ処理の方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームはフォーマットルールに準拠し、
前記フォーマットルールは、構文要素がない場合にピクチャ順序カウント(POC)の導出を指定し、
前記構文要素は、現在のピクチャの前記POCの最上位ビット(MSB)サイクルの値を指定する、
方法。 - 前記構文要素はph_poc_msb_cycle_valである、
請求項10に記載の方法。 - ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、
前記ルールは、前記AUの出力順序が前記AUの復号順序と異なることに応答して、漸次復号リフレッシュ(GDR)ピクチャが前記ビットストリームでは許容されないことを指定する、
方法。 - コーディングされたレイヤビデオシーケンス(CLVS)内のすべてのピクチャの出力順序と復号順序は、フラグが1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
請求項12に記載の方法。 - 前記AUの前記出力順序と前記復号順序は、フラグが、コーディングされたビデオシーケンス(CVS)内のピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
請求項12に記載の方法。 - 前記AUの前記出力順序と前記復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
請求項12に記載の方法。 - 前記AUの前記出力順序と前記復号順序は、フラグが、前記ビットストリーム内のシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
請求項12に記載の方法。 - 前記フラグはsps_gdr_enabled_flagである、
請求項13乃至16のいずれかに記載の方法。 - 前記変換は、前記ビットストリームから前記ビデオを復号することを含む、
請求項1乃至17のいずれかに記載の方法。 - 前記変換は、前記ビデオを前記ビットストリームに符号化することを含む、
請求項1乃至17のいずれかに記載の方法。 - ビデオを表すビットストリームをコンピュータ読取可能記録媒体に記憶する方法であって、
請求項1乃至17のいずれか1つ以上に記載された方法に従って、前記ビデオから前記ビットストリームを生成するステップと、
前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、
を備える、方法。 - 請求項1乃至20のいずれか1つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ処理装置。
- 命令が記憶されたコンピュータ読取可能媒体であって、前記命令は、実行されると、プロセッサに請求項1乃至20の1つ以上に記載の方法を実装させる、コンピュータ読取可能媒体。
- 請求項1乃至20のいずれか1つ以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
- ビットストリームを記憶するためのビデオ処理装置であって、当該ビデオ処理装置は、請求項1乃至20のいずれか1つ以上に記載される方法を実装するよう構成される、
ビデオ処理装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063038601P | 2020-06-12 | 2020-06-12 | |
US63/038,601 | 2020-06-12 | ||
PCT/US2021/037118 WO2021252973A1 (en) | 2020-06-12 | 2021-06-11 | Picture header constraints for multi-layer video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023529198A true JP2023529198A (ja) | 2023-07-07 |
Family
ID=78845938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022575907A Pending JP2023529198A (ja) | 2020-06-12 | 2021-06-11 | マルチレイヤビデオコーディングのピクチャヘッダ制約 |
Country Status (6)
Country | Link |
---|---|
US (4) | US11930221B2 (ja) |
EP (1) | EP4150901A4 (ja) |
JP (1) | JP2023529198A (ja) |
KR (1) | KR20230021664A (ja) |
CN (3) | CN115918067A (ja) |
WO (3) | WO2021252976A1 (ja) |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1704720A1 (en) | 2004-01-16 | 2006-09-27 | General Instrument Corporation | Method, protocol, and apparatus for transporting advanced video coding content |
US7586924B2 (en) * | 2004-02-27 | 2009-09-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream |
KR101862329B1 (ko) * | 2012-01-20 | 2018-05-29 | 지이 비디오 컴프레션, 엘엘씨 | 병렬 처리, 전송 디멀티플렉서 및 비디오 비트스트림을 허용하는 코딩 개념 |
US9351005B2 (en) * | 2012-09-24 | 2016-05-24 | Qualcomm Incorporated | Bitstream conformance test in video coding |
US9602841B2 (en) * | 2012-10-30 | 2017-03-21 | Texas Instruments Incorporated | System and method for decoding scalable video coding |
KR102383006B1 (ko) * | 2013-04-07 | 2022-04-04 | 돌비 인터네셔널 에이비 | 출력 계층 세트들에서의 시그널링 변경 |
US9648348B2 (en) * | 2013-10-23 | 2017-05-09 | Qualcomm Incorporated | Multi-layer video file format designs |
JPWO2015098561A1 (ja) * | 2013-12-27 | 2017-03-23 | ソニー株式会社 | 復号装置および復号方法、並びに、符号化装置および符号化方法 |
US20150264404A1 (en) * | 2014-03-17 | 2015-09-17 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
US9794595B2 (en) * | 2014-03-18 | 2017-10-17 | Qualcomm Incorporated | Derivation of end of sequence NAL unit information for multi-layer bitstreams |
US10880565B2 (en) | 2014-03-24 | 2020-12-29 | Qualcomm Incorporated | Use of specific HEVC SEI messages for multi-layer video codecs |
US9918091B2 (en) * | 2014-06-20 | 2018-03-13 | Qualcomm Incorporated | Systems and methods for assigning a minimum value to a syntax structure in a parameter set |
WO2016098056A1 (en) * | 2014-12-18 | 2016-06-23 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
US20170105004A1 (en) * | 2015-10-07 | 2017-04-13 | Qualcomm Incorporated | Methods and systems of coding a predictive random access picture using a background picture |
US10623755B2 (en) | 2016-05-23 | 2020-04-14 | Qualcomm Incorporated | End of sequence and end of bitstream NAL units in separate file tracks |
EP4026097A4 (en) | 2019-09-24 | 2023-01-25 | Huawei Technologies Co., Ltd. | SIGNALING AN IMAGE HEAD IN VIDEO ENCODING |
AU2021201606A1 (en) * | 2020-01-14 | 2022-08-11 | Huawei Technologies Co., Ltd. | Method and apparatus of signaling the number of candidates for merge mode |
US11546623B2 (en) | 2020-03-10 | 2023-01-03 | Qualcomm Incorporated | Coded video sequence start access unit in video coding |
US11611778B2 (en) | 2020-05-20 | 2023-03-21 | Sharp Kabushiki Kaisha | Systems and methods for signaling general constraint information in video coding |
US11418814B2 (en) | 2020-05-22 | 2022-08-16 | Tencent America LLC | Constraint on syntax elements for still picture profiles |
AU2021274887A1 (en) * | 2020-05-22 | 2022-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processing of output layer sets of coded video |
WO2021141519A2 (en) * | 2020-05-26 | 2021-07-15 | Huawei Technologies Co., Ltd. | Method and apparatus of high-level syntax for smoothing intra-prediction techniques |
US20230113358A1 (en) * | 2020-05-27 | 2023-04-13 | Lg Electronics Inc. | Image coding method based on poc information and non-reference picture flag in video or image coding system |
US11503342B2 (en) * | 2020-06-10 | 2022-11-15 | Sharp Kabushiki Kaisha | Systems and methods for signaling sequence parameter information in video coding |
CN115769571A (zh) * | 2020-06-17 | 2023-03-07 | 字节跳动有限公司 | 视频编解码中的解码的图片缓冲器管理和子图片 |
-
2021
- 2021-06-11 CN CN202180042176.1A patent/CN115918067A/zh active Pending
- 2021-06-11 CN CN202180042173.8A patent/CN115836526A/zh active Pending
- 2021-06-11 WO PCT/US2021/037121 patent/WO2021252976A1/en active Application Filing
- 2021-06-11 JP JP2022575907A patent/JP2023529198A/ja active Pending
- 2021-06-11 EP EP21822889.8A patent/EP4150901A4/en active Pending
- 2021-06-11 WO PCT/US2021/037118 patent/WO2021252973A1/en unknown
- 2021-06-11 WO PCT/US2021/037123 patent/WO2021252978A1/en active Application Filing
- 2021-06-11 KR KR1020227043111A patent/KR20230021664A/ko active Search and Examination
- 2021-06-11 CN CN202180042695.8A patent/CN115885512A/zh active Pending
-
2022
- 2022-12-12 US US18/079,154 patent/US11930221B2/en active Active
- 2022-12-12 US US18/079,303 patent/US20230113199A1/en active Pending
- 2022-12-12 US US18/079,219 patent/US11943483B2/en active Active
-
2023
- 2023-11-30 US US18/524,963 patent/US20240121441A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230021664A (ko) | 2023-02-14 |
US20240121441A1 (en) | 2024-04-11 |
EP4150901A1 (en) | 2023-03-22 |
US11930221B2 (en) | 2024-03-12 |
EP4150901A4 (en) | 2023-10-18 |
WO2021252978A1 (en) | 2021-12-16 |
US11943483B2 (en) | 2024-03-26 |
US20230105096A1 (en) | 2023-04-06 |
CN115885512A (zh) | 2023-03-31 |
CN115918067A (zh) | 2023-04-04 |
WO2021252976A1 (en) | 2021-12-16 |
CN115836526A (zh) | 2023-03-21 |
US20230113199A1 (en) | 2023-04-13 |
US20230104910A1 (en) | 2023-04-06 |
WO2021252973A1 (en) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7457151B2 (ja) | スケーラブル映像コーディングにおけるランダムアクセスポイントアクセスユニット | |
US20240080492A1 (en) | Identification Of Inter-Layer Reference Pictures In Coded Video | |
JP2023526369A (ja) | 映像ビットストリームにおけるコーディングされたピクチャバッファ情報の信号通知 | |
CN115804091A (zh) | 访问单元分隔符,以及视频编解码中的通用约束信息 | |
JP2023526661A (ja) | 適合出力サブビットストリームの生成技術 | |
CN115699731A (zh) | 参考图片重采样 | |
US11943483B2 (en) | Constraints on picture output ordering in a video bitstream | |
US11973967B2 (en) | Ordering of NAL units in coded video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240430 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240528 |