JP2023529198A - マルチレイヤビデオコーディングのピクチャヘッダ制約 - Google Patents

マルチレイヤビデオコーディングのピクチャヘッダ制約 Download PDF

Info

Publication number
JP2023529198A
JP2023529198A JP2022575907A JP2022575907A JP2023529198A JP 2023529198 A JP2023529198 A JP 2023529198A JP 2022575907 A JP2022575907 A JP 2022575907A JP 2022575907 A JP2022575907 A JP 2022575907A JP 2023529198 A JP2023529198 A JP 2023529198A
Authority
JP
Japan
Prior art keywords
video
picture
layer
bitstream
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022575907A
Other languages
English (en)
Inventor
ワン,イェ-クイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of JP2023529198A publication Critical patent/JP2023529198A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8045Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

マルチレイヤコーディングのためのピクチャヘッダ制約の方法、システム及びデバイスを説明する。ビデオ処理の例示的な方法は、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、第2構文要素は、現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する。

Description

[関連出願の相互参照]
適用可能な特許法及び/又はパリ条約に基づく規則の下で、本出願は、2020年6月12日に出願された米国仮特許出願第63/038,601号の優先権及び利益を適時に主張するために行われる。法の下のすべての目的のために、前述の出願の開示全体は、参照によって本出願の開示の一部として組み込まれる。
[技術分野]
本特許文書は、画像及びビデオのコーディング及び復号に関する。
デジタルビデオは、インターネット及び他のデジタル通信ネットワークにおける最大の帯域幅使用を占める。ビデオを受信及び表示することが可能な接続ユーザデバイスの数が増加するにつれて、デジタルビデオの利用のための帯域幅需要が増加し続けることが予想される。
本特許文書は、ビデオ符号化、復号又は処理を実行するためにビデオエンコーダ及びデコーダによって使用することができる、マルチレイヤコーディングのピクチャヘッダ制約のための技術を開示する。
1つの例示的な態様において、ビデオ処理方法が開示される。本方法は、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、第2構文要素は、現在のピクチャのピクチャ順序カウント(POC:picture order count)の最上位ビット(MSB:most significant bit)サイクルの値を指定する。
別の例示的な態様において、ビデオ処理方法が開示される。本方法は、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、構文要素がない場合にピクチャ順序カウント(POC)の導出を指定し、構文要素は、現在のピクチャのPOCの最上位ビット(MSB)サイクルの値を指定する。
更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、ルールは、AUの出力順序がAUの復号順序と異なることに応答して、ビットストリームでは漸次復号リフレッシュ(GDR:gradual decode refresh)ピクチャが許容されないことを指定する。
更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内の複数のレイヤを備え、フォーマットルールは、第1レイヤについてのエンドオブシーケンス(EOS:end of sequence)ネットワーク抽象化レイヤ(NAL:network abstraction layer)ユニットが、ビットストリーム内の第1アクセスユニット(AU)内に存在することに応答して、ビットストリーム内の第1AUに続くAU内の第1レイヤの1つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始(CLVSS:coded layer video sequence start)ピクチャであることを指定する。
更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内の複数のレイヤを備え、フォーマットルールは、第1アクセスユニット内の第1ピクチャが、クリーンランダムアクセス(CRA:clean random access)ピクチャ又は漸次復号リフレッシュ(GDR:gradual decoding refresh)ピクチャであるコーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることに応答して、第2ピクチャがCLVSSピクチャであることを指定する。
更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、1つ以上のピクチャを備えるビデオと、ルールに従ってビデオのビットストリームとの間の変換を実行するステップを含み、ルールは、ビットストリームが少なくとも、出力される第1ピクチャを備えることを指定し、第1ピクチャは出力レイヤ内にあり、第1ピクチャは、1に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ(HRD:hypothetical reference decoder)に関連付けられる除去プロセスとに影響を及ぼす。
更に別の例示的態様において、ビデオエンコーダ装置が開示される。ビデオエンコーダは、上述の方法を実装するよう構成されるプロセッサを備える。
更に別の例示的態様において、ビデオデコーダ装置が開示される。ビデオデコーダは、上述の方法を実装するよう構成されるプロセッサを備える。
更に別の例示的態様において、コードが記憶されるコンピュータ読取可能媒体が開示される。コードは、本明細書で説明される方法のうちの1つをプロセッサ実行可能なコードの形態で具現化する。
これら及び他の特徴は、本文書を通して説明される。
本明細書で開示される様々な技術が実装され得る、例示的なビデオ処理システムを示すブロック図である。
ビデオ処理に使用される例示的なハードウェアプラットフォームのブロック図である。
本開示のいくつかの実施形態を実装することができる、例示的なビデオコーディングシステムを示すブロック図である。
本開示のいくつかの実施形態を実装することができる、エンコーダの例を示すブロック図である。
本開示のいくつかの実施形態を実装することができる、デコーダの例を示すブロック図である。
ビデオ処理の例示的な方法のフローチャートを示す図である。 ビデオ処理の例示的な方法のフローチャートを示す図である。 ビデオ処理の例示的な方法のフローチャートを示す図である。 ビデオ処理の例示的な方法のフローチャートを示す図である。 ビデオ処理の例示的な方法のフローチャートを示す図である。 ビデオ処理の例示的な方法のフローチャートを示す図である。
セクションの見出しは、本文書において、理解の容易性のために使用されており、各セクションで開示される技術及び実施形態の適用可能性をそのセクションのみに限定するものではない。さらに、H.266の用語は、一部の説明において、理解の容易性のためだけに使用され、開示される技術の範囲を限定するためには使用されない。このように、本明細書で説明される技術は、他のビデオコーデックプロトコル及び設計にも適用可能である。
1. 導入
本文書は、ビデオコーディング技術に関する。具体的には、シングルレイヤビデオコーディングとマルチレイヤビデオコーディングの両方をサポートするビデオコーデックのレベル及びビットストリーム適合性を定義することに関する。これは、シングルレイヤビデオコーディング及びマルチレイヤビデオコーディングをサポートする任意のビデオコーディング標準又は非標準ビデオコーデック、例えば開発中のVVC(Versatile Video Coding)に適用され得る。
2. 略語
APS 適応パラメータセット(Adaptation Parameter Set)
AU アクセスユニット(Access Unit)
AUD アクセスユニットデリミタ(Access Unit Delimiter)
AVC アドバンスドビデオコーディング(Advanced Video Coding)
CLVS コーディングされたレイヤビデオシーケンス(Coded Layer Video Sequence)
CLVSS コーディングされたレイヤビデオシーケンス開始(Coded Layer Video Sequence Start)
CPB コーディングされたピクチャバッファ(Coded Picture Buffer)
CRA クリーンランダムアクセス(Clean Random Access)
CTU コーディングツリーユニット(Coding Tree Unit)
CVS コーディングされたビデオシーケンス(Coded Video Sequence)
DCI 復号能力情報(Decoding Capability Information)
DPB 復号されたピクチャバッファ(Decoded Picture Buffer)
EOB エンドオブビットストリーム(End Of Bitstream)
EOS エンドオブシーケンス(End Of Sequence)
GDR 漸次復号リフレッシュ(Gradual Decoding Refresh)
HEVC 高効率ビデオコーディング(High Efficiency Video Coding)
HRD 仮想参照デコーダ(Hypothetical Reference Decoder)
IDR 即時復号リフレッシュ(Instantaneous Decoding Refresh)
ILP インターレイヤ予測(Inter-Layer Prediction)
ILRP インターレイヤ参照ピクチャ(Inter-Layer Reference Picture)
JEM 共同探査モデル(Joint Exploration Model)
LTRP 長期参照ピクチャ(Long-Term Reference Picture)
MCTS 動き制約タイルセット(Motion-Constrained Tile Sets)
NAL ネットワーク抽象化レイヤ(Network Abstraction Layer)
OLS 出力レイヤセット(Output Layer Set)
PH ピクチャヘッダ(Picture Header)
POC ピクチャ順序カウント(Picture Order Count)
PPS ピクチャパラメータセット(Picture Parameter Set)
PTL プロファイル、層及びレベル(Profile, Tier and Level)
PU ピクチャユニット(Picture Unit)
RAP ランダムアクセスポイント(Random Access Point)
RBSP 生バイトシーケンスペイロード(Raw Byte Sequence Payload)
SEI 補足強化情報(Supplemental Enhancement Information)
SLI サブピクチャレベル情報(Subpicture Level Information)
SPS シーケンスパラメータセット(Sequence Parameter Set)
STRP 短期参照ピクチャ(Short-Term Reference Picture)
SVC スケーラブルビデオコーディング(Scalable Video Coding)
VCL ビデオコーディングレイヤ(Video Coding Layer)
VPS ビデオパラメータセット(Video Parameter Set)
VTM VVCテストモデル(VVC Test Model)
VUI ビデオユーザビリティ情報(Video Usability Information)
VVC Versatile Video Coding
3. 最初の議論
ビデオコーディング規格は、主に、周知のITU-T及びISO/IEC規格の開発を通して発展してきた。ITU-TはH.261及びH.263を作り、ISO/IECはMPEG-1及びMPEG-4 Visualを作り、2つの組織は共同で、H.262/MPEG-2 Video及びH.264/MPEG-4 アドバンスドビデオコーディング(AVC)及びH.265/HEVC規格を作り出した。H.262から、ビデオコーディング規格は、時間的予測と変換コーディングが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越える将来のビデオコーディング技術を探求するために、VCEGとMPEGによって共同でJVET(Joint Video Exploration Team)が2015年に設立された。それ以来、JVETによって多くの新たな方法が採用されており、JEM(Joint Exploration Model)と名付けられた基準ソフトウェアに入れられている。JVET会議は四半期に1回同時開催されており、新たなコーディング規格はHEVCと比較して50%のビットレート低減を目指している。新たなビデオコーディング規格は、2018年4月のJVET会議においてVVC(Versatile Video Coding)として正式に命名され、そのときにVVCテストモデル(VTM)の最初のバージョンがリリースされた。VVC標準化に寄与する継続的な努力が行われているため、JVET会議ごとに新たなコーディング技術がVVC規格に採用されている。VVCワーキングドラフト及びテストモデルVTMは、その後、毎回会議後に更新される。VVCプロジェクトは現在、2020年7月の会議で技術的完成(FDIS)を目指している。
3.1. HEVC及びVVCにおけるランダムアクセスとそのサポート
ランダムアクセスは、復号順序でビットストリームの最初のピクチャではないピクチャから、ビットストリームのアクセスと復号を開始することを指す。ブロードキャスト/マルチキャスト及びマルチパーティ・ビデオ会議におけるチューニングとチャネル切り替え、ローカル再生とストリーミングにおけるシーク、並びにストリーミングにおけるストリーム適応をサポートするために、ビットストリームは、頻繁なランダムアクセスポイントを含む必要があり、そのようなランダムアクセスポイントは、典型的には、イントラコーディングされたピクチャであるが、(例えば漸次復号リフレッシュの場合)インターコーディングされたピクチャであってもよい。
HEVCは、NALユニットタイプを通して、NALユニットヘッダ内のイントラランダムアクセスポイント(IRAP:intra random access points)ピクチャのシグナリングを含む。3つのタイプのIRAPピクチャ、すなわち、即時デコーダリフレッシュ(IDR:instantaneous decoder refresh)ピクチャ、クリーンランダムアクセス(CRA:clean random access)ピクチャ及びブロークンリンクアクセス(BLA:broken link access)ピクチャがサポートされる。IDRピクチャは、現在のグループオブピクチャ(GOP:group-of-pictures)の前のいかなるピクチャも参照しないように、インターピクチャ予測構造を制約しており、従来的に、クローズドGOPランダムアクセスポイントと呼ばれる。CRAピクチャは、特定のピクチャが現在のGOPの前のピクチャを参照することを可能にすることによって制限を緩和し、それらのすべては、ランダムアクセスの場合に廃棄される。CRAピクチャは、従来的に、オープンGOPランダムアクセスポイントと呼ばれる。BLAピクチャは、通常、例えばストリーム切り替えの間にCRAピクチャにおける2つのビットストリーム又はその一部のスプライシングに由来する。IRAPピクチャのより良いシステム使用を可能にするために、全部で6つの異なるNALユニットが、IRAPピクチャのプロパティをシグナリングするために定義され、これは、ISOベースメディアファイルフォーマット(ISOBMFF)[7]で定義されるストリームアクセスポイントタイプにより良くマッチするために使用されることができ、これはHTTP(DASH)[8]上の動的適応ストリーミングにおけるランダムアクセスサポートに利用される。
VVCは、3つのタイプのIRAPピクチャと、2つのタイプのIDRピクチャ(1つのタイプは関連するRADLピクチャを伴い、他のタイプは関連するRADLピクチャを伴わない)と、1つのタイプのCRAピクチャをサポートする。これらは基本的にはHEVCのものと同じである。HEVCのBLAピクチャタイプはVVCに含まれないが、それは主に2つの理由による:i)BLAピクチャの基本的な機能性を、CRAピクチャとエンドオブシーケンスNALユニットによって実現することができ、その存在は、後続のピクチャがシングルレイヤビットストリーム内で新たなCVSを開始することを示す。ii)NALユニットヘッダのNALユニットタイプフィールドに6ビットではなく5ビットを使用することによって示されるように、VVCの開発中にHEVCよりも少ないNALユニットタイプを指定したいという要望があった。
VVCとHEVCの間のランダムアクセスサポートにおける別の重要な違いは、VVCにおけるより規範的な方法でのGDRのサポートである。GDRでは、ビットストリームの復号は、インターコーディングされたピクチャから開始することができ、最初は、ピクチャ領域全体を正しく復号することはできないが、複数のピクチャの後では、ピクチャ領域全体が正しいであろう。AVCとHEVCも、GDRランダムアクセスポイントとリカバリポイントのシグナリングのためにリカバリポイントSEIメッセージを使用して、GDRをサポートする。VVCでは、新たなNALユニットタイプがGDRピクチャの指示のために指定され、リカバリポイントはピクチャヘッダ構文構造でシグナリングされる。CVSとビットストリームは、GDRピクチャで開始することが許容される。これは、ビットストリーム全体が、単一のイントラコーディングされたピクチャなしに、インターコーディングされたピクチャのみを含むことを許容されることを意味する。この方法でGDRサポートを指定する主な利点は、GDRに準拠した挙動(conforming behavior)を提供することである。GDRは、ピクチャ全体をイントラコーディングすることとは対照的に、イントラコーディングされたスライス又はブロックを複数のピクチャに分配することによって、エンコーダがビットストリームのビットレートを平滑化することを可能にし、したがって、大幅なエンドツーエンド遅延の低減を可能にし、これは今日では、無線ディスプレイ、オンラインゲーム、ドローンベースのアプリケーションのような超低遅延アプリケーションがより一般的になっているので、以前よりも重要であると考えられる。
VVCにおける別のGDR関連の機能は、仮想境界シグナリングである。GDRピクチャとそのリカバリポイントとの間のピクチャにおける、リフレッシュされた領域(すなわち、正しく復号された領域)とリフレッシュされていない領域との間の境界を、仮想境界としてシグナリングすることができ、シグナリングされると、境界を横切るインループフィルタリングは適用されず、したがって、境界又はその近くではいくつかのサンプルの復号不一致は生じないであろう。これは、アプリケーションが、GDRプロセス中に正しく復号された領域を表示することを決定するときに役立ち得る。
IRAPピクチャとGDRピクチャを、ランダムアクセスポイント(RAP)ピクチャと総称することができる。
3.2. シーケンス内のピクチャ解像度の変更
AVC及びHEVCでは、新たなSPSを使用する新たなシーケンスがIRAPピクチャで開始しない限り、ピクチャの空間解像度は変化しない可能性がある。VVCは、常にイントラコーディングされるIRAPピクチャを符号化することなく、ある位置においてシーケンス内でピクチャ解像度の変更を可能にする。この特徴は、参照ピクチャが、復号されている現在のピクチャとは異なる解像度を有するときに、インター予測のために使用される当該参照ピクチャの再サンプリングを必要とするので、この特徴は、参照ピクチャ再サンプリング(RPR:reference picture resampling)と称されることがある。
スケーリング比は、1/2(参照ピクチャから現在のピクチャへの2倍のダウンサンプリング)以上かつ8(8倍のアップサンプリング)以下に制限される。参照ピクチャと現在のピクチャとの間の様々なスケーリング比を扱うために、異なる周波数カットオフを有する3つのセットの再サンプリングフィルタが指定される。3つのセットの再サンプリングフィルタは、それぞれ、1/2から1/1.75、1/1.75から1/1.25及び1/1.25から8の範囲のスケーリング比に適用される。各セットの再サンプリングフィルタは、ルマについて16相(phase)、クロマについて32相を有し、これは動き補償補間フィルタの場合と同じである。実際に、通常のMC補間プロセスは、1/1.25から8の範囲のスケーリング比を有する再サンプリングプロセスの特別なケースである。水平及び垂直スケーリング比は、ピクチャ幅及び高さと、参照ピクチャ及び現在のピクチャについて指定された左、右、上及び下のスケーリングオフセットとに基づいて導出される。
HEVCとは異なるこの機能をサポートするためのVVC設計の他の態様は、以下を含む:i)ピクチャ解像度及び対応する適合ウィンドウが、SPSの代わりにPPSでシグナリングされるが、SPSでは、最大ピクチャ解像度がシグナリングされる。ii)シングルレイヤビットストリームでは、各ピクチャストア(1つの復号されたピクチャの記憶のためのDPBにおけるスロット)は、最大ピクチャ解像度を有する復号されたピクチャを記憶するために必要とされるバッファサイズを占める。
3.3. 一般的な及びVVCにおけるスケーラブルビデオコーディング(SVC)
スケーラブルビデオコーディング(SVC、単にビデオコーディングにおけるスケーラビリティと称されることもある)は、参照レイヤ(RL:reference layer)と称されることもあるベースレイヤ(BL:base layer)及び1つ以上のスケーラブルエンハンスメントレイヤ(EL:enhancement layer)が使用されるビデオコーディングを指す。SVCでは、ベースレイヤは、ベースレベルの品質でビデオデータを担持することができる。1つ以上のエンハンスメントレイヤは、例えばより高い空間、時間及び/又は信号対雑音(SNR)レベルをサポートするために、追加のビデオデータを担持することができる。エンハンスメントレイヤは、以前に符号化されたレイヤに対して定義され得る。例えば下部レイヤがBLとして機能してよく、上部レイヤがELとして機能してもよい。中間レイヤは、EL又はRLのいずれか又はその両方として機能し得る。例えば中間レイヤ(例えば最下位レイヤでも最上位レイヤでもないレイヤ)は、中間レイヤの下にあるレイヤ、例えばベースレイヤ又は任意の介在するエンハンスメントレイヤについてのELであってよく、同時に、中間レイヤの上にある1つ以上のエンハンスメントレイヤについてのRLとして機能し得る。同様に、HEVC規格のマルチビュー又は3D拡張では、複数のビューが存在してもよく、あるビューの情報が、別のビューの情報(例えば動き推定、動きベクトル予測及び/又は他の冗長性)をコーディング(例えば符号化又は復号)するために利用され得る。
SVCでは、エンコーダ又はデコーダによって使用されるパラメータは、それらが利用され得るコーディングレベル(例えばビデオレベル、シーケンスレベル、ピクチャレベル、スライスレベル等)に基づいて、パラメータセットにグループ化される。例えばビットストリーム内の異なるレイヤの1つ以上のコーディングされたビデオシーケンスによって利用され得るパラメータは、ビデオパラメータセット(VPS)に含まれてよく、コーディングされたビデオシーケンス内の1つ以上のピクチャによって利用されるパラメータは、シーケンスパラメータセット(SPS)に含まれてよい。同様に、ピクチャ内の1つ以上のスライスによって利用されるパラメータは、ピクチャパラメータセット(PPS)に含まれてよく、単一のスライスに特有である他のパラメータは、スライスヘッダに含まれてよい。同様に、特定のレイヤが所与の時間にどのパラメータセットを使用しているかの指示は、様々なコーディングレベルで提供され得る。
VVCにおける参照ピクチャ再サンプリング(RPR)のサポートのおかげで、空間スケーラビリティサポートのために必要とされるアップサンプリングは、単にRPRアップサンプリングフィルタを使用するだけでよいので、複数のレイヤ、例えばVVCではSD及びHD解像度を有する2つのレイヤを含むビットストリームのサポートを、いずれの追加の信号処理レベルコーディングツールも必要とせずに設計することができる。それにもかかわらず、スケーラビリティのサポートには、(スケーラビリティをサポートしないときと比べて)高レベルの構文変更が必要とされる。スケーラビリティのサポートは、VVCバージョン1で指定される。AVC及びHEVCの拡張を含む、いずれかの以前のビデオコーディング規格におけるスケーラビリティのサポートとは異なり、VVCスケーラビリティの設計は、可能な限りシングルレイヤデコーダ設計に好ましいようにされている。マルチレイヤビットストリームのための復号能力は、あたかもビットストリーム内にはシングルレイヤしか存在しないかのような方法で指定される。例えばDPBサイズのような復号能力は、復号されるべきビットストリーム内のレイヤの数に依存しない方法で指定される。基本的に、シングルレイヤビットストリームのために設計されたデコーダは、マルチレイヤビットストリームを復号できるようにするためにはあまり変更を必要としない。AVC及びHEVCのマルチレイヤ拡張の設計と比較して、HLS態様は、いくつかの柔軟性を犠牲にして、著しく単純化されている。例えばIRAP AUは、CVSに存在するレイヤの各々についてのピクチャを含むことが要求される。
3.4. パラメータセット
AVC、HEVC及びVVCは、パラメータセットを指定する。パラメータセットのタイプは、SPS、PPS、APS及びVPSを含む。SPS及びPPSは、AVC、HEVC及びVVCのすべてにおいてサポートされる。VPSはHEVCから導入されており、HEVCとVVCの両方に含まれる。APSはAVCにもHEVCにも含まれていなかったが、最新のVVCドラフトテキストには含まれる。
SPSはシーケンスレベルヘッダ情報を担持するように設計され、PPSは、まれに変化するピクチャレベルヘッダ情報を担持するように設計された。SPS及びPPSでは、まれに変化する情報をシーケンス又はピクチャごとに繰り返す必要がなく、したがって、この情報の冗長的なシグナリングを回避することができる。さらに、SPS及びPPSの使用は、重要なヘッダ情報の帯域外送信を可能にし、冗長送信の必要性を回避するだけでなく、エラー耐性も改善する。
VPSは、マルチレイヤビットストリーム内のすべてのレイヤに共通するシーケンスレベルのヘッダ情報を担持するために導入された。
APSは、コーディングにかなりのビットを必要とするこのようなピクチャレベル又はスライスレベルの情報を担持するために導入され、複数のピクチャによって共有されることができ、シーケンスにおいては、非常に多くの異なるバリエーションが存在する可能性がある。
4. 開示される技術的解決策によって対処される技術的問題
VVCにおけるPOC、GDR、EOS及び静止画プロファイルの最新の設計は、以下の問題を有する:
1)vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagは0に等しくなければならないことが要求される。しかしながら、参照レイヤ内のそのようなピクチャは、C.6節で指定される一般的なサブビットストリーム抽出プロセスによって除去される可能性がある。したがって、POCの導出は正しくない。
2)ph_poc_msb_cycle_present_flagの値がPOC導出プロセスで使用されるが、フラグが存在しない可能性があり、その場合は推定される値は存在しない。
3)GDR機能は、主に、使用される低エンドツーエンド遅延アプリケーションに有益である。したがって、低エンドツーエンド遅延アプリケーションに適さない方法でビットストリームが符号化されるとき、その使用を許容しないことは理にかなっている。
4)レイヤのEOS NALユニットが、マルチレイヤビットストリームのAU内に存在するとき、これは、このAUへジャンプするシーク操作があったこと又はこのAUがビットストリーム・スプライシングポイントであることを意味する。2つの状況のいずれにとっても、レイヤ間にインターレイヤ依存性があるかどうかにかかわらず、同じビットストリームの別のレイヤではコンテンツは連続的であるのに、このレイヤは同じコンテンツに対して連続的ではないということは意味がない。
5)出力すべきピクチャを持たないビットストリームを有する可能性がある。これは、一般にすべてのプロファイルに対して又は静止画プロファイルのみに対して、許容されるべきではない。
5.実施形態及び解決策のリスト
上記の問題点及び他の問題を解決するために、以下に要約される方法が開示される。項目は、一般的な概念を説明するための例と見なされるべきであり、狭義に解釈されるべきではない。さらに、これらの項目を、個々に又は任意の方法で組み合わせて適用することができる。
1)問題1を解決するために、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagが0に等しいことを要求する代わりに、より厳しい条件下で、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求され得る。
a)一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のピクチャのスライスのRefPicList[ 0 ]又はRefPicList[ 1 ]内にILRPエントリが存在するとき、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求される。
b)一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が0に等しく、現在のレイヤの参照レイヤの現在のAU内にあるrefpicLayerIdに等しいnuh_layer_idを有し、かつMax( 0, vps_max_tid_il_ref_pics_plus1[ currLayerIdx ][ refLayerIdx ] - 1 )以下のTemporalIdを有する、ピクチャが存在するとき、ph_poc_msb_cycle_present_flagの値が0に等しいことが要求され、ここで、currLayerIdx及びrefLayerIdxは、それぞれ、GeneralLayerIdx[ nuh_layer_id ]及びGeneralLayerIdx[ refpicLayerId ]に等しい。
c)一例では、ph_poc_msb_cycle_present_flagの値が0に等しいことは全く要求されない。
2)問題2を解決するために、POC導出プロセスで「ph_poc_msb_cycle_present_flagが1(0)に等しいこと」を使用する代わりに、「ph_poc_msb_cycle_valが存在する(存在しない)」を使用する。
3)問題3を解決するために、GDRピクチャが低エンドツーエンド遅延アプリケーションにおいてのみ使用されることが想定され、GDRピクチャは、AUの出力順序と復号順序が異なるときは許容され得ない。
a)一例では、sps_gdr_enabled_flagが1に等しいとき、CLVSのすべてのピクチャの復号順序と出力順序は同じであるべきことが要求される。この制約はまた、AUの復号順序と出力順序が、マルチレイヤビットストリームにおいて同じであることも義務付けることに注意されたい。なぜなら、AU内のすべてのピクチャは復号順序において連続することが要求され、AU内のすべてのピクチャが同じ出力順序を有するからである。
b)一例では、sps_gdr_enabled_flagが、CVS内のピクチャによって参照されるSPSについて1に等しいとき、CVS内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
c)一例では、sps_gdr_enabled_flagが、ピクチャによって参照されるSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
d)一例では、sps_gdr_enabled_flagが、ビットストリーム内に存在するSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
e)一例では、sps_gdr_enabled_flagが、(ビットストリーム内にあることによって又は外部の手段を通して提供される)ビットストリームのSPSについて1に等しいとき、ビットストリーム内のすべてのAUの復号順序と出力順序は同じであるべきことが要求される。
4)問題4を解決するために、レイヤのEOS NALユニットがマルチレイヤビットストリームのAU内に存在するとき、すべて又は特定の上位レイヤの各々における次のピクチャがCLVSSピクチャであることが要求される。
a)一例では、AU auAが、レイヤ layerA内にEOS NALユニットを含むとき、CVSに存在し、かつlayerAを参照レイヤとして有する、各レイヤ layerBごとに、復号順序でauAに続くAUにおいて復号順序でlayerB内の第1ピクチャが、CLVSSピクチャであるべきことが指定される。
b)一例では、代替的に、AU auAが、レイヤ layerA内にEOS NALユニットを含むとき、CVS内に存在し、かつlayerAよりも上位レイヤである、レイヤ layerBごとに、復号順序でauAに続くAUにおいて復号順序でlayerB内の第1ピクチャが、CLVSSピクチャであるべきことが指定される。
c)一例では、代替的に、AU auA内の1つのピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
d)一例では、代替的に、AU auA内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBより上位である、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
e)一例では、代替的に、AU auA内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBを参照レイヤとして有する、CVS内に存在する各レイヤ layerAごとに、auA内にlayerAについてのピクチャ picAが存在する場合、picAがCLVSSピクチャであるべきであり、そうでない場合(uA内にlayerAについてのピクチャが存在しない場合)、復号順序でauAに続くAU内のlayerAについての復号順序で第1ピクチャが、CLVSSピクチャであるべきことが指定される。
f)一例では、代替的に、AU内にEOS NALユニットが存在するとき、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
g)一例では、代替的に、AU内のレイヤ layerB内にEOS NALユニットが存在するとき、layerBよりも上位である、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
h)一例では、代替的に、AU内のレイヤ layerB内にEOS NALユニットが存在するとき、layerBを参照レイヤとして有する、CVS内に存在する各レイヤごとに、AU内にEOS NALユニットが存在するべきであることが指定される。
i)一例では、代替的に、AU内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AU内のすべてのピクチャが、CLVSSピクチャであるべきことが指定される。
j)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBより上位のすべてのレイヤ内のAU内のピクチャが、CLVSSピクチャであるべきことが指定される。
k)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、layerBを参照レイヤとして有する、すべてのレイヤ内のAU内のピクチャが、CLVSSピクチャであるべきことが指定される。
l)一例では、代替的に、AU内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在する各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
m)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在するlayerBより上位の各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
n)一例では、代替的に、AU内のレイヤ layerB内のピクチャが、CRAピクチャ又はGDRピクチャであるCLVSSピクチャであるとき、AUは、CVS内に存在するlayerBを参照レイヤとして有する各レイヤごとに、ピクチャを有するべきであり、AU内のすべてのピクチャがCLVSSピクチャであるべきことが指定される。
5)問題5を解決するために、ビットストリームは、出力される少なくとも1つのピクチャを有するべきであることが指定される。
a)一例では、ビットストリームが1つのピクチャのみを含むとき、ピクチャは、1に等しいph_pic_output_flagを有するべきであることが指定される。
b)一例では、ビットストリームは、出力レイヤ内にあり、かつ1に等しいph_pic_output_flagを有する、少なくとも1つのピクチャを有するべきであることが指定される。
c)例では、上記制約のいずれかは、1つ以上の静止画プロファイルの定義の一部として、例えばMain 10静止画プロファイル(Main 10 Still Picture profile)及びMain 4:4:4 10静止画プロファイル(Main 4:4:4 10 Still Picture profile)として指定される。
d)例では、上記制約のいずれかは、プロファイルの定義の一部ではなく、それが任意のプロファイルに当てはまるよう指定される。
6. 実施形態
Figure 2023529198000002
6.1. 第1実施形態
この実施形態は、項目1~項目5及びそれらの副項目の一部についてのものである。
Figure 2023529198000003
Figure 2023529198000004
図1は、本明細書で開示される様々な技術が実装され得る例示的なビデオ処理システム1000を示すブロック図である。様々な実装は、システム1000の構成要素の一部又はすべてを含み得る。システム1000は、ビデオコンテンツを受け取るための入力1002を含み得る。ビデオコンテンツは、生又は非圧縮フォーマットで、例えば8ビット又は10ビットの多成分画素値で受け取られてよく、あるいは圧縮又は符号化フォーマットであってもよい。入力1002は、ネットワークインタフェース、周辺バスインタフェース又はストレージインタフェースを表し得る。ネットワークインタフェースの例は、イーサネット(登録商標)、受動光ネットワーク(PON)等のような有線インタフェースと、Wi-Fi又はセルラインタフェースのような無線インタフェースを含む。
システム1000は、本文書で説明される様々なコーディング又は符号化方法を実装し得るコーディング構成要素1004を含み得る。コーディング構成要素1004は、入力1002からコーディング構成要素1004の出力へビデオの平均ビットレートを低減して、ビデオのコーディングされた表現を生成し得る。したがって、コーディング技術は、ビデオ圧縮又はビデオトランスコーディング技術と呼ばれることがある。コーディング構成要素1004の出力は、構成要素1006によって表されるように、記憶され得るか又は接続された通信を介して送信され得る。入力1002で受け取られたビデオの記憶又は通信されたビットストリーム(又はコーディングされた)表現は、構成要素1008によって、ディスプレイインタフェース1010に送られる画素値又は表示可能なビデオを生成するために使用され得る。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ復元と呼ばれることがある。さらに、特定のビデオ処理操作は、「コーディング」操作又はツールと称されるが、コーディングツール又は操作はエンコーダで使用され、コーディングの結果を反転する、対応する復号ツール又は操作が、デコーダによって実行されることになることが理解されよう。
周辺バスインタフェース又はディスプレイインタフェースの例には、ユニバーサルシリアルバス(USB)又は高解像度マルチメディアインタフェース(HDMI(登録商標))又はディスプレイポート等が含まれ得る。ストレージインタフェースの例には、SATA(serial advanced technology attachment)、PCI、IDEインタフェース等が含まれる。本文書において説明される技術は、携帯電話、ラップトップ、スマートフォンあるいはデジタルデータ処理及び/又はビデオ表示を実行することができる他のデバイスのような、様々な電子デバイスにおいて具体化され得る。
図2は、ビデオ処理装置2000のブロック図である。装置2000は、本明細書で説明される方法の1つ以上を実装するために使用され得る。装置2000は、スマートフォン、タブレット、コンピュータ、モノのインターネット(IoT)受信機等において具体化され得る。装置2000は、1つ以上のプロセッサ2002、1つ以上のメモリ2004及びビデオ処理ハードウェア2006を含み得る。プロセッサ2002は、本文書において(例えば図6~図9において)説明される1つ以上の方法を実装するように構成され得る。メモリ(複数のメモリ)2004は、本明細書で説明される方法及び技術を実装するために使用されるデータ及びコードを記憶するために使用され得る。ビデオ処理ハードウェア2006は、ハードウェア回路内で、本文書で説明されるいくつかの技術を実装するために使用され得る。いくつかの実施形態において、ハードウェア2006は、部分的又は全体的に、1つ以上のプロセッサ2002、例えばグラフィクスプロセッサ内に存在してもよい。
図3は、本開示の技術を利用し得る例示的なビデオコーディングシステム100を示すブロック図である。図3に示されるように、ビデオコーディングシステム100は、ソースデバイス110と宛先デバイス120を含み得る。ソースデバイス110は符号化ビデオデータを生成し、ビデオ符号化デバイスと称されることがある。宛先デバイス120は、ソースデバイス110によって生成された符号化ビデオデータを復号することができ、ビデオ復号デバイスと称されることがある。ソースデバイス110は、ビデオソース112、ビデオエンコーダ114及び入力/出力(I/O)インタフェース116を含み得る。
ビデオソース112は、ビデオキャプチャデバイス、ビデオコンテンツプロバイダからビデオデータを受け取るためのインタフェース及び/又はビデオデータを生成するためのコンピュータグラフィクスシステムのようなソース又はそのようなソースの組合せを含み得る。ビデオデータは、1つ以上のピクチャを備え得る。ビデオエンコーダ114は、ビデオソース112からのビデオデータを符号化してビットストリームを生成する。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットのシーケンスを含み得る。ビットストリームは、コーディングされたピクチャ及び関連するデータを含み得る。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連するデータは、シーケンスパラメータセット、ピクチャパラメータセット及び他の構文構造を含み得る。I/Oインタフェース116は、変調器/復調器(モデム)及び/又は送信機を含み得る。符号化されたビデオデータは、I/Oインタフェース116を介してネットワーク130aを通って宛先デバイス120に直接送信され得る。符号化されたビデオデータはまた、宛先デバイス120によるアクセスのために記憶媒体/サーバ130b上に記憶され得る。
宛先デバイス120は、I/Oインタフェース126、ビデオデコーダ124及びディスプレイデバイス122を含み得る。
I/Oインタフェース126は、受信機及び/又はモデムを含み得る。I/Oインタフェース126は、ソースデバイス110又は記憶媒体/サーバ130bから符号化されたビデオデータを取得し得る。ビデオデコーダ124は、符号化されたビデオデータを復号し得る。ディスプレイデバイス122は、復号されたビデオデータをユーザに表示し得る。ディスプレイデバイス122は、宛先デバイス120と一体化されてよく、あるいは外部ディスプレイデバイスとインタフェースするよう構成される宛先デバイス120の外部にあってもよい。
ビデオエンコーダ114及びビデオデコーダ124は、HEVC(High Efficiency Video Coding)規格、VVC(Versatile Video Coding)規格並びに他の現在の及び/又は更なる規格のような、ビデオ圧縮規格に従って動作し得る。
図4は、ビデオエンコーダ200の一例を示すブロック図であり、これは、図3に示されるシステム100内のビデオエンコーダ114であり得る。
ビデオエンコーダ200は、本開示の技術のいずれか又はすべてを実行するよう構成され得る。図4の例では、ビデオエンコーダ200は複数の機能構成要素を含む。本開示で説明される技術は、ビデオエンコーダ200の様々な構成要素の間で共有され得る。いくつかの例において、プロセッサは、本開示で説明される技術のいずれか又はすべてを実行するように構成され得る。
ビデオエンコーダ200の機能構成要素は、分割ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205及びイントラ予測ユニット206を含み得る予測ユニット202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214とを含み得る。
他の例では、ビデオエンコーダ200は、より多くの、より少ない又は異なる機能構成要素を含み得る。一例では、予測ユニット202は、イントラブロックコピー(IBC)ユニットを含み得る。IBCユニットは、少なくとも1つの参照ピクチャが、現在のビデオブロックが配置されているピクチャである、IBCモードで予測を実行し得る。
さらに、動き推定ユニット204及び動き補償ユニット205のようないくつかの構成要素は、高度に統合されてもよいが、図4の例では、説明の目的のために別個に表されている。
分割ユニット201は、ピクチャを1つ以上のビデオブロックに分割(partition)し得る。ビデオエンコーダ200及びビデオデコーダ300は、様々なビデオブロックサイズをサポートし得る。
モード選択ユニット203は、例えばエラー結果に基づいて、コーディングモード、すなわちイントラ又はインターのうちの1つを選択し、結果として得られるイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成するように残差生成ユニット207に提供し、かつ参照ピクチャとして使用するために符号化ブロックを再構成するように再構成ユニット212に提供し得る。ある例では、モード選択ユニット203は、予測がインター予測信号とイントラ予測信号に基づく、イントラ及びインター予測の組合せ(CIIP:combination of intra and inter predication)モードを選択し得る。モード選択ユニット203はまた、インター予測の場合に、ブロックに対する動きベクトルの解像度(例えばサブピクセル又は整数ピクセル精度)を選択し得る。
現在のビデオブロックにおいてインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ以上の参照フレームを現在のビデオブロックに対して比較することによって、現在のビデオブロックの動き情報を生成し得る。動き補償ユニット205は、動き情報と、現在のビデオブロックに関連付けられるピクチャ以外のバッファ213からのピクチャの復号されたサンプルとに基づいて、現在のビデオブロックについて予測されるビデオブロックを決定し得る。
動き推定ユニット204と動き補償ユニット205は、例えば現在のビデオブロックがIスライス内にあるか、Pスライス内にあるか又はBスライス内にあるかに応じて、現在のビデオブロックについて異なる操作を実行し得る。
いくつかの例では、動き推定ユニット204は、現在のビデオブロックについて、一方向予測を実行することができ、動き推定ユニット204は、現在のビデオブロックの参照ビデオブロックについて、リスト0又はリスト1内の参照ピクチャを検索することができる。次いで、動き推定ユニット204は、参照ビデオブロックと、現在のビデオブロックと参照ビデオブロックとの間の空間変位を示す動きベクトルとを含む、リスト0又はリスト1内の参照ピクチャを示す参照インデックスを生成し得る。動き推定ユニット204は、参照インデックス、予測方向インジケータ及び動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のブロックの予測ビデオブロックを生成し得る。
他の例では、動き推定ユニット204は、現在のビデオブロックについて、双方向予測を実行することができ、動き推定ユニット204は、現在のビデオブロックの参照ビデオブロックについて、リスト0内の参照ピクチャを検索してよく、また現在のビデオブロックの別の参照ビデオブロックについて、リスト1内の参照ピクチャを検索することができる。次いで、動き推定ユニット204は、参照ビデオブロックと、該参照ビデオブロックと現在のビデオブロックとの間の空間変位を示す動きベクトルとを含む、リスト0及びリスト1内の参照ピクチャを示す参照インデックスを生成し得る。動き推定ユニット204は、参照インデックス及び現在のビデオブロックの動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成し得る。
いくつかの例では、動き推定ユニット204は、デコーダの復号処理のために動き情報のフルセットを出力し得る。
いくつかの例では、動き推定ユニット204は、現在のビデオについて動き情報のフルセットを出力しないことがある。むしろ、動き推定ユニット204は、別のビデオブロックの動き情報を参照して、現在のビデオブロックの動き情報をシグナリングし得る。例えば動き推定ユニット204は、現在のビデオブロックの動き情報が、隣接するビデオブロックの動き情報と十分に類似していると判断し得る。
一例では、動き推定ユニット204は、現在のビデオブロックに関連付けられる構文構造において、現在のビデオブロックが別のビデオブロックと同じ動き情報を有することをビデオデコーダ300に指示する値を指示し得る。
別の例では、動き推定ユニット204は、現在のビデオブロックに関連付けられる構文構造において、別のビデオブロック及び動きベクトル差(MVD:motion vector difference)を識別し得る。動きベクトル差は、現在のビデオブロックの動きベクトルと、指示されたビデオブロックの動きベクトルとの間の差を示す。ビデオデコーダ300は、指示されたビデオブロックの動きベクトルと動きベクトル差を使用して、現在のビデオブロックの動きベクトルを決定し得る。
上述のように、ビデオエンコーダ200は、動きベクトルを予測的にシグナリングし得る。ビデオエンコーダ200によって実装され得る予測シグナリング技術の2つの例は、アドバンスドベクトル予測(AMVP:advanced motion vector predication)とマージモードシグナリングを含む。
イントラ予測ユニット206は、現在のビデオブロックに対してイントラ予測を実行し得る。イントラ予測ユニット206が現在のビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット206は、同じピクチャ内の他のビデオブロックの復号されたサンプルに基づいて、現在のビデオブロックについての予測データを生成し得る。現在のビデオブロックについての予測データは、予測されるビデオブロックと様々な構文要素とを含み得る。
残差生成ユニット207は、現在のビデオブロックから、現在のビデオブロックの予測ビデオブロックを減算することによって(例えばマイナス記号によって示される)、現在のビデオブロックについての残差データを生成し得る。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプル構成要素に対応する残差ビデオブロックを含み得る。
他の例では、例えばスキップモードにおいて、現在のビデオブロックについて現在のビデオブロックの残差データが存在しないことがあり、残差生成ユニット207は減算操作を実行しないことがある。
変換処理ユニット208は、1つ以上の変換を、現在のビデオブロックに関連付けられる残差ビデオブロックに適用することによって、現在のビデオブロックについての1つ以上の変換係数ビデオブロックを生成し得る。
変換処理ユニット208が、現在のビデオブロックに関連付けられる変換係数ビデオブロックを生成した後、量子化ユニット209は、現在のビデオブロックに関連付けられる1つ以上の量子化パラメータ(QP)値に基づいて、現在のビデオブロックに関連付けられる変換係数ビデオブロックを量子化し得る。
逆量子化ユニット210及び逆変換ユニット211は、変換係数ビデオブロックから残差ビデオブロックを再構成するために、それぞれ、逆量子化及び逆変換を変換係数ビデオブロックに適用し得る。再構成ユニット212は、再構成された残差ビデオブロックを、予測ユニット202によって生成された1つ以上の予測ビデオブロックからの対応するサンプルに追加して、バッファ213における記憶のために、現在のブロックに関連付けられる再構成ビデオブロックを生成し得る。
再構成ユニット212がビデオブロックを再構成した後、ループフィルタリング操作を実行して、ビデオブロック内のビデオブロッキングアーチファクトを低減し得る。
エントロピー符号化ユニット214は、ビデオエンコーダ200の他の機能構成要素からデータを受け取り得る。エントロピー符号化ユニット214がデータを受け取ると、エントロピー符号化ユニット214は、1つ以上のエントロピー符号化操作を実行して、エントロピー符号化データを生成し、エントロピー符号化データを含むビットストリームを出力し得る。
図5は、図3に図示されるシステム100内のビデオデコーダ124であり得るビデオデコーダ300の一例を示すブロック図である。
ビデオデコーダ300は、本開示の技術のいずれか又はすべてを実行するよう構成され得る。図5の例では、ビデオデコーダ300は、複数の機能構成要素を含む。本開示で説明される技術は、ビデオデコーダ300の様々な構成要素の間で共有され得る。いくつかの例において、プロセッサは、本開示で説明される技術のいずれか又はすべてを実行するよう構成され得る。
図5の例では、ビデオデコーダ300は、エントロピー復号ユニット301、動き補償ユニット302、イントラ予測ユニット303、逆量子化ユニット304、逆変換ユニット305、再構成ユニット306及びバッファ307を含む。ビデオデコーダ300は、いくつかの例では、ビデオエンコーダ200(図4)を参照して説明した符号化パスと概ね逆の復号パスを実行し得る。
エントロピー復号ユニット301は、符号化ビットストリームを取り出し得る。符号化ビットストリームは、エントロピーコーディングされたビデオデータ(例えばビデオデータの符号化ブロック)を含み得る。エントロピー復号ユニット301は、エントロピーコーディングされたビデオデータを復号することができ、エントロピー復号されたビデオデータから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス及び他の動き情報を含む、動き情報を決定し得る。動き補償ユニット302は、例えばAMVP及びマージモードを実行することによって、そのような情報を決定し得る。
動き補償ユニット302は、動き補償されたブロックを生成することができ、場合によっては、補間フィルタに基づいて補間を実行することができる。サブピクセル精度で使用される補間フィルタの識別子は、構文要素に含まれ得る。
動き補償ユニット302は、ビデオブロックの符号化中にビデオエンコーダ200によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルについての補間値を算出し得る。動き補償ユニット302は、受け取った構文情報に従ってビデオエンコーダ200によって使用される補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
動き補償ユニット302は、構文情報の一部を使用して、符号化ビデオシーケンスのフレーム及び/又はスライスを符号化するために使用されるブロックのサイズと、符号化ビデオシーケンスのピクチャの各マクロブロックがどのように分割されるかを記述する分割情報と、各分割がどのように符号化されるかを示すモードと、各インター符号化ブロックについての1つ以上の参照フレーム(及び参照フレームリスト)と、符号化ビデオシーケンスを復号するための他の情報を決定し得る。
イントラ予測ユニット303は、例えばビットストリームで受け取ったイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成し得る。逆量子化ユニット304は、ビットストリームにおいて提供され、かつエントロピー復号ユニット301によって復号される、量子化されたビデオブロック係数を逆量子化する、すなわち、脱量子化する。逆変換ユニット305は、逆変換を適用する。
再構成ユニット306は、残差ブロックを、動き補償ユニット302又はイントラ予測ユニット303によって生成された対応する予測ブロックと合算して、復号されたブロックを形成し得る。所望であれば、ブロッキネス(blockiness)アーチファクトを除去するために、デブロッキングフィルタも適用して、復号されたブロックをフィルタリングしてもよい。次いで、復号されたビデオブロックはバッファ307に記憶され、バッファ307は、後続の動き補償/イントラ予測のために参照ブロックを提供し、また、ディスプレイデバイス上における提示のために復号されたビデオも生成する。
図6~図11は、例えば図1~図5に示される実施形態において上述した技術的解決策を実装することができる例示的な方法を示す。
図6は、ビデオ処理の例示的な方法600のフローチャートを示す。方法600は、動作610において、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに準拠し、フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、第2構文要素は、現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する。
図7は、ビデオ処理の例示的な方法700のフローチャートを示す。方法700は、動作710において、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに準拠し、フォーマットルールは、構文要素が存在しない場合に、ピクチャ順序カウント(POC)の導出を指定し、構文要素は、現在のピクチャのPOCの最上位ビット(MSB)サイクルの値を指定する。
図8は、ビデオ処理の例示的な方法800のフローチャートを示す。方法800は、動作810において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、ルールは、AUの出力順序がAUの復号順序と異なることに応答して、漸次復号リフレッシュ(GDR)ピクチャがビットストリームにおいて許容されないことを指定する。
図9は、ビデオ処理の例示的な方法900のフローチャートを示す。方法900は、動作910において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1レイヤのエンドオブシーケンス(EOS)ネットワーク抽象化レイヤ(NAL)ユニットが、ビットストリーム内の第1アクセスユニット(AU)内に存在していることに応答して、ビットストリーム内の第1AUに続くAU内の第1レイヤの1つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることを指定する。
図10は、ビデオ処理の例示的な方法1000のフローチャートを示す。方法1000は、動作1010において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1アクセスユニット内の第1ピクチャが、クリーンランダムアクセス(CRA)ピクチャ又は漸次復号リフレッシュ(GDR)ピクチャであるコーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることに応答して、第2ピクチャがCLVSSピクチャであることを指定する。
図11は、ビデオ処理の例示的な方法1100のフローチャートを示す。方法1100は、動作1110において、ルールに従って、1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ルールは、ビットストリームが、出力される少なくとも第1ピクチャを備えることを指定し、第1ピクチャは出力レイヤ内にあり、第1ピクチャは1に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ(HRD)に関連付けられる除去プロセスとに影響を及ぼす。
以下の解決策は、前のセクション(例えば項目1~5)で議論された技術の例示的な実施形態を示す。
いくつかの実施形態によって好ましい解決策のリストを次に提供する。
A1.ビデオ処理の方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに準拠し、該フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、第2構文要素は、現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する。
A2.解決策A1の方法において、
第1構文要素の値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ(ILRP)エントリが現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、フラグは、インデックス化レイヤ(indexed layer)がインターレイヤ予測を使用するかどうかを指定する。
A3.解決策A2の方法において、
参照ピクチャリストは、第1参照ピクチャリスト(RefPicList[ 0 ])又は第2参照ピクチャリスト(RefPicList[ 1 ])を備える。
A4.解決策A2の方法において、
ゼロに等しい第1構文要素の値は、第2構文要素がピクチャヘッダ構文構造内に存在しないことを指定する。
A5.解決策A2の方法において、
ゼロに等しいフラグの値は、インデックス化レイヤがインターレイヤ予測を使用することを許容されることを指定する。
A6.解決策A1の方法において、
第1構文要素の値は、フラグの値がゼロに等しく、かつピクチャが、(i)現在のレイヤの参照レイヤ内の現在のアクセスユニット(AU)内にある第2識別子に等しい第1識別子と、(ii)閾値以下の第3識別子とを有することに応答して、ゼロに等しく、フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、第1識別子は、ビデオコーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが属するレイヤを指定し、第2識別子は、参照ピクチャが属するレイヤを指定し、第3識別子は、時間的識別子であり、閾値は、イントラランダムアクセスピクチャ(IRAP)ピクチャでもなく、漸次復号リフレッシュ(GDR)ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ(IRLP)として使用されるかどうかを指定する第2構文要素に基づく。
A7.解決策A6の方法において、
第1識別子はnuh_layer_idであり、第2識別子はrefpicLayerIdであり、第3識別子はTemporalIdであり、第2構文要素はvps_max_tid_il_ref_pics_plus1である。
A8.解決策A1の方法において、
第1構文要素は、ゼロであることは全く要求されない。
A9.解決策A2~A8のいずれかの方法において、
第1構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、第2構文要素はph_poc_msb_cycle_valである。
A10.ビデオ処理の方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、構文要素が存在しない場合に、ピクチャ順序カウント(POC)の導出を指定し、構文要素は、現在のピクチャのPOC最上位ビット(MSB)サイクルの値を指定する。
A11.解決策A10の方法において、
構文要素はph_poc_msb_cycle_valである。
A12.ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、ルールは、AUの出力順序がAUの復号順序と異なることに応答して、ビットストリームでは漸次復号リフレッシュ(GDR)ピクチャが許容されないことを指定する。
A13.解決策A12の方法において、
コーディングされたレイヤビデオシーケンス(CLVS)内のすべてのピクチャの出力順序と復号順序は、フラグが1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
A14.解決策12の方法において、
AUの出力順序と復号順序は、フラグが、コーディングされたビデオシーケンス(CVS)内のピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
A15.解決策A12の方法において、
AUの出力順序と復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
A16.解決策A12の方法において、AUの出力順序及び復号順序は、フラグが、ビットストリーム内のシーケンスパラメータセット(SPS)について1に等しいことに応答して、同一であり、フラグは、GDRピクチャが有効であるかどうかを指定する。
A17.解決策A13~A16のいずれかの方法において、
フラグは、sps_gdr_enabled_flagである。
いくつかの実施形態によって好ましい解決策の別のリストを次に提供する。
B1.ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1レイヤについてのエンドオブシーケンス(EOS)ネットワーク抽象化レイヤ(NAL)ユニットが、ビットストリーム内の第1アクセスユニット(AU)内に存在することに応答して、ビットストリーム内の第1AUに続くAU内の第1レイヤの1つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることを指定する。
B2.解決策B1の方法において、
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤを参照レイヤとして使用する第2レイヤについての復号順序において、第1ピクチャがCLVSS画像であることを更に指定する。
B3.解決策B1の方法において、
1つ以上の上位レイヤは、すべて又は特定の上位レイヤを備える。
B4.解決策B1の方法において、
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤよりも上位レイヤである第2レイヤについての復号順序において、第1ピクチャがCLVSSピクチャであることを更に指定する。
B5.解決策B1の方法において、
フォーマットルールは、EOS NALユニットが、ビットストリーム内のコーディングされたビデオシーケンス(CVS)の各レイヤ内に存在することを更に指定する。
B6.解決策B1の方法において、
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤより上位レイヤである第2レイヤが、EOS NALユニットを備えることを更に指定する。
B7.解決策B1の方法において、
フォーマットルールは、第1レイヤを含むコーディングされたビデオシーケンス(CVS)内に存在し、第1レイヤを参照レイヤとして使用する第2レイヤが、EOS NALユニットを備えることを更に指定する。
B8.ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って1つ以上のピクチャを備える複数のアクセスユニットAU内に複数のレイヤを備え、フォーマットルールは、第1アクセスユニット内の第1ピクチャが、クリーンランダムアクセス(CRA)ピクチャ又は漸次復号リフレッシュ(GDR)ピクチャであるコーディングされたレイヤビデオシーケンス開始(CLVSS)ピクチャであることに応答して、第2ピクチャがCLVSSピクチャであることを指定する。
B9.解決策B8の方法において、
第2ピクチャは、第1アクセスユニット内のレイヤのピクチャである。
B10.解決策B8の方法において、
第1レイヤは第1ピクチャを備え、第2ピクチャは、第1レイヤより上位である第2レイヤ内のピクチャである。
B11.解決策B8の方法において、
.第1レイヤは第1ピクチャを備え、第2ピクチャは、第1レイヤを参照レイヤとして使用する第2レイヤ内のピクチャである。
B12.解決策B8の方法において、
第2ピクチャは、第1アクセスユニットに続く第2アクセスユニットの復号順序において第1ピクチャである。
B13.解決策B8の方法において、
第2ピクチャは、第1アクセスユニット内の任意のピクチャである。
B14.解決策B1~B13のいずれかの方法において、
CLVSSピクチャは、1に等しいフラグを有する(IRAP)ピクチャ又は(GDR)ピクチャである、コーディングされたピクチャであり、1に等しいフラグは、関連するピクチャが、ビットストリーム内に存在しないピクチャへの参照を備えるという決定があると、関連するピクチャがデコーダによって出力されないことを指示する。
いくつかの実施形態によって好ましい解決策の更に別のリストが次に提供される。
C1.ビデオ処理の方法であって、
ルールに従って、1つ以上のピクチャを備えるビデオと、ビデオのビットストリームとの間の変換を実行するステップを備え、ルールは、ビットストリームが少なくとも、出力される第1ピクチャを備えることを指定し、第1ピクチャは出力レイヤ内にあり、第1ピクチャは、1に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ(HRD)に関連付けられる除去プロセスとに影響を及ぼす。
C2.解決策C1の方法において、
ルールはすべてのプロファイルに当てはまり、ビットストリームは任意のプロファイルに準拠することが許容される。
C3.解決策C2の方法において、
構文要素はph_pic_output_flagである。
C4.解決策C2の方法において、
プロファイルは、Main 10静止画プロファイル又はMain 4:4:4 10静止画プロファイルである。
解決策の以下のリストは、上記に列挙される解決策の各々に当てはまる。
O1.上記解決策のいずれかの方法において、
変換は、ビットストリームからビデオを復号することを含む。
O2.上記解決策のいずれかの方法において、
変換は、ビデオをビットストリームに符号化することを含む。
O3.ビデオを表すビットストリームをコンピュータ読取可能記録媒体に記憶する方法であって、
上記解決策のいずれか1つ以上に記載される方法に従って、ビデオからビットストリームを生成するステップと、ビットストリームをコンピュータ読取可能記録媒体に記憶するステップと、を備える。
O4.請求項1乃至7のいずれか1つ以上に記載される方法を実装するよう構成されたプロセッサを備える、ビデオ処理装置。
O5.命令が記憶されたコンピュータ読取可能媒体であって、
命令は、実行されると、プロセッサに上記解決策の1つ以上に記載される方法を実装させる、コンピュータ読取可能媒体。
O6.上記解決策のいずれか1つ以上に記載の方法に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
O7.ビットストリームを記憶するためのビデオ処理装置であって、
当該ビデオ処理装置は、上記解決策のいずれか1つ以上に記載される方法を実装するよう構成される。
いくつかの実施形態によって好ましい解決策の更に別のリストが次に提供される。
P1.ビデオ処理方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオのピクチャ内のピクチャ順序カウントの最上位ビットサイクルの存在を示す構文要素の値に対する制約を指定する。
P2.解決策P1の方法において、
フォーマットルールは、独立値フラグがゼロ値に設定され、かつピクチャの少なくとも1つのスライスがその参照リスト内のインターレイヤ参照ピクチャを使用するとき、構文要素の値が0であることを指定する。
P3.解決策P1~P2のいずれかの方法において、
フォーマットルールは、コーディングされた表現内に構文要素を含まないことによって構文要素のゼロの値が指示されることを指定する。
P4.ビデオ処理方法であって、
1つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、変換は、アクセスユニットの出力順序がアクセスユニットの復号順序と異なる場合に、漸次復号リフレッシュピクチャが許容されないことを指定するルールに準拠する。
P5.ビデオ処理方法であって、
1つ以上のビデオピクチャを備えるビデオレイヤを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオシーケンスの終了(end of a video sequence)を示す第1ネットワーク抽象化レイヤユニット(NAL)が、レイヤのアクセスユニット内に存在する場合、コーディングされた表現内の上位レイヤの各々の次のピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有さなければならないことを指定する。
P6.解決策P5の方法において、
フォーマットルールは、レイヤを参照レイヤとして使用する第2レイヤの復号順序における第1ピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有するべきことを更に指定する。
P7.解決策P1~P5のいずれかの方法において、
変換を実行するステップは、ビデオを符号化してコーディングされた表現を生成するステップを含む。
P8.解決策P1~P5のいずれかの方法において、
変換を実行するステップは、コーディングされた表現を解析及び復号してビデオを生成するステップを含む。
P9.解決策P1~P8の1つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ復号装置。
P10.解決策P1~P8の1つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ符号化装置。
P11.コンピュータコードが記憶されたコンピュータプログラム製品であって、
コードは、プロセッサによって実行されると、プロセッサに、解決策P1~P8のいずれかに記載される方法を実装させる。
本文書において、「ビデオ処理」という用語は、ビデオ符号化、ビデオ復号、ビデオ圧縮又はビデオ復元を指すことがある。例えばビデオ圧縮アルゴリズムは、ビデオの画素表現から対応するビットストリーム表現へ又はその逆の変換中に適用され得る。現在のビデオブロックのビットストリーム表現(又は単にビットストリーム)は、例えば構文によって定義されるように、共同配置されるか又はビットストリーム内の異なる場所に拡散されるビットに対応し得る。例えばマクロブロックは、変換されてコーディングされたエラー残差値に関して、またビットストリーム内のヘッダ及び他のフィールド内のビットを使用して符号化され得る。
本文書において説明される、開示される及び他の解決策、実施例、実施形態、モジュール及び機能的動作は、デジタル電子回路において、あるいは本文書で開示される構造及びそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア又はハードウェアにおいて、あるいはそれらの1つ以上の組合せにおいて実装されることができる。開示される及び他の実施形態を、1つ以上のコンピュータプログラム製品として、すなわちデータ処理装置による実行のため又はデータ処理装置の動作を制御するために、コンピュータ読取可能媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装することができる。コンピュータ読取可能媒体は、機械読取可能ストレージデバイス、機械読取可能記憶基板、メモリデバイス、機械読取可能伝搬信号に影響を与える組成物又は1つ以上のそれらの組合せとすることができる。「データ処理装置」という用語は、例としてプログラマブルプロセッサ、コンピュータあるいは複数のプロセッサ又はコンピュータを含む、データを処理するためのすべての装置、デバイス及び機械を包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムのための実行環境を作成するコード、例えばプロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム又はそれらの1つ以上の組合せを構成するコードを含むことができる。伝搬信号は、人工的に生成された信号、例えば適切な受信器装置への伝送のために情報を符号化するために生成される、機械生成電気信号、光学信号又は電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト又はコードとしても知られる)を、コンパイル又は解釈された言語を含む、任意の形態のプログラミング言語で書くことができ、それは、スタンドアロンプログラムとして、あるいはコンピューティング環境における使用に適したモジュール、構成要素、サブルーチン又は他のユニットとして含む、任意の形態で展開することができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応しない。プログラムは、他のプログラム又はデータ(例えばマークアップ言語文書に記憶される1つ以上のスクリプト)を保持するファイルの一部内に、問題のプログラムに専用の単一ファイル内に、あるいは複数の協調ファイル(例えば1つ以上のモジュール、サブプログラム又はコードの一部を記憶するファイル)内に記憶されることができる。コンピュータプログラムは、1つのコンピュータにおいて、あるいは1つのサイトに配置されるか又は複数のサイトに分散されて通信ネットワークによって相互接続される複数のコンピュータにおいて実行されるように展開されることができる。
本文書で説明されるプロセス及び論理フローを、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって実行することができ、入力データに対して作用し、出力を生成することによって、機能を実行することができる。プロセス及び論理フローはまた、例えばFPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)のような特殊目的論理回路によって実行されることもでき、そのようなものとして装置も実装することもできる。
コンピュータプログラムの実行に適したプロセッサは、例として、汎用及び専用マイクロプロセッサの両方と、任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、読取専用メモリ又はランダムアクセスメモリ又はその両方から命令及びデータを受け取ることになる。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令及びデータを記憶するための1つ以上のメモリデバイスである。一般に、コンピュータはまた、データを記憶するための1つ以上の大容量ストレージデバイス、例えば磁気ディスク、磁気光ディスク又は光ディスクを含むか、そこからデータを受け取り、そこにデータを転送し又はその両方を行うために動作可能に結合される。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ読取可能媒体は、例として、半導体メモリデバイス、例えばEPROM、EEPROM及びフラッシュメモリデバイス;磁気ディスク、例えば内部ハードディスク又はリムーバブルディスク;光磁気ディスク;並びにCD ROM及びDVD-ROMディスクを含む、すべての形態の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、特殊目的論理回路によって補足されるか又はその中に内蔵されることができる。
この特許文書は多くの詳細を含むが、これらは、いずれかの主題の範囲又は特許請求され得る範囲に対する限定として解釈されるべきではなく、むしろ、特定の技術の特定の実施形態に特有である可能性がある特徴の説明と解釈されるべきである。この特許文書において別個の実施形態の文脈で説明される特定の特徴を、単一の実施形態で組み合わせて実装することもできる。反対に、単一の実施形態の文脈において説明される様々な特徴を、複数の実施形態において別個に又は任意の適切な副次的組合せで実装することもできる。さらに、特徴は、特定の組合せにおいて作用するものとして上述され、最初にそのように特許請求されることもあるが、特許請求される組合せからの1つ以上の特徴が、場合によっては、その組合せから切り出される可能性があり、特許請求される組合せは、副次的組合せ又は副次的組合せのバリエーションに向けられる可能性がある。
同様に、動作は図面において特定の順序で示されるが、これは、所望の結果を達成するために、このような動作が、示される特定の順序で又は順番に実行すること、あるいは例示されたすべての動作を実行することを要求するものとして理解されるべきではない。さらに、この特許文書で説明される実施形態における様々なシステム構成要素の分離は、すべての実施形態においてこのような分離を必要とするものとして理解されるべきではない。
いくつかの実装及び実施例のみを説明したが、この特許文書で説明され、例示されているものに基づいて、他の実装、拡張及び変形がなされることができる。
[関連出願の相互参照]
出願は、2020年6月12日に出願された米国仮特許出願第63/038,601号の優先権及び利益を主張する、2021年6月11日に出願された国際特許出願第PCT/US2021/037118号に基づく。上述の特許出願は全て、その全体が参照により本明細書に組み込まれる。

Claims (24)

  1. ビデオ処理の方法であって、
    1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
    前記ビットストリームはフォーマットルールに準拠し、
    前記フォーマットルールは、第2構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第1構文要素の値に対する制約を指定し、
    前記第2構文要素は、前記現在のピクチャのピクチャ順序カウント(POC)の最上位ビット(MSB)サイクルの値を指定する、
    方法。
  2. 前記第1構文要素の前記値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ(ILRP)エントリが前記現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定する、
    請求項1に記載の方法。
  3. 前記参照ピクチャリストは、第1参照ピクチャリスト(RefPicList[ 0 ])又は第2参照ピクチャリスト(RefPicList[ 1 ])を備える、
    請求項2に記載の方法。
  4. ゼロに等しい前記第1構文要素の前記値は、前記第2構文要素が前記ピクチャヘッダ構文構造内に存在しないことを指定する、
    請求項2に記載の方法。
  5. ゼロに等しい前記フラグの前記値は、前記インデックス化レイヤが前記インターレイヤ予測を使用することを許容されることを指定する、
    請求項2に記載の方法。
  6. 前記第1構文要素の前記値は、フラグの値がゼロに等しく、かつピクチャが(i)現在のレイヤの参照レイヤ内の現在のアクセスユニット(AU)内にある第2識別子に等しい第1識別子と、(ii)閾値以下の第3識別子とを有することに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、前記第1識別子は、ビデオコーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが属するレイヤを指定し、前記第2識別子は、参照ピクチャが属するレイヤを指定し、前記第3識別子は、時間的識別子であり、前記閾値は、イントラランダムアクセスピクチャ(IRAP)ピクチャでも漸次復号リフレッシュ(GDR)ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ(IRLP)として使用されるかどうかを指定する第2構文要素に基づく、
    請求項1に記載の方法。
  7. 前記第1識別子はnuh_layer_idであり、前記第2識別子はrefpicLayerIdであり、前記第3識別子はTemporalIdであり、前記第2構文要素はvps_max_tid_il_ref_pics_plus1である、
    請求項6に記載の方法。
  8. 前記第1構文要素は、ゼロであることは全く要求されない、
    請求項1に記載の方法。
  9. 前記第1構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、前記第2構文要素はph_poc_msb_cycle_valである、
    請求項2乃至8のいずれかに記載の方法。
  10. ビデオ処理の方法であって、
    1つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
    前記ビットストリームはフォーマットルールに準拠し、
    前記フォーマットルールは、構文要素がない場合にピクチャ順序カウント(POC)の導出を指定し、
    前記構文要素は、現在のピクチャの前記POCの最上位ビット(MSB)サイクルの値を指定する、
    方法。
  11. 前記構文要素はph_poc_msb_cycle_valである、
    請求項10に記載の方法。
  12. ビデオ処理の方法であって、
    ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
    前記ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットAUを備え、
    前記ルールは、前記AUの出力順序が前記AUの復号順序と異なることに応答して、漸次復号リフレッシュ(GDR)ピクチャが前記ビットストリームでは許容されないことを指定する、
    方法。
  13. コーディングされたレイヤビデオシーケンス(CLVS)内のすべてのピクチャの出力順序と復号順序は、フラグが1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
    請求項12に記載の方法。
  14. 前記AUの前記出力順序と前記復号順序は、フラグが、コーディングされたビデオシーケンス(CVS)内のピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
    請求項12に記載の方法。
  15. 前記AUの前記出力順序と前記復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
    請求項12に記載の方法。
  16. 前記AUの前記出力順序と前記復号順序は、フラグが、前記ビットストリーム内のシーケンスパラメータセット(SPS)について1に等しいことに応答して同一であり、前記フラグは、GDRピクチャが有効であるかどうかを指定する、
    請求項12に記載の方法。
  17. 前記フラグはsps_gdr_enabled_flagである、
    請求項13乃至16のいずれかに記載の方法。
  18. 前記変換は、前記ビットストリームから前記ビデオを復号することを含む、
    請求項1乃至17のいずれかに記載の方法。
  19. 前記変換は、前記ビデオを前記ビットストリームに符号化することを含む、
    請求項1乃至17のいずれかに記載の方法。
  20. ビデオを表すビットストリームをコンピュータ読取可能記録媒体に記憶する方法であって、
    請求項1乃至17のいずれか1つ以上に記載された方法に従って、前記ビデオから前記ビットストリームを生成するステップと、
    前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、
    を備える、方法。
  21. 請求項1乃至20のいずれか1つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ処理装置。
  22. 命令が記憶されたコンピュータ読取可能媒体であって、前記命令は、実行されると、プロセッサに請求項1乃至20の1つ以上に記載の方法を実装させる、コンピュータ読取可能媒体。
  23. 請求項1乃至20のいずれか1つ以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
  24. ビットストリームを記憶するためのビデオ処理装置であって、当該ビデオ処理装置は、請求項1乃至20のいずれか1つ以上に記載される方法を実装するよう構成される、
    ビデオ処理装置。
JP2022575907A 2020-06-12 2021-06-11 マルチレイヤビデオコーディングのピクチャヘッダ制約 Pending JP2023529198A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063038601P 2020-06-12 2020-06-12
US63/038,601 2020-06-12
PCT/US2021/037118 WO2021252973A1 (en) 2020-06-12 2021-06-11 Picture header constraints for multi-layer video coding

Publications (1)

Publication Number Publication Date
JP2023529198A true JP2023529198A (ja) 2023-07-07

Family

ID=78845938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022575907A Pending JP2023529198A (ja) 2020-06-12 2021-06-11 マルチレイヤビデオコーディングのピクチャヘッダ制約

Country Status (6)

Country Link
US (4) US11930221B2 (ja)
EP (1) EP4150901A4 (ja)
JP (1) JP2023529198A (ja)
KR (1) KR20230021664A (ja)
CN (3) CN115918067A (ja)
WO (3) WO2021252976A1 (ja)

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1704720A1 (en) 2004-01-16 2006-09-27 General Instrument Corporation Method, protocol, and apparatus for transporting advanced video coding content
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
KR101862329B1 (ko) * 2012-01-20 2018-05-29 지이 비디오 컴프레션, 엘엘씨 병렬 처리, 전송 디멀티플렉서 및 비디오 비트스트림을 허용하는 코딩 개념
US9351005B2 (en) * 2012-09-24 2016-05-24 Qualcomm Incorporated Bitstream conformance test in video coding
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
KR102383006B1 (ko) * 2013-04-07 2022-04-04 돌비 인터네셔널 에이비 출력 계층 세트들에서의 시그널링 변경
US9648348B2 (en) * 2013-10-23 2017-05-09 Qualcomm Incorporated Multi-layer video file format designs
JPWO2015098561A1 (ja) * 2013-12-27 2017-03-23 ソニー株式会社 復号装置および復号方法、並びに、符号化装置および符号化方法
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US9794595B2 (en) * 2014-03-18 2017-10-17 Qualcomm Incorporated Derivation of end of sequence NAL unit information for multi-layer bitstreams
US10880565B2 (en) 2014-03-24 2020-12-29 Qualcomm Incorporated Use of specific HEVC SEI messages for multi-layer video codecs
US9918091B2 (en) * 2014-06-20 2018-03-13 Qualcomm Incorporated Systems and methods for assigning a minimum value to a syntax structure in a parameter set
WO2016098056A1 (en) * 2014-12-18 2016-06-23 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US20170105004A1 (en) * 2015-10-07 2017-04-13 Qualcomm Incorporated Methods and systems of coding a predictive random access picture using a background picture
US10623755B2 (en) 2016-05-23 2020-04-14 Qualcomm Incorporated End of sequence and end of bitstream NAL units in separate file tracks
EP4026097A4 (en) 2019-09-24 2023-01-25 Huawei Technologies Co., Ltd. SIGNALING AN IMAGE HEAD IN VIDEO ENCODING
AU2021201606A1 (en) * 2020-01-14 2022-08-11 Huawei Technologies Co., Ltd. Method and apparatus of signaling the number of candidates for merge mode
US11546623B2 (en) 2020-03-10 2023-01-03 Qualcomm Incorporated Coded video sequence start access unit in video coding
US11611778B2 (en) 2020-05-20 2023-03-21 Sharp Kabushiki Kaisha Systems and methods for signaling general constraint information in video coding
US11418814B2 (en) 2020-05-22 2022-08-16 Tencent America LLC Constraint on syntax elements for still picture profiles
AU2021274887A1 (en) * 2020-05-22 2022-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processing of output layer sets of coded video
WO2021141519A2 (en) * 2020-05-26 2021-07-15 Huawei Technologies Co., Ltd. Method and apparatus of high-level syntax for smoothing intra-prediction techniques
US20230113358A1 (en) * 2020-05-27 2023-04-13 Lg Electronics Inc. Image coding method based on poc information and non-reference picture flag in video or image coding system
US11503342B2 (en) * 2020-06-10 2022-11-15 Sharp Kabushiki Kaisha Systems and methods for signaling sequence parameter information in video coding
CN115769571A (zh) * 2020-06-17 2023-03-07 字节跳动有限公司 视频编解码中的解码的图片缓冲器管理和子图片

Also Published As

Publication number Publication date
KR20230021664A (ko) 2023-02-14
US20240121441A1 (en) 2024-04-11
EP4150901A1 (en) 2023-03-22
US11930221B2 (en) 2024-03-12
EP4150901A4 (en) 2023-10-18
WO2021252978A1 (en) 2021-12-16
US11943483B2 (en) 2024-03-26
US20230105096A1 (en) 2023-04-06
CN115885512A (zh) 2023-03-31
CN115918067A (zh) 2023-04-04
WO2021252976A1 (en) 2021-12-16
CN115836526A (zh) 2023-03-21
US20230113199A1 (en) 2023-04-13
US20230104910A1 (en) 2023-04-06
WO2021252973A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
JP7457151B2 (ja) スケーラブル映像コーディングにおけるランダムアクセスポイントアクセスユニット
US20240080492A1 (en) Identification Of Inter-Layer Reference Pictures In Coded Video
JP2023526369A (ja) 映像ビットストリームにおけるコーディングされたピクチャバッファ情報の信号通知
CN115804091A (zh) 访问单元分隔符,以及视频编解码中的通用约束信息
JP2023526661A (ja) 適合出力サブビットストリームの生成技術
CN115699731A (zh) 参考图片重采样
US11943483B2 (en) Constraints on picture output ordering in a video bitstream
US11973967B2 (en) Ordering of NAL units in coded video

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240430

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528