JP2023519939A - 映像コーディングにおけるスライスタイプ - Google Patents
映像コーディングにおけるスライスタイプ Download PDFInfo
- Publication number
- JP2023519939A JP2023519939A JP2022559413A JP2022559413A JP2023519939A JP 2023519939 A JP2023519939 A JP 2023519939A JP 2022559413 A JP2022559413 A JP 2022559413A JP 2022559413 A JP2022559413 A JP 2022559413A JP 2023519939 A JP2023519939 A JP 2023519939A
- Authority
- JP
- Japan
- Prior art keywords
- video
- picture
- bitstream
- slice
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 129
- 238000003672 processing method Methods 0.000 claims abstract description 21
- 230000001131 transforming effect Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 21
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 230000033001 locomotion Effects 0.000 description 67
- 239000010410 layer Substances 0.000 description 26
- 239000013598 vector Substances 0.000 description 17
- 230000003044 adaptive effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 230000011664 signaling Effects 0.000 description 9
- 241000023320 Luma <angiosperm> Species 0.000 description 7
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 7
- 239000010432 diamond Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 6
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 5
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 5
- 238000012952 Resampling Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 229910003460 diamond Inorganic materials 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 101150067185 ppsA gene Proteins 0.000 description 3
- 101150010264 ppsB gene Proteins 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 101100508818 Mus musculus Inpp5k gene Proteins 0.000 description 2
- 101100366438 Rattus norvegicus Sphkap gene Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 235000019395 ammonium persulphate Nutrition 0.000 description 2
- 238000000261 appearance potential spectroscopy Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- QNRATNLHPGXHMA-XZHTYLCXSA-N (r)-(6-ethoxyquinolin-4-yl)-[(2s,4s,5r)-5-ethyl-1-azabicyclo[2.2.2]octan-2-yl]methanol;hydrochloride Chemical compound Cl.C([C@H]([C@H](C1)CC)C2)CN1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OCC)C=C21 QNRATNLHPGXHMA-XZHTYLCXSA-N 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 229920000069 polyphenylene sulfide Polymers 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2381—Adapting the multiplex stream to a specific network, e.g. an Internet Protocol [IP] network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/6106—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
- H04N21/6125—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
パリ条約に基づく適用可能な特許法および/または規則に基づいて、本願は、2020年3月30日出願の米国特許仮出願第63/002064号の優先権および利益を適時に主張することを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。
本明細書は、映像コーディング技術に関する。具体的には、スライスタイプ、ALF、および適合性ウィンドウの信号通知、並びにVPS、SPS、PPS、APS、およびDCI NALユニットを含めたいくつかの非VCL NALユニットの繰り返しの改善に関する。この考えは、個々にまたは様々な組み合わせで、マルチレイヤー映像コーディング、例えば、現在開発されているVVC(Versatile Video Coding)をサポートする任意の映像コーディング規約または非標準映像コーデックに適用されてもよい。
2.略語
ALF Adaptive Loop Filter(適応ループフィルタ)
APS Adaptation Parameter Set(適応パラメータセット)
AU Access Unit(アクセスユニット)
AUD Access Unit Delimiter(アクセスユニットデリミター)
AVC Advanced Video Coding(高度映像コーディング)
CLVS Coded Layer Video Sequence(コーディングされたレイヤー映像シーケンス)
CPB Coded Picture Buffer(コーディングされたピクチャバッファ)
CRA Clean Random Access(クリーンランダムアクセス)
CTU Coding Tree Unit(コーディングツリーユニット)
CVS Coded Video Sequence(コーディングされた映像シーケンス)
DCI Decoding Capability Information(復号化能力情報)
DPB Decoded Picture Buffer(復号化されたピクチャバッファ)
DU Decoding Unit(復号化ユニット)
EOB End Of Bitstream(ビットストリーム終端)
EOS End Of Sequence(シーケンス終端)
GDR Gradual Decoding Refresh(漸次的復号リフレッシュ)
HEVC High Efficiency Video Coding(高効率映像コーディング)
HRD Hypothetical Reference Decoder(仮想参照デコーダ)
IDR Instantaneous Decoding Refresh(瞬時復号リフレッシュ)
JEM Joint Exploration Model(共同探索モデル)
LMCS Luma Mapping with Chroma Scaling(彩度スケーリングを伴う輝度マッピング)
MCTS Motion-Constrained Tile Sets(動き制約タイルセット)
NAL Network Abstraction Layer(ネットワーク抽象化レイヤー)
OLS Output Layer Set(出力レイヤーセット)
PH Picture Header(ピクチャヘッダ)
PPS Picture Parameter Set(ピクチャパラメータセット)
PTL Profile,Tier and Level(プロファイル、ティアおよびレベル)
PU Picture Unit(ピクチャユニット)
RADL Random Access Decodable Leading(Picture)(ランダムアクセス復号可能リード)(ピクチャ)
RAP Random Access Point(ランダムアクセスポイント)
RASL Random Access Skipped Leading(Picture)(ランダムアクセススキップリード)(ピクチャ)
RBSP Raw Byte Sequence Payload(生バイトシーケンスペイロード)
RPL Reference Picture List(参照ピクチャリスト)
SAO Sample Adaptive Offset(サンプル適応オフセット)
SEI Supplemental Enhancement Information(補足強化情報)
SPS Sequence Parameter Set(シーケンスパラメータセット)
STSA Step-wise Temporal Sublayer Access(ステップワイズ時間サブレイヤーアクセス)
SVC Scalable Video Coding(スケーラブル映像コーディング)
VCL Video Coding Layer(映像コーディングレイヤー)
VPS Video Parameter Set(映像パラメータセット)
VTM VVC Test Model(VVC試験モデル)
VUI Video Usability Information(映像ユーザビリティ情報)
VVC Versatile Video Coding(汎用映像コーディング)
映像コーディング規約は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 VideoとH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC[1]規格を共同で作った。H.262以来、映像コーディング規約は、時間予測と変換コーディングが利用されるハイブリッド映像コーディング構造に基づく。HEVCを超えた将来の映像コーディング技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Mode)[2]と呼ばれる参照ソフトウェアに組み込まれてきた。JVETは四半期に1回開催され、新しいコーディング規約はHEVCに比べて50%のビットレート低減を目指している。2018年4月のJVET会議において、新しい映像コーディング規約を「VVC(Versatile Video Coding)」と正式に命名し、その時、第1版のVVCテストモデル(VTM)をリリースした。VVCの標準化に寄与する努力が続けられているので、すべてのJVET会議において、VVC標準に新しいコーディング技術が採用されている。毎回の会議の後、VVC作業草案およびテストモデルVTMを更新する。VVCプロジェクトは、現在、2020年7月の会合における技術完成(FDIS)を目指している。
AVC、HEVC、VVCはパラメータセットを指定する。パラメータセットのタイプは、SPS、PPS、APS、VPS等である。SPS、PPSは、AVC、HEVC、VVCのすべてでサポートされている。VPSは、HEVCから導入されたものであり、HEVCおよびVVCの両方に含まれる。APSは、AVCまたはHEVCに含まれていなかったが、最近のVVC草案のテキストに含まれている。
HEVCと同様に、VVCにおけるスライスヘッダは、特定のスライスに関する情報を伝達する。これは、スライスアドレス、スライスタイプ、スライスQP、ピクチャオーダカウント(Picture Order Count)最下位ビット(Least Significant Bit、LSBs)、RPSおよびRPL情報、重み付け予測パラメータ、ループフィルタリングパラメータ、タイルおよびWPPのエントリオフセット等が含まれる。
AVCおよびHEVCにおいて、ピクチャの空間的解像度は、新しいSPSを使用する新しいシーケンスがIRAPピクチャで始まらない限り、変更することができない。VVCは、常にイントラコーディング化されたIRAPピクチャを符号化せずに、ある位置のシーケンス内でピクチャの解像度を変更することを可能にする。この特徴は、参照ピクチャが復号化されている現在のピクチャと異なる解像度を有する場合、インター予測に使用される参照ピクチャをリサンプリングすることが必要であるため、参照ピクチャリサンプリング(RPR)と称する。
2つの菱形フィルタ形状(図7に示す)がブロックベースのALFにおいて使用される。輝度成分に対し7×7の菱形が適用され、彩度成分には5×5の菱形が適用される。局所的な勾配の方向および活性度に基づいて、4×4ブロックごとに最大25個までのフィルタのうち1つを選択する。ピクチャにおける各4×4ブロックは、方向性および活性度に基づいて分類される。各4×4ブロックをフィルタリングする前に、そのブロックに対して計算された勾配値に基づいて、回転または対角および垂直フリップ等の簡単な幾何学的変換をフィルタ係数に適用することができる。これは、これらの変換をフィルタサポート領域内のサンプルに適用することに等しい。その考えは、ALFが適用される異なるブロックを、それらの方向性を揃えることによって、より類似させることである。ブロックベースの分類は彩度成分には適用されない。
最近のVVCテキスト(JVET-Q2001-vE/v15)における既存の設計は、以下の問題を有する。
1)slice_typeの値は、以下のように制約される。
4)SEIメッセージの大部分の繰り返しは、1つのPUまたはDU内で最大4倍に制限される。PH、AUD、EOS、EOB NALユニットの繰り返しは許可されない。フィラーデータNALユニットの繰り返しは、必要な回数だけ許可される必要がある(例えば、一定のビットレートを達成するために)。しかしながら、他の非VCL NALユニット、即ち、VPS、SPS、PPS、APS、およびDCI NALユニットの繰り返し時間に制限はない。
上述した課題等を解決するために、以下に示す方法が開示されている。本発明は、一般的な概念を説明するための例であり、狭義に解釈されるべきではない。さらに、本発明は、個々に適用されてもよいし、任意に組み合わせて適用されてもよい。
1)問題1を解決するために、slice_typeおよび/またはslice_typeの信号通知に関する制約は、一般的な制約フラグ/NALユニットのタイプ/現在のピクチャが現在のAUにおける第1のピクチャであるかどうかに関連付けられた条件に依存し得る。
a.一例において、この条件は、以下を含んでよい。
i.intra_only_constraint_flagが1に等しい場合。
ii.NALユニットタイプがIRAP NALユニットタイプであり、現在のピクチャが現在のAUにおける第1のピクチャである場合。
iii.指示(例えば、SPSフラグ)が、ピクチャ(または現在のピクチャを含むCLVS、または現在のピクチャを含む任意の他のピクチャのセット)においてイントラスライスのみが許可されることを通知する場合。
b.slice_type値の制約を更新し、最初の2つの条件のうちの1つまたは上記条件のすべてのうちの1つの条件が真である場合に、slice_type値も2に等しい値になるように要求されるようにしてもよい。
c.あるいは、最初の2つの条件のうちの1つまたは上記条件のうちの1つが真である場合、slice_typeの信号通知をスキップし、Iスライスであると推論することができる(すなわち、slice_typeが2である)。
d.さらに、NALユニットタイプがIRAP NALユニットタイプであり、現在のレイヤーが独立レイヤーである場合、slice_typeの信号通知はスキップされ、Iスライスであると推論されてもよい。
2)問題2を解決するために、ph_alf_enabled_flagが0に等しい場合、現在のピクチャのすべてのスライスに対してALFを無効化することを規定することができる。
3)問題3を解決するために、ピクチャの幅および高さが最大ピクチャの幅および高さである場合、pps_conformance_window_flagの値は0に等しいことが必要な場合がある。
a.また、ピクチャの幅および高さが最大のピクチャの幅および高さである場合、PPS適合性ウィンドウ構文要素の値は、SPSにおいて信号通知されるものと同じであると推論し、それ以外の場合には、0に等しいと推論するように規定してもよい。
4)問題4を解決するために、ランダムアクセスのような機能に影響を及ぼさない範囲でVPS、SPS、PPS、APS、およびDCI NALユニットの繰り返し時間に何らかの制限を設けるために、以下の制約の1つ以上を規定することができる。
i.あるいは、上記中、「IDR_W_RADL~GDR_NUT」を「IDR_W_RADL~RSV_IRAP_12」に変更する。
b.1つのPUにおいてvps_video_parameter_set_idの特定の値を有するVPS NALユニットの数は、1より大きくてはならない。
d.sps_seq_parameter_set_idの特定の値を有するSPS NALユニットが、SPSを参照するCLVSの関連付けられたAUセット(associatedAuSet)に存在する場合、SPS NALユニットは、associatedAuSetの第1のAUに存在しなければならず、かつIDR_W_RADL~GDR_NUTの範囲内にnal_unit_typeを有する少なくとも1つのVCL NALユニットを有するassociatedAuSetの任意のAUに存在してもよく、かつ他のAUに存在してはならない。
i.あるいは、sps_seq_parameter_set_idの特定の値を有するSPS NALユニットがCLVSに存在する場合、このユニットは、CLVSの第1のPUに存在しなければならず、かつIDR_W_RADL~GDR_NUTの範囲内にnal_unit_typeを有する少なくとも1つのコーディングされたスライスNALユニットを有する任意のPUに存在してもよく、かつ他のPUに存在してはならない。
ii.4.d.または4.d.i項において、「IDR_W_RADL~GDR_NUT」を「IDR_W_RADL~RSV_IRAP_12」に変更することができる。
e.1つのPUにおいてsps_seq_parameter_set_idの特定の値を有するSPS NALユニットの数は、1以下でなくてはならない。
i.あるいは、1つのDUにおいて、adaptation_parameter_set_idの特定の値、かつ、aps_params_typeの特定の値を有するAPS NALユニットの数は、1以下でなくてはならない。
i.DCI NALユニットがCVSに存在する場合、それはCVSの第1のAUに存在しなければならず、IDR_W_RADL~GDR_NUTの範囲内にあるnal_unit_typeを有する少なくとも1つのVCL NALユニットを有する任意のAUに存在してもよく、他のAUに存在してはならない。
j.1つのPUにおけるDCI NALユニットの数は、1以下でなくてはならない。
この実施形態は、項目1に対するものである。
以下の制約:
nal_unit_typeがIDR_W_RADL~CRA_NUTの範囲内にあり、かつvps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]が1に等しい場合は、slice_typeは2に等しいものとする。
は、以下の様に変更される。:
この実施形態は、項目2に対するものである。
この実施形態は、項目3に対するものである。
...
SubWidthC*(pps_conf_win_left_offset+pps_conf_win_right_offset)の値は、pic_width_in_luma_samplesよりも小さいものとし、SubHeightC*(pps_conf_win_top_offset+pps_conf_win_bottom_offset)の値は、pic_height_in_luma_samplesより小さいものとする。
ChromaArrayTypeが0に等しくない場合、2つの彩度配列の対応する規定されたサンプルは、ピクチャ座標(x/SubWidthC,y/SubHeightC)を有するサンプルであり、(x,y)は、規定された輝度サンプルのピクチャ座標である。
注2-適合性クロッピングウィンドウのオフセットパラメータは、出力側でのみ適用される。すべての内部復号化処理が、アンクロップされたピクチャサイズに対して適用される。
ppsAおよびppsBを、同じSPSを参照する任意の2つのPPSとする。ppsAおよびppsBが、それぞれpic_width_in_luma_samplesおよびpic_height_in_luma_samplesと同じ値を有する場合、ppsAおよびppsBは、それぞれpps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset、およびpps_conf_win_bottom_offsetと同じ値を有するものとすることが、ビットストリーム適合性の要件である。
pic_width_in_luma_samplesがpic_width_max_in_luma_samplesに等しく、かつ、pic_height_in_luma_samplesがpic_height_max_in_luma_samplesに等しい場合、pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset、およびpps_conf_win_bottom_offsetが、それぞれ、sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset、およびsps_conf_win_bottom_offsetと等しいことがビットストリーム適合性の要件である。
本願は、2020年3月30日出願の米国特許仮出願第63/002,064号の優先権と利益を主張する、2021年3月29日出願の国際特許出願第PCT/US2021/024663号に基づく。前述の特許出願はすべて、参照によりその全体が本明細書に組み込まれる。
Claims (17)
- 1つ以上のスライスを含む1つ以上のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、前記ビットストリームは、フォーマット規則に準拠し、前記フォーマット規則は、前記1つ以上のスライスのうちのスライスのスライスタイプが、前記ビットストリームにおいて指示されるか否かを条件に依存して指定し、前記条件は、一般制約フラグ、ネットワーク抽象化レイヤーユニットタイプ、または、前記スライスがアクセスユニットの第1のピクチャにあるか否かに基づくことを規定する、
映像処理方法。 - 前記条件は、前記一般制約フラグが前記スライスに対するイントラのみである制約を示す、
請求項1に記載の方法。 - 前記条件は、前記スライスが前記アクセスユニットの前記第1のピクチャ内にあり、かつ、前記ネットワーク抽象化レイヤーユニットタイプが特定のタイプを有し、前記特定のタイプは、イントラランダムアクセスポイントタイプを示す、
請求項1に記載の方法。 - 前記条件は、前記ビットストリームが、前記ピクチャを含むピクチャのセットにおいてイントラスライスのみが許可されることを示す、
請求項1に記載の方法。 - 前記ピクチャのセットは、前記ピクチャに対応する、
請求項4に記載の方法。 - 前記ピクチャのセットは、前記ピクチャを含むコーディングされたレイヤー映像シーケンス(CLVS)に対応する、
請求項4に記載の方法。 - 前記フォーマット規則は、前記スライスタイプ値2が、(a)前記一般制約フラグまたは前記ネットワーク抽象化レイヤーユニットタイプが前記条件を満たすか、または、(b)前記スライスが前記アクセスユニットの前記第1のピクチャにあることに呼応して、前記ビットストリームに示されることを規定する、
請求項1~6のいずれか1項に記載の方法。 - 前記フォーマット規則は、前記スライスタイプが値2を有することを規定し、かつ、前記スライスタイプの指示は、(a)前記一般制約フラグまたは前記ネットワーク抽象化レイヤーユニットタイプが前記条件を満たすか、または(b)前記スライスが前記アクセスユニットの第1のピクチャにあることに呼応して、前記ビットストリームから省略されることを規定する、
請求項1に記載の方法。 - 前記フォーマット規則は、前記スライスタイプが値2を有することを規定し、前記スライスタイプの指示は、(a)前記ネットワーク抽象化レイヤーユニットタイプは、イントラランダムアクセスポイントタイプであり、かつ、(b)前記スライスを含むピクチャが属するレイヤーは、独立して復号化可能なレイヤーであることに呼応して、前記ビットストリームから省略されることを規定する、請求項1に記載の方法。
- 前記変換は、前記ビットストリームから前記映像を生成することを含む、請求項1~9のいずれか1項に記載の方法。
- 前記変換は、前記映像を前記ビットストリームに符号化することを含む、
請求項1~9のいずれか1項に記載の方法。 - 請求項1~10の1項以上に記載の方法を実装するように構成されたプロセッサを備える、
映像復号化装置。 - 請求項1~11の1項以上に記載の方法を実装するように構成されるプロセッサを備える、
映像符号化装置。 - コードが記憶されたコンピュータ読み取り可能な媒体であって、前記コードがプロセッサにより実行された場合、請求項1~11のいずれか1項に記載の方法を前記プロセッサに実行させる、
コンピュータ可読媒体。 - 請求項1~11のいずれか1項に記載の方法に従ってビットストリームを生成し、前記ビットストリームをコンピュータ可読媒体に記憶することを含む、
映像処理方法。 - 請求項1~11のいずれか1項に記載の方法に従って、映像から生成されたビットストリームを記憶した、
コンピュータ読み取り可能な媒体。 - 本明細書に記載の方法、装置、ビットストリーム、またはシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024000249A JP2024038255A (ja) | 2020-03-30 | 2024-01-04 | 映像コーディングにおけるスライスタイプ |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063002064P | 2020-03-30 | 2020-03-30 | |
US63/002,064 | 2020-03-30 | ||
PCT/US2021/024663 WO2021202387A1 (en) | 2020-03-30 | 2021-03-29 | Slice type in video coding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024000249A Division JP2024038255A (ja) | 2020-03-30 | 2024-01-04 | 映像コーディングにおけるスライスタイプ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023519939A true JP2023519939A (ja) | 2023-05-15 |
JP7416974B2 JP7416974B2 (ja) | 2024-01-17 |
Family
ID=77930148
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022559413A Active JP7416974B2 (ja) | 2020-03-30 | 2021-03-29 | 映像コーディングにおけるスライスタイプ |
JP2022559411A Active JP7415038B2 (ja) | 2020-03-30 | 2021-03-29 | 映像コーディングにおける適合性ウィンドウパラメータ |
JP2024000249A Pending JP2024038255A (ja) | 2020-03-30 | 2024-01-04 | 映像コーディングにおけるスライスタイプ |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022559411A Active JP7415038B2 (ja) | 2020-03-30 | 2021-03-29 | 映像コーディングにおける適合性ウィンドウパラメータ |
JP2024000249A Pending JP2024038255A (ja) | 2020-03-30 | 2024-01-04 | 映像コーディングにおけるスライスタイプ |
Country Status (7)
Country | Link |
---|---|
US (3) | US11902558B2 (ja) |
EP (2) | EP4115611A4 (ja) |
JP (3) | JP7416974B2 (ja) |
KR (2) | KR20220160576A (ja) |
CN (3) | CN115486063A (ja) |
BR (1) | BR112022019770A2 (ja) |
WO (3) | WO2021202391A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021123326A1 (en) * | 2019-12-20 | 2021-06-24 | Canon Kabushiki Kaisha | High level syntax for video coding and decoding |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103621084A (zh) * | 2011-04-28 | 2014-03-05 | 皇家飞利浦有限公司 | 用于生成图像编码信号的方法和装置 |
US20120294353A1 (en) * | 2011-05-16 | 2012-11-22 | Mediatek Inc. | Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components |
WO2013128010A2 (en) * | 2012-03-02 | 2013-09-06 | Canon Kabushiki Kaisha | Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream |
US20140079138A1 (en) * | 2012-09-14 | 2014-03-20 | Sony Corporation | Simplifiication of pic_order_cnt_lsb calculation in hm8 |
CN104919803B (zh) * | 2013-01-15 | 2017-09-12 | 华为技术有限公司 | 一种用于解码视频比特流的方法 |
EP3073742A4 (en) | 2013-11-21 | 2017-06-28 | LG Electronics Inc. | Signal transceiving apparatus and signal transceiving method |
US9641851B2 (en) * | 2014-04-18 | 2017-05-02 | Qualcomm Incorporated | Conformance window information in multi-layer coding |
CN110913217B (zh) | 2014-06-19 | 2022-01-25 | Vid拓展公司 | 用于基于三维色彩映射模型参数优化的系统和方法 |
KR101663668B1 (ko) * | 2014-06-27 | 2016-10-07 | 삼성전자주식회사 | 영상 패딩영역의 비디오 복호화 및 부호화 장치 및 방법 |
US10609327B2 (en) | 2014-12-29 | 2020-03-31 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
EP4262213A1 (en) | 2015-02-27 | 2023-10-18 | Sony Group Corporation | Transmitting device, transmitting method, receiving device and receiving method |
US10244249B2 (en) | 2015-09-21 | 2019-03-26 | Qualcomm Incorporated | Fixed point implementation of range adjustment of components in video coding |
US10129558B2 (en) | 2015-09-21 | 2018-11-13 | Qualcomm Incorporated | Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding |
US10200701B2 (en) * | 2015-10-14 | 2019-02-05 | Qualcomm Incorporated | HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding |
JP6710970B2 (ja) | 2015-12-28 | 2020-06-17 | ソニー株式会社 | 送信装置および送信方法 |
EP3409015B1 (en) | 2016-01-28 | 2019-09-25 | Koninklijke Philips N.V. | Encoding and decoding hdr videos |
US11102495B2 (en) | 2016-05-17 | 2021-08-24 | Qualcomm Incorporated | Methods and systems for generating and processing content color volume messages for video |
EP3386201B1 (en) | 2016-10-11 | 2020-11-04 | Sony Corporation | Transmitting device, transmitting method, receiving device, and receiving method |
JP7195925B2 (ja) | 2016-11-22 | 2022-12-26 | ソニーグループ株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US10812820B2 (en) * | 2016-11-30 | 2020-10-20 | Qualcomm Incorporated | Systems and methods for signaling and constraining a high dynamic range (HDR) video system with dynamic metadata |
US11153579B2 (en) | 2018-03-23 | 2021-10-19 | Qualcomm Incorporated | Deriving dynamic range adjustment (DRA) parameters for video coding |
CN116419000A (zh) | 2019-07-08 | 2023-07-11 | 华为技术有限公司 | 用于视频译码中的参考图像重采样的多个图像大小和符合性窗口的处理 |
GB201913403D0 (en) * | 2019-09-17 | 2019-10-30 | Canon Kk | Method and apparatus for encoding and decoding a video stream with subpictures |
CN114600462A (zh) * | 2019-10-25 | 2022-06-07 | 夏普株式会社 | 用于在视频编码中发送信号通知图片信息的系统和方法 |
JP2023011955A (ja) * | 2019-12-03 | 2023-01-25 | シャープ株式会社 | 動画像符号化装置、動画像復号装置 |
US11778215B2 (en) * | 2020-02-28 | 2023-10-03 | Qualcomm Incorporated | Coding output layer set data and conformance window data of high level syntax for video coding |
US11375212B2 (en) | 2020-04-18 | 2022-06-28 | Qualcomm Incorporated | Flexible chroma processing for dynamic range adjustment |
-
2021
- 2021-03-29 KR KR1020227032740A patent/KR20220160576A/ko active Search and Examination
- 2021-03-29 CN CN202180026946.3A patent/CN115486063A/zh active Pending
- 2021-03-29 WO PCT/US2021/024672 patent/WO2021202391A1/en active Application Filing
- 2021-03-29 WO PCT/US2021/024663 patent/WO2021202387A1/en unknown
- 2021-03-29 CN CN202180025544.1A patent/CN115380525A/zh active Pending
- 2021-03-29 CN CN202180026561.7A patent/CN115398898A/zh active Pending
- 2021-03-29 JP JP2022559413A patent/JP7416974B2/ja active Active
- 2021-03-29 EP EP21779320.7A patent/EP4115611A4/en active Pending
- 2021-03-29 BR BR112022019770A patent/BR112022019770A2/pt unknown
- 2021-03-29 JP JP2022559411A patent/JP7415038B2/ja active Active
- 2021-03-29 EP EP21780523.3A patent/EP4115608A4/en active Pending
- 2021-03-29 KR KR1020227032741A patent/KR20220159987A/ko active Search and Examination
- 2021-03-29 WO PCT/US2021/024675 patent/WO2021202393A1/en unknown
-
2022
- 2022-09-30 US US17/957,387 patent/US11902558B2/en active Active
- 2022-09-30 US US17/957,375 patent/US11902557B2/en active Active
-
2023
- 2023-12-29 US US18/400,588 patent/US20240187627A1/en active Pending
-
2024
- 2024-01-04 JP JP2024000249A patent/JP2024038255A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021123326A1 (en) * | 2019-12-20 | 2021-06-24 | Canon Kabushiki Kaisha | High level syntax for video coding and decoding |
Non-Patent Citations (2)
Title |
---|
BENJAMIN BROSS, JIANLE CHEN, SHAN LIU, AND YE-KUI WANG: "Versatile Video Coding (Draft 8)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-Q2001 (version 15), JPN6023032685, 12 March 2020 (2020-03-12), pages 47 - 50, ISSN: 0005125683 * |
YE-KUI WANG: "AHG8/AHG9: Scalability HLS cleanups", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-Q0118-v1, JPN6023032686, December 2019 (2019-12-01), pages 1 - 8, ISSN: 0005125684 * |
Also Published As
Publication number | Publication date |
---|---|
WO2021202393A1 (en) | 2021-10-07 |
US20240187627A1 (en) | 2024-06-06 |
JP7415038B2 (ja) | 2024-01-16 |
EP4115611A4 (en) | 2023-06-28 |
JP7416974B2 (ja) | 2024-01-17 |
WO2021202391A1 (en) | 2021-10-07 |
KR20220160576A (ko) | 2022-12-06 |
US20230034593A1 (en) | 2023-02-02 |
EP4115608A1 (en) | 2023-01-11 |
CN115380525A (zh) | 2022-11-22 |
JP2023519938A (ja) | 2023-05-15 |
EP4115611A1 (en) | 2023-01-11 |
CN115486063A (zh) | 2022-12-16 |
US20230052835A1 (en) | 2023-02-16 |
US11902558B2 (en) | 2024-02-13 |
KR20220159987A (ko) | 2022-12-05 |
CN115398898A (zh) | 2022-11-25 |
WO2021202387A1 (en) | 2021-10-07 |
US11902557B2 (en) | 2024-02-13 |
BR112022019770A2 (pt) | 2022-11-16 |
EP4115608A4 (en) | 2023-05-24 |
JP2024038255A (ja) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7451742B2 (ja) | ピクチャヘッダにおけるシンタックス要素の条件付きシグナリング | |
JP2023518046A (ja) | スケーラブル映像コーディングにおけるランダムアクセスポイントアクセスユニット | |
JP2023529972A (ja) | コーディングされた映像における量子化情報の信号通知 | |
JP2023526660A (ja) | 映像サブビットストリーム抽出処理におけるスケーラブルネスト化されたseiメッセージのハンドリング | |
JP2023529823A (ja) | マルチレイヤ映像ビットストリームのサブビットストリーム抽出 | |
JP2023529420A (ja) | コーディングされた映像ピクチャにおけるスライスカウントの制約 | |
JP2023526371A (ja) | 漸次的復号更新および参照ピクチャリストの信号通知 | |
JP2023529431A (ja) | 映像ピクチャにおけるサブピクチャ数の制約 | |
CN115299063A (zh) | 变换跳过残差编解码 | |
CN115362479A (zh) | 图片中的条带类型 | |
JP7416974B2 (ja) | 映像コーディングにおけるスライスタイプ | |
JP7372483B2 (ja) | 映像ピクチャヘッダにおけるフィルタリングパラメータ信号通知 | |
WO2021197407A1 (en) | Video coding using adaptation parameter sets | |
JP2023526372A (ja) | 映像コーディングにおけるスケーリングウィンドウ | |
JP2023526657A (ja) | コーディングされた映像におけるnalユニットの順序 | |
JP2023529198A (ja) | マルチレイヤビデオコーディングのピクチャヘッダ制約 | |
CN115462085A (zh) | 视频编解码中滤波的高级控制 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221007 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7416974 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |