JP7490592B2 - 映像の復号化方法及びこれを利用する装置 - Google Patents
映像の復号化方法及びこれを利用する装置 Download PDFInfo
- Publication number
- JP7490592B2 JP7490592B2 JP2021022000A JP2021022000A JP7490592B2 JP 7490592 B2 JP7490592 B2 JP 7490592B2 JP 2021022000 A JP2021022000 A JP 2021022000A JP 2021022000 A JP2021022000 A JP 2021022000A JP 7490592 B2 JP7490592 B2 JP 7490592B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- current picture
- inter
- pictures
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 82
- 239000010410 layer Substances 0.000 claims description 558
- 239000011229 interlayer Substances 0.000 claims description 136
- 230000002123 temporal effect Effects 0.000 claims description 126
- 230000008569 process Effects 0.000 claims description 13
- 230000011664 signaling Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000005192 partition Methods 0.000 description 4
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 3
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229940075930 picrate Drugs 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-M picrate anion Chemical compound [O-]C1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-M 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Machine Translation (AREA)
Description
for ( m = 0; m <= vps_maximum_layer_id; m++)
if (layer_id_nuh_included_flag[i][m])
layerSetLayerIdList[i][n++] = m
numLayersInIdList[i] = n
多階層基盤の映像符号化復号化方法では、VPS extensionに記述されたlayer_id_nuh_included_flag[i][j]に基づいて、VPS VUIビットストリーム分割HRD(VPS Video usability information bitstream partition hypothetical reference decoder)パラメータシンタックス、ビットストリーム分割HRD(Bitstream partition HRD)パラメータSEIメッセージ(supplemental enhancement information message)シンタックスなどを記述するか、レイヤセットに関する情報を解釈することができる。
階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を表す変数「NumActiveRefLayerPics」は下記のように求めることができる。第1方法による場合、ピクチャの全てのスライスは同一の「NumActiveRefLayerPics」値を有するものと限定され得る。
階層間予測のため、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「NumActiveRefLayerPics」は、下記のように誘導されることもある。ピクチャの全てのスライスは、同一の「NumActiveRefLayerPics」値を有するものと限定され得る。
また他の例として、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「NumActiveRefLayerPics」は、下記のように誘導されることもある。ピクチャの全てのスライスは、同一の「NumActiveRefLayerPics」値を有するものと限定され得る。
Claims (14)
- 複数の階層を支援する映像のデコーディング方法において、
階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信する段階と、
前記参照階層に対する情報に基づいて前記現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を誘導する段階と、
前記有効な参照階層ピクチャの個数に基づいて階層間予測を行う段階とを含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が0でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が0でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピクチャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が0より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が0の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする方法。 - 前記現在ピクチャの全てのスライスは、前記有効な参照階層ピクチャの同一の個数を参照することを特徴とする請求項1に記載の方法。
- 前記現在ピクチャを含む前記現在階層の前記レイヤ識別子が0の場合、前記有効な参照階層ピクチャの個数は0に誘導されることを特徴とする請求項1に記載の方法。
- 前記現在ピクチャと同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの前記最後の個数が0である場合、前記有効な参照階層ピクチャの個数は、0に誘導されることを特徴とする請求項1に記載の映像復号化方法。
- 前記現在ピクチャのデコーディングに階層間予測が用いられない場合、前記有効な参照階層ピクチャの個数は0に誘導されることを特徴とする請求項1に記載の方法。
- 最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、あるいは前記現在ピクチャを含む前記階層の直接参照階層の個数が1である場合、前記有効な参照階層ピクチャの個数は1に誘導されることを特徴とする請求項1に記載の方法。
- 前記参照階層に対する情報が、階層間予測のために現在ピクチャのデコーディングに用いられるピクチャの個数を示す個数情報を含む場合、前記有効な参照階層ピクチャの個数は、前記個数情報によって特定される値に誘導されることを特徴とする請求項1に記載の方法。
- 複数の階層を支援する映像のデコーディング装置において、
階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信し、前記参照階層に対する前記情報に基づいて、前記現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を誘導し、前記有効な参照階層ピクチャの個数に基づいて階層間予測を行うデコーディング部を含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が0でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が0でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が0より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が0の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする装置。 - 前記現在ピクチャを含む前記現在階層の前記レイヤ識別子が0の場合、前記有効な参照階層ピクチャの個数は0に誘導されることを特徴とする請求項8に記載の装置。
- 前記現在ピクチャと同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの前記最後の個数が0である場合、前記有効な参照階層ピクチャの個数は、0に誘導されることを特徴とする請求項8に記載の装置。
- 前記現在ピクチャのデコーディングに階層間予測が用いられない場合、前記有効な参照階層ピクチャの個数は0に誘導されることを特徴とする請求項8に記載の装置。
- 最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、あるいは前記現在ピクチャを含む前記階層の直接参照階層の個数が1である場合、前記有効な参照階層ピクチャの個数は1に誘導されることを特徴とする請求項8に記載の装置。
- 複数の階層を支援する映像のエンコーディング方法において、
階層間予測のために現在ピクチャのエンコーディングに用いられる参照階層に対する情報を決定する段階と、
前記参照階層に対する情報に基づいて前記現在ピクチャのエンコーディングに用いられる有効な参照階層ピクチャの個数を誘導する段階と、
前記有効な参照階層ピクチャの個数に基づいて階層間予測を行う段階とを含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が0でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が0でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が0より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が0の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする方法。 - 複数の階層を支援する映像のエンコーディング装置において、
階層間予測のために現在ピクチャのエンコーディングに用いられる参照階層に対する情報を決定し、前記参照階層に対する前記情報に基づいて、前記現在ピクチャのエンコーディングに用いられる有効な参照階層ピクチャの個数を誘導し、前記有効な参照階層ピクチャの個数に基づいて階層間予測を行うエンコーディング部を含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が0でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が0でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が0より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が0の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023043188A JP2023072090A (ja) | 2014-01-02 | 2023-03-17 | 映像の復号化方法及びこれを利用する装置 |
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140000413 | 2014-01-02 | ||
KR10-2014-0000413 | 2014-01-02 | ||
KR20140003760 | 2014-01-13 | ||
KR10-2014-0003760 | 2014-01-13 | ||
KR20140030743 | 2014-03-17 | ||
KR10-2014-0030743 | 2014-03-17 | ||
KR10-2014-0033012 | 2014-03-20 | ||
KR20140033012 | 2014-03-20 | ||
KR10-2014-0177008 | 2014-12-10 | ||
KR1020140177008A KR102294092B1 (ko) | 2014-01-02 | 2014-12-10 | 영상의 복호화 방법 및 이를 이용하는 장치 |
JP2019039912A JP2019134444A (ja) | 2014-01-02 | 2019-03-05 | 映像の復号化方法及びこれを利用する装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019039912A Division JP2019134444A (ja) | 2014-01-02 | 2019-03-05 | 映像の復号化方法及びこれを利用する装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023043188A Division JP2023072090A (ja) | 2014-01-02 | 2023-03-17 | 映像の復号化方法及びこれを利用する装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021101538A JP2021101538A (ja) | 2021-07-08 |
JP7490592B2 true JP7490592B2 (ja) | 2024-05-27 |
Family
ID=53793008
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016562715A Pending JP2017508417A (ja) | 2014-01-02 | 2014-12-17 | 映像の復号化方法及びこれを利用する装置 |
JP2019039912A Pending JP2019134444A (ja) | 2014-01-02 | 2019-03-05 | 映像の復号化方法及びこれを利用する装置 |
JP2021022000A Active JP7490592B2 (ja) | 2014-01-02 | 2021-02-15 | 映像の復号化方法及びこれを利用する装置 |
JP2023043188A Pending JP2023072090A (ja) | 2014-01-02 | 2023-03-17 | 映像の復号化方法及びこれを利用する装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016562715A Pending JP2017508417A (ja) | 2014-01-02 | 2014-12-17 | 映像の復号化方法及びこれを利用する装置 |
JP2019039912A Pending JP2019134444A (ja) | 2014-01-02 | 2019-03-05 | 映像の復号化方法及びこれを利用する装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023043188A Pending JP2023072090A (ja) | 2014-01-02 | 2023-03-17 | 映像の復号化方法及びこれを利用する装置 |
Country Status (5)
Country | Link |
---|---|
US (6) | US9967571B2 (ja) |
EP (2) | EP3086555B1 (ja) |
JP (4) | JP2017508417A (ja) |
KR (4) | KR102294092B1 (ja) |
CN (1) | CN105122799B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9591324B2 (en) * | 2013-10-14 | 2017-03-07 | Qualcomm Incorporated | Systems and methods for separately defining dependencies for sub-layer based inter-layer prediction |
KR102266902B1 (ko) * | 2014-01-13 | 2021-06-18 | 삼성전자주식회사 | 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치 |
EP4022930A4 (en) | 2019-09-24 | 2022-11-02 | Huawei Technologies Co., Ltd. | OLS FOR SPATIAL AND SNR Scalability |
CN115152233A (zh) * | 2019-12-30 | 2022-10-04 | Lg电子株式会社 | 包括dpb管理处理的图像解码方法及其设备 |
US11381842B2 (en) * | 2020-03-26 | 2022-07-05 | Alibaba Group Holding Limited | Methods for coding or decoding video parameter set or sequence parameter set |
US11297350B1 (en) * | 2020-03-27 | 2022-04-05 | Tencent America LLC | Method for output layer set for multilayered video stream |
KR20230002715A (ko) * | 2020-04-15 | 2023-01-05 | 엘지전자 주식회사 | 서브 레이어 요구 개수에 기반하여 서브 레이어를 결정하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
KR20230008795A (ko) * | 2020-05-04 | 2023-01-16 | 엘지전자 주식회사 | 영상 디코딩 방법 및 그 장치 |
EP4140140A4 (en) | 2020-05-21 | 2023-07-05 | ByteDance Inc. | PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS |
US20230179769A1 (en) * | 2020-05-25 | 2023-06-08 | Lg Electronics Inc. | Multilayer-based image coding method in video or image coding system |
US11646014B1 (en) * | 2022-07-25 | 2023-05-09 | Intuit Inc. | Ensemble of machine learning models for real-time predictions in expert electronic chats |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100763196B1 (ko) | 2005-10-19 | 2007-10-04 | 삼성전자주식회사 | 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치 |
CN100387063C (zh) * | 2005-12-01 | 2008-05-07 | 西安交通大学 | 可伸缩视频编码中的三维码率控制方法 |
US8396134B2 (en) * | 2006-07-21 | 2013-03-12 | Vidyo, Inc. | System and method for scalable video coding using telescopic mode flags |
CN101578884B (zh) | 2007-01-08 | 2015-03-04 | 诺基亚公司 | 提供和使用译码的媒体流的互操作点的预定信令的系统和方法 |
JP5918354B2 (ja) | 2011-04-26 | 2016-05-18 | エルジー エレクトロニクス インコーポレイティド | 参照ピクチャリスト管理方法及びその方法を使用する装置 |
US10003817B2 (en) | 2011-11-07 | 2018-06-19 | Microsoft Technology Licensing, Llc | Signaling of state information for a decoded picture buffer and reference picture lists |
KR20130050863A (ko) | 2011-11-08 | 2013-05-16 | 삼성전자주식회사 | 참조리스트를 이용하는 예측을 수반하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
US20130114710A1 (en) | 2011-11-08 | 2013-05-09 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video by prediction using reference picture list, and method and apparatus for decoding video by performing compensation using reference picture list |
KR20130086011A (ko) | 2012-01-20 | 2013-07-30 | 한국전자통신연구원 | 비디오 정보 전송 방법, 비디오 복호화 방법, 비디오 부호화기 및 비디오 복호화기 |
TWI616087B (zh) * | 2012-01-31 | 2018-02-21 | Vid衡器股份有限公司 | 可縮放高效率視訊編碼(hevc)參考圖集(rps)傳訊 |
US10609394B2 (en) * | 2012-04-24 | 2020-03-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and deriving parameters for coded multi-layer video sequences |
US9398284B2 (en) * | 2012-08-16 | 2016-07-19 | Qualcomm Incorporated | Constructing reference picture lists for multi-view or 3DV video coding |
US20140218473A1 (en) * | 2013-01-07 | 2014-08-07 | Nokia Corporation | Method and apparatus for video coding and decoding |
US9648326B2 (en) * | 2013-07-02 | 2017-05-09 | Qualcomm Incorporated | Optimizations on inter-layer prediction signalling for multi-layer video coding |
US10595031B2 (en) * | 2013-07-12 | 2020-03-17 | Qualcomm Incorporated | Selection of target output layers in high efficiency video coding extensions |
JP6472441B2 (ja) * | 2013-10-11 | 2019-02-20 | シャープ株式会社 | ビデオを復号するための方法 |
US9681145B2 (en) * | 2013-10-14 | 2017-06-13 | Qualcomm Incorporated | Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency |
EP3438667B1 (de) * | 2017-08-02 | 2020-12-30 | Siemens Healthcare Diagnostics Products GmbH | Bindungstest zur diagnose einer heparin-induzierten thrombozytopenie |
-
2014
- 2014-12-10 KR KR1020140177008A patent/KR102294092B1/ko active Application Filing
- 2014-12-17 US US14/774,290 patent/US9967571B2/en active Active
- 2014-12-17 EP EP14876965.6A patent/EP3086555B1/en active Active
- 2014-12-17 JP JP2016562715A patent/JP2017508417A/ja active Pending
- 2014-12-17 EP EP21188128.9A patent/EP3937494A1/en not_active Withdrawn
- 2014-12-17 CN CN201480017906.2A patent/CN105122799B/zh active Active
-
2018
- 2018-03-22 US US15/933,040 patent/US10397584B2/en active Active
- 2018-03-22 US US15/933,010 patent/US10375400B2/en active Active
- 2018-03-22 US US15/933,051 patent/US10326997B2/en active Active
- 2018-03-22 US US15/928,964 patent/US10291920B2/en active Active
-
2019
- 2019-03-05 JP JP2019039912A patent/JP2019134444A/ja active Pending
-
2021
- 2021-02-15 JP JP2021022000A patent/JP7490592B2/ja active Active
- 2021-08-20 KR KR1020210109939A patent/KR102423851B1/ko active IP Right Grant
-
2022
- 2022-07-18 KR KR1020220088467A patent/KR102517340B1/ko active IP Right Grant
- 2022-11-30 US US18/060,351 patent/US20230114591A1/en active Pending
-
2023
- 2023-03-17 JP JP2023043188A patent/JP2023072090A/ja active Pending
- 2023-03-29 KR KR1020230041311A patent/KR20230047350A/ko active IP Right Grant
Non-Patent Citations (2)
Title |
---|
Hahyun Lee et al.,"MV-HEVC/SHVC HLS: On inter-layer RPS signalling and derivation"、Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 17th Meeting:Valencia,ES,Document:JCTVC-Q0060、2014年3月17日、pp.1-4 |
Jianle Chen et al.,"High efficiency video coding (HEVC) scalable extensions Draft 5"、Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 16th Meeting:San Jose,US,Document:JCTVC-P1008_v4、2014年1月22日、pp.69,87 |
Also Published As
Publication number | Publication date |
---|---|
KR102294092B1 (ko) | 2021-08-27 |
US10397584B2 (en) | 2019-08-27 |
EP3086555A1 (en) | 2016-10-26 |
EP3086555A4 (en) | 2018-01-10 |
JP2023072090A (ja) | 2023-05-23 |
JP2021101538A (ja) | 2021-07-08 |
KR20150081229A (ko) | 2015-07-13 |
KR20220106094A (ko) | 2022-07-28 |
KR102423851B1 (ko) | 2022-07-21 |
JP2019134444A (ja) | 2019-08-08 |
US9967571B2 (en) | 2018-05-08 |
EP3937494A1 (en) | 2022-01-12 |
US10326997B2 (en) | 2019-06-18 |
KR20210105868A (ko) | 2021-08-27 |
US20180213238A1 (en) | 2018-07-26 |
US10291920B2 (en) | 2019-05-14 |
US20180213237A1 (en) | 2018-07-26 |
US20180288421A1 (en) | 2018-10-04 |
CN105122799A (zh) | 2015-12-02 |
US20230114591A1 (en) | 2023-04-13 |
KR20230047350A (ko) | 2023-04-07 |
KR102517340B1 (ko) | 2023-04-03 |
EP3086555B1 (en) | 2021-09-15 |
JP2017508417A (ja) | 2017-03-23 |
US20160316210A1 (en) | 2016-10-27 |
CN105122799B (zh) | 2019-02-05 |
US10375400B2 (en) | 2019-08-06 |
US20180213236A1 (en) | 2018-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7490592B2 (ja) | 映像の復号化方法及びこれを利用する装置 | |
JP6874032B2 (ja) | ピクチャの符号化/復号化方法及びこれを利用する装置 | |
JP7171654B2 (ja) | 時間的サブレイヤー情報に基づいたインターレイヤー予測方法及び装置 | |
CN113615187B (zh) | 视频解码的方法、装置以及存储介质 | |
US11032559B2 (en) | Video encoding and decoding method and apparatus using the same | |
US20200007876A1 (en) | Image encoding/decoding method and device | |
KR20150065797A (ko) | 스케일러블 비디오 코딩을 위한 예측 모드 정보 업샘플링 | |
CN118118690A (zh) | 视频解码方法、装置、计算机设备及存储介质、方法 | |
KR20140043240A (ko) | 영상 부호화/복호화 방법 및 장치 | |
CN116325723B (zh) | 用于视频解码的方法、计算机设备及介质 | |
KR20140088002A (ko) | 영상의 부호화/복호화 방법 및 이를 이용하는 장치 | |
KR102400485B1 (ko) | 영상의 복호화 방법 및 이를 이용하는 장치 | |
KR102271878B1 (ko) | 영상의 부호화/복호화 방법 및 이를 이용하는 장치 | |
JP7512430B2 (ja) | ゼロ残差フラグコーディング | |
KR20230024341A (ko) | 최대 시간 식별자에 기반하여 서브 비트스트림 추출과정을 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독가능한 기록매체 | |
KR102325977B1 (ko) | 영상의 복호화 방법 및 이를 이용하는 장치 | |
JP2023519751A (ja) | Dpb関連情報及びptl関連情報をシグナリングする画像符号化/復号化方法及び装置、並びにビットストリームを保存したコンピュータ可読記録媒体 | |
KR20230027156A (ko) | 서브레이어 레벨 정보에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체 | |
JP2023520227A (ja) | レイヤ間参照の如何に基づいてサブレイヤを決定する画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法 | |
KR20150008805A (ko) | 비디오 비트스트림의 계층 정보 표현 방법 | |
JP2024509606A (ja) | 単一参照動きベクトル差分のための適応解像度 | |
JP2023519980A (ja) | Hrdパラメータをシグナリングする画像符号化/復号化方法及び装置、並びにビットストリームを保存したコンピュータ可読記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220819 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230317 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230317 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230329 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230331 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20230519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7490592 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |