JP2022008413A - 復号装置、符号化装置及び記録媒体 - Google Patents
復号装置、符号化装置及び記録媒体 Download PDFInfo
- Publication number
- JP2022008413A JP2022008413A JP2021150571A JP2021150571A JP2022008413A JP 2022008413 A JP2022008413 A JP 2022008413A JP 2021150571 A JP2021150571 A JP 2021150571A JP 2021150571 A JP2021150571 A JP 2021150571A JP 2022008413 A JP2022008413 A JP 2022008413A
- Authority
- JP
- Japan
- Prior art keywords
- motion
- motion search
- search range
- unit
- motion vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000033001 locomotion Effects 0.000 claims abstract description 728
- 239000013598 vector Substances 0.000 claims abstract description 294
- 230000002093 peripheral effect Effects 0.000 claims abstract description 76
- 238000011156 evaluation Methods 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims description 111
- 230000008569 process Effects 0.000 claims description 56
- 238000012545 processing Methods 0.000 description 134
- 238000006243 chemical reaction Methods 0.000 description 76
- 238000010586 diagram Methods 0.000 description 64
- 238000012986 modification Methods 0.000 description 63
- 230000004048 modification Effects 0.000 description 63
- 238000013139 quantization Methods 0.000 description 49
- 238000004891 communication Methods 0.000 description 27
- 238000009795 derivation Methods 0.000 description 21
- 238000012937 correction Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000011664 signaling Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 230000002146 bilateral effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000003702 image correction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 101150095908 apex1 gene Proteins 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical group COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Error Detection And Correction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
次世代の動画像圧縮規格では、動き補償のための動き情報の符号量を削減するために、復号装置側で動き探索を行うモードが検討されている。このようなモードでは、復号装置は、復号対象ブロックとは異なる復号済みブロックに類似する参照ピクチャ内の領域を探索(動き探索)することにより、復号対象ブロックのための動きベクトルを導出する。このとき、動き探索による復号装置の処理負荷、及び参照ピクチャのデータ転送による復号装置に要求されるメモリバンド幅の増加が予想されるため、処理負荷及びメモリバンド幅の増加を抑制する技術が求められている。
まず、後述する本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例として、実施の形態1の概要を説明する。ただし、実施の形態1は、本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例にすぎず、本開示の各態様で説明する処理および/または構成は、実施の形態1とは異なる符号化装置および復号化装置においても実施可能である。
(2)実施の形態1の符号化装置または復号化装置に対して、当該符号化装置または復号化装置を構成する複数の構成要素のうち一部の構成要素について機能または実施する処理の追加、置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する構成要素に対応する構成要素を、本開示の各態様で説明する構成要素に置き換えること
(3)実施の形態1の符号化装置または復号化装置が実施する方法に対して、処理の追加、および/または当該方法に含まれる複数の処理のうちの一部の処理について置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(4)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(5)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が備える機能の一部を備える構成要素、または実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が実施する処理の一部を実施する構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(6)実施の形態1の符号化装置または復号化装置が実施する方法に対して、当該方法に含まれる複数の処理のうち、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(7)実施の形態1の符号化装置または復号化装置が実施する方法に含まれる複数の処理のうちの一部の処理を、本開示の各態様で説明する処理と組み合わせて実施すること
まず、実施の形態1に係る符号化装置の概要を説明する。図1は、実施の形態1に係る符号化装置100の機能構成を示すブロック図である。符号化装置100は、動画像/画像をブロック単位で符号化する動画像/画像符号化装置である。
分割部102は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部104に出力する。例えば、分割部102は、まず、ピクチャを固定サイズ(例えば128x128)のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット(CTU)と呼ばれることがある。そして、分割部102は、再帰的な四分木(quadtree)及び/又は二分木(binary tree)ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ(例えば64x64以下)のブロックに分割する。この可変サイズのブロックは、符号化ユニット(CU)、予測ユニット(PU)あるいは変換ユニット(TU)と呼ばれることがある。なお、本実施の形態では、CU、PU及びTUは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがCU、PU、TUの処理単位となってもよい。
減算部104は、分割部102によって分割されたブロック単位で原信号(原サンプル)から予測信号(予測サンプル)を減算する。つまり、減算部104は、符号化対象ブロック(以下、カレントブロックという)の予測誤差(残差ともいう)を算出する。そして、減算部104は、算出された予測誤差を変換部106に出力する。
変換部106は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部108に出力する。具体的には、変換部106は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換(DCT)又は離散サイン変換(DST)を行う。
量子化部108は、変換部106から出力された変換係数を量子化する。具体的には、量子化部108は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ(QP)に基づいて当該変換係数を量子化する。そして、量子化部108は、カレントブロックの量子化された変換係数(以下、量子化係数という)をエントロピー符号化部110及び逆量子化部112に出力する。
エントロピー符号化部110は、量子化部108から入力である量子化係数を可変長符号化することにより符号化信号(符号化ビットストリーム)を生成する。具体的には、エントロピー符号化部110は、例えば、量子化係数を二値化し、二値信号を算術符号化する。
逆量子化部112は、量子化部108からの入力である量子化係数を逆量子化する。具体的には、逆量子化部112は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部112は、カレントブロックの逆量子化された変換係数を逆変換部114に出力する。
逆変換部114は、逆量子化部112からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部114は、変換係数に対して、変換部106による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部114は、復元された予測誤差を加算部116に出力する。
加算部116は、逆変換部114からの入力である予測誤差と予測制御部128からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部116は、再構成されたブロックをブロックメモリ118及びループフィルタ部120に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。
ブロックメモリ118は、イントラ予測で参照されるブロックであって符号化対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ118は、加算部116から出力された再構成ブロックを格納する。
ループフィルタ部120は、加算部116によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ122に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ(インループフィルタ)であり、例えば、デブロッキング・フィルタ(DF)、サンプルアダプティブオフセット(SAO)及びアダプティブループフィルタ(ALF)などを含む。
フレームメモリ122は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ122は、ループフィルタ部120によってフィルタされた再構成ブロックを格納する。
イントラ予測部124は、ブロックメモリ118に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測(画面内予測ともいう)を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部124は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部128に出力する。
インター予測部126は、フレームメモリ122に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測(画面間予測ともいう)を行うことで、予測信号(インター予測信号)を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部126は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索(motion estimation)を行う。そして、インター予測部126は、動き探索により得られた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部126は、生成されたインター予測信号を予測制御部128に出力する。
予測制御部128は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部104及び加算部116に出力する。
次に、上記の符号化装置100から出力された符号化信号(符号化ビットストリーム)を復号可能な復号装置の概要について説明する。図10は、実施の形態1に係る復号装置200の機能構成を示すブロック図である。復号装置200は、動画像/画像をブロック単位で復号する動画像/画像復号装置である。
エントロピー復号部202は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部202は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部202は、二値信号を多値化(debinarize)する。これにより、エントロピー復号部202は、ブロック単位で量子化係数を逆量子化部204に出力する。
逆量子化部204は、エントロピー復号部202からの入力である復号対象ブロック(以下、カレントブロックという)の量子化係数を逆量子化する。具体的には、逆量子化部204は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部204は、カレントブロックの逆量子化された量子化係数(つまり変換係数)を逆変換部206に出力する。
逆変換部206は、逆量子化部204からの入力である変換係数を逆変換することにより予測誤差を復元する。
加算部208は、逆変換部206からの入力である予測誤差と予測制御部220からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部208は、再構成されたブロックをブロックメモリ210及びループフィルタ部212に出力する。
ブロックメモリ210は、イントラ予測で参照されるブロックであって復号対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ210は、加算部208から出力された再構成ブロックを格納する。
ループフィルタ部212は、加算部208によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ214及び表示装置等に出力する。
フレームメモリ214は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ214は、ループフィルタ部212によってフィルタされた再構成ブロックを格納する。
イントラ予測部216は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ210に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部216は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部220に出力する。
インター予測部218は、フレームメモリ214に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部218は、符号化ビットストリームから読み解かれた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部220に出力する。
予測制御部220は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部208に出力する。
次に、符号化装置100のインター予測部126の内部構成について説明する。具体的には、復号装置側で動き探索を行うモード(FRUCモード)を実現するための、符号化装置100のインター予測部126の機能構成について説明する。
次に、以上のように構成されたインター予測部126の動作について、図13~図17を参照しながら具体的に説明する。以下では、単一の参照ピクチャを参照してインター予測を行う場合について説明する。
次に、復号装置200のインター予測部218の内部構成について説明する。具体的には、復号装置側で動き探索を行うモード(FRUCモード)を実現するための、復号装置200のインター予測部218の機能構成について説明する。
次に、以上のように構成されたインター予測部218の動作について、図13を参照しながら説明する。インター予測部218の処理は、ステップS103がステップS203に代わる点を除いて、符号化装置100のインター予測部126の処理と同じである。以下に、ステップS203について説明する。
以上のように、本実施の形態に係る符号化装置100のインター予測部126及び復号装置200のインター予測部218によれば、動き探索範囲外の位置に対応する動きベクトルを有する候補を除外してから候補の選択を行うことができる。したがって、候補の選択のための処理負荷を低減することができる。さらに、動き探索範囲外の再構成画像をフレームメモリから読み込まなくてもよいので、動き探索のためのメモリバンド幅を低減させることができる。
上記実施の形態1では、動き探索範囲の位置は、候補リスト内の複数の候補に含まれる複数の動きベクトルの平均動きベクトルに基づいて決定されていたが、本変形例では、候補リスト内の複数の候補に含まれる複数の動きベクトルの中央動きベクトルに基づいて決定される。
次に、実施の形態1の変形例2について説明する。本変形例では、平均動きベクトルの代わりに、最小動きベクトルに基づいて、動き探索範囲の位置を決定する。以下に、上記実施の形態1と異なる点を中心に本変形例について説明する。
次に、実施の形態1の変形例3について説明する。本変形例では、平均動きベクトルの代わりに、カレントピクチャとは異なる符号化/復号済みピクチャの動きベクトルに基づいて動き探索範囲の位置を決定する。以下に、上記実施の形態1と異なる点を中心に本変形例について説明する。
次に、実施の形態1の変形例4について説明する。本変形例では、参照ピクチャを複数の領域に分割し、分割された領域に基づいて複数の候補に含まれる複数の動きベクトルをグルーピングする。このとき、最も多くの動きベクトルを含むグループに基づいて、動き探索範囲の位置を決定する。
次に、実施の形態1の変形例5について説明する。本変形例では、動き探索範囲の位置の補正を行う点が上記実施の形態1と異なる。以下に、上記実施の形態1と異なる点を中心に本変形例について図21を参照しながら説明する。図21は、実施の形態1の変形例5における動き探索範囲の一例を示す図である。
次に、実施の形態1の変形例6について説明する。上記変形例5では、ゼロ動きベクトルに対応する位置を含むように動き探索範囲の位置を補正していたが、本変形例では、複数の隣接ブロックのうちの1つの隣接ブロックの動きベクトルに対応する位置を含むように動き探索範囲の位置を補正する。
次に、実施の形態1の変形例7について説明する。本変形例では、ビットストリームに動き探索範囲に関する情報が含まれていない点が、上記実施の形態1と異なる。以下に、本変形例について上記実施の形態1と異なる点を中心に図23を参照しながら説明する。
なお、上記実施の形態1では、参照ピクチャリストに含まれる複数の参照ピクチャのすべてが順に選択されていたが、必ずしもすべての参照ピクチャが選択されなくてもよい。本変形例では、選択される参照ピクチャの数が制限される例について説明する。
次に、実施の形態1の変形例9について説明する。本変形例では、インター予測において複数の参照ピクチャが参照される場合の動き探索範囲のサイズの決定方法について説明する。
以上、本開示の1つまたは複数の態様に係る符号化装置及び復号装置について、実施の形態及び変形例に基づいて説明したが、本開示は、この実施の形態及び変形例に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態又は本変形例に施したものや、異なる変形例における構成要素を組み合わせて構築される形態も、本開示の1つまたは複数の態様の範囲内に含まれてもよい。
以上の各実施の形態において、機能ブロックの各々は、通常、MPU及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ROM等の記録媒体に記録されたソフトウェア(プログラム)を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア(専用回路)によって実現することも、当然、可能である。
図25は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
また、ストリーミングサーバex103は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバex103は、CDN(Contents Delivery Network)により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。CDNでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。
近年では、互いにほぼ同期した複数のカメラex113及び/又はスマートフォンex115などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。
コンテンツの切り替えに関して、図26に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的/空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンex115で視聴していた映像の続きを、帰宅後にインターネットTV等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。
図28は、コンピュータex111等におけるwebページの表示画面例を示す図である。図29は、スマートフォンex115等におけるwebページの表示画面例を示す図である。図28及び図29に示すようにwebページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置(復号装置)は、リンク画像として各コンテンツが有する静止画又はIピクチャを表示したり、複数の静止画又はIピクチャ等でgifアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。
また、車の自動走行又は走行支援のため2次元又は3次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、1以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。
また、コンテンツ供給システムex100では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。
また、これらの符号化又は復号処理は、一般的に各端末が有するLSIex500において処理される。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD-ROM、フレキシブルディスク、又はハードディスクなど)に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンex115がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンex115が有するLSIex500で符号化処理されたデータである。
図30は、スマートフォンex115を示す図である。また、図31は、スマートフォンex115の構成例を示す図である。スマートフォンex115は、基地局ex110との間で電波を送受信するためのアンテナex450と、映像及び静止画を撮ることが可能なカメラ部ex465と、カメラ部ex465で撮像した映像、及びアンテナex450で受信した映像等が復号されたデータを表示する表示部ex458とを備える。スマートフォンex115は、さらに、タッチパネル等である操作部ex466と、音声又は音響を出力するためのスピーカ等である音声出力部ex457と、音声を入力するためのマイク等である音声入力部ex456と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ex467と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのSIMex468とのインタフェース部であるスロット部ex464とを備える。なお、メモリ部ex467の代わりに外付けメモリが用いられてもよい。
102 分割部
104 減算部
106 変換部
108 量子化部
110 エントロピー符号化部
112、204 逆量子化部
114、206 逆変換部
116、208 加算部
118、210 ブロックメモリ
120、212 ループフィルタ部
122、214 フレームメモリ
124、216 イントラ予測部
126、218 インター予測部
128、220 予測制御部
200、322 復号装置
202 エントロピー復号部
300 符号化復号システム
310 符号化システム
311、321 通信装置
313 出力バッファ
320 復号システム
323 入力バッファ
1261、2181 候補導出部
1262、2182 範囲決定部
1263、2183 動き探索部
1264、2184 動き補償部
Claims (5)
- 動きベクトルを用いて復号対象ブロックを復号する復号装置であって、
プロセッサと、
メモリと、を備え、
前記プロセッサは、前記メモリを用いて、
ビットストリームから、代表位置を示す代表動きベクトルを導出し、
前記復号対象ブロックの第1の参照ピクチャにおいて、前記代表動きベクトルが示す前記代表位置を含む第1の動き探索範囲を決定し、
前記第1の動き探索範囲に含まれる複数の候補領域の第1の評価値を算出し、
前記第1の動き探索範囲に含まれる前記複数の候補領域のうち最も高い評価を示す第1の評価値を有する候補領域及びその周辺を含む領域であって、前記第1の動き探索範囲に包含される領域である、第1の周辺領域を決定し、
前記第1の周辺領域に含まれる領域の評価値のうち最も高い評価を示す第2の評価値を用いて、前記復号対象ブロックの動きベクトルを決定する、
復号装置。 - 前記第1の評価値は、前記候補領域と第2の参照ピクチャにおける領域との差分であり、前記候補領域及び前記第2の参照ピクチャにおける前記領域は前記復号対象ブロックの動き軌道に沿った領域である、
請求項1記載の復号装置。 - 前記第2の評価値は、前記第1の周辺領域に含まれる領域と前記第2の参照ピクチャにおける領域との差分である、
請求項2記載の復号装置。 - 動きベクトルを用いて符号化対象ブロックを符号化する符号化装置であって、
プロセッサと、
メモリと、を備え、
前記プロセッサは、前記メモリを用いて、
前記符号化対象ブロックの第1の参照ピクチャにおいて、代表動きベクトルが示す代表位置を含む第1の動き探索範囲を決定し、
前記第1の動き探索範囲に含まれる複数の候補領域の第1の評価値を算出し、
前記第1の動き探索範囲に含まれる前記複数の候補領域のうち最も高い評価を示す第1の評価値を有する候補領域及びその周辺を含む領域であって、前記第1の動き探索範囲に包含される領域である、第1の周辺領域を決定し、
前記第1の周辺領域に含まれる領域の評価値のうち最も高い評価を示す第2の評価値を用いて、前記符号化対象ブロックの動きベクトルを決定する、
符号化装置。 - ビットストリームを記録する記録媒体であって、前記ビットストリームは、
復号対象ブロックを含むピクチャと、
復号処理で行われる動き探索に関する情報と、を含み、
前記復号処理では、
前記情報から代表位置を示す代表動きベクトルを導出し、
前記復号対象ブロックの第1の参照ピクチャにおいて、前記代表動きベクトルが示す前記代表位置を含む第1の動き探索範囲を決定し、
前記第1の動き探索範囲に含まれる複数の候補領域の第1の評価値を算出し、
前記第1の動き探索範囲に含まれる前記複数の候補領域のうち最も高い評価を示す第1の評価値を有する候補領域及びその周辺を含む領域であって、前記第1の動き探索範囲に包含される領域である、第1の周辺領域を決定し、
前記第1の周辺領域に含まれる領域の評価値のうち最も高い評価を示す第2の評価値を用いて、前記復号対象ブロックの動きベクトルを決定する、
記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023130501A JP2023145787A (ja) | 2017-04-13 | 2023-08-09 | 符号化装置及び復号装置 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762485072P | 2017-04-13 | 2017-04-13 | |
US62/485,072 | 2017-04-13 | ||
JP2017090685 | 2017-04-28 | ||
JP2017090685 | 2017-04-28 | ||
PCT/JP2018/014363 WO2018190207A1 (ja) | 2017-04-13 | 2018-04-04 | 符号化装置、復号装置、符号化方法及び復号方法 |
JP2019512462A JP6946419B2 (ja) | 2017-04-13 | 2018-04-04 | 復号装置、復号方法及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019512462A Division JP6946419B2 (ja) | 2017-04-13 | 2018-04-04 | 復号装置、復号方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023130501A Division JP2023145787A (ja) | 2017-04-13 | 2023-08-09 | 符号化装置及び復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022008413A true JP2022008413A (ja) | 2022-01-13 |
JP7331052B2 JP7331052B2 (ja) | 2023-08-22 |
Family
ID=63792652
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021150571A Active JP7331052B2 (ja) | 2017-04-13 | 2021-09-15 | 復号装置及び符号化装置 |
JP2023130501A Pending JP2023145787A (ja) | 2017-04-13 | 2023-08-09 | 符号化装置及び復号装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023130501A Pending JP2023145787A (ja) | 2017-04-13 | 2023-08-09 | 符号化装置及び復号装置 |
Country Status (6)
Country | Link |
---|---|
US (3) | US11653018B2 (ja) |
JP (2) | JP7331052B2 (ja) |
KR (2) | KR102620087B1 (ja) |
CN (5) | CN117097886A (ja) |
TW (1) | TWI782974B (ja) |
WO (1) | WO2018190207A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3747194A1 (en) * | 2018-01-29 | 2020-12-09 | VID SCALE, Inc. | Frame-rate up conversion with low complexity |
WO2020156549A1 (en) | 2019-02-02 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Buffer access methods for intra block copy in video coding |
JP7384910B2 (ja) * | 2019-02-02 | 2023-11-21 | 北京字節跳動網絡技術有限公司 | 映像符号化におけるイントラブロックコピーのためのバッファ管理 |
CN117395439A (zh) | 2019-03-01 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的基于方向的预测 |
KR20210125506A (ko) | 2019-03-04 | 2021-10-18 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 인트라 블록 복사를 위한 버퍼 관리 |
KR20230170800A (ko) | 2019-07-06 | 2023-12-19 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 인트라 블록 카피를 위한 가상 예측 버퍼 |
BR112022000358A2 (pt) | 2019-07-10 | 2022-05-10 | Beijing Bytedance Network Tech Co Ltd | Método e aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador |
KR20220030957A (ko) | 2019-07-11 | 2022-03-11 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 인트라 블록 카피를 위한 비트스트림 적합 제약 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001119701A (ja) * | 1999-10-20 | 2001-04-27 | Nec Corp | 高速動き検索装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2894958B2 (ja) * | 1994-10-14 | 1999-05-24 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | 画像復号化方式および装置 |
JP3709721B2 (ja) * | 1997-10-03 | 2005-10-26 | ソニー株式会社 | 符号化ストリームスプライシング装置及び符号化ストリームスプライシング方法、符号化ストリーム生成装置及び符号化ストリーム生成方法、並びに情報処理装置及び方法 |
JP4035903B2 (ja) * | 1998-10-22 | 2008-01-23 | ソニー株式会社 | 動きベクトル検出方法及び装置 |
TW444507B (en) * | 1998-10-22 | 2001-07-01 | Sony Corp | Detecting method and device for motion vector |
US7050502B2 (en) * | 2001-09-18 | 2006-05-23 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for motion vector detection and medium storing method program directed to the same |
JP2003169338A (ja) * | 2001-09-18 | 2003-06-13 | Matsushita Electric Ind Co Ltd | 動きベクトル検出方法及び装置並びに方法プログラムを記録した媒体 |
WO2005036887A1 (ja) * | 2003-10-14 | 2005-04-21 | Nec Corporation | 動きベクトル探索方法、動きベクトル探索装置および動きベクトル探索プログラム |
WO2015138008A1 (en) * | 2014-03-10 | 2015-09-17 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
US10958927B2 (en) * | 2015-03-27 | 2021-03-23 | Qualcomm Incorporated | Motion information derivation mode determination in video coding |
MX2018002477A (es) | 2015-09-02 | 2018-06-15 | Mediatek Inc | Metodo y aparato de derivacion de movimiento de lado de decodificador para codificacion de video. |
-
2018
- 2018-04-03 TW TW107111971A patent/TWI782974B/zh active
- 2018-04-04 CN CN202311289533.1A patent/CN117097886A/zh active Pending
- 2018-04-04 CN CN202311293955.6A patent/CN117097887A/zh active Pending
- 2018-04-04 KR KR1020237030332A patent/KR102620087B1/ko active IP Right Grant
- 2018-04-04 KR KR1020237044343A patent/KR20240005981A/ko active IP Right Grant
- 2018-04-04 CN CN202311295185.9A patent/CN117097888A/zh active Pending
- 2018-04-04 CN CN202311289889.5A patent/CN117176945A/zh active Pending
- 2018-04-04 WO PCT/JP2018/014363 patent/WO2018190207A1/ja unknown
- 2018-04-04 CN CN202311295209.0A patent/CN117097889A/zh active Pending
-
2021
- 2021-09-15 JP JP2021150571A patent/JP7331052B2/ja active Active
-
2022
- 2022-07-15 US US17/865,659 patent/US11653018B2/en active Active
-
2023
- 2023-03-24 US US18/125,816 patent/US11895316B2/en active Active
- 2023-08-09 JP JP2023130501A patent/JP2023145787A/ja active Pending
- 2023-12-20 US US18/390,148 patent/US20240129516A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001119701A (ja) * | 1999-10-20 | 2001-04-27 | Nec Corp | 高速動き検索装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7331052B2 (ja) | 2023-08-22 |
KR20240005981A (ko) | 2024-01-12 |
JP2023145787A (ja) | 2023-10-11 |
CN117097889A (zh) | 2023-11-21 |
US20230232034A1 (en) | 2023-07-20 |
TWI782974B (zh) | 2022-11-11 |
TW202308382A (zh) | 2023-02-16 |
US11653018B2 (en) | 2023-05-16 |
TW201842773A (zh) | 2018-12-01 |
US11895316B2 (en) | 2024-02-06 |
US20220368935A1 (en) | 2022-11-17 |
KR102620087B1 (ko) | 2024-01-02 |
WO2018190207A1 (ja) | 2018-10-18 |
CN117097888A (zh) | 2023-11-21 |
CN117176945A (zh) | 2023-12-05 |
US20240129516A1 (en) | 2024-04-18 |
CN117097886A (zh) | 2023-11-21 |
CN117097887A (zh) | 2023-11-21 |
KR20230131968A (ko) | 2023-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6946419B2 (ja) | 復号装置、復号方法及びプログラム | |
JP7014881B2 (ja) | 符号化装置及び符号化方法 | |
JP7087030B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7331052B2 (ja) | 復号装置及び符号化装置 | |
JPWO2019155971A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7026747B2 (ja) | 復号装置及び復号方法 | |
JP6857716B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7001822B2 (ja) | 復号装置及び復号方法 | |
JP7017580B2 (ja) | 復号装置、画像復号装置及び復号方法 | |
JP7389282B2 (ja) | 復号装置、及び、復号方法 | |
JP2022093625A (ja) | 符号化装置、復号装置、符号化方法、及び復号方法 | |
JP2023126387A (ja) | 符号化装置及び符号化方法 | |
JPWO2019189344A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
WO2019021803A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
WO2019244809A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JPWO2019225459A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
WO2019049912A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
WO2019146718A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
WO2019093279A1 (ja) | 符号化装置、復号装置、符号化方法および復号方法 | |
KR20240104207A (ko) | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7331052 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |