JP2022179772A - 復号装置及び符号化装置 - Google Patents
復号装置及び符号化装置 Download PDFInfo
- Publication number
- JP2022179772A JP2022179772A JP2022165614A JP2022165614A JP2022179772A JP 2022179772 A JP2022179772 A JP 2022179772A JP 2022165614 A JP2022165614 A JP 2022165614A JP 2022165614 A JP2022165614 A JP 2022165614A JP 2022179772 A JP2022179772 A JP 2022179772A
- Authority
- JP
- Japan
- Prior art keywords
- transform
- unit
- block
- inverse
- inverse transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims description 48
- 238000012545 processing Methods 0.000 abstract description 146
- 238000006243 chemical reaction Methods 0.000 abstract description 43
- 230000006835 compression Effects 0.000 abstract description 9
- 238000007906 compression Methods 0.000 abstract description 9
- 230000006866 deterioration Effects 0.000 abstract description 3
- 230000033001 locomotion Effects 0.000 description 106
- 238000013139 quantization Methods 0.000 description 105
- 238000000034 method Methods 0.000 description 97
- 230000009466 transformation Effects 0.000 description 62
- 230000008569 process Effects 0.000 description 59
- 239000013598 vector Substances 0.000 description 52
- 230000003044 adaptive effect Effects 0.000 description 43
- 238000010586 diagram Methods 0.000 description 41
- 238000004891 communication Methods 0.000 description 12
- 238000012937 correction Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 5
- 101150095908 apex1 gene Proteins 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000002146 bilateral effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000003702 image correction Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical group COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
まず、後述する本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例として、実施の形態1の概要を説明する。ただし、実施の形態1は、本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例にすぎず、本開示の各態様で説明する処理および/または構成は、実施の形態1とは異なる符号化装置および復号化装置においても実施可能である。
(2)実施の形態1の符号化装置または復号化装置に対して、当該符号化装置または復号化装置を構成する複数の構成要素のうち一部の構成要素について機能または実施する処理の追加、置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する構成要素に対応する構成要素を、本開示の各態様で説明する構成要素に置き換えること
(3)実施の形態1の符号化装置または復号化装置が実施する方法に対して、処理の追加、および/または当該方法に含まれる複数の処理のうちの一部の処理について置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(4)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(5)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が備える機能の一部を備える構成要素、または実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が実施する処理の一部を実施する構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(6)実施の形態1の符号化装置または復号化装置が実施する方法に対して、当該方法に含まれる複数の処理のうち、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(7)実施の形態1の符号化装置または復号化装置が実施する方法に含まれる複数の処理のうちの一部の処理を、本開示の各態様で説明する処理と組み合わせて実施すること
まず、実施の形態1に係る符号化装置の概要を説明する。図1は、実施の形態1に係る符号化装置100の機能構成を示すブロック図である。符号化装置100は、動画像/画像をブロック単位で符号化する動画像/画像符号化装置である。
分割部102は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部104に出力する。例えば、分割部102は、まず、ピクチャを固定サイズ(例えば128x128)のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット(CTU)と呼ばれることがある。そして、分割部102は、再帰的な四分木(quadtree)及び/又は二分木(binary tree)ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ(例えば64x64以下)のブロックに分割する。この可変サイズのブロックは、符号化ユニット(CU)、予測ユニット(PU)あるいは変換ユニット(TU)と呼ばれることがある。なお、本実施の形態では、CU、PU及びTUは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがCU、PU、TUの処理単位となってもよい。
減算部104は、分割部102によって分割されたブロック単位で原信号(原サンプル)から予測信号(予測サンプル)を減算する。つまり、減算部104は、符号化対象ブロック(以下、カレントブロックという)の予測誤差(残差ともいう)を算出する。そして、減算部104は、算出された予測誤差を変換部106に出力する。
変換部106は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部108に出力する。具体的には、変換部106は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換(DCT)又は離散サイン変換(DST)を行う。
量子化部108は、変換部106から出力された変換係数を量子化する。具体的には、量子化部108は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ(QP)に基づいて当該変換係数を量子化する。そして、量子化部108は、カレントブロックの量子化された変換係数(以下、量子化係数という)をエントロピー符号化部110及び逆量子化部112に出力する。
エントロピー符号化部110は、量子化部108から入力である量子化係数を可変長符号化することにより符号化信号(符号化ビットストリーム)を生成する。具体的には、エントロピー符号化部110は、例えば、量子化係数を二値化し、二値信号を算術符号化する。
逆量子化部112は、量子化部108からの入力である量子化係数を逆量子化する。具体的には、逆量子化部112は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部112は、カレントブロックの逆量子化された変換係数を逆変換部114に出力する。
逆変換部114は、逆量子化部112からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部114は、変換係数に対して、変換部106による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部114は、復元された予測誤差を加算部116に出力する。
加算部116は、逆変換部114からの入力である予測誤差と予測制御部128からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部116は、再構成されたブロックをブロックメモリ118及びループフィルタ部120に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。
ブロックメモリ118は、イントラ予測で参照されるブロックであって符号化対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ118は、加算部116から出力された再構成ブロックを格納する。
ループフィルタ部120は、加算部116によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ122に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ(インループフィルタ)であり、例えば、デブロッキング・フィルタ(DF)、サンプルアダプティブオフセット(SAO)及びアダプティブループフィルタ(ALF)などを含む。
フレームメモリ122は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ122は、ループフィルタ部120によってフィルタされた再構成ブロックを格納する。
イントラ予測部124は、ブロックメモリ118に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測(画面内予測ともいう)を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部124は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部128に出力する。
インター予測部126は、フレームメモリ122に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測(画面間予測ともいう)を行うことで、予測信号(インター予測信号)を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部126は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索(motion estimation)を行う。そして、インター予測部126は、動き探索により得られた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部126は、生成されたインター予測信号を予測制御部128に出力する。
flow)モードと呼ばれることがある。
予測制御部128は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部104及び加算部116に出力する。
次に、上記の符号化装置100から出力された符号化信号(符号化ビットストリーム)を復号可能な復号装置の概要について説明する。図10は、実施の形態1に係る復号装置200の機能構成を示すブロック図である。復号装置200は、動画像/画像をブロック単位で復号する動画像/画像復号装置である。
エントロピー復号部202は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部202は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部202は、二値信号を多値化(debinarize)する。これにより、エントロピー復号部202は、ブロック単位で量子化係数を逆量子化部204に出力する。
逆量子化部204は、エントロピー復号部202からの入力である復号対象ブロック(以下、カレントブロックという)の量子化係数を逆量子化する。具体的には、逆量子化部204は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部204は、カレントブロックの逆量子化された量子化係数(つまり変換係数)を逆変換部206に出力する。
逆変換部206は、逆量子化部204からの入力である変換係数を逆変換することにより予測誤差を復元する。
加算部208は、逆変換部206からの入力である予測誤差と予測制御部220からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部208は、再構成されたブロックをブロックメモリ210及びループフィルタ部212に出力する。
ブロックメモリ210は、イントラ予測で参照されるブロックであって復号対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ210は、加算部208から出力された再構成ブロックを格納する。
ループフィルタ部212は、加算部208によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ214及び表示装置等に出力する。
フレームメモリ214は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ214は、ループフィルタ部212によってフィルタされた再構成ブロックを格納する。
イントラ予測部216は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ210に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部216は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部220に出力する。
インター予測部218は、フレームメモリ214に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部218は、符号化ビットストリームから読み解かれた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部220に出力する。
予測制御部220は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部208に出力する。
次に、実施の形態2について説明する。本実施の形態では、変換及び逆変換について詳細に説明する。なお、本実施の形態に係る符号化装置及び復号装置の構成は、実施の形態1と実質的に同一であるので、図示及び説明を省略する。
まず、本実施の形態に係る符号化装置100の変換部106及び量子化部108の処理について、図11を参照しながら具体的に説明する。図11は、実施の形態2に係る符号化装置100における変換及び量子化処理を示すフローチャートである。
次に、本実施の形態に係る復号装置200の逆量子化部204及び逆変換部206の処理について、図12を参照しながら具体的に説明する。図12は、実施の形態2に係る復号装置200における逆量子化及び逆変換処理を示すフローチャートである。
発明者らは、従来の符号化では、第1の変換及び第2の変換の両方において変換基底及び変換パラメータ(例えばフィルタの係数)の最適な組合せを探索するための処理量が膨大であるという課題を見出した。これに対して、本実施の形態に係る符号化装置100及び復号装置200によれば、イントラ予測モード及び第1の変換基底に応じて、第2の変換をスキップすることができる。その結果、第1の変換及び第2の変換の両方において変換基底及び変換パラメータの最適な組合せを探索するための処理を減少させることができ、圧縮効率の低下を抑制しつつ処理負荷の軽減を実現することができる。
次に、実施の形態3について説明する。本実施の形態では、イントラ予測モードの判定に用いられる所定モードが非方向性予測モードに限定される点が、上記実施の形態2と異なる。以下に、本実施の形態について、上記実施の形態2と異なる点を中心に図面を参照しながら説明する。なお、以下の各図において、実施の形態2と実質的に同一のステップについては同一の符号を付し、重複する説明は省略又は簡略化する。
まず、本実施の形態に係る符号化装置100の変換部106及び量子化部108の処理について、図13を参照しながら具体的に説明する。図13は、実施の形態3に係る符号化装置100における変換及び量子化処理を示すフローチャートである。
次に、本実施の形態に係る復号装置200の逆量子化部204及び逆変換部206の処理について、図14を参照しながら具体的に説明する。図14は、実施の形態3に係る復号装置200における逆量子化及び逆変換処理を示すフローチャートである。
以上のように、本実施の形態に係る符号化装置100及び復号装置200によれば、イントラ予測モードが非方向性予測モードの場合に第2の変換をスキップすることができる。非方向性予測モードでは、残差がブロック内で平坦になることが多い。したがって、DCT-IIの変換基底及びそれに類似する変換基底以外の変換基底が用いられれば、高域成分が残りやすく、変換係数の分布がランダムになりやすい。この場合、第2の変換による圧縮効率向上の効果が低減するため、第2の変換をスキップすることにより圧縮効率の低下を抑制しつつ、処理負荷の軽減を実現することができる。
次に、実施の形態4について説明する。本実施の形態では、適応基底選択モードにおいてブロックサイズに応じて第1の変換基底が固定される点が、上記実施の形態2と異なる。以下に、本実施の形態について、上記実施の形態2及び3と異なる点を中心に図面を参照しながら説明する。なお、以下の各図において、実施の形態2及び3と実質的に同一のステップについては同一の符号を付し、重複する説明は省略又は簡略化する。
まず、本実施の形態に係る符号化装置100の変換部106及び量子化部108の処理について、図15を参照しながら具体的に説明する。図15は、実施の形態4に係る符号化装置100における変換及び量子化処理を示すフローチャートである。
次に、本実施の形態に係る符号化装置100のエントロピー符号化部110の変換に関する符号化処理について、図16を参照しながら具体的に説明する。図16は、実施の形態4に係る符号化装置100における符号化処理を示すフローチャートである。
次に、本実施の形態に係る復号装置200のエントロピー復号部202の処理について、図17を参照しながら具体的に説明する。図17は、実施の形態4に係る復号装置200における復号処理を示すフローチャートである。
次に、本実施の形態に係る復号装置200の逆量子化部204及び逆変換部206の処理について、図18を参照しながら具体的に説明する。図18は、実施の形態4に係る復号装置200における逆量子化及び逆変換処理を示すフローチャートである。
以上のように、本実施の形態に係る符号化装置100及び復号装置200によれば、適応基底選択モードが用いられる場合に、ブロックサイズに応じて第1の変換基底を固定することができる。したがって、適応基底選択モードにおける第1の変換の負荷を低減することができる。
以上の実施の形態及び各変形例において、機能ブロックの各々は、通常、MPU及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ROM等の記録媒体に記録されたソフトウェア(プログラム)を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア(専用回路)によって実現することも、当然、可能である。
図19は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
また、ストリーミングサーバex103は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバex103は、CDN(Contents Delivery Network)により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。CDNでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。
近年では、互いにほぼ同期した複数のカメラex113及び/又はスマートフォンex115などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。
コンテンツの切り替えに関して、図20に示す、上記実施の形態及び各変形例で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的/空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンex115で視聴していた映像の続きを、帰宅後にインターネットTV等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。
図22は、コンピュータex111等におけるwebページの表示画面例を示す図である。図23は、スマートフォンex115等におけるwebページの表示画面例を示す図である。図22及び図23に示すようにwebページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置(復号装置)は、リンク画像として各コンテンツが有する静止画又はIピクチャを表示したり、複数の静止画又はIピクチャ等でgifアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。
また、車の自動走行又は走行支援のため2次元又は3次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、1以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。
また、コンテンツ供給システムex100では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。
また、これらの符号化又は復号処理は、一般的に各端末が有するLSIex500において処理される。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD-ROM、フレキシブルディスク、又はハードディスクなど)に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンex115がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンex115が有するLSIex500で符号化処理されたデータである。
図24は、スマートフォンex115を示す図である。また、図25は、スマートフォンex115の構成例を示す図である。スマートフォンex115は、基地局ex110との間で電波を送受信するためのアンテナex450と、映像及び静止画を撮ることが可能なカメラ部ex465と、カメラ部ex465で撮像した映像、及びアンテナex450で受信した映像等が復号されたデータを表示する表示部ex458とを備える。スマートフォンex115は、さらに、タッチパネル等である操作部ex466と、音声又は音響を出力するためのスピーカ等である音声出力部ex457と、音声を入力するためのマイク等である音声入力部ex456と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ex467と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのSIMex468とのインタフェース部であるスロット部ex464とを備える。なお、メモリ部ex467の代わりに外付けメモリが用いられてもよい。
102 分割部
104 減算部
106 変換部
108 量子化部
110 エントロピー符号化部
112、204 逆量子化部
114、206 逆変換部
116、208 加算部
118、210 ブロックメモリ
120、212 ループフィルタ部
122、214 フレームメモリ
124、216 イントラ予測部
126、218 インター予測部
128、220 予測制御部
200 復号装置
202 エントロピー復号部
Claims (4)
- 復号装置であって、
プロセッサ及びメモリを備え、前記プロセッサは前記メモリを用いて、
ピクチャに含まれる復号対象ブロックにイントラ予測を用いる場合、複数の第1の逆変換基底の候補の中から第1の逆変換基底を選択可能な基底選択モードが前記復号対象ブロックに用いられるか否か、及び、前記復号対象ブロックのサイズが所定条件を満たすか否かを判定し、
前記復号対象ブロックに前記基底選択モードが用いられ、かつ、前記復号対象ブロックのサイズが前記所定条件を満たす場合は、
(i)前記復号対象ブロックのイントラ予測モードが所定モードでない場合に、前記復号対象ブロックの逆量子化された係数に、第2の逆変換基底を用いて第2の逆変換を行い、さらに第1の所定逆変換基底を用いて第1の逆変換を行い、
(ii)前記復号対象ブロックのイントラ予測モードが前記所定モードである場合に、前記第2の逆変換をスキップし、前記復号対象ブロックの逆量子化された係数に、前記第1の所定逆変換基底を用いて第1の逆変換を行い、
前記第1の逆変換はSeparableな変換であり、前記第2の逆変換はNon-Seaparableな変換である、
復号装置。 - 復号装置であって、
プロセッサ及びメモリを備え、前記プロセッサは前記メモリを用いて、
(i)ピクチャに含まれる第1の復号対象ブロックであって、所定モードでないイントラ予測モードが用いられ、複数の第1の逆変換基底の候補の中から第1の逆変換基底を選択可能な基底選択モードが用いられ、かつ、所定条件を満たすサイズを有する前記第1の復号対象ブロックの逆量子化された係数に、第2の逆変換基底を用いて第2の逆変換を行い、さらに第1の所定逆変換基底を用いて第1の逆変換を行い、
(ii)前記ピクチャに含まれる第2の復号対象ブロックであって、前記所定モードであるイントラ予測モードが用いられ、前記基底選択モードが用いられ、かつ、前記所定条件を満たすサイズを有する前記第2の復号対象ブロックの逆量子化された係数に、前記第2の逆変換をスキップして、前記第1の所定逆変換基底を用いて第1の逆変換を行い、
前記第1の逆変換はSeparableな変換であり、前記第2の逆変換はNon-Seaparableな変換である、
復号装置。 - 符号化装置であって、
プロセッサ及びメモリを備え、前記プロセッサは前記メモリを用いて、
ピクチャに含まれる符号化対象ブロックにイントラ予測を用いる場合、複数の第1の変換基底の候補の中から第1の変換基底を選択可能な基底選択モードが前記符号化対象ブロックに用いられるか否か、及び、前記符号化対象ブロックのサイズが所定条件を満たすか否かを判定し、
前記符号化対象ブロックに前記基底選択モードが用いられ、かつ、前記符号化対象ブロックのサイズが前記所定条件を満たす場合は、
(i)前記符号化対象ブロックの残差信号に、第1の所定変換基底を用いて第1の変換を行うことにより第1の変換係数を生成し、
(ii-1)前記符号化対象ブロックのイントラ予測モードが所定モードでない場合は、前記第1の変換係数に、第2の変換基底を用いて第2の変換を行うことにより第2の変換係数を生成し、前記第2の変換係数を量子化し、
(ii-2)前記符号化対象ブロックのイントラ予測モードが前記所定モードである場合は、前記第1の変換係数を量子化し、
前記第1の変換はSeparableな変換であり、前記第2の変換はNon-Seaparableな変換である、
符号化装置。 - 符号化装置であって、
プロセッサ及びメモリを備え、前記プロセッサは前記メモリを用いて、
(i)ピクチャに含まれる第1の符号化対象ブロックであって、所定モードでないイントラ予測モードが用いられ、複数の第1の変換基底の候補の中から選択された第1の変換基底を選択可能な基底選択モードが用いられ、かつ、所定条件を満たすサイズを有する前記第1の符号化対象ブロックの残差信号に、第1の所定変換基底を用いて第1の変換を行うことにより第1の変換係数を生成し、前記第1の変換係数に第2の変換基底を用いて第2の変換を行うことにより第2の変換係数を生成し、前記第2の変換係数を量子化し、
(ii)前記ピクチャに含まれる第2の符号化対象ブロックであって、前記所定モードであるイントラ予測モードが用いられ、前記基底選択モードが用いられ、且つ、前記所定条件を満たすサイズを有する前記第2の符号化対象ブロックの残差信号に、前記第1の所定変換基底を用いて第1の変換を行うことにより第1の変換係数を生成し、前記第1の変換係数を量子化し、
前記第1の変換はSeparableな変換であり、前記第2の変換はNon-Seaparableな変換である、
符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024120638A JP2024144621A (ja) | 2017-06-01 | 2024-07-25 | 復号装置、復号方法、符号化装置及び符号化方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762513685P | 2017-06-01 | 2017-06-01 | |
US62/513,685 | 2017-06-01 | ||
JP2020159897A JP7026747B2 (ja) | 2017-06-01 | 2020-09-24 | 復号装置及び復号方法 |
JP2022021225A JP7161636B2 (ja) | 2017-06-01 | 2022-02-15 | 符号化装置及び符号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022021225A Division JP7161636B2 (ja) | 2017-06-01 | 2022-02-15 | 符号化装置及び符号化方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024120638A Division JP2024144621A (ja) | 2017-06-01 | 2024-07-25 | 復号装置、復号方法、符号化装置及び符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022179772A true JP2022179772A (ja) | 2022-12-02 |
JP7529740B2 JP7529740B2 (ja) | 2024-08-06 |
Family
ID=64455133
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019521253A Active JP6770192B2 (ja) | 2017-06-01 | 2018-05-30 | 符号化装置、符号化方法、復号装置及び復号方法 |
JP2020159897A Active JP7026747B2 (ja) | 2017-06-01 | 2020-09-24 | 復号装置及び復号方法 |
JP2022021225A Active JP7161636B2 (ja) | 2017-06-01 | 2022-02-15 | 符号化装置及び符号化方法 |
JP2022165614A Active JP7529740B2 (ja) | 2017-06-01 | 2022-10-14 | 復号装置及び符号化装置 |
JP2024120638A Pending JP2024144621A (ja) | 2017-06-01 | 2024-07-25 | 復号装置、復号方法、符号化装置及び符号化方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019521253A Active JP6770192B2 (ja) | 2017-06-01 | 2018-05-30 | 符号化装置、符号化方法、復号装置及び復号方法 |
JP2020159897A Active JP7026747B2 (ja) | 2017-06-01 | 2020-09-24 | 復号装置及び復号方法 |
JP2022021225A Active JP7161636B2 (ja) | 2017-06-01 | 2022-02-15 | 符号化装置及び符号化方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024120638A Pending JP2024144621A (ja) | 2017-06-01 | 2024-07-25 | 復号装置、復号方法、符号化装置及び符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (3) | US11102489B2 (ja) |
JP (5) | JP6770192B2 (ja) |
TW (1) | TW201904293A (ja) |
WO (1) | WO2018221554A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018221554A1 (ja) * | 2017-06-01 | 2018-12-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、符号化方法、復号装置及び復号方法 |
WO2019231206A1 (ko) | 2018-05-30 | 2019-12-05 | 디지털인사이트주식회사 | 영상 부호화/복호화 방법 및 장치 |
CN110636313B (zh) * | 2019-09-18 | 2022-07-15 | 浙江大华技术股份有限公司 | 变换、二次变换矩阵训练方法、编码器及相关装置 |
WO2021196231A1 (zh) * | 2020-04-03 | 2021-10-07 | Oppo广东移动通信有限公司 | 变换方法、编码器、解码器以及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60104480A (ja) * | 1983-11-10 | 1985-06-08 | ヤマハ発動機株式会社 | 自動二輪車等の緩衝装置 |
TW201134225A (en) * | 2009-08-06 | 2011-10-01 | Panasonic Corp | Encoding method, decoding method, encoding device and decoding device |
JP4819940B2 (ja) * | 2009-12-04 | 2011-11-24 | 株式会社日立国際電気 | 動画像符号化装置 |
WO2011083573A1 (ja) * | 2010-01-07 | 2011-07-14 | 株式会社 東芝 | 動画像符号化装置及び動画像復号化装置 |
KR20110113561A (ko) * | 2010-04-09 | 2011-10-17 | 한국전자통신연구원 | 적응적인 필터를 이용한 인트라 예측 부호화/복호화 방법 및 그 장치 |
WO2011127964A2 (en) * | 2010-04-13 | 2011-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for intra predicting a block, apparatus for reconstructing a block of a picture, apparatus for reconstructing a block of a picture by intra prediction |
KR101791242B1 (ko) * | 2010-04-16 | 2017-10-30 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 장치 및 방법 |
KR101373814B1 (ko) * | 2010-07-31 | 2014-03-18 | 엠앤케이홀딩스 주식회사 | 예측 블록 생성 장치 |
WO2012134046A2 (ko) * | 2011-04-01 | 2012-10-04 | 주식회사 아이벡스피티홀딩스 | 동영상의 부호화 방법 |
KR20120140181A (ko) * | 2011-06-20 | 2012-12-28 | 한국전자통신연구원 | 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치 |
CN104067622B (zh) * | 2011-10-18 | 2018-01-02 | 株式会社Kt | 图像编码方法、图像解码方法、图像编码器及图像解码器 |
PL3402200T3 (pl) * | 2011-10-24 | 2023-04-11 | Gensquare Llc | Aparat do dekodowania obrazu |
KR20130049522A (ko) * | 2011-11-04 | 2013-05-14 | 오수미 | 인트라 예측 블록 생성 방법 |
CN104704827B (zh) * | 2012-11-13 | 2019-04-12 | 英特尔公司 | 用于下一代视频的内容自适应变换译码 |
JP5537695B2 (ja) * | 2013-04-10 | 2014-07-02 | 株式会社東芝 | 画像復号化装置、方法およびプログラム |
US10491922B2 (en) * | 2015-09-29 | 2019-11-26 | Qualcomm Incorporated | Non-separable secondary transform for video coding |
US11095893B2 (en) * | 2016-10-12 | 2021-08-17 | Qualcomm Incorporated | Primary transform and secondary transform in video coding |
JP6767579B2 (ja) * | 2017-06-01 | 2020-10-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、符号化方法、復号装置及び復号方法 |
WO2018221554A1 (ja) * | 2017-06-01 | 2018-12-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、符号化方法、復号装置及び復号方法 |
-
2018
- 2018-05-30 WO PCT/JP2018/020657 patent/WO2018221554A1/ja active Application Filing
- 2018-05-30 JP JP2019521253A patent/JP6770192B2/ja active Active
- 2018-05-31 TW TW107118739A patent/TW201904293A/zh unknown
-
2019
- 2019-11-27 US US16/697,534 patent/US11102489B2/en active Active
-
2020
- 2020-09-24 JP JP2020159897A patent/JP7026747B2/ja active Active
-
2021
- 2021-06-23 US US17/355,596 patent/US11729398B2/en active Active
-
2022
- 2022-02-15 JP JP2022021225A patent/JP7161636B2/ja active Active
- 2022-10-14 JP JP2022165614A patent/JP7529740B2/ja active Active
-
2023
- 2023-06-23 US US18/213,367 patent/US20230336741A1/en active Pending
-
2024
- 2024-07-25 JP JP2024120638A patent/JP2024144621A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20200099939A1 (en) | 2020-03-26 |
US20210321117A1 (en) | 2021-10-14 |
JP2020202597A (ja) | 2020-12-17 |
US11729398B2 (en) | 2023-08-15 |
JP2022069458A (ja) | 2022-05-11 |
US20230336741A1 (en) | 2023-10-19 |
JP7529740B2 (ja) | 2024-08-06 |
JP6770192B2 (ja) | 2020-10-14 |
WO2018221554A1 (ja) | 2018-12-06 |
JP7026747B2 (ja) | 2022-02-28 |
US11102489B2 (en) | 2021-08-24 |
JP2024144621A (ja) | 2024-10-11 |
JP7161636B2 (ja) | 2022-10-26 |
TW201904293A (zh) | 2019-01-16 |
JPWO2018221554A1 (ja) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7292477B2 (ja) | 符号化装置及び復号装置 | |
JP7199221B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7568875B2 (ja) | 符号化装置、復号装置及び非一時的記憶媒体 | |
JP2022111206A (ja) | 画像符号化装置及び符号化方法 | |
JP7260685B2 (ja) | 符号化装置及び符号化方法 | |
JP7331052B2 (ja) | 復号装置及び符号化装置 | |
JP7339890B2 (ja) | 符号化装置及び復号装置 | |
JP7299386B2 (ja) | 符号化装置及び復号装置 | |
JP7114773B2 (ja) | 復号装置及び符号化装置 | |
JP7161636B2 (ja) | 符号化装置及び符号化方法 | |
JP7314382B2 (ja) | 復号装置 | |
JP2023068203A (ja) | 復号装置及び復号方法 | |
JP2022066196A (ja) | 画像復号装置 | |
JP7535642B2 (ja) | 符号化装置、及び、符号化方法 | |
JP2022111209A (ja) | 符号化装置及び復号装置 | |
JP2023174874A (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2022168052A (ja) | 復号装置及び符号化装置 | |
JP2023016992A (ja) | 符号化装置及び復号装置 | |
JP2023001298A (ja) | 復号装置及び復号方法 | |
JP7241056B2 (ja) | 復号装置、復号方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7529740 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |