JP7036628B2 - 符号化装置、復号装置、符号化方法及び復号方法 - Google Patents
符号化装置、復号装置、符号化方法及び復号方法 Download PDFInfo
- Publication number
- JP7036628B2 JP7036628B2 JP2018039640A JP2018039640A JP7036628B2 JP 7036628 B2 JP7036628 B2 JP 7036628B2 JP 2018039640 A JP2018039640 A JP 2018039640A JP 2018039640 A JP2018039640 A JP 2018039640A JP 7036628 B2 JP7036628 B2 JP 7036628B2
- Authority
- JP
- Japan
- Prior art keywords
- reference sample
- block
- pixel values
- unit
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 122
- 239000013074 reference sample Substances 0.000 claims description 268
- 238000012545 processing Methods 0.000 claims description 204
- 238000001914 filtration Methods 0.000 claims description 83
- 230000002146 bilateral effect Effects 0.000 description 161
- 230000033001 locomotion Effects 0.000 description 108
- 238000006243 chemical reaction Methods 0.000 description 75
- 230000008569 process Effects 0.000 description 67
- 239000013598 vector Substances 0.000 description 54
- 238000010586 diagram Methods 0.000 description 53
- 238000013139 quantization Methods 0.000 description 52
- 238000009499 grossing Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 18
- 230000002093 peripheral effect Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 12
- 238000012937 correction Methods 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 230000011664 signaling Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000003702 image correction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 101150095908 apex1 gene Proteins 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical group COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
まず、後述する本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例として、実施の形態1の概要を説明する。ただし、実施の形態1は、本開示の各態様で説明する処理および/または構成を適用可能な符号化装置および復号化装置の一例にすぎず、本開示の各態様で説明する処理および/または構成は、実施の形態1とは異なる符号化装置および復号化装置においても実施可能である。
(2)実施の形態1の符号化装置または復号化装置に対して、当該符号化装置または復号化装置を構成する複数の構成要素のうち一部の構成要素について機能または実施する処理の追加、置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する構成要素に対応する構成要素を、本開示の各態様で説明する構成要素に置き換えること
(3)実施の形態1の符号化装置または復号化装置が実施する方法に対して、処理の追加、および/または当該方法に含まれる複数の処理のうちの一部の処理について置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(4)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(5)実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が備える機能の一部を備える構成要素、または実施の形態1の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が実施する処理の一部を実施する構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
(6)実施の形態1の符号化装置または復号化装置が実施する方法に対して、当該方法に含まれる複数の処理のうち、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
(7)実施の形態1の符号化装置または復号化装置が実施する方法に含まれる複数の処理のうちの一部の処理を、本開示の各態様で説明する処理と組み合わせて実施すること
まず、実施の形態1に係る符号化装置の概要を説明する。図1は、実施の形態1に係る符号化装置100の機能構成を示すブロック図である。符号化装置100は、動画像/画像をブロック単位で符号化する動画像/画像符号化装置である。
分割部102は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部104に出力する。例えば、分割部102は、まず、ピクチャを固定サイズ(例えば128x128)のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット(CTU)と呼ばれることがある。そして、分割部102は、再帰的な四分木(quadtree)及び/又は二分木(binary tree)ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ(例えば64x64以下)のブロックに分割する。この可変サイズのブロックは、符号化ユニット(CU)、予測ユニット(PU)あるいは変換ユニット(TU)と呼ばれることがある。なお、本実施の形態では、CU、PU及びTUは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがCU、PU、TUの処理単位となってもよい。
減算部104は、分割部102によって分割されたブロック単位で原信号(原サンプル)から予測信号(予測サンプル)を減算する。つまり、減算部104は、符号化対象ブロック(以下、カレントブロックという)の予測誤差(残差ともいう)を算出する。そして、減算部104は、算出された予測誤差を変換部106に出力する。
変換部106は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部108に出力する。具体的には、変換部106は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換(DCT)又は離散サイン変換(DST)を行う。
量子化部108は、変換部106から出力された変換係数を量子化する。具体的には、量子化部108は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ(QP)に基づいて当該変換係数を量子化する。そして、量子化部108は、カレントブロックの量子化された変換係数(以下、量子化係数という)をエントロピー符号化部110及び逆量子化部112に出力する。
エントロピー符号化部110は、量子化部108から入力である量子化係数を可変長符号化することにより符号化信号(符号化ビットストリーム)を生成する。具体的には、エントロピー符号化部110は、例えば、量子化係数を二値化し、二値信号を算術符号化する。
逆量子化部112は、量子化部108からの入力である量子化係数を逆量子化する。具体的には、逆量子化部112は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部112は、カレントブロックの逆量子化された変換係数を逆変換部114に出力する。
逆変換部114は、逆量子化部112からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部114は、変換係数に対して、変換部106による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部114は、復元された予測誤差を加算部116に出力する。
加算部116は、逆変換部114からの入力である予測誤差と予測制御部128からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部116は、再構成されたブロックをブロックメモリ118及びループフィルタ部120に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。
ブロックメモリ118は、イントラ予測で参照されるブロックであって符号化対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ118は、加算部116から出力された再構成ブロックを格納する。
ループフィルタ部120は、加算部116によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ122に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ(インループフィルタ)であり、例えば、デブロッキング・フィルタ(DF)、サンプルアダプティブオフセット(SAO)及びアダプティブループフィルタ(ALF)などを含む。
フレームメモリ122は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ122は、ループフィルタ部120によってフィルタされた再構成ブロックを格納する。
イントラ予測部124は、ブロックメモリ118に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測(画面内予測ともいう)を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部124は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部128に出力する。
インター予測部126は、フレームメモリ122に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測(画面間予測ともいう)を行うことで、予測信号(インター予測信号)を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部126は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索(motion estimation)を行う。そして、インター予測部126は、動き探索により得られた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部126は、生成されたインター予測信号を予測制御部128に出力する。
予測制御部128は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部104及び加算部116に出力する。
次に、上記の符号化装置100から出力された符号化信号(符号化ビットストリーム)を復号可能な復号装置の概要について説明する。図10は、実施の形態1に係る復号装置200の機能構成を示すブロック図である。復号装置200は、動画像/画像をブロック単位で復号する動画像/画像復号装置である。
エントロピー復号部202は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部202は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部202は、二値信号を多値化(debinarize)する。これにより、エントロピー復号部202は、ブロック単位で量子化係数を逆量子化部204に出力する。
逆量子化部204は、エントロピー復号部202からの入力である復号対象ブロック(以下、カレントブロックという)の量子化係数を逆量子化する。具体的には、逆量子化部204は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部204は、カレントブロックの逆量子化された量子化係数(つまり変換係数)を逆変換部206に出力する。
逆変換部206は、逆量子化部204からの入力である変換係数を逆変換することにより予測誤差を復元する。
加算部208は、逆変換部206からの入力である予測誤差と予測制御部220からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部208は、再構成されたブロックをブロックメモリ210及びループフィルタ部212に出力する。
ブロックメモリ210は、イントラ予測で参照されるブロックであって復号対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ210は、加算部208から出力された再構成ブロックを格納する。
ループフィルタ部212は、加算部208によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ214及び表示装置等に出力する。
フレームメモリ214は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ214は、ループフィルタ部212によってフィルタされた再構成ブロックを格納する。
イントラ予測部216は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ210に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部216は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部220に出力する。
インター予測部218は、フレームメモリ214に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部218は、符号化ビットストリームから読み解かれた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部220に出力する。
予測制御部220は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部208に出力する。
本実施の形態における符号化装置および復号装置は、イントラ予測を行うときには、事前に、予測対象ブロックの周辺にあって、その予測に用いられる画素である参照サンプルに対してフィルタリングを行う。なお、本実施の形態における符号化装置は、実施の形態1における符号化装置100の全ての構成および機能を備えていてもよく、一部の構成および機能のみを備えていてもよい。同様に、本実施の形態における復号装置は、実施の形態1における復号装置200の全ての構成および機能を備えていてもよく、一部の構成および機能のみを備えていてもよい。
バイラテラルフィルタは、一次元のフィルタである。これは、それぞれ参照サンプルとして用いられる複数の画素が、予測対象ブロックの左に1列に配列された複数の画素、または、予測対象ブロックの上に1行に配列された複数の画素だけだからである。
バイラテラルフィルタに用いられる重みωは、例えば、空間パラメータσdおよびレンジパラメータσγを用いて算出される。
図17は、空間パラメータσdを説明するための図である。
レンジパラメータσγは、符号化装置100Aにおいて画像のコントラストに応じた適切な値として導出され、例えばピクチャパラメータセットに含めて送信される。
ここで、本実施の形態におけるバイラテラルフィルタは、適応的参照サンプルスムージングの代わりに用いられてもよい。
図20Aは、上記各実施の形態に係る符号化装置の実装例を示すブロック図である。符号化装置は、処理回路160及びメモリ162を備える。例えば、図1または図11に示された符号化装置の複数の構成要素は、図20Aに示された処理回路160及びメモリ162によって実装される。
上記各実施の形態における符号化装置及び復号装置は、それぞれ、画像符号化装置及び画像復号装置として利用されてもよいし、動画像符号化装置及び動画像復号装置として利用されてもよい。
以上の各実施の形態において、機能ブロックの各々は、通常、MPU及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ROM等の記録媒体に記録されたソフトウェア(プログラム)を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア(専用回路)によって実現することも、当然、可能である。
図22は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
また、ストリーミングサーバex103は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバex103は、CDN(Contents Delivery Network)により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。CDNでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。
近年では、互いにほぼ同期した複数のカメラex113及び/又はスマートフォンex115などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。
コンテンツの切り替えに関して、図23に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的/空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンex115で視聴していた映像の続きを、帰宅後にインターネットTV等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。
図25は、コンピュータex111等におけるwebページの表示画面例を示す図である。図26は、スマートフォンex115等におけるwebページの表示画面例を示す図である。図25及び図26に示すようにwebページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置(復号装置)は、リンク画像として各コンテンツが有する静止画又はIピクチャを表示したり、複数の静止画又はIピクチャ等でgifアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。
また、車の自動走行又は走行支援のため2次元又は3次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、1以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。
また、コンテンツ供給システムex100では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。
また、これらの符号化又は復号処理は、一般的に各端末が有するLSIex500において処理される。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD-ROM、フレキシブルディスク、又はハードディスクなど)に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンex115がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンex115が有するLSIex500で符号化処理されたデータである。
図27は、スマートフォンex115を示す図である。また、図28は、スマートフォンex115の構成例を示す図である。スマートフォンex115は、基地局ex110との間で電波を送受信するためのアンテナex450と、映像及び静止画を撮ることが可能なカメラ部ex465と、カメラ部ex465で撮像した映像、及びアンテナex450で受信した映像等が復号されたデータを表示する表示部ex458とを備える。スマートフォンex115は、さらに、タッチパネル等である操作部ex466と、音声又は音響を出力するためのスピーカ等である音声出力部ex457と、音声を入力するためのマイク等である音声入力部ex456と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ex467と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのSIMex468とのインタフェース部であるスロット部ex464とを備える。なお、メモリ部ex467の代わりに外付けメモリが用いられてもよい。
102 分割部
104 減算部
106 変換部
108 量子化部
110 エントロピー符号化部
112、204 逆量子化部
114、206 逆変換部
116、208 加算部
118、210 ブロックメモリ
120、212 ループフィルタ部
122、214 フレームメモリ
124、216 イントラ予測部
126、218 インター予測部
128、220 予測制御部
131、231 バイラテラルフィルタ部
160、260 処理回路
162、262 メモリ
200、200A 復号装置
202 エントロピー復号部
Claims (20)
- 処理回路と、
メモリとを備え、
前記処理回路は、前記メモリを用いて、
予測対象ブロックの左または上に配列された複数の画素のそれぞれを参照サンプルとして参照し、
複数の前記参照サンプルのうちの処理対象参照サンプルの画素値に対して、複数の前記参照サンプルの画素値を用いたフィルタリングを行い、
フィルタリングされた前記処理対象参照サンプルの画素値を用いたイントラ予測によって、前記予測対象ブロックの予測画像を生成し、
前記予測対象ブロックと前記予測画像との差分を算出し、
前記フィルタリングでは、
複数の前記参照サンプルのそれぞれについて、当該参照サンプルと前記処理対象参照サンプルとの間の距離と、画素値の差とに基づいて、当該参照サンプルの重みを決定し、
複数の前記参照サンプルのそれぞれの画素値と、決定された重みとを用いた重み付け加算によって、前記処理対象参照サンプルの画素値に対してフィルタリングを行う、
符号化装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記距離が長いほど、前記参照サンプルに対して小さい重みを決定する、
請求項1に記載の符号化装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記画素値の差が大きいほど、前記参照サンプルに対して小さい重みを決定する、
請求項1または2に記載の符号化装置。 - 前記画素値の差は、輝度値の差である、
請求項1~3の何れか1項に記載の符号化装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記予測対象ブロックのブロックサイズに基づく第1パラメータに対する、前記距離の割合が大きいほど、前記参照サンプルに対して小さい重みを決定する、
請求項1~4の何れか1項に記載の符号化装置。 - 前記第1パラメータは、前記予測対象ブロックのブロックサイズが大きいほど大きい値を示す、
請求項5に記載の符号化装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
複数の前記参照サンプルのコントラストに基づく第2パラメータに対する、前記画素値の差の割合が大きいほど、前記参照サンプルに対して小さい重みを決定する、
請求項1~5の何れか1項に記載の符号化装置。 - 前記第2パラメータは、複数の前記参照サンプルのコントラストが低いほど、小さい値を示す、
請求項7に記載の符号化装置。 - 処理回路と、
メモリとを備え、
前記処理回路は、前記メモリを用いて、
符号化された予測対象ブロックの左または上に配列された複数の画素のそれぞれを参照サンプルとして参照し、
複数の前記参照サンプルのうちの処理対象参照サンプルの画素値に対して、複数の前記参照サンプルの画素値を用いたフィルタリングを行い、
フィルタリングされた前記処理対象参照サンプルの画素値を用いたイントラ予測によって、前記予測対象ブロックの予測画像を生成し、
ビットストリームから得られる予測誤差に前記予測画像を加算し、
前記フィルタリングでは、
複数の前記参照サンプルのそれぞれについて、当該参照サンプルと前記処理対象参照サンプルとの間の距離と、画素値の差とに基づいて、当該参照サンプルの重みを決定し、
複数の前記参照サンプルのそれぞれの画素値と、決定された重みとを用いた重み付け加算によって、前記処理対象参照サンプルの画素値に対してフィルタリングを行う、
復号装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記距離が長いほど、前記参照サンプルに対して小さい重みを決定する
請求項10に記載の復号装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記画素値の差が大きいほど、前記参照サンプルに対して小さい重みを決定する
請求項10または11に記載の復号装置。 - 前記画素値の差は、輝度値の差である
請求項10~12の何れか1項に記載の復号装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
前記予測対象ブロックのブロックサイズに基づく第1パラメータに対する、前記距離の割合が大きいほど、前記参照サンプルに対して小さい重みを決定する
請求項10~13の何れか1項に記載の復号装置。 - 前記第1パラメータは、前記予測対象ブロックのブロックサイズが大きいほど大きい値を示す
請求項14に記載の復号装置。 - 前記処理回路は、
前記参照サンプルの重みの決定では、
複数の前記参照サンプルのコントラストに基づく第2パラメータに対する、前記画素値の差の割合が大きいほど、前記参照サンプルに対して小さい重みを決定する
請求項10~15の何れか1項に記載の復号装置。 - 前記第2パラメータは、複数の前記参照サンプルのコントラストが低いほど、小さい値を示す
請求項16に記載の復号装置。 - 予測対象ブロックの左または上に配列された複数の画素のそれぞれを参照サンプルとして参照し、
複数の前記参照サンプルのうちの処理対象参照サンプルの画素値に対して、複数の前記参照サンプルの画素値を用いたフィルタリングを行い、
フィルタリングされた前記処理対象参照サンプルの画素値を用いたイントラ予測によって、前記予測対象ブロックの予測画像を生成し、
前記予測対象ブロックと前記予測画像との差分を算出し、
前記フィルタリングでは、
複数の前記参照サンプルのそれぞれについて、当該参照サンプルと前記処理対象参照サンプルとの間の距離と、画素値の差とに基づいて、当該参照サンプルの重みを決定し、
複数の前記参照サンプルのそれぞれの画素値と、決定された重みとを用いた重み付け加算によって、前記処理対象参照サンプルの画素値に対してフィルタリングを行う、
符号化方法。 - 符号化された予測対象ブロックの左または上に配列された複数の画素のそれぞれを参照サンプルとして参照し、
複数の前記参照サンプルのうちの処理対象参照サンプルの画素値に対して、複数の前記参照サンプルの画素値を用いたフィルタリングを行い、
フィルタリングされた前記処理対象参照サンプルの画素値を用いたイントラ予測によって、前記予測対象ブロックの予測画像を生成し、
ビットストリームから得られる予測誤差に前記予測画像を加算し、
前記フィルタリングでは、
複数の前記参照サンプルのそれぞれについて、当該参照サンプルと前記処理対象参照サンプルとの間の距離と、画素値の差とに基づいて、当該参照サンプルの重みを決定し、
複数の前記参照サンプルのそれぞれの画素値と、決定された重みとを用いた重み付け加算によって、前記処理対象参照サンプルの画素値に対してフィルタリングを行う、
復号方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762469638P | 2017-03-10 | 2017-03-10 | |
| US62/469,638 | 2017-03-10 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018152852A JP2018152852A (ja) | 2018-09-27 |
| JP7036628B2 true JP7036628B2 (ja) | 2022-03-15 |
Family
ID=63681966
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018039640A Active JP7036628B2 (ja) | 2017-03-10 | 2018-03-06 | 符号化装置、復号装置、符号化方法及び復号方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10848760B2 (ja) |
| JP (1) | JP7036628B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20200267381A1 (en) * | 2017-11-01 | 2020-08-20 | Vid Scale, Inc. | Methods for simplifying adaptive loop filter in video coding |
Families Citing this family (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12184846B2 (en) | 2017-01-02 | 2024-12-31 | Industry-University Cooperation Foundation Hanyang University | Intra prediction method and apparatus for performing adaptive filtering on reference pixel |
| KR102719084B1 (ko) * | 2017-01-02 | 2024-10-16 | 한양대학교 산학협력단 | 참조 화소에 대하여 적응적 필터링을 수행하기 위한 화면 내 예측 방법 및 장치 |
| US11184636B2 (en) * | 2017-06-28 | 2021-11-23 | Sharp Kabushiki Kaisha | Video encoding device and video decoding device |
| US10902559B2 (en) | 2017-08-04 | 2021-01-26 | Outward, Inc. | Machine learning based image processing techniques |
| US10992930B2 (en) | 2018-03-30 | 2021-04-27 | Hulu, LLC | Template refined bi-prediction for video coding |
| CN117294837A (zh) | 2018-04-02 | 2023-12-26 | 深圳市大疆创新科技有限公司 | 用于图像处理的方法和图像处理装置 |
| US20190373292A1 (en) * | 2018-06-01 | 2019-12-05 | Qualcomm Incorporated | In-loop bilateral filter type decision based on block information |
| CN116708835A (zh) * | 2018-07-02 | 2023-09-05 | Lg电子株式会社 | 编解码设备和数据发送设备 |
| AU2018435559A1 (en) * | 2018-08-09 | 2021-03-11 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Video image component prediction method and device, and computer storage medium |
| TWI814890B (zh) | 2018-08-17 | 2023-09-11 | 大陸商北京字節跳動網絡技術有限公司 | 簡化的跨分量預測 |
| CN116647693A (zh) * | 2018-09-06 | 2023-08-25 | Lg电子株式会社 | 编解码设备、存储介质和数据发送设备 |
| TWI827675B (zh) | 2018-09-12 | 2024-01-01 | 大陸商北京字節跳動網絡技術有限公司 | 交叉分量線性模型中的尺寸相關的下採樣 |
| US11212521B2 (en) * | 2018-11-07 | 2021-12-28 | Avago Technologies International Sales Pte. Limited | Control of memory bandwidth consumption of affine mode in versatile video coding |
| US11729376B2 (en) | 2018-11-27 | 2023-08-15 | Apple Inc. | Method for encoding/decoding video signal and apparatus therefor |
| CN116456082A (zh) * | 2018-12-25 | 2023-07-18 | Oppo广东移动通信有限公司 | 编码预测方法、装置及计算机存储介质 |
| CN113366836B (zh) * | 2019-01-11 | 2025-01-17 | 北京字节跳动网络技术有限公司 | 尺寸相关的跨分量线性模型 |
| KR20250024109A (ko) * | 2019-01-13 | 2025-02-18 | 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 | Mrl 기반 인트라 예측을 수행하는 영상 코딩 방법 및 장치 |
| KR20250119668A (ko) | 2019-01-14 | 2025-08-07 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
| CN118118657A (zh) * | 2019-03-13 | 2024-05-31 | Lg 电子株式会社 | 基于dmvr的帧间预测方法和设备 |
| US11962796B2 (en) * | 2019-04-01 | 2024-04-16 | Qualcomm Incorporated | Gradient-based prediction refinement for video coding |
| US11317088B2 (en) * | 2019-05-17 | 2022-04-26 | Qualcomm Incorporated | Gradient-based prediction refinement for video coding |
| EP3963884A4 (en) | 2019-05-21 | 2022-08-10 | Huawei Technologies Co., Ltd. | METHOD AND APPARATUS FOR LOCAL ILLUMINATION COMPENSATION FOR INTER PREDICTION |
| WO2021054691A1 (ko) * | 2019-09-20 | 2021-03-25 | 엘지전자 주식회사 | 변환에 기반한 영상 코딩 방법 및 그 장치 |
| CN113891075B (zh) * | 2020-07-03 | 2023-02-28 | 杭州海康威视数字技术股份有限公司 | 滤波处理方法及装置 |
| CN115988206B (zh) * | 2023-03-21 | 2024-03-26 | 深圳传音控股股份有限公司 | 图像处理方法、处理设备及存储介质 |
| US20240372983A1 (en) * | 2023-05-04 | 2024-11-07 | Tencent America LLC | Systems and methods for smooth mode predictions |
| US12477116B2 (en) | 2023-05-17 | 2025-11-18 | Tencent America LLC | Systems and methods for angular intra mode coding |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012102929A1 (en) | 2011-01-28 | 2012-08-02 | Qualcomm Incorporated | Pixel level adaptive intra-smoothing |
| JP2014064249A (ja) | 2012-09-24 | 2014-04-10 | Ntt Docomo Inc | 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 |
| JP2014512129A (ja) | 2011-04-01 | 2014-05-19 | アイベックス・ピイティ・ホールディングス・カンパニー・リミテッド | イントラ予測モードにおける映像復号化方法 |
| JP2015008359A (ja) | 2013-06-24 | 2015-01-15 | ソニー株式会社 | 画像符号化装置および方法、並びに、画像復号装置および方法 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7170937B2 (en) * | 2002-05-01 | 2007-01-30 | Texas Instruments Incorporated | Complexity-scalable intra-frame prediction technique |
| US20030231795A1 (en) * | 2002-06-12 | 2003-12-18 | Nokia Corporation | Spatial prediction based intra-coding |
| US7830960B2 (en) * | 2005-01-13 | 2010-11-09 | Qualcomm Incorporated | Mode selection techniques for intra-prediction video encoding |
| US8571309B2 (en) * | 2011-11-15 | 2013-10-29 | At&T Intellectual Property I, L.P. | System and method of image upsampling |
| US9906790B2 (en) * | 2014-03-14 | 2018-02-27 | Qualcomm Incorporated | Deblock filtering using pixel distance |
| US10425648B2 (en) * | 2015-09-29 | 2019-09-24 | Qualcomm Incorporated | Video intra-prediction using position-dependent prediction combination for video coding |
| WO2017090993A1 (ko) * | 2015-11-24 | 2017-06-01 | 삼성전자 주식회사 | 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치 |
| JP2017143943A (ja) * | 2016-02-16 | 2017-08-24 | 富士フイルム株式会社 | 放射線画像処理装置、方法およびプログラム |
-
2018
- 2018-03-06 JP JP2018039640A patent/JP7036628B2/ja active Active
- 2018-03-08 US US15/915,588 patent/US10848760B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012102929A1 (en) | 2011-01-28 | 2012-08-02 | Qualcomm Incorporated | Pixel level adaptive intra-smoothing |
| JP2014512129A (ja) | 2011-04-01 | 2014-05-19 | アイベックス・ピイティ・ホールディングス・カンパニー・リミテッド | イントラ予測モードにおける映像復号化方法 |
| JP2014064249A (ja) | 2012-09-24 | 2014-04-10 | Ntt Docomo Inc | 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 |
| JP2015008359A (ja) | 2013-06-24 | 2015-01-15 | ソニー株式会社 | 画像符号化装置および方法、並びに、画像復号装置および方法 |
Non-Patent Citations (1)
| Title |
|---|
| Jacob Strom, et al.,Bilateral Filter After Inverse Transform,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-D0069,4th Meeting: Chengdu, CN,2016年10月,pp.1-5 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20200267381A1 (en) * | 2017-11-01 | 2020-08-20 | Vid Scale, Inc. | Methods for simplifying adaptive loop filter in video coding |
| US11641488B2 (en) * | 2017-11-01 | 2023-05-02 | Vid Scale, Inc. | Methods for simplifying adaptive loop filter in video coding |
| US12348787B2 (en) | 2017-11-01 | 2025-07-01 | Interdigital Vc Holdings, Inc. | Methods for simplifying adaptive loop filter in video coding |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018152852A (ja) | 2018-09-27 |
| US20180316918A1 (en) | 2018-11-01 |
| US10848760B2 (en) | 2020-11-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7036628B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| JP7086240B2 (ja) | 画像復号装置及び復号方法 | |
| JP7568875B2 (ja) | 符号化装置、復号装置及び非一時的記憶媒体 | |
| JP7014881B2 (ja) | 符号化装置及び符号化方法 | |
| JP7712431B2 (ja) | 符号化装置及び復号装置 | |
| JP7553686B2 (ja) | 符号化装置、復号装置、符号化方法、及び復号方法 | |
| JP6857716B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| WO2018199051A1 (ja) | 符号化装置、復号装置、符号化方法および復号方法 | |
| JP2022008413A (ja) | 復号装置、符号化装置及び記録媒体 | |
| JP7001822B2 (ja) | 復号装置及び復号方法 | |
| JP7681757B2 (ja) | 符号化装置及び復号装置 | |
| JP7017580B2 (ja) | 復号装置、画像復号装置及び復号方法 | |
| JP7086176B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| JP7026747B2 (ja) | 復号装置及び復号方法 | |
| WO2019138998A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| WO2019163794A1 (ja) | 符号化装置及び符号化方法 | |
| JP6767579B2 (ja) | 符号化装置、符号化方法、復号装置及び復号方法 | |
| WO2018097117A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| WO2019163795A1 (ja) | 符号化装置及び符号化方法 | |
| WO2019088162A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| WO2019098092A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
| JP6798066B2 (ja) | 符号化装置、復号装置、符号化方法、復号方法及びピクチャ圧縮プログラム | |
| WO2019021947A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220202 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220303 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7036628 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |





