JP2020198463A - 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 - Google Patents
符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 Download PDFInfo
- Publication number
- JP2020198463A JP2020198463A JP2019101629A JP2019101629A JP2020198463A JP 2020198463 A JP2020198463 A JP 2020198463A JP 2019101629 A JP2019101629 A JP 2019101629A JP 2019101629 A JP2019101629 A JP 2019101629A JP 2020198463 A JP2020198463 A JP 2020198463A
- Authority
- JP
- Japan
- Prior art keywords
- image
- quantization
- learning
- generated
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000013139 quantization Methods 0.000 claims abstract description 181
- 238000012545 processing Methods 0.000 claims abstract description 94
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 65
- 238000001914 filtration Methods 0.000 claims description 23
- 238000013459 approach Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 230000000052 comparative effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000013500 data storage Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化するコンピュータに、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、処理を実行させる。
<画像処理システムのシステム構成>
はじめに、画像処理システムのシステム構成について説明する。図1は、画像処理システムのシステム構成の一例を示す図である。図1に示すように、画像処理システム100は、学習装置110と、符号化装置120と、復号装置130とを有する。
次に、学習装置110、符号化装置120、復号装置130の各装置のハードウェア構成について説明する。なお、本実施形態において、学習装置110、符号化装置120、復号装置130の各装置は、同様のハードウェア構成を有しているものとする。
次に、学習装置110の詳細について説明する。
はじめに、学習装置における学習用データ生成部111の機能構成、及び、学習用データ生成部111により生成される学習用データの詳細について説明する。図3は、学習装置における学習用データ生成部の機能構成及び生成した学習用データの一例を示す図である。
・デブロッキングフィルタ(Deblocking filter:DB)、
・サンプルアダプティブオフセットフィルタ(Sample Adaptive Offset filter:SAO)、
・適応ループフィルタ(Adaptive loop filter:ALF)、
が含まれる。
次に、学習装置における学習部112の機能構成について説明する。図4は、学習装置における学習部の機能構成の一例を示す図である。図4に示すように、学習部112は、CNNF410と、加算部411と、比較/変更部412とを有する。
・量子化パラメータ、
・逆直交変換部より出力された信号、
・予測画像、
と、
・参照画像と学習用の入力画像との差分
との対応関係を学習し、学習済みCNNFを生成する。
次に、学習装置110による学習処理の流れについて説明する。図5は、学習装置による学習処理の流れを示すフローチャートである。
次に、符号化装置120の詳細について説明する。
はじめに、符号化装置120における符号化部122の機能構成の詳細について説明する。図6は、符号化装置における符号化部の機能構成の一例を示す図である。
・デブロッキングフィルタ(DB)、
・サンプルアダプティブオフセットフィルタ(SAO)、
・適応ループフィルタ(ALF)、
・NNフィルタ部、
が含まれる。
次に、符号化装置120におけるループ内フィルタ部600の機能構成の詳細及びNNフィルタ部の機能構成の詳細について説明する。図7は、符号化装置におけるループ内フィルタ部の機能構成及びNNフィルタ部の機能構成の一例を示す図である。
次に、符号化装置120におけるNNフィルタ部710によるフィルタ処理の流れについて説明する。図8は、符号化装置におけるNNフィルタ部によるフィルタ処理の流れを示すフローチャートである。
次に、上記符号化装置120における符号化部122の機能構成を、比較例の符号化装置の機能構成と対比することで、上記符号化装置120の特徴を明確にする。なお、ここでいう、比較例の符号化装置とは、ループ内フィルタ部として、参照画像に含まれる符号化歪みを推論するAIフィルタ(参照画像を入力として学習したAIフィルタ)を適用した符号化装置を指すものとする。
図9は、比較例の符号化装置における符号化部の機能構成の一例を示す図である。比較例の符号化装置における符号化部900の場合、ループ内フィルタ部910に含まれるNNフィルタ部は、量子化パラメータ及び参照画像と、符号化歪みとの対応関係を学習することで生成された学習済みCNNFを有している。
次に、比較例の符号化装置におけるループ内フィルタ部910の機能構成の詳細及びNNフィルタ部の機能構成の詳細について説明する。図10は、比較例の符号化装置におけるループ内フィルタ部の機能構成及びNNフィルタ部の機能構成の一例を示す図である。
次に、符号化装置120と、比較例の符号化装置との機能構成の違いに伴う効果の違いについて図11及び図12を用いて説明する。図11は、比較例の符号化装置における量子化誤差及び予測誤差を示す図である。
次に、復号装置130の詳細について説明する。
はじめに、復号装置130における復号部132の機能構成の詳細について説明する。図13は、復号装置における復号部の機能構成の一例を示す図である。
・デブロッキングフィルタ、
・サンプルアダプティブオフセットフィルタ、
・適応ループフィルタ、
・NNフィルタ部、
が含まれる。なお、NNフィルタ部には、学習装置110より通知された学習済みCNNF(あるいは、符号化装置120により送信されていた場合にあっては、エントロピ復号部1310より通知された学習済みCNNF)が含まれる。
・予測画像と予測残差信号とを加算することで生成される参照画像を取得する、あるいは、
・逆直交変換部1312より出力された予測残差信号と、画面内予測部1313または動き補償部1314により生成された予測画像と、エントロピ復号部1310より通知された量子化パラメータとを、それぞれ取得する。
次に、復号装置130におけるループ内フィルタ部1315の機能構成の詳細及びNNフィルタ部の機能構成の詳細について説明する。図14は、復号装置におけるループ内フィルタ部の機能構成及びNNフィルタ部の機能構成の一例を示す図である。
次に、復号装置130におけるNNフィルタ部1410によるフィルタ処理の流れについて説明する。図15は、復号装置におけるNNフィルタ部によるフィルタ処理の流れを示すフローチャートである。
(付記1)
画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化するコンピュータに、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理を実行させるための符号化プログラム。
(付記2)
前記量子化処理において生じる量子化誤差を含む信号とは、前記量子化処理を行った結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られる信号であり、
前記予測誤差を含む画像とは、前記画面内予測または画面間予測により生成される前記予測画像である、
付記1に記載の符号化プログラム。
(付記3)
前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを加算することで参照画像を生成し、
前記フィルタ部に、取得した前記量子化パラメータと、前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを分けて入力することで推論された符号化歪みを、生成した前記参照画像に加算することで、フィルタ処理後の第1の参照画像を出力する、
付記2に記載の符号化プログラム。
(付記4)
生成した前記参照画像を他のフィルタ部に入力することで、フィルタ処理後の第2の参照画像を出力し、
フィルタ処理後の前記第1の参照画像とフィルタ処理後の前記第2の参照画像のうち、レート歪みの小さいいずれか一方を、フィルタ処理後の最終的な参照画像として出力する、
付記3に記載の符号化プログラム。
(付記5)
前記フィルタ部は、学習用の入力画像を符号化する際に取得される学習用データを用いて学習することで生成される、付記4に記載の符号化プログラム。
(付記6)
前記学習用データには、
画面内予測または画面間予測により生成された予測画像と、
該予測画像と学習用の入力画像との差分から算出した予測残差に対して、直交変換処理及び量子化処理を行った際に用いた量子化パラメータと、
該量子化処理の結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、
前記学習用の入力画像と、
が含まれる付記5に記載の符号化プログラム。
(付記7)
前記フィルタ部は、前記学習用データに含まれる前記予測画像と、前記量子化パラメータと、前記信号とを入力した際の出力に、該予測画像と該信号とを加算した加算結果が、前記学習用データに含まれる前記学習用の入力画像に近づくように学習することで生成される、付記6に記載の符号化プログラム。
(付記8)
符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号するコンピュータに、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理を実行させるための復号プログラム。
(付記9)
前記量子化誤差を含む信号とは、前記量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号であり、
前記予測誤差を含む画像とは、前記画面内予測または動き補償により生成される前記予測画像である、
付記8に記載の復号プログラム。
(付記10)
前記逆直交変換処理を行うことで得られた信号と、前記予測画像とを加算することで参照画像を生成し、
前記フィルタ部に、取得した前記量子化パラメータと、前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを分けて入力することで推論された符号化歪みを、生成した前記参照画像に加算することで、フィルタ処理後の第1の参照画像を出力し、前記符号化データを復号する、
付記9に記載の復号プログラム。
(付記11)
前記フィルタ部は、学習用の入力画像を符号化する際に取得される学習用データを用いて学習することで生成される、付記10に記載の復号プログラム。
(付記12)
前記学習用データには、
画面内予測または画面間予測により生成された予測画像と、
該予測画像と学習用の入力画像との差分から算出した予測残差に対して、直交変換処理及び量子化処理を行った際に用いた量子化パラメータと、
該量子化処理の結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、
前記学習用の入力画像と、
が含まれる付記11に記載の復号プログラム。
(付記13)
前記フィルタ部は、前記学習用データに含まれる前記予測画像と、前記量子化パラメータと、前記信号とを入力した際の出力に、該予測画像と該信号とを加算した加算結果が、前記学習用データに含まれる前記学習用の入力画像に近づくように学習することで生成される、付記12に記載の復号プログラム。
(付記14)
画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化する符号化装置であって、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得する第1の取得部と、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する第2の取得部と
を有する符号化装置。
(付記15)
符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号する復号装置であって、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得する第1の取得部と、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する第2の取得部と
を有する復号装置。
(付記16)
画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化する符号化方法であって、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理をコンピュータが実行する符号化方法。
(付記17)
符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号する復号方法であって、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理をコンピュータが実行する復号方法。
111 :学習用データ生成部
112 :学習部
120 :符号化装置
121 :画像データ取得部
122 :符号化部
123 :符号化データ出力部
130 :復号装置
131 :符号化データ入力部
132 :復号部
133 :画像データ出力部
310 :直交変換部
311 :量子化部
312 :エントロピ符号化部
313 :逆量子化部
314 :逆直交変換部
315 :バッファ部
316 :ループ内フィルタ部
317 :フレームバッファ部
318 :画面内予測部
319 :画面間予測部
320 :学習用データ
410 :CNNF
600 :ループ内フィルタ部
710 :NNフィルタ部
730 :学習済みCNNF
1310 :エントロピ復号部
1311 :逆量子化部
1312 :逆直交変換部
1313 :画面内予測部
1314 :動き補償部
1315 :ループ内フィルタ部
1316 :フレームバッファ部
1410 :NNフィルタ部
Claims (17)
- 画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化するコンピュータに、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理を実行させるための符号化プログラム。 - 前記量子化処理において生じる量子化誤差を含む信号とは、前記量子化処理を行った結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られる信号であり、
前記予測誤差を含む画像とは、前記画面内予測または画面間予測により生成される前記予測画像である、
請求項1に記載の符号化プログラム。 - 前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを加算することで参照画像を生成し、
前記フィルタ部に、取得した前記量子化パラメータと、前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを分けて入力することで推論された符号化歪みを、生成した前記参照画像に加算することで、フィルタ処理後の第1の参照画像を出力する、
請求項2に記載の符号化プログラム。 - 生成した前記参照画像を他のフィルタ部に入力することで、フィルタ処理後の第2の参照画像を出力し、
フィルタ処理後の前記第1の参照画像とフィルタ処理後の前記第2の参照画像のうち、レート歪みの小さいいずれか一方を、フィルタ処理後の最終的な参照画像として出力する、
請求項3に記載の符号化プログラム。 - 前記フィルタ部は、学習用の入力画像を符号化する際に取得される学習用データを用いて学習することで生成される、請求項4に記載の符号化プログラム。
- 前記学習用データには、
画面内予測または画面間予測により生成された予測画像と、
該予測画像と学習用の入力画像との差分から算出した予測残差に対して、直交変換処理及び量子化処理を行った際に用いた量子化パラメータと、
該量子化処理の結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、
前記学習用の入力画像と、
が含まれる請求項5に記載の符号化プログラム。 - 前記フィルタ部は、前記学習用データに含まれる前記予測画像と、前記量子化パラメータと、前記信号とを入力した際の出力に、該予測画像と該信号とを加算した加算結果が、前記学習用データに含まれる前記学習用の入力画像に近づくように学習することで生成される、請求項6に記載の符号化プログラム。
- 符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号するコンピュータに、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理を実行させるための復号プログラム。 - 前記量子化誤差を含む信号とは、前記量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号であり、
前記予測誤差を含む画像とは、前記画面内予測または動き補償により生成される前記予測画像である、
請求項8に記載の復号プログラム。 - 前記逆直交変換処理を行うことで得られた信号と、前記予測画像とを加算することで参照画像を生成し、
前記フィルタ部に、取得した前記量子化パラメータと、前記逆直交変換処理を行うことで得られる信号と、前記予測画像とを分けて入力することで推論された符号化歪みを、生成した前記参照画像に加算することで、フィルタ処理後の第1の参照画像を出力し、前記符号化データを復号する、
請求項9に記載の復号プログラム。 - 前記フィルタ部は、学習用の入力画像を符号化する際に取得される学習用データを用いて学習することで生成される、請求項10に記載の復号プログラム。
- 前記学習用データには、
画面内予測または画面間予測により生成された予測画像と、
該予測画像と学習用の入力画像との差分から算出した予測残差に対して、直交変換処理及び量子化処理を行った際に用いた量子化パラメータと、
該量子化処理の結果に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、
前記学習用の入力画像と、
が含まれる請求項11に記載の復号プログラム。 - 前記フィルタ部は、前記学習用データに含まれる前記予測画像と、前記量子化パラメータと、前記信号とを入力した際の出力に、該予測画像と該信号とを加算した加算結果が、前記学習用データに含まれる前記学習用の入力画像に近づくように学習することで生成される、請求項12に記載の復号プログラム。
- 画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化する符号化装置であって、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得する第1の取得部と、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する第2の取得部と
を有する符号化装置。 - 符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号する復号装置であって、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得する第1の取得部と、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する第2の取得部と
を有する復号装置。 - 画面内予測または画面間予測により生成された予測画像と処理対象の入力画像との差分から予測残差を算出し、算出した予測残差に対して直交変換処理及び量子化処理を行った後、エントロピ符号化処理を行うことで、前記処理対象の入力画像を符号化する符号化方法であって、
前記処理対象の入力画像を符号化する際、前記量子化処理において用いられた量子化パラメータと、前記量子化処理において生じる量子化誤差を含む信号と、前記画面内予測または画面間予測において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理をコンピュータが実行する符号化方法。 - 符号化データをエントロピ復号した量子化信号に対して、逆量子化処理及び逆直交変換処理を行うことで得られた信号と、画面内予測または動き補償を行うことで得られた予測画像とを加算し、フィルタ処理を行うことで、前記符号化データを復号する復号方法であって、
前記符号化データを復号する際、量子化パラメータと、量子化誤差を含む信号と、前記画面内予測または動き補償において生じる予測誤差を含む画像とをそれぞれ取得し、
学習用の入力画像を符号化する際に生じた符号化歪みを学習したフィルタ部に、取得した前記量子化パラメータと、前記量子化誤差を含む信号と、前記予測誤差を含む画像とを分けて入力することで、前記フィルタ部により推論された符号化歪みを取得する、
処理をコンピュータが実行する復号方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101629A JP7318314B2 (ja) | 2019-05-30 | 2019-05-30 | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 |
US16/857,225 US11128873B2 (en) | 2019-05-30 | 2020-04-24 | Storage medium, encoding device, decoding device, encoding method, and decoding method |
EP20172404.4A EP3745720A1 (en) | 2019-05-30 | 2020-04-30 | Video coding with in-loop neural network filter to improve the reconstructed reference image |
CN202010402038.7A CN112019843B (zh) | 2019-05-30 | 2020-05-13 | 编码和解码方法、设备、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101629A JP7318314B2 (ja) | 2019-05-30 | 2019-05-30 | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020198463A true JP2020198463A (ja) | 2020-12-10 |
JP7318314B2 JP7318314B2 (ja) | 2023-08-01 |
Family
ID=70482381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019101629A Active JP7318314B2 (ja) | 2019-05-30 | 2019-05-30 | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11128873B2 (ja) |
EP (1) | EP3745720A1 (ja) |
JP (1) | JP7318314B2 (ja) |
CN (1) | CN112019843B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7475842B2 (ja) | 2019-11-26 | 2024-04-30 | キヤノン株式会社 | 画像復号装置、制御方法、およびプログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114868390A (zh) * | 2020-12-04 | 2022-08-05 | 深圳市大疆创新科技有限公司 | 视频编码方法、解码方法、编码器、解码器以及ai加速器 |
WO2023014065A1 (ko) * | 2021-08-06 | 2023-02-09 | 삼성전자 주식회사 | 영상에 대한 ai 기반 필터링을 위한 장치 및 방법 |
EP4383708A1 (en) * | 2021-08-06 | 2024-06-12 | Samsung Electronics Co., Ltd. | Device and method for ai-based filtering of image |
WO2023051654A1 (en) * | 2021-09-29 | 2023-04-06 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019072097A1 (en) * | 2017-10-12 | 2019-04-18 | Mediatek Inc. | VIDEO ENCODING METHOD USING NEURAL NETWORK |
US20190124348A1 (en) * | 2017-10-19 | 2019-04-25 | Samsung Electronics Co., Ltd. | Image encoder using machine learning and data processing method of the image encoder |
WO2019087905A1 (ja) * | 2017-10-31 | 2019-05-09 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、および画像符号化装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013223050A (ja) | 2012-04-13 | 2013-10-28 | Sharp Corp | フィルタ装置、復号装置、および符号化装置 |
US10321128B2 (en) * | 2015-02-06 | 2019-06-11 | Sony Corporation | Image encoding apparatus and image encoding method |
CN107736027B (zh) | 2015-06-12 | 2021-06-01 | 松下知识产权经营株式会社 | 图像编码方法、图像解码方法、图像编码装置及图像解码装置 |
KR102124714B1 (ko) * | 2015-09-03 | 2020-06-19 | 미디어텍 인크. | 비디오 코딩에서의 신경망 기반 프로세싱의 방법 및 장치 |
WO2017222140A1 (ko) * | 2016-06-24 | 2017-12-28 | 한국과학기술원 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
KR101974261B1 (ko) | 2016-06-24 | 2019-04-30 | 한국과학기술원 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
CN107197260B (zh) * | 2017-06-12 | 2019-09-13 | 清华大学深圳研究生院 | 基于卷积神经网络的视频编码后置滤波方法 |
JPWO2019039283A1 (ja) * | 2017-08-22 | 2020-10-01 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
-
2019
- 2019-05-30 JP JP2019101629A patent/JP7318314B2/ja active Active
-
2020
- 2020-04-24 US US16/857,225 patent/US11128873B2/en active Active
- 2020-04-30 EP EP20172404.4A patent/EP3745720A1/en active Pending
- 2020-05-13 CN CN202010402038.7A patent/CN112019843B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019072097A1 (en) * | 2017-10-12 | 2019-04-18 | Mediatek Inc. | VIDEO ENCODING METHOD USING NEURAL NETWORK |
US20190124348A1 (en) * | 2017-10-19 | 2019-04-25 | Samsung Electronics Co., Ltd. | Image encoder using machine learning and data processing method of the image encoder |
WO2019087905A1 (ja) * | 2017-10-31 | 2019-05-09 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、および画像符号化装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7475842B2 (ja) | 2019-11-26 | 2024-04-30 | キヤノン株式会社 | 画像復号装置、制御方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7318314B2 (ja) | 2023-08-01 |
EP3745720A1 (en) | 2020-12-02 |
CN112019843A (zh) | 2020-12-01 |
US20200382794A1 (en) | 2020-12-03 |
US11128873B2 (en) | 2021-09-21 |
CN112019843B (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11694125B2 (en) | Image encoder using machine learning and data processing method of the image encoder | |
US10798421B2 (en) | Method for encoding and decoding image information | |
JP2020198463A (ja) | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 | |
US11902575B2 (en) | Image encoding method using a skip mode, and a device using the method | |
US8929450B2 (en) | Temporal block merge mode | |
US9066104B2 (en) | Spatial block merge mode | |
US9414086B2 (en) | Partial frame utilization in video codecs | |
TW201739260A (zh) | 視訊編碼中限制塊尺寸的視訊資料處理方法與裝置 | |
US20210037237A1 (en) | Video Processing Methods and Apparatuses for Processing Video Data Coded in Large Size Coding Units | |
TWI770681B (zh) | 視訊編碼或解碼系統中的視訊處理方法和裝置 | |
US11997259B2 (en) | Methods for encoding and decoding pictures and associated apparatus | |
KR20220009473A (ko) | 영상의 부호화/복호화 방법 및 장치 | |
US7702017B2 (en) | Moving picture encoding apparatus, moving picture encoding method, moving picture encoding program, moving picture decoding apparatus, moving picture decoding method, and moving picture decoding program | |
US11785221B2 (en) | Encoding and decoding method, apparatus and communication system | |
US10212436B2 (en) | Image encoding apparatus, image decoding apparatus and image transmission method | |
US20240089440A1 (en) | Image decoding device, method, and non-transitory computer-readable storage medium | |
US12015773B2 (en) | Image encoding apparatus, image encoding method, image decoding apparatus, image decoding method, and non-transitory computer-readable storage medium | |
US11973964B2 (en) | Video compression based on long range end-to-end deep learning | |
WO2021263251A1 (en) | State transition for dependent quantization in video coding | |
US10375392B2 (en) | Video encoding apparatus, video encoding method, video decoding apparatus, and video decoding method | |
US10992942B2 (en) | Coding method, decoding method, and coding device | |
WO2024077576A1 (zh) | 基于神经网络的环路滤波、视频编解码方法、装置和系统 | |
US20230007311A1 (en) | Image encoding device, image encoding method and storage medium, image decoding device, and image decoding method and storage medium | |
JP6270472B2 (ja) | 画像符号化装置、画像符号化方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7318314 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |