JP2019525544A - Cnn基盤インループフィルタを含む符号化方法と装置及び復号化方法と装置 - Google Patents
Cnn基盤インループフィルタを含む符号化方法と装置及び復号化方法と装置 Download PDFInfo
- Publication number
- JP2019525544A JP2019525544A JP2018567746A JP2018567746A JP2019525544A JP 2019525544 A JP2019525544 A JP 2019525544A JP 2018567746 A JP2018567746 A JP 2018567746A JP 2018567746 A JP2018567746 A JP 2018567746A JP 2019525544 A JP2019525544 A JP 2019525544A
- Authority
- JP
- Japan
- Prior art keywords
- information
- loop filter
- filtering
- cnn
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 55
- 238000001914 filtration Methods 0.000 claims abstract description 183
- 238000013139 quantization Methods 0.000 claims description 133
- 230000003044 adaptive effect Effects 0.000 claims description 44
- 230000009466 transformation Effects 0.000 claims description 19
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 description 172
- 238000012549 training Methods 0.000 description 39
- 238000010586 diagram Methods 0.000 description 30
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000282376 Panthera tigris Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
Description
前記復元情報は、前記オリジナル映像のような形式であり、前記CNN基盤インループフィルタは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成し得る。
前記装置は、前記予測情報にインループフィルタリングを行うインループフィルタをさらに含み得る。
行う。変換及び量子化部120は、量子化パラメータ(quantization parameter(QP)による量子化区間、映像信号の特性による歪曲値区間、映像信号特性によるテクスチャ複雑度区間、及び映像信号特性による動き複雑度区間のうち少なくとも1つ以上に基づいて、残差映像eにフィルタリングを行う。映像信号は残差ブロックeを含む。
テキスト適応可変長コーディング(CAVLC)、コンテキスト適応2進算術コーディング(CABAC)、又は構文基盤コンテキスト適応2進算術コーディング(SBAC)などの符号化方式を用いてエントロピー符号化を行うことができる。
エントロピー符号化部130は、エントロピー符号化を行って符号化データをビットストリームに出力する。符号化データは、量子化パラメータを符号化したビットストリームと符号化されたビットストリームを復号化するために必要な様々な情報を含む。また、符号化データは、符号化されたブロックの形態、量子化パラメータ、量子化ブロックが符号化されたビットストリーム、及び予測に必要な情報などを含んでもよい。
部140は、変換及び量子化部120の動作を逆に行う。例えば、逆量子化及び逆
化及び逆変換部140は、変換及び量子化部120の変換構造及び量子化構造を反対に構成してもよい。
また、逆量子化及び逆変換部140が逆量子化及び逆変換を行うものと図示して
てもよい。
インループフィルタ145が3つのフィルタを含んでいる場合、インループフィルタ145は、デブロックフィルタ(DF)、サンプル適応型オフセットフィルタ(SAO filter)、及び適応型ループフィルタ(ALF)を含むものとして具現されてもよい。
サンプル適応型オフセットフィルタ(SAO filter)は、符号化ブロック単位でリンギングアーティファクト(ringing artefact)や画素値区間の歪曲を修正する。サンプル適応型オフセットフィルタ(SAO fil
クセルブロックfに対して差値をオフセットに復元し得る。
図5を参照すると、符号化装置100は、変換及び量子化部120、エントロピー符号化部130、逆量子化及び逆変換部140、インループフィルタ145、CNN基盤インループフィルタ150d、復号化ピクチャーバッファ160、予測部170、及び複数の加算器を含む。
送信する。
図9に示されたエントロピー復号化部210、逆量子化及び逆変換部220、符号化ピクチャーバッファ240、予測部250、及び加算器は、図8Aに示された復号化部210、逆量子化及び逆変換部220、符号化ピクチャーバッファ240、予測部250、及び加算器と構成及び動作が実質的に同一である。ここで、以下は、インループフィルタ225及びCNN基盤インループフィルタ230bについて説明する。
第1畳み込みレイヤ152−1は数式(1)に対応する。
出力レイヤ153は数式(4)に対応する。
損失関数は数式(5)に対応する。
符号化装置100で符号化時に使用された歪曲値区間は、復号化装置200で確認できる値であり、符号化装置100は、符号化時に使用されたインデックスを復号化装置200に送信しなくてもよい。ここで、符号化装置100はオーバーヘッドが発生せず、符号化の効率を高めることができる。
入力訓練映像600は残差映像であってもよい。残差映像は、入力映像と復元映像を差分した映像である。復元映像は、インループフィルタリングが適用された映像であるか、又はインループフィルタリングが適用されていない映像である。
すなわち、CNN基盤インループフィルタ150は、残差映像にフィルタリングを行って残差映像に近い出力映像を生成し得る。この場合、CNN基盤インループフィルタ150は、図6に示されたCNN基盤インループフィルタ150eとして動作し得る。
例えば、予測スライスの映像800−2は、イントラスライスの映像800−1を参照して映像を予測する。予測スライスの映像800−3は、イントラスライスの映像700−1及び予測スライスの映像800−2を参照して映像を予測する。同じ原理で、予測スライスの映像800−5及び800−7は、以前のスライスの映像を参照して映像を予測する。
CNN基盤インループフィルタ150は、低い遅延構造下で選択的にフィルタリングを適用するだけではなく、一連の各入力スライスごとに、また、入力スライス内で符号化単位ブロックごとに(CTU)、又は符号化ブロックごとに(CU)、又は指定された映像領域ごとに選択的に適用し得る。
Claims (30)
- オリジナル映像と予測映像との間の差に該当する残差映像をフィルタリングすることによってフィルタリング情報を生成するステップと、
前記フィルタリング情報を逆フィルタリングすることによって逆フィルタリング情報を生成するステップと、
前記逆フィルタリング情報をCNN基盤インループフィルタに入力することによって復元情報を生成するステップと、
前記復元情報と前記オリジナル映像に基づいたオリジナル情報の差を算出するステップと、
前記差に基づいて前記CNN基盤インループフィルタの加重値を補正するステップと、
を含み、
前記予測映像は、前記オリジナル映像と前記復元情報に基づいて生成される、
CNN基盤インループフィルタ学習方法。 - 前記フィルタリング情報を生成するステップは、
前記残差映像を変換及び量子化することによってフィルタリング情報を生成するステップを含み、
前記逆フィルタリング情報を生成するステップは、前記フィルタリング情報を逆量子化及び逆変換することによって逆フィルタリング情報を生成するステップを含む、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記フィルタリング情報を生成するステップは、量子化パラメータによる量子化区間に基づいて前記残差映像をフィルタリングするステップを含み、
前記補正するステップは、前記量子化区間に対する加重値を補正するステップを含む、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記フィルタリング情報を生成するステップは、歪曲値による歪曲値区間に基づいて前記残差映像をフィルタリングするステップを含み、
前記補正するステップは、前記歪曲値区間に対する加重値を補正するステップを含む、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記フィルタリング情報を生成するステップは、映像特性のテクスチャ複雑度区間に基づいて前記残差映像をフィルタリングするステップを含み、
前記補正するステップは、前記テクスチャ複雑度区間に対する加重値を補正するステップを含む、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記フィルタリング情報を生成するステップは、映像特性の動き複雑度区間に基づいて前記残差映像をフィルタリングするステップを含み、
前記補正するステップは、前記動き複雑度区間に対する加重値を補正するステップを含む、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記復元情報を生成するステップは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成するステップを含み、
前記復元情報は、前記オリジナル映像のような形式である、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成するステップは、前記予測情報にインループフィルタリングを行うステップを含む、請求項7に記載のCNN基盤インループフィルタ学習方法。
- 前記復元情報を生成するステップは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成するステップを含み、
前記復元情報は、前記残差映像のような形式である、請求項1に記載のCNN基盤インループフィルタ学習方法。 - 前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成するステップは、前記予測情報にインループフィルタリングを行うステップを含む、請求項9に記載のCNN基盤インループフィルタ学習方法。
- オリジナル映像と予測映像との間の差に該当する残差映像をフィルタリングすることによってフィルタリング情報を生成するフィルタリング部と、
前記フィルタリング情報を逆フィルタリングすることによって逆フィルタリング情報を生成する逆フィルタリング部と、
前記オリジナル映像と復元情報に基づいて前記予測映像を生成する予測部と、
前記逆フィルタリング情報と前記予測映像が入力されて前記復元情報を出力するCNN基盤インループフィルタと、
前記フィルタリング情報と前記予測映像の情報に基づいて符号化を行う符号化部と、
を含む符号化装置。 - 前記フィルタリング部は、前記残差映像を変換及び量子化することによってフィルタリング情報を生成し、
前記逆フィルタリング部は、前記フィルタリング情報を逆量子化及び逆変換することによって逆フィルタリング情報を生成する、請求項11に記載の符号化装置。 - 前記復元情報は、前記オリジナル映像のような形式であり、
前記CNN基盤インループフィルタは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成する、請求項11に記載の符号化装置。 - 前記予測情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項13に記載の符号化装置。
- 前記インループフィルタは、デブロックフィルタ(deblocking filter(DF))、サンプル適応型オフセットフィルタ(sample adaptive offset(SAO)filter)、及び適応型ループフィルタ(adaptive loop filter(ALF))のうち少なくとも1つを含む、請求項14に記載の符号化装置。
- 前記復元情報は、前記残差映像のような形式であり、
前記CNN基盤インループフィルタは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成する、請求項11に記載の符号化装置。 - 前記予測情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項16に記載の符号化装置。
- 前記復元情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項11に記載の符号化装置。
- 符号化されたビットストリーム情報に復号化を行ってフィルタリング情報と予備予測情報を出力するエントロピー復号化部と、
前記フィルタリング情報を逆フィルタリングすることによって逆フィルタリング情報を生成する逆フィルタリング部と、
前記予備予測情報に基づいて予測映像を生成する予測部と、
前記逆フィルタリング情報と前記予測映像が入力されて復元情報を出力するCNN基盤インループフィルタと、
を含む、復号化装置。 - 前記復元情報は、前記オリジナル映像のような形式であり、
前記CNN基盤インループフィルタは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成する、請求項19に記載の復号化装置。 - 前記逆フィルタリング情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項20に記載の復号化装置。
- 前記インループフィルタは、デブロックフィルタ(DF)、サンプル適応型オフセットフィルタ(SAO filter)、及び適応型ループフィルタ(ALF)のうち少なくとも1つを含む、請求項21に記載の復号化装置。
- 前記復元情報は、前記残差映像のような形式であり、
前記CNN基盤インループフィルタは、前記逆フィルタリング情報及び前記予測映像に基づいた予測情報を前記CNN基盤インループフィルタに入力することによって復元情報を生成する、請求項19に記載の復号化装置。 - 前記復元情報と前記予測映像を加えて最終復元情報を生成する加算器をさらに含む、請求項23に記載の復号化装置。
- 前記逆フィルタリング情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項23に記載の復号化装置。
- 前記インループフィルタは、デブロックフィルタ(DF)、サンプル適応型オフセットフィルタ(SAO filter)、及び適応型ループフィルタ(ALF)のうち少なくとも1つを含む、請求項25に記載の復号化装置。
- 前記復元情報は、前記残差映像のような形式であり、
前記CNN基盤インループフィルタは、前記逆フィルタリング情報を前記CNN基盤インループフィルタに入力することによって残差復元情報を生成する、請求項19に記載の復号化装置。 - 前記残差復元情報と前記予測映像を加えて最終復元情報を生成する加算器をさらに含む、請求項27に記載の復号化装置。
- 前記最終復元情報にインループフィルタリングを行うインループフィルタをさらに含む、請求項28に記載の復号化装置。
- 前記インループフィルタは、デブロックフィルタ(DF)、サンプル適応型オフセットフィルタ(SAO filter)、及び適応型ループフィルタ(ALF)のうち少なくとも1つを含む、請求項29に記載の復号化装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0079240 | 2016-06-24 | ||
KR20160079240 | 2016-06-24 | ||
KR1020170017959A KR101974261B1 (ko) | 2016-06-24 | 2017-02-09 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
KR10-2017-0017959 | 2017-02-09 | ||
PCT/KR2017/001512 WO2017222140A1 (ko) | 2016-06-24 | 2017-02-13 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019525544A true JP2019525544A (ja) | 2019-09-05 |
JP6761490B2 JP6761490B2 (ja) | 2020-09-23 |
Family
ID=60998313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018567746A Active JP6761490B2 (ja) | 2016-06-24 | 2017-02-13 | Cnn基盤インループフィルタを含む符号化方法と装置及び復号化方法と装置 |
Country Status (4)
Country | Link |
---|---|
US (3) | US11095887B2 (ja) |
JP (1) | JP6761490B2 (ja) |
KR (1) | KR101974261B1 (ja) |
CN (1) | CN109644268B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023517349A (ja) * | 2020-12-16 | 2023-04-25 | テンセント・アメリカ・エルエルシー | ビデオコーディング方法及び装置 |
JP7411113B2 (ja) | 2021-01-14 | 2024-01-10 | テンセント・アメリカ・エルエルシー | 品質入力を有するループフィルタのためのマスクされたニューラルネットワークによるモデル共有 |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932697B (zh) * | 2017-05-26 | 2020-01-17 | 杭州海康威视数字技术股份有限公司 | 一种失真图像的去失真方法、装置及电子设备 |
US11190784B2 (en) | 2017-07-06 | 2021-11-30 | Samsung Electronics Co., Ltd. | Method for encoding/decoding image and device therefor |
WO2019008752A1 (ja) * | 2017-07-07 | 2019-01-10 | 三菱電機株式会社 | データ処理装置、データ処理方法および圧縮データ |
US10979718B2 (en) | 2017-09-01 | 2021-04-13 | Apple Inc. | Machine learning video processing systems and methods |
EP3725077A1 (en) * | 2017-12-14 | 2020-10-21 | InterDigital VC Holdings, Inc. | Deep learning based image partitioning for video compression |
WO2019143026A1 (ko) * | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 특징맵 압축을 이용한 이미지 처리 방법 및 장치 |
WO2019143027A1 (ko) * | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 이미지 파이프라인 처리 방법 및 장치 |
AU2018357828A1 (en) * | 2018-01-16 | 2019-08-01 | Korea Advanced Institute Of Science And Technology | Method and apparatus for super-resolution using line unit operation |
KR102017998B1 (ko) | 2018-01-16 | 2019-09-03 | 한국과학기술원 | 이미지 파이프라인 처리 방법 및 장치 |
WO2019143025A1 (ko) * | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 라인 입력 및 출력을 이용한 이미지 처리 방법 및 장치 |
WO2019194425A1 (ko) * | 2018-04-06 | 2019-10-10 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화에 인공 신경망을 적용하는 장치 및 방법 |
US11265540B2 (en) | 2018-02-23 | 2022-03-01 | Sk Telecom Co., Ltd. | Apparatus and method for applying artificial neural network to image encoding or decoding |
US20190289327A1 (en) * | 2018-03-13 | 2019-09-19 | Mediatek Inc. | Method and Apparatus of Loop Filtering for VR360 Videos |
US11393160B2 (en) * | 2018-03-23 | 2022-07-19 | Intel Corporation | Deep geometric model fitting |
WO2019194460A1 (ko) * | 2018-04-01 | 2019-10-10 | 엘지전자 주식회사 | 컨벌루션 뉴럴 네트워크를 이용한 영상 코딩 방법 및 그 장치 |
KR102067340B1 (ko) * | 2018-07-16 | 2020-01-16 | 한국과학기술원 | 유방암 병변 특성에 따른 유방 종괴 생성 방법 및 그 시스템 |
US11720997B2 (en) | 2018-10-19 | 2023-08-08 | Samsung Electronics Co.. Ltd. | Artificial intelligence (AI) encoding device and operating method thereof and AI decoding device and operating method thereof |
WO2020080765A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image |
WO2020080873A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Method and apparatus for streaming data |
KR20200044653A (ko) | 2018-10-19 | 2020-04-29 | 삼성전자주식회사 | 딥 뉴럴 네트워크를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
US11616988B2 (en) | 2018-10-19 | 2023-03-28 | Samsung Electronics Co., Ltd. | Method and device for evaluating subjective quality of video |
WO2020080827A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Ai encoding apparatus and operation method of the same, and ai decoding apparatus and operation method of the same |
KR102525578B1 (ko) | 2018-10-19 | 2023-04-26 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
WO2020080665A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image |
CN111105357B (zh) * | 2018-10-25 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 一种失真图像的去失真方法、装置及电子设备 |
KR102621118B1 (ko) * | 2018-11-01 | 2024-01-04 | 삼성전자주식회사 | 영상 적응적 양자화 테이블을 이용한 영상의 부호화 장치 및 방법 |
KR102013777B1 (ko) | 2018-12-12 | 2019-10-21 | 한국과학기술정보연구원 | 동영상 왜곡 복원 방법 및 이를 적용한 장치 |
KR102192980B1 (ko) * | 2018-12-13 | 2020-12-18 | 주식회사 픽스트리 | 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 |
KR102212442B1 (ko) * | 2018-12-13 | 2021-02-04 | 주식회사 픽스트리 | 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 |
CN109982092B (zh) * | 2019-04-28 | 2022-11-01 | 华侨大学 | 基于多分支循环卷积神经网络的hevc帧间快速方法 |
JP7318314B2 (ja) | 2019-05-30 | 2023-08-01 | 富士通株式会社 | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 |
US11521074B2 (en) * | 2019-05-31 | 2022-12-06 | Carnegie Mellon University | Flexible, lightweight quantized deep neural networks |
US20220277491A1 (en) * | 2019-05-31 | 2022-09-01 | Electronics And Telecommunications Research Institute | Method and device for machine learning-based image compression using global context |
KR20210004702A (ko) * | 2019-07-05 | 2021-01-13 | 삼성전자주식회사 | Ai 프로세서 및 이의 신경망 연산 수행 방법 |
CN112422993B (zh) * | 2019-08-21 | 2021-12-03 | 四川大学 | 一种结合卷积神经网络的hevc视频质量增强方法 |
CN110798690B (zh) * | 2019-08-23 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 视频解码方法、环路滤波模型的训练方法、装置和设备 |
KR102436512B1 (ko) | 2019-10-29 | 2022-08-25 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
KR20210056179A (ko) | 2019-11-08 | 2021-05-18 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
WO2021101243A1 (en) * | 2019-11-20 | 2021-05-27 | Samsung Electronics Co., Ltd. | Apparatus and method for using ai metadata related to image quality |
KR20210074228A (ko) * | 2019-12-11 | 2021-06-21 | 한국전자기술연구원 | 심층 신경망 모델의 부호화/복호화 방법 및 장치 |
US20210264239A1 (en) * | 2020-02-20 | 2021-08-26 | Tencent America LLC | Method and apparatus for neural network optimized matrix-matrix multiplication (nnmm) |
US11496775B2 (en) * | 2020-02-20 | 2022-11-08 | Tencent America LLC | Neural network model compression with selective structured weight unification |
KR102287942B1 (ko) | 2020-02-24 | 2021-08-09 | 삼성전자주식회사 | 전처리를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
CN111314698A (zh) * | 2020-02-27 | 2020-06-19 | 浙江大华技术股份有限公司 | 一种图像编码处理方法及装置 |
KR20210127412A (ko) | 2020-04-14 | 2021-10-22 | 삼성전자주식회사 | Ai 다운스케일 장치 및 그 동작방법, 및 ai 업스케일 장치 및 그 동작방법 |
CN111741300B (zh) * | 2020-05-28 | 2023-03-07 | 杭州师范大学 | 一种视频处理方法 |
CN113766249B (zh) * | 2020-06-01 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
US20230188713A1 (en) * | 2020-06-04 | 2023-06-15 | Interdigital Vc Holdings France, Sas | Neural network based filter in video coding |
US11334967B2 (en) * | 2020-07-30 | 2022-05-17 | Novatek Microelectronics Corp. | Method and image processing device for generating image filter |
CN112422989B (zh) * | 2020-11-17 | 2023-06-09 | 杭州师范大学 | 一种视频编码方法 |
WO2022116165A1 (zh) * | 2020-12-04 | 2022-06-09 | 深圳市大疆创新科技有限公司 | 视频编码方法、解码方法、编码器、解码器以及ai加速器 |
EP4064133A3 (en) * | 2021-03-24 | 2022-12-28 | Samsung Electronics Co., Ltd. | Method for optimising a machine learning model for image processing |
US20220383554A1 (en) | 2021-05-18 | 2022-12-01 | Tencent America LLC | Substitutional quality factor learning for quality-adaptive neural network-based loop filter |
CN113497941A (zh) * | 2021-06-30 | 2021-10-12 | 浙江大华技术股份有限公司 | 图像滤波方法、编码方法及相关设备 |
WO2023022376A1 (ko) * | 2021-08-17 | 2023-02-23 | 현대자동차주식회사 | 개선된 인루프 필터를 이용하는 비디오 코딩방법 및 장치 |
WO2023080464A1 (ko) * | 2021-11-05 | 2023-05-11 | 삼성전자 주식회사 | Ai 기반 필터링을 위한 영상 처리 방법 및 장치 |
CN115209147B (zh) * | 2022-09-15 | 2022-12-27 | 深圳沛喆微电子有限公司 | 摄像头视频传输带宽优化方法、装置、设备及存储介质 |
CN117834864A (zh) * | 2022-09-27 | 2024-04-05 | 中兴通讯股份有限公司 | 一种视频编解码环路滤波方法、视频解码方法及装置 |
CN117746045B (zh) * | 2024-02-08 | 2024-05-28 | 江西师范大学 | 一种Transformer和卷积融合的医学图像分割方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05191796A (ja) * | 1992-01-10 | 1993-07-30 | Sharp Corp | ブロック歪補正器 |
US20090034622A1 (en) * | 2007-08-01 | 2009-02-05 | Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry | Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images |
US20160162782A1 (en) * | 2014-12-09 | 2016-06-09 | Samsung Electronics Co., Ltd. | Convolution neural network training apparatus and method thereof |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5825646A (en) * | 1993-03-02 | 1998-10-20 | Pavilion Technologies, Inc. | Method and apparatus for determining the sensitivity of inputs to a neural network on output parameters |
US5461699A (en) * | 1993-10-25 | 1995-10-24 | International Business Machines Corporation | Forecasting using a neural network and a statistical forecast |
JP5345139B2 (ja) * | 2007-06-08 | 2013-11-20 | トムソン ライセンシング | 多格子スパース性ベースのフィルタリングに基づくインループ・アーチファクト解除フィルタリングのための方法及び装置 |
JP2009111691A (ja) * | 2007-10-30 | 2009-05-21 | Hitachi Ltd | 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 |
WO2009126299A1 (en) | 2008-04-11 | 2009-10-15 | Thomson Licensing | Deblocking filtering for displaced intra prediction and template matching |
US8311111B2 (en) * | 2008-09-11 | 2012-11-13 | Google Inc. | System and method for decoding using parallel processing |
US9479786B2 (en) * | 2008-09-26 | 2016-10-25 | Dolby Laboratories Licensing Corporation | Complexity allocation for video and image coding applications |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
JP5597968B2 (ja) | 2009-07-01 | 2014-10-01 | ソニー株式会社 | 画像処理装置および方法、プログラム、並びに記録媒体 |
US20120320973A1 (en) * | 2010-03-09 | 2012-12-20 | Thomson Licensing | Methods and apparatus for a classification-based loop filter |
US9015093B1 (en) * | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
EP2693750A4 (en) * | 2011-03-30 | 2016-09-28 | Lg Electronics Inc | IN-LOOP FILTER PROCESS AND DEVICE THEREFOR |
US9008180B2 (en) * | 2011-04-21 | 2015-04-14 | Intellectual Discovery Co., Ltd. | Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering |
JP6359101B2 (ja) | 2013-10-14 | 2018-07-18 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像の符号化及び復号のためのイントラブロックコピー予測モードの特徴 |
KR101768865B1 (ko) | 2014-06-19 | 2017-08-18 | 에스케이텔레콤 주식회사 | 가중치예측을 이용한 영상 부호화/복호화 방법 및 장치 |
KR102276854B1 (ko) | 2014-07-31 | 2021-07-13 | 삼성전자주식회사 | 인루프 필터 파라미터 예측을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
US9563825B2 (en) * | 2014-11-20 | 2017-02-07 | Adobe Systems Incorporated | Convolutional neural network using a binarized convolution layer |
CN104811276B (zh) * | 2015-05-04 | 2018-04-03 | 东南大学 | 一种超奈奎斯特速率通信的dl‑cnn解调器 |
CN105611303B (zh) * | 2016-03-07 | 2019-04-09 | 京东方科技集团股份有限公司 | 图像压缩系统、解压缩系统、训练方法和装置、显示装置 |
US11024009B2 (en) * | 2016-09-15 | 2021-06-01 | Twitter, Inc. | Super resolution using a generative adversarial network |
-
2017
- 2017-02-09 KR KR1020170017959A patent/KR101974261B1/ko active IP Right Grant
- 2017-02-13 US US16/313,052 patent/US11095887B2/en active Active
- 2017-02-13 JP JP2018567746A patent/JP6761490B2/ja active Active
- 2017-02-13 CN CN201780051305.7A patent/CN109644268B/zh active Active
-
2021
- 2021-07-15 US US17/376,162 patent/US11627316B2/en active Active
-
2022
- 2022-12-26 US US18/088,615 patent/US20230134212A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05191796A (ja) * | 1992-01-10 | 1993-07-30 | Sharp Corp | ブロック歪補正器 |
US20090034622A1 (en) * | 2007-08-01 | 2009-02-05 | Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry | Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images |
US20160162782A1 (en) * | 2014-12-09 | 2016-06-09 | Samsung Electronics Co., Ltd. | Convolution neural network training apparatus and method thereof |
Non-Patent Citations (1)
Title |
---|
RONGQUN LIN ET AL.: "Deep Convolutional Neural Network for Decompressed Video Enhancement", PROCEEDINGS OF 2016 DATA COMPRESSION CONFERENCE (DCC), JPN6019050287, 30 March 2016 (2016-03-30), pages 617, XP033027777, ISSN: 0004180475, DOI: 10.1109/DCC.2016.83 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023517349A (ja) * | 2020-12-16 | 2023-04-25 | テンセント・アメリカ・エルエルシー | ビデオコーディング方法及び装置 |
JP7403747B2 (ja) | 2020-12-16 | 2023-12-25 | テンセント・アメリカ・エルエルシー | ビデオコーディング方法及び装置 |
JP7411113B2 (ja) | 2021-01-14 | 2024-01-10 | テンセント・アメリカ・エルエルシー | 品質入力を有するループフィルタのためのマスクされたニューラルネットワークによるモデル共有 |
Also Published As
Publication number | Publication date |
---|---|
KR20180001428A (ko) | 2018-01-04 |
CN109644268B (zh) | 2022-03-08 |
US11627316B2 (en) | 2023-04-11 |
CN109644268A (zh) | 2019-04-16 |
KR101974261B1 (ko) | 2019-04-30 |
US20190230354A1 (en) | 2019-07-25 |
US11095887B2 (en) | 2021-08-17 |
US20210344916A1 (en) | 2021-11-04 |
JP6761490B2 (ja) | 2020-09-23 |
US20230134212A1 (en) | 2023-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019525544A (ja) | Cnn基盤インループフィルタを含む符号化方法と装置及び復号化方法と装置 | |
KR102165340B1 (ko) | 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치 | |
JP6053220B2 (ja) | イントラ予測符号化方法、イントラ予測復号方法、イントラ予測符号化装置、イントラ予測復号装置、それらのプログラム並びにプログラムを記録した記録媒体 | |
JP7343669B2 (ja) | Vvcにおける色変換のための方法及び機器 | |
JP7362877B2 (ja) | イントラ予測モードとブロック差分パルスコード変調モードとの間の相互作用のための方法および装置 | |
JP2022526400A (ja) | ビデオコーディングのための方法および装置 | |
JP7297918B2 (ja) | ビデオ符号化のための色変換 | |
JP7434588B2 (ja) | ビデオ・フィルタリングのための方法および装置 | |
JP2023508686A (ja) | ビデオ符号化のための方法並びに、その装置、及びコンピュータプログラム | |
KR20220003631A (ko) | 서브-파티션들의 병렬 양방향 인트라-코딩 | |
KR102276914B1 (ko) | 비디오 인코딩 장치 그리고 이의 구동 방법 | |
JP2023513772A (ja) | ビデオコーディングのための方法、装置およびコンピュータプログラム | |
JP2023515931A (ja) | ビデオコーディングのための方法および装置 | |
JP6454229B2 (ja) | 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
JP2021527362A (ja) | イントラ予測のための方法及び装置 | |
WO2022269469A1 (en) | Method, apparatus and computer program product for federated learning for non independent and non identically distributed data | |
JP6030989B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、それらのプログラム並びにプログラムを記録した記録媒体 | |
JP7408834B2 (ja) | ビデオフィルタリングのための方法および装置 | |
JP7443527B2 (ja) | ビデオコーディングのための方法、装置及びプログラム | |
JP7403747B2 (ja) | ビデオコーディング方法及び装置 | |
KR102017027B1 (ko) | 고속 영상 부호화 방법 및 장치 | |
KR102668253B1 (ko) | 비트레이트 감소를 위한 비디오 스트림 적응형 필터링 | |
KR20230003566A (ko) | 포스트 필터링에 의한 신경 이미지 압축에서의 블록별 컨텐츠-적응적 온라인 훈련 | |
Piljić | Just-in-time video transcoding system on heterogeneous high performance computing architectures | |
JP5728330B2 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200904 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6761490 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |