JP7761139B2 - 画像フィルタリング方法、装置、機器及びプログラム - Google Patents
画像フィルタリング方法、装置、機器及びプログラムInfo
- Publication number
- JP7761139B2 JP7761139B2 JP2024516555A JP2024516555A JP7761139B2 JP 7761139 B2 JP7761139 B2 JP 7761139B2 JP 2024516555 A JP2024516555 A JP 2024516555A JP 2024516555 A JP2024516555 A JP 2024516555A JP 7761139 B2 JP7761139 B2 JP 7761139B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- filtering
- classification information
- filtered
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/40—Tree coding, e.g. quadtree, octree
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本願は、2022年02月10日に中国特許局に提出された、出願番号が202210126411.Xである中国特許出願の優先権を主張し、その内容の全てが引用により本願に組み込まれる。
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記分類情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含む。
フィルタリング対象画像の符号化情報を決定するように構成される決定ユニットであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、決定ユニットと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記分類情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るように構成されるフィルタリングユニットと、を含む。
Claims (25)
- 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記符号化画像タイプは、フルフレーム内符号化画像及びフレーム間符号化可能画像を含み、前記分類情報が前記フィルタリング対象画像の符号化画像タイプを指示する場合、前記フィルタリング対象画像の符号化情報を決定するステップは、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化画像タイプを取得するステップと、
前記複数の画像領域がいずれも前記フルフレーム内符号化画像に属する場合、前記分類情報の値は第1の値であると決定するステップと、
前記複数の画像領域がいずれも前記フレーム間符号化可能画像に属する場合、前記分類情報の値は第2の値であると決定するステップと、
前記フィルタリング対象画像がスライス境界又はタイル境界を横切る場合、前記分類情報の値は第3の値であると決定し、又は前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域及び前記フレーム間符号化可能画像に属する画像領域の前記フィルタリング対象画像におけるそれぞれの割合に基づいて、前記分類情報の値を決定するステップと、を含む、
画像フィルタリング方法。 - 前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域及び前記フレーム間符号化可能画像に属する画像領域の前記フィルタリング対象画像におけるそれぞれの割合に基づいて、前記分類情報を決定するステップは、
前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域の前記フィルタリング対象画像における割合が第1閾値より大きいか等しい場合、前記分類情報の値は前記第1の値であると決定するステップと、
前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域の前記フィルタリング対象画像における割合が前記第1閾値より小さい場合、前記分類情報の値は前記第2の値であると決定するステップと、を含む、
請求項1に記載の画像フィルタリング方法。 - 前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域及び前記フレーム間符号化可能画像に属する画像領域の前記フィルタリング対象画像におけるそれぞれの割合に基づいて、前記分類情報の値を決定するステップは、
前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域の前記フィルタリング対象画像における割合が第1閾値より大きいか等しい場合、前記分類情報の値は前記第1の値であると決定するステップと、
前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域の前記フィルタリング対象画像における割合が前記第1閾値より小さく、且つ第2閾値より大きいか等しい場合、前記分類情報の値は前記第2の値であると決定するステップと、
前記複数の画像領域のうち、前記フルフレーム内符号化画像に属する画像領域の前記フィルタリング対象画像における割合が前記第2閾値より小さい場合、前記分類情報の値は前記第3の値であると決定するステップと、を含む、
請求項1に記載の画像フィルタリング方法。 - 前記分類情報は、スライスレベル、画像ブロックレベル、又は画像ヘッダレベルで指示される、
請求項1に記載の画像フィルタリング方法。 - 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記符号化モードは、フレーム内符号化モード及びフレーム間符号化モードを含み、前記分類情報がフィルタリング対象画像の符号化モードを指示する場合、前記分類情報は、第1分類情報及び第2分類情報のうちの少なくとも1つを含み、
前記第1分類情報は、前記フィルタリング対象画像内の1つ又は複数のピクセルに対応する符号化モードを指示し、前記第2分類情報は、前記フィルタリング対象画像内の所定サイズ領域に対応する符号化モードを指示し、
前記分類情報が前記第2分類情報を含む場合、前記フィルタリング対象画像の符号化情報を決定するステップは、
前記フィルタリング対象画像内の異なる符号化モードに対応する画像領域の前記フィルタリング対象画像における割合に基づいて、前記第2分類情報を決定するステップを含む、
画像フィルタリング方法。 - 前記分類情報が前記第1分類情報を含む場合、前記フィルタリング対象画像の符号化情報を決定するステップは、
前記フィルタリング対象画像内の1つ又は複数のピクセルに対応する符号化モードを取得するステップと、
前記フィルタリング対象画像内の1つ又は複数のピクセルに対応する符号化モードに基づいて、前記符号化情報内の第1分類情報を決定するステップと、を含み、
前記第1分類情報は、複数の要素からなる行列であり、前記行列内の各要素は、前記フィルタリング対象画像内の1つ又は複数のピクセルの符号化モードに対応する、
請求項5に記載の画像フィルタリング方法。 - 前記フィルタリング対象画像内の1つ又は複数のピクセルに対応する符号化モードに基づいて、前記第1分類情報を決定するステップは、
前記フィルタリング対象画像内のすべてのピクセルに対応する符号化モードが前記フレーム内符号化モードである場合、前記第1分類情報内の各行列要素の値は第1の値であると決定するステップと、
前記フィルタリング対象画像内のすべてのピクセルに対応する符号化モードが前記フレーム間符号化モードである場合、前記第1分類情報内の各行列要素の値は第2の値であると決定するステップと、
前記フィルタリング対象画像における第1画像領域内の1つ又は複数のピクセルに対応する符号化モードが前記フレーム内符号化モードであり、第2画像領域内の1つ又は複数のピクセルに対応する符号化モードが前記フレーム間符号化モードである場合、前記第1分類情報における前記第1画像領域内の1つ又は複数のピクセルに対応する行列要素の値は前記第1の値であり、前記第2画像領域内の1つ又は複数のピクセルに対応する行列要素の値は前記第2の値であると決定するステップと、を含む、
請求項5に記載の画像フィルタリング方法。 - 前記フィルタリング対象画像内の異なる符号化モードに対応する画像領域の前記フィルタリング対象画像における割合に基づいて、前記第2分類情報を決定するステップは、
前記フィルタリング対象画像内の前記フレーム内符号化モードに対応する画像領域の前記フィルタリング対象画像における割合が第1所定閾値より大きいか等しい場合、前記第2分類情報の値は第1の値であると決定するステップと、
前記フィルタリング対象画像内の前記フレーム内符号化モードに対応する画像領域の前記フィルタリング対象画像における割合が前記第1所定閾値より小さい場合、前記第2分類情報の値は第2の値であると決定するステップと、を含む、
請求項5に記載の画像フィルタリング方法。 - 前記フィルタリング対象画像内の異なる符号化モードに対応する画像領域の前記フィルタリング対象画像における割合に基づいて、前記第2分類情報を決定するステップは、
前記フィルタリング対象画像内の前記フレーム内符号化モードに対応する画像領域の前記フィルタリング対象画像における割合が第1所定閾値より大きいか等しい場合、前記第2分類情報の値は第1の値であると決定するステップと、
前記フィルタリング対象画像内の前記フレーム内符号化モードに対応する画像領域の前記フィルタリング対象画像における割合が前記第1所定閾値より小さく、且つ第2所定閾値より大きいか等しい場合、前記第2分類情報の値は第2の値であると決定するステップと、
前記フィルタリング対象画像内の前記フレーム内符号化モードに対応する画像領域の前記フィルタリング対象画像における割合が前記第2所定閾値より小さい場合、前記第2分類情報の値は第3の値であると決定するステップと、を含む、
請求項5に記載の画像フィルタリング方法。 - 前記分類情報は、ブロックレベルで指示される、
請求項5に記載の画像フィルタリング方法。 - 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記符号化モードは、通常のフレーム内符号化モード、行列重み付けフレーム内予測(MIP)モード、フレーム内ブロック複製(IBC)モード、フレーム内文字列予測(ISP)モード、パレット(PLT)モード、通常のフレーム間符号化モード、スキップ(Skip)モード、モーションマージ(Merge)モード、フレーム間とフレーム内との複合予測(CIIP)モードのうちの少なくとも1つを含み、
前記分類情報が前記フィルタリング対象画像の符号化モードを指示する場合、前記フィルタリング対象画像の符号化情報を決定するステップは、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化モードを取得するステップと、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化モードに基づいて、前記符号化情報内の分類情報を決定するステップと、を含み、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化モードに基づいて、前記符号化情報内の分類情報を決定するステップは、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化モードのインデックスを決定するステップと、
前記フィルタリング対象画像内の複数の画像領域に対応する符号化モードのインデックスに基づいて、前記分類情報を決定するステップと、を含む、
画像フィルタリング方法。 - 1つの符号化モードが1つのインデックスに対応し、又は複数の符号化モードが1つのインデックスに対応する、
請求項11に記載の画像フィルタリング方法。 - 前記分類情報は、ブロックレベルで指示される、
請求項11に記載の画像フィルタリング方法。 - 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力するステップは、
前記フィルタリング対象画像及び前記分類情報のうちの少なくとも1つを前処理した後、前記フィルタリングモデルに入力するステップを含む、
画像フィルタリング方法。 - 前記フィルタリング対象画像及び前記分類情報のうちの少なくとも1つを前処理した後、前記フィルタリングモデルに入力するステップは、
前記フィルタリング対象画像と前記分類情報とをレイヤのマージをした後、前記フィルタリングモデルに入力するステップを含む、
請求項14に記載の画像フィルタリング方法。 - 前記フィルタリング対象画像及び前記分類情報のうちの少なくとも1つを前処理した後、前記フィルタリングモデルに入力するステップは、
前記フィルタリング対象画像と前記分類情報とを乗算してから第1特徴抽出ユニットに入力して、前記フィルタリング対象画像と前記分類情報とを融合した後の第1特征情報を得るステップと、
前記フィルタリング対象画像を第2特徴抽出ユニットに入力して特徴抽出を行って、前記フィルタリング対象画像の第2特征情報を得るステップと、
前記第1特征情報及び前記第2特征情報を前記フィルタリングモデルに入力するステップと、を含む、
請求項14に記載の画像フィルタリング方法。 - 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力するステップは、
前記フィルタリング対象画像に対応する予測画像、量子化パラメータ、及びブロック分割情報のうちの少なくとも1つと、前記フィルタリング対象画像及び前記分類情報とを、前記フィルタリングモデルに入力するステップを含み、
前記フィルタリング対象画像に対応する予測画像、量子化パラメータ、及びブロック分割情報のうちの少なくとも1つと、前記フィルタリング対象画像及び前記分類情報とを、前記フィルタリングモデルに入力するステップは、
前記予測画像を第1処理ユニットに入力して、前記予測画像の特徴情報を得るステップと、
前記フィルタリング対象画像を第2処理ユニットに入力して、前記フィルタリング対象画像の特徴情報を得るステップと、
前記予測画像の特徴情報、前記量子化パラメータ、及び前記ブロック分割情報のうちの少なくとも1つと、前記フィルタリング対象画像の特徴情報及び前記分類情報とを、前記フィルタリングモデルに入力するステップと、を含む、
画像フィルタリング方法。 - 前記量子化パラメータは、シーケンスレベル量子化パラメータ及びスライスレベル量子化パラメータのうちの少なくとも1つを含む、
請求項17に記載の画像フィルタリング方法。 - 画像フィルタリング方法であって、
フィルタリング対象画像の符号化情報を決定するステップであって、前記符号化情報は、前記フィルタリング対象画像の分類情報を含み、前記分類情報は、前記フィルタリング対象画像の符号化画像タイプ、符号化モードのうちの少なくとも1つを指示する、ステップと、
前記フィルタリング対象画像及び前記分類情報を深層学習ベースの同一のフィルタリングモデルに入力し、前記フィルタリングモデルに、前記符号化情報に基づいて前記フィルタリング対象画像をフィルタリングさせて、フィルタリング後の画像を得るステップと、を含み、
前記フィルタリングモデルは、N個の残差ブロックを含み、前記Nは正の整数である、
画像フィルタリング方法。 - 前記N個の残差ブロックのうちの少なくとも1つの残差ブロックに含まれる各畳み込み層の入力チャネル数と出力チャネル数は同じであり、又は、前記N個の残差ブロックのうちの少なくとも1つの残差ブロックに含まれる各畳み込み層の入力チャネル数と出力チャネル数は異なる、
請求項19に記載の画像フィルタリング方法。 - 前記N個の残差ブロックのうちの少なくとも1つの残差ブロックは、注目層を含む、
請求項19に記載の画像フィルタリング方法。 - 前記フィルタリング後の画像は後続の画像の参照画像として使用され、又は、前記フィルタリング後の画像は表示に使用され、且つ後続の画像の参照画像としては使用されない、
請求項1に記載の画像フィルタリング方法。 - 請求項1ないし22のうちいずれか一項に記載の方法を実行するように構成された画像フィルタリング装置。
- 電子機器であって、
プロセッサと、メモリと、を備え、前記メモリは、コンピュータプログラムを記憶するように構成され、前記プロセッサは、前記メモリに記憶されたコンピュータプログラムを呼び出して実行することにより、請求項1~22のいずれか一項に記載の方法を実行する、電子機器。 - 電子機器で実行されるときに、前記電子機器に、請求項1~22のいずれか一項に記載の方法を実行させるコンピュータプログラム命令を含む、コンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210126411.XA CN116630171A (zh) | 2022-02-10 | 2022-02-10 | 图像滤波方法、装置、设备及存储介质 |
| CN202210126411.X | 2022-02-10 | ||
| PCT/CN2022/137882 WO2023151365A1 (zh) | 2022-02-10 | 2022-12-09 | 图像滤波方法、装置、设备及存储介质、程序产品 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024531738A JP2024531738A (ja) | 2024-08-29 |
| JP7761139B2 true JP7761139B2 (ja) | 2025-10-28 |
Family
ID=87563594
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024516555A Active JP7761139B2 (ja) | 2022-02-10 | 2022-12-09 | 画像フィルタリング方法、装置、機器及びプログラム |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US12368866B2 (ja) |
| EP (1) | EP4390833A4 (ja) |
| JP (1) | JP7761139B2 (ja) |
| KR (1) | KR20240054313A (ja) |
| CN (1) | CN116630171A (ja) |
| WO (1) | WO2023151365A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118741128B (zh) * | 2024-05-17 | 2026-01-16 | 北京红云融通技术有限公司 | 一种视频编解码处理方法及相关产品 |
| WO2025244421A1 (ko) * | 2024-05-22 | 2025-11-27 | 엘지전자 주식회사 | 메쉬 데이터 부호화 장치, 메쉬 데이터 부호화 방법, 메쉬 데이터 복호화 장치 및 메쉬 데이터 복호화 방법 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019031410A1 (ja) | 2017-08-10 | 2019-02-14 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、および画像符号化装置 |
| WO2019093268A1 (ja) | 2017-11-08 | 2019-05-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像処理装置及び画像処理方法 |
| CN110351568A (zh) | 2019-06-13 | 2019-10-18 | 天津大学 | 一种基于深度卷积网络的视频环路滤波器 |
| CN113259671A (zh) | 2020-02-10 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
| WO2021244884A1 (en) | 2020-06-04 | 2021-12-09 | Interdigital Vc Holdings France, Sas | Neural network based filter in video coding |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4643454B2 (ja) * | 2006-01-10 | 2011-03-02 | 株式会社東芝 | 動画像復号装置及び動画像復号方法 |
| EP3451670A1 (en) * | 2017-08-28 | 2019-03-06 | Thomson Licensing | Method and apparatus for filtering with mode-aware deep learning |
| US11265540B2 (en) * | 2018-02-23 | 2022-03-01 | Sk Telecom Co., Ltd. | Apparatus and method for applying artificial neural network to image encoding or decoding |
| US20190306502A1 (en) * | 2018-04-02 | 2019-10-03 | Qualcomm Incorporated | System and method for improved adaptive loop filtering |
| CN113766249B (zh) * | 2020-06-01 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
| CN111711824B (zh) * | 2020-06-29 | 2021-07-02 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
-
2022
- 2022-02-10 CN CN202210126411.XA patent/CN116630171A/zh active Pending
- 2022-12-09 WO PCT/CN2022/137882 patent/WO2023151365A1/zh not_active Ceased
- 2022-12-09 KR KR1020247009750A patent/KR20240054313A/ko active Pending
- 2022-12-09 JP JP2024516555A patent/JP7761139B2/ja active Active
- 2022-12-09 EP EP22925716.7A patent/EP4390833A4/en active Pending
-
2023
- 2023-11-21 US US18/516,276 patent/US12368866B2/en active Active
-
2025
- 2025-07-08 US US19/262,746 patent/US20250337927A1/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019031410A1 (ja) | 2017-08-10 | 2019-02-14 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、および画像符号化装置 |
| WO2019093268A1 (ja) | 2017-11-08 | 2019-05-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像処理装置及び画像処理方法 |
| CN110351568A (zh) | 2019-06-13 | 2019-10-18 | 天津大学 | 一种基于深度卷积网络的视频环路滤波器 |
| CN113259671A (zh) | 2020-02-10 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
| WO2021244884A1 (en) | 2020-06-04 | 2021-12-09 | Interdigital Vc Holdings France, Sas | Neural network based filter in video coding |
Non-Patent Citations (1)
| Title |
|---|
| Yue Li et al,EE1-1.2: Test on Deep In-Loop Filter with Adaptive Parameter Selection and Residual Scaling [online],JVET-Y0143-v2,ITU-T,2022年01月12日,pp.1-6,[retrieved on 2025.02.05], Retrieved from the Internet:<URL:https://jvet-experts.org/doc_end_user/documents/25_Teleconference/wg11/JVET-Y0143-v2.zip>, JVET-Y0143-r1.docx pp.1-6 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023151365A1 (zh) | 2023-08-17 |
| CN116630171A (zh) | 2023-08-22 |
| US12368866B2 (en) | 2025-07-22 |
| US20240089465A1 (en) | 2024-03-14 |
| KR20240054313A (ko) | 2024-04-25 |
| EP4390833A1 (en) | 2024-06-26 |
| EP4390833A4 (en) | 2025-05-07 |
| US20250337927A1 (en) | 2025-10-30 |
| JP2024531738A (ja) | 2024-08-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2023202344B2 (en) | Position dependent intra prediction combination extended with angular modes | |
| KR102745742B1 (ko) | 변환에 기반한 영상 코딩 방법 및 그 장치 | |
| KR102142181B1 (ko) | 비디오 코딩에서의 팔레트 블록 사이즈에 대한 제한 | |
| JP2023544705A (ja) | ビデオコーディング中の、ジョイント成分ニューラルネットワークベースのフィルタ処理 | |
| KR20210125088A (ko) | 매트릭스 기반 인트라 예측 및 2차 변환 코어 선택을 조화시키는 인코더, 디코더 및 대응 방법 | |
| CN106658019A (zh) | 参考帧编解码的方法与装置 | |
| CN112673640A (zh) | 使用调色板译码的编码器、解码器和相应方法 | |
| US20250337927A1 (en) | Filtering differently coded frames by a general filtering model based on deep learning | |
| JP7657931B2 (ja) | ビデオ符号化・復号化方法及びシステム、ビデオ符号器並びにビデオ復号器 | |
| KR20200023358A (ko) | 무분할 양방향 필터 | |
| TW202133612A (zh) | 用於視訊解碼的基於塊的增量脈衝解碼調制 | |
| US20240236371A1 (en) | Video encoding method, video decoding method, device, system, and storage medium | |
| JP2021519018A (ja) | 効率的なデブロッキングを実行するための画像処理デバイス及び方法 | |
| KR20250171279A (ko) | 비디오 코딩을 위한 분리가능한 컨볼루션 및 멀티-스케일 강화를 갖는 뉴럴 네트워크-기반 인 루프 필터 아키텍처들 | |
| CN116405701B (zh) | 图像滤波方法、装置、设备及存储介质 | |
| WO2023092404A1 (zh) | 视频编解码方法、设备、系统、及存储介质 | |
| JP7765159B2 (ja) | 画像フィルタリング方法およびその装置、並びに機器 | |
| CN114979628B (zh) | 图像块预测样本的确定方法及编解码设备 | |
| JP7293460B2 (ja) | 効率的なデブロッキングを実行するための画像処理デバイス及び方法 | |
| WO2024213011A1 (en) | Visual volumetric video-based coding method, encoder and decoder | |
| US20240015312A1 (en) | Neural network based filtering process for multiple color components in video coding | |
| CN114979629B (zh) | 图像块预测样本的确定方法及编解码设备 | |
| RU2820991C1 (ru) | Кодирующее устройство, декодирующее устройство и соответствующие способы уменьшения сложности при внутрикадровом прогнозировании для планарного режима | |
| HK40092615A (zh) | 图像滤波方法、装置、设备及存储介质 | |
| WO2024151494A2 (en) | Visual volumetric video-based coding method, encoder and decoder |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240313 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250129 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250516 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250610 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250905 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250916 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250929 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7761139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |