JP2020039087A - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents
画像処理装置、画像処理方法及び画像処理プログラム Download PDFInfo
- Publication number
- JP2020039087A JP2020039087A JP2018166303A JP2018166303A JP2020039087A JP 2020039087 A JP2020039087 A JP 2020039087A JP 2018166303 A JP2018166303 A JP 2018166303A JP 2018166303 A JP2018166303 A JP 2018166303A JP 2020039087 A JP2020039087 A JP 2020039087A
- Authority
- JP
- Japan
- Prior art keywords
- image
- vector
- feature vector
- code amount
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
以下、本発明の一実施形態に係る画像処理装置について説明する。
以下、画像処理装置の機能構成について、図面を参照しながら説明する。
図1は、本発明の一実施形態による画像処理装置100の機能構成を示すブロック図である。
また、画像更新部106は、所定の条件が満たされた場合、更新特徴マップ生成部107及び符号量評価部110への更新画像の出力を終了し、外部の装置へ更新画像を出力する。なお、所定の条件とは、例えば、所定の回数の更新画像の生成が行われること、あるいは、任意の評価方法によって行われる更新画像の評価結果の値が所定の値に達したこと等である。
なお、上記更新画像の品質評価の評価方法には、任意の方法を用いることができる。例えば、後述する損失関数による評価方法を用いることができる。
なお、上記更新画像の符号量評価の評価方法には、任意の方法を用いることができる。例えば、後述する損失関数による評価方法を用いることができる。
以下、画像処理装置の動作の一例について、図面を参照しながら説明する。
図3は、本発明の一実施形態による画像処理装置100の動作を示すフローチャートである。
次に、参照特徴マップ生成部103は、画像記憶部102に記憶された処理対象画像と少なくとも1つのフィルタとに基づいて、少なくとも1つの参照特徴マップを生成する(ステップS102)。
なお、生成される特徴マップの数も任意である。
i番目の特徴マップφiは以下の式(1)で表される。
次に、参照特徴ベクトル生成部104は、参照特徴マップ生成部103によって生成された参照特徴マップに基づいて参照特徴ベクトルを生成する。そして、参照特徴ベクトル記憶部105は、参照特徴ベクトル生成部104によって生成された参照特徴ベクトルを記憶する(ステップS103)。
なお、参照特徴マップに基づいて生成される参照特徴ベクトルは、ベクトルではなく1階以上の任意のテンソルであってもよい。以下、説明を簡単にするため、生成される参照特徴ベクトルが1階のテンソルΨである場合について説明する。
例えば、統計量として平均値を用いる場合、参照特徴ベクトルはm個の要素を持ち、各要素は以下の式(2)のように表される。
例えば、統計量として平均値を用いる場合、この参照特徴ベクトルはn2個の要素を持ち、各要素は以下の式(3)のように表される。
例えば、統計量として平均値を用いる場合、この参照特徴ベクトルはm2個の要素を持ち、各要素は以下の式(4)のように表される。
次に、画像更新部106は、更新画像を初期値にする初期化を行う。そして、画像更新部106は、更新画像の更新を逐次繰り返すことによって、出力画像を生成する(ステップS104)。
なお、逐次行われる更新画像の更新方法は任意であるが、以下、説明を簡単にするため、本実施形態においては、誤差逆伝搬法による更新方法を用いる場合について説明する。
画像更新部106は、更新量に基づいて、更新画像の各要素を更新し、新たな更新画像を生成する(ステップS105)。更新量は、後述の更新量決定部111により決定されるが、初回のみ任意の初期値が用いられる。あるいは、初回のみ、更新量に基づく更新画像の各要素の更新処理を省略してもよい。
なお、損失関数には、任意の関数を用いることができる。例えば、平均二乗誤差を使用する場合、更新画像I’の特徴ベクトルΨ(I’)と、処理対象画像Iの参照特徴ベクトルΨ(I)に対する損失Eqは、以下の式(5)のように定義することができる。
例えば、第一特徴ベクトルΨ1として抽象的なコンテキストを示すベクトル、第二特徴ベクトルΨ2として画像の画素値そのものを並べたベクトルを使用する場合について説明する。第一特徴ベクトルによる損失関数を第一損失関数Eq1(I’)、及び、第二特徴ベクトルによる更新画像と処理対象画像の損失関数を第二損失関数Eq2(I’)として、以下の式(6)及び式(7)のようにそれぞれ定義する。
次に、符号量評価部110は、画像更新部106によって更新された更新画像の符号量を評価して符号量フィードバックベクトルを生成し、出力する(ステップS109)。
次に、更新量決定部111は、品質評価部109によって生成された品質フィードバックベクトルと、符号量評価部110によって生成された符号量フィードバックベクトルと、に基づいて更新量を決定し、更新量を示す情報を画像更新部106へ出力する(ステップS110)。
上記の構成を備えることにより、本発明の一実施形態による画像処理装置100は、演算コストを抑えつつ、品質と符号量とを調整することができる。
Claims (6)
- 処理対象画像の画素値を更新して新たな画像を生成する画像処理装置であって、
前記処理対象画像と予め定められた少なくとも1つのフィルタとによって生成された第1の特徴マップに基づいて第1の特徴ベクトルを生成する第1特徴ベクトル生成部と、
前記処理対象画像を更新し更新画像を生成する画像更新部と、
前記更新画像と予め定められた少なくとも1つのフィルタとによって生成された第2の特徴マップに基づいて第2の特徴ベクトルを生成する第2特徴ベクトル生成部と、
前記第1の特徴ベクトルと前記第2の特徴ベクトルとに基づいて前記更新画像の品質評価を行い、前記品質評価の結果に基づくベクトルである品質フィードバックベクトルを生成する品質評価部と、
前記更新画像に対する符号量評価を行い、前記符号量評価の結果に基づくベクトルである符号量フィードバックベクトルを生成する符号量評価部と、
前記品質フィードバックベクトルと前記符号量フィードバックベクトルとに基づいて前記更新画像の更新における更新量を決定する更新量決定部と、
を備える画像処理装置。 - 前記第1の特徴マップ及び前記第2の特徴マップのうち少なくとも一方は、複数の前記フィルタによる階層的な畳み込み処理が行われることによって生成される
請求項1に記載の画像処理装置。 - 前記第1の特徴ベクトル及び前記第2の特徴ベクトルのうち少なくとも一方は、前記第1の特徴マップ又は前記第2の特徴マップの統計量に基づいて生成される
請求項1又は請求項2に記載の画像処理装置。 - 前記第1の特徴ベクトル及び前記第2の特徴ベクトルのうち少なくとも一方は、前記第1の特徴マップどうしの相互相関又は前記第2の特徴マップどうしの相互相関に基づいて生成される
請求項1又は請求項2に記載の画像処理装置。 - 処理対象画像の画素値を更新して新たな画像を生成する画像処理装置が行う画像処理方法であって、
前記処理対象画像と予め定められた少なくとも1つのフィルタとによって生成された第1の特徴マップに基づいて第1の特徴ベクトルを生成する第1特徴ベクトル生成ステップと、
前記処理対象画像を更新し更新画像を生成する画像更新ステップと、
前記更新画像と予め定められた少なくとも1つのフィルタとによって生成された第2の特徴マップに基づいて第2の特徴ベクトルを生成する第2特徴ベクトル生成ステップと、
前記第1の特徴ベクトルと前記第2の特徴ベクトルとに基づいて前記更新画像の品質評価を行い、前記品質評価の結果に基づくベクトルである品質フィードバックベクトルを生成する品質評価ステップと、
前記更新画像に対する符号量評価を行い、前記符号量評価の結果に基づくベクトルである符号量フィードバックベクトルを生成する符号量評価ステップと、
前記品質フィードバックベクトルと前記符号量フィードバックベクトルとに基づいて前記更新画像の更新における更新量を決定する更新量決定ステップと、
を有する画像処理方法。 - 請求項1から請求項4のうちいずれか一項に記載の画像処理装置としてコンピュータを機能させるための画像処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018166303A JP7075012B2 (ja) | 2018-09-05 | 2018-09-05 | 画像処理装置、画像処理方法及び画像処理プログラム |
PCT/JP2019/033317 WO2020050089A1 (ja) | 2018-09-05 | 2019-08-26 | 画像処理装置、画像処理方法及び画像処理プログラム |
US17/273,157 US11546588B2 (en) | 2018-09-05 | 2019-08-26 | Image processing apparatus, image processing method and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018166303A JP7075012B2 (ja) | 2018-09-05 | 2018-09-05 | 画像処理装置、画像処理方法及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020039087A true JP2020039087A (ja) | 2020-03-12 |
JP7075012B2 JP7075012B2 (ja) | 2022-05-25 |
Family
ID=69722555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018166303A Active JP7075012B2 (ja) | 2018-09-05 | 2018-09-05 | 画像処理装置、画像処理方法及び画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11546588B2 (ja) |
JP (1) | JP7075012B2 (ja) |
WO (1) | WO2020050089A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180131953A1 (en) * | 2015-03-31 | 2018-05-10 | Magic Pony Technology Limited | Training end-to-end video processes |
WO2018095890A1 (en) * | 2016-11-23 | 2018-05-31 | Thomson Licensing | Methods and apparatuses for encoding and decoding video based on perceptual metric classification |
JP2018516412A (ja) * | 2015-06-05 | 2018-06-21 | ソニー株式会社 | 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018033137A1 (zh) * | 2016-08-19 | 2018-02-22 | 北京市商汤科技开发有限公司 | 在视频图像中展示业务对象的方法、装置和电子设备 |
US10798387B2 (en) * | 2016-12-12 | 2020-10-06 | Netflix, Inc. | Source-consistent techniques for predicting absolute perceptual video quality |
US11113800B2 (en) * | 2017-01-18 | 2021-09-07 | Nvidia Corporation | Filtering image data using a neural network |
US10699160B2 (en) * | 2017-08-23 | 2020-06-30 | Samsung Electronics Co., Ltd. | Neural network method and apparatus |
US11216698B2 (en) * | 2018-02-16 | 2022-01-04 | Spirent Communications, Inc. | Training a non-reference video scoring system with full reference video scores |
US10916003B2 (en) * | 2018-03-20 | 2021-02-09 | Uber Technologies, Inc. | Image quality scorer machine |
US11055819B1 (en) * | 2018-09-27 | 2021-07-06 | Amazon Technologies, Inc. | DualPath Deep BackProjection Network for super-resolution |
US10877540B2 (en) * | 2019-10-04 | 2020-12-29 | Intel Corporation | Content adaptive display power savings systems and methods |
-
2018
- 2018-09-05 JP JP2018166303A patent/JP7075012B2/ja active Active
-
2019
- 2019-08-26 WO PCT/JP2019/033317 patent/WO2020050089A1/ja active Application Filing
- 2019-08-26 US US17/273,157 patent/US11546588B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180131953A1 (en) * | 2015-03-31 | 2018-05-10 | Magic Pony Technology Limited | Training end-to-end video processes |
JP2018516412A (ja) * | 2015-06-05 | 2018-06-21 | ソニー株式会社 | 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 |
WO2018095890A1 (en) * | 2016-11-23 | 2018-05-31 | Thomson Licensing | Methods and apparatuses for encoding and decoding video based on perceptual metric classification |
Non-Patent Citations (2)
Title |
---|
GATYS, LEON A. ET AL.: "Image Style Transfer Using Convolutional Neural Networks", 2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, JPN6019041592, 12 December 2016 (2016-12-12), pages 2414 - 2423, ISSN: 0004607578 * |
YANG, RUOZHANG ET AL.: "No-reference image quality assessment based on deep learning method", 2017 IEEE 3RD INFORMATION TECHNOLOGY AND MECHATRONICS ENGINEERING CONFERENCE (ITOEC), JPN6019041593, 1 December 2017 (2017-12-01), pages 476 - 479, ISSN: 0004607579 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020050089A1 (ja) | 2020-03-12 |
US20210329232A1 (en) | 2021-10-21 |
US11546588B2 (en) | 2023-01-03 |
JP7075012B2 (ja) | 2022-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7168896B2 (ja) | 画像符号化方法、及び画像復号方法 | |
US11335034B2 (en) | Systems and methods for image compression at multiple, different bitrates | |
JP2023532397A (ja) | ポストフィルタリングのためのコンテンツ適応型オンライン訓練方法、装置およびコンピュータプログラム | |
CN116349225B (zh) | 视频解码方法和装置、电子设备和存储介质 | |
JP2009503977A (ja) | 多次元デジタル信号のフィルタリング方法及び装置、並びに、関連する符号化/復号化方法及び装置 | |
CN110753225A (zh) | 一种视频压缩方法、装置及终端设备 | |
JP7434604B2 (ja) | ニューラル画像圧縮における画像置換を用いたコンテンツ適応型オンライン訓練 | |
Cui et al. | An efficient deep quantized compressed sensing coding framework of natural images | |
Zhou et al. | $\ell_ {2} $ Restoration of $\ell_ {\infty} $-Decoded Images Via Soft-Decision Estimation | |
CN110730347A (zh) | 图像压缩方法、装置及电子设备 | |
JP7141007B2 (ja) | 符号化装置、符号化方法及びプログラム | |
WO2020050089A1 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
Petrov et al. | Intra frame compression and video restoration based on conditional markov processes theory | |
CN115665413A (zh) | 图像压缩最优量化参数的估计方法 | |
CN106447610B (zh) | 图像重建方法及装置 | |
US20180020217A1 (en) | Image encoding apparatus, image decoding apparatus, and control methods therefor | |
WO2020050075A1 (ja) | 符号量推定装置、符号量推定方法及び符号量推定プログラム | |
US20210377523A1 (en) | Encoding device, encoding method, decoding device, and decoding method | |
JP4784386B2 (ja) | 復号化装置、逆量子化方法及びプログラム | |
JP2016082395A (ja) | 符号化装置、符号化方法及びプログラム | |
JP3299073B2 (ja) | 量子化装置及び量子化方法 | |
JP2019205010A (ja) | 符号化装置、画像補間システム及び符号化プログラム | |
US20220321879A1 (en) | Processing image data | |
JP7406208B2 (ja) | 符号化装置、符号化方法及びプログラム | |
Presta et al. | STanH: Parametric Quantization for Variable Rate Learned Image Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7075012 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |