JP2022129683A - Image encoding device, image encoding method, image decoding device, and image decoding method - Google Patents

Image encoding device, image encoding method, image decoding device, and image decoding method Download PDF

Info

Publication number
JP2022129683A
JP2022129683A JP2021028459A JP2021028459A JP2022129683A JP 2022129683 A JP2022129683 A JP 2022129683A JP 2021028459 A JP2021028459 A JP 2021028459A JP 2021028459 A JP2021028459 A JP 2021028459A JP 2022129683 A JP2022129683 A JP 2022129683A
Authority
JP
Japan
Prior art keywords
image
block
input image
map
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021028459A
Other languages
Japanese (ja)
Inventor
昂 深堀
Akira Fukabori
ケビン 梶谷
Kevin Kajiya
雅博 筒
Masahiro Tsutsu
チャリス ラサンサ フェルナンド
Lasantha Fernando Charith
哲 孫
Ze Son
信 吉澤
Makoto Yoshizawa
隆士 道川
Takashi Michikawa
秀夫 横田
Hideo Yokota
茂穂 野田
Shigeo Noda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RIKEN Institute of Physical and Chemical Research
Avatarin Inc
Original Assignee
RIKEN Institute of Physical and Chemical Research
Avatarin Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RIKEN Institute of Physical and Chemical Research, Avatarin Inc filed Critical RIKEN Institute of Physical and Chemical Research
Priority to JP2021028459A priority Critical patent/JP2022129683A/en
Publication of JP2022129683A publication Critical patent/JP2022129683A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

To provide an image encoding device capable of compressing an input image without degrading its image quality.SOLUTION: An image encoding device 10 includes: a saliency map generation unit 12 that generates a saliency map of an input image from the input image; a gradient intensity map generation unit 13 that generates a gradient intensity map of the input image from the input image; an importance map generation unit 14 that generates an importance map of the input image from the saliency map and the gradient intensity map; and an image compression unit 15 that compresses the input image using the importance map.SELECTED DRAWING: Figure 2

Description

本発明は、画像符号化装置、画像符号化方法、画像復号化装置、及び画像復号化方法に関わる。 The present invention relates to an image encoding device, an image encoding method, an image decoding device, and an image decoding method.

動画像の圧縮符号化技術については、例えば、ISO/IEC(International Organization for Standardization/International Electrotechnical Commission)による標準規格として、MPEG規格(H.265/HEVC)が知られている。HEVCでは、4K(3840×2160画素)画像や、8K(7680×4320画素)画像に対する符号化方式などを規定している。 MPEG standard (H.265/HEVC) is known as a standard by ISO/IEC (International Organization for Standardization/International Electrotechnical Commission) for compression encoding technology of moving images. HEVC defines encoding methods for 4K (3840×2160 pixels) images and 8K (7680×4320 pixels) images.

今後、8K画像などの高精細な動画再生のニーズが高まることが予想されており、大容量の画像を、品質を劣化させることなく圧縮し、低遅延で伝送する技術の開発が望まれている。 In the future, it is expected that the need for high-definition video playback such as 8K images will increase, and the development of technology that compresses large-capacity images without degrading quality and transmits them with low delay is desired. .

そこで、本発明は、入力画像を、その画質を劣化させることなく、圧縮することのできる画像符号化装置及び画像符号化方法を提案することを課題とする。 Accordingly, an object of the present invention is to propose an image coding apparatus and an image coding method capable of compressing an input image without degrading its image quality.

上述の課題を解決するため、本発明に関わる画像符号化装置は、入力画像から入力画像の顕著性マップを生成する顕著性マップ生成部と、入力画像から入力画像の勾配強度マップを生成する勾配強度マップ生成部と、顕著性マップ及び勾配強度マップから入力画像の重要度マップを生成する重要度マップ生成部と、重要度マップを用いて入力画像を圧縮する画像圧縮部を備える。重要度マップを用いた画像圧縮により、画質を劣化させることなく、効率のよい画像圧縮を実現できる。 In order to solve the above-described problems, the image coding apparatus according to the present invention includes a saliency map generation unit that generates a saliency map of an input image from an input image, and a gradient map that generates a gradient intensity map of the input image from the input image. An intensity map generator, an importance map generator for generating an importance map of the input image from the saliency map and the gradient intensity map, and an image compressor for compressing the input image using the importance map. Image compression using an importance map can achieve efficient image compression without degrading image quality.

画像圧縮部は、入力画像を複数のブロックに分割する分割部と、ブロック内の複数の画素のそれぞれに対応する重要度マップの値の総和をブロック内の画素数で割った値を正規化した値をブロックのサンプリングレートとして計算する処理を各ブロックについて実行する計算部と、ブロック毎に計算されたサンプリングレートで各ブロックをサンプリングするサンプリング部と、サンプリングされた各ブロックを符号化する符号化部とを備えてもよい。これにより、各ブロックの重要度に応じて、ブロック毎にサンプリングレートを適応的に変えることができ、画質を劣化させることなく、効率のよい画像圧縮を実現できる。 The image compression unit divides the input image into a plurality of blocks, and normalizes the value obtained by dividing the sum of the values of the importance map corresponding to each of the plurality of pixels in the block by the number of pixels in the block. A calculation unit that executes processing for each block to calculate a value as the sampling rate of the block, a sampling unit that samples each block at the sampling rate calculated for each block, and an encoding unit that encodes each sampled block. and may be provided. As a result, the sampling rate can be adaptively changed for each block according to the importance of each block, and efficient image compression can be realized without degrading the image quality.

本発明に関わる画像復号化装置は、本発明に関わる画像符号化装置により符号化された入力画像の各ブロックを復号化する画像復号化装置であって、符号化された各ブロックを復号化する復号化部と、復号化された各ブロックから、画像補間方法により、入力画像の復元画像を生成する画像復元部と、重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算する画質評価部とを備える。重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算することにより、画像の重要度に応じた適切な画質評価を行うことができる。 An image decoding apparatus according to the present invention is an image decoding apparatus that decodes each block of an input image encoded by the image encoding apparatus according to the present invention, and decodes each encoded block. an image restoration unit that generates a restored image of the input image from each decoded block by an image interpolation method; and an image quality evaluator for calculating. By calculating the image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor, it is possible to perform appropriate image quality evaluation according to the importance of the image.

本発明に関わる画像符号化方法は、入力画像から入力画像の顕著性マップを生成するステップと、入力画像から入力画像の勾配強度マップを生成するステップと、顕著性マップ及び勾配強度マップから入力画像の重要度マップを生成するステップと、重要度マップを用いて入力画像を圧縮するステップとを含む。重要度マップを用いた画像圧縮により、画質を劣化させることなく、効率のよい画像圧縮を実現できる。 An image coding method according to the present invention comprises the steps of generating a saliency map of the input image from the input image; generating a gradient intensity map of the input image from the input image; and compressing the input image using the importance map. Image compression using an importance map can achieve efficient image compression without degrading image quality.

入力画像を圧縮するステップは、入力画像を複数のブロックに分割するステップと、ブロック内の複数の画素のそれぞれに対応する重要度マップの値の総和をブロック内の画素数で割った値を正規化した値をブロックのサンプリングレートとして計算する処理を各ブロックについて実行するステップと、ブロック毎に計算されたサンプリングレートで各ブロックをサンプリングするステップと、サンプリングされた各ブロックを符号化するステップとを含んでもよい。これにより、各ブロックの重要度に応じて、ブロック毎にサンプリングレートを適応的に変えることができ、画質を劣化させることなく、効率のよい画像圧縮を実現できる。 The step of compressing the input image includes dividing the input image into a plurality of blocks, and normalizing the sum of the values of the importance map corresponding to each of the plurality of pixels in the block divided by the number of pixels in the block. a step of calculating the unitized value as the sampling rate of the block for each block, a step of sampling each block at the sampling rate calculated for each block, and a step of encoding each sampled block. may contain. As a result, the sampling rate can be adaptively changed for each block according to the importance of each block, and efficient image compression can be realized without degrading the image quality.

本発明に関わる画像復号化方法は、本発明に関わる画像符号化方法により符号化された入力画像の各ブロックを復号化する画像復号化方法であって、符号化された各ブロックを復号化するステップと、復号化された各ブロックから、画像補間方法により、入力画像の復元画像を生成するステップと、重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算するステップとを含む。重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算することにより、画像の重要度に応じた適切な画質評価を行うことができる。 An image decoding method according to the present invention is an image decoding method for decoding each block of an input image encoded by the image encoding method according to the present invention, and decoding each encoded block. generating a restored image of the input image from each decoded block by an image interpolation method; and calculating an image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor. including. By calculating the image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor, it is possible to perform appropriate image quality evaluation according to the importance of the image.

本発明によれば、入力画像を、その画質を劣化させることなく、効率的に圧縮することができる。 According to the present invention, an input image can be efficiently compressed without degrading its image quality.

本発明の実施形態に関わる画像符号化装置のハードウェア構成を示す説明図である。1 is an explanatory diagram showing the hardware configuration of an image encoding device according to an embodiment of the present invention; FIG. 本発明の実施形態に関わる画像符号化装置の機能ブロック図である。1 is a functional block diagram of an image encoding device according to an embodiment of the present invention; FIG. 本発明の実施形態に関わる画像復号化装置のハードウェア構成を示す説明図である。1 is an explanatory diagram showing the hardware configuration of an image decoding device according to an embodiment of the present invention; FIG. 本発明の実施形態に関わる画像復号化装置の機能ブロック図である。1 is a functional block diagram of an image decoding device according to an embodiment of the present invention; FIG. 本発明の実施形態に関わる画像入力部に入力される入力画像の一例を示す図である。It is a figure which shows an example of the input image input into the image input part in connection with embodiment of this invention. 本発明の実施形態に関わる顕著性マップ生成部により生成される顕著性マップの一例を示す図である。It is a figure which shows an example of the saliency map produced|generated by the saliency map production|generation part in connection with embodiment of this invention. 本発明の実施形態に関わる勾配強度マップ生成部により生成される勾配強度マップの一例を示す図である。It is a figure which shows an example of the gradient intensity|strength map produced|generated by the gradient intensity|strength map production|generation part in connection with embodiment of this invention. 本発明の実施形態に関わるサンプリング部によりサンプリングされる入力画像の一例を示す図である。It is a figure which shows an example of the input image sampled by the sampling part in connection with embodiment of this invention. 本発明の実施形態に関わる復号化部により復号される入力画像の一例を示す図である。It is a figure which shows an example of the input image decoded by the decoding part in connection with embodiment of this invention. 本発明の実施形態に関わる画像復元部により復元される入力画像の一例を示す図である。It is a figure which shows an example of the input image restored by the image restoration part in connection with embodiment of this invention.

以下、図面を参照しながら本発明の実施形態について説明する。ここで、同一符号は同一の構成要素を示すものとし、重複する説明は省略する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. Here, the same reference numerals denote the same components, and duplicate descriptions are omitted.

図1は本発明の実施形態に関わる画像符号化装置10のハードウェア構成を示す説明図である。画像符号化装置10は、プロセッサ101、メモリ102、記憶装置103、カメラ104、及び通信装置105を備えている。記憶装置103は、オペレーティングシステム106及び画像処理プログラム107などのソフトウェア資源を格納している。これらのソフトウェア資源は、メモリ102に読み込まれ、プロセッサ101により実行される。 FIG. 1 is an explanatory diagram showing the hardware configuration of an image encoding device 10 according to an embodiment of the invention. The image encoding device 10 includes a processor 101 , memory 102 , storage device 103 , camera 104 and communication device 105 . The storage device 103 stores software resources such as an operating system 106 and an image processing program 107 . These software resources are loaded into memory 102 and executed by processor 101 .

図2は本発明の実施形態に関わる画像符号化装置10の機能ブロック図である。プロセッサ101、メモリ102、記憶装置103、カメラ104、及び通信装置105などのハードウェア資源と、オペレーティングシステム106及び画像処理プログラム107などのソフトウェア資源との協働により、画像入力部11、顕著性マップ生成部12、勾配強度マップ生成部13、重要度マップ生成部14、画像圧縮部15、及び通信部16の機能が実現される。 FIG. 2 is a functional block diagram of the image encoding device 10 according to the embodiment of the invention. Hardware resources such as the processor 101, the memory 102, the storage device 103, the camera 104, and the communication device 105 cooperate with software resources such as the operating system 106 and the image processing program 107 to generate the image input unit 11 and the saliency map. The functions of the generation unit 12, the gradient intensity map generation unit 13, the importance map generation unit 14, the image compression unit 15, and the communication unit 16 are realized.

画像入力部11は、カメラ104によって撮影された動画を構成する入力画像を取り込む。 The image input unit 11 takes in input images that form a moving image captured by the camera 104 .

顕著性マップ生成部12は、入力画像から入力画像の顕著性マップを生成する。顕著性マップは、入力画像における領域ごとの目立ちやすさ、すなわち、人間の視覚における顕著さの空間分布を示す。顕著性マップは、入力画像中の点や領域に対して人間が瞬間的に注目する度合い、すなわち、顕著性の高さを数値化した顕著性値を算出することにより生成することができる。例えば、目の網膜にある網膜神経節細胞の中に受容野と呼ばれる領域があり、この受容野に光による刺激を受けると、その情報が脳に伝達される。受容野は、中央にある円形の部分とその周辺領域との2つで構成されている。このような受容野における仕組みを利用し、中央にある円形の部分とその周辺領域との刺激により信号が強くなる箇所(注意を引く場所)を数値化するようなモデルを顕著性マップとして用いることができる。具体的には、入力画像からピラミッド画像を作成し、ガウシアンフィルタにより特徴を抽出することにより、顕著性マップを生成する手法が知られている。また、畳み込みニューラルネットワークの出力が入力の摂動に対してどのように変化するか解析することで顕著性マップを生成する手法が知られている。 The saliency map generator 12 generates a saliency map of the input image from the input image. A saliency map indicates the saliency of each region in the input image, that is, the spatial distribution of salience in human vision. A saliency map can be generated by calculating a saliency value that quantifies the degree to which a person instantly pays attention to a point or area in an input image, that is, the level of saliency. For example, retinal ganglion cells in the retina of the eye have a region called a receptive field, and when this receptive field is stimulated by light, the information is transmitted to the brain. The receptive field consists of two parts, a central circular part and a peripheral area. Using such a mechanism in the receptive field, a model that quantifies the point where the signal becomes strong due to the stimulation of the circular area in the center and the surrounding area (place that attracts attention) is used as a saliency map. can be done. Specifically, a method of generating a saliency map by creating a pyramid image from an input image and extracting features using a Gaussian filter is known. Also known is a method of generating a saliency map by analyzing how the output of a convolutional neural network changes with respect to input perturbations.

勾配強度マップ生成部13は、入力画像から入力画像の勾配強度マップを生成する。勾配強度マップは、入力画像の各画素の勾配強度値(すなわち、画素の輝度の差)の空間分布を示す。例えば、x方向及びy方向を、互いに直交する二方向とし、ある画素のx方向の勾配強度値をExとし、y方向の勾配強度値をEyとすると、その勾配強度値Eは、Ex及びEyの二乗和の平方根として算出される。勾配強度マップは、入力画像のエッジの空間分布を示す。 The gradient intensity map generation unit 13 generates a gradient intensity map of the input image from the input image. The gradient strength map shows the spatial distribution of the gradient strength values (ie, pixel intensity differences) for each pixel in the input image. For example, the x direction and the y direction are two directions orthogonal to each other, and the gradient strength value in the x direction of a certain pixel is Ex, and the gradient strength value in the y direction is Ey. is calculated as the square root of the sum of squares of A gradient intensity map shows the spatial distribution of the edges of the input image.

重要度マップ生成部14は、顕著性マップ及び勾配強度マップから入力画像の重要度マップを生成する。重要度マップは、入力画像の各画素の重要度値の空間分布を示す。重要度マップ生成部14は、入力画像の顕著さの空間分布を示す顕著性マップと、入力画像のエッジの空間分布を示す勾配強度マップとを組み合わせて重要度マップを生成する。このようにして生成された重要度マップは、入力画像の顕著性の高い部分と、入力画像のエッジ部分とを、他の部分(顕著性の低い部分又はエッジでない部分)よりも、相対的に視覚的な重要度の高い部分として、各画素の重要度値の空間分布を示す。 The importance map generator 14 generates an importance map of the input image from the saliency map and the gradient intensity map. The importance map shows the spatial distribution of importance values for each pixel of the input image. The importance map generating unit 14 generates an importance map by combining a saliency map indicating the spatial distribution of salience of the input image and a gradient intensity map indicating the spatial distribution of edges of the input image. The importance map generated in this way shows the high salience portion of the input image and the edge portion of the input image relative to other portions (low salience portions or non-edge portions). The spatial distribution of the importance value of each pixel is shown as a portion of high visual importance.

例えば、入力画像がl行w列の画素値の行列Iとして表されるものとし、入力画像の顕著性マップがl行w列の顕著性値の行列Sとして表されるものとし、入力画像の勾配強度マップがl行w列の勾配強度値の行列Gとして表されるものとし、入力画像の重要度マップがl行w列の重要度値の行列IMとして表されるものとする。行列Iのi行j列目の要素I(i,j)は、i行j列目の画素の値を示す。行列Sのi行j列目の要素S(i,j)は、i行j列目の画素の顕著性値を示す。行列Gのi行j列目の要素G(i,j)は、i行j列目の画素の勾配強度値を示す。行列IMのi行j列目の要素IM(i,j)は、i行j列目の画素の重要度値を示す。但し、1≦i≦l、且つ、1≦j≦wである。 For example, the input image is represented as a matrix I of l rows and w columns of pixel values, and the saliency map of the input image is represented as a matrix S of l rows and w columns of saliency values. Let the gradient magnitude map be represented as a matrix G of l rows and w columns of gradient magnitude values, and let the importance map of the input image be represented as a matrix IM of l rows and w columns of importance values. An element I(i,j) at the i-th row and j-th column of the matrix I indicates the value of the i-th row and j-th column pixel. An element S(i,j) at the i-th row and j-th column of the matrix S indicates the saliency value of the i-th row and j-th column pixel. An element G(i,j) at the i-th row and j-th column of the matrix G indicates the gradient intensity value of the i-th row and j-th column pixel. An element IM(i,j) at the i-th row and j-th column of the matrix IM indicates the importance value of the i-th row and j-th column pixel. However, 1≤i≤l and 1≤j≤w.

重要度マップ生成部14は、例えば、以下に示す(1)式~(3)式のうち何れかの式により、IM(i,j)を算出してもよい。 The importance map generation unit 14 may calculate IM(i, j) by, for example, one of the following formulas (1) to (3).

IM(i,j)={S(i,j)+G(i,j)}n/2n …(1) IM(i, j)={S(i, j)+G(i, j)} n /2 n (1)

IM(i,j)={S(i,j)}n (S(i,j)>G(i,j)のとき)
IM(i,j)={G(i,j)}n (G(i,j)>S(i,j)のとき)…(2)
IM(i,j)={S(i,j)} n (when S(i,j)>G(i,j))
IM(i,j)={G(i,j)} n (when G(i,j)>S(i,j)) (2)

IM(i,j)=α{S(i,j)}n1+(1-α){G(i,j)}n2 …(3) IM(i,j)=α{S(i,j)} n1 +(1−α){G(i,j)} n2 (3)

但し、0<n<1、0<n1<1、0<n2<1、及び0<α<1の関係を満たすものとする。 However, the relationships 0<n<1, 0<n1<1, 0<n2<1, and 0<α<1 are satisfied.

画像圧縮部15は、重要度マップを用いて入力画像を圧縮する。画像圧縮部15は、分割部151、計算部152、サンプリング部153、及び符号化部154を備える。 The image compression unit 15 compresses the input image using the importance map. The image compression unit 15 includes a division unit 151 , a calculation unit 152 , a sampling unit 153 and an encoding unit 154 .

分割部151は、入力画像を複数のブロックに分割する。ここで、ブロックは、複数の画素を含む符号化単位であり、符号化ツリーユニット(CTU)と呼ばれる。 A dividing unit 151 divides an input image into a plurality of blocks. Here, a block is a coding unit containing a plurality of pixels, and is called a coding tree unit (CTU).

計算部152は、複数のブロックのうちあるブロック内の複数の画素のそれぞれに対応する重要度マップの値(重要度値)の総和をそのブロック内の画素数で割った値を、例えば、0から1の範囲で正規化した値(正規化値)を、そのブロックのサンプリングレートとして計算する処理を実行する。すなわち、あるブロックのサンプリングレートは、そのブロック内の複数の画素のそれぞれの重要度値の平均値を正規化した値として計算される。計算部152は、サンプリングレートを計算する処理を各ブロックについて実行する。 Calculation unit 152 calculates a value obtained by dividing the sum of importance map values (importance values) corresponding to a plurality of pixels in a block among the plurality of blocks by the number of pixels in the block, for example, 0. to 1 (normalized value) is calculated as the sampling rate of the block. That is, the sampling rate of a certain block is calculated as a value obtained by normalizing the average value of the respective importance values of the plurality of pixels within that block. The calculation unit 152 executes processing for calculating the sampling rate for each block.

サンプリング部153は、ブロック毎に計算されたサンプリングレートで各ブロックをサンプリングする。サンプリングレートは、ブロック毎に算出された重要度値の平均値を正規化した値に応じて異なり得るため、各ブロックの重要度に応じて、ブロック毎にサンプリングレートを適応的に変えることができる。これにより、画質を劣化させることなく、効率のよい画像圧縮を実現できる。 The sampling unit 153 samples each block at the sampling rate calculated for each block. Since the sampling rate can vary according to the normalized average value of the importance values calculated for each block, the sampling rate can be adaptively changed for each block according to the importance of each block. . As a result, efficient image compression can be achieved without degrading image quality.

符号化部154は、サンプリングされた各ブロックを符号化する。各ブロックの符号化方式として、例えば、ハフマン符号化方式を用いることができる。 The encoder 154 encodes each sampled block. As an encoding method for each block, for example, the Huffman encoding method can be used.

通信部16は、符号化部154により符号化された情報を、通信網を通じて外部に送信する。通信網は、無線ネットワーク、有線ネットワーク、又は無線ネットワークと有線ネットワークとが混在するネットワークでもよい。 The communication unit 16 transmits the information encoded by the encoding unit 154 to the outside through the communication network. The communication network may be a wireless network, a wired network, or a mixed network of wireless and wired networks.

図3は本発明の実施形態に関わる画像復号化装置20のハードウェア構成構成を示す説明図である。画像復号化装置20は、プロセッサ201、メモリ202、記憶装置203、画像表示装置204、及び通信装置205を備えている。記憶装置203は、オペレーティングシステム206及び画像処理プログラム207などのソフトウェア資源を格納している。これらのソフトウェア資源は、メモリ202に読み込まれ、プロセッサ201により実行される。 FIG. 3 is an explanatory diagram showing the hardware configuration of the image decoding device 20 according to the embodiment of the present invention. The image decoding device 20 includes a processor 201 , a memory 202 , a storage device 203 , an image display device 204 and a communication device 205 . The storage device 203 stores software resources such as an operating system 206 and an image processing program 207 . These software resources are loaded into memory 202 and executed by processor 201 .

図4は本発明の実施形態に関わる画像復号化装置20の機能ブロック図である。プロセッサ201、メモリ202、記憶装置203、画像表示装置204、及び通信装置205などのハードウェア資源と、オペレーティングシステム206及び画像処理プログラム207などのソフトウェア資源との協働により、通信部21、復号化部22、画像復元部23、画像出力部24、及び画質評価部25の機能が実現されている。 FIG. 4 is a functional block diagram of the image decoding device 20 according to the embodiment of the invention. Hardware resources such as the processor 201, the memory 202, the storage device 203, the image display device 204, and the communication device 205 cooperate with software resources such as the operating system 206 and the image processing program 207 to enable the communication unit 21, the decoding Functions of the unit 22, the image restoration unit 23, the image output unit 24, and the image quality evaluation unit 25 are realized.

通信部21は、画像符号化装置10から送信される符号化された情報を、通信網を通じて受信する。 The communication unit 21 receives encoded information transmitted from the image encoding device 10 through a communication network.

復号化部22は、符号化された各ブロックを復号化する。各ブロックの復号化方式として、例えば、ハフマン復号化方式を用いることができる。 The decoding unit 22 decodes each encoded block. As a decoding method for each block, for example, a Huffman decoding method can be used.

画像復元部23は、復号化された各ブロックから、画像補間方法により、入力画像の復元画像を生成する。画像補間方法として、例えば、(1)テンソル復元に基づく方法、(2)低次元多模体モデルに基づく方法、(3)構造化行列のランク最小化に基づく方法、(4)特異値分解に基づく方法、(5)深層学習に基づく方法、及び(6)離散フーリエ変換に基づく方法などを挙げることができる。 The image restoration unit 23 generates a restored image of the input image from each decoded block by an image interpolation method. Examples of image interpolation methods include (1) a method based on tensor reconstruction, (2) a method based on a low-dimensional multi-body model, (3) a method based on rank minimization of a structured matrix, and (4) singular value decomposition. (5) a method based on deep learning, and (6) a method based on discrete Fourier transform.

テンソル復元に基づく方法に言及した文献として、例えば、(A)Zhao Q, Zhang L, Cichocki A. Bayesian CP factorization of incomplete tensors with automatic rank determination. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(9): 1751-1763、及び(B)Chen Y L, Hsu C T, Liao H Y M. Simultaneous tensor decomposition and completion using factor priors. IEEE transactions on pattern analysis and machine intelligence, 2013, 36(3): 577-591などがある。 References to methods based on tensor reconstruction include, for example, (A) Zhao Q, Zhang L, Cichocki A. Bayesian CP factorization of incomplete tensors with automatic rank determination. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(9 ): 1751-1763, and (B) Chen Y L, Hsu C T, Liao H Y M. Simultaneous tensor decomposition and completion using factor priors. IEEE transactions on pattern analysis and machine intelligence, 2013, 36(3): 577-591, etc. be.

低次元多模体モデルに基づく方法に言及した文献として、例えば、Yokota T, Hontani H, Zhao Q, et al. Manifold Modeling in Embedded Space: An Interpretable Alternative to Deep Image Prior. IEEE Transactions on Neural Networks and Learning Systems, 2020などがある。 For example, Yokota T, Hontani H, Zhao Q, et al. Manifold Modeling in Embedded Space: An Interpretable Alternative to Deep Image Prior. IEEE Transactions on Neural Networks and Learning Systems, 2020, etc.

構造化行列のランク最小化に基づく方法に言及した文献として、例えば、Takahashi T, Konishi K, Furukawa T. Structured matrix rank minimization approach to image inpainting, IEEE 55th International Midwest Symposium on Circuits and Systems (MWSCAS). IEEE, 2012: 860-863などがある。 Takahashi T, Konishi K, Furukawa T. Structured matrix rank minimization approach to image inpainting, IEEE 55th International Midwest Symposium on Circuits and Systems (MWSCAS). , 2012: 860-863.

特異値分解に基づく方法に言及した文献として、例えば、Song L, Du B, Zhang L, et al. Nonlocal patch based T-SVD for image inpainting: Algorithm and error analysis, Proceedings of the AAAI Conference on Artificial Intelligence. 2018, 32(1) などがある。 For example, Song L, Du B, Zhang L, et al. Nonlocal patch based T-SVD for image inpainting: Algorithm and error analysis, Proceedings of the AAAI Conference on Artificial Intelligence. 2018, 32(1), etc.

深層学習に基づく方法に言及した文献として、例えば、Ulyanov D, Vedaldi A, Lempitsky V. Deep image prior, Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 9446-9454などがある。 References to deep learning-based methods include, for example, Ulyanov D, Vedaldi A, Lempitsky V. Deep image prior, Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 9446-9454.

離散フーリエ変換に基づく方法に言及した文献として、例えば、Sridevi G, Kumar S S. Image inpainting based on fractional-order nonlinear diffusion for image reconstruction. Circuits, Systems, and Signal Processing, 2019, 38(8): 3802-3817などがある。 References to methods based on discrete Fourier transform include, for example, Sridevi G, Kumar S S. Image inpainting based on fractional-order nonlinear diffusion for image reconstruction. Circuits, Systems, and Signal Processing, 2019, 38(8): 3802 -3817 and so on.

画像出力部24は、復元画像を映像表示する。映像表示される復元画像は、動画でもよく、或いは静止画でもよい。 The image output unit 24 video-displays the restored image. The restored image to be displayed may be a moving image or a still image.

画質評価部25は、重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算する。 The image quality evaluation unit 25 calculates the image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor.

画質評価値として、MSE(Mean Square Error)及びPSNR(Peak Signal-to- Noise Ratio)を用いる場合、画質評価部25は、(4)式及び(5)式を用いて、MSE及びPSNRを計算する。 When MSE (Mean Square Error) and PSNR (Peak Signal-to-Noise Ratio) are used as image quality evaluation values, the image quality evaluation unit 25 calculates MSE and PSNR using equations (4) and (5). do.

Figure 2022129683000002
Figure 2022129683000002

Figure 2022129683000003
Figure 2022129683000003

(4)式において、IMWMSE(i,j)は、入力画像のi行j列目の画素のMSEを示す。O(i,j)は、復元画像のi行j列目の画素値を示す。W(i,j)は、入力画像のi行j列目の画素の画質評価に用いられる重み係数を示す。画質評価部25は、W(i,j)=IM(i,j)として、(1)式から、IMWMSE(i,j)を計算する。 In equation (4), IMWMSE(i,j) indicates the MSE of the pixel at the i-th row and the j-th column of the input image. O(i, j) indicates the pixel value of the i-th row and j-th column of the restored image. W(i, j) indicates a weighting factor used for image quality evaluation of the i-th row and j-th column pixel of the input image. The image quality evaluation unit 25 sets W(i, j)=IM(i, j) and calculates IMWMSE(i, j) from equation (1).

なお、復元画像の画像評価は、全ての入力画像の復元中に必ずしも行う必要はなく、画像評価を要する特定の入力画像を復元するときに行えばよい。画質評価部25による復元画像の画像評価が行われる場合には、画像符号化装置10の通信部16から画像復号化装置20の通信部21に入力画像の重要度マップの情報が送信される。通信部21は、受信した重要度マップの情報を画質評価部25に転送する。重要度マップの情報を通信部21から受け取った画質評価部25は、W(i,j)=IM(i,j)として、(1)式から、IMWMSE(i,j)を計算することができる。 Note that the image evaluation of the restored image does not necessarily have to be performed during restoration of all input images, and may be performed when restoring a specific input image that requires image evaluation. When image evaluation of the restored image is performed by the image quality evaluation unit 25 , the communication unit 16 of the image encoding device 10 transmits information of the importance map of the input image to the communication unit 21 of the image decoding device 20 . The communication unit 21 transfers the received importance map information to the image quality evaluation unit 25 . The image quality evaluation unit 25 that has received the importance map information from the communication unit 21 can calculate IMWMSE(i, j) from equation (1) with W(i, j)=IM(i, j). can.

(5)式において、IMWPSNR(i,j)は、入力画像のi行j列目の画素のPSNRを示す。MAX(I・W)2は、画素値の取り得る最大値を示す。例えば、画素値が8ビットで表現される場合、MAX(I・W)2は、255である。画質評価部25は、(2)式から、IMWPSNR(i,j)を計算する。 In equation (5), IMWPSNR(i, j) indicates the PSNR of the pixel at the i-th row and the j-th column of the input image. MAX(I·W) 2 indicates the maximum possible pixel value. For example, MAX(I·W) 2 is 255 when the pixel value is represented by 8 bits. Image quality evaluation unit 25 calculates IMWPSNR(i, j) from equation (2).

画質評価値として、SSIM(Structural similarity index)を用いる場合、画質評価部25は、(6)式~(8)式を用いて、SSIMを計算する。 When using an SSIM (Structural similarity index) as an image quality evaluation value, the image quality evaluation unit 25 calculates the SSIM using equations (6) to (8).

Figure 2022129683000004
Figure 2022129683000004

Figure 2022129683000005
Figure 2022129683000005

Figure 2022129683000006
Figure 2022129683000006

(8)式において、μIMIは、(6)式により計算されるIMI(i,j)の平均画素値を示す。μIMOは、(7)式により計算されるIMO(i,j)の平均画素値を示す。δIMIは、(6)式により計算されるIMI(i,j)の標準偏差を示す。δIMOは、(7)式により計算されるIMO(i,j)の標準偏差を示す。δIMIIMOは、IMI(i,j)とIMO(i,j)との共分散を示す。c1及びc2は、それぞれ、定数を示す。画質評価部25は、(6)式~(8)式から、IMWPSNR(i,j)を計算する。 In equation (8), μIMI indicates the average pixel value of IMI (i, j) calculated by equation (6). μ IMO indicates the average pixel value of IMO (i, j) calculated by equation (7). δIMI indicates the standard deviation of IMI (i,j) calculated by equation (6). δ IMO indicates the standard deviation of IMO (i, j) calculated by equation (7). δIMIIMO denotes the covariance between IMI(i,j) and IMO(i,j). c1 and c2 each represent a constant. Image quality evaluation unit 25 calculates IMWPSNR(i, j) from equations (6) to (8).

通信部21は、画質評価部25により計算された画質評価値をフィードバック情報として、画像符号化装置10に送信する。画像符号化装置10は、通信部16を通じて、画質評価値を受信すると、受信した画質評価値を重要度マップ生成部14に転送する。重要度マップ生成部14は、画質評価値が向上するように、重要度マップを生成し直すことができる。例えば、重要度マップ生成部14は、画質評価値が向上するように、重要度マップの生成に用いられるパラメータ(例えば、(1)式~(3)式に記載のn、n1、n2、及びαなど)の値を更新してもよい。このように、重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算することにより、画像の重要度に応じた適切な画質評価を行うことができる。 The communication unit 21 transmits the image quality evaluation value calculated by the image quality evaluation unit 25 to the image encoding device 10 as feedback information. Upon receiving the image quality evaluation value through the communication unit 16 , the image encoding device 10 transfers the received image quality evaluation value to the importance map generation unit 14 . The importance map generator 14 can regenerate the importance map so as to improve the image quality evaluation value. For example, the importance map generation unit 14 uses parameters used for generating the importance map (for example, n, n1, n2, and α, etc.) may be updated. In this way, by calculating the image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor, it is possible to perform appropriate image quality evaluation according to the importance of the image.

なお、図5は、画像入力部11に入力される入力画像の一例を示す。図6は、顕著性マップ生成部12により生成される顕著性マップの一例を示す。図7は、勾配強度マップ生成部13により生成される勾配強度マップの一例を示す。図8は、サンプリング部153によりサンプリングされる入力画像の一例を示す。図9は、復号化部22により復号される入力画像の一例を示す。図10は、画像復元部23により復元される入力画像(復元画像)の一例を示す。 5 shows an example of an input image input to the image input unit 11. FIG. FIG. 6 shows an example of a saliency map generated by the saliency map generator 12. As shown in FIG. FIG. 7 shows an example of a gradient intensity map generated by the gradient intensity map generator 13. FIG. FIG. 8 shows an example of an input image sampled by the sampling unit 153. As shown in FIG. FIG. 9 shows an example of an input image decoded by the decoding unit 22. As shown in FIG. FIG. 10 shows an example of an input image (restored image) restored by the image restoration unit 23. As shown in FIG.

本発明の実施形態によれば、重要度マップを用いた画像圧縮により、画質を劣化させることなく、効率のよい画像圧縮を実現できる。特に、入力画像の各ブロックの重要度に応じて、ブロック毎にサンプリングレートを適応的に変えることができ、画質を劣化させることなく、効率のよい画像圧縮を実現できる。また、重要度マップの値を重み係数として入力画像に対する復元画像の画質評価値を計算することにより、画像の重要度に応じた適切な画質評価を行うことができる。 According to the embodiment of the present invention, image compression using an importance map can achieve efficient image compression without degrading image quality. In particular, the sampling rate can be adaptively changed for each block according to the importance of each block of the input image, and efficient image compression can be realized without degrading the image quality. Further, by calculating the image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor, it is possible to perform appropriate image quality evaluation according to the importance of the image.

本発明の実施形態によれば、効率よく画像圧縮できるため、動画像を低遅延で伝送することができる。例えば、遠隔医療システム、ロボットの遠隔制御システム、遠隔会議システム、又はバーチャル・リアリティ・システムなどの動画伝送に好適である。 According to the embodiments of the present invention, since image compression can be performed efficiently, moving images can be transmitted with low delay. For example, it is suitable for moving image transmission for telemedicine systems, remote control systems for robots, teleconferencing systems, or virtual reality systems.

なお、以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更/改良され得るととともに、本発明にはその等価物も含まれる。即ち、実施形態に当業者が適宜設計変更を加えたものも、本発明の特徴を備えている限り、本発明の範囲に包含される。また、実施形態が備える各要素は、技術的に可能な限りにおいて組み合わせることができ、これらを組み合わせたものも本発明の特徴を含む限り本発明の範囲に包含される。 In addition, the embodiment described above is intended to facilitate understanding of the present invention, and is not intended to limit and interpret the present invention. The present invention may be modified/improved without departing from its spirit, and the present invention also includes equivalents thereof. In other words, any design modifications made by those skilled in the art to the embodiments are also included in the scope of the present invention as long as they have the features of the present invention. In addition, each element provided in the embodiment can be combined as long as it is technically possible, and the combination thereof is also included in the scope of the present invention as long as it includes the features of the present invention.

10…画像符号化装置 11…画像入力部 12…顕著性マップ生成部 13…勾配強度マップ生成部 14…重要度マップ生成部 15…画像圧縮部 16…通信部 20…画像復号化装置 21…通信部 22…復号化部 23…画像復元部 24…画像出力部 25…画質評価部 151…分割部 152…計算部 153…サンプリング部 154…符号化部 REFERENCE SIGNS LIST 10 image encoding device 11 image input unit 12 saliency map generation unit 13 gradient intensity map generation unit 14 importance map generation unit 15 image compression unit 16 communication unit 20 image decoding device 21 communication Section 22 Decoding section 23 Image restoration section 24 Image output section 25 Image quality evaluation section 151 Division section 152 Calculation section 153 Sampling section 154 Encoding section

Claims (6)

入力画像から前記入力画像の顕著性マップを生成する顕著性マップ生成部と、
前記入力画像から前記入力画像の勾配強度マップを生成する勾配強度マップ生成部と、
前記顕著性マップ及び前記勾配強度マップから前記入力画像の重要度マップを生成する重要度マップ生成部と、
前記重要度マップを用いて前記入力画像を圧縮する画像圧縮部と、
を備える、画像符号化装置。
a saliency map generator that generates a saliency map of the input image from the input image;
a gradient intensity map generator that generates a gradient intensity map of the input image from the input image;
an importance map generator that generates an importance map of the input image from the saliency map and the gradient intensity map;
an image compression unit that compresses the input image using the importance map;
An image encoding device comprising:
請求項1に記載の画像符号化装置であって、
前記画像圧縮部は、
前記入力画像を複数のブロックに分割する分割部と、
ブロック内の複数の画素のそれぞれに対応する前記重要度マップの値の総和を前記ブロック内の画素数で割った値を正規化した値を前記ブロックのサンプリングレートとして計算する処理を各ブロックについて実行する計算部と、
ブロック毎に計算されたサンプリングレートで各ブロックをサンプリングするサンプリング部と、
サンプリングされた各ブロックを符号化する符号化部と、
を備える、画像符号化装置。
The image encoding device according to claim 1,
The image compression unit
a dividing unit that divides the input image into a plurality of blocks;
For each block, a process of calculating the sampling rate of the block by normalizing the value obtained by dividing the sum of the values of the importance map corresponding to each of the plurality of pixels in the block by the number of pixels in the block. a calculation unit that
a sampling unit that samples each block at a sampling rate calculated for each block;
an encoder that encodes each sampled block;
An image encoding device comprising:
請求項2に記載の画像符号化装置により符号化された前記入力画像の各ブロックを復号化する画像復号化装置であって、
符号化された各ブロックを復号化する復号化部と、
復号化された各ブロックから、画像補間方法により、前記入力画像の復元画像を生成する画像復元部と、
前記重要度マップの値を重み係数として前記入力画像に対する前記復元画像の画質評価値を計算する画質評価部と、
を備える、画像復号化装置。
An image decoding device for decoding each block of the input image encoded by the image encoding device according to claim 2,
a decoding unit that decodes each encoded block;
an image restoration unit that generates a restored image of the input image from each decoded block by an image interpolation method;
an image quality evaluation unit that calculates an image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor;
An image decoding device.
入力画像から前記入力画像の顕著性マップを生成するステップと、
前記入力画像から前記入力画像の勾配強度マップを生成するステップと、
前記顕著性マップ及び前記勾配強度マップから前記入力画像の重要度マップを生成するステップと、
前記重要度マップを用いて前記入力画像を圧縮するステップと、
を含む、画像符号化方法。
generating from an input image a saliency map of said input image;
generating a gradient intensity map of the input image from the input image;
generating an importance map of the input image from the saliency map and the gradient strength map;
compressing the input image using the importance map;
An image encoding method, comprising:
請求項4に記載の画像符号化方法であって、
前記入力画像を圧縮するステップは、
前記入力画像を複数のブロックに分割するステップと、
ブロック内の複数の画素のそれぞれに対応する前記重要度マップの値の総和を前記ブロック内の画素数で割った値を正規化した値を前記ブロックのサンプリングレートとして計算する処理を各ブロックについて実行するステップと、
ブロック毎に計算されたサンプリングレートで各ブロックをサンプリングするステップと、
サンプリングされた各ブロックを符号化するステップと、
を含む、画像符号化方法。
The image encoding method according to claim 4,
Compressing the input image comprises:
dividing the input image into a plurality of blocks;
For each block, a process of calculating the sampling rate of the block by normalizing the value obtained by dividing the sum of the values of the importance map corresponding to each of the plurality of pixels in the block by the number of pixels in the block. and
sampling each block at a sampling rate calculated for each block;
encoding each sampled block;
An image encoding method, comprising:
請求項5に記載の画像符号化方法により符号化された前記入力画像の各ブロックを復号化する画像復号化方法であって、
符号化された各ブロックを復号化するステップと、
復号化された各ブロックから、画像補間方法により、前記入力画像の復元画像を生成するステップと、
前記重要度マップの値を重み係数として前記入力画像に対する前記復元画像の画質評価値を計算するステップと、
を含む、画像復号化方法。
An image decoding method for decoding each block of the input image encoded by the image encoding method according to claim 5,
decoding each encoded block;
generating a restored image of the input image from each decoded block by an image interpolation method;
calculating an image quality evaluation value of the restored image with respect to the input image using the value of the importance map as a weighting factor;
An image decoding method comprising:
JP2021028459A 2021-02-25 2021-02-25 Image encoding device, image encoding method, image decoding device, and image decoding method Pending JP2022129683A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021028459A JP2022129683A (en) 2021-02-25 2021-02-25 Image encoding device, image encoding method, image decoding device, and image decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021028459A JP2022129683A (en) 2021-02-25 2021-02-25 Image encoding device, image encoding method, image decoding device, and image decoding method

Publications (1)

Publication Number Publication Date
JP2022129683A true JP2022129683A (en) 2022-09-06

Family

ID=83150903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021028459A Pending JP2022129683A (en) 2021-02-25 2021-02-25 Image encoding device, image encoding method, image decoding device, and image decoding method

Country Status (1)

Country Link
JP (1) JP2022129683A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023032518A1 (en) * 2021-09-06 2023-03-09 Nec Corporation Data compression system and method of using

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023032518A1 (en) * 2021-09-06 2023-03-09 Nec Corporation Data compression system and method of using
US11764806B2 (en) 2021-09-06 2023-09-19 Nec Corporation Data compression system and method of using

Similar Documents

Publication Publication Date Title
Zheng et al. Implicit dual-domain convolutional network for robust color image compression artifact reduction
US10834415B2 (en) Devices for compression/decompression, system, chip, and electronic device
Lee et al. Context-adaptive entropy model for end-to-end optimized image compression
CN108520503B (en) Face defect image restoration method based on self-encoder and generation countermeasure network
CN110798690B (en) Video decoding method, and method, device and equipment for training loop filtering model
CN110222758B (en) Image processing method, device, equipment and storage medium
CN112465727A (en) Low-illumination image enhancement method without normal illumination reference based on HSV color space and Retinex theory
CN112053408B (en) Face image compression method and device based on deep learning
CN116309148A (en) Image restoration model training method, image restoration device and electronic equipment
Ahmed et al. PIQI: perceptual image quality index based on ensemble of Gaussian process regression
CN114936977A (en) Image deblurring method based on channel attention and cross-scale feature fusion
Ma et al. CVEGAN: a perceptually-inspired gan for compressed video enhancement
JP2022129683A (en) Image encoding device, image encoding method, image decoding device, and image decoding method
Wang et al. A customized deep network based encryption-then-lossy-compression scheme of color images achieving arbitrary compression ratios
CN117173021A (en) Video processing method and device
Yang et al. Blind VQA on 360° video via progressively learning from pixels, frames, and video
CN116977169A (en) Data processing method, apparatus, device, readable storage medium, and program product
WO2023203509A1 (en) Image data compression method and device using segmentation and classification
CN116703750A (en) Image defogging method and system based on edge attention and multi-order differential loss
CN113591838B (en) Target detection method, device, electronic equipment and storage medium
JP2022129735A (en) Image encoding device, image encoding method, image decoding device, and image decoding method
Suresh et al. A fast and efficient no-reference video quality assessment algorithm using video action recognition features
Bakhtiarnia et al. Crowd counting on heavily compressed images with curriculum pre-training
Liu et al. Soft-introVAE for continuous latent space image super-resolution
Cai et al. Deep Sampling Networks