JP2022112364A - Imaging device and measurement coding device - Google Patents

Imaging device and measurement coding device Download PDF

Info

Publication number
JP2022112364A
JP2022112364A JP2021008179A JP2021008179A JP2022112364A JP 2022112364 A JP2022112364 A JP 2022112364A JP 2021008179 A JP2021008179 A JP 2021008179A JP 2021008179 A JP2021008179 A JP 2021008179A JP 2022112364 A JP2022112364 A JP 2022112364A
Authority
JP
Japan
Prior art keywords
matrix
measurement
unit
prediction
cowh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021008179A
Other languages
Japanese (ja)
Inventor
金佳 周
Jinjia Zhou
ジラユー ピエタク
Jirayu Pietak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hosei University
Original Assignee
Hosei University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hosei University filed Critical Hosei University
Priority to JP2021008179A priority Critical patent/JP2022112364A/en
Publication of JP2022112364A publication Critical patent/JP2022112364A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

To enable efficiently compressing an image while suppressing deterioration of image quality in use of compressed sensing.SOLUTION: A compressed sensing unit uses a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequence ordered Walsh-Hadamard) matrix in which respective rows of a NoH (Naturally ordered Hadamard) matrix are arranged in sequence as a measurement matrix to perform compressed sensing processing. The respective rows of the CoWH matrix have mutually different projection patterns when projected onto an image block. The CoWH matrix is configured such that the number of consecutive elements of the same value in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.SELECTED DRAWING: Figure 6

Description

本発明は、イメージング装置及び測定符号化装置に関する。 The present invention relates to imaging devices and measurement coding devices.

ナイキストシャノンのサンプリング定理は、サンプリングレート(SR)は信号の少なくとも2倍の周波数でなければならないというものであるが、従来のイメージング技術は実装の限界に直面している。近年開発されたCMOSイメージセンサ(CIS)は解像度が4K、8K、16Kであり、高価且つ高消費電力である。さらに、大量の画像データを保存するために巨大な記憶空間を必要とする。 Although the Nyquist-Shannon sampling theorem states that the sampling rate (SR) must be at least twice the frequency of the signal, conventional imaging techniques face implementation limits. Recently developed CMOS image sensors (CIS) have resolutions of 4K, 8K, and 16K, and are expensive and consume a lot of power. Furthermore, it requires a huge storage space to store a large amount of image data.

画像データの保存及び伝送コストを削減するために、JPEG/JPEG2000、AVC(Advanced Video Coding)、HEVC(High-Efficiency Video Coding)、及びVVC(Versatile Video Coding)等のマルチメディア圧縮ツールが広く用いられている。ソフトウェア及びハードウェアの実装では、世代ごとに最大10倍の複雑さに達する可能性があり、これはCIS設計の障害の結果である。 Multimedia compression tools such as JPEG/JPEG2000, AVC (Advanced Video Coding), HEVC (High-Efficiency Video Coding), and VVC (Versatile Video Coding) are widely used to reduce image data storage and transmission costs. ing. Software and hardware implementations can reach up to ten times complexity per generation, which is a result of CIS design impediments.

すべてのデータ圧縮アルゴリズムは、空間的及び時間的な冗長性を低下させる。原信号は、DCT(Discrete Cosine Transform)、フーリエ変換の変形、DWT(Discrete Wavelet Transform)等の一般的な変換基底を用いた係数の疎なベクトルの観点から、画像データを効率的に圧縮し、これは非可逆である。 All data compression algorithms reduce spatial and temporal redundancy. The original signal is obtained by efficiently compressing the image data from the viewpoint of a sparse vector of coefficients using a general transform basis such as DCT (Discrete Cosine Transform), Fourier transform, DWT (Discrete Wavelet Transform), This is irreversible.

低ビットレートを満たすために非可逆圧縮を実行する場合、そもそもなぜ高次元及び冗長な測定値を収集する必要があるのかという疑問が生じる。ここで、高次元測定を集めて圧縮する代わりに、圧縮された測定値を取得し、測定値と一致する最も疎な高次元信号を導き出すことができる。これは「圧縮センシング」又は「圧縮サンプリング」と呼ばれ、以下において適宜「CS」と表記する。 When performing lossy compression to meet low bitrates, the question arises why we need to collect high-dimensional and redundant measurements in the first place. Now, instead of collecting and compressing high-dimensional measurements, we can take the compressed measurements and derive the sparsest high-dimensional signal that matches the measurements. This is called "compressed sensing" or "compressed sampling" and will be hereinafter appropriately denoted as "CS".

このような圧縮センシングは、データ収集及び処理に革命をもたらす可能性を秘めた新しい視点であり、信号処理、データ圧縮、逆問題の解決、放射システムの設計、レーダー、壁を介したイメージング、SAR(Synthetic Aperture Radar)アンテナのいくつかの強化されたアプローチを可能にしている。 Such compressed sensing is a new perspective that has the potential to revolutionize data acquisition and processing: signal processing, data compression, inverse problem solving, radiation system design, radar, imaging through walls, SAR. (Synthetic Aperture Radar) antennas allow for some enhanced approaches.

圧縮センシングを用いたブロックベースの計算イメージング(BCI: Block-based Computational Imaging)の進歩が近年注目を集めている。このパラダイムにより、次世代のイメージセンサは、読み出し遅延の短縮及び消費電力の低減に優れた性能を発揮できる。 Advances in Block-based Computational Imaging (BCI) using compressed sensing have attracted attention in recent years. This paradigm will enable next-generation image sensors to deliver superior performance in reduced readout delays and reduced power consumption.

それにもかかわらず、最小の処理のBCI測定のための新しい符号化アルゴリズムの必要性が高まっている。一般に圧縮センシングは、スパーシティ及びインコヒーレントで構成される2つの主要な基本的条件に基づいて構築される。 Nonetheless, there is a growing need for new coding algorithms for BCI measurements with minimal processing. Compressed sensing is generally built on two main basic conditions consisting of sparsity and incoherence.

特定のアプリケーションでCSを適用するための重要な条件として、信号特性は、特定の直交変換基底で表現される場合、疎でなければならない。この特性は、少数の係数だけが信号情報の大部分を含み、次のように表現できることを意味する。 An important condition for applying CS in a particular application is that the signal properties should be sparse when represented in a particular orthogonal transform basis. This property means that only a few coefficients contain most of the signal information and can be expressed as:

Figure 2022112364000002
ここで、
Figure 2022112364000002
here,

Figure 2022112364000003
はベクトル化された信号である。
Figure 2022112364000003
is the vectorized signal.

Figure 2022112364000004
は、2次元信号である基底
Figure 2022112364000004
is a two-dimensional signal basis

Figure 2022112364000005
におけるXの射影を含むスパースベクトル、すなわち、画像又はビデオがラスタースキャンによって列ベクトルに変形される。
Figure 2022112364000005
A sparse vector, i.e. an image or video, containing the projection of X at is transformed into a column vector by raster scanning.

圧縮センシングの理論は、インコヒーレンスが測定の質及び信号のサンプリング方法に関連する鍵であると主張している。したがって、Xのサンプリングに使用される測定行列 Compressed sensing theory claims that incoherence is key to the quality of the measurement and how the signal is sampled. Therefore, the measurement matrix used for sampling X

Figure 2022112364000006
はコヒーレンスが低くなければならない。
Figure 2022112364000006
must have low coherence.

ベルヌーイ、ガウス、バイナリなどの様々な分布によって by various distributions such as Bernoulli, Gaussian, and binary

Figure 2022112364000007
が得られる。圧縮された測定値
Figure 2022112364000007
is obtained. Compressed measurements

Figure 2022112364000008
を劣決定系の射影を用いて得ることができる。これは数学的に
Figure 2022112364000008
can be obtained using the projection of the underdetermined system. this is mathematically

Figure 2022112364000009
と記述できる。ここで、mの次元はn未満でなければならない。
Figure 2022112364000009
can be described as where the dimension of m must be less than n.

信号の良好な復元を保証するために、RIP(Restricted Isometry Property)と呼ばれる行列の特性が重要である。次の式を使用して、不均一な分散測定行列のmの下限の次元を決定できる。 A matrix property called RIP (Restricted Isometry Property) is important to ensure good signal restoration. The following formula can be used to determine the lower bound dimension of m for a heterogeneous variance measure matrix.

Figure 2022112364000010
ここで、
Figure 2022112364000010
here,

Figure 2022112364000011
である。したがって、不均一な分散測定行列に対するmの下限の次元は、凸最適化を介して非適切(ill-posed)な線形逆問題を解くことによって、次のように記述できる。
Figure 2022112364000011
is. Therefore, the lower bound dimension of m for a heterogeneous variance measure matrix can be written by solving the ill-posed linear inverse problem via convex optimization:

Figure 2022112364000012
信号を復元するために、圧縮センシングは、信号Xが疎変換
Figure 2022112364000012
Compressive sensing is used to restore the signal, where the signal X is sparsely transformed

Figure 2022112364000013
により圧縮可能であり、
Figure 2022112364000013
is compressible by

Figure 2022112364000014
は、
Figure 2022112364000014
teeth,

Figure 2022112364000015
と非常にインコヒーレントである必要がある。したがって、係数ドメイン(測定ドメイン)の不完全な測定値の次元mから以下のように高精度に復元できる。
Figure 2022112364000015
and must be very incoherent. Therefore, the dimension m of imperfect measurements in the coefficient domain (measurement domain) can be restored with high accuracy as follows.

Figure 2022112364000016
ここで、
Figure 2022112364000016
here,

Figure 2022112364000017
は逆変換である。
Figure 2022112364000017
is the inverse transform.

よって、l最小化と呼ばれる凸最適化を用いて、次の式のように、古典的な方法により測定値を復元できる。 Thus, convex optimization, called l 1 minimization, can be used to recover the measurements by the classical method, as follows:

Figure 2022112364000018
これは次のように単純化できる。
Figure 2022112364000018
This can be simplified as follows.

Figure 2022112364000019
Figure 2022112364000019

グリーディベースの復元アルゴリズムとして、OMP(Orthogonal Matching Pursuit)、それの拡張であるステップワイズOMP、A*Omp、CoSaMP、及びTwIST2が圧縮センシングのために提案されている。 As greedy-based restoration algorithms, OMP (Orthogonal Matching Pursuit), its extensions Stepwise OMP, A*Omp, CoSaMP, and TwIST2 have been proposed for compressed sensing.

最小化と比較すると、グリーディベースの復元アルゴリズムは一連の部分空間問題を最小限に抑えることで、一般に高速である。しかし、より高い予備知識及び良好な測定量が必要であり、一部のアプリケーションはセンシングデバイスでSRを削減する必要がある場合にそのような情報を得ることが現実的ではない。 Compared to l 1 minimization, greedy-based restoration algorithms are generally faster by minimizing a series of subspace problems. However, it requires higher prior knowledge and better measurements, and for some applications it is impractical to obtain such information when the sensing device needs to reduce the SR.

スカラー量子化(SQ)は、簡単な測定符号化アプローチを提供した(非特許文献1、2参照)。SQ符号化は、情報理論によるレート歪み(RD)性能の点で非常に非効率的であることを確立した。従来の符号化と比較すると、SQ符号化はビットレートの低い利用を生み出すが、結果的に高い復元エラーが発生する。したがって、QIHT(Quantized Iterative Hard Thresholding)、QCoSaMP(Quantized Compressed Sampling Matching Pursuit)、AOP-QIHT(Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding)等の、破損した符号化された測定値を予測するために複雑な復元アルゴリズムが必要である。品質劣化は、最終的に復元された画像・ビデオに表示される。 Scalar quantization (SQ) provided a simple measurement coding approach [1, 2]. It was established that SQ coding is very inefficient in terms of rate-distortion (RD) performance according to information theory. Compared to conventional encoding, SQ encoding yields low bitrate utilization, but results in high reconstruction error. Therefore, complex techniques such as QIHT (Quantized Iterative Hard Thresholding), QCoSaMP (Quantized Compressed Sampling Matching Pursuit), AOP-QIHT (Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding) are used to predict corrupted coded measurements. A decompression algorithm is required. The quality degradation will show up in the final reconstructed image/video.

DPCM(Differential Pulse-Code Modulation)は、伝送路上のビットレートを低減するために適用される簡単なアプローチでもある(非特許文献3参照)。DPCM符号化では、以前の符号化されたブロックを1つ使用して現在のブロックを予測する。ただし、以前の符号化されたブロックには、現在のブロックと関係のない無関係な情報が含まれている可能性があり、その結果、ビットレートが不要に増加する。それにもかかわらず、DPCM符号化は実用的な符号化方法を提供する。 DPCM (Differential Pulse-Code Modulation) is also a simple approach applied to reduce the bit rate on the transmission path (see Non-Patent Document 3). DPCM coding uses one previously coded block to predict the current block. However, previously encoded blocks may contain extraneous information unrelated to the current block, resulting in an unnecessary increase in bitrate. Nevertheless, DPCM encoding provides a practical encoding method.

非特許文献4における符号化手法は、BCI測定に対してDCT符号化を行う。このアプローチは、SQやDPCMよりも符号化効率が向上する。 The encoding method in Non-Patent Document 4 performs DCT encoding on BCI measurements. This approach improves coding efficiency over SQ and DPCM.

非特許文献5の研究では、量子化器のデッドゾーンで調査された最先端の符号化スキームからの代替アプローチを提案した。非特許文献5では、品質劣化は主に量子化器から来ていると述べ、歪みは測定符号化スキームにおける量子化及びSRの両方に関連していると述べている。したがって、このアプローチでは、測定行列の選択、量子化及びSRのトレードオフ、並びにディープラーニングを用いた復元アルゴリズムを含むシステムパラメータを設計した。さらに、有効な方法は、量子化ステップ及びSRを共同で制御して、任意のビットレートでほぼ最適な品質を達成できる。 [5] proposed an alternative approach from state-of-the-art coding schemes investigated with quantizer dead zones. [5] state that the quality degradation comes mainly from the quantizer, and that the distortion is related to both quantization and SR in the measurement coding scheme. Therefore, in this approach, we designed the system parameters, including measurement matrix selection, quantization and SR trade-offs, and a restoration algorithm using deep learning. Moreover, effective methods can jointly control the quantization step and SR to achieve near-optimal quality at any bitrate.

方向符号化アプローチは非特許文献6で初めて導入されている。SDPC(Spatially Directional Predictive Coding)は、高い復元確率及び低ビットレートでのSQ符号化及びDPCM符号化を達成した効率的な測定符号化アプローチである。この研究では、自然画像をサンプリングするために、測定行列としてランダムガウシアンを用いている。しかし、ガウス測定行列が適用されているため、ビットレートの不安定な利用が生じる。重要なのは、バイナリのみをサポートするBCIに対してこの種の測定行列を用いることができなかったということである。 The directional coding approach was first introduced in [6]. Spatially Directional Predictive Coding (SDPC) is an efficient measurement coding approach that achieves SQ and DPCM coding with high probability of recovery and low bitrates. In this study, we use random Gaussian as the measurement matrix to sample natural images. However, since a Gaussian measurement matrix is applied, it results in unstable utilization of bitrate. Importantly, this kind of measurement matrix could not be used for BCI, which only supports binary.

H.264/AVCから流用されたイントラ予測のコンセプトを測定符号化と組み合わせ、イントラ予測候補を生成するための測定行列の部分的改変が非特許文献7で提案されている(Modified SRM)。部分的に改変されたランダムバイナリ測定行列を用いた4方向のイントラ予測アプローチであり、この研究は主に符号化された測定値をエンドポイントに伝達することに焦点を当てている。特定のサンプリングパターンを測定行列に埋め込み、センシングしながら境界情報を得る。非特許文献7では、得られた情報に H. Non-Patent Document 7 proposes a partial modification of the measurement matrix to generate intra prediction candidates by combining the concept of intra prediction borrowed from H.264/AVC with measurement coding (Modified SRM). A four-way intra-prediction approach using a partially modified random binary measurement matrix, this work is mainly focused on conveying coded measurements to endpoints. A specific sampling pattern is embedded in the measurement matrix to obtain boundary information while sensing. In Non-Patent Document 7, the obtained information

Figure 2022112364000020
を乗算し、予測テンプレートを生成する。SQ符号化、DPCM符号化、SDPC符号化と比較して軽量なアプローチである。しかし、DPCM符号化やSDPC符号化よりもビットレートを低くすることができなかった。この提案は、最先端の研究に比べて予測候補生成の複雑さを低減できるが、測定行列の修正により視覚的品質の大幅な劣化を引き起こし、RIP条件及びその逆変換を満たすことができなかった。
Figure 2022112364000020
to generate a prediction template. It is a lightweight approach compared to SQ encoding, DPCM encoding and SDPC encoding. However, the bit rate could not be made lower than that of DPCM encoding and SDPC encoding. Although this proposal can reduce the complexity of predictive candidate generation compared to the state-of-the-art work, the modification of the measurement matrix causes significant visual quality degradation and fails to satisfy the RIP condition and its inverse transform. .

A. Zymnis, S. Boyd and E. Candes, "Compressed Sensing With Quantized Measurements," in IEEE Signal Processing Letters, vol. 17, no. 2, pp. 149-152, Feb. 2010, doi: 10.1109/LSP.2009.2035667A. Zymnis, S. Boyd and E. Candes, "Compressed Sensing With Quantized Measurements," in IEEE Signal Processing Letters, vol. 17, no. 2, pp. 149-152, Feb. 2010, doi: 10.1109/LSP. 2009.2035667 W. Dai and O. Milenkovic. Information Theoretical and Algorithmic Approaches to Quantized Compressive Sensing. IEEE Transactions on Communications, 59(7):1857-1866, 2011W. Dai and O. Milenkovic. Information Theoretical and Algorithmic Approaches to Quantized Compressive Sensing. IEEE Transactions on Communications, 59(7):1857-1866, 2011 S. Mun and J. E. Fowler, "DPCM for quantized block-based compressed sensing of images," 2012 Proceedings of the 20th European Signal Processing Conference (EUSIPCO), Bucharest, 2012, pp. 1424-1428S. Mun and J. E. Fowler, "DPCM for quantized block-based compressed sensing of images," 2012 Proceedings of the 20th European Signal Processing Conference (EUSIPCO), Bucharest, 2012, pp. 1424-1428 Yifu Zhang, Shunliang Mei, Quqing Chen and Zhibo Chen, "A novel image/video coding method based on Compressed Sensing theory," 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, 2008, pp. 1361-1364, doi: 10.1109/ICASSP.2008.4517871Yifu Zhang, Shunliang Mei, Quqing Chen and Zhibo Chen, "A novel image/video coding method based on Compressed Sensing theory," 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, 2008, pp. 1361- 1364, doi: 10.1109/ICASSP.2008.4517871 C. Zhao, H. Bai and Y. Zhao, "Optimized Measurements Coding for Compressive Sensing Reconstruction Network," 2018 14th IEEE International Conference on Signal Processing (ICSP), Beijing, China, 2018, pp. 596-599, doi: 10.1109/ICSP.2018.8652427C. Zhao, H. Bai and Y. Zhao, "Optimized Measurements Coding for Compressive Sensing Reconstruction Network," 2018 14th IEEE International Conference on Signal Processing (ICSP), Beijing, China, 2018, pp. 596-599, doi: 10.1109 /ICSP.2018.8652427 J. Zhang, D. Zhao and F. Jiang, "Spatially directional predictive coding for block-based compressive sensing of natural images," 2013 IEEE International Conference on Image Processing, Melbourne, VIC, 2013, pp. 1021-1025, doi: 10.1109/ICIP.2013.6738211J. Zhang, D. Zhao and F. Jiang, "Spatially directional predictive coding for block-based compressive sensing of natural images," 2013 IEEE International Conference on Image Processing, Melbourne, VIC, 2013, pp. 1021-1025, doi: 10.1109/ICIP.2013.6738211 J. Zhou, D. Zhou, L. Guo, Y. Takeshi and S. Goto, "Measurement-domain intra prediction framework for compressively sensed images," 2017 IEEE International Symposium on Circuits and Systems (ISCAS), Baltimore, MD, 2017, pp. 1-4, doi: 10.1109/ISCAS.2017.8050262J. Zhou, D. Zhou, L. Guo, Y. Takeshi and S. Goto, "Measurement-domain intra prediction framework for compressively sensed images," 2017 IEEE International Symposium on Circuits and Systems (ISCAS), Baltimore, MD, 2017 , pp. 1-4, doi: 10.1109/ISCAS.2017.8050262

本発明は、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供することを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide an imaging apparatus and a measurement coding apparatus that can efficiently compress an image while suppressing deterioration in image quality when compressed sensing is used.

第1の態様に係るイメージング装置は、画像ブロック単位で画像出力を行うイメージセンサ部と、前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部とを備える。前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行う。前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なる。前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 An imaging apparatus according to a first aspect includes an image sensor unit that outputs an image in image block units, and a measurement matrix of m rows and n columns (m<n) applied to the pixel values of n pixels that constitute the image block. a compressed sensing unit that performs compressed sensing processing to output m measured values; and an analog/digital converter that outputs measured data by performing analog/digital conversion processing on the m measured values. . The compression sensing unit uses a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequence ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequence as the measurement matrix, and the compression Perform sensing processing. Each row of the CoWH matrix has a different projection pattern when projected onto the image block. The CoWH matrix is configured such that the number of consecutive elements of the same value in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.

第2の態様に係る測定符号化装置は、第1の態様に係るイメージング装置と、前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部とを備える。 A measurement coding apparatus according to a second aspect includes the imaging apparatus according to the first aspect, a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block, and a left adjacent block adjacent to the left side of the image block. an intra prediction unit that outputs predicted measurement data obtained by predicting the measurement data of the image block using any one of a plurality of intra prediction modes including a horizontal prediction mode using blocks; A quantization unit that performs quantization processing on residual data representing a difference between the measured data and the predicted measured data output from the intra prediction unit.

本発明によれば、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供できる。 Advantageous Effects of Invention According to the present invention, it is possible to provide an imaging device and a measurement coding device that can efficiently compress an image while suppressing image quality deterioration when compressed sensing is used.

実施形態に係る測定伝送システムの構成を示す図である。1 is a diagram showing the configuration of a measurement transmission system according to an embodiment; FIG. 実施形態に係る測定符号化装置の構成を示す図である。1 is a diagram showing the configuration of a measurement coding apparatus according to an embodiment; FIG. 実施形態に係る圧縮センシング部の動作を示す図である。It is a figure which shows operation|movement of the compression sensing part which concerns on embodiment. 実施形態に係る垂直予測モード及び水平予測モードを示す図である。It is a figure which shows the vertical prediction mode and horizontal prediction mode which concern on embodiment. 実施形態に係るイメージング装置の構成例を示す図である。It is a figure which shows the structural example of the imaging device which concerns on embodiment. 実施形態に係る測定行列の投影パターンを示す図である。FIG. 4 is a diagram showing projection patterns of measurement matrices according to the embodiment; 実施形態に係るCoWH行列の生成アルゴリズムを示す図である。FIG. 4 is a diagram showing a CoWH matrix generation algorithm according to an embodiment; NoH行列、SoWH行列、及びCoWH行列のそれぞれを用いた場合においてl最小化及び逆高速ウォルシュ・アダマール変換(IFWHT)を用いた復元結果を比較して示す図である。FIG. 10 is a diagram showing a comparison of reconstruction results using l1 minimization and inverse fast Walsh - Hadamard transform (IFWHT) when using NoH matrix, SoWH matrix, and CoWH matrix, respectively; 実施形態に係る符号化装置の一部の構成例を示す図である。It is a figure which shows the example of a structure of a part of encoding apparatus which concerns on embodiment. 実施形態に係る測定復号装置の構成を示す図である。1 is a diagram showing the configuration of a measurement decoding device according to an embodiment; FIG. 実施形態に係る作用・効果を説明するための図である。It is a figure for demonstrating the effect|action and effect which concern on embodiment.

図面を参照して、実施形態に係る測定伝送システムについて説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 A measurement transmission system according to an embodiment will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.

(1)測定伝送システムの構成
まず、本実施形態に係る測定伝送システムの構成について説明する。図1は、本実施形態に係る測定伝送システム1の構成を示す図である。図1に示すように、測定伝送システム1は、測定符号化装置100と、測定復号装置200とを有する。
(1) Configuration of measurement transmission system First, the configuration of the measurement transmission system according to this embodiment will be described. FIG. 1 is a diagram showing the configuration of a measurement transmission system 1 according to this embodiment. As shown in FIG. 1 , the measurement transmission system 1 has a measurement coding device 100 and a measurement decoding device 200 .

測定符号化装置100は、画像センシングにより画像データを生成するとともに、画像データを圧縮センシングにより圧縮する。そして、測定符号化装置100は、圧縮センシングにより圧縮された測定データを圧縮符号化によりさらに圧縮し、圧縮された符号化データ(ビットストリーム)を、伝送路を介して送信する。例えば、伝送路は無線伝送路である。伝送路は、有線伝送路を含んでもよい。 The measurement coding device 100 generates image data by image sensing and compresses the image data by compression sensing. Then, measurement coding apparatus 100 further compresses the measurement data compressed by compressed sensing by compression coding, and transmits the compressed coded data (bit stream) via a transmission line. For example, the transmission line is a wireless transmission line. The transmission line may include a wired transmission line.

測定復号装置200は、圧縮された符号化データを測定符号化装置100から受信し、受信した符号化データから測定データを復号する。そして、測定復号装置200は、復元アルゴリズムを用いて測定データから元の画像データを復元し、例えばディスプレイに対して画像データを出力する。 The measurement decoding device 200 receives the compressed encoded data from the measurement encoding device 100 and decodes the measurement data from the received encoded data. The measurement decoding device 200 then restores the original image data from the measurement data using a restoration algorithm, and outputs the image data to, for example, a display.

測定伝送システム1は、遠隔監視システムを構成してもよい。例えば、測定符号化装置100がバッテリ駆動型のセンシングデバイスであって、測定復号装置200がサーバに設けられてもよい。サーバは、測定符号化装置100から画像データを収集し、監視対象に対する遠隔監視を行ってもよい。このようなセンシングデバイスは、駆動時間を延長するために低消費電力であることが要求される。 The measurement transmission system 1 may constitute a remote monitoring system. For example, the measurement coding device 100 may be a battery-powered sensing device and the measurement decoding device 200 may be provided in a server. The server may collect image data from the measurement coding device 100 and perform remote monitoring of the monitored object. Such sensing devices are required to have low power consumption in order to extend the driving time.

なお、図1において、測定符号化装置100を1つのみ図示しているが、測定復号装置200は、複数の測定符号化装置100から符号化データを受信してもよい。 Although only one measurement coding apparatus 100 is illustrated in FIG. 1 , the measurement decoding apparatus 200 may receive coded data from a plurality of measurement coding apparatuses 100 .

また、測定符号化装置100から測定復号装置200への符号化データの伝送は、伝送路を介して行われる場合に限定されるものではなく、記憶媒体を介して測定符号化装置100から測定復号装置200へ間接的に符号化データが伝送されてもよい。 Also, the transmission of encoded data from measurement encoding device 100 to measurement decoding device 200 is not limited to the case where it is performed via a transmission line, but is transmitted from measurement encoding device 100 to measurement decoding device 200 via a storage medium. Encoded data may be transmitted indirectly to device 200 .

(2)測定符号化装置
次に、本実施形態に係る測定符号化装置100について説明する。
(2) Measurement Coding Apparatus Next, the measurement coding apparatus 100 according to this embodiment will be described.

(2.1)測定符号化装置の全体構成
図2は、本実施形態に係る測定符号化装置100の構成を示す図である。
(2.1) Overall Configuration of Measurement Coding Apparatus FIG. 2 is a diagram showing the configuration of the measurement coding apparatus 100 according to this embodiment.

図2に示すように、測定符号化装置100は、イメージング装置110と、符号化装置120と、送信部130とを有する。イメージング装置110、符号化装置120、及び送信部130は、別体に構成されていてもよいし、一体に構成されていてもよい。測定符号化装置100は、図示を省略するバッテリを有していてもよい。 As shown in FIG. 2, the measurement coding device 100 has an imaging device 110, a coding device 120, and a transmitting section . The imaging device 110, the encoding device 120, and the transmission unit 130 may be configured separately, or may be configured integrally. The measurement coding device 100 may have a battery (not shown).

イメージング装置110は、イメージセンサ部111と、圧縮センシング部112と、アナログ/デジタル(A/D)変換部113とを有する。 The imaging device 110 has an image sensor portion 111 , a compression sensing portion 112 and an analog/digital (A/D) conversion portion 113 .

イメージセンサ部111は、画像ブロック単位で画像出力を行う。イメージセンサ部111は、CMOSイメージセンサ(CIS)を含んで構成される。但し、イメージセンサ部111は、CCDイメージセンサを含んで構成されてもよい。 The image sensor unit 111 outputs an image in units of image blocks. The image sensor unit 111 includes a CMOS image sensor (CIS). However, the image sensor unit 111 may be configured including a CCD image sensor.

圧縮センシング部112は、イメージセンサ部111が出力する画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する。このような処理は、画素ドメインから測定ドメインへの変換処理に相当する。 The compression sensing unit 112 applies a measurement matrix of m rows and n columns (m<n) to pixel values of n pixels forming an image block output from the image sensor unit 111, and outputs m measured values. Such processing corresponds to conversion processing from the pixel domain to the measurement domain.

図3は、本実施形態に係る圧縮センシング部112の動作を示す図である。図3に示すように、1つの画像が複数の画像ブロックに分割され、ラスタースキャン順で画像ブロックが取得される。各画像ブロックは、n画素(n個の画素)分の画素値からなる。圧縮センシング部112は、各画像ブロックからラスタースキャン順で画素値を取得する。 FIG. 3 is a diagram showing the operation of the compression sensing unit 112 according to this embodiment. As shown in FIG. 3, one image is divided into a plurality of image blocks, and the image blocks are acquired in raster scan order. Each image block consists of pixel values for n pixels (n pixels). The compression sensing unit 112 acquires pixel values from each image block in raster scan order.

図3において、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xとを例示している。画素値列は、n個の画素値(x乃至x)からなる。 In FIG. 3 , a pixel value sequence X1 corresponding to image block B1 , a pixel value sequence X2 corresponding to image block B2, a pixel value sequence X3 corresponding to image block B3 , and an image block B i , and pixel value sequences X i corresponding to . A pixel value sequence consists of n pixel values (x 1 to x n ).

圧縮センシング部112は、各画素値列Xにm行n列の測定行列(Measurement Matrix)を乗算して出力する。これにより、各画素値列Xは、m個の測定値(y乃至y)からなる測定値列Yに変換される。ここで、mはnよりも小さいため、データ量が圧縮されることになる。 The compressed sensing unit 112 multiplies each pixel value sequence X by a measurement matrix of m rows and n columns, and outputs the result. As a result, each pixel value sequence X is converted into a measured value sequence Y consisting of m measured values (y 1 to y m ). Here, since m is smaller than n, the amount of data is compressed.

図2に戻り、A/D変換部113は、圧縮センシング部112が出力するm個の測定値Yに対してA/D変換処理を行うことにより、デジタル信号である測定データYを出力する。圧縮センシングにより測定値の数が削減(圧縮)されているため、A/D変換部113の消費電力を低く抑えることができる。 Returning to FIG. 2, the A/D conversion unit 113 performs A/D conversion processing on the m measured values Y output from the compression sensing unit 112, thereby outputting measurement data Y as a digital signal. Since the number of measured values is reduced (compressed) by compressed sensing, the power consumption of the A/D converter 113 can be kept low.

A/D変換部113が出力する各画像ブロックの測定データYは、符号化装置120により、イントラ予測を用いた圧縮符号化によりさらに圧縮される。符号化装置120は、イントラ予測部121と、残差データ生成部122と、量子化部123と、ハフマン符号化部124と、ハフマン復号部125と、逆量子化部126と、合成部127とを有する。 The measurement data Y of each image block output from the A/D conversion unit 113 is further compressed by compression encoding using intra prediction by the encoding device 120 . The encoding device 120 includes an intra prediction unit 121, a residual data generation unit 122, a quantization unit 123, a Huffman encoding unit 124, a Huffman decoding unit 125, an inverse quantization unit 126, and a synthesis unit 127. have

イントラ予測部121は、複数のイントラ予測モードのいずれか1つを用いて、現画像ブロックの測定データYを予測した予測測定データYを出力する。複数のイントラ予測モードは、図4に示すように、現画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと、現画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む。複数の予測モードは、垂直予測モードの予測測定データと水平予測モードの予測測定データとの平均を予測測定データとして算出する平均予測モードをさらに含む。 The intra prediction unit 121 outputs predicted measurement data Yp obtained by predicting the measurement data Y of the current image block using any one of a plurality of intra prediction modes. As shown in FIG. 4, the multiple intra prediction modes are a vertical prediction mode using the upper neighboring block adjacent to the upper side of the current image block and a horizontal prediction mode using the left neighboring block adjacent to the left side of the current image block. including. The multiple prediction modes further include an average prediction mode that calculates an average of prediction measurement data in the vertical prediction mode and prediction measurement data in the horizontal prediction mode as prediction measurement data.

イントラ予測部121は、参照データ生成部1211と、予測データ生成部1212と、選択部1213とを有する。 The intra prediction unit 121 has a reference data generation unit 1211 , a prediction data generation unit 1212 and a selection unit 1213 .

参照データ生成部1211は、予測測定データを得るために、上側隣接ブロックの参照データと左側隣接ブロックの参照データとを生成する。 The reference data generation unit 1211 generates reference data for the upper adjacent block and reference data for the left adjacent block in order to obtain prediction measurement data.

予測データ生成部1212は、参照データ生成部1211が生成する参照データを用いて、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとを生成する。 The prediction data generation unit 1212 uses the reference data generated by the reference data generation unit 1211 to generate the prediction measurement data Yv in the vertical prediction mode, the prediction measurement data Yh in the horizontal prediction mode, and the prediction measurement data in the average prediction mode. Y avg .

選択部1213は、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとのそれぞれについて、現画像ブロックの測定データYとの類似度を算出することにより、類似度が最も高い予測測定データを選択し、選択した予測測定データYを残差データ生成部122に出力する。類似度を表す指標値としては、例えば、絶対値差分和(SAD:Sum of Absolute Difference)を用いることができる。 The selection unit 1213 compares each of the prediction measurement data Y v in the vertical prediction mode, the prediction measurement data Y h in the horizontal prediction mode, and the prediction measurement data Y avg in the average prediction mode with the measurement data Y of the current image block. By calculating the degree of similarity, the predicted measured data with the highest degree of similarity is selected, and the selected predicted measured data Yp is output to the residual data generator 122 . For example, the sum of absolute differences (SAD) can be used as the index value representing the degree of similarity.

但し、いずれの予測測定データも現画像ブロックの測定データYとの類似度が低い場合、選択部1213は、現画像ブロックの測定データYをそのまま量子化部123に出力してもよい。例えば、選択部1213は、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとのそれぞれのSADが閾値よりも大きい場合、現画像ブロックの測定データYをそのまま量子化部123に出力する。 However, if any prediction measurement data has a low degree of similarity with the measurement data Y of the current image block, the selection unit 1213 may directly output the measurement data Y of the current image block to the quantization unit 123 . For example, when the SAD of each of the predicted measured data Y v in the vertical prediction mode, the predicted measured data Y h in the horizontal prediction mode, and the predicted measured data Y avg in the average prediction mode is larger than the threshold, The measurement data Y of the current image block is directly output to the quantization section 123 .

残差データ生成部122は、現画像ブロックの測定データYとイントラ予測部121が出力する予測測定データYとの差分を表す残差データYを生成し、生成した残差データYを量子化部123に出力する。 The residual data generation unit 122 generates residual data Y r representing the difference between the measured data Y of the current image block and the predicted measured data Y p output by the intra prediction unit 121, and the generated residual data Y r Output to quantization section 123 .

量子化部123は、残差データY(又は現画像ブロックの測定データY)に対して量子化処理を行い、量子化データYをハフマン符号化部124に出力する。 The quantization unit 123 performs quantization processing on the residual data Y r (or the measurement data Y of the current image block) and outputs the quantized data Y q to the Huffman coding unit 124 .

ハフマン符号化部124は、量子化データYに対してハフマン符号化処理を行うことにより符号化データを生成し、生成した符号化データを送信部130及びハフマン復号部125に出力する。なお、ハフマン符号化に限定されるものではなく、ハフマン符号化以外のエントロピー符号化を用いてもよい。 The Huffman encoding unit 124 generates encoded data by performing Huffman encoding processing on the quantized data Yq , and outputs the generated encoded data to the transmission unit 130 and the Huffman decoding unit 125 . Entropy coding other than Huffman coding may be used instead of Huffman coding.

送信部130は、ハフマン符号化部124が出力する符号化データを、伝送路を介して測定復号装置200に送信する。送信部130は、符号化データを含む無線信号を送信する無線送信機を含んでもよい。また、送信部130は、選択部1213が選択した予測モードを示すモード情報を符号化データに含めて送信する。 Transmitting section 130 transmits the encoded data output from Huffman encoding section 124 to measurement decoding apparatus 200 via a transmission path. Transmitter 130 may include a radio transmitter that transmits radio signals containing encoded data. In addition, the transmission unit 130 transmits encoded data including mode information indicating the prediction mode selected by the selection unit 1213 .

ハフマン復号部125は、ハフマン符号化部124が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYを復元し、復元した量子化データYを逆量子化部126に出力する。 Huffman decoding section 125 restores quantized data Y q by performing Huffman decoding processing on the encoded data output from Huffman coding section 124 , and sends the restored quantized data Y q to inverse quantization section 126 . Output.

逆量子化部126は、復元量子化データYに対して逆量子化処理を行うことにより残差データYを復元し、復元残差データYdeqを合成部127に出力する。 The inverse quantization unit 126 restores the residual data Y r by performing inverse quantization processing on the restored quantized data Y q and outputs the restored residual data Y deq to the synthesizing unit 127 .

合成部127は、復元残差データYdeqと予測測定データYとを合成することにより測定データYを復元し、復元測定データをイントラ予測部121の参照データ生成部1211に出力する。 The synthesizing unit 127 restores the measured data Y by synthesizing the restored residual data Y deq and the predicted measured data Y p , and outputs the restored measured data to the reference data generation unit 1211 of the intra prediction unit 121 .

なお、図2に示す符号化装置120の構成例において、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力している。しかしながら、ハフマン復号部125を不要としてもよい。この場合、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力することに代えて、量子化部123が出力する量子化データYを逆量子化部126に入力する構成になる。 In addition, in the configuration example of the encoding device 120 shown in FIG. However, the Huffman decoding unit 125 may be unnecessary. In this case, instead of inputting the encoded data output by the Huffman encoding unit 124 to the Huffman decoding unit 125, the quantized data Yq output by the quantization unit 123 is input to the inverse quantization unit 126. Become.

(2.2)イメージング装置
次に、本実施形態に係るイメージング装置110について説明する。
(2.2) Imaging Device Next, the imaging device 110 according to this embodiment will be described.

図5は、本実施形態に係るイメージング装置110の構成例を示す図である。本実施形態に係るイメージング装置110は、圧縮センシングを用いるCMOSイメージセンサ、すなわち、CS-CISである。 FIG. 5 is a diagram showing a configuration example of the imaging device 110 according to this embodiment. The imaging device 110 according to the present embodiment is a CMOS image sensor using compression sensing, ie CS-CIS.

図5に示すように、イメージング装置110は、画素アレイ(Pixel Array)111aと、行選択部(ROW SELECTOR)111bと、列選択部(COLUMN SELECTOR)111cと、行列演算トリガ部112aと、行列演算部112bと、A/D変換部113とを有する。 As shown in FIG. 5, the imaging device 110 includes a pixel array 111a, a row selector 111b, a column selector 111c, a matrix operation trigger 112a, and a matrix operation. 112 b and A/D converter 113 .

画素アレイ111a、行選択部111b、及び列選択部111cは、図2に示すイメージセンサ部111を構成する。画素アレイ111aは、アレイ状に配置された複数の画素を有する。各画素は、光を受けて、電気信号である画素値を出力する。画素アレイ111aは、n個の画素からなるブロック単位に区分されている。行選択部111b及び列選択部111cは、画素値を読み出す画素を選択し、選択した画素から画素値を読み出す。 The pixel array 111a, the row selection section 111b, and the column selection section 111c constitute the image sensor section 111 shown in FIG. The pixel array 111a has a plurality of pixels arranged in an array. Each pixel receives light and outputs a pixel value, which is an electrical signal. The pixel array 111a is divided into blocks of n pixels. The row selection unit 111b and the column selection unit 111c select pixels from which pixel values are to be read, and read pixel values from the selected pixels.

行列演算トリガ部112a及び行列演算部112bは、図2に示す圧縮センシング部112を構成する。行列演算トリガ部112aは、n個の画素からなる画素値列Xに対する行列演算をトリガする。行列演算部112bは、画素値列Xに対して、測定行列を用いた行列演算を行い、m個の測定値からなる測定値列YをA/D変換部113に出力する。A/D変換部113は、測定値列Yをデジタル信号に変換し、測定データYを出力する。 The matrix calculation trigger section 112a and the matrix calculation section 112b constitute the compression sensing section 112 shown in FIG. The matrix calculation trigger unit 112a triggers matrix calculation for a pixel value sequence X consisting of n pixels. The matrix calculator 112 b performs matrix calculation on the pixel value sequence X using the measurement matrix, and outputs a measured value sequence Y made up of m measured values to the A/D converter 113 . The A/D converter 113 converts the measured value sequence Y into a digital signal and outputs measured data Y. FIG.

図6は、本実施形態に係る測定行列の投影パターンを示す図である。ここでは、画像ブロックのサイズが8画素×8画素、すなわち、nの値が64あるものとする。また、mの値が8(図にLow frequency からhigh frequency まで8つのパターンがある)、すなわち、n=64から8個の測定値(m=8)に変換する、12.5%(m/n=8/64=12.5%)まで圧縮時に使う8つのパターンを示す。図6において、白抜きの各領域は測定行列における要素の値が「1」であることを表し、黒塗りの領域は測定行列における要素の値が「0」であることを表す。 FIG. 6 is a diagram showing projection patterns of measurement matrices according to the present embodiment. Here, it is assumed that the size of the image block is 8 pixels×8 pixels, that is, the value of n is 64. In addition, the value of m is 8 (there are 8 patterns from low frequency to high frequency in the figure), that is, converting from n = 64 to 8 measured values (m = 8), 12.5% (m/ 8 patterns used for compression up to n=8/64=12.5%). In FIG. 6 , each white area represents an element value of “1” in the measurement matrix, and a black area represents an element value of “0” in the measurement matrix.

図6に示すように、圧縮センシング部112は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を測定行列として用いて、圧縮センシング処理を行う。なお、シーケンシーとは、行列の1つの行において値が切り替わる頻度(周波数)をいう。 As shown in FIG. 6, the compression sensing unit 112 measures the CoWH (Continuously ordered Walsh-Hadamard) matrix based on the SoWH (Sequence ordered Walsh-Hadamard) matrix in which each row of the NoH (Naturally ordered Hadamard) matrix is arranged in sequence. to perform the compressed sensing process. Note that the sequence means the frequency (frequency) at which values are switched in one row of the matrix.

CoWH行列の各行は、画像ブロックに投影したときの投影パターンが互いに異なる。CoWH行列は、CoWH行列における上側の行から下側の行に向かうにつれて、投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 Each row of the CoWH matrix has a different projection pattern when projected onto an image block. The CoWH matrix is configured such that the number of consecutive equivalent elements in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.

例えば、CoWH行列の最も上側の行(行#1)は、投影パターンにおいて、要素「1」が64画素分だけ連続している。行#1を用いて算出される測定値をyと呼ぶ。 For example, the uppermost row (row #1) of the CoWH matrix has 64 consecutive pixels of "1" in the projection pattern. The measurement calculated using row # 1 is called y1.

CoWH行列の上から2番目の行(行#2)及び3番目の行(行#3)のそれぞれは、投影パターンにおいて、要素「1」が32画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。行#2を用いて算出される測定値をyと呼び、行#3を用いて算出される測定値をyと呼ぶ。 Each of the second row (row #2) and the third row (row #3) from the top of the CoWH matrix has 32 consecutive pixels of element “1” and element “0” in the projection pattern. ” continues for 32 pixels. The measurement calculated using row # 2 is called y2, and the measurement calculated using row # 3 is called y3.

CoWH行列の上から4番目の行(行#4)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 The fourth row from the top of the CoWH matrix (row #4) has 16 consecutive pixels of element "1" and 32 consecutive pixels of element "0" in the projection pattern.

CoWH行列の上から5番目の行(行#5)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 The fifth row from the top of the CoWH matrix (row #5) has 16 consecutive pixels of element "1" and 16 consecutive pixels of element "0" in the projection pattern.

CoWH行列の上から6番目の行(行#6)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 The sixth row from the top of the CoWH matrix (row #6) has 16 consecutive pixels of element "1" and 32 consecutive pixels of element "0" in the projection pattern.

CoWH行列の上から7番目の行(行#7)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 The seventh row from the top of the CoWH matrix (row #7) has 16 consecutive pixels of element "1" and 16 consecutive pixels of element "0" in the projection pattern.

CoWH行列の上から8番目の行(行#8)は、投影パターンにおいて、要素「1」が8画素分だけ連続する領域及び要素「1」が16画素分だけ連続する領域を有する。また、要素「0」が8画素分だけ連続する領域及び要素「0」が16画素分だけ連続する領域を有する。 The eighth row from the top of the CoWH matrix (row #8) has an area of 8 consecutive pixels of "1" and an area of 16 consecutive pixels of "1" in the projection pattern. It also has an area in which the element "0" continues for 8 pixels and an area in which the element "0" continues for 16 pixels.

CoWH行列は、画像ブロックの全画素値を取得する第1投影パターンを構成する行と、画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行とを有する。これにより、測定ドメインにおける垂直予測モード及び水平予測モードのイントラ予測を円滑に行うことが可能になる。具体的には、CoWH行列における最も上側の行(行#1)は、第1投影パターンを構成し、CoWH行列における上から2番目及び3番目の行(行#2及び#3)は、第2投影パターン及び第3投影パターンを構成する。 The CoWH matrix includes rows forming a first projection pattern for obtaining all pixel values of an image block, rows forming a second projection pattern for obtaining pixel values in the upper half of the image block, and rows forming the left half of the image block. and rows forming a third projection pattern from which pixel values are obtained. This makes it possible to smoothly perform intra prediction in vertical prediction mode and horizontal prediction mode in the measurement domain. Specifically, the uppermost row (row #1) in the CoWH matrix constitutes the first projection pattern, and the second and third rows (rows #2 and #3) from the top in the CoWH matrix constitute the first projection pattern. A second projection pattern and a third projection pattern are constructed.

なお、CS理論をCISに採用することにより、測定行列 By adopting the CS theory to the CIS, the measurement matrix

Figure 2022112364000021
は、スクランブルマスクの確率が高いバイナリ{0,1}又はワーストケースでも相補{-1,1}でなければならないという実装上の制約がある。
Figure 2022112364000021
has the implementation constraint that the scrambling mask must be binary {0,1} with high probability or even complementary {-1,1} in the worst case.

本実施形態に係る連続順序のウォルシュ・アダマール(CoWH)は、自然順序のアダマール(NoH)によって導き出すことができるバイナリシーケンシー順序のウォルシュ・アダマール(SoWH)を最適化したものである。なお、NoH行列及びSoWH行列の列は直交している。これらの行列は、n次の行列 The continuous-order Walsh-Hadamard (CoWH) according to the present embodiment is an optimization of the binary-sequence-order Walsh-Hadamard (SoWH) that can be derived by the natural-order Hadamard (NoH). Note that the columns of the NoH and SoWH matrices are orthogonal. These matrices are matrices of order n

Figure 2022112364000022
を与えることによって得ることができる。NoH行列は次のように表現できる。
Figure 2022112364000022
can be obtained by giving A NoH matrix can be expressed as follows.

Figure 2022112364000023
ここで、In×nは単位行列である。
Figure 2022112364000023
where I n×n is the identity matrix.

Figure 2022112364000024
は、
Figure 2022112364000025
の転置であり、その次数はXの次元に等しくなければならない。これは、図6(a)に示すような投影パターンを生じる。これは繰り返し適用することができ、次のように、n次の
Figure 2022112364000024
teeth,
Figure 2022112364000025
, whose degree must equal the dimension of X. This produces a projected pattern as shown in FIG. 6(a). This can be applied iteratively, as follows:

Figure 2022112364000026
に対してSylvester's constructionを適用することにより次の行列のシーケンスにつながり、これはウォルシュ・アダマール行列と呼ばれ、次のように表現できる。
Figure 2022112364000026
Applying Sylvester's construction to leads to the following sequence of matrices, called Walsh-Hadamard matrices, which can be expressed as:

Figure 2022112364000027
但し、
Figure 2022112364000027
however,

Figure 2022112364000028
であり、
Figure 2022112364000028
and

Figure 2022112364000029
はクロネッカー積である。その結果、図6(b)に示すような投影パターンを生じる。
Figure 2022112364000029
is the Kronecker product. As a result, a projection pattern as shown in FIG. 6(b) is produced.

ウォルシュ・アダマール行列のシーケンシー順の行は、ビット反転及びgray-code permutationを適用することによってNoH行列から導き出される。これにより、 The sequential rows of the Walsh-Hadamard matrix are derived from the NoH matrix by applying bit-reversal and gray-code permutation. This will

Figure 2022112364000030
で表現されるSoWH測定行列が得られる。
Figure 2022112364000030
We obtain the SoWH measurement matrix expressed as

本実施形態では、測定行列の上部に低周波係数をグループ化することで、SoWH測定行列の投影パターンを再編成する。CoWHの配置では、図6(c)に示すように、投影パターンは、接続された要素の数を増やすように編成されている。これにより、センシングしながら測定品質を向上させることができる。関連するコンポーネントは、対応する値を持つ連続した画素のグループに対応し、より豊富な予備知識の点で、復元アルゴリズム及び逆変換に影響を与える。 In this embodiment, we rearrange the projection pattern of the SoWH measurement matrix by grouping the low-frequency coefficients at the top of the measurement matrix. In the CoWH arrangement, the projected pattern is organized to increase the number of connected elements, as shown in Fig. 6(c). Thereby, the measurement quality can be improved while sensing. The relevant component corresponds to a group of contiguous pixels with corresponding values and influences the reconstruction algorithm and the inverse transform in terms of richer prior knowledge.

また、図6(c)に示すCoWH行列の良好な連続パターンは、NoH行列及びSoWH行列に比べてSRの下限を延長することを可能にし、これは通常は良好な視覚品質のために50%制限されている。 Also, the good continuous pattern of the CoWH matrix shown in FIG. Limited.

CoWH行列は図7に示すアルゴリズムにより生成される。具体的には、i及びjを、

Figure 2022112364000031
の次数とし、探索基準位置(search criteria position)dはn×nに等しい。次に、各dについて、ri,jの除算後の剰余を求める。次数が奇数か偶数かを判定するために、
Figure 2022112364000032
を計算する。各次数についてri,jを求めた後、
Figure 2022112364000033
を再配置するために、Aを空の行列
Figure 2022112364000034
とすると、
Figure 2022112364000035
である。 A CoWH matrix is generated by the algorithm shown in FIG. Specifically, i and j are
Figure 2022112364000031
and the search criteria position d is equal to n×n. Then, for each d, find the remainder after division of r i,j . To determine if the degree is odd or even,
Figure 2022112364000032
to calculate After obtaining r i,j for each order,
Figure 2022112364000033
to rearrange A with an empty matrix
Figure 2022112364000034
and
Figure 2022112364000035
is.

A(CoWH行列)は、少なくともの次の確率でRIPを満たす。 A (CoWH matrix) satisfies the RIP with probability of at least

Figure 2022112364000036
Figure 2022112364000036

ここでβは正の定数である。 where β is a positive constant.

ハードウェア実装のために、この拡張された行列Aを相補の行列からバイナリに二値化している。CoWH行列のサンプリングマスク(投影パターン)は、NoH行列及びSoWH行列に比べて、低周波係数から高周波係数に向けて徐々に配置されている。 For hardware implementation, this extended matrix A is binary binarized from the complementary matrix. The sampling mask (projection pattern) of the CoWH matrix is arranged gradually from low frequency coefficients to high frequency coefficients compared to NoH and SoWH matrices.

図8は、NoH行列、SoWH行列、及びCoWH行列のそれぞれを用いた場合においてl最小化及び逆高速ウォルシュ・アダマール変換(IFWHT)を用いた復元結果を比較して示す図である。図8に示すように、CoWH行列は、同一SRでの視覚品質の点でNoH行列及びSoWH行列を上回っている。なお、図8(a)は構成された測定行列を示し、図8(b)は復元画像を示し、図8(c)は400%ズームした結果を示す。なお、n=65536(256画素×256画素であり、m=8192(12.5%まで圧縮された)であり、B(すなわち、BCIで用いるブロックのサイズ)=8ある。 FIG. 8 is a diagram showing a comparison of reconstruction results using l1 minimization and inverse fast Walsh - Hadamard transform (IFWHT) when using NoH matrix, SoWH matrix, and CoWH matrix, respectively. As shown in FIG. 8, the CoWH matrix outperforms the NoH and SoWH matrices in terms of visual quality at the same SR. 8(a) shows the constructed measurement matrix, FIG. 8(b) shows the restored image, and FIG. 8(c) shows the result of 400% zoom. Note that n=65536 (256 pixels by 256 pixels, m=8192 (compressed to 12.5%), and B (ie, size of block used in BCI)=8.

(2.3)符号化装置
次に、本実施形態に係る符号化装置120について説明する。図9は、本実施形態に係る符号化装置120の一部の構成例を示す図である。
(2.3) Encoding Device Next, the encoding device 120 according to this embodiment will be described. FIG. 9 is a diagram showing a configuration example of part of the encoding device 120 according to this embodiment.

図9に示すように、参照データ生成部1211と、予測データ生成部1212と、選択部1213とにより、図2に示すイントラ予測部121が構成される。イントラ予測部121の入力側には、入力バッファ141が設けられる。量子化部123の出力側には、出力バッファ142が設けられる。 As shown in FIG. 9, the reference data generation unit 1211, the prediction data generation unit 1212, and the selection unit 1213 constitute the intra prediction unit 121 shown in FIG. An input buffer 141 is provided on the input side of the intra prediction unit 121 . An output buffer 142 is provided on the output side of the quantization section 123 .

参照データ生成部1211は、合成部127が出力する復元測定データYから測定値y、y、yを分離するパッケージスプリッタ1211aと、測定値yから測定値yを減算する減算器1211bと、測定値yから測定値yを減算する減算器1211cと、減算器1211bの出力を記憶するレジスタ1211dと、減算器1211cの出力を記憶するレジスタ1211eとを有する。 The reference data generating unit 1211 includes a package splitter 1211a that separates the measured values y1, y2 , and y3 from the restored measured data Y output by the synthesizing unit 127 , and a subtractor that subtracts the measured value y2 from the measured value y1. 1211b, a subtractor 1211c for subtracting the measured value y3 from the measured value y1, a register 1211d for storing the output of the subtractor 1211b, and a register 1211e for storing the output of the subtractor 1211c.

ここで、測定値yは、CoWH行列において画像ブロックの全画素値を取得する投影パターンを構成する行#1により得られた測定値であって、画像ブロックの全画素値の合計に相当する。 where the measurement y1 is the measurement obtained by row #1, which constitutes the projection pattern that captures all pixel values of the image block in the CoWH matrix, and corresponds to the sum of all pixel values of the image block. .

測定値yは、CoWH行列において画像ブロックの左半分の画素値を取得する投影パターンを構成する行#2により得られた測定値であって、画像ブロックの左半分の画素値の合計に相当する。 The measurement y2 is the measurement obtained by row # 2 , which constitutes the projection pattern that captures the pixel values of the left half of the image block in the CoWH matrix and corresponds to the sum of the pixel values of the left half of the image block. do.

測定値yは、CoWH行列において画像ブロックの上半分の画素値を取得する投影パターンを構成する行#3により得られた測定値であって、画像ブロックの上半分の画素値の合計に相当する。 The measurement y3 is the measurement obtained by row #3, which constitutes the projection pattern that captures the pixel values of the upper half of the image block in the CoWH matrix and corresponds to the sum of the pixel values of the upper half of the image block. do.

このため、測定値yから測定値yを減算する減算器1211bの出力は、画像ブロックの右半分の画素値の合計に相当し、これはレジスタ1211dに保持される。この画像ブロックの右半分の画素値の合計は、図4に示す水平予測モードにおける参照データとして用いられる。レジスタ1211dは、現画像ブロックの左側隣接ブロックに対応する参照データだけを保持すればよく、ここではそのサイズを16ビットとしている。 Thus, the output of subtractor 1211b , which subtracts measurement y2 from measurement y1, corresponds to the sum of the pixel values of the right half of the image block, which is held in register 1211d. The sum of pixel values in the right half of this image block is used as reference data in the horizontal prediction mode shown in FIG. Register 1211d only needs to hold the reference data corresponding to the left-hand neighboring block of the current image block, and here its size is 16 bits.

他方、測定値yから測定値yを減算する減算器1211cの出力は、画像ブロックの下半分の画素値の合計に相当し、これはレジスタ1211eに保持される。この画像ブロックの下半分の画素値の合計は、図4に示す垂直予測モードにおける参照データとして用いられる。レジスタ1211eは、現画像ブロックが属する行の1つ上の行に属する各画像ブロックについて参照データを保持する。画像の幅をWとし、画像ブロックのサイズをBとすると、レジスタ1211eは、W/B個のブロック分の参照データを保持する。 On the other hand, the output of subtractor 1211c , which subtracts measurement y1 from measurement y3, corresponds to the sum of the pixel values of the lower half of the image block, which is held in register 1211e. The sum of pixel values in the lower half of this image block is used as reference data in the vertical prediction mode shown in FIG. The register 1211e holds reference data for each image block belonging to the row above the row to which the current image block belongs. Assuming that the image width is W and the image block size is B, the register 1211e holds reference data for W/B blocks.

予測データ生成部1212は、レジスタ1211eが出力する、画像ブロックの下半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置 The prediction data generation unit 1212 calculates the pixel value (average value) per pixel from the sum of the pixel values in the lower half of the image block output from the register 1211e, and transposes the CoWH matrix to this average value.

Figure 2022112364000037
を乗算することにより、垂直予測モードの予測測定データYを出力する。このようにして、イントラ予測部121は、垂直予測モードについて、上側隣接ブロックについて得られた測定値yから、当該上側隣接ブロックについて得られた測定値yを減算することにより、画素ドメインにおける当該上側隣接ブロックの下半分の合計の画素値を得る処理と、下半分の合計の画素値を有効画素数で除算することにより、当該上側隣接ブロックの下半分の画素値の平均を得る処理と、この平均からCoWH行列に基づいて垂直予測モードの予測測定データYを得る処理とを実行する。
Figure 2022112364000037
to output the predicted measurement data Yv in the vertical prediction mode. In this way, the intra prediction unit 121 subtracts the measured value y3 obtained for the upper neighboring block from the measured value y1 obtained for the upper neighboring block for the vertical prediction mode, thereby obtaining A process of obtaining the total pixel value of the lower half of the upper neighboring block, and a process of obtaining the average of the pixel values of the lower half of the upper neighboring block by dividing the total pixel value of the lower half by the number of effective pixels. , and obtaining the predicted measurement data Yv of the vertical prediction mode from this average based on the CoWH matrix.

また、予測データ生成部1212は、レジスタ1211dが出力する、画像ブロックの右半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置 In addition, the prediction data generation unit 1212 calculates the pixel value (average value) per pixel from the sum of the pixel values of the right half of the image block output by the register 1211d, and transposes the CoWH matrix to this average value.

Figure 2022112364000038
を乗算することにより、水平予測モードの予測測定データYを出力する。このようにして、イントラ予測部121は、水平予測モードについて、左側隣接ブロックについて得られた測定値yから、左側隣接ブロックについて得られた測定値yを減算することにより、画素ドメインにおける左側隣接ブロックの右半分の合計の画素値を得る処理と、右半分の合計の画素値を有効画素数で除算することにより、左側隣接ブロックの右半分の画素値の平均を得る処理と、この平均からCoWH行列に基づいて水平予測モードの予測測定データYを得る処理とを実行する。
Figure 2022112364000038
to output the predicted measurement data Yh in the horizontal prediction mode. In this way, the intra prediction unit 121 subtracts the measured value y2 obtained for the left neighboring block from the measured value y1 obtained for the left neighboring block for the horizontal prediction mode, thereby obtaining the left side in the pixel domain. A process of obtaining the total pixel value of the right half of the adjacent block, a process of obtaining the average of the pixel values of the right half of the left adjacent block by dividing the total pixel value of the right half by the number of effective pixels, and this average to obtain predicted measurement data Yh in the horizontal prediction mode based on the CoWH matrix from .

さらに、予測データ生成部1212は、予測測定データY及び予測測定データYの平均を平均予測モードの予測測定データYavgとして求める。 Further, the predicted data generator 1212 obtains the average of the predicted measured data Yv and the predicted measured data Yh as the predicted measured data Yavg in the average prediction mode.

このようなイントラ予測の方法は、次のように表現できる。 Such an intra prediction method can be expressed as follows.

垂直予測モード: Vertical prediction mode:

Figure 2022112364000039
水平予測モード:
Figure 2022112364000039
Horizontal prediction mode:

Figure 2022112364000040
平均予測モード:
Figure 2022112364000040
Average prediction mode:

Figure 2022112364000041
Figure 2022112364000041

選択部1213は、最終的なイントラ予測モードの予測測定データYを選択するために、次のようにSADを用いて、予測候補とYとの間の最小差 To select the final intra-prediction mode prediction measurement data Y p , the selection unit 1213 uses SAD as follows to determine the minimum difference between the prediction candidate and Y

Figure 2022112364000042
を検索し、次のように予測測定データYを選択する。
Figure 2022112364000042
and select the predicted measurement data Yp as follows.

Figure 2022112364000043
Figure 2022112364000043

但し、選択部1213は、予測候補が選択されない場合、予測測定データYをゼロに割り当てる。 However, if no prediction candidate is selected, the selection unit 1213 assigns zero to the prediction measurement data Yp .

そして、残差データ生成部122は、次のようにして残差データYを算出する。 Then, the residual data generator 122 calculates the residual data Yr as follows.

Figure 2022112364000044
Figure 2022112364000044

量子化部123は、次のようにスカラー量子化により残差データYを量子化して量子化データYを出力する。 The quantization unit 123 quantizes the residual data Yr by scalar quantization as follows and outputs quantized data Yq .

Figure 2022112364000045
Figure 2022112364000045

但し、Bはビット深度パラメータであって、例えば4ビットである。 where Bp is a bit depth parameter, eg 4 bits.

なお、逆量子化部126は次の計算を行う。 Note that the inverse quantization unit 126 performs the following calculations.

Figure 2022112364000046
Figure 2022112364000046

これらの処理の中で量子化は非可逆であるが、イントラ予測及びエントロピー符号化は可逆である。 Among these processes, quantization is lossy, but intra prediction and entropy coding are lossless.

(3)測定復号装置
次に、本実施形態に係る測定復号装置200について説明する。図10は、本実施形態に係る測定復号装置200の構成を示す図である。
(3) Measurement decoding device Next, the measurement decoding device 200 according to this embodiment will be described. FIG. 10 is a diagram showing the configuration of a measurement decoding apparatus 200 according to this embodiment.

図10に示すように、測定復号装置200は、受信部210と、復号装置220と、復元部230とを有する。 As shown in FIG. 10 , measurement decoding apparatus 200 has reception section 210 , decoding apparatus 220 and restoration section 230 .

受信部210は、測定符号化装置100から伝送路を介して符号化データを受信し、受信した符号化データを復号装置220に出力する。符号化データは、測定符号化装置100が選択した予測モードを示すモード情報を含む。受信部210は、モード情報も復号装置220に出力する。 Receiving section 210 receives encoded data from measurement encoding apparatus 100 via a transmission path, and outputs the received encoded data to decoding apparatus 220 . The encoded data includes mode information indicating the prediction mode selected by measurement encoding device 100 . Receiving section 210 also outputs mode information to decoding device 220 .

復号装置220は、イントラ予測部221と、ハフマン復号部222と、逆量子化部223と、合成部224とを有する。イントラ予測部221は、参照データ生成部2211と、予測データ生成部2212とを有する。 The decoding device 220 has an intra prediction section 221 , a Huffman decoding section 222 , an inverse quantization section 223 and a synthesis section 224 . The intra prediction section 221 has a reference data generation section 2211 and a prediction data generation section 2212 .

参照データ生成部2211は、測定符号化装置100の参照データ生成部1211と同様に構成され、予測データ生成部2212は、測定符号化装置100の参照データ生成部1211と同様に構成される。但し、予測データ生成部2212は、測定符号化装置100から伝送されるモード情報が示す予測モードについてのみ予測測定データYを生成し、生成した予測測定データYを合成部224に出力する。 Reference data generation section 2211 is configured similarly to reference data generation section 1211 of measurement encoding apparatus 100 , and prediction data generation section 2212 is configured similarly to reference data generation section 1211 of measurement encoding apparatus 100 . However, prediction data generation section 2212 generates prediction measurement data Y p only for the prediction mode indicated by the mode information transmitted from measurement coding apparatus 100 , and outputs the generated prediction measurement data Y p to combining section 224 .

ハフマン復号部222は、受信部210が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYを復元し、復元した量子化データYを逆量子化部223に出力する。 The Huffman decoding unit 222 restores the quantized data Y q by performing Huffman decoding processing on the encoded data output from the receiving unit 210 , and outputs the restored quantized data Y q to the inverse quantization unit 223 . .

逆量子化部223は、復元量子化データYに対して逆量子化処理を行うことにより残差データYを復元し、復元残差データYdeqを合成部224に出力する。 The inverse quantization unit 223 restores the residual data Y r by performing inverse quantization processing on the restored quantized data Y q and outputs the restored residual data Y deq to the synthesizing unit 224 .

合成部224は、復元残差データYdeqと予測測定データYとを合成することにより測定データYを復元し、復元測定データを復元部230に出力する。 Synthesis section 224 reconstructs measurement data Y by combining the reconstructed residual data Y deq and predicted measurement data Y p , and outputs the reconstructed measurement data to reconstruction section 230 .

復元部230は、測定データYから元のn画素分の画素値X(画像ブロック)を復元アルゴリズムにより復元して出力する。CS理論は、m次元の測定データは効率的な復元アルゴリズムを介して元の信号の測定を復元するのに十分であると主張する。例えば、復元部230は、lアルゴリズム及びIFWHTを用いて元のn画素分の画素値X(画像ブロック)を復元する。 The restoration unit 230 restores the original pixel value X (image block) for n pixels from the measurement data Y using a restoration algorithm and outputs the restored pixel value. CS theory asserts that m-dimensional measurement data is sufficient to reconstruct the original signal measurement via an efficient reconstruction algorithm. For example, the restoration unit 230 restores the pixel value X (image block) for the original n pixels using the l1 algorithm and IFWHT .

(4)作用・効果
本実施形態によれば、ウォルシュ・アダマール変換(WHT:Walsh-Hadamard transform)に基づく最適化されたバイナリ構造測定行列(SRM:structural measurement matrix)を含む新たな高解像度BCIのための軽量な符号化フレームワークを実現できる。また、測定ドメインにおいて、CoWH行列の特徴を活用したイントラ予測を行うことにより、空間冗長性を削減できる。よって、効率的に画像を圧縮して保存及び伝送できる。
(4) Actions and Effects According to the present embodiment, a new high-resolution BCI including an optimized binary structural measurement matrix (SRM) based on the Walsh-Hadamard transform (WHT) It is possible to realize a lightweight encoding framework for In addition, spatial redundancy can be reduced by performing intra-prediction utilizing the features of the CoWH matrix in the measurement domain. Therefore, images can be efficiently compressed and stored and transmitted.

以下において、メモリ空間に効率的に格納し、符号化された測定値を伝送するためのシミュレーション結果について説明する。定量的メトリックは、PSNR(peak-to-noise-ratio)、SSIM(structural similarity index measure)、bpp(bits-per-pixel)である。 In the following, simulation results for efficient storage in memory space and transmission of encoded measurements are described. Quantitative metrics are PSNR (peak-to-noise-ratio), SSIM (structural similarity index measure), bpp (bits-per-pixel).

「A. Mercat, M. Viitanen, and J. Vanne, “UVG dataset: 50/120fps 4K sequences for video codec analysis and development,” in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020」で規定されるBeauty、ReadySetGo、Bosphorus、HoneyBeeで構成される色空間で4Kデータセットを使用する。ここで、n=24883200(3840×2160×3)、SR∈{4/4、1/8、1/16、1/32、1/64}およびB=16である。 "A. Mercat, M. Viitanen, and J. Vanne, ``UVG dataset: 50/120fps 4K sequences for video codec analysis and development,'' in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020" We use a 4K dataset in a color space composed of Beauty, ReadySetGo, Bosphorus, and HoneyBee. where n=24883200 (3840×2160×3), SRε{4/4, 1/8, 1/16, 1/32, 1/64} and B=16.

下記の表1は、符号化無しのPSNR(dB)、SSIM、bppに関する最小プロセスBCI測定の比較を示す。表1の最小プロセスBCI測定の比較によると、CoWH行列は、SRが減少するたびにPSNRが平均5~8%、SSIMが0.2~0.5の品質劣化特性を提供することが分かる。 Table 1 below shows a comparison of minimum process BCI measurements for PSNR (dB) without encoding, SSIM, bpp. A comparison of the minimum process BCI measurements in Table 1 shows that the CoWH matrix provides quality degradation characteristics of 5-8% on average for PSNR and 0.2-0.5 for SSIM for each decrease in SR.

Figure 2022112364000047
Figure 2022112364000047

さらに、SRが1/16に等しい場合、CoWH行列は、1/32および1/64と比較して、アンダーサンプリングアーティファクトが少なく、良好な結果の下限を提供している。以下において、SRを1/16に固定して、符号化性能を評価し、最先端の研究と比較する。 Furthermore, when SR equals 1/16, the CoWH matrix provides a lower bound for better results with less undersampling artifacts compared to 1/32 and 1/64. In the following, with SR fixed at 1/16, the coding performance is evaluated and compared with state-of-the-art research.

さらに、各投影パターン間の関係を高めることにより、より高い視覚品質が得られるという仮説を証明する。但し、その結果、エッジの詳細が失われる。 Furthermore, we prove the hypothesis that a higher visual quality can be obtained by increasing the relationship between each projection pattern. However, this results in loss of edge detail.

さらに、本実施形態に係る測定符号化装置100によるイントラ予測(IPMC:Intra Prediction-based Measurement Coding)を、最小限のプロセスBCI測定を空間的に符号化する最先端の研究と比較する。これらの比較では、最先端のコードを選択した。ただし、符号化性能の比較を公平にするために、量子化方法及びパラメータを同じに変更した。SQを使用し、ベースラインとして Furthermore, intra prediction (IPMC: Intra Prediction-based Measurement Coding) by the measurement coding apparatus 100 according to the present embodiment is compared with state-of-the-art work on spatially coding minimal process BCI measurements. For these comparisons, the state-of-the-art code was selected. However, the quantization method and parameters were changed to be the same in order to make the comparison of coding performance fair. Using SQ as a baseline

Figure 2022112364000048
を用いて測定値をサンプリングした。
Figure 2022112364000048
was used to sample the measurements.

Figure 2022112364000049
Figure 2022112364000049

表2のシミュレーション結果のように、IPMCは全体としてPSNRが19.96%dB、SSIMが20.25%、bppが10.34%のSQを達成した。 As shown in the simulation results in Table 2, IPMC as a whole achieved SQ with PSNR of 19.96% dB, SSIM of 20.25% and bpp of 10.34%.

DPCMと比較すると、PSNRが14.50%、SSIMが9.19%、bppが8.77%を達成し、あらゆる面でDPCMを上回った。 Compared with DPCM, it achieved PSNR of 14.50%, SSIM of 9.19% and bpp of 8.77%, outperforming DPCM in all aspects.

SDPCなどの同様の符号化と比較すると、PSNRが14.37%、SSIMが9.19%、bppが7.19%であった。 PSNR was 14.37%, SSIM was 9.19% and bpp was 7.19% when compared to similar encodings such as SDPC.

さらに、サンプリングおよび符号化のより進歩したModified SRMと比較すると、PSNRが11.73%、SSIMが13.09%、bppが6.74%と本実施形態が上回った。したがって、Modified SRMは、隣接するブロックから情報を取得するためにバイナリSRMを変更し、H.264として最終的にイントラ予測候補を生成するため、あまり効率的ではない。 Furthermore, when compared with Modified SRM, which is more advanced in sampling and encoding, PSNR is 11.73%, SSIM is 13.09%, and bpp is 6.74%, which are higher in this embodiment. Therefore, the Modified SRM modifies the binary SRM to obtain information from neighboring blocks, and the H. H.264 to generate the final intra-prediction candidates, so it is not very efficient.

よって、本実施形態に係るIPMCは、最先端の研究と比較して、PSNRが15.06%、SSIMが18.74%、bppが3.7%という点で、全体的に優れた符号化性能を示した。 Thus, IPMC according to the present embodiment is an overall superior coding in terms of PSNR of 15.06%, SSIM of 18.74% and bpp of 3.7% compared to the state-of-the-art work. showed performance.

図11は、HoneyBeeデータセットを使用して400%ズームした詳細の例を示す図である。図11において、(a)はSQ(ベースライン)、(b)はDPCM、(c)はSDCP、(d)はModified SRM、(e)は本実施形態である。図11に示すように、HoneyBeeデータセットを使用してトリミングされた結果によると、SRが1/16の場合、本実施形態は最先端の研究と比較してより豊かな視覚品質を提供した。 FIG. 11 shows an example of detail zoomed 400% using the HoneyBee dataset. In FIG. 11, (a) is SQ (baseline), (b) is DPCM, (c) is SDCP, (d) is Modified SRM, and (e) is this embodiment. As shown in Fig. 11, the trimmed results using the HoneyBee dataset show that at SR of 1/16, the present embodiment provided richer visual quality compared to the state-of-the-art work.

よって、表2の全体的な性能によると、本実施形態は、最先端の研究に対して、すべての面でトレードオフの性能パフォーマンスをもたらした。 Thus, according to the overall performance in Table 2, the present embodiment provided trade-off performance performance on all fronts for state-of-the-art research.

さらに、FPGAにIPMCアルゴリズムを実装した。ここで、解像度は3820×2140、合計ロジック使用率は3,421、最大動作周波数は102.65MHzである。このアーキテクチャは、28.32mWの電力を消費した。これにより、表3に要約されているように、ソフトウェア実装よりも100倍高速なリアルタイムエンコーディングの可能性がもたらされた。 In addition, we have implemented the IPMC algorithm on the FPGA. Here, the resolution is 3820×2140, the total logic utilization is 3,421, and the maximum operating frequency is 102.65 MHz. This architecture consumed 28.32 mW of power. This provided the potential for real-time encoding that is 100 times faster than software implementations, as summarized in Table 3.

Figure 2022112364000050
Figure 2022112364000050

(5)その他の実施形態
上述の実施形態に係る各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
(5) Other Embodiments A program that causes a computer to execute each process according to the above-described embodiments may be provided. The program may be recorded on a computer readable medium. A computer readable medium allows the installation of the program on the computer. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be, for example, a recording medium such as CD-ROM or DVD-ROM.

測定符号化装置100(符号化装置120)が行う各処理を実行する回路を集積化し、測定符号化装置100(符号化装置120)を半導体集積回路(チップセット、SoC)により構成してもよい。 A circuit for executing each process performed by the measurement encoding device 100 (encoding device 120) may be integrated, and the measurement encoding device 100 (encoding device 120) may be configured by a semiconductor integrated circuit (chipset, SoC). .

以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 Although the embodiments have been described in detail with reference to the drawings, the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the invention.

1 :測定伝送システム
100 :測定符号化装置
110 :イメージング装置
111 :イメージセンサ部
111a :画素アレイ
111b :行選択部
111c :列選択部
112 :圧縮センシング部
112a :行列演算トリガ部
112b :行列演算部
113 :A/D変換部
120 :符号化装置
121 :イントラ予測部
122 :残差データ生成部
123 :量子化部
124 :ハフマン符号化部
125 :ハフマン復号部
126 :逆量子化部
127 :合成部
130 :送信部
141 :入力バッファ
142 :出力バッファ
200 :測定復号装置
210 :受信部
220 :復号装置
221 :イントラ予測部
222 :ハフマン復号部
223 :逆量子化部
224 :合成部
230 :復元部
1211 :参照データ生成部
1211a :パッケージスプリッタ
1211b :減算器
1211c :減算器
1211d :レジスタ
1211e :レジスタ
1212 :予測データ生成部
1213 :選択部
2211 :参照データ生成部
2212 :予測データ生成部
1: measurement transmission system 100: measurement coding device 110: imaging device 111: image sensor section 111a: pixel array 111b: row selection section 111c: column selection section 112: compression sensing section 112a: matrix calculation trigger section 112b: matrix calculation section 113: A/D conversion unit 120: Encoding device 121: Intra prediction unit 122: Residual data generation unit 123: Quantization unit 124: Huffman coding unit 125: Huffman decoding unit 126: Inverse quantization unit 127: Synthesis unit 130 : Transmitter 141 : Input buffer 142 : Output buffer 200 : Measurement decoder 210 : Receiver 220 : Decoder 221 : Intra predictor 222 : Huffman decoder 223 : Inverse quantizer 224 : Synthesizer 230 : Restorer 1211 : Reference data generator 1211a : Package splitter 1211b : Subtractor 1211c : Subtractor 1211d : Register 1211e : Register 1212 : Predicted data generator 1213 : Selector 2211 : Reference data generator 2212 : Predicted data generator

Claims (8)

画像ブロック単位で画像出力を行うイメージセンサ部と、
前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、
前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部と、を備え、
前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行い、
前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なり、
前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されていることを特徴とするイメージング装置。
an image sensor unit that outputs an image in units of image blocks;
a compression sensing unit that performs a compression sensing process of applying a measurement matrix of m rows and n columns (m<n) to pixel values of n pixels constituting the image block and outputting m measured values;
an analog/digital conversion unit that outputs measurement data by performing analog/digital conversion processing on the m measured values;
The compression sensing unit uses a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequence ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequence as the measurement matrix, and the compression perform sensing processing,
Each row of the CoWH matrix has a different projection pattern when projected onto the image block,
The imaging apparatus according to claim 1, wherein the CoWH matrix is configured such that the number of consecutive elements having the same value in the projection pattern decreases from an upper row to a lower row in the CoWH matrix.
前記CoWH行列は、
前記画像ブロックの全画素値を取得する第1投影パターンを構成する行と、
前記画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、
前記画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行と、を有することを特徴とする請求項1に記載のイメージング装置。
The CoWH matrix is
rows forming a first projection pattern for obtaining all pixel values of the image block;
rows forming a second projection pattern for obtaining pixel values of the upper half of the image block;
and a row forming a third projection pattern for obtaining pixel values of the left half of the image block.
前記CoWH行列における最も上側の行は、前記第1投影パターンを構成し、
前記CoWH行列における上から2番目及び3番目の行は、前記第2投影パターン及び前記第3投影パターンを構成することを特徴とする請求項2に記載のイメージング装置。
the uppermost row in the CoWH matrix constitutes the first projection pattern;
3. The imaging apparatus of claim 2, wherein the second and third rows from the top in the CoWH matrix constitute the second projection pattern and the third projection pattern.
請求項2又は3に記載のイメージング装置と、
前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、
前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部と、を備えることを特徴とする測定符号化装置。
An imaging device according to claim 2 or 3;
using any one of a plurality of intra prediction modes including a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block and a horizontal prediction mode using a left adjacent block adjacent to the left side of the image block; an intra prediction unit that outputs predicted measured data obtained by predicting the measured data of the image block;
a quantization unit that performs quantization processing on residual data representing a difference between the measurement data of the image block and the prediction measurement data output from the intra prediction unit. Device.
前記イントラ予測部は、前記垂直予測モードについて、
前記上側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記上側隣接ブロックに対して前記第2投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記上側隣接ブロックの下半分の合計の画素値を得る処理と、
前記下半分の合計の画素値を有効画素数で除算することにより、前記上側隣接ブロックの下半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記垂直予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4に記載の測定符号化装置。
The intra prediction unit, for the vertical prediction mode,
By subtracting the measurement value obtained by applying the second projection pattern to the upper adjacent block from the measurement value obtained by applying the first projection pattern to the upper adjacent block, obtaining the sum pixel value of the lower half of the upper neighboring block in the pixel domain;
obtaining an average pixel value of the lower half of the upper adjacent block by dividing the total pixel value of the lower half by the number of effective pixels;
obtaining prediction measurement data for the vertical prediction mode from the average based on the CoWH matrix.
前記イントラ予測部は、前記水平予測モードについて、
前記左側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記左側隣接ブロックに対して前記第3投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記左側隣接ブロックの右半分の合計の画素値を得る処理と、
前記右半分の合計の画素値を有効画素数で除算することにより、前記左側隣接ブロックの右半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記水平予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4又は5に記載の測定符号化装置。
The intra prediction unit, for the horizontal prediction mode,
By subtracting the measured value obtained by applying the third projection pattern to the left adjacent block from the measured value obtained by applying the first projection pattern to the left adjacent block, obtaining the sum pixel value of the right half of the left neighboring block in the pixel domain;
obtaining an average pixel value of the right half of the left adjacent block by dividing the total pixel value of the right half by the number of valid pixels;
and obtaining prediction measurement data for the horizontal prediction mode from the average based on the CoWH matrix.
前記複数のイントラ予測モードは、前記垂直予測モードの予測測定データと前記水平予測モードの予測測定データとの平均を予測測定データとして算出する平均予測モードをさらに含み、
前記イントラ予測部は、前記垂直予測モードの予測測定データと、前記水平予測モードの予測測定データと、前記平均予測モードの予測測定データとのそれぞれについて、前記画像ブロックの測定データとの類似度を算出することにより、前記類似度が最も高い予測測定データを選択する処理を実行することを特徴とする請求項4乃至6のいずれか1項に記載の測定符号化装置。
The plurality of intra prediction modes further include an average prediction mode for calculating an average of prediction measurement data in the vertical prediction mode and prediction measurement data in the horizontal prediction mode as prediction measurement data,
The intra prediction unit calculates a similarity between each of the prediction measurement data in the vertical prediction mode, the prediction measurement data in the horizontal prediction mode, and the prediction measurement data in the average prediction mode and the measurement data of the image block. 7. The measurement coding apparatus according to any one of claims 4 to 6, wherein the process of selecting the predicted measurement data with the highest degree of similarity is performed by calculating.
前記量子化部により量子化された残差データを符号化する符号化部と、
前記符号化部により符号化された残差データを復号側に送信する送信部と、をさらに備え、
前記送信部は、前記イントラ予測部が選択した予測測定データの予測モードを示すモード情報をさらに送信することを特徴とする請求項7に記載の測定符号化装置。
an encoding unit that encodes the residual data quantized by the quantization unit;
A transmitting unit that transmits residual data encoded by the encoding unit to a decoding side,
The measurement coding apparatus according to claim 7, wherein the transmission unit further transmits mode information indicating a prediction mode of the prediction measurement data selected by the intra prediction unit.
JP2021008179A 2021-01-21 2021-01-21 Imaging device and measurement coding device Pending JP2022112364A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021008179A JP2022112364A (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021008179A JP2022112364A (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Publications (1)

Publication Number Publication Date
JP2022112364A true JP2022112364A (en) 2022-08-02

Family

ID=82655994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021008179A Pending JP2022112364A (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Country Status (1)

Country Link
JP (1) JP2022112364A (en)

Similar Documents

Publication Publication Date Title
Kang et al. Distributed compressive video sensing
US8681873B2 (en) Data compression for video
JP5566529B2 (en) How to code a video using a dictionary
Do et al. Distributed compressed video sensing
Chen et al. Dynamic measurement rate allocation for distributed compressive video sensing
US20110206118A1 (en) Data Compression for Video
US9609342B2 (en) Compression for frames of a video signal using selected candidate blocks
CN107743239B (en) Method and device for encoding and decoding video data
Dinh et al. Measurement coding for compressive imaging using a structural measuremnet matrix
Zhang et al. Spatially directional predictive coding for block-based compressive sensing of natural images
CN105474642A (en) Re-encoding image sets using frequency-domain differences
CN104301730A (en) Two-way video coding and decoding system and method based on video mobile equipment
JP7431752B2 (en) Video encoding, video decoding method, device, computer device and computer program
Unde et al. Rate–distortion analysis of structured sensing matrices for block compressive sensing of images
Unde et al. Adaptive compressive video coding for embedded camera sensors: compressed domain motion and measurements estimation
CN103634607A (en) Method for prediction in image encoding and image encoding apparatus applying the same
KR100846870B1 (en) Apparatus and method of multi-stage, multi-dimensional transform based on multiple unit blocks
Zhao et al. Compressive-sensed image coding via stripe-based DPCM
JP2022112364A (en) Imaging device and measurement coding device
JP2009296277A (en) Image coder, image decoder, image coding method, image decoding method, and program
Letaief et al. Real time HEVC video compression using Hybrid DWT-DCT algorithm on an FPGA
Badem et al. Transform domain residual coding technique for distributed video coding
KR101096619B1 (en) The method for encoding/decoding data and the apparatus thereof
JP2011223316A (en) Image encoding apparatus, image decoding apparatus, and method for image encoding and decoding
He et al. Study on Segmentation-Based HEVC Compression Performance

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231122