JP2022112364A - Imaging device and measurement coding device - Google Patents
Imaging device and measurement coding device Download PDFInfo
- Publication number
- JP2022112364A JP2022112364A JP2021008179A JP2021008179A JP2022112364A JP 2022112364 A JP2022112364 A JP 2022112364A JP 2021008179 A JP2021008179 A JP 2021008179A JP 2021008179 A JP2021008179 A JP 2021008179A JP 2022112364 A JP2022112364 A JP 2022112364A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- measurement
- unit
- prediction
- cowh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005259 measurement Methods 0.000 title claims abstract description 181
- 238000003384 imaging method Methods 0.000 title claims description 22
- 239000011159 matrix material Substances 0.000 claims abstract description 107
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000007423 decrease Effects 0.000 claims abstract description 5
- 238000013139 quantization Methods 0.000 claims description 33
- 230000005540 biological transmission Effects 0.000 claims description 24
- 238000007906 compression Methods 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000006866 deterioration Effects 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 238000013459 approach Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 230000002194 synthesizing effect Effects 0.000 description 5
- ISRUGXGCCGIOQO-UHFFFAOYSA-N Rhoden Chemical compound CNC(=O)OC1=CC=CC=C1OC(C)C ISRUGXGCCGIOQO-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 241000256844 Apis mellifera Species 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Studio Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、イメージング装置及び測定符号化装置に関する。 The present invention relates to imaging devices and measurement coding devices.
ナイキストシャノンのサンプリング定理は、サンプリングレート(SR)は信号の少なくとも2倍の周波数でなければならないというものであるが、従来のイメージング技術は実装の限界に直面している。近年開発されたCMOSイメージセンサ(CIS)は解像度が4K、8K、16Kであり、高価且つ高消費電力である。さらに、大量の画像データを保存するために巨大な記憶空間を必要とする。 Although the Nyquist-Shannon sampling theorem states that the sampling rate (SR) must be at least twice the frequency of the signal, conventional imaging techniques face implementation limits. Recently developed CMOS image sensors (CIS) have resolutions of 4K, 8K, and 16K, and are expensive and consume a lot of power. Furthermore, it requires a huge storage space to store a large amount of image data.
画像データの保存及び伝送コストを削減するために、JPEG/JPEG2000、AVC(Advanced Video Coding)、HEVC(High-Efficiency Video Coding)、及びVVC(Versatile Video Coding)等のマルチメディア圧縮ツールが広く用いられている。ソフトウェア及びハードウェアの実装では、世代ごとに最大10倍の複雑さに達する可能性があり、これはCIS設計の障害の結果である。 Multimedia compression tools such as JPEG/JPEG2000, AVC (Advanced Video Coding), HEVC (High-Efficiency Video Coding), and VVC (Versatile Video Coding) are widely used to reduce image data storage and transmission costs. ing. Software and hardware implementations can reach up to ten times complexity per generation, which is a result of CIS design impediments.
すべてのデータ圧縮アルゴリズムは、空間的及び時間的な冗長性を低下させる。原信号は、DCT(Discrete Cosine Transform)、フーリエ変換の変形、DWT(Discrete Wavelet Transform)等の一般的な変換基底を用いた係数の疎なベクトルの観点から、画像データを効率的に圧縮し、これは非可逆である。 All data compression algorithms reduce spatial and temporal redundancy. The original signal is obtained by efficiently compressing the image data from the viewpoint of a sparse vector of coefficients using a general transform basis such as DCT (Discrete Cosine Transform), Fourier transform, DWT (Discrete Wavelet Transform), This is irreversible.
低ビットレートを満たすために非可逆圧縮を実行する場合、そもそもなぜ高次元及び冗長な測定値を収集する必要があるのかという疑問が生じる。ここで、高次元測定を集めて圧縮する代わりに、圧縮された測定値を取得し、測定値と一致する最も疎な高次元信号を導き出すことができる。これは「圧縮センシング」又は「圧縮サンプリング」と呼ばれ、以下において適宜「CS」と表記する。 When performing lossy compression to meet low bitrates, the question arises why we need to collect high-dimensional and redundant measurements in the first place. Now, instead of collecting and compressing high-dimensional measurements, we can take the compressed measurements and derive the sparsest high-dimensional signal that matches the measurements. This is called "compressed sensing" or "compressed sampling" and will be hereinafter appropriately denoted as "CS".
このような圧縮センシングは、データ収集及び処理に革命をもたらす可能性を秘めた新しい視点であり、信号処理、データ圧縮、逆問題の解決、放射システムの設計、レーダー、壁を介したイメージング、SAR(Synthetic Aperture Radar)アンテナのいくつかの強化されたアプローチを可能にしている。 Such compressed sensing is a new perspective that has the potential to revolutionize data acquisition and processing: signal processing, data compression, inverse problem solving, radiation system design, radar, imaging through walls, SAR. (Synthetic Aperture Radar) antennas allow for some enhanced approaches.
圧縮センシングを用いたブロックベースの計算イメージング(BCI: Block-based Computational Imaging)の進歩が近年注目を集めている。このパラダイムにより、次世代のイメージセンサは、読み出し遅延の短縮及び消費電力の低減に優れた性能を発揮できる。 Advances in Block-based Computational Imaging (BCI) using compressed sensing have attracted attention in recent years. This paradigm will enable next-generation image sensors to deliver superior performance in reduced readout delays and reduced power consumption.
それにもかかわらず、最小の処理のBCI測定のための新しい符号化アルゴリズムの必要性が高まっている。一般に圧縮センシングは、スパーシティ及びインコヒーレントで構成される2つの主要な基本的条件に基づいて構築される。 Nonetheless, there is a growing need for new coding algorithms for BCI measurements with minimal processing. Compressed sensing is generally built on two main basic conditions consisting of sparsity and incoherence.
特定のアプリケーションでCSを適用するための重要な条件として、信号特性は、特定の直交変換基底で表現される場合、疎でなければならない。この特性は、少数の係数だけが信号情報の大部分を含み、次のように表現できることを意味する。 An important condition for applying CS in a particular application is that the signal properties should be sparse when represented in a particular orthogonal transform basis. This property means that only a few coefficients contain most of the signal information and can be expressed as:
圧縮センシングの理論は、インコヒーレンスが測定の質及び信号のサンプリング方法に関連する鍵であると主張している。したがって、Xのサンプリングに使用される測定行列 Compressed sensing theory claims that incoherence is key to the quality of the measurement and how the signal is sampled. Therefore, the measurement matrix used for sampling X
ベルヌーイ、ガウス、バイナリなどの様々な分布によって by various distributions such as Bernoulli, Gaussian, and binary
信号の良好な復元を保証するために、RIP(Restricted Isometry Property)と呼ばれる行列の特性が重要である。次の式を使用して、不均一な分散測定行列のmの下限の次元を決定できる。 A matrix property called RIP (Restricted Isometry Property) is important to ensure good signal restoration. The following formula can be used to determine the lower bound dimension of m for a heterogeneous variance measure matrix.
よって、l1最小化と呼ばれる凸最適化を用いて、次の式のように、古典的な方法により測定値を復元できる。 Thus, convex optimization, called l 1 minimization, can be used to recover the measurements by the classical method, as follows:
グリーディベースの復元アルゴリズムとして、OMP(Orthogonal Matching Pursuit)、それの拡張であるステップワイズOMP、A*Omp、CoSaMP、及びTwIST2が圧縮センシングのために提案されている。 As greedy-based restoration algorithms, OMP (Orthogonal Matching Pursuit), its extensions Stepwise OMP, A*Omp, CoSaMP, and TwIST2 have been proposed for compressed sensing.
l1最小化と比較すると、グリーディベースの復元アルゴリズムは一連の部分空間問題を最小限に抑えることで、一般に高速である。しかし、より高い予備知識及び良好な測定量が必要であり、一部のアプリケーションはセンシングデバイスでSRを削減する必要がある場合にそのような情報を得ることが現実的ではない。 Compared to l 1 minimization, greedy-based restoration algorithms are generally faster by minimizing a series of subspace problems. However, it requires higher prior knowledge and better measurements, and for some applications it is impractical to obtain such information when the sensing device needs to reduce the SR.
スカラー量子化(SQ)は、簡単な測定符号化アプローチを提供した(非特許文献1、2参照)。SQ符号化は、情報理論によるレート歪み(RD)性能の点で非常に非効率的であることを確立した。従来の符号化と比較すると、SQ符号化はビットレートの低い利用を生み出すが、結果的に高い復元エラーが発生する。したがって、QIHT(Quantized Iterative Hard Thresholding)、QCoSaMP(Quantized Compressed Sampling Matching Pursuit)、AOP-QIHT(Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding)等の、破損した符号化された測定値を予測するために複雑な復元アルゴリズムが必要である。品質劣化は、最終的に復元された画像・ビデオに表示される。 Scalar quantization (SQ) provided a simple measurement coding approach [1, 2]. It was established that SQ coding is very inefficient in terms of rate-distortion (RD) performance according to information theory. Compared to conventional encoding, SQ encoding yields low bitrate utilization, but results in high reconstruction error. Therefore, complex techniques such as QIHT (Quantized Iterative Hard Thresholding), QCoSaMP (Quantized Compressed Sampling Matching Pursuit), AOP-QIHT (Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding) are used to predict corrupted coded measurements. A decompression algorithm is required. The quality degradation will show up in the final reconstructed image/video.
DPCM(Differential Pulse-Code Modulation)は、伝送路上のビットレートを低減するために適用される簡単なアプローチでもある(非特許文献3参照)。DPCM符号化では、以前の符号化されたブロックを1つ使用して現在のブロックを予測する。ただし、以前の符号化されたブロックには、現在のブロックと関係のない無関係な情報が含まれている可能性があり、その結果、ビットレートが不要に増加する。それにもかかわらず、DPCM符号化は実用的な符号化方法を提供する。 DPCM (Differential Pulse-Code Modulation) is also a simple approach applied to reduce the bit rate on the transmission path (see Non-Patent Document 3). DPCM coding uses one previously coded block to predict the current block. However, previously encoded blocks may contain extraneous information unrelated to the current block, resulting in an unnecessary increase in bitrate. Nevertheless, DPCM encoding provides a practical encoding method.
非特許文献4における符号化手法は、BCI測定に対してDCT符号化を行う。このアプローチは、SQやDPCMよりも符号化効率が向上する。 The encoding method in Non-Patent Document 4 performs DCT encoding on BCI measurements. This approach improves coding efficiency over SQ and DPCM.
非特許文献5の研究では、量子化器のデッドゾーンで調査された最先端の符号化スキームからの代替アプローチを提案した。非特許文献5では、品質劣化は主に量子化器から来ていると述べ、歪みは測定符号化スキームにおける量子化及びSRの両方に関連していると述べている。したがって、このアプローチでは、測定行列の選択、量子化及びSRのトレードオフ、並びにディープラーニングを用いた復元アルゴリズムを含むシステムパラメータを設計した。さらに、有効な方法は、量子化ステップ及びSRを共同で制御して、任意のビットレートでほぼ最適な品質を達成できる。 [5] proposed an alternative approach from state-of-the-art coding schemes investigated with quantizer dead zones. [5] state that the quality degradation comes mainly from the quantizer, and that the distortion is related to both quantization and SR in the measurement coding scheme. Therefore, in this approach, we designed the system parameters, including measurement matrix selection, quantization and SR trade-offs, and a restoration algorithm using deep learning. Moreover, effective methods can jointly control the quantization step and SR to achieve near-optimal quality at any bitrate.
方向符号化アプローチは非特許文献6で初めて導入されている。SDPC(Spatially Directional Predictive Coding)は、高い復元確率及び低ビットレートでのSQ符号化及びDPCM符号化を達成した効率的な測定符号化アプローチである。この研究では、自然画像をサンプリングするために、測定行列としてランダムガウシアンを用いている。しかし、ガウス測定行列が適用されているため、ビットレートの不安定な利用が生じる。重要なのは、バイナリのみをサポートするBCIに対してこの種の測定行列を用いることができなかったということである。 The directional coding approach was first introduced in [6]. Spatially Directional Predictive Coding (SDPC) is an efficient measurement coding approach that achieves SQ and DPCM coding with high probability of recovery and low bitrates. In this study, we use random Gaussian as the measurement matrix to sample natural images. However, since a Gaussian measurement matrix is applied, it results in unstable utilization of bitrate. Importantly, this kind of measurement matrix could not be used for BCI, which only supports binary.
H.264/AVCから流用されたイントラ予測のコンセプトを測定符号化と組み合わせ、イントラ予測候補を生成するための測定行列の部分的改変が非特許文献7で提案されている(Modified SRM)。部分的に改変されたランダムバイナリ測定行列を用いた4方向のイントラ予測アプローチであり、この研究は主に符号化された測定値をエンドポイントに伝達することに焦点を当てている。特定のサンプリングパターンを測定行列に埋め込み、センシングしながら境界情報を得る。非特許文献7では、得られた情報に H. Non-Patent Document 7 proposes a partial modification of the measurement matrix to generate intra prediction candidates by combining the concept of intra prediction borrowed from H.264/AVC with measurement coding (Modified SRM). A four-way intra-prediction approach using a partially modified random binary measurement matrix, this work is mainly focused on conveying coded measurements to endpoints. A specific sampling pattern is embedded in the measurement matrix to obtain boundary information while sensing. In Non-Patent Document 7, the obtained information
本発明は、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供することを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide an imaging apparatus and a measurement coding apparatus that can efficiently compress an image while suppressing deterioration in image quality when compressed sensing is used.
第1の態様に係るイメージング装置は、画像ブロック単位で画像出力を行うイメージセンサ部と、前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部とを備える。前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行う。前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なる。前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 An imaging apparatus according to a first aspect includes an image sensor unit that outputs an image in image block units, and a measurement matrix of m rows and n columns (m<n) applied to the pixel values of n pixels that constitute the image block. a compressed sensing unit that performs compressed sensing processing to output m measured values; and an analog/digital converter that outputs measured data by performing analog/digital conversion processing on the m measured values. . The compression sensing unit uses a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequence ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequence as the measurement matrix, and the compression Perform sensing processing. Each row of the CoWH matrix has a different projection pattern when projected onto the image block. The CoWH matrix is configured such that the number of consecutive elements of the same value in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.
第2の態様に係る測定符号化装置は、第1の態様に係るイメージング装置と、前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部とを備える。 A measurement coding apparatus according to a second aspect includes the imaging apparatus according to the first aspect, a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block, and a left adjacent block adjacent to the left side of the image block. an intra prediction unit that outputs predicted measurement data obtained by predicting the measurement data of the image block using any one of a plurality of intra prediction modes including a horizontal prediction mode using blocks; A quantization unit that performs quantization processing on residual data representing a difference between the measured data and the predicted measured data output from the intra prediction unit.
本発明によれば、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供できる。 Advantageous Effects of Invention According to the present invention, it is possible to provide an imaging device and a measurement coding device that can efficiently compress an image while suppressing image quality deterioration when compressed sensing is used.
図面を参照して、実施形態に係る測定伝送システムについて説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 A measurement transmission system according to an embodiment will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.
(1)測定伝送システムの構成
まず、本実施形態に係る測定伝送システムの構成について説明する。図1は、本実施形態に係る測定伝送システム1の構成を示す図である。図1に示すように、測定伝送システム1は、測定符号化装置100と、測定復号装置200とを有する。
(1) Configuration of measurement transmission system First, the configuration of the measurement transmission system according to this embodiment will be described. FIG. 1 is a diagram showing the configuration of a
測定符号化装置100は、画像センシングにより画像データを生成するとともに、画像データを圧縮センシングにより圧縮する。そして、測定符号化装置100は、圧縮センシングにより圧縮された測定データを圧縮符号化によりさらに圧縮し、圧縮された符号化データ(ビットストリーム)を、伝送路を介して送信する。例えば、伝送路は無線伝送路である。伝送路は、有線伝送路を含んでもよい。
The
測定復号装置200は、圧縮された符号化データを測定符号化装置100から受信し、受信した符号化データから測定データを復号する。そして、測定復号装置200は、復元アルゴリズムを用いて測定データから元の画像データを復元し、例えばディスプレイに対して画像データを出力する。
The
測定伝送システム1は、遠隔監視システムを構成してもよい。例えば、測定符号化装置100がバッテリ駆動型のセンシングデバイスであって、測定復号装置200がサーバに設けられてもよい。サーバは、測定符号化装置100から画像データを収集し、監視対象に対する遠隔監視を行ってもよい。このようなセンシングデバイスは、駆動時間を延長するために低消費電力であることが要求される。
The
なお、図1において、測定符号化装置100を1つのみ図示しているが、測定復号装置200は、複数の測定符号化装置100から符号化データを受信してもよい。
Although only one
また、測定符号化装置100から測定復号装置200への符号化データの伝送は、伝送路を介して行われる場合に限定されるものではなく、記憶媒体を介して測定符号化装置100から測定復号装置200へ間接的に符号化データが伝送されてもよい。
Also, the transmission of encoded data from
(2)測定符号化装置
次に、本実施形態に係る測定符号化装置100について説明する。
(2) Measurement Coding Apparatus Next, the
(2.1)測定符号化装置の全体構成
図2は、本実施形態に係る測定符号化装置100の構成を示す図である。
(2.1) Overall Configuration of Measurement Coding Apparatus FIG. 2 is a diagram showing the configuration of the
図2に示すように、測定符号化装置100は、イメージング装置110と、符号化装置120と、送信部130とを有する。イメージング装置110、符号化装置120、及び送信部130は、別体に構成されていてもよいし、一体に構成されていてもよい。測定符号化装置100は、図示を省略するバッテリを有していてもよい。
As shown in FIG. 2, the
イメージング装置110は、イメージセンサ部111と、圧縮センシング部112と、アナログ/デジタル(A/D)変換部113とを有する。
The
イメージセンサ部111は、画像ブロック単位で画像出力を行う。イメージセンサ部111は、CMOSイメージセンサ(CIS)を含んで構成される。但し、イメージセンサ部111は、CCDイメージセンサを含んで構成されてもよい。
The
圧縮センシング部112は、イメージセンサ部111が出力する画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する。このような処理は、画素ドメインから測定ドメインへの変換処理に相当する。
The
図3は、本実施形態に係る圧縮センシング部112の動作を示す図である。図3に示すように、1つの画像が複数の画像ブロックに分割され、ラスタースキャン順で画像ブロックが取得される。各画像ブロックは、n画素(n個の画素)分の画素値からなる。圧縮センシング部112は、各画像ブロックからラスタースキャン順で画素値を取得する。
FIG. 3 is a diagram showing the operation of the
図3において、画像ブロックB1に対応する画素値列X1と、画像ブロックB2に対応する画素値列X2と、画像ブロックB3に対応する画素値列X3と、画像ブロックBiに対応する画素値列Xiとを例示している。画素値列は、n個の画素値(x1乃至xn)からなる。 In FIG. 3 , a pixel value sequence X1 corresponding to image block B1 , a pixel value sequence X2 corresponding to image block B2, a pixel value sequence X3 corresponding to image block B3 , and an image block B i , and pixel value sequences X i corresponding to . A pixel value sequence consists of n pixel values (x 1 to x n ).
圧縮センシング部112は、各画素値列Xにm行n列の測定行列(Measurement Matrix)を乗算して出力する。これにより、各画素値列Xは、m個の測定値(y1乃至ym)からなる測定値列Yに変換される。ここで、mはnよりも小さいため、データ量が圧縮されることになる。
The
図2に戻り、A/D変換部113は、圧縮センシング部112が出力するm個の測定値Yに対してA/D変換処理を行うことにより、デジタル信号である測定データYを出力する。圧縮センシングにより測定値の数が削減(圧縮)されているため、A/D変換部113の消費電力を低く抑えることができる。
Returning to FIG. 2, the A/
A/D変換部113が出力する各画像ブロックの測定データYは、符号化装置120により、イントラ予測を用いた圧縮符号化によりさらに圧縮される。符号化装置120は、イントラ予測部121と、残差データ生成部122と、量子化部123と、ハフマン符号化部124と、ハフマン復号部125と、逆量子化部126と、合成部127とを有する。
The measurement data Y of each image block output from the A/
イントラ予測部121は、複数のイントラ予測モードのいずれか1つを用いて、現画像ブロックの測定データYを予測した予測測定データYpを出力する。複数のイントラ予測モードは、図4に示すように、現画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと、現画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む。複数の予測モードは、垂直予測モードの予測測定データと水平予測モードの予測測定データとの平均を予測測定データとして算出する平均予測モードをさらに含む。
The
イントラ予測部121は、参照データ生成部1211と、予測データ生成部1212と、選択部1213とを有する。
The
参照データ生成部1211は、予測測定データを得るために、上側隣接ブロックの参照データと左側隣接ブロックの参照データとを生成する。
The reference
予測データ生成部1212は、参照データ生成部1211が生成する参照データを用いて、垂直予測モードの予測測定データYvと、水平予測モードの予測測定データYhと、平均予測モードの予測測定データYavgとを生成する。
The prediction
選択部1213は、垂直予測モードの予測測定データYvと、水平予測モードの予測測定データYhと、平均予測モードの予測測定データYavgとのそれぞれについて、現画像ブロックの測定データYとの類似度を算出することにより、類似度が最も高い予測測定データを選択し、選択した予測測定データYpを残差データ生成部122に出力する。類似度を表す指標値としては、例えば、絶対値差分和(SAD:Sum of Absolute Difference)を用いることができる。
The
但し、いずれの予測測定データも現画像ブロックの測定データYとの類似度が低い場合、選択部1213は、現画像ブロックの測定データYをそのまま量子化部123に出力してもよい。例えば、選択部1213は、垂直予測モードの予測測定データYvと、水平予測モードの予測測定データYhと、平均予測モードの予測測定データYavgとのそれぞれのSADが閾値よりも大きい場合、現画像ブロックの測定データYをそのまま量子化部123に出力する。
However, if any prediction measurement data has a low degree of similarity with the measurement data Y of the current image block, the
残差データ生成部122は、現画像ブロックの測定データYとイントラ予測部121が出力する予測測定データYpとの差分を表す残差データYrを生成し、生成した残差データYrを量子化部123に出力する。
The residual
量子化部123は、残差データYr(又は現画像ブロックの測定データY)に対して量子化処理を行い、量子化データYqをハフマン符号化部124に出力する。
The
ハフマン符号化部124は、量子化データYqに対してハフマン符号化処理を行うことにより符号化データを生成し、生成した符号化データを送信部130及びハフマン復号部125に出力する。なお、ハフマン符号化に限定されるものではなく、ハフマン符号化以外のエントロピー符号化を用いてもよい。
The
送信部130は、ハフマン符号化部124が出力する符号化データを、伝送路を介して測定復号装置200に送信する。送信部130は、符号化データを含む無線信号を送信する無線送信機を含んでもよい。また、送信部130は、選択部1213が選択した予測モードを示すモード情報を符号化データに含めて送信する。
Transmitting
ハフマン復号部125は、ハフマン符号化部124が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYqを復元し、復元した量子化データYqを逆量子化部126に出力する。
逆量子化部126は、復元量子化データYqに対して逆量子化処理を行うことにより残差データYrを復元し、復元残差データYdeqを合成部127に出力する。
The
合成部127は、復元残差データYdeqと予測測定データYpとを合成することにより測定データYを復元し、復元測定データをイントラ予測部121の参照データ生成部1211に出力する。
The synthesizing
なお、図2に示す符号化装置120の構成例において、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力している。しかしながら、ハフマン復号部125を不要としてもよい。この場合、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力することに代えて、量子化部123が出力する量子化データYqを逆量子化部126に入力する構成になる。
In addition, in the configuration example of the
(2.2)イメージング装置
次に、本実施形態に係るイメージング装置110について説明する。
(2.2) Imaging Device Next, the
図5は、本実施形態に係るイメージング装置110の構成例を示す図である。本実施形態に係るイメージング装置110は、圧縮センシングを用いるCMOSイメージセンサ、すなわち、CS-CISである。
FIG. 5 is a diagram showing a configuration example of the
図5に示すように、イメージング装置110は、画素アレイ(Pixel Array)111aと、行選択部(ROW SELECTOR)111bと、列選択部(COLUMN SELECTOR)111cと、行列演算トリガ部112aと、行列演算部112bと、A/D変換部113とを有する。
As shown in FIG. 5, the
画素アレイ111a、行選択部111b、及び列選択部111cは、図2に示すイメージセンサ部111を構成する。画素アレイ111aは、アレイ状に配置された複数の画素を有する。各画素は、光を受けて、電気信号である画素値を出力する。画素アレイ111aは、n個の画素からなるブロック単位に区分されている。行選択部111b及び列選択部111cは、画素値を読み出す画素を選択し、選択した画素から画素値を読み出す。
The
行列演算トリガ部112a及び行列演算部112bは、図2に示す圧縮センシング部112を構成する。行列演算トリガ部112aは、n個の画素からなる画素値列Xに対する行列演算をトリガする。行列演算部112bは、画素値列Xに対して、測定行列を用いた行列演算を行い、m個の測定値からなる測定値列YをA/D変換部113に出力する。A/D変換部113は、測定値列Yをデジタル信号に変換し、測定データYを出力する。
The matrix
図6は、本実施形態に係る測定行列の投影パターンを示す図である。ここでは、画像ブロックのサイズが8画素×8画素、すなわち、nの値が64あるものとする。また、mの値が8(図にLow frequency からhigh frequency まで8つのパターンがある)、すなわち、n=64から8個の測定値(m=8)に変換する、12.5%(m/n=8/64=12.5%)まで圧縮時に使う8つのパターンを示す。図6において、白抜きの各領域は測定行列における要素の値が「1」であることを表し、黒塗りの領域は測定行列における要素の値が「0」であることを表す。 FIG. 6 is a diagram showing projection patterns of measurement matrices according to the present embodiment. Here, it is assumed that the size of the image block is 8 pixels×8 pixels, that is, the value of n is 64. In addition, the value of m is 8 (there are 8 patterns from low frequency to high frequency in the figure), that is, converting from n = 64 to 8 measured values (m = 8), 12.5% (m/ 8 patterns used for compression up to n=8/64=12.5%). In FIG. 6 , each white area represents an element value of “1” in the measurement matrix, and a black area represents an element value of “0” in the measurement matrix.
図6に示すように、圧縮センシング部112は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を測定行列として用いて、圧縮センシング処理を行う。なお、シーケンシーとは、行列の1つの行において値が切り替わる頻度(周波数)をいう。
As shown in FIG. 6, the
CoWH行列の各行は、画像ブロックに投影したときの投影パターンが互いに異なる。CoWH行列は、CoWH行列における上側の行から下側の行に向かうにつれて、投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 Each row of the CoWH matrix has a different projection pattern when projected onto an image block. The CoWH matrix is configured such that the number of consecutive equivalent elements in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.
例えば、CoWH行列の最も上側の行(行#1)は、投影パターンにおいて、要素「1」が64画素分だけ連続している。行#1を用いて算出される測定値をy1と呼ぶ。 For example, the uppermost row (row #1) of the CoWH matrix has 64 consecutive pixels of "1" in the projection pattern. The measurement calculated using row # 1 is called y1.
CoWH行列の上から2番目の行(行#2)及び3番目の行(行#3)のそれぞれは、投影パターンにおいて、要素「1」が32画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。行#2を用いて算出される測定値をy2と呼び、行#3を用いて算出される測定値をy3と呼ぶ。 Each of the second row (row #2) and the third row (row #3) from the top of the CoWH matrix has 32 consecutive pixels of element “1” and element “0” in the projection pattern. ” continues for 32 pixels. The measurement calculated using row # 2 is called y2, and the measurement calculated using row # 3 is called y3.
CoWH行列の上から4番目の行(行#4)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 The fourth row from the top of the CoWH matrix (row #4) has 16 consecutive pixels of element "1" and 32 consecutive pixels of element "0" in the projection pattern.
CoWH行列の上から5番目の行(行#5)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 The fifth row from the top of the CoWH matrix (row #5) has 16 consecutive pixels of element "1" and 16 consecutive pixels of element "0" in the projection pattern.
CoWH行列の上から6番目の行(行#6)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 The sixth row from the top of the CoWH matrix (row #6) has 16 consecutive pixels of element "1" and 32 consecutive pixels of element "0" in the projection pattern.
CoWH行列の上から7番目の行(行#7)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 The seventh row from the top of the CoWH matrix (row #7) has 16 consecutive pixels of element "1" and 16 consecutive pixels of element "0" in the projection pattern.
CoWH行列の上から8番目の行(行#8)は、投影パターンにおいて、要素「1」が8画素分だけ連続する領域及び要素「1」が16画素分だけ連続する領域を有する。また、要素「0」が8画素分だけ連続する領域及び要素「0」が16画素分だけ連続する領域を有する。 The eighth row from the top of the CoWH matrix (row #8) has an area of 8 consecutive pixels of "1" and an area of 16 consecutive pixels of "1" in the projection pattern. It also has an area in which the element "0" continues for 8 pixels and an area in which the element "0" continues for 16 pixels.
CoWH行列は、画像ブロックの全画素値を取得する第1投影パターンを構成する行と、画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行とを有する。これにより、測定ドメインにおける垂直予測モード及び水平予測モードのイントラ予測を円滑に行うことが可能になる。具体的には、CoWH行列における最も上側の行(行#1)は、第1投影パターンを構成し、CoWH行列における上から2番目及び3番目の行(行#2及び#3)は、第2投影パターン及び第3投影パターンを構成する。 The CoWH matrix includes rows forming a first projection pattern for obtaining all pixel values of an image block, rows forming a second projection pattern for obtaining pixel values in the upper half of the image block, and rows forming the left half of the image block. and rows forming a third projection pattern from which pixel values are obtained. This makes it possible to smoothly perform intra prediction in vertical prediction mode and horizontal prediction mode in the measurement domain. Specifically, the uppermost row (row #1) in the CoWH matrix constitutes the first projection pattern, and the second and third rows (rows #2 and #3) from the top in the CoWH matrix constitute the first projection pattern. A second projection pattern and a third projection pattern are constructed.
なお、CS理論をCISに採用することにより、測定行列 By adopting the CS theory to the CIS, the measurement matrix
本実施形態に係る連続順序のウォルシュ・アダマール(CoWH)は、自然順序のアダマール(NoH)によって導き出すことができるバイナリシーケンシー順序のウォルシュ・アダマール(SoWH)を最適化したものである。なお、NoH行列及びSoWH行列の列は直交している。これらの行列は、n次の行列 The continuous-order Walsh-Hadamard (CoWH) according to the present embodiment is an optimization of the binary-sequence-order Walsh-Hadamard (SoWH) that can be derived by the natural-order Hadamard (NoH). Note that the columns of the NoH and SoWH matrices are orthogonal. These matrices are matrices of order n
ウォルシュ・アダマール行列のシーケンシー順の行は、ビット反転及びgray-code permutationを適用することによってNoH行列から導き出される。これにより、 The sequential rows of the Walsh-Hadamard matrix are derived from the NoH matrix by applying bit-reversal and gray-code permutation. This will
本実施形態では、測定行列の上部に低周波係数をグループ化することで、SoWH測定行列の投影パターンを再編成する。CoWHの配置では、図6(c)に示すように、投影パターンは、接続された要素の数を増やすように編成されている。これにより、センシングしながら測定品質を向上させることができる。関連するコンポーネントは、対応する値を持つ連続した画素のグループに対応し、より豊富な予備知識の点で、復元アルゴリズム及び逆変換に影響を与える。 In this embodiment, we rearrange the projection pattern of the SoWH measurement matrix by grouping the low-frequency coefficients at the top of the measurement matrix. In the CoWH arrangement, the projected pattern is organized to increase the number of connected elements, as shown in Fig. 6(c). Thereby, the measurement quality can be improved while sensing. The relevant component corresponds to a group of contiguous pixels with corresponding values and influences the reconstruction algorithm and the inverse transform in terms of richer prior knowledge.
また、図6(c)に示すCoWH行列の良好な連続パターンは、NoH行列及びSoWH行列に比べてSRの下限を延長することを可能にし、これは通常は良好な視覚品質のために50%制限されている。 Also, the good continuous pattern of the CoWH matrix shown in FIG. Limited.
CoWH行列は図7に示すアルゴリズムにより生成される。具体的には、i及びjを、
A(CoWH行列)は、少なくともの次の確率でRIPを満たす。 A (CoWH matrix) satisfies the RIP with probability of at least
ここでβは正の定数である。 where β is a positive constant.
ハードウェア実装のために、この拡張された行列Aを相補の行列からバイナリに二値化している。CoWH行列のサンプリングマスク(投影パターン)は、NoH行列及びSoWH行列に比べて、低周波係数から高周波係数に向けて徐々に配置されている。 For hardware implementation, this extended matrix A is binary binarized from the complementary matrix. The sampling mask (projection pattern) of the CoWH matrix is arranged gradually from low frequency coefficients to high frequency coefficients compared to NoH and SoWH matrices.
図8は、NoH行列、SoWH行列、及びCoWH行列のそれぞれを用いた場合においてl1最小化及び逆高速ウォルシュ・アダマール変換(IFWHT)を用いた復元結果を比較して示す図である。図8に示すように、CoWH行列は、同一SRでの視覚品質の点でNoH行列及びSoWH行列を上回っている。なお、図8(a)は構成された測定行列を示し、図8(b)は復元画像を示し、図8(c)は400%ズームした結果を示す。なお、n=65536(256画素×256画素であり、m=8192(12.5%まで圧縮された)であり、B(すなわち、BCIで用いるブロックのサイズ)=8ある。 FIG. 8 is a diagram showing a comparison of reconstruction results using l1 minimization and inverse fast Walsh - Hadamard transform (IFWHT) when using NoH matrix, SoWH matrix, and CoWH matrix, respectively. As shown in FIG. 8, the CoWH matrix outperforms the NoH and SoWH matrices in terms of visual quality at the same SR. 8(a) shows the constructed measurement matrix, FIG. 8(b) shows the restored image, and FIG. 8(c) shows the result of 400% zoom. Note that n=65536 (256 pixels by 256 pixels, m=8192 (compressed to 12.5%), and B (ie, size of block used in BCI)=8.
(2.3)符号化装置
次に、本実施形態に係る符号化装置120について説明する。図9は、本実施形態に係る符号化装置120の一部の構成例を示す図である。
(2.3) Encoding Device Next, the
図9に示すように、参照データ生成部1211と、予測データ生成部1212と、選択部1213とにより、図2に示すイントラ予測部121が構成される。イントラ予測部121の入力側には、入力バッファ141が設けられる。量子化部123の出力側には、出力バッファ142が設けられる。
As shown in FIG. 9, the reference
参照データ生成部1211は、合成部127が出力する復元測定データYから測定値y1、y2、y3を分離するパッケージスプリッタ1211aと、測定値y1から測定値y2を減算する減算器1211bと、測定値y1から測定値y3を減算する減算器1211cと、減算器1211bの出力を記憶するレジスタ1211dと、減算器1211cの出力を記憶するレジスタ1211eとを有する。
The reference
ここで、測定値y1は、CoWH行列において画像ブロックの全画素値を取得する投影パターンを構成する行#1により得られた測定値であって、画像ブロックの全画素値の合計に相当する。
where the measurement y1 is the measurement obtained by
測定値y2は、CoWH行列において画像ブロックの左半分の画素値を取得する投影パターンを構成する行#2により得られた測定値であって、画像ブロックの左半分の画素値の合計に相当する。 The measurement y2 is the measurement obtained by row # 2 , which constitutes the projection pattern that captures the pixel values of the left half of the image block in the CoWH matrix and corresponds to the sum of the pixel values of the left half of the image block. do.
測定値y3は、CoWH行列において画像ブロックの上半分の画素値を取得する投影パターンを構成する行#3により得られた測定値であって、画像ブロックの上半分の画素値の合計に相当する。 The measurement y3 is the measurement obtained by row #3, which constitutes the projection pattern that captures the pixel values of the upper half of the image block in the CoWH matrix and corresponds to the sum of the pixel values of the upper half of the image block. do.
このため、測定値y1から測定値y2を減算する減算器1211bの出力は、画像ブロックの右半分の画素値の合計に相当し、これはレジスタ1211dに保持される。この画像ブロックの右半分の画素値の合計は、図4に示す水平予測モードにおける参照データとして用いられる。レジスタ1211dは、現画像ブロックの左側隣接ブロックに対応する参照データだけを保持すればよく、ここではそのサイズを16ビットとしている。
Thus, the output of subtractor 1211b , which subtracts measurement y2 from measurement y1, corresponds to the sum of the pixel values of the right half of the image block, which is held in
他方、測定値y1から測定値y3を減算する減算器1211cの出力は、画像ブロックの下半分の画素値の合計に相当し、これはレジスタ1211eに保持される。この画像ブロックの下半分の画素値の合計は、図4に示す垂直予測モードにおける参照データとして用いられる。レジスタ1211eは、現画像ブロックが属する行の1つ上の行に属する各画像ブロックについて参照データを保持する。画像の幅をWとし、画像ブロックのサイズをBとすると、レジスタ1211eは、W/B個のブロック分の参照データを保持する。
On the other hand, the output of subtractor 1211c , which subtracts measurement y1 from measurement y3, corresponds to the sum of the pixel values of the lower half of the image block, which is held in
予測データ生成部1212は、レジスタ1211eが出力する、画像ブロックの下半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置
The prediction
また、予測データ生成部1212は、レジスタ1211dが出力する、画像ブロックの右半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置
In addition, the prediction
さらに、予測データ生成部1212は、予測測定データYv及び予測測定データYhの平均を平均予測モードの予測測定データYavgとして求める。
Further, the predicted
このようなイントラ予測の方法は、次のように表現できる。 Such an intra prediction method can be expressed as follows.
垂直予測モード: Vertical prediction mode:
選択部1213は、最終的なイントラ予測モードの予測測定データYpを選択するために、次のようにSADを用いて、予測候補とYとの間の最小差
To select the final intra-prediction mode prediction measurement data Y p , the
但し、選択部1213は、予測候補が選択されない場合、予測測定データYpをゼロに割り当てる。
However, if no prediction candidate is selected, the
そして、残差データ生成部122は、次のようにして残差データYrを算出する。
Then, the
量子化部123は、次のようにスカラー量子化により残差データYrを量子化して量子化データYqを出力する。
The
但し、Bpはビット深度パラメータであって、例えば4ビットである。 where Bp is a bit depth parameter, eg 4 bits.
なお、逆量子化部126は次の計算を行う。
Note that the
これらの処理の中で量子化は非可逆であるが、イントラ予測及びエントロピー符号化は可逆である。 Among these processes, quantization is lossy, but intra prediction and entropy coding are lossless.
(3)測定復号装置
次に、本実施形態に係る測定復号装置200について説明する。図10は、本実施形態に係る測定復号装置200の構成を示す図である。
(3) Measurement decoding device Next, the
図10に示すように、測定復号装置200は、受信部210と、復号装置220と、復元部230とを有する。
As shown in FIG. 10 ,
受信部210は、測定符号化装置100から伝送路を介して符号化データを受信し、受信した符号化データを復号装置220に出力する。符号化データは、測定符号化装置100が選択した予測モードを示すモード情報を含む。受信部210は、モード情報も復号装置220に出力する。
Receiving
復号装置220は、イントラ予測部221と、ハフマン復号部222と、逆量子化部223と、合成部224とを有する。イントラ予測部221は、参照データ生成部2211と、予測データ生成部2212とを有する。
The
参照データ生成部2211は、測定符号化装置100の参照データ生成部1211と同様に構成され、予測データ生成部2212は、測定符号化装置100の参照データ生成部1211と同様に構成される。但し、予測データ生成部2212は、測定符号化装置100から伝送されるモード情報が示す予測モードについてのみ予測測定データYpを生成し、生成した予測測定データYpを合成部224に出力する。
Reference
ハフマン復号部222は、受信部210が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYqを復元し、復元した量子化データYqを逆量子化部223に出力する。
The
逆量子化部223は、復元量子化データYqに対して逆量子化処理を行うことにより残差データYrを復元し、復元残差データYdeqを合成部224に出力する。
The
合成部224は、復元残差データYdeqと予測測定データYpとを合成することにより測定データYを復元し、復元測定データを復元部230に出力する。
復元部230は、測定データYから元のn画素分の画素値X(画像ブロック)を復元アルゴリズムにより復元して出力する。CS理論は、m次元の測定データは効率的な復元アルゴリズムを介して元の信号の測定を復元するのに十分であると主張する。例えば、復元部230は、l1アルゴリズム及びIFWHTを用いて元のn画素分の画素値X(画像ブロック)を復元する。
The
(4)作用・効果
本実施形態によれば、ウォルシュ・アダマール変換(WHT:Walsh-Hadamard transform)に基づく最適化されたバイナリ構造測定行列(SRM:structural measurement matrix)を含む新たな高解像度BCIのための軽量な符号化フレームワークを実現できる。また、測定ドメインにおいて、CoWH行列の特徴を活用したイントラ予測を行うことにより、空間冗長性を削減できる。よって、効率的に画像を圧縮して保存及び伝送できる。
(4) Actions and Effects According to the present embodiment, a new high-resolution BCI including an optimized binary structural measurement matrix (SRM) based on the Walsh-Hadamard transform (WHT) It is possible to realize a lightweight encoding framework for In addition, spatial redundancy can be reduced by performing intra-prediction utilizing the features of the CoWH matrix in the measurement domain. Therefore, images can be efficiently compressed and stored and transmitted.
以下において、メモリ空間に効率的に格納し、符号化された測定値を伝送するためのシミュレーション結果について説明する。定量的メトリックは、PSNR(peak-to-noise-ratio)、SSIM(structural similarity index measure)、bpp(bits-per-pixel)である。 In the following, simulation results for efficient storage in memory space and transmission of encoded measurements are described. Quantitative metrics are PSNR (peak-to-noise-ratio), SSIM (structural similarity index measure), bpp (bits-per-pixel).
「A. Mercat, M. Viitanen, and J. Vanne, “UVG dataset: 50/120fps 4K sequences for video codec analysis and development,” in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020」で規定されるBeauty、ReadySetGo、Bosphorus、HoneyBeeで構成される色空間で4Kデータセットを使用する。ここで、n=24883200(3840×2160×3)、SR∈{4/4、1/8、1/16、1/32、1/64}およびB=16である。 "A. Mercat, M. Viitanen, and J. Vanne, ``UVG dataset: 50/120fps 4K sequences for video codec analysis and development,'' in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020" We use a 4K dataset in a color space composed of Beauty, ReadySetGo, Bosphorus, and HoneyBee. where n=24883200 (3840×2160×3), SRε{4/4, 1/8, 1/16, 1/32, 1/64} and B=16.
下記の表1は、符号化無しのPSNR(dB)、SSIM、bppに関する最小プロセスBCI測定の比較を示す。表1の最小プロセスBCI測定の比較によると、CoWH行列は、SRが減少するたびにPSNRが平均5~8%、SSIMが0.2~0.5の品質劣化特性を提供することが分かる。 Table 1 below shows a comparison of minimum process BCI measurements for PSNR (dB) without encoding, SSIM, bpp. A comparison of the minimum process BCI measurements in Table 1 shows that the CoWH matrix provides quality degradation characteristics of 5-8% on average for PSNR and 0.2-0.5 for SSIM for each decrease in SR.
さらに、SRが1/16に等しい場合、CoWH行列は、1/32および1/64と比較して、アンダーサンプリングアーティファクトが少なく、良好な結果の下限を提供している。以下において、SRを1/16に固定して、符号化性能を評価し、最先端の研究と比較する。 Furthermore, when SR equals 1/16, the CoWH matrix provides a lower bound for better results with less undersampling artifacts compared to 1/32 and 1/64. In the following, with SR fixed at 1/16, the coding performance is evaluated and compared with state-of-the-art research.
さらに、各投影パターン間の関係を高めることにより、より高い視覚品質が得られるという仮説を証明する。但し、その結果、エッジの詳細が失われる。 Furthermore, we prove the hypothesis that a higher visual quality can be obtained by increasing the relationship between each projection pattern. However, this results in loss of edge detail.
さらに、本実施形態に係る測定符号化装置100によるイントラ予測(IPMC:Intra Prediction-based Measurement Coding)を、最小限のプロセスBCI測定を空間的に符号化する最先端の研究と比較する。これらの比較では、最先端のコードを選択した。ただし、符号化性能の比較を公平にするために、量子化方法及びパラメータを同じに変更した。SQを使用し、ベースラインとして
Furthermore, intra prediction (IPMC: Intra Prediction-based Measurement Coding) by the
表2のシミュレーション結果のように、IPMCは全体としてPSNRが19.96%dB、SSIMが20.25%、bppが10.34%のSQを達成した。 As shown in the simulation results in Table 2, IPMC as a whole achieved SQ with PSNR of 19.96% dB, SSIM of 20.25% and bpp of 10.34%.
DPCMと比較すると、PSNRが14.50%、SSIMが9.19%、bppが8.77%を達成し、あらゆる面でDPCMを上回った。 Compared with DPCM, it achieved PSNR of 14.50%, SSIM of 9.19% and bpp of 8.77%, outperforming DPCM in all aspects.
SDPCなどの同様の符号化と比較すると、PSNRが14.37%、SSIMが9.19%、bppが7.19%であった。 PSNR was 14.37%, SSIM was 9.19% and bpp was 7.19% when compared to similar encodings such as SDPC.
さらに、サンプリングおよび符号化のより進歩したModified SRMと比較すると、PSNRが11.73%、SSIMが13.09%、bppが6.74%と本実施形態が上回った。したがって、Modified SRMは、隣接するブロックから情報を取得するためにバイナリSRMを変更し、H.264として最終的にイントラ予測候補を生成するため、あまり効率的ではない。 Furthermore, when compared with Modified SRM, which is more advanced in sampling and encoding, PSNR is 11.73%, SSIM is 13.09%, and bpp is 6.74%, which are higher in this embodiment. Therefore, the Modified SRM modifies the binary SRM to obtain information from neighboring blocks, and the H. H.264 to generate the final intra-prediction candidates, so it is not very efficient.
よって、本実施形態に係るIPMCは、最先端の研究と比較して、PSNRが15.06%、SSIMが18.74%、bppが3.7%という点で、全体的に優れた符号化性能を示した。 Thus, IPMC according to the present embodiment is an overall superior coding in terms of PSNR of 15.06%, SSIM of 18.74% and bpp of 3.7% compared to the state-of-the-art work. showed performance.
図11は、HoneyBeeデータセットを使用して400%ズームした詳細の例を示す図である。図11において、(a)はSQ(ベースライン)、(b)はDPCM、(c)はSDCP、(d)はModified SRM、(e)は本実施形態である。図11に示すように、HoneyBeeデータセットを使用してトリミングされた結果によると、SRが1/16の場合、本実施形態は最先端の研究と比較してより豊かな視覚品質を提供した。 FIG. 11 shows an example of detail zoomed 400% using the HoneyBee dataset. In FIG. 11, (a) is SQ (baseline), (b) is DPCM, (c) is SDCP, (d) is Modified SRM, and (e) is this embodiment. As shown in Fig. 11, the trimmed results using the HoneyBee dataset show that at SR of 1/16, the present embodiment provided richer visual quality compared to the state-of-the-art work.
よって、表2の全体的な性能によると、本実施形態は、最先端の研究に対して、すべての面でトレードオフの性能パフォーマンスをもたらした。 Thus, according to the overall performance in Table 2, the present embodiment provided trade-off performance performance on all fronts for state-of-the-art research.
さらに、FPGAにIPMCアルゴリズムを実装した。ここで、解像度は3820×2140、合計ロジック使用率は3,421、最大動作周波数は102.65MHzである。このアーキテクチャは、28.32mWの電力を消費した。これにより、表3に要約されているように、ソフトウェア実装よりも100倍高速なリアルタイムエンコーディングの可能性がもたらされた。 In addition, we have implemented the IPMC algorithm on the FPGA. Here, the resolution is 3820×2140, the total logic utilization is 3,421, and the maximum operating frequency is 102.65 MHz. This architecture consumed 28.32 mW of power. This provided the potential for real-time encoding that is 100 times faster than software implementations, as summarized in Table 3.
(5)その他の実施形態
上述の実施形態に係る各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
(5) Other Embodiments A program that causes a computer to execute each process according to the above-described embodiments may be provided. The program may be recorded on a computer readable medium. A computer readable medium allows the installation of the program on the computer. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be, for example, a recording medium such as CD-ROM or DVD-ROM.
測定符号化装置100(符号化装置120)が行う各処理を実行する回路を集積化し、測定符号化装置100(符号化装置120)を半導体集積回路(チップセット、SoC)により構成してもよい。 A circuit for executing each process performed by the measurement encoding device 100 (encoding device 120) may be integrated, and the measurement encoding device 100 (encoding device 120) may be configured by a semiconductor integrated circuit (chipset, SoC). .
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 Although the embodiments have been described in detail with reference to the drawings, the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the invention.
1 :測定伝送システム
100 :測定符号化装置
110 :イメージング装置
111 :イメージセンサ部
111a :画素アレイ
111b :行選択部
111c :列選択部
112 :圧縮センシング部
112a :行列演算トリガ部
112b :行列演算部
113 :A/D変換部
120 :符号化装置
121 :イントラ予測部
122 :残差データ生成部
123 :量子化部
124 :ハフマン符号化部
125 :ハフマン復号部
126 :逆量子化部
127 :合成部
130 :送信部
141 :入力バッファ
142 :出力バッファ
200 :測定復号装置
210 :受信部
220 :復号装置
221 :イントラ予測部
222 :ハフマン復号部
223 :逆量子化部
224 :合成部
230 :復元部
1211 :参照データ生成部
1211a :パッケージスプリッタ
1211b :減算器
1211c :減算器
1211d :レジスタ
1211e :レジスタ
1212 :予測データ生成部
1213 :選択部
2211 :参照データ生成部
2212 :予測データ生成部
1: measurement transmission system 100: measurement coding device 110: imaging device 111:
Claims (8)
前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、
前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部と、を備え、
前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行い、
前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なり、
前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されていることを特徴とするイメージング装置。 an image sensor unit that outputs an image in units of image blocks;
a compression sensing unit that performs a compression sensing process of applying a measurement matrix of m rows and n columns (m<n) to pixel values of n pixels constituting the image block and outputting m measured values;
an analog/digital conversion unit that outputs measurement data by performing analog/digital conversion processing on the m measured values;
The compression sensing unit uses a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequence ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequence as the measurement matrix, and the compression perform sensing processing,
Each row of the CoWH matrix has a different projection pattern when projected onto the image block,
The imaging apparatus according to claim 1, wherein the CoWH matrix is configured such that the number of consecutive elements having the same value in the projection pattern decreases from an upper row to a lower row in the CoWH matrix.
前記画像ブロックの全画素値を取得する第1投影パターンを構成する行と、
前記画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、
前記画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行と、を有することを特徴とする請求項1に記載のイメージング装置。 The CoWH matrix is
rows forming a first projection pattern for obtaining all pixel values of the image block;
rows forming a second projection pattern for obtaining pixel values of the upper half of the image block;
and a row forming a third projection pattern for obtaining pixel values of the left half of the image block.
前記CoWH行列における上から2番目及び3番目の行は、前記第2投影パターン及び前記第3投影パターンを構成することを特徴とする請求項2に記載のイメージング装置。 the uppermost row in the CoWH matrix constitutes the first projection pattern;
3. The imaging apparatus of claim 2, wherein the second and third rows from the top in the CoWH matrix constitute the second projection pattern and the third projection pattern.
前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、
前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部と、を備えることを特徴とする測定符号化装置。 An imaging device according to claim 2 or 3;
using any one of a plurality of intra prediction modes including a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block and a horizontal prediction mode using a left adjacent block adjacent to the left side of the image block; an intra prediction unit that outputs predicted measured data obtained by predicting the measured data of the image block;
a quantization unit that performs quantization processing on residual data representing a difference between the measurement data of the image block and the prediction measurement data output from the intra prediction unit. Device.
前記上側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記上側隣接ブロックに対して前記第2投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記上側隣接ブロックの下半分の合計の画素値を得る処理と、
前記下半分の合計の画素値を有効画素数で除算することにより、前記上側隣接ブロックの下半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記垂直予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4に記載の測定符号化装置。 The intra prediction unit, for the vertical prediction mode,
By subtracting the measurement value obtained by applying the second projection pattern to the upper adjacent block from the measurement value obtained by applying the first projection pattern to the upper adjacent block, obtaining the sum pixel value of the lower half of the upper neighboring block in the pixel domain;
obtaining an average pixel value of the lower half of the upper adjacent block by dividing the total pixel value of the lower half by the number of effective pixels;
obtaining prediction measurement data for the vertical prediction mode from the average based on the CoWH matrix.
前記左側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記左側隣接ブロックに対して前記第3投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記左側隣接ブロックの右半分の合計の画素値を得る処理と、
前記右半分の合計の画素値を有効画素数で除算することにより、前記左側隣接ブロックの右半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記水平予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4又は5に記載の測定符号化装置。 The intra prediction unit, for the horizontal prediction mode,
By subtracting the measured value obtained by applying the third projection pattern to the left adjacent block from the measured value obtained by applying the first projection pattern to the left adjacent block, obtaining the sum pixel value of the right half of the left neighboring block in the pixel domain;
obtaining an average pixel value of the right half of the left adjacent block by dividing the total pixel value of the right half by the number of valid pixels;
and obtaining prediction measurement data for the horizontal prediction mode from the average based on the CoWH matrix.
前記イントラ予測部は、前記垂直予測モードの予測測定データと、前記水平予測モードの予測測定データと、前記平均予測モードの予測測定データとのそれぞれについて、前記画像ブロックの測定データとの類似度を算出することにより、前記類似度が最も高い予測測定データを選択する処理を実行することを特徴とする請求項4乃至6のいずれか1項に記載の測定符号化装置。 The plurality of intra prediction modes further include an average prediction mode for calculating an average of prediction measurement data in the vertical prediction mode and prediction measurement data in the horizontal prediction mode as prediction measurement data,
The intra prediction unit calculates a similarity between each of the prediction measurement data in the vertical prediction mode, the prediction measurement data in the horizontal prediction mode, and the prediction measurement data in the average prediction mode and the measurement data of the image block. 7. The measurement coding apparatus according to any one of claims 4 to 6, wherein the process of selecting the predicted measurement data with the highest degree of similarity is performed by calculating.
前記符号化部により符号化された残差データを復号側に送信する送信部と、をさらに備え、
前記送信部は、前記イントラ予測部が選択した予測測定データの予測モードを示すモード情報をさらに送信することを特徴とする請求項7に記載の測定符号化装置。 an encoding unit that encodes the residual data quantized by the quantization unit;
A transmitting unit that transmits residual data encoded by the encoding unit to a decoding side,
The measurement coding apparatus according to claim 7, wherein the transmission unit further transmits mode information indicating a prediction mode of the prediction measurement data selected by the intra prediction unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021008179A JP2022112364A (en) | 2021-01-21 | 2021-01-21 | Imaging device and measurement coding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021008179A JP2022112364A (en) | 2021-01-21 | 2021-01-21 | Imaging device and measurement coding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022112364A true JP2022112364A (en) | 2022-08-02 |
Family
ID=82655994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021008179A Pending JP2022112364A (en) | 2021-01-21 | 2021-01-21 | Imaging device and measurement coding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022112364A (en) |
-
2021
- 2021-01-21 JP JP2021008179A patent/JP2022112364A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kang et al. | Distributed compressive video sensing | |
US8681873B2 (en) | Data compression for video | |
JP5566529B2 (en) | How to code a video using a dictionary | |
Do et al. | Distributed compressed video sensing | |
Chen et al. | Dynamic measurement rate allocation for distributed compressive video sensing | |
US20110206118A1 (en) | Data Compression for Video | |
US9609342B2 (en) | Compression for frames of a video signal using selected candidate blocks | |
CN107743239B (en) | Method and device for encoding and decoding video data | |
Dinh et al. | Measurement coding for compressive imaging using a structural measuremnet matrix | |
Zhang et al. | Spatially directional predictive coding for block-based compressive sensing of natural images | |
CN105474642A (en) | Re-encoding image sets using frequency-domain differences | |
CN104301730A (en) | Two-way video coding and decoding system and method based on video mobile equipment | |
JP7431752B2 (en) | Video encoding, video decoding method, device, computer device and computer program | |
Unde et al. | Rate–distortion analysis of structured sensing matrices for block compressive sensing of images | |
Unde et al. | Adaptive compressive video coding for embedded camera sensors: compressed domain motion and measurements estimation | |
CN103634607A (en) | Method for prediction in image encoding and image encoding apparatus applying the same | |
KR100846870B1 (en) | Apparatus and method of multi-stage, multi-dimensional transform based on multiple unit blocks | |
Zhao et al. | Compressive-sensed image coding via stripe-based DPCM | |
JP2022112364A (en) | Imaging device and measurement coding device | |
JP2009296277A (en) | Image coder, image decoder, image coding method, image decoding method, and program | |
Letaief et al. | Real time HEVC video compression using Hybrid DWT-DCT algorithm on an FPGA | |
Badem et al. | Transform domain residual coding technique for distributed video coding | |
KR101096619B1 (en) | The method for encoding/decoding data and the apparatus thereof | |
JP2011223316A (en) | Image encoding apparatus, image decoding apparatus, and method for image encoding and decoding | |
He et al. | Study on Segmentation-Based HEVC Compression Performance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210226 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231122 |