JP2017098898A - Image encoding device, control method of the same, program, and storage medium - Google Patents

Image encoding device, control method of the same, program, and storage medium Download PDF

Info

Publication number
JP2017098898A
JP2017098898A JP2015232263A JP2015232263A JP2017098898A JP 2017098898 A JP2017098898 A JP 2017098898A JP 2015232263 A JP2015232263 A JP 2015232263A JP 2015232263 A JP2015232263 A JP 2015232263A JP 2017098898 A JP2017098898 A JP 2017098898A
Authority
JP
Japan
Prior art keywords
quantization
tile
bit rate
subbands
tiles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015232263A
Other languages
Japanese (ja)
Other versions
JP6564314B2 (en
JP2017098898A5 (en
Inventor
遼太 鈴木
Ryota Suzuki
遼太 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015232263A priority Critical patent/JP6564314B2/en
Priority to US15/357,634 priority patent/US10356408B2/en
Publication of JP2017098898A publication Critical patent/JP2017098898A/en
Publication of JP2017098898A5 publication Critical patent/JP2017098898A5/ja
Application granted granted Critical
Publication of JP6564314B2 publication Critical patent/JP6564314B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

PROBLEM TO BE SOLVED: To achieve compatibility among quantification of tile-division image data, reduction of a tile boundary distortion, and high controllability of a code amount when encoding.SOLUTION: An image encoding device includes: a setting part that sets a bit rate of image data of an encoding target; a frequency conversion part 105 that generates a plurality of sub-bands by performing the frequency conversion to a target tile; a quantification control part 106 that determines which one of a first quantification method of quantifying the same sub band in the tiles with the same quantification parameter and a second quantification method of quantifying the same sub band of tiles with a variable quantification parameter, in a plurality of sub bands of the target tile obtained by the frequency conversion part, in accordance with the bit rate; a quantification part 107 that quantifies the plurality of sub bands obtained by performing the frequency conversion of the target tile on the basis of the quantification parameter determined by the quantification control part; and an encoding part 108 that encodes conversion coefficient data after the quantification generated in the quantification part.SELECTED DRAWING: Figure 1

Description

本発明は、画像の符号化技術に関するものである。   The present invention relates to an image encoding technique.

現在、画像データを高効率に圧縮符号化する符号化手法が提案されている。その中の代表的な符号化方式として、JPEG(Joint Photographic Coding Experts Group)が挙げられる。このJPEG方式では、周波数変換において、DCT(離散コサイン変換:Discrete Cosine Transform)が用いられる。しかし、JPEGにおけるDCTは、8×8画素の固定ブロック単位で処理する為、低ビットレートにおいて、ブロック歪みが発生しやすいことで知られている。   Currently, an encoding method for compressing and encoding image data with high efficiency has been proposed. A representative coding method among them is JPEG (Joint Photographic Coding Experts Group). In this JPEG system, DCT (Discrete Cosine Transform) is used for frequency conversion. However, since DCT in JPEG is processed in units of fixed blocks of 8 × 8 pixels, it is known that block distortion tends to occur at a low bit rate.

一方、このJPEGの後継として規格化されたJPEG2000と呼ばれる符号化方式では、周波数変換において、DWT(離散ウェーブレット変換:Discrete Wavelet Transform)が用いられている。DWTは、ハイパスフィルタとローパスフィルタを組み合わせたフィルタバンクと呼ばれるフィルタによって、画像データを複数の周波数帯域成分に分割する。DCTが固定ブロック単位で周波数変換を行うのに対し、DWTはそのサイズに実質的に制限はなく、たとえば画面単位に周波数変換を行うことができ、量子化に伴うブロック歪みが発生しない。そして、画像データを複数の周波数帯域(以降サブバンドと呼ぶ)に分割した後、サブバンド毎に量子化してから符号化する。量子化においては、人間の視覚特性を考慮して、低域サブバンドに符号量を多く割り当てることで、主観画質を損なわずに符号量を削減する手法が静止画や動画における量子化の一般的な考え方である。   On the other hand, in a coding method called JPEG2000, which is standardized as a successor to JPEG, DWT (Discrete Wavelet Transform) is used in frequency conversion. DWT divides image data into a plurality of frequency band components by a filter called a filter bank that combines a high-pass filter and a low-pass filter. The DCT performs frequency conversion in units of fixed blocks, whereas the DWT has virtually no limitation on the size, and can perform frequency conversion in units of screens, for example, and block distortion due to quantization does not occur. Then, after the image data is divided into a plurality of frequency bands (hereinafter referred to as subbands), the data is quantized for each subband and then encoded. In quantization, in consideration of human visual characteristics, a method for reducing the code amount without losing the subjective image quality by assigning a large amount of code to the low frequency subband is generally used for still images and moving images. It is a natural idea.

ここで、JPEG2000におけるDWT及び量子化は、任意の矩形ブロック(以降タイルと呼ぶ)に対して適応可能である。このタイルに分割して符号化する技術により、処理の並列度を上げたり、内部で保持するRAM(ラインバッファ)容量を削減することができる。例えば、画像データを左右に2分割する場合を考察する。この場合、左右のタイルそれぞれの水平1ラインの画素数は、オリジナルのそれの半分になり、符号化する際に保持するラインバッファの容量も、オリジナルの場合の半分に削減できる。しかし、各タイルが独立した量子化を実行するため、各タイルの量子化誤差に差異が生じ、特に高圧縮時にはタイル境界部分で歪みが生じることが課題となっている。   Here, DWT and quantization in JPEG2000 can be applied to an arbitrary rectangular block (hereinafter referred to as a tile). By dividing and encoding the tiles, it is possible to increase the parallelism of processing and reduce the RAM (line buffer) capacity held inside. For example, consider a case where image data is divided into left and right parts. In this case, the number of pixels in one horizontal line of each of the left and right tiles is half that of the original, and the capacity of the line buffer held when encoding can be reduced to half that of the original. However, since each tile performs independent quantization, a difference occurs in the quantization error of each tile. In particular, distortion occurs at the tile boundary portion at the time of high compression.

先行技術として、DWTベースのタイル分割を行う画像符号化方式において、符号量制御のための下位ビットの破棄によって生じる画質の歪みを低減する方法が下記の特許文献1に開示されている。   As a prior art, in an image coding system that performs DWT-based tile division, a method of reducing image quality distortion caused by discarding lower bits for code amount control is disclosed in Patent Document 1 below.

特開2013−175870号公報JP 2013-175870 A

各タイルが共通の量子化パラメータを使用することができれば、タイル境界の歪みは発生しない。しかし、各タイルが同一の量子化パラメータを適用するようにすると、逆に符号量の制御性が悪化し、目標ビットレートに収束しないケースが発生し得る。   If the tiles can use a common quantization parameter, tile boundary distortion will not occur. However, if the same quantization parameter is applied to each tile, the controllability of the code amount deteriorates, and there may occur a case where the tile does not converge to the target bit rate.

ここで、上述の特許文献1には、エンベデッド符号化(EBCOT)によるビットプレーン量子化を用いた符号量制御における、タイル間の下位ビット破棄位置が異なることで発生する境界歪みの低減方法が記載されている。詳細には、破棄すべき誤差データをタイルデータとは別に符号化して保持しておき、復号時には、保持していた誤差データを用いてタイルデータを復号することで境界歪みを低減する仕組みとなっている。しかし、この手法では、誤差データの符号化処理部、誤差データの復号処理部、復号時のタイルデータと誤差データの合成処理部が別途必要となるため、複雑かつ実装規模の増大が懸念される。   Here, Patent Document 1 described above describes a method for reducing boundary distortion that occurs due to different lower bit discard positions between tiles in code amount control using bit plane quantization by embedded coding (EBCOT). Has been. Specifically, error data to be discarded is encoded and stored separately from tile data, and at the time of decoding, the tile data is decoded using the stored error data, thereby reducing boundary distortion. ing. However, this method requires an error data encoding processing unit, an error data decoding processing unit, and a tile data and error data combining processing unit at the time of decoding. .

本発明は上記問題に鑑みなされたものであり、タイル分割した画像データを量子化、および符号化する際に、実装規模の増大を抑えつつ容易な制御方法で、タイル境界歪みの低減と符号量の高い制御性の両立を図る技術を提供しようとするものである。   The present invention has been made in view of the above problems, and when quantizing and encoding tile-divided image data, it is possible to reduce tile boundary distortion and code amount with an easy control method while suppressing an increase in mounting scale. It is intended to provide a technology for achieving both high controllability and high controllability.

この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
符号化対象の画像データを複数のタイルに分割し、当該タイルを単位に符号化する画像符号化装置であって、
前記符号化対象の画像データのビットレートを設定する設定手段と、
着目タイルを周波数変換することで複数のサブバンドを生成する周波数変換手段と、
該周波数変換手段で得られた着目タイルの複数のサブバンドの各々について、
(1)タイル間の同一サブバンドに対し固定であって同一の量子化パラメータで量子化する第1の量子化方法
(2)タイル間の同一サブバンドに対して可変の量子化パラメータで量子化する第2の量子化方法
のいずれを用いるかを、前記設定手段で設定されたビットレートに従って決定する量子化制御手段と、
該量子化制御手段で決定した量子化パラメータに基づき、前記着目タイルを周波数変換することで得た複数のサブバンドを量子化する量子化手段と、
前記量子化手段で生成する量子化後の変換係数データを符号化する符号化手段とを備える。
In order to solve this problem, for example, an image encoding device of the present invention has the following configuration. That is,
An image encoding device that divides image data to be encoded into a plurality of tiles and encodes the tiles as a unit,
Setting means for setting a bit rate of the image data to be encoded;
A frequency conversion means for generating a plurality of subbands by frequency converting the tile of interest;
For each of the plurality of subbands of the tile of interest obtained by the frequency conversion means,
(1) A first quantization method in which the same subband between tiles is fixed and is quantized with the same quantization parameter.
(2) Quantization control means for determining which of the second quantization methods for quantizing the same subband between tiles with a variable quantization parameter according to the bit rate set by the setting means When,
Quantization means for quantizing a plurality of subbands obtained by frequency-transforming the tile of interest based on the quantization parameter determined by the quantization control means;
Encoding means for encoding the transform coefficient data after quantization generated by the quantization means.

本発明によれば、タイル分割した画像データを量子化、および符号化する際に、実装規模の増大を抑えつつ容易な制御で、タイル境界歪みの低減と符号量の高い制御性の両立を図ることが可能となる。   According to the present invention, when quantizing and encoding tile-divided image data, the reduction in tile boundary distortion and the controllability with a high code amount are achieved with easy control while suppressing an increase in mounting scale. It becomes possible.

第1実施形態における撮像装置のブロック構成図。1 is a block configuration diagram of an imaging apparatus in a first embodiment. FIG. 実施形態における2つの量子化方法を説明するための図。The figure for demonstrating the two quantization methods in embodiment. 第1実施形態における量子化方法の決定処理を示すフローチャート。The flowchart which shows the determination process of the quantization method in 1st Embodiment. 第1実施形態におけるサブバンドの分割例と、ビットレートと各サブバンドに適用する量子化方法との関係を示す図。The figure which shows the example of the division | segmentation of the subband in 1st Embodiment, and the relationship between the bit rate and the quantization method applied to each subband. 第2実施形態におけるビットレートと量子化パラメータの許容範囲との関係と、量子化パラメータの推移を示す図。The figure which shows transition of the quantization parameter and the relationship between the bit rate in 2nd Embodiment, and the tolerance | permissible_range of a quantization parameter. サブバンドの符号化時の符号量の推移を示す図。The figure which shows transition of the code amount at the time of encoding of a subband. 符号化処理手順を示すフローチャート。The flowchart which shows an encoding process procedure.

以下、添付図面に従って本発明に係る実施形態を詳細に説明する。なお、以下の説明において、画像符号化装置の適用する装置として、デジタルカメラに代表される撮像装置を例にして説明する。従って符号化対象の画像データの発生源は、撮像装置が有する撮像部となる。しかし、本発明は撮像装置のみに適用されるものではない。また、符号化対象の画像データの発生源は、撮像部に限らず、符号化対象の画像データを記憶した記憶媒体でもよく、その種類も問わない。あくまで理解を容易にするためであると理解されたい。   Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. In the following description, an imaging apparatus represented by a digital camera will be described as an example of an apparatus to which the image encoding apparatus is applied. Therefore, the generation source of the image data to be encoded is an imaging unit included in the imaging device. However, the present invention is not applied only to the imaging apparatus. The generation source of the image data to be encoded is not limited to the imaging unit, and may be a storage medium storing the image data to be encoded, and the type thereof is not limited. It should be understood that this is for ease of understanding.

[第1実施形態]
図1は、第1実施形態が適用する撮像装置100のブロック構成図である。撮像装置100は、撮像した画像情報を複数のタイルに分割してから、記録する構成となっている。また、タイルのサイズは可変で、例えば、画像データ全体を1つのタイルとして設定してもよい。制御部110は参照符号101乃至109の各構成要素を制御し、装置全体の制御を司るものである。典型的には、制御部110は、CPU、CPUの処理手順を示すプログラムやデータを格納したROM、CPUのワークエリア等として利用するRAMで構成されるものである。なお、参照符号101乃至109のいくつか、もしくは全部が制御部110の処理により実現しても構わない。
[First Embodiment]
FIG. 1 is a block configuration diagram of an imaging apparatus 100 to which the first embodiment is applied. The imaging apparatus 100 is configured to divide the captured image information into a plurality of tiles and then record it. Further, the tile size is variable. For example, the entire image data may be set as one tile. The control unit 110 controls each component of reference numerals 101 to 109 and controls the entire apparatus. Typically, the control unit 110 includes a CPU, a ROM storing a program and data indicating a processing procedure of the CPU, and a RAM used as a work area of the CPU. Note that some or all of the reference numerals 101 to 109 may be realized by the processing of the control unit 110.

操作部101は、ユーザの指令を受け付け、指令に応じた制御信号を生成する。例えば、撮像指示、タイル分割数(タイルのサイズ)、記録ビットレートの設定などもこの操作部101から入力される。入力されたタイル分割数はタイル分割部103に供給される。また、記録ビットレートは量子化制御部106に供給される。   The operation unit 101 receives a user command and generates a control signal according to the command. For example, an imaging instruction, tile division number (tile size), recording bit rate setting, and the like are also input from the operation unit 101. The input tile division number is supplied to the tile division unit 103. The recording bit rate is supplied to the quantization control unit 106.

撮像部102は、操作部101からの制御信号に基づき、撮像センサの画素毎に配置される赤、緑、青(RGB)のカラーフィルターを透過した光強度の信号を画像情報に変換してタイル分割部103に出力する。本第1実施形態は、撮像部102から出力される画像データを、生(未現像)の画像を意味するRAW画像データと称す。撮像部102に配置されるカラーフィルターの一例としてベイヤ―配列がある。ベイヤ―配列は、赤(R)、緑(G)、青(B)が画素毎にモザイク状に配置されていて、2×2の4画素につき赤(R)1画素、青(B)1画素、緑(G1、G2)2画素を1セットにして規則的に並べられた構造となっている。   Based on the control signal from the operation unit 101, the imaging unit 102 converts the light intensity signal transmitted through the red, green, and blue (RGB) color filters arranged for each pixel of the imaging sensor into image information and tiles it. The data is output to the dividing unit 103. In the first embodiment, the image data output from the imaging unit 102 is referred to as RAW image data meaning a raw (undeveloped) image. An example of a color filter arranged in the imaging unit 102 is a Bayer array. In the Bayer array, red (R), green (G), and blue (B) are arranged in a mosaic pattern for each pixel, and red (R) 1 pixel and blue (B) 1 for every 2 × 2 4 pixels. It has a structure in which pixels and two green (G1, G2) pixels are regularly arranged in one set.

タイル分割部103は、撮像部102から入力されるRAW画像を一旦内部メモリに格納し、操作部101から供給されるタイル分割数に基づき、RAW画像データを1つ以上のタイルに分割する。なお、操作部101からのタイル分割数はM×Nの形式であり、分割されるタイルは基本的に同じサイズとする。ただし、オリジナルのRAW画像データの水平画素数がMの整数倍となるとは限らないが、余った画素は予め設定された条件に従って適当なタイルにわりあてるものとする。かかる点は垂直方向の分割数Nについても同様である。タイル分割部103は、分割して得られたタイルをプレーン形成部104へ順次供給する。なお、操作部101から入力されるタイル分割数を用いずに、撮像部102から入力される画像サイズに応じて、内部のメモリリソースが破綻しないような分割数を自動的に算出するようにしてもよい。   The tile dividing unit 103 temporarily stores the RAW image input from the imaging unit 102 in the internal memory, and divides the RAW image data into one or more tiles based on the number of tile divisions supplied from the operation unit 101. Note that the number of tile divisions from the operation unit 101 is in an M × N format, and the divided tiles are basically the same size. However, although the number of horizontal pixels of the original RAW image data is not necessarily an integer multiple of M, the remaining pixels are assigned to appropriate tiles according to preset conditions. The same applies to the number of divisions N in the vertical direction. The tile dividing unit 103 sequentially supplies the tiles obtained by the division to the plane forming unit 104. Instead of using the number of tile divisions input from the operation unit 101, the number of divisions so that the internal memory resource does not fail is automatically calculated according to the image size input from the imaging unit 102. Also good.

プレーン形成部104は、タイル分割部103から供給されたタイルのRAW画像データを色成分毎に分解して色プレーンを形成する。ベイヤ配列のRAW画像であるため、色プレーン形成部104は、赤(R)、緑(G1)、緑(G2)、青(B)の各色成分を抜き出し、色プレーンを形成する。そして、プレーン形成部104は、形成したRプレーン、G1プレーン、G2プレーン、そして、Bプレーンを、例えばこの順に周波数変換部105に供給する。   The plane forming unit 104 decomposes the RAW image data of the tile supplied from the tile dividing unit 103 for each color component to form a color plane. Since the RAW image is a Bayer array, the color plane forming unit 104 extracts each color component of red (R), green (G1), green (G2), and blue (B) to form a color plane. Then, the plane forming unit 104 supplies the formed R plane, G1 plane, G2 plane, and B plane to the frequency conversion unit 105 in this order, for example.

周波数変換部105は、プレーン形成部104より受信したRプレーンに対して離散ウェーブレット変換を実行し、その結果得られた変換係数データを量子化部107に供給する。この離散ウェーブレット変換では、例えば、JPEG2000で規定される整数型5×3型フィルタであってもよく、又は実数型9×7フィルタを用いても良い。そして、周波数変換部105は、プレーン形成部」104から受信した他のプレーン(G1,G2,Bプレーン)に対しても離散ウェーブレット変換を実行し、その結果得られた変換係数データを量子化部107に供給する。   The frequency transform unit 105 performs discrete wavelet transform on the R plane received from the plane forming unit 104 and supplies transform coefficient data obtained as a result to the quantization unit 107. In this discrete wavelet transform, for example, an integer type 5 × 3 filter specified by JPEG2000 may be used, or a real type 9 × 7 filter may be used. Then, the frequency transform unit 105 also performs discrete wavelet transform on other planes (G1, G2, B planes) received from the “plane forming unit” 104, and the resulting transform coefficient data is quantized. 107 is supplied.

量子化制御部106は、操作部101から入力される記録ビットレートに基づき、量子化部107が使用する量子化パラメータを決定して、量子化部107に供給する。ここで、実施形態における量子化制御部106は、2つの量子化方法から量子化パラメータを決定する構成となっている。この2つの量子化方法の詳細は後述する。   The quantization control unit 106 determines a quantization parameter used by the quantization unit 107 based on the recording bit rate input from the operation unit 101, and supplies the quantization parameter to the quantization unit 107. Here, the quantization control unit 106 in the embodiment is configured to determine a quantization parameter from two quantization methods. Details of these two quantization methods will be described later.

量子化部107は、周波数変換部105から受信した変換係数データに対して、量子化制御部106から受信した量子化パラメータを用いて量子化を実行し、量子化後の係数をエントロピー符号化部108に供給する。   The quantization unit 107 performs quantization on the transform coefficient data received from the frequency transform unit 105 by using the quantization parameter received from the quantization control unit 106, and the quantized coefficients are entropy coding units. 108.

エントロピー符号化部108は、量子化部107から受信した量子化後の変換係数データを圧縮符号化し、符号化データを生成する。そして、エントロピー符号化部108は生成した符号化データを記憶媒体109に供給する。この圧縮符号化は、例えば、ゴロム符号化のようなエントロピー符号化を用いて実施する。   The entropy encoding unit 108 compresses and encodes the quantized transform coefficient data received from the quantization unit 107 to generate encoded data. Then, the entropy encoding unit 108 supplies the generated encoded data to the storage medium 109. This compression coding is performed using entropy coding such as Golomb coding, for example.

記憶媒体109は、エントロピー符号化部108から受信した符号化データを記憶する不揮発性メモリ(例えば脱着可能な記憶媒体(SDカード)等)である。   The storage medium 109 is a non-volatile memory (for example, a removable storage medium (SD card)) that stores encoded data received from the entropy encoding unit 108.

次に、量子化制御部106における、第1の量子化方法と、第2の量子化方法について、図2(a)、図2(b)を用いて説明する。   Next, the first quantization method and the second quantization method in the quantization control unit 106 will be described with reference to FIGS. 2 (a) and 2 (b).

図2(a)は、第1の量子化方法を示す概念図であり、図2(b)は、第2の量子化方法を示す概念図である。以下、これらについてさらに詳しく説明する。なお、実施形態における周波数変換部105は、1つのタイルに対して、離散ウェーブレット変換を2回行うものとして説明する。結果、図4(a)に示すように、1つのタイルから7つのサブバンドSB0乃至SB6が生成される。なお、この離散ウェーブレット変換の実行回数は2回に限らず、1回以上であればその回数に制限はない。場合によっては、操作部101からその回数を設定できるようにしても良い。   FIG. 2A is a conceptual diagram illustrating the first quantization method, and FIG. 2B is a conceptual diagram illustrating the second quantization method. Hereinafter, these will be described in more detail. Note that the frequency conversion unit 105 in the embodiment will be described as performing discrete wavelet conversion twice for one tile. As a result, as shown in FIG. 4A, seven subbands SB0 to SB6 are generated from one tile. Note that the number of executions of this discrete wavelet transform is not limited to two, and there is no limit to the number of times as long as it is one or more. In some cases, the number of times may be set from the operation unit 101.

<第1の量子化方法>
図2(a)に示すように、1つのサブバンドを面で均一に量子化する方法である。この量子化方法における量子化パラメータは、1サブバンドにつき1パラメータの関係が固定であり、各タイルにおける同一サブバンドの量子化パラメータ(量子化ステップ)が、隣接タイル間で同一の値とを取る。各タイルのサブバンドはタイル間で同一の量子化パラメータが設定されるため、量子化によるタイル境界の歪みが発生することはない。なお、本実施形態での量子化パラメータは、操作部101から入力されるビットレート付近に収束するような統計値を予め用意して量子化に適用する方法で説明する。
<First quantization method>
As shown in FIG. 2A, this is a method of uniformly quantizing one subband on the surface. In this quantization method, the relationship of one parameter per subband is fixed, and the quantization parameter (quantization step) of the same subband in each tile takes the same value between adjacent tiles. . Since the same quantization parameter is set for each subband of each tile, distortion of the tile boundary due to quantization does not occur. Note that the quantization parameter in this embodiment will be described by a method in which statistical values that converge near the bit rate input from the operation unit 101 are prepared in advance and applied to quantization.

なお、実施形態では、周波数変換部105から、1つのタイルから7つのサブバンドが生成される。それ故、それぞれに対してサブバンドに対し、予め設定した量子化パラメータが設定される。   In the embodiment, seven subbands are generated from one tile from the frequency conversion unit 105. Therefore, a preset quantization parameter is set for each subband.

<第2の量子化方法>
図2(b)に示すように、1つのサブバンドをライン単位に分割し、各ラインが異なる量子化パラメータ(Q#x)(x=0,1,2…)を用いて量子化する方法である。この量子化方法は、ライン毎に量子化パラメータを変更することが可能であるため、設定ビットレートへの収束性が高い。
<Second quantization method>
As shown in FIG. 2B, a method of dividing one subband into lines and quantizing each line using different quantization parameters (Q # x) (x = 0, 1, 2,...). It is. Since this quantization method can change the quantization parameter for each line, the convergence to the set bit rate is high.

第1の量子化方法および第2の量子化方法の決定処理の基本的な考え方を説明する。ビットレートが低い場合(目標圧縮率が高い場合)は、符号量を抑制するために量子化パラメータが大きく設定されるため、量子化誤差は大きくなる。つまり、タイル境界部の歪みが視認しやすくなる傾向になる。かかる点に従い、タイル境界の画質を優先した第1の量子化方法に決定する。   A basic concept of the determination process of the first quantization method and the second quantization method will be described. When the bit rate is low (when the target compression rate is high), the quantization parameter is set to be large in order to suppress the code amount, and the quantization error becomes large. That is, the distortion at the tile boundary tends to be visually recognized. In accordance with this point, the first quantization method giving priority to the image quality of the tile boundary is determined.

一方、ビットレートが高い場合(目標圧縮率が低い場合)は、量子化パラメータが小さく設定されるため、量子化誤差は小さい。タイル境界部の歪みが視認しにくいことから、ビットレートの収束性を優先した第2の量子化方法に決定する。   On the other hand, when the bit rate is high (when the target compression ratio is low), the quantization parameter is set to be small, so that the quantization error is small. Since the distortion at the tile boundary is difficult to visually recognize, the second quantization method is given priority on the convergence of the bit rate.

続いて、RAW画像の符号化処理に対して、量子化制御部106が行う量子化方法決定処理について図3に示すフローチャートを基に説明を行う。   Next, the quantization method determination process performed by the quantization control unit 106 for the RAW image encoding process will be described based on the flowchart shown in FIG.

S301にて、量子化制御部106は、ユーザが設定した操作部101からビットレートRを取得する。なお、ビットレートは、ユーザがそれを変更しない限りメモリに保持される場合には、そのメモリよりビットレートを取得しても構わない。S302にて、量子化制御部106は、取得したビットレートRと予め設定された閾値Tと比較し、大小判定を行う。ビットレートRが閾値T0を下回る場合(R<0Tの場合)はS303に処理を進める。また、ビットレートRが閾値T0以上の場合にはS304に処理を進める。なお、閾値T0の設定例は後述する。   In S301, the quantization control unit 106 acquires the bit rate R from the operation unit 101 set by the user. If the bit rate is held in a memory unless the user changes it, the bit rate may be acquired from the memory. In S <b> 302, the quantization control unit 106 compares the acquired bit rate R with a preset threshold value T, and performs size determination. When the bit rate R is lower than the threshold value T0 (when R <0T), the process proceeds to S303. If the bit rate R is greater than or equal to the threshold T0, the process proceeds to S304. An example of setting the threshold value T0 will be described later.

S303にて、量子化制御部106は、着目タイルの各サブバンドの量子化方法を、第1の量子化方法を用いるとして決定する。また、S304に処理が進んだ場合、量子化制御部106は、着目タイルの各サブバンドの量子化方法として、第1の量子化方法と第2の量子化方法との組み合わせを用いるものとして決定する。   In S303, the quantization control unit 106 determines that the first quantization method is used as the quantization method for each subband of the tile of interest. When the process proceeds to S304, the quantization control unit 106 determines that a combination of the first quantization method and the second quantization method is used as the quantization method for each subband of the tile of interest. To do.

ここで、閾値Tの設定例と、第1の量子化方法と第2の量子化方法とを組み合わせた量子化方法について、図4(a)、図4(b)を用いて説明する。   Here, a setting example of the threshold value T and a quantization method in which the first quantization method and the second quantization method are combined will be described with reference to FIGS. 4 (a) and 4 (b).

図4(a)は、1つのタイルに対し、離散ウェーブレット変換を2回実行した場合に生成されるサブバンドを示している。各サブバンドは以下の意味を持つ。
・サブバンドSB0(2LLとも表現する):
1回目の離散ウェーブレット変換で得られる低域成分の変換係数データの集合(1LL)に対して、垂直方向ローパスフィルタ処理、水平方向ローパスフィルタ処理を施して得られた変換係数データの集合である。
・サブバンドSB1(2HLとも表現する):
1回目の離散ウェーブレット変換で得られる低域成分の変換係数データの集合(1LL)に対して、垂直方向ローパスフィルタ処理、水平方向ハイパスフィルタ処理を施して得られた変換係数データの集合である
・サブバンドSB2(2LHとも表現する):
1回目の離散ウェーブレット変換で得られる低域成分の変換係数データの集合(1LL)に対して、垂直方向ハイパスフィルタ処理、水平方向ローパスフィルタ処理を施して得られた変換係数データの集合である。
・サブバンドSB3(2HHとも表現する):
1回目の離散ウェーブレット変換で得られる低域成分の変換係数データの集合(1LL)に対して、垂直方向ハイパスフィルタ処理、水平方向ハイパスフィルタ処理を施して得られた変換係数データの集合である。
・サブバンドSB4(1HLとも表現する):
タイルに対して、垂直方向ローパスフィルタ処理、水平方向ハイパスフィルタ処理を施して得られた変換係数データの集合である。
・サブバンドSB5(1LHとも表現する):
タイルに対して、垂直方向ハイパスフィルタ処理、水平方向ローパスフィルタ処理を施して得られた変換係数データの集合である。
・サブバンドSB6(1HHとも表現する):
タイルに対して、垂直方向ハイパスフィルタ処理、水平方向ハイパスフィルタ処理を施して得られた変換係数データの集合である。
FIG. 4A shows subbands generated when the discrete wavelet transform is executed twice for one tile. Each subband has the following meaning.
Subband SB0 (also expressed as 2LL):
This is a set of transform coefficient data obtained by subjecting a set (1LL) of low-frequency component transform coefficient data obtained by the first discrete wavelet transform to vertical low-pass filter processing and horizontal low-pass filter processing.
Subband SB1 (also expressed as 2HL):
A set of transform coefficient data obtained by subjecting a set of low-frequency component transform coefficient data (1LL) obtained by the first discrete wavelet transform (1LL) to vertical low-pass filter processing and horizontal high-pass filter processing. Subband SB2 (also expressed as 2LH):
This is a set of transform coefficient data obtained by subjecting a set (1LL) of low-frequency component transform coefficient data obtained by the first discrete wavelet transform to vertical high-pass filter processing and horizontal low-pass filter processing.
Subband SB3 (also expressed as 2HH):
This is a set of transform coefficient data obtained by subjecting a set (1LL) of low-frequency component transform coefficient data obtained by the first discrete wavelet transform to vertical high-pass filter processing and horizontal high-pass filter processing.
Subband SB4 (also expressed as 1HL):
It is a set of transform coefficient data obtained by performing vertical low-pass filter processing and horizontal high-pass filter processing on tiles.
Subband SB5 (also expressed as 1LH):
This is a set of transform coefficient data obtained by performing vertical high-pass filter processing and horizontal low-pass filter processing on tiles.
Subband SB6 (also expressed as 1HH):
This is a set of transform coefficient data obtained by performing vertical high-pass filter processing and horizontal high-pass filter processing on tiles.

ここで、量子化制御部304のS303,S304の処理の具体例を説明する。図4(b)は、各サブバンドの量子化方法適用パターンを示したテーブルである。閾値の大小関係は、T0<T1<T2<T3である。
・パターン1:
ビットレートRが、閾値T0未満の場合に、着目タイルから得られた全サブバンドに第1の量子化方法を適用するパターンである。このパターン1に相当する場合の処理がS303の処理でもある。以下に説明するパターン2乃至パターン5は、S304における処理となる。
・パターン2:
ビットレートRが、閾値T0以上T1未満の場合に、サブバンドSB6に第2の量子化方法が適用され、それ以外のサブバンドSB0乃至5に対しては第1の量子化方法を適用するパターンである。
・パターン3:
ビットレートRが、閾値T1以上T2未満の場合に、サブバンドSB4乃至SB6に第2の量子化方法が適用され、それ以外のサブバンドSB0乃至3に対しては第1の量子化方法を適用するパターンである。
・パターン4:
ビットレートRが、閾値T2以上T3未満の場合に、サブバンドSB3乃至SB6に第2の量子化方法が適用され、それ以外のサブバンドSB0乃至2に対しては第1の量子化方法を適用するパターンである。
・パターン5:
ビットレートRが、閾値T3以上の場合に、サブバンドSB1〜SB6に対して第2の量子化方法が適用され、サブバンドSB0に対しては第1の量子化方法を適用するパターンである。
Here, a specific example of the processing of S303 and S304 of the quantization control unit 304 will be described. FIG. 4B is a table showing a quantization method application pattern for each subband. The magnitude relation of the threshold is T0 <T1 <T2 <T3.
・ Pattern 1:
This is a pattern in which the first quantization method is applied to all subbands obtained from the target tile when the bit rate R is less than the threshold value T0. The process corresponding to this pattern 1 is also the process of S303. Patterns 2 to 5 described below are the processes in S304.
・ Pattern 2:
A pattern in which the second quantization method is applied to subband SB6 when bit rate R is equal to or greater than threshold value T0 and less than T1, and the first quantization method is applied to other subbands SB0 to SB5. It is.
・ Pattern 3:
When the bit rate R is greater than or equal to the threshold T1 and less than T2, the second quantization method is applied to the subbands SB4 to SB6, and the first quantization method is applied to the other subbands SB0 to SB3. Pattern.
Pattern 4:
When the bit rate R is greater than or equal to the threshold T2 and less than T3, the second quantization method is applied to the subbands SB3 to SB6, and the first quantization method is applied to the other subbands SB0 to SB2 Pattern.
Pattern 5:
When the bit rate R is greater than or equal to the threshold T3, the second quantization method is applied to the subbands SB1 to SB6, and the first quantization method is applied to the subband SB0.

ビットレートが最も高いパターン5においては、タイル境界部の歪みが視認しにくいため、第2の量子化方法を適用するサブバンドが最も多く、ビットレートの収束性を重視した制御となっている。   In the pattern 5 with the highest bit rate, since distortion at the tile boundary is difficult to visually recognize, there are the most subbands to which the second quantization method is applied, and the control is focused on the convergence of the bit rate.

実施形態におけるサブバンドはSB#(#=0,1,2、…)と表現している。ウェーブレット変換を行う回数が2以外でもかかる表現を用いるのであれば、周波数成分の低い順で表していると言える。上記のパターン1乃至5における量子化制御部106の処理は以下(1)、(2)のようにまとめることができる。
(1)周波数変換で得られる複数のサブバンドを周波数の低い順に並べた場合の、最も低い周波数から高い周波数に向かうM個のサブバンドについては第1の量子化方法を適用し、M+1個目から最も高い周波数までのN個のサブバンドについては第2の量子化方法を適用する。
(2)ビットレートが低いほどMを大きくする(または、ビットレートは高いほどNを大きくする)
また、最も周波数の低いサブバンドSB0(実施形態では2LL)は、ビットレートとは無関係に、第1の量子化方法を採用する。
The subband in the embodiment is expressed as SB # (# = 0, 1, 2,...). If such an expression is used even when the number of wavelet transforms is other than 2, it can be said that the frequency components are represented in order of decreasing frequency components. The processing of the quantization control unit 106 in the above patterns 1 to 5 can be summarized as (1) and (2) below.
(1) When a plurality of subbands obtained by frequency conversion are arranged in order from the lowest frequency, the first quantization method is applied to the M subbands from the lowest frequency to the higher frequency, and the M + 1th The second quantization method is applied to N subbands from 1 to the highest frequency.
(2) M is increased as the bit rate is lower (or N is increased as the bit rate is higher).
The lowest frequency subband SB0 (2LL in the embodiment) employs the first quantization method regardless of the bit rate.

以上のようにすることで、タイル分割した画像の符号化において、ビットレートに応じて量子化方法を動的に切り替えることで、タイル境界歪みの抑制と符号量の制御性を両立可能な画像符号化装置を提供することができる。   As described above, in coding of tiled images, image coding that can simultaneously suppress tile boundary distortion and control the amount of code by dynamically switching the quantization method according to the bit rate. A device can be provided.

なお、第1の量子化方法に基づく符号化処理は、着目サブバンドの全変換係数を同じ量子化パラメータに基づき量子化し、符号化することになるので、その説明は不要であろう。そこで以下では、第2の量子化方法にもとづく、各ラインの量子化パラメータの変更がどのようにして推移するのかを、その符号化処理と共に説明する。   Note that the encoding process based on the first quantization method quantizes and encodes all the transform coefficients of the target subband based on the same quantization parameter, and therefore description thereof is unnecessary. Therefore, in the following, how the change of the quantization parameter of each line changes based on the second quantization method will be described together with the encoding process.

着目サブバンドのライン0、1、2…と符号化を行っていくと、各ラインの符号化データが生成されていく。つまり、各ラインの符号化を継続していく限り、総符号量は単調増加していく。   When encoding is performed for lines 0, 1, 2,... Of the target subband, encoded data of each line is generated. That is, as long as encoding of each line continues, the total code amount increases monotonously.

着目サブバンドの全ラインの符号化を終えた際の目標符号量は、ユーザが設定したビットレートRに加え、分割タイル数、ウェーブレット変換の回数、並びに、着目サブバンドの種類で決まる。   In addition to the bit rate R set by the user, the target code amount at the end of encoding all lines of the target subband is determined by the number of divided tiles, the number of wavelet transforms, and the type of target subband.

図6は、着目サブバンドをライン0から順に量子化、符号化を行った際の符号量の推移を示している。図示の右肩上がりの直線は、目標符号量と原点を結ぶ理想推移を示す直線(以下、理想直線という)を示している。第0ラインから第iラインまでの累積目標符号量を『TA(i)』と表している。実際に量子化、符号化がこの理想直線上を推移するとは限らず、理想直線を上回ったり、下回ったりしながら累積符号量は増えていく。理想直線を上回った場合、符号量の発生を抑制する必要があることを意味する。それ故、次ラインの量子化の際には、量子化パラメータ(量子化ステップ)を所定値だけ増加させる。一方、理想直線を下回った場合、符号量を増やして画質を高めても良いことを意味する。それ故、次ラインの量子化の際には、量子化パラメータ(量子化ステップ)を所定値だけ減少させる。   FIG. 6 shows the transition of the code amount when the target subband is quantized and encoded in order from the line 0. The straight line that rises to the right in the figure indicates a straight line that represents an ideal transition connecting the target code amount and the origin (hereinafter referred to as an ideal straight line). The accumulated target code amount from the 0th line to the i-th line is represented as “TA (i)”. Actually, quantization and encoding do not always move on the ideal line, and the accumulated code amount increases while exceeding or falling below the ideal line. If it exceeds the ideal straight line, it means that it is necessary to suppress the generation of the code amount. Therefore, when the next line is quantized, the quantization parameter (quantization step) is increased by a predetermined value. On the other hand, when it falls below the ideal straight line, it means that the image quality may be increased by increasing the code amount. Therefore, when the next line is quantized, the quantization parameter (quantization step) is decreased by a predetermined value.

かかる点を踏まえ、実施形態における制御部110の制御下における或るサブバンドの符号化処理を図7のフローチャートに従って説明する。なお、以下の説明で用いる変数iはライン番号を特定するために用いられる。また、変数Aは、第0〜第iラインまでの累積符号量を格納するために用いられるものである。   Based on this point, encoding processing of a certain subband under the control of the control unit 110 in the embodiment will be described with reference to the flowchart of FIG. Note that the variable i used in the following description is used to specify the line number. The variable A is used for storing the accumulated code amount from the 0th line to the i-th line.

まず、制御部110は、S1にて、量子化制御部106を制御し、着目サブバンドの符号化に先立ち、量子化パラメータRに初期値を設定する。この初期値は、ユーザが設定したビットレートR、分割タイル数、ウェーブレット変換の回数、並びに、着目サブバンドの種類で決まる。   First, in step S1, the control unit 110 controls the quantization control unit 106, and sets an initial value for the quantization parameter R prior to encoding the subband of interest. This initial value is determined by the bit rate R set by the user, the number of divided tiles, the number of wavelet transforms, and the type of the subband of interest.

次に、S2にて、制御部110は変数i、Aをそれぞれ0クリアする。そして、S3にて、制御部110は量子化部107を制御し、着目サブバンドから第iラインの変換係数データを周波数変換部105から入力させ、S4にて量子化パラメータRを用いて量子化を行わせる。そして、S5にて、制御部110はエントロピー符号化部108を制御して、量子化後の1ライン分の変換係数データに対しエントロピー符号化を実行させる。そして、制御部110は、S6にて、変数Aに第iラインの符号化データ量を加算することで、変数Aを更新する。     Next, in S2, control unit 110 clears variables i and A to 0, respectively. In step S3, the control unit 110 controls the quantization unit 107 to input the transform coefficient data of the i-th line from the target subband from the frequency conversion unit 105. In step S4, the control unit 110 performs quantization using the quantization parameter R. To do. In step S5, the control unit 110 controls the entropy encoding unit 108 to execute entropy encoding on the transform coefficient data for one line after quantization. In step S6, the control unit 110 updates the variable A by adding the encoded data amount of the i-th line to the variable A.

次いで制御部110は、S7にて第iラインまでの累積符号量Aと累積目標符号量TA(i)との差が、予め設定した閾値ε以下であるか否かを判定する。閾値ε以下である場合、処理はS11に進み、制御部110は全ラインの符号化を終えたか否かを判定し、否の場合にはS12にて変数iを“1”増加させ、S3以降の処理を繰り返す。   Next, in S7, the control unit 110 determines whether or not the difference between the accumulated code amount A up to the i-th line and the accumulated target code amount TA (i) is equal to or less than a preset threshold value ε. If it is equal to or smaller than the threshold ε, the process proceeds to S11, and the control unit 110 determines whether or not all lines have been encoded. If not, the variable i is incremented by “1” in S12, and after S3 Repeat the process.

また、第iラインまでの累積符号量Aと累積目標符号量TA(i)との差が閾値εを超える場合、制御部110は処理をS8に進め、A<TA(i)であるか否か、つまり、累積符号量Aが累積目標符号量TA(i)を下回っているか否かを判定する。A<TA(i)である場合、符号量を増やしても良いことになる。それ故、制御部110は、S9にて、量子化パラメータRを予め設定された正の所定値ΔRだけ増加させる。また、A>TA(i)であった場合、符号量を減らす必要がある。それ故、制御部110は、S10にて、量子化パラメータRを所定値ΔRだけ減少させる。   When the difference between the accumulated code amount A up to the i-th line and the accumulated target code amount TA (i) exceeds the threshold ε, the control unit 110 advances the process to S8, and whether A <TA (i) is satisfied. That is, it is determined whether or not the accumulated code amount A is less than the accumulated target code amount TA (i). If A <TA (i), the code amount may be increased. Therefore, the control unit 110 increases the quantization parameter R by a predetermined positive value ΔR in S9. If A> TA (i), it is necessary to reduce the code amount. Therefore, the control unit 110 decreases the quantization parameter R by a predetermined value ΔR in S10.

以上の結果、着目サブバンドの量子化パラメータをライン単位に変更した符号化が実現できる。   As a result, it is possible to realize encoding in which the quantization parameter of the target subband is changed for each line.

[第2実施形態]
第2実施形態に係る装置構成は、上記第1の実施形態と同様であるため、構成説明を省略する。また、量子化制御部106が行う量子化方法決定処理についても第1の実施形態と同様であるため省略する。異なる点は、本第2の実施形態における第2の量子化方法(図2(b))では、隣接タイルにおける同一サブバンド間の量子化パラメータが、所定の範囲内に収まるように、ライン毎の量子化パラメータを決定する構成とする点である。
[Second Embodiment]
Since the apparatus configuration according to the second embodiment is the same as that of the first embodiment, description of the configuration is omitted. Also, the quantization method determination process performed by the quantization control unit 106 is the same as that in the first embodiment, and is therefore omitted. The difference is that in the second quantization method according to the second embodiment (FIG. 2B), the quantization parameter between the same subbands in adjacent tiles is set to be within a predetermined range. The quantization parameter is determined.

第1実施形態における第2の量子化方法は、ビットレートに依存することなく処理内容は常に同じであり、タイル間の量子化パラメータの差分について考慮されていなかった。そのため、特に、低ビットレート時は、隣接タイル間の量子化パラメータ差分量が大きい場合に、タイル境界の歪みが発生し得る可能性があった。   In the second quantization method in the first embodiment, the processing content is always the same regardless of the bit rate, and the difference in the quantization parameter between tiles is not considered. Therefore, particularly at the low bit rate, there is a possibility that distortion of the tile boundary may occur when the amount of quantization parameter difference between adjacent tiles is large.

そこで、本第2の実施形態の第2の量子化方法は、ビットレートに応じて隣接タイル間のライン毎の量子化パラメータに設定範囲を設けることで、より細かく画質とビットレートの収束性のバランスを最適にすることを目的とする。以下かかる詳細を説明する。   Therefore, in the second quantization method of the second embodiment, the setting range is set for the quantization parameter for each line between adjacent tiles according to the bit rate, so that the image quality and the convergence property of the bit rate are more finely defined. The objective is to optimize the balance. The details will be described below.

本第2実施形態における第2の量子化方法における量子化パラメータの設定方法、設定値の範囲について説明する。本第2実施形態では、分割したタイルの着目タイルのサブバンドの先頭ラインの量子化パラメータが、タイル間で同値であるものとする。   A quantization parameter setting method and a setting value range in the second quantization method according to the second embodiment will be described. In the second embodiment, it is assumed that the quantization parameter of the first line of the subband of the target tile of the divided tile has the same value between tiles.

図5(a)は、タイルの所定のサブバンドの量子化パラメータの設定範囲を示している。また、図5(b)は、図5(a)で示した設定範囲の中に収まるように、ライン毎の量子化パラメータが推移していることを表している。図5(a)中の閾値T0,T1の設定方法については、例えば、記録可能な最大ビットレートを等割にした値を設定すればよい。ただし、閾値の大小関係はT0<T1であり、閾値に基づく設定パターンは3つであるものとして説明する。また、量子化パラメータ差分の許容範囲A、B、Cの大小関係はA<B<Cである。
・パターン1:
ビットレートRが、閾値T0未満の場合に、第2の量子化方法で用いる各ラインの量子化パラメータが、先頭ラインの量子化パラメータに対して、±Aの範囲に収まるように設定する。
・パターン2:
ビットレートRが、閾値T0以上T1未満の場合に、第2の量子化方法で用いる量子化パラメータが、先頭ラインの量子化パラメータに対して、±Bの範囲に収まるように設定する。
・パターン3:
ビットレートRが、閾値T1以上の場合に、第2の量子化方法で用いる量子化パラメータが、先頭ラインの量子化パラメータに対して、±Cの範囲に収まるように設定する。
FIG. 5A shows the setting range of the quantization parameter of a predetermined subband of the tile. FIG. 5B shows that the quantization parameter for each line changes so as to be within the set range shown in FIG. As for the setting method of the threshold values T0 and T1 in FIG. 5A, for example, a value obtained by equally dividing the recordable maximum bit rate may be set. However, it is assumed that the threshold value relationship is T0 <T1, and that there are three setting patterns based on the threshold value. Further, the size relationship between the allowable ranges A, B, and C of the quantization parameter difference is A <B <C.
・ Pattern 1:
When the bit rate R is less than the threshold value T0, the quantization parameter of each line used in the second quantization method is set to fall within a range of ± A with respect to the quantization parameter of the first line.
・ Pattern 2:
When the bit rate R is greater than or equal to the threshold value T0 and less than T1, the quantization parameter used in the second quantization method is set to fall within a range of ± B with respect to the quantization parameter of the first line.
・ Pattern 3:
When the bit rate R is equal to or higher than the threshold value T1, the quantization parameter used in the second quantization method is set so as to fall within a range of ± C with respect to the quantization parameter of the first line.

図5(a)、図5(b)から分かるように、ビットレートが最も高いパターン3においては、タイル境界部の歪みが視認しにくいため、より広い範囲で量子化パラメータを設定する。   As can be seen from FIGS. 5A and 5B, in the pattern 3 having the highest bit rate, the distortion at the tile boundary is difficult to visually recognize, so the quantization parameter is set in a wider range.

一方、ビットレートが最も低いパターン1においては、ビットレートが下がるとタイル境界部の歪みが視認しやすくなるため、より狭い範囲で量子化パラメータを設定することでタイル歪みを抑制している。   On the other hand, in the pattern 1 with the lowest bit rate, when the bit rate decreases, the distortion at the tile boundary becomes easy to visually recognize. Therefore, the tile distortion is suppressed by setting the quantization parameter in a narrower range.

以上のようにすることで、タイル分割した画像の符号化において、ビットレートに応じて量子化パラメータの設定範囲を動的に切り替えることで、より細かく画質とビットレート収束性のバランスを調整することが可能な画像符号化装置を提供することができる。   By doing the above, in the encoding of tile-divided images, the balance between image quality and bit rate convergence can be adjusted more finely by dynamically switching the setting range of the quantization parameter according to the bit rate. It is possible to provide an image encoding apparatus capable of

なお、本実施形態の量子化パラメータの設定範囲を1つのサブバンドに着目して説明したが、設定範囲A、B、Cは、いずれのサブバンドにおいても同様の大小関係が成り立つ。また、設定範囲A,B,Cは、量子化パラメータのリミッタとして用いることになる。図7のフローチャートに適用するのであれば、設定値Aを適用する場合には、S9、S10の直後等に、『量子化パラメータの初期値±A』の範囲を超えた場合に範囲内に戻す処理を追加すればよい。   Note that the quantization parameter setting range of this embodiment has been described focusing on one subband, but the setting ranges A, B, and C have the same magnitude relationship in any subband. The setting ranges A, B, and C are used as limiters for quantization parameters. If applied to the flowchart of FIG. 7, when the set value A is applied, immediately after S9, S10, etc., if the range of the “quantization parameter initial value ± A” is exceeded, it is returned to the range. What is necessary is just to add a process.

(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other examples)
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.

100…撮像装置、101…操作部、102…撮像部、103…タイル分割部、104…プレーン形成部、105…周波数変換部、106…量子化制御部、107…量子化部、108…エントロピー符号化部、109…記憶媒体、110…制御部 DESCRIPTION OF SYMBOLS 100 ... Imaging device 101 ... Operation part 102 ... Imaging part 103 ... Tile division part 104 ... Plane formation part 105 ... Frequency conversion part 106 ... Quantization control part 107 ... Quantization part 108 ... Entropy code 110, storage medium, 110, control unit

Claims (11)

符号化対象の画像データを複数のタイルに分割し、当該タイルを単位に符号化する画像符号化装置であって、
前記符号化対象の画像データのビットレートを設定する設定手段と、
着目タイルを周波数変換することで複数のサブバンドを生成する周波数変換手段と、
該周波数変換手段で得られた着目タイルの複数のサブバンドの各々について、
(1)タイル間の同一サブバンドに対し固定であって同一の量子化パラメータで量子化する第1の量子化方法
(2)タイル間の同一サブバンドに対して可変の量子化パラメータで量子化する第2の量子化方法
のいずれを用いるかを、前記設定手段で設定されたビットレートに従って決定する量子化制御手段と、
該量子化制御手段で決定した量子化パラメータに基づき、前記着目タイルを周波数変換することで得た複数のサブバンドを量子化する量子化手段と、
前記量子化手段で生成する量子化後の変換係数データを符号化する符号化手段と、
を備えることを特徴とする画像符号化装置。
An image encoding device that divides image data to be encoded into a plurality of tiles and encodes the tiles as a unit,
Setting means for setting a bit rate of the image data to be encoded;
A frequency conversion means for generating a plurality of subbands by frequency converting the tile of interest;
For each of the plurality of subbands of the tile of interest obtained by the frequency conversion means,
(1) A first quantization method in which the same subband between tiles is fixed and is quantized with the same quantization parameter.
(2) Quantization control means for determining which of the second quantization methods for quantizing the same subband between tiles with a variable quantization parameter according to the bit rate set by the setting means When,
Quantization means for quantizing a plurality of subbands obtained by frequency-transforming the tile of interest based on the quantization parameter determined by the quantization control means;
Encoding means for encoding transform coefficient data after quantization generated by the quantization means;
An image encoding device comprising:
前記量子化制御手段は、
前記設定手段で設定したビットレートが、第1の閾値を下回る場合は前記着目タイルから得られた全サブバンドを前記第1の量子化方法を用いて符号化するとして決定し、
前記設定手段で設定したビットレートが、前記第1の閾値を下回らない場合は前記着目タイルから得られた全サブバンドにおける予め設定されたサブバンドには前記第1の量子化方法と、前記着目タイルから得られた全サブバンドにおける、上記以外のサブバンドには前記第2の量子化方法で用いるとして決定する
ことを特徴とする請求項1に記載の画像符号化装置。
The quantization control means includes
If the bit rate set by the setting means is below a first threshold, determine that all subbands obtained from the tile of interest are encoded using the first quantization method;
If the bit rate set by the setting means does not fall below the first threshold, the first quantization method and the focus will be applied to preset subbands in all subbands obtained from the focus tile. The image coding apparatus according to claim 1, wherein the sub-bands other than the above in all sub-bands obtained from tiles are determined to be used in the second quantization method.
前記量子化制御手段は、
前記周波数変換で得られる複数のサブバンドを周波数の低い順に並べた場合の、最も低い周波数から高い周波数に向かうM個のサブバンドについては第1の量子化方法を適用し、M+1個目から最も高い周波数までのN個のサブバンドについては第2の量子化方法を適用し、
前記ビットレートが低いほど前記Mを大きくする
ことを特徴とする請求項2に記載の画像符号化装置。
The quantization control means includes
The first quantization method is applied to the M subbands from the lowest frequency to the higher frequency when the plurality of subbands obtained by the frequency conversion are arranged in order from the lowest frequency, and the M + 1th from the M + 1th most. Apply the second quantization method for N subbands up to high frequencies,
The image encoding apparatus according to claim 2, wherein the M is increased as the bit rate is lower.
前記量子化制御手段は、前記着目タイルから得られた全サブバンドのうち最も低い周波数のサブバンドについては、前記ビットレートとは無関係に前記第1の量子化方法を適用するものとして決定する
ことを特徴とする請求項1乃至3のいずれか1項に記載の画像符号化装置。
The quantization control means determines that the first quantization method is applied to a subband having the lowest frequency among all subbands obtained from the tile of interest regardless of the bit rate. The image encoding device according to claim 1, wherein
前記第2の量子化方法は、着目サブバンドのラインを単位に量子化パラメータを決定する
ことを特徴とする請求項1乃至4のいずれか1項に記載の画像符号化装置。
The image coding apparatus according to any one of claims 1 to 4, wherein the second quantization method determines a quantization parameter in units of a line of a subband of interest.
前記量子化制御手段は、前記第2の量子化方法に従って着目サブバンドを量子化する際の量子化パラメータの許容範囲を、ビットレートに従って決定する
ことを特徴とする請求項1乃至5のいずれか1項に記載の画像符号化装置。
The quantization control means determines an allowable range of a quantization parameter when quantizing the target subband according to the second quantization method according to a bit rate. The image encoding device according to item 1.
前記許容範囲は、ビットレートが低いほど狭くすることを特徴とする請求項6に記載の画像符号化装置。   The image encoding apparatus according to claim 6, wherein the allowable range is narrowed as the bit rate is lower. 前記周波数変換手段は、ウェーブレット変換手段であることを特徴とする請求項1乃至7のいずれか1項に記載の画像符号化装置。   The image coding apparatus according to claim 1, wherein the frequency conversion unit is a wavelet conversion unit. 符号化対象の画像データを複数のタイルに分割し、当該タイルを単位に符号化する画像符号化装置の制御方法であって、
設定手段が、前記符号化対象の画像データのビットレートを設定する設定工程と、
周波数変換手段が、着目タイルを周波数変換することで複数のサブバンドを生成する周波数変換工程と、
量子化制御手段が、該周波数変換工程で得られた着目タイルの複数のサブバンドの各々について、
(1)タイル間の同一サブバンドに対し固定であって同一の量子化パラメータで量子化する第1の量子化方法
(2)タイル間の同一サブバンドに対して可変の量子化パラメータで量子化する第2の量子化方法
のいずれを用いるかを、前記設定工程で設定されたビットレートに従って決定する量子化制御工程と、
量子化手段が、該量子化制御工程で決定した量子化パラメータに基づき、前記着目タイルを周波数変換することで得た複数のサブバンドを量子化する量子化工程と、
符号化手段が、前記量子化工程で生成する量子化後の変換係数データを符号化する符号化工程と、
を備えることを特徴とする画像符号化装置の制御方法。
A control method of an image encoding device that divides image data to be encoded into a plurality of tiles and encodes the tiles as a unit,
A setting step for setting a bit rate of the image data to be encoded;
A frequency conversion step in which the frequency conversion means generates a plurality of subbands by frequency converting the tile of interest;
For each of the plurality of subbands of the tile of interest obtained by the frequency conversion step, the quantization control means
(1) A first quantization method in which the same subband between tiles is fixed and is quantized with the same quantization parameter.
(2) A quantization control step for determining which of the second quantization methods for quantizing the same subband between tiles with a variable quantization parameter according to the bit rate set in the setting step When,
A quantization step of quantizing a plurality of subbands obtained by frequency-converting the tile of interest based on a quantization parameter determined in the quantization control step;
An encoding step in which encoding means encodes the transformed transform coefficient data generated in the quantization step;
A method for controlling an image encoding device comprising:
コンピュータが読み込み実行することで、前記コンピュータを、請求項1乃至8のいずれか1項に記載の画像符号化装置が有する各手段として機能させるためのプログラム。   A program for causing a computer to function as each unit included in the image encoding device according to any one of claims 1 to 8, when the computer reads and executes the computer. 請求項10に記載のプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 10.
JP2015232263A 2015-11-27 2015-11-27 Image encoding apparatus, control method thereof, program, and storage medium Expired - Fee Related JP6564314B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015232263A JP6564314B2 (en) 2015-11-27 2015-11-27 Image encoding apparatus, control method thereof, program, and storage medium
US15/357,634 US10356408B2 (en) 2015-11-27 2016-11-21 Image encoding apparatus and method of controlling the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015232263A JP6564314B2 (en) 2015-11-27 2015-11-27 Image encoding apparatus, control method thereof, program, and storage medium

Publications (3)

Publication Number Publication Date
JP2017098898A true JP2017098898A (en) 2017-06-01
JP2017098898A5 JP2017098898A5 (en) 2018-12-20
JP6564314B2 JP6564314B2 (en) 2019-08-21

Family

ID=58818191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015232263A Expired - Fee Related JP6564314B2 (en) 2015-11-27 2015-11-27 Image encoding apparatus, control method thereof, program, and storage medium

Country Status (1)

Country Link
JP (1) JP6564314B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068385A (en) * 2017-10-05 2019-04-25 キヤノン株式会社 Encoder, control method thereof, and control program, and imaging apparatus

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056761A (en) * 2002-05-31 2004-02-19 Canon Inc Image reproduction apparatus and method
JP2004056260A (en) * 2002-07-17 2004-02-19 Ricoh Co Ltd Image decoder, image processor, program, recording medium and image decoding method
JP2004228963A (en) * 2003-01-23 2004-08-12 Ricoh Co Ltd Image processor, image forming apparatus, program, and storage medium
JP2005341076A (en) * 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> Image communication system, communication conference system, hierarchical encoder, server device, image communication method, image communication program, and image communication program recording medium
JP2006203409A (en) * 2005-01-19 2006-08-03 Megachips Lsi Solutions Inc Compression encoding device and method, and program
JP2008514139A (en) * 2004-09-21 2008-05-01 ドロップレット テクノロジー インコーポレイテッド Compression rate control system and method for variable subband processing
JP2010177828A (en) * 2009-01-28 2010-08-12 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for encoding scalable image, and computer-readable recording medium with the program recorded therein

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056761A (en) * 2002-05-31 2004-02-19 Canon Inc Image reproduction apparatus and method
JP2004056260A (en) * 2002-07-17 2004-02-19 Ricoh Co Ltd Image decoder, image processor, program, recording medium and image decoding method
JP2004228963A (en) * 2003-01-23 2004-08-12 Ricoh Co Ltd Image processor, image forming apparatus, program, and storage medium
JP2005341076A (en) * 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> Image communication system, communication conference system, hierarchical encoder, server device, image communication method, image communication program, and image communication program recording medium
JP2008514139A (en) * 2004-09-21 2008-05-01 ドロップレット テクノロジー インコーポレイテッド Compression rate control system and method for variable subband processing
JP2006203409A (en) * 2005-01-19 2006-08-03 Megachips Lsi Solutions Inc Compression encoding device and method, and program
JP2010177828A (en) * 2009-01-28 2010-08-12 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for encoding scalable image, and computer-readable recording medium with the program recorded therein

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068385A (en) * 2017-10-05 2019-04-25 キヤノン株式会社 Encoder, control method thereof, and control program, and imaging apparatus
JP7016660B2 (en) 2017-10-05 2022-02-07 キヤノン株式会社 Coding device, its control method, and control program, and image pickup device.

Also Published As

Publication number Publication date
JP6564314B2 (en) 2019-08-21

Similar Documents

Publication Publication Date Title
JP6722995B2 (en) Encoding method, encoding device, imaging device, and program
US7359561B2 (en) Picture encoding with wavelet transform and block area weights
JP4365957B2 (en) Image processing method and apparatus and storage medium
JP4656190B2 (en) Information processing apparatus and method
CN110495174B (en) Encoding method, apparatus, image processing system, and computer-readable storage medium
JP2003319185A (en) Image encoding apparatus and method, image decoding apparatus and method
JP6986868B2 (en) Image coding device, image decoding device, image coding method, image decoding method, program
US10897615B2 (en) Image encoding apparatus and control method therefor
US10356408B2 (en) Image encoding apparatus and method of controlling the same
JP2017216630A5 (en)
JP2004166254A (en) Image encoder and method, program and recording medium
JP4111259B2 (en) Encoding apparatus, encoding method, software program, table data, and recording medium
JP6564314B2 (en) Image encoding apparatus, control method thereof, program, and storage medium
JP2009044483A (en) Image-encoding apparatus
JP7033013B2 (en) Image coding device, image decoding device, their control method, and program
US20230133895A1 (en) Image encoding apparatus and method for controlling the same and non-transitory computer-readable storage medium
JP6813991B2 (en) Image coding device and its control method and program
JP6792360B2 (en) Image coding device and image decoding device and their control methods and programs
JP6849359B2 (en) Coding device, coding device control method, and program
JP7016660B2 (en) Coding device, its control method, and control program, and image pickup device.
JP2021182700A (en) Encoding device and method, program and storage medium
JP2017216625A (en) Image encoding device and its control method
JP2001231009A (en) Image data storage device ad method
JP6793499B2 (en) Image coding device and its control method
JP5560172B2 (en) Image processing apparatus, image processing method, and image processing program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190726

R151 Written notification of patent or utility model registration

Ref document number: 6564314

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees