JP2015115903A - Imaging apparatus, control method of imaging apparatus, and computer program - Google Patents

Imaging apparatus, control method of imaging apparatus, and computer program Download PDF

Info

Publication number
JP2015115903A
JP2015115903A JP2013258701A JP2013258701A JP2015115903A JP 2015115903 A JP2015115903 A JP 2015115903A JP 2013258701 A JP2013258701 A JP 2013258701A JP 2013258701 A JP2013258701 A JP 2013258701A JP 2015115903 A JP2015115903 A JP 2015115903A
Authority
JP
Japan
Prior art keywords
block size
region
block
interest
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013258701A
Other languages
Japanese (ja)
Inventor
康一 郡司
Koichi Gunji
康一 郡司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013258701A priority Critical patent/JP2015115903A/en
Publication of JP2015115903A publication Critical patent/JP2015115903A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve image quality in the case of image variation and to improve encoding efficiency even in a compression system where a block size is variable.SOLUTION: An imaging apparatus is configured to divide a moving image that is obtained by imaging a subject, into a plurality of blocks and encode the moving image for each block. The imaging apparatus includes: determination means for determining a block size of dividing the moving image from among a plurality of block sizes; division means for dividing the moving image in accordance with the determined block side; and encoding means for performing encoding processing for each divided block. The determination means determines the block size of dividing the moving image, in accordance with a magnitude of variation of an image in the moving image, while switching between a first pattern that defines a block size for dividing a region of interest of a user of the imaging apparatus in the moving image as a size smaller than a block size for dividing any other region than the region of interest, and a second pattern that divides the moving image in accordance wit a maximum block size among the plurality of block sizes.

Description

本発明は、撮像装置、撮像装置の制御方法、コンピュータプログラムに関する。
に関する。
The present invention relates to an imaging apparatus, an imaging apparatus control method, and a computer program.
About.

デジタルビデオカメラやデジタルカメラなどの撮像装置では、MPEG2方式やH.264方式で動画像を圧縮して記録する方法を利用できるが、近年では、より高効率な圧縮方式、例えばHEVC方式などが開発されている。   In an imaging apparatus such as a digital video camera or a digital camera, the MPEG2 system or H.264 is used. Although a method of compressing and recording a moving image by the H.264 method can be used, in recent years, a more efficient compression method, such as the HEVC method, has been developed.

従来の圧縮方式では、符号化はマクロブロックと呼ばれる画像分割単位で処理され、マクロブロック毎に動き予測や変換処理、量子化処理が行われていた。これに対しHEVC方式では、動き予測や変換処理、量子化処理を行うブロックサイズを可変にすることで、符号化効率の更なる向上を実現している。   In the conventional compression method, encoding is processed in units of image divisions called macroblocks, and motion prediction, conversion processing, and quantization processing are performed for each macroblock. On the other hand, in the HEVC method, the encoding efficiency is further improved by changing the block size for performing motion prediction, conversion processing, and quantization processing.

この符号化効率は、量子化処理で使用される「量子化特性」と呼ばれる量子化パラメータで制御が可能であるが、圧縮率を高く制御すると一般的に画質は劣化する。量子化パラメータはマクロブロック毎に設定可能であり、撮影画像の特定部分の量子化パラメータを可変にすることによって、カメラのズーム動作やパニング動作、チルト動作時等の画像の変動時にも画質向上を実現する方法が特許文献1で提案されている。   The coding efficiency can be controlled by a quantization parameter called “quantization characteristic” used in the quantization process. However, when the compression rate is controlled to be high, the image quality generally deteriorates. The quantization parameter can be set for each macroblock, and by changing the quantization parameter for a specific part of the captured image, the image quality can be improved even when the image fluctuates during zoom operation, panning operation, tilt operation, etc. A method for realizing this is proposed in Patent Document 1.

特開平9−214965号公報Japanese Patent Laid-Open No. 9-214965

しかしながら、上記提案方法は、マクロブロックのサイズが固定された圧縮方式における画質向上方法の提案であって、ブロックサイズが可変の圧縮方式については考慮されていない。   However, the above proposed method is a proposal of an image quality improvement method in a compression method in which the macroblock size is fixed, and does not consider a compression method in which the block size is variable.

そこで本発明では、ブロックサイズが可変の圧縮方式であっても画像変動時の画質向上および符号化効率向上を可能とする技術を提供することを目的とする。   Therefore, an object of the present invention is to provide a technique that can improve the image quality and the coding efficiency when the image changes even if the compression method has a variable block size.

上記の課題を解決するための本発明は、被写体を撮像して得られた動画像を複数のブロックに分割してブロックごとに符号化する撮像装置であって、
前記動画像を分割するブロックサイズを複数のブロックサイズのうちから決定する決定手段と、
前記決定されたブロックサイズにより前記動画像を分割する分割手段と、
前記分割されたブロックごとに符号化処理を行う符号化手段と
を備え、
前記決定手段は前記動画像における画像の変動の大きさに応じて、前記動画像における該撮像装置のユーザの関心領域を分割するためのブロックサイズを該関心領域以外の領域を分割するためのブロックサイズも小さいサイズとする第1のパターンと、前記動画像を前記複数のブロックサイズのうち最大のブロックサイズにより分割する第2のパターンとで切り替えて、前記動画像を分割するブロックサイズを決定することを特徴とする。
The present invention for solving the above-described problem is an imaging apparatus that divides a moving image obtained by imaging a subject into a plurality of blocks and encodes each block,
Determining means for determining a block size for dividing the moving image from a plurality of block sizes;
Dividing means for dividing the moving image according to the determined block size;
Encoding means for performing an encoding process for each of the divided blocks,
The determining unit is configured to divide a region other than the region of interest into a block size for dividing the region of interest of the user of the imaging device in the moving image according to the magnitude of image variation in the moving image. The block size for dividing the moving image is determined by switching between the first pattern having a small size and the second pattern for dividing the moving image by the maximum block size among the plurality of block sizes. It is characterized by that.

本発明によれば、ブロックサイズが可変の圧縮方式においても、画像変動時に符号化効率を上げながら画質も向上させることができる。   According to the present invention, even in a compression scheme with a variable block size, the image quality can be improved while increasing the encoding efficiency when the image changes.

発明の実施形態に対応する撮像装置100として、(A)は実施形態1に対応し、(B)は実施形態2に対応する機能構成の一例を示すブロック図。FIG. 4 is a block diagram illustrating an example of a functional configuration corresponding to the first embodiment and (B) corresponding to the second embodiment as the imaging apparatus 100 corresponding to the embodiment of the invention. HEVC方式におけるブロック分割例を説明するための図。The figure for demonstrating the example of a block division | segmentation in a HEVC system. 発明の実施形態1に対応する撮像装置100の動作の一例を示すフローチャート。5 is a flowchart showing an example of the operation of the imaging apparatus 100 corresponding to Embodiment 1 of the invention. 発明の実施形態2に対応する撮像装置100の動作の一例を示すフローチャート。9 is a flowchart showing an example of the operation of the imaging apparatus 100 corresponding to Embodiment 2 of the invention. 発明の実施形態1に対応するブロック分割例を説明するための図。The figure for demonstrating the example of a block division corresponding to Embodiment 1 of invention. 発明の実施形態2に対応するブロック分割例を説明するための図。The figure for demonstrating the example of a block division corresponding to Embodiment 2 of invention.

以下に説明する発明の実施形態では、符号化ブロック分割方法の決定を、撮影により生成される動画像が変動する速度(変動速度)に応じて行う。   In the embodiment of the invention described below, the coding block division method is determined in accordance with the speed (fluctuation speed) at which a moving image generated by shooting changes.

発明の実施形態として、撮像装置としてのデジタルカメラまたはデジタルビデオカメラにおいてズームイン動作やズームアウト動作といったズーム動作を行うことにより生ずる画像の変動に基づいて符号化ブロックの分割方法を決定することができる。以下、当該実施形態を発明の第1の実施形態(実施形態1)として、その内容を添付の図面を参照してより詳細に説明する。   As an embodiment of the invention, a coding block division method can be determined based on image fluctuations caused by zoom operations such as a zoom-in operation and a zoom-out operation in a digital camera or digital video camera as an imaging apparatus. Hereinafter, the embodiment will be described in detail as a first embodiment (Embodiment 1) of the invention with reference to the accompanying drawings.

[実施形態1]
まず、図1(A)を参照して本実施形態に対応する撮像装置100の構成及び動作を説明する。図1(A)は、実施形態1に対応する撮像装置100の機能構成の一例を示す図である。図1(A)の撮像装置100において、撮像素子や不図示の表示素子のような物理的デバイスを除き、各ブロックは専用ロジック回路やメモリを用いてハードウェア的に構成されてもよい。或いは、メモリに記憶されている処理プログラムをCPU等のコンピュータが実行することにより、ソフトウェア的に構成されてもよい。また、撮像装置100は、デジタルカメラやデジタルビデオカメラ以外に、例えばパーソナルコンピュータ、携帯電話、スマートフォン、PDA、タブレット端末など、撮像機能を有する任意の情報処理端末或いは装置とすることができる。
[Embodiment 1]
First, the configuration and operation of the imaging apparatus 100 corresponding to the present embodiment will be described with reference to FIG. FIG. 1A is a diagram illustrating an example of a functional configuration of the imaging apparatus 100 corresponding to the first embodiment. In the imaging apparatus 100 of FIG. 1A, each block may be configured by hardware using a dedicated logic circuit or memory, except for a physical device such as an imaging element or a display element (not shown). Alternatively, the processing program stored in the memory may be configured by software by a computer such as a CPU executing the processing program. In addition to the digital camera and the digital video camera, the imaging device 100 can be any information processing terminal or device having an imaging function, such as a personal computer, a mobile phone, a smartphone, a PDA, or a tablet terminal.

センサ101は、CCDやCMOSなどの撮像素子であり、撮影レンズ群100で入射光量や合焦の調節を行い、結像された撮影画像を光電変換して、さらにアナログ・デジタル変換したデジタル信号を出力する。センサ100の各画素には、R(赤)、G(緑)、B(青)の何れかのカラーフィルタが所定の配列、例えばベイヤー配列やハニカム配列で配置されている。また、高速出力のために、数個の画素を加算して1個の画素として出力画像を縮小する画素加算処理を行ってRGB画像信号を出力する場合もある。   The sensor 101 is an image sensor such as a CCD or a CMOS. The photographing lens group 100 adjusts the amount of incident light and focusing, photoelectrically converts the formed captured image, and further converts a digital signal obtained by analog / digital conversion. Output. In each pixel of the sensor 100, any one of R (red), G (green), and B (blue) color filters is arranged in a predetermined arrangement, for example, a Bayer arrangement or a honeycomb arrangement. For high-speed output, RGB image signals may be output by performing pixel addition processing for adding several pixels to reduce the output image as one pixel.

現像処理部102は、センサ101からRGB画像信号を受信し、まずRGBのオフセット調整、ゲイン調整、ガンマ補正処理を行う。ガンマ補正は、センサ101やレンズ群100などの特性を考慮して、ビデオカメラユーザが所望する記録画像を生成するための特性で処理する。ガンマ曲線を調整することによって、TVモニターで表示するための記録画像の生成や、映画フィルムの質感や階調を再現した記録画像の生成が可能である。次にRGB画像信号を輝度信号(Y)と色差信号(Cb、Cr)に変換して出力する。また、レンズの歪曲収差の補正処理や、撮像装置100の防振処理やノイズリダクション処理なども行う。   The development processing unit 102 receives an RGB image signal from the sensor 101 and first performs RGB offset adjustment, gain adjustment, and gamma correction processing. The gamma correction is processed with characteristics for generating a recorded image desired by the video camera user in consideration of characteristics of the sensor 101 and the lens group 100. By adjusting the gamma curve, it is possible to generate a recorded image for display on a TV monitor and a recorded image that reproduces the texture and gradation of a movie film. Next, the RGB image signal is converted into a luminance signal (Y) and a color difference signal (Cb, Cr) and output. In addition, correction processing for lens distortion, image stabilization processing, noise reduction processing, and the like of the imaging apparatus 100 are also performed.

レンズ制御・ズーム量検出部103は、入射光量や合焦の調節制御を行い、また、ズーム倍率の制御を行う。なお、光学式ズームだけでなく、いわゆる画像処理による電子ズームを含めることもできる。ブロックサイズ配置決定部104は、レンズ制御・ズーム量検出部103からのズーム量情報を元に、符号化ブロックサイズと画面内ブロック分割を決定する。ブロック分割部105は、図2(A)に示すように画面を同じ大きさの第一の符号化ブロックに分割し、ブロックサイズ配置決定部104の指示に従い、図2(B)に示すように第一の符号化ブロックをさらに第二の符号化ブロックに分割して画像信号を出力する。HEVCでは第一の符号化ブロックをCoding Tree Unit(CTU)、第二の符号化ブロックをCoding Unit(CU)と呼ぶ。なお、HEVCにおいてCTUが取り得るブロックサイズには、64x64、32x32、16x16があり、CUが取り得るブロックサイズには、64x64、32x32、16x16、8x8がある。HEVCでは、動き補償処理、イントラ予測処理、直交変換処理、量子化処理、エントロピー符号化処理は、第二の符号化ブロック内で実行される。図2(A)では、64x64画素サイズのブロックが32x32画素サイズのブロックに4分割されている様子を示している。図2(B)では、32x32画素サイズのブロックが16x16画素サイズと8x8画素サイズのブロックに分割されている。   The lens control / zoom amount detection unit 103 performs adjustment control of the amount of incident light and focusing, and also controls zoom magnification. In addition to optical zoom, electronic zoom by so-called image processing can be included. Based on the zoom amount information from the lens control / zoom amount detection unit 103, the block size arrangement determination unit 104 determines the encoding block size and the intra-screen block division. The block division unit 105 divides the screen into first encoded blocks having the same size as shown in FIG. 2A, and follows the instruction of the block size arrangement determination unit 104 as shown in FIG. The first encoded block is further divided into second encoded blocks, and an image signal is output. In HEVC, the first coding block is called a coding tree unit (CTU), and the second coding block is called a coding unit (CU). Note that the block sizes that can be taken by the CTU in HEVC include 64 × 64, 32 × 32, and 16 × 16, and the block sizes that can be taken by the CU include 64 × 64, 32 × 32, 16 × 16, and 8 × 8. In HEVC, motion compensation processing, intra prediction processing, orthogonal transform processing, quantization processing, and entropy coding processing are executed in the second coding block. FIG. 2A shows a state in which a block of 64 × 64 pixel size is divided into four blocks of 32 × 32 pixel size. In FIG. 2B, a block of 32 × 32 pixel size is divided into a block of 16 × 16 pixel size and 8 × 8 pixel size.

予測部106は、ブロック分割105から入力された画像信号と、メモリ109に格納された後述する符号化済み画像信号から、画面内予測または動き検出を含む画面間予測処理のどちらか最適な予測方式を選択して予測差分信号を生成する。予測処理は、図2(C)に示すように、第二の符号化ブロックをさらに予測処理に最適なブロックサイズに分割して行う。HEVCでは予測処理の単位ブロックをPrediction Unit(PU)と呼ぶ。例えば、CUのサイズを2N×2Nとした場合、動き補償処理のためには2N×2N、2N×N、N×2N、N×N等のサイズを有するブロックパターンが選択される。また、イントラ予測処理の場合、2N×2N、N×N(N=4)のサイズを有するブロックパターンが選択される。図2(C)では、32x32画素サイズのブロックが、8x8、16x8、4x4の画素サイズのブロックに分割されている。   The prediction unit 106 uses an image signal input from the block division 105 and an encoded image signal (described later) stored in the memory 109, which is an optimal prediction method for either intra-screen prediction or inter-screen prediction processing including motion detection. Is selected to generate a prediction difference signal. As shown in FIG. 2C, the prediction process is performed by further dividing the second encoded block into a block size optimal for the prediction process. In HEVC, a unit block for prediction processing is called Prediction Unit (PU). For example, when the size of the CU is 2N × 2N, a block pattern having a size of 2N × 2N, 2N × N, N × 2N, N × N, or the like is selected for motion compensation processing. In the case of intra prediction processing, a block pattern having a size of 2N × 2N and N × N (N = 4) is selected. In FIG. 2C, a 32 × 32 pixel size block is divided into 8 × 8, 16 × 8, and 4 × 4 pixel size blocks.

変換・量子化部107は、図2(D)に示すように、第二の符号化ブロックをさらに変換処理に最適なブロックサイズに分割して直交変換処理及び量子化処理を行う。HEVCでは、これらの処理単位のブロックをTransform Unit(TU)と呼ぶ。HEVCにおいてTUが取り得るブロックサイズには、32x32、16x16、8x8、4x4の4種類がある。図2(D)では、32x32画素サイズのブロックが16x16、8x8、4x4の画素サイズのブロックに分割されている。直交変換された変換係数は、後述する符号量制御111から指示された量子化パラメータで量子化処理され、量子化データをエントロピー符号化110と局所復号部108に出力する。   As shown in FIG. 2D, the transform / quantization unit 107 further divides the second encoded block into a block size optimal for the transform process, and performs orthogonal transform processing and quantization processing. In HEVC, these processing unit blocks are called transform units (TU). There are four types of block sizes that can be taken by a TU in HEVC: 32 × 32, 16 × 16, 8 × 8, and 4 × 4. In FIG. 2D, a 32 × 32 pixel size block is divided into 16 × 16, 8 × 8, and 4 × 4 pixel size blocks. The orthogonally transformed transform coefficient is quantized with a quantization parameter instructed by a code amount control 111 described later, and the quantized data is output to the entropy coding 110 and the local decoding unit 108.

局所復号部108は、入力された量子化データに対して逆量子化処理、逆直交変換処理を順に行い、予測106から入力される予測画像を加算して復号化処理を行う。復号化データは、さらにループフィルタ処理を行い、メモリ109に格納する。   The local decoding unit 108 sequentially performs an inverse quantization process and an inverse orthogonal transform process on the input quantized data, adds the predicted image input from the prediction 106, and performs a decoding process. The decoded data is further subjected to loop filter processing and stored in the memory 109.

エントロピー符号化部110は、入力された量子化データに対して符号化パラメータの生起確率を近傍の符号化状態に基づいて動的に更新するCABAC(Context Adaptive Binary Arithmetic Coding)と呼ばれる算術符号化手法で二値データに変換する。符号量制御部111は、エントロピー符号化後の発生符号量を元に量子化パラメータを生成し、変換・量子化部107に供給する。以上の処理部により画像符号化装置が構成されている。   The entropy encoding unit 110 is an arithmetic encoding method called CABAC (Context Adaptive Binary Arithmetic Coding) that dynamically updates the occurrence probability of an encoding parameter for input quantized data based on a nearby encoding state. To convert to binary data. The code amount control unit 111 generates a quantization parameter based on the generated code amount after entropy coding, and supplies the quantization parameter to the transform / quantization unit 107. The above processing unit constitutes an image encoding device.

次に、図3のフローチャートを参照して、本実施形態におけるブロックサイズの決定処理を説明する。該フローチャートに対応する処理は、例えば、ブロックサイズ配置決定部104として機能するCPUが対応するプログラム(ROM等に格納)を実行することにより実現できる。   Next, block size determination processing in the present embodiment will be described with reference to the flowchart of FIG. The processing corresponding to the flowchart can be realized, for example, by executing a corresponding program (stored in a ROM or the like) by the CPU functioning as the block size arrangement determining unit 104.

まず、撮影が開始されると、S301において、レンズ制御・ズーム量検出部103がズーム量情報の値の変化に基づきズーム動作の有無を検出する。ズーム動作中であれば(S301で「YES」)、S302に移行する。一方、ズーム動作していない場合(S301で「NO」)、S305においてブロックサイズ配置決定部104に入力された画像から特徴抽出を行い、画像の特徴に応じたCU分割サイズと配置を決定し、その後、S306に移行する。   First, when shooting is started, in S301, the lens control / zoom amount detection unit 103 detects the presence or absence of a zoom operation based on a change in the value of zoom amount information. If the zoom operation is being performed (“YES” in S301), the process proceeds to S302. On the other hand, when the zoom operation is not performed (“NO” in S301), feature extraction is performed from the image input to the block size arrangement determination unit 104 in S305, and the CU division size and arrangement corresponding to the feature of the image are determined. Thereafter, the process proceeds to S306.

S305における処理につき、例えば、高周波成分の多い画像については、ブロックサイズを小さく設定し、高周波成分が少なく平坦な画像についてはブロックサイズを大きく設定することができる。また、使用する光学系との関連で入力画像中の情報欠損領域や光量落ち領域、歪曲の強い領域等が存在する場合、これらの領域についてはブロックサイズを大きく設定して符号量を削減することができる。なお、動きベクトルや量子化パラメータは、ブロックあたりに1つ含まれるので、ブロックサイズを大きくすると、細かく分割した場合と比較して動きベクトルや量子化パラメータの数を削減できるため、符号量を削減することができる。一方、ブロックサイズを細かくすると、各ブロックに適した動きベクトルや量子化幅を設定可能となる。このように、入力画像の特徴に応じた適切なブロックサイズを選択することで、符号化効率が向上し、高画質化した符号化ストリームを生成することができる。   Regarding the processing in S305, for example, the block size can be set small for an image with many high-frequency components, and the block size can be set large for a flat image with few high-frequency components. Also, if there are information loss areas, light loss areas, strong distortion areas, etc. in the input image in relation to the optical system to be used, the block size should be set large for these areas to reduce the code amount. Can do. In addition, since one motion vector and quantization parameter are included per block, if the block size is increased, the number of motion vectors and quantization parameters can be reduced compared to the case of finely dividing, thus reducing the amount of codes. can do. On the other hand, if the block size is made fine, a motion vector and a quantization width suitable for each block can be set. Thus, by selecting an appropriate block size according to the characteristics of the input image, it is possible to improve the encoding efficiency and generate an encoded stream with high image quality.

S302からS304では、ズーム量情報の値の変動に基づくズーム変動速度を所定の閾値と比較してズーム変動速度の「速さ」を判定し、判定結果に応じてCU分割サイズと配置を変更する。一般にズーム動作は、特定画素または特定画像領域を中心として同心円方向に画像を拡大、縮小する動作であって、ズーム中心となる領域がユーザの関心領域となっている。但し、関心領域をユーザが感心のある被写体が撮影されている領域として捉えた場合、ズームの倍率に応じて被写体が画像に占める割合が変化するため、それに応じて関心領域の大きさも変わる。動画像の生成・記録処理においては、関心領域の画像の品質を高く保ち、関心領域以外の周辺領域については画像の品質よりも符号化効率を優先してもよく、当該思想に基づき画像内でブロックサイズの割当を決定できる。しかし、ズーム変動速度によってはユーザが画質を認識しにくい場合があるため、かならずしも上記の基本的なブロック割当パターンを採用しなくてもよい。本実施形態では、この点に着目し、ズーム変動速度に応じて大きなブロックサイズを適応的に割り当てる手法を採用している。     In S302 to S304, the zoom variation speed based on the variation in the value of the zoom amount information is compared with a predetermined threshold to determine the “speed” of the zoom variation speed, and the CU partition size and arrangement are changed according to the determination result. . In general, the zoom operation is an operation of enlarging or reducing an image in a concentric direction around a specific pixel or a specific image region, and the region that is the center of zoom is the region of interest of the user. However, when the region of interest is regarded as a region where a subject that the user is impressed with is captured, the ratio of the subject to the image changes according to the zoom magnification, and the size of the region of interest also changes accordingly. In the generation / recording process of the moving image, the quality of the image of the region of interest may be kept high, and the encoding efficiency may be prioritized over the quality of the image in the peripheral region other than the region of interest. Block size allocation can be determined. However, since it may be difficult for the user to recognize the image quality depending on the zoom fluctuation speed, the above basic block allocation pattern may not necessarily be adopted. In this embodiment, paying attention to this point, a method of adaptively allocating a large block size according to the zoom fluctuation speed is adopted.

具体的に、ズーム変動速度が該閾値以上で、所定の速度以上となる場合にズーム動作が「速い」と判定でき(S302で「YES」)、S303において、図5(A)の中段に示す図のように、画像全体を最大サイズ(64x64画素サイズ)のCUで分割する。これは、ズーム動作が速い場合、画像を認識することは難しく、また、品質の良い画像を記録することも困難であり、なるべく符号化効率を高めるためにCUサイズを大きく設定するためである。   Specifically, when the zoom fluctuation speed is equal to or higher than the threshold and equal to or higher than the predetermined speed, the zoom operation can be determined to be “fast” (“YES” in S302), and in S303, the middle stage of FIG. As shown in the figure, the entire image is divided by the CU having the maximum size (64 × 64 pixel size). This is because when the zoom operation is fast, it is difficult to recognize an image and it is difficult to record a high-quality image, and the CU size is set to be as large as possible in order to increase the encoding efficiency as much as possible.

一方、ズーム変動速度が閾値より小さい場合にズーム動作が「遅い」とできる(S302で「NO」)。この場合S304において図5(B)のズーム開始時点の図で示すように画像中心部分を細かいCUサイズ、画像周辺を粗いCUサイズとなるようブロックサイズ配置決定部104とブロック分割部105でブロック分割処理を行う。例えば、画像中心部分は最小のCUサイズとし、それ以外を残りのCUサイズとすることができる。ズーム動作が遅い場合、ユーザは画像を認識をすることが可能である。そして、ズーム中心はユーザにとって意味のある関心領域であるので品質の良い画像を記録すべくブロックサイズを小さくする。その一方、周辺領域はズームインにより撮像範囲から消えていったり、撮像範囲に新たに含まれることになる部分であるが、中心部分と比べると画像が変動する割合も高くユーザにとっては重要度が低いと推定される。そこで、周辺画素で構成される領域については符号化効率を高めるためにCUサイズを大き目に設定する。ブロック分割処理の後、S306に移行する。   On the other hand, when the zoom fluctuation speed is smaller than the threshold, the zoom operation can be “slow” (“NO” in S302). In this case, the block size arrangement determining unit 104 and the block dividing unit 105 perform block division so that the center portion of the image has a fine CU size and the periphery of the image has a coarse CU size as shown in the zoom start point in FIG. Process. For example, the center portion of the image can be the minimum CU size, and the rest can be the remaining CU size. When the zoom operation is slow, the user can recognize the image. Since the zoom center is a meaningful region of interest for the user, the block size is reduced to record a high-quality image. On the other hand, the peripheral area is a part that disappears from the imaging range due to zooming in or is newly included in the imaging range, but the rate of change of the image is high compared to the central part and is less important for the user. It is estimated to be. Therefore, the CU size is set to a large size in order to increase the coding efficiency for the area composed of the peripheral pixels. After block division processing, the process proceeds to S306.

図5(A)及び(B)について詳細に説明しておくと、ズームイン又はズームアウトの開始時点、終了時点においてはズーム動作が遅くなるため、画像中心部分を細かいCUサイズ、画像周辺を粗いCUサイズとなる第1のパターンで分割を行う。そして、ズーム動作継続中のズーム変動速度に応じてそのまま第1のパターンで分割を行うか、或いは、ズーム変動速度が速い場合には全体を最大サイズのCUで均一に分割する第2のパターンを採用する。なお、第2のパターンについて、全体を均一に分割するパターンに限定されることなく、例えば周辺を最大サイズで分割し、中心部分を2番目に大きいサイズのブロックで分割する(第3のパターン)ようにしてもよい。   Referring to FIGS. 5A and 5B in detail, the zoom operation is slow at the start and end of zoom-in or zoom-out, so that the center of the image is a fine CU size and the periphery of the image is a coarse CU. The division is performed with the first pattern having the size. Then, the first pattern is divided as it is according to the zoom fluctuation speed during the zoom operation, or when the zoom fluctuation speed is high, the second pattern is uniformly divided by the maximum size CU. adopt. It should be noted that the second pattern is not limited to a pattern that uniformly divides the whole, for example, the periphery is divided by the maximum size, and the central portion is divided by the second largest block (third pattern). You may do it.

このような第3のパターンは、ズーム動作の速度を判定する際に用いる閾値を細分化して、他のパターンと併用して段階的にパターンを切り替えるために用いてもよい。例えば、ズーム動作速度を3つの速度領域に分類し、最も遅い速度領域に属する場合には第1のパターンを採用する。次に、2番目に遅い(中央の)速度領域に属する場合には、上記第3のパターンを採用することができる。さらに、一番速い速度領域に属する場合には第2のパターンを採用することができる。   Such a third pattern may be used for subdividing the threshold used when determining the speed of the zoom operation and switching the pattern stepwise in combination with other patterns. For example, the zoom operation speed is classified into three speed areas, and the first pattern is adopted when belonging to the slowest speed area. Next, in the case of belonging to the second slowest (central) speed region, the third pattern can be adopted. Further, the second pattern can be adopted when belonging to the fastest speed region.

また、CUが取り得るサイズは64x64、32x32、16x16、8x8の4種類であるので、第1のパターンにおいては4種類全てを使用して、ズームの中心から周辺に向かってブロックサイズが増加していくようにパターンを設定してもよい。一方、ズーム動作の速度が上昇するに従い、使用するブロックサイズの数をサイズの小さい方から減らしていき、ズーム変動速度を4段階に分けてパターンを設定してもよい。この場合、ズーム変動速度が最も遅い速度領域では4種類全てのブロックサイズを使用する一方、変動速度が上昇するにつれて8x8、16x16、32x32の順で使用されなくなり、最終的に64x64のみとなる。   In addition, since the CU can take four sizes of 64x64, 32x32, 16x16, and 8x8, all four types are used in the first pattern, and the block size increases from the center of the zoom toward the periphery. The pattern may be set as it goes. On the other hand, as the speed of the zoom operation increases, the number of block sizes to be used may be reduced from the smaller size, and the zoom variation speed may be divided into four stages to set the pattern. In this case, all four types of block sizes are used in the speed region in which the zoom fluctuation speed is the slowest, but as the fluctuation speed rises, they are not used in the order of 8 × 8, 16 × 16, and 32 × 32, and finally only 64 × 64.

S306では、分割されたCUを元に予測部106が予測処理を行う。まずは画面内予測及び動き検出を含む画面間予測処理のうち、いずれか一方の予測方式を選択し、PUサイズを決定する。予測方式の選択基準は、例えば各予測方式における予測誤差がより小さくなる方式とすることができる。画面内予測の場合のPUサイズは、CUと同じサイズまたは4分割したサイズである。一方の画面間予測の場合、CU内部を不均一に矩形分割することによってCU内に異なる動き領域が混在する場合の予測効率を高めることができるので、動きベクトルの探索結果からPUサイズを決定する。次に、選択した予測方式とPUサイズに基づいて予測差分信号を生成する。   In S306, the prediction unit 106 performs prediction processing based on the divided CU. First, one of prediction methods is selected from among inter-screen prediction processes including intra-screen prediction and motion detection, and a PU size is determined. As a selection criterion for the prediction method, for example, a method in which a prediction error in each prediction method becomes smaller can be used. The PU size in the case of intra prediction is the same size as CU or a size divided into four. In the case of one inter-screen prediction, it is possible to improve prediction efficiency when different motion regions are mixed in a CU by dividing the inside of the CU into non-uniform rectangles, so the PU size is determined from the motion vector search result. . Next, a prediction difference signal is generated based on the selected prediction method and PU size.

次にS307において、分割されたCUに基づき変換・量子化部107で直交変換処理と量子化処理を行う。変換・量子化部107は、入力された予測差分信号の局所的な性質に応じて変換符号化効率が高まるようにTUサイズを決定する。HEVCでは、CUを元にしてTUサイズを決めるモードと、PUサイズを元にしてTUサイズを決めるモードとがある。変換・量子化部107は、選択したTUサイズに基づきまずは直交変換処理を行い、変換係数を算出する。次に、変換係数を量子化パラメータに応じて量子化することによって情報量を圧縮する。次にS308において、エントロピー符号化部110がCABAC手法で符号化データを生成する。以上のS301からS308までの処理は、ズーム動作中は繰り返して実行される(S309で「NO」)。   In step S307, the transform / quantization unit 107 performs orthogonal transform processing and quantization processing based on the divided CU. The transform / quantization unit 107 determines the TU size so that transform coding efficiency is increased according to the local nature of the input prediction difference signal. In HEVC, there are a mode for determining the TU size based on the CU and a mode for determining the TU size based on the PU size. The transform / quantization unit 107 first performs orthogonal transform processing based on the selected TU size, and calculates transform coefficients. Next, the amount of information is compressed by quantizing the transform coefficient according to the quantization parameter. Next, in S308, the entropy encoding unit 110 generates encoded data by the CABAC method. The above processes from S301 to S308 are repeatedly executed during the zoom operation (“NO” in S309).

なお、ズーム動作時のCUサイズと分割配置は、図5(A)や(B)に示すようにズーム動作開始時点と終了時点とで同じでもよいし、図5(C)や(D)に示すようにズーム動作開始時点と終了時点とで変更してもよい。   It should be noted that the CU size and the divided arrangement during the zoom operation may be the same at the zoom operation start time and end time as shown in FIGS. 5A and 5B, or in FIGS. 5C and 5D. As shown, the zoom operation start time and end time may be changed.

図5(C)、(D)に示す例では、ズームイン後又はズームアウト前の分割配置において画像の中心部にサイズの小さいブロックをより多く割り当てている。これは、ズームイン後やズームアウト前はユーザの関心領域が画像の中心部分に拡大表示されることとなるので、拡大された関心領域についてより細かいブロックを割り当てて符号化を行って高品質の画像を提供するためである。一方、ズームイン前又はズームアウト後の分割配置において小さいブロックの割当て数が減少している。これは、ズームイン前やズームアウト後はユーザの関心領域が画像の中心部分に相対的に縮小表示されることとなるので、関心領域が画像全体に占める割合が減った分、関心領域に割り当てられる細かいブロックの数が減り、その周辺画素には符号化効率を考慮してよりサイズ大きいサイズのブロックが割り当てられることとなる。   In the example shown in FIGS. 5C and 5D, more small blocks are allocated to the center of the image in the divided arrangement after zooming in or before zooming out. This is because the user's region of interest is enlarged and displayed in the center of the image after zooming in and before zooming out, so that a high-quality image is assigned by assigning smaller blocks to the enlarged region of interest for encoding. Is to provide. On the other hand, the number of small blocks allocated is reduced in the divided arrangement before zooming in or after zooming out. This is because the user's region of interest is reduced relative to the center of the image before zooming in or after zooming out, so that the proportion of the region of interest in the entire image is reduced and assigned to the region of interest. The number of fine blocks is reduced, and a block having a larger size is assigned to the surrounding pixels in consideration of encoding efficiency.

以上の本実施形態によれば、撮像装置100でHEVC方式により動画像の予測符号化を行って画像記録を行う際に、ズーム動作のズーム変動速度に応じて適応的に符号化ブロック分割パターンを決定することができる。これにより、ズーム動作の制御状況に応じた品質の動画像を生成して画質の向上を図りつつ、同時に符号化効率を向上させることができる。   According to the present embodiment described above, when the image capturing apparatus 100 performs predictive encoding of a moving image by the HEVC method and performs image recording, an encoded block division pattern is adaptively set according to the zoom fluctuation speed of the zoom operation. Can be determined. As a result, it is possible to generate a moving image having a quality according to the control state of the zoom operation and improve the image quality, and at the same time improve the encoding efficiency.

[実施形態2]
次に発明の第2の実施形態(実施形態2)について説明する。上記実施形態1では、撮影により生成される動画像の変動がズーム動作に基づく場合に、ズーム変動速度に基づき符号化ブロック分割方法を決定した。これに対し本実施形態2では、符号化ブロック分割方法の決定を被写体が動画像内で移動する移動速度に応じて行う場合について説明する。当該被写体の移動は撮像装置100としてのデジタルカメラまたはデジタルビデオカメラのパニング動作や、チルト動作、或いは被写体自体の移動に基づくものである。以下の本実施形態の説明では、特にパニング動作に基づく被写体の移動を例にして説明する。なお、パニング動作とチルト動作とは動作方向が、水平方向の動作であるパニング動作に対し、チルト動作は垂直動作である点を除けば基本的には同じである。また、被写体自体の移動も、撮像装置100と被写体との相対的な位置関係の変化という意味でパニング動作やチルト動作と同様である。よって、以下に説明する本実施形態はチルト動作や被写体自体が移動する場合にも適用が可能である。
[Embodiment 2]
Next, a second embodiment (Embodiment 2) of the invention will be described. In Embodiment 1 described above, when the variation of the moving image generated by shooting is based on the zoom operation, the coding block division method is determined based on the zoom variation speed. On the other hand, in the second embodiment, a case will be described in which the coding block division method is determined according to the moving speed at which the subject moves in the moving image. The movement of the subject is based on the panning operation, tilt operation, or movement of the subject itself of the digital camera or digital video camera as the imaging apparatus 100. In the following description of the present embodiment, the movement of the subject based on the panning operation will be described as an example. The panning operation and the tilt operation are basically the same except that the tilting operation is a vertical operation, whereas the panning operation is a horizontal operation. The movement of the subject itself is the same as the panning operation and the tilt operation in the sense that the relative positional relationship between the imaging device 100 and the subject changes. Therefore, the present embodiment described below can also be applied when the tilting operation or the subject itself moves.

まず、図1(B)を参照して本実施形態に対応する撮像装置100の構成及び動作を説明する。図1(B)は、実施形態2に対応する撮像装置100の機能構成の一例を示す図である。実施形態1と異なる機能ブロックはパニング・チルト検出部113だけであるので、本実施形態では他の構成ブロックの説明を省略する。図1(B)の撮像装置100におけるパニング・チルト検出部113は、撮像装置100の揺れをジャイロセンサ(角速度センサ)などによって検出し、撮像装置100の振動に基づき水平方向のパニング動作や、垂直方向のチルト動作を検出することができる。   First, the configuration and operation of the imaging apparatus 100 corresponding to the present embodiment will be described with reference to FIG. FIG. 1B is a diagram illustrating an example of a functional configuration of the imaging apparatus 100 corresponding to the second embodiment. Since only the panning / tilt detector 113 is a functional block different from that of the first embodiment, the description of other constituent blocks is omitted in this embodiment. A panning / tilt detection unit 113 in the imaging apparatus 100 in FIG. 1B detects shaking of the imaging apparatus 100 by a gyro sensor (angular velocity sensor) or the like, and performs a panning operation in the horizontal direction based on the vibration of the imaging apparatus 100 or a vertical direction. It is possible to detect a tilting operation in the direction.

次に、本実施形態の特徴であるブロック構成に関して図4の動作タイミングチャートに従いながら説明する。該フローチャートに対応する処理は、例えば、ブロックサイズ配置決定部104として機能するCPUが対応するプログラム(ROM等に格納)を実行することにより実現できる。   Next, a block configuration that is a feature of the present embodiment will be described with reference to an operation timing chart of FIG. The processing corresponding to the flowchart can be realized, for example, by executing a corresponding program (stored in a ROM or the like) by the CPU functioning as the block size arrangement determining unit 104.

まず撮影が開始されるとS401において、パニング・チルト検出部113がパニング動作の有無とパニング方向を検出する。これは被写体の移動を検出することと実質的に同義である。このとき合わせて、パニング動作におけるパニング変動速度(撮像装置100の水平方向での移動速度)を測定しておく。なお、当該パニング変動速度は被写体の画像内での移動速度と見なすこともできる。当該パニング動作の有無及び方向の検出方法や変動速度の計測方法は公知の手法を用いればよいので、ここでの詳細な説明は省略する。パニング動作中であれば(S401で「YES」)、S402に移行する。一方、パニング動作していない場合(S401で「NO」)、S405において、ブロックサイズ配置決定部104に入力された画像から特徴抽出を行い、画像の特徴に応じたCU分割サイズと配置を決定する。当該抽出された特徴に応じたブロックサイズの決定処理の内容は、S305におけるものと同様である。その後S406に移行する。   First, when shooting is started, in step S401, the panning / tilt detection unit 113 detects the presence / absence of a panning operation and the panning direction. This is substantially synonymous with detecting movement of the subject. At the same time, the panning fluctuation speed (moving speed in the horizontal direction of the imaging apparatus 100) in the panning operation is measured in advance. Note that the panning fluctuation speed can be regarded as a movement speed of the subject in the image. Since a known method may be used as a method for detecting the presence / absence and direction of the panning operation and a method for measuring the fluctuation speed, a detailed description thereof is omitted here. If the panning operation is being performed (“YES” in S401), the process proceeds to S402. On the other hand, when the panning operation is not performed (“NO” in S401), in S405, feature extraction is performed from the image input to the block size arrangement determining unit 104, and the CU partition size and arrangement corresponding to the image feature are determined. . The contents of the block size determination process corresponding to the extracted features are the same as those in S305. Thereafter, the process proceeds to S406.

S402からS404では、パニング変動速度を所定の閾値と比較して、パニング変動速度の「速さ」を判定し、判定結果に応じてCU分割サイズと配置を変更する。一般にパニング動作は、画面全体が水平方向(右方向、または、左方向)に移動する動作であって、新たに画像内に登場する被写体が写っている領域がユーザの関心領域となる。よって、パニングの方向の側、即ち、右方向にパンしている場合には画像の右側の領域、左方向にパンしている場合には画像の左側の領域の画像の品質を高く保ち、逆側の領域については画像の品質よりも符号化効率を優先してもよい。基本的にはこのような思想に基づき、画像内でブロックサイズを割り当てることができる。しかし、パニング変動速度によってはユーザが画質を認識しにくい場合があるため、かならずしも上記の基本的なブロック割当パターンを採用しなくてもよい。本実施形態では、この点に着目し、パニング変動速度に応じて大きなブロックサイズを適応的に割り当てる手法を採用している。   In S402 to S404, the panning fluctuation speed is compared with a predetermined threshold to determine the “speed” of the panning fluctuation speed, and the CU partition size and arrangement are changed according to the determination result. In general, the panning operation is an operation in which the entire screen moves in the horizontal direction (right direction or left direction), and a region in which a subject newly appearing in the image is captured is a user's region of interest. Therefore, when panning in the panning direction, that is, when panning to the right, the image quality on the right side of the image is kept high. For the area on the side, encoding efficiency may be prioritized over image quality. Basically, a block size can be assigned in an image based on such a concept. However, since it may be difficult for the user to recognize the image quality depending on the panning fluctuation speed, it is not always necessary to adopt the above basic block allocation pattern. In the present embodiment, paying attention to this point, a method of adaptively allocating a large block size according to the panning fluctuation speed is adopted.

具体的にパニング変動速度が該閾値以上で、所定の速度以上の場合にパニング動作が「速い」と判定でき(S402で「YES」)、S403において図6(C)で示すように、画像全体を最大サイズ(64x64画素サイズ)のCUで分割する。これは、パニング動作が速い場合は、画像を認識することは難しく品質の良い画像を記録することも困難であり、なるべく符号化効率を高めるためにCUサイズを大きく設定するためである。   Specifically, when the panning fluctuation speed is equal to or higher than the threshold and is equal to or higher than the predetermined speed, it is possible to determine that the panning operation is “fast” (“YES” in S402), and in S403, as shown in FIG. Is divided by the CU having the maximum size (64 × 64 pixel size). This is because, when the panning operation is fast, it is difficult to recognize an image and it is difficult to record a high-quality image, and the CU size is set to be as large as possible in order to increase the encoding efficiency as much as possible.

一方、パニング変動速度が閾値より小さい場合にパニング動作が「遅い」と判定できる(S402で「NO」)。この場合S404において、左にパニング動作中であれば図6(A)で示すように画像左側部分を細かいCUサイズとし、右側に向かうにつれてCUサイズを大きくしていく。そして、画面から消えていく画像右側部分がより粗いCUサイズとなるようにブロックサイズ配置決定部104とブロック分割部105でブロック分割処理を行う。また、右にパニング動作中であれば、S404において図6(B)で示すように画像右部分を細かいCUサイズとし、左側に向かうにつれてCUサイズを大きくしていく。そして、画面から消えていく画像左側部分がより粗いCUサイズとなるようにブロックサイズ配置決定部104とブロック分割部105でブロック分割処理を行う。このようにパニング動作では、画面に新たに現れる(入ってくる)被写体像がユーザにとって意味のある関心領域であるので、品質の良い画像を記録すべくブロックサイズを小さくする。その一方、画面から消えていく被写体像はユーザにとっては重要度が高くないので、符号化効率を高めるためにCUサイズを大き目に設定する。   On the other hand, when the panning fluctuation speed is smaller than the threshold, the panning operation can be determined to be “slow” (“NO” in S402). In this case, in S404, if the panning operation is being performed to the left, the left portion of the image is set to a fine CU size as shown in FIG. 6A, and the CU size is increased toward the right side. Then, the block size arrangement determining unit 104 and the block dividing unit 105 perform block division processing so that the right part of the image disappearing from the screen has a coarser CU size. If the panning operation is being performed to the right, the right portion of the image is set to a fine CU size as shown in FIG. 6B in S404, and the CU size is increased toward the left side. Then, the block size arrangement determining unit 104 and the block dividing unit 105 perform block division processing so that the left portion of the image disappearing from the screen has a coarser CU size. As described above, in the panning operation, a subject image newly appearing (entering) on the screen is a region of interest meaningful to the user, so the block size is reduced to record a high-quality image. On the other hand, since the subject image disappearing from the screen is not important for the user, the CU size is set to a large size in order to increase the encoding efficiency.

図6(A)及び(B)について更に説明すると、ここでは一例としてCUサイズを3段階で変化させているが、CUが取り得るサイズは64x64、32x32、16x16、8x8の4種類であるので4段階に分けてもよい。その場合、例えば右方向にパニングしている場合画像の右側領域を8x8のCUサイズで分割し、左側領域に向かうに従ってCUサイズを16x16、32x32、64x64と増加させていくことができる。   6 (A) and 6 (B) will be further described. In this example, the CU size is changed in three stages as an example, but the CU can take four sizes of 64 × 64, 32 × 32, 16 × 16, and 8 × 8. It may be divided into stages. In this case, for example, when panning in the right direction, the right area of the image can be divided into 8 × 8 CU sizes, and the CU size can be increased to 16 × 16, 32 × 32, and 64 × 64 toward the left area.

また、CUサイズを変化させる段階は例えばパニング変動速度に応じて異ならせてもよい。例えば、パニング変動速度が遅い場合には画像の内容をより把握しやすくなるため、CUサイズの変化を滑らかにすべく4種類の全てのサイズを用いてブロック分割を行うことができる。一方、パニング変動速度が速くなって行くに従い画像の内容の把握が難しくなっていくため、使用するCUサイズの種類を減らすことができる。その際、より小さいCUサイズ(最初は最小の8x8画素サイズ)から省略していき、最終的に最大のサイズ(64x64画素サイズ)のみを使うようにしてもよい。これはパニング動作の速度を判定する際に用いる閾値を細分化して、パニング動作速度を複数の速度領域に分類することで実現できる。例えば、閾値を3つ用意して4つの速度領域を設定した場合、速度の遅い順に4種類、3種類、2種類、1種類とすることができる。   Further, the step of changing the CU size may be varied depending on the panning fluctuation speed, for example. For example, when the panning fluctuation speed is slow, it becomes easier to grasp the contents of the image, so that the block division can be performed using all four kinds of sizes in order to smooth the change of the CU size. On the other hand, since it becomes difficult to grasp the contents of the image as the panning fluctuation speed increases, the types of CU sizes to be used can be reduced. At that time, it may be omitted from the smaller CU size (initially the minimum 8 × 8 pixel size), and finally only the maximum size (64 × 64 pixel size) may be used. This can be realized by subdividing the threshold used when determining the speed of the panning operation and classifying the panning operation speed into a plurality of speed regions. For example, when three threshold values are prepared and four speed regions are set, the number can be set to four types, three types, two types, and one type in order of increasing speed.

以降、S406からS409までの処理は図3のS306からS309までの処理と同様であるので説明を省略する。以上のS401からS408までの処理は、パニング動作中は繰り返して実行される(S409で「NO」)。   Hereinafter, the processing from S406 to S409 is the same as the processing from S306 to S309 in FIG. The processes from S401 to S408 are repeatedly executed during the panning operation (“NO” in S409).

なお、本実施形態のCU分割方法は、ビデオカメラがパンやチルト動作により撮像装置100の移動が検出された場合だけでなく、被写体自体の動きに応じて実行してもよい。例えば、HEVCにおける動き補償のために動き検出を行う場合、検出された動きベクトルの大きさを上記のパニング動作の変動速度の大きさと同様に扱うことで上記分割処理を実施することができる。この場合、動きベクトルにより特定される被写体の動きが左方向の場合に図6(A)に示すCU分割パターンを適用することができる。同様に、動きベクトルにより特定される被写体の動きが右方向の場合に図6(B)に示すCU分割パターンを適用することができる。   Note that the CU division method according to the present embodiment may be executed not only when the video camera detects movement of the imaging apparatus 100 by panning or tilting operation but also according to the movement of the subject itself. For example, when motion detection is performed for motion compensation in HEVC, the division process can be performed by treating the magnitude of the detected motion vector in the same manner as the magnitude of the fluctuation speed of the panning operation. In this case, the CU division pattern shown in FIG. 6A can be applied when the motion of the subject specified by the motion vector is in the left direction. Similarly, when the motion of the subject specified by the motion vector is rightward, the CU division pattern shown in FIG. 6B can be applied.

以上の本実施形態によれば、撮像装置100でHEVC方式により動画像の予測符号化を行って画像記録を行う際に、パニング動作やチルト動作における変動速度や、被写体の移動速度に応じて適応的に符号化ブロック分割パターンを決定することができる。また、撮像装置100が斜めの方向に移動した場合であっても、上記と同様にして移動方向に応じて分割ブロックサイズを決定することができる。これにより、撮像装置100或いは被写体自体が移動する場合であっても画質の向上を図りつつ、同時に符号化効率を向上させることができる。   According to the above-described embodiment, when the image capturing apparatus 100 performs predictive coding of a moving image by the HEVC method and performs image recording, the image capturing apparatus 100 is adapted according to the fluctuation speed in the panning operation and the tilt operation and the moving speed of the subject. Thus, the coding block division pattern can be determined. Even when the imaging apparatus 100 moves in an oblique direction, the divided block size can be determined according to the moving direction in the same manner as described above. As a result, even when the imaging apparatus 100 or the subject itself moves, it is possible to improve the coding efficiency while improving the image quality.

(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other examples)
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.

Claims (18)

被写体を撮像して得られた動画像を複数のブロックに分割してブロックごとに符号化する撮像装置であって、
前記動画像を分割するブロックサイズを複数のブロックサイズのうちから決定する決定手段と、
前記決定されたブロックサイズにより前記動画像を分割する分割手段と、
前記分割されたブロックごとに符号化処理を行う符号化手段と
を備え、
前記決定手段は前記動画像における画像の変動の大きさに応じて、前記動画像における該撮像装置のユーザの関心領域を分割するためのブロックサイズを該関心領域以外の領域を分割するためのブロックサイズも小さいサイズとする第1のパターンと、前記動画像を前記複数のブロックサイズのうち最大のブロックサイズにより分割する第2のパターンとで切り替えて、前記動画像を分割するブロックサイズを決定することを特徴とする撮像装置。
An imaging device that divides a moving image obtained by imaging a subject into a plurality of blocks and encodes each block,
Determining means for determining a block size for dividing the moving image from a plurality of block sizes;
Dividing means for dividing the moving image according to the determined block size;
Encoding means for performing an encoding process for each of the divided blocks,
The determining unit is configured to divide a region other than the region of interest into a block size for dividing the region of interest of the user of the imaging device in the moving image according to the magnitude of image variation in the moving image. The block size for dividing the moving image is determined by switching between the first pattern having a small size and the second pattern for dividing the moving image by the maximum block size among the plurality of block sizes. An imaging apparatus characterized by that.
前記画像の変動の大きさは、前記被写体を撮像する際にズーム動作が実行されていた場合、該ズーム動作の変動速度に基づき、
前記決定手段は、
前記変動速度が所定の速度以上の場合に前記第2のパターンに基づき前記ブロックサイズを決定し、
前記変動速度が前記所定の速度より小さい場合に前記第1のパターンに基づき前記ブロックサイズを決定する
ことを特徴とする請求項1に記載の撮像装置。
The magnitude of the fluctuation of the image is based on the fluctuation speed of the zoom operation when the zoom operation is performed when the subject is imaged.
The determining means includes
Determining the block size based on the second pattern when the fluctuation speed is equal to or higher than a predetermined speed;
The imaging apparatus according to claim 1, wherein the block size is determined based on the first pattern when the fluctuation speed is smaller than the predetermined speed.
前記決定手段は、前記第1のパターンにおけるブロックサイズを決定する場合に、前記ズーム動作におけるズーム中心を前記関心領域とすることを特徴とする請求項2に記載の撮像装置。   The imaging apparatus according to claim 2, wherein the determination unit determines a center of zoom in the zoom operation as the region of interest when determining a block size in the first pattern. 前記決定手段は前記第1のパターンにおいて、
前記関心領域を分割するためのブロックサイズを前記複数のブロックサイズのうち最小のブロックサイズとし、
前記関心領域以外の領域を分割するためのブロックサイズを、画像の周辺に行くに従って、前記最小のブロックサイズを除く前記複数のブロックサイズの中で、より大きなブロックサイズとすることを特徴とする請求項3に記載の撮像装置。
In the first pattern, the determining means is
The block size for dividing the region of interest is the minimum block size among the plurality of block sizes,
The block size for dividing the region other than the region of interest is set to a larger block size among the plurality of block sizes excluding the minimum block size as it goes to the periphery of the image. Item 4. The imaging device according to Item 3.
前記決定手段は前記第1のパターンにおいて、
前記関心領域以外の領域を分割するためのブロックサイズに、前記複数のブロックサイズのうち少なくとも前記最大のブロックサイズが含まれるようにし、
前記関心領域を分割するためのブロックサイズを、前記複数のブロックサイズのうち前記関心領域以外の領域に割り当てられていないブロックサイズのうち、より大きいブロックサイズとすることを特徴とする請求項3に記載の撮像装置。
In the first pattern, the determining means is
The block size for dividing the region other than the region of interest includes at least the maximum block size among the plurality of block sizes,
The block size for dividing the region of interest is set to a larger block size among block sizes not allocated to regions other than the region of interest among the plurality of block sizes. The imaging device described.
前記決定手段は、前記関心領域以外の領域を分割するためのブロックサイズを、画像の周辺に行くに従ってより大きなブロックサイズとすることを特徴とする請求項5に記載の撮像装置。   The imaging apparatus according to claim 5, wherein the determining unit sets a block size for dividing an area other than the region of interest to a larger block size as going to the periphery of the image. 前記決定手段は前記第1のパターンにおいて、前記変動速度が遅くなるにつれ、前記関心領域を分割するためのブロックサイズを前記複数のブロックサイズの中で、より小さいブロックサイズとすることを特徴とする請求項2乃至6のいずれか1項に記載の撮像装置。   In the first pattern, the determining unit sets a block size for dividing the region of interest to a smaller block size among the plurality of block sizes as the fluctuation speed becomes slower. The imaging device according to any one of claims 2 to 6. 前記決定手段は、前記ズーム動作が終了した場合に、前記第1のパターンに基づいて、前記動画像を分割するブロックサイズを決定することを特徴とする請求項2乃至7のいずれか1項に記載の撮像装置。   The said determination means determines the block size which divides | segments the said moving image based on a said 1st pattern, when the said zoom operation | movement is complete | finished. The imaging device described. 前記ズーム動作がズームイン動作である場合、前記決定手段は、前記ズームイン動作の終了時点における前記第1のパターンにおける前記関心領域の大きさを、前記ズームイン動作の開始時点における前記関心領域の大きさよりも大きく設定し、
前記ズーム動作がズームアウト動作である場合、前記決定手段は、前記ズームアウト動作の開始時点における前記第1のパターンにおける前記関心領域の大きさを、前記ズームアウト動作の終了時点における前記関心領域の大きさよりも大きく設定する
ことを特徴とする請求項2乃至8のいずれか1項に記載の撮像装置。
When the zoom operation is a zoom-in operation, the determining means sets the size of the region of interest in the first pattern at the end of the zoom-in operation to be larger than the size of the region of interest at the start of the zoom-in operation. Set larger,
In the case where the zoom operation is a zoom-out operation, the determining means determines the size of the region of interest in the first pattern at the start time of the zoom-out operation, and the size of the region of interest at the end time of the zoom-out operation. The imaging apparatus according to claim 2, wherein the imaging apparatus is set to be larger than the size.
前記画像の変動の大きさは、前記動画像における被写体の移動の速度に基づき、
前記決定手段は前記第1のパターンにおいて、
前記被写体の移動速度が所定の速度以上の場合に前記第2のパターンに基づき前記ブロックサイズを決定し、
前記被写体の移動速度が前記所定の速度より小さい場合に前記第1のパターンに基づき前記ブロックサイズを決定する
ことを特徴とする請求項1に記載の撮像装置。
The magnitude of the fluctuation of the image is based on the moving speed of the subject in the moving image,
In the first pattern, the determining means is
Determining the block size based on the second pattern when the moving speed of the subject is equal to or higher than a predetermined speed;
The imaging apparatus according to claim 1, wherein the block size is determined based on the first pattern when a moving speed of the subject is smaller than the predetermined speed.
前記決定手段は、前記第1のパターンにおけるブロックサイズを決定する場合に、前記動画像において前記被写体の移動方向に基づき被写体が前記動画像に現れる側の領域を前記関心領域とすることを特徴とする請求項10に記載の撮像装置。   The determining means, when determining a block size in the first pattern, sets a region on the side where the subject appears in the moving image based on the moving direction of the subject as the region of interest in the moving image. The imaging device according to claim 10. 前記決定手段は前記第1のパターンにおいて、
前記関心領域を分割するためのブロックサイズを前記複数のブロックサイズのうち最小のブロックサイズとし、
前記関心領域以外の領域を分割するためのブロックサイズを、前記関心領域から離れるに従って、前記最小のブロックサイズを除く前記複数のブロックサイズの中で、より大きなブロックサイズとすることを特徴とする請求項11に記載の撮像装置。
In the first pattern, the determining means is
The block size for dividing the region of interest is the minimum block size among the plurality of block sizes,
The block size for dividing a region other than the region of interest is set to a larger block size among the plurality of block sizes excluding the minimum block size as the distance from the region of interest increases. Item 12. The imaging device according to Item 11.
前記決定手段は前記第1のパターンにおいて、
前記関心領域以外の領域を分割するためのブロックサイズに、前記複数のブロックサイズのうち少なくとも前記最大のブロックサイズが含まれるようにし、
前記関心領域を分割するためのブロックサイズを、前記複数のブロックサイズのうち前記関心領域以外の領域に割り当てられていないブロックサイズの中で、より大きいブロックサイズとすることを特徴とする請求項11に記載の撮像装置。
In the first pattern, the determining means is
The block size for dividing the region other than the region of interest includes at least the maximum block size among the plurality of block sizes,
12. The block size for dividing the region of interest is set to a larger block size among block sizes not assigned to regions other than the region of interest among the plurality of block sizes. The imaging device described in 1.
前記決定手段は、前記関心領域以外の領域におけるブロックサイズを、前記関心領域から離れる従ってより大きなブロックサイズとすることを特徴とする請求項13に記載の撮像装置。   14. The imaging apparatus according to claim 13, wherein the determining unit sets a block size in a region other than the region of interest to a larger block size away from the region of interest. 前記決定手段は、前記被写体の移動速度が遅くなるにつれ、前記関心領域を分割するためのブロックサイズを、前記複数のブロックサイズの中で、より小さいブロックサイズとすることを特徴とする請求項10乃至14のいずれか1項に記載の撮像装置。   11. The determination unit according to claim 10, wherein the block size for dividing the region of interest is set to a smaller block size among the plurality of block sizes as the moving speed of the subject decreases. 15. The imaging device according to any one of 1 to 14. 前記動画像における被写体の移動は、前記撮像装置のパニング動作、前記撮像装置のチルト動作、及び、前記被写体自体の移動のうち少なくともいずれかに基づくことを特徴とする請求項10乃至15のいずれか1項に記載の撮像装置。   16. The movement of the subject in the moving image is based on at least one of a panning operation of the imaging device, a tilt operation of the imaging device, and a movement of the subject itself. The imaging apparatus according to item 1. 被写体を撮像して得られた動画像を複数のブロックに分割してブロックごとに符号化する撮像装置の制御方法であって、
決定手段が、前記動画像を分割するブロックサイズを複数のブロックサイズのうちから決定する決定工程と、
分割手段が、前記決定されたブロックサイズにより前記動画像を分割する分割工程と、
符号化手段が、前記分割されたブロックごとに符号化処理を行う符号化工程と
を備え、
前記決定工程では、前記動画像における画像の変動の大きさに応じて、前記動画像における該撮像装置のユーザの関心領域を分割するためのブロックサイズを該関心領域以外の領域を分割するためのブロックサイズも小さいサイズとする第1のパターンと、前記動画像を前記複数のブロックサイズのうち最大のブロックサイズにより分割する第2のパターンとで切り替えることにより、前記動画像を分割するブロックサイズを決定することを特徴とする撮像装置の制御方法。
A control method of an imaging apparatus that divides a moving image obtained by imaging a subject into a plurality of blocks and encodes each block,
A determining step for determining a block size for dividing the moving image from a plurality of block sizes;
A dividing step of dividing the moving image by the determined block size;
An encoding means comprising an encoding step of performing an encoding process for each of the divided blocks;
In the determining step, the block size for dividing the region of interest of the user of the imaging device in the moving image is divided into regions other than the region of interest in accordance with the magnitude of image fluctuation in the moving image. A block size for dividing the moving image is changed by switching between a first pattern having a small block size and a second pattern for dividing the moving image by a maximum block size among the plurality of block sizes. A control method for an imaging apparatus, characterized by:
コンピュータを請求項1乃至16のいずれか1項に記載の撮像装置の各手段として機能させることを特徴とするプログラム。   A program that causes a computer to function as each unit of the imaging apparatus according to any one of claims 1 to 16.
JP2013258701A 2013-12-13 2013-12-13 Imaging apparatus, control method of imaging apparatus, and computer program Pending JP2015115903A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013258701A JP2015115903A (en) 2013-12-13 2013-12-13 Imaging apparatus, control method of imaging apparatus, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013258701A JP2015115903A (en) 2013-12-13 2013-12-13 Imaging apparatus, control method of imaging apparatus, and computer program

Publications (1)

Publication Number Publication Date
JP2015115903A true JP2015115903A (en) 2015-06-22

Family

ID=53529294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013258701A Pending JP2015115903A (en) 2013-12-13 2013-12-13 Imaging apparatus, control method of imaging apparatus, and computer program

Country Status (1)

Country Link
JP (1) JP2015115903A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018093386A (en) * 2016-12-05 2018-06-14 キヤノン株式会社 Encoding device and encoding method
JP2018195084A (en) * 2017-05-17 2018-12-06 キヤノン株式会社 Image processing apparatus, image processing method, program, and storage medium
JP2019191724A (en) * 2018-04-20 2019-10-31 キヤノン株式会社 Image processing apparatus, image processing method, and program
JP2020127178A (en) * 2019-02-06 2020-08-20 株式会社リコー Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program
US10834421B2 (en) 2017-07-05 2020-11-10 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US11222414B2 (en) 2017-07-05 2022-01-11 Canon Kabushiki Kaisha Image processing apparatus that specifies a block to be encoded

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214965A (en) * 1996-02-07 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> Method and device for encoding moving image
JPH11146367A (en) * 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd Mobile video-phone
JP2001223936A (en) * 2000-02-14 2001-08-17 Canon Inc Image pickup device and its control method, and computer- readable memory
JP2007228101A (en) * 2006-02-21 2007-09-06 Victor Co Of Japan Ltd Dynamic-image coding equipment
JP2009055236A (en) * 2007-08-24 2009-03-12 Canon Inc Video coder and method
WO2010150486A1 (en) * 2009-06-22 2010-12-29 パナソニック株式会社 Video coding method and video coding device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214965A (en) * 1996-02-07 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> Method and device for encoding moving image
JPH11146367A (en) * 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd Mobile video-phone
JP2001223936A (en) * 2000-02-14 2001-08-17 Canon Inc Image pickup device and its control method, and computer- readable memory
JP2007228101A (en) * 2006-02-21 2007-09-06 Victor Co Of Japan Ltd Dynamic-image coding equipment
JP2009055236A (en) * 2007-08-24 2009-03-12 Canon Inc Video coder and method
WO2010150486A1 (en) * 2009-06-22 2010-12-29 パナソニック株式会社 Video coding method and video coding device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018093386A (en) * 2016-12-05 2018-06-14 キヤノン株式会社 Encoding device and encoding method
JP2018195084A (en) * 2017-05-17 2018-12-06 キヤノン株式会社 Image processing apparatus, image processing method, program, and storage medium
JP7032871B2 (en) 2017-05-17 2022-03-09 キヤノン株式会社 Image processing equipment and image processing methods, programs, storage media
US10834421B2 (en) 2017-07-05 2020-11-10 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US11222414B2 (en) 2017-07-05 2022-01-11 Canon Kabushiki Kaisha Image processing apparatus that specifies a block to be encoded
JP2019191724A (en) * 2018-04-20 2019-10-31 キヤノン株式会社 Image processing apparatus, image processing method, and program
JP7077115B2 (en) 2018-04-20 2022-05-30 キヤノン株式会社 Image processing equipment, image processing methods, and programs
JP2020127178A (en) * 2019-02-06 2020-08-20 株式会社リコー Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program
JP7346837B2 (en) 2019-02-06 2023-09-20 株式会社リコー Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program

Similar Documents

Publication Publication Date Title
JP6471786B2 (en) Image processing apparatus and image processing method
EP3598758B1 (en) Encoder decisions based on results of hash-based block matching
JP5583992B2 (en) Signal processing device
EP2717578A1 (en) Image processing device and image processing method
JP2015115903A (en) Imaging apparatus, control method of imaging apparatus, and computer program
JP6648753B2 (en) Image encoding apparatus and method
KR20130129381A (en) Image processing device and image processing method
JP2011188243A5 (en)
JP2012257198A (en) Stereoscopic image encoding apparatus, method therefor, and image pickup apparatus having stereoscopic image encoding apparatus
CN114402620A (en) Bit shifting for cross component adaptive loop filtering for video coding and decoding
US20150062371A1 (en) Encoding apparatus and method
JP2010057166A (en) Image coding apparatus, image coding method, integrated circuit, and camera
JP2023511206A (en) Encoders, Decoders, and Corresponding Methods for Adaptive Loop Filtering
JP6652068B2 (en) Moving picture coding apparatus, moving picture coding method and moving picture coding program
JP2019029802A (en) Encoding apparatus, encoding method, and program
JP6906324B2 (en) Coding device, coding method, and program
US9736485B2 (en) Encoding apparatus, encoding method, and image capture apparatus
KR20220065880A (en) Use of DCT-based interpolation filters and enhanced bilinear interpolation filters in affine motion compensation
WO2016171006A1 (en) Encoding device and encoding method, and decoding device and decoding method
JP2015023498A (en) Image coding device, image coding method and program
JP2009218965A (en) Image processor, imaging device mounted with the same and image reproduction device
JP2015115901A (en) Encoding apparatus, encoding apparatus control method, and computer program
JP2020057898A (en) Image coding device
JP2018191136A (en) Encoding device, encoding method and program
JP2008227876A (en) Imaging apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180119