JP2011199354A - Image processing unit, image reproducing unit, and image processing system - Google Patents

Image processing unit, image reproducing unit, and image processing system Download PDF

Info

Publication number
JP2011199354A
JP2011199354A JP2010060731A JP2010060731A JP2011199354A JP 2011199354 A JP2011199354 A JP 2011199354A JP 2010060731 A JP2010060731 A JP 2010060731A JP 2010060731 A JP2010060731 A JP 2010060731A JP 2011199354 A JP2011199354 A JP 2011199354A
Authority
JP
Japan
Prior art keywords
image
local area
inter
images
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010060731A
Other languages
Japanese (ja)
Inventor
Ayako Nemoto
亞矢子 根本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2010060731A priority Critical patent/JP2011199354A/en
Publication of JP2011199354A publication Critical patent/JP2011199354A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an image processing unit that efficiently encodes an image signal captured by a plurality of cameras, and to provide an image reproducing unit for decoding the coded image signal to be displayed on a monitor, or the like.SOLUTION: The image processing unit includes: imaging means 1 to N of generating a plurality of image signals from a plurality of captured moving pictures; feature amount calculation means 21 to 2N of dividing the plurality of image signals into a plurality of local areas, and of calculating an inter-frame difference value for each local area; an image composite means 32 of combining images of the local area based on the calculated inter-frame difference value, and of generating a plurality of composite images; a frame rate control means 33 of controlling a frame rate of the composite image, based on the inter-frame difference value of the local area constituting the composite image; and an image coding means 34 of performing coding using inter-frame prediction to the composite image to generate a bit stream.

Description

この発明は、複数の画像信号を符号化する画像処理装置、および、符号化された画像信号を復号しモニタ等に表示する画像再生装置に関するものである。   The present invention relates to an image processing apparatus that encodes a plurality of image signals, and an image reproduction apparatus that decodes the encoded image signals and displays them on a monitor or the like.

近年、複数のカメラから異なる監視エリアを撮影し、得られた複数のカメラ画像を分割表示し、また、画像データを順次圧縮して、記録媒体に記録しておく画像記録表示装置を用いた監視カメラシステム(デジタルCCTV(Closed Circuit TeleVision)システム)が広く普及し始めている。このシステムでは、複数カメラにより撮影した画像を、符号化装置に入力して画像データの圧縮を行うシステム構成が用いられており、画像データを圧縮する符号化技術としては、例えば国際標準規格であるMPEG2(Moving Picture Experts Group Part2)や、最近ではH.264/AVC等が用いられる。これらは、動き補償予測符号化、離散コサイン変換符号化および可変長符号化を組み合わせたハイブリッド符号化方式である。   In recent years, monitoring using an image recording display device that shoots different monitoring areas from a plurality of cameras, divides and displays the obtained camera images, and sequentially compresses image data and records it on a recording medium. Camera systems (digital CCTV (Closed Circuit TeleVision) systems) are beginning to become widespread. In this system, a system configuration is used in which images captured by a plurality of cameras are input to an encoding device and image data is compressed, and an encoding technique for compressing image data is, for example, an international standard. MPEG2 (Moving Picture Experts Group Part2) and recently H.264. H.264 / AVC or the like is used. These are hybrid coding schemes that combine motion compensation prediction coding, discrete cosine transform coding, and variable length coding.

このような監視カメラシステムでは、回路規模の増大を避けるために、複数のカメラから入力される画像を順次切り替えて、1つの符号化器にて圧縮する構成が想定される。従って、複数カメラからの入力される異なる画像を周期的に切り替えるため、時間的に連続しない画像のフレーム間の予測を行う必要がある。そのため、画像データを圧縮する符号化技術として、MPEG2やH.264/AVC等のフレーム間予測を用いる方式を選択した場合、圧縮効率が悪いという問題点がある。   In such a surveillance camera system, in order to avoid an increase in circuit scale, it is assumed that images input from a plurality of cameras are sequentially switched and compressed by one encoder. Accordingly, since different images input from a plurality of cameras are periodically switched, it is necessary to perform prediction between frames of images that are not temporally continuous. Therefore, as an encoding technique for compressing image data, MPEG2 or H.264 is used. When a method using inter-frame prediction such as H.264 / AVC is selected, there is a problem that the compression efficiency is poor.

従来の監視カメラシステムでは、このような問題を解決するために複数の画像信号を合成して1つの合成画像信号を生成し、フレーム間で相関関係を有する合成画像信号を1つの符号化器を用いて圧縮することによって符号化を行っていた。(例えば、特許文献1参照)   In a conventional surveillance camera system, in order to solve such a problem, a plurality of image signals are combined to generate one combined image signal, and a combined image signal having a correlation between frames is combined with one encoder. Encoding was performed by using and compressing. (For example, see Patent Document 1)

特開2002−27393号公報(第4頁〜第7頁、第1図)JP 2002-27393 A (pages 4-7, FIG. 1)

従来の監視カメラシステムでは、各カメラからの画像信号を単純に並べて合成したり、各画像信号の解像度を縮小して組み合わせたりして、合成画像信号を生成している。従って、複数のカメラからの画像信号のうち一部のカメラからの画像の動きが大きい場合において、動きの小さなカメラからの画像に合わせてフレーム間予測を行うと、その画像の動きが大きい画像に対する情報量の割り当てが十分ではなく、画質が悪くなるという問題が生じる。一方、動きの大きなカメラからの画像に合わせてフレーム間予測を行った場合、符号化したビットストリームの発生情報量が多くなり、記録媒体への記録時間が短くなるという問題点があった。また、解像度を縮小して組み合わせた場合には、再生した際の画質が悪くなるという問題点があった。   In a conventional surveillance camera system, image signals from the cameras are simply arranged and combined, or the resolution of each image signal is reduced and combined to generate a combined image signal. Therefore, when the motion of images from some cameras among the image signals from a plurality of cameras is large, if inter-frame prediction is performed according to the images from cameras with small motion, the images with large motion There is a problem that the information amount is not sufficiently allocated and the image quality is deteriorated. On the other hand, when inter-frame prediction is performed according to an image from a camera with a large movement, there is a problem that the amount of information generated in the encoded bit stream increases and the recording time on the recording medium is shortened. Further, when the resolutions are reduced and combined, there is a problem that the image quality at the time of reproduction deteriorates.

この発明に係る画像処理装置は、動画像を撮影する複数の撮像手段と、前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、算出したフレーム間差分値に基づいてローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、合成画像を構成するローカルエリアのフレーム間差分値に基づいて、合成画像のフレームレートを制御するフレームレート制御手段と、合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、を備えている。   An image processing apparatus according to the present invention divides a plurality of image capturing means for capturing a moving image and a plurality of image signals generated from the moving images captured by the plurality of image capturing means into a plurality of local areas, respectively. Feature amount calculating means for calculating inter-frame difference values for each area; image combining means for generating a plurality of composite images by combining local area images based on the calculated inter-frame difference values; and locals constituting the composite images Frame rate control means for controlling the frame rate of the composite image based on the inter-frame difference value of the area, and image encoding means for performing coding using inter-frame prediction on the composite image and generating a bitstream It is equipped with.

また、この発明に係る画像処理装置は、動画像を撮影する複数の撮像手段と、前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、算出したフレーム間差分値に基づいてローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、合成画像を構成するローカルエリアのフレーム間差分値に基づいて、合成画像の高周波成分を除去するフィルタ手段と、複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、を備えている。   The image processing apparatus according to the present invention divides a plurality of image capturing means for capturing moving images and a plurality of image signals generated from the moving images captured by the plurality of image capturing means into a plurality of local areas, respectively. A feature amount calculating unit that calculates an inter-frame difference value for each local area; an image combining unit that combines a local area image based on the calculated inter-frame difference value to generate a plurality of combined images; and a combined image Filter means for removing high-frequency components of the composite image based on the inter-frame difference value of the local area, and image encoding that performs inter-frame prediction on a plurality of composite images and generates a bitstream Means.

また、この発明に係る画像再生装置は、複数の画像信号を構成するローカルエリアの画像を組み合わせて生成した複数の合成画像から、画像信号を構成するローカルエリアの画像を抽出する画像抽出手段と、抽出したローカルエリアの画像を合成して画像信号を生成する画像再合成手段と、生成された画像信号をモニタに表示する画像表示手段とを備え、合成画像は、複数のローカルエリアの画像のフレーム間差分値に基づいて、ローカルエリア画像を組み合わせて合成された合成画像である。   In addition, the image reproducing apparatus according to the present invention includes an image extracting unit that extracts a local area image constituting an image signal from a plurality of composite images generated by combining local area images constituting a plurality of image signals; An image re-synthesizing unit that synthesizes the extracted local area images to generate an image signal; and an image display unit that displays the generated image signal on a monitor. The synthesized image is a frame of a plurality of local area images. It is a synthesized image synthesized by combining local area images based on the inter-difference value.

また、この発明に係る画像処理装置は、動画像を撮影する複数の撮像手段と、前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、ローカルエリアごとに複数の画像信号の相関性を算出する相関性算出手段と、算出した相関性に基づいて、画像信号を符号化する順序およびGOP構造を決定する符号化制御手段と、符号化する順序およびGOP構造に基づいてフレーム間予測を用いて画像信号を符号化し、ビットストリームを出力する画像符号化手段と、を備えている。   The image processing apparatus according to the present invention divides a plurality of image capturing means for capturing moving images and a plurality of image signals generated from the moving images captured by the plurality of image capturing means into a plurality of local areas, respectively. Correlation calculating means for calculating the correlation of a plurality of image signals for each local area, coding control means for determining the order and GOP structure for encoding the image signals based on the calculated correlation, and encoding And an image encoding means for encoding an image signal using inter-frame prediction based on the order to perform and the GOP structure and outputting a bit stream.

また、この発明に係る画像処理システムは、画像信号の符号化を行う画像処理装置と、符号化された画像信号を復号およびモニタに再生する画像再生装置を備える画像処理システムであって、画像処理装置は、動画像を撮影する複数の撮像手段と、前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、算出したフレーム間差分値に基づいてローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、合成画像を構成するローカルエリアのフレーム間差分値に基づいて、合成画像のフレームレートを制御するフレームレート制御手段と、複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、ビットストリームおよび合成画像を構成するローカルエリアの組合せを記憶する画像記憶手段と、を備え、画像再生装置は、画像記憶手段からビットストリームおよびローカルエリアの組合せを取得するデータ取得手段と、データ取得手段により取得したビットストリームを復号し、合成画像を生成する画像復号手段と、復号された合成画像から、ローカルエリアの組合せに基づいて画像信号を構成するローカルエリアの画像を抽出する画像抽出手段と、抽出したローカルエリアの画像を合成して画像信号を生成する画像再合成手段と、生成された画像信号をモニタに表示する画像表示手段と、を備えている。   An image processing system according to the present invention is an image processing system including an image processing device that encodes an image signal, and an image reproduction device that decodes and reproduces the encoded image signal on a monitor. The apparatus divides a plurality of image capturing means for capturing a moving image and a plurality of image signals generated from the moving images captured by the plurality of image capturing means into a plurality of local areas, and performs inter-frame differences for each local area. A feature amount calculating unit that calculates a value, an image combining unit that combines a local area image based on the calculated inter-frame difference value, and generates a plurality of combined images, and an inter-frame difference value of the local area that forms the combined image Based on the frame rate control means for controlling the frame rate of the composite image and inter-frame prediction for a plurality of composite images An image encoding unit that performs encoding and generates a bitstream; and an image storage unit that stores a combination of the local area constituting the bitstream and the composite image. And a data acquisition means for acquiring a combination of local areas, an image decoding means for decoding the bitstream acquired by the data acquisition means to generate a composite image, and an image based on the combination of local areas from the decoded composite image Image extracting means for extracting an image of a local area constituting a signal, image recombining means for generating an image signal by combining the extracted images of the local area, and image display means for displaying the generated image signal on a monitor And.

また、この発明に係る画像処理システムは、画像信号の符号化を行う画像処理装置と、符号化された画像信号を復号およびモニタに再生する画像再生装置を備える画像処理システムであって、画像処理装置は、動画像を撮影する複数の撮像手段と、前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、算出したフレーム間差分値に基づいてローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、合成画像を構成するローカルエリアのフレーム間差分値に基づいて、合成画像の高周波成分を除去するフィルタ手段と、複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、ビットストリームおよび合成画像を構成するローカルエリアの組合せを記憶する画像記憶手段と、を備え、画像再生装置は、画像記憶手段からビットストリームおよびローカルエリアの組合せを取得するデータ取得手段と、データ取得手段により取得したビットストリームを復号し、合成画像を生成する画像復号手段と、復号された合成画像から、ローカルエリアの組合せに基づいて画像信号を構成するローカルエリアの画像を抽出する画像抽出手段と、抽出したローカルエリアの画像を合成して画像信号を生成する画像再合成手段と、生成された画像信号をモニタに表示する画像表示手段と、を備えている。   An image processing system according to the present invention is an image processing system including an image processing device that encodes an image signal, and an image reproduction device that decodes and reproduces the encoded image signal on a monitor. The apparatus divides a plurality of image capturing means for capturing a moving image and a plurality of image signals generated from the moving images captured by the plurality of image capturing means into a plurality of local areas, and performs inter-frame differences for each local area. A feature amount calculating unit that calculates a value, an image combining unit that combines a local area image based on the calculated inter-frame difference value, and generates a plurality of combined images, and an inter-frame difference value of the local area that forms the combined image Based on the filter means for removing high-frequency components of the composite image, and performing encoding using inter-frame prediction on a plurality of composite images An image encoding means for generating a bit stream, and an image storage means for storing a combination of local areas constituting the bit stream and the composite image, and the image reproducing apparatus includes a combination of the bit stream and the local area from the image storage means. A data acquisition means for acquiring the image data, an image decoding means for decoding the bitstream acquired by the data acquisition means and generating a composite image, and a local signal that constitutes an image signal from the decoded composite image based on a combination of local areas Image extraction means for extracting an image of the area, image recomposition means for generating an image signal by combining the extracted images of the local area, and image display means for displaying the generated image signal on a monitor Yes.

この発明によれば、複数のカメラにより撮影された画像信号を効率的に符号化することができる。   According to the present invention, image signals photographed by a plurality of cameras can be efficiently encoded.

本発明の実施の形態1に示す画像処理装置および画像再生装置の全体構成を表すブロック図である。It is a block diagram showing the whole structure of the image processing apparatus and image reproduction apparatus which are shown in Embodiment 1 of this invention. 本発明の実施の形態1に示すフレーム間差分値算出処理のフローチャートである。It is a flowchart of the difference value calculation process between frames shown in Embodiment 1 of this invention. 本発明の実施の形態1に示すフレーム間差分値の算出例を示す概念図である。It is a conceptual diagram which shows the example of calculation of the difference value between frames shown in Embodiment 1 of this invention. 本発明の実施の形態1に示す画像合成処理のフローチャートである。It is a flowchart of the image composition process shown in Embodiment 1 of this invention. 本発明の実施の形態1に示すローカルエリアの組合せの算出例を示す概念図である。It is a conceptual diagram which shows the example of calculation of the combination of the local area shown in Embodiment 1 of this invention. 本発明の実施の形態1に示す合成画像の生成例を示す概念図である。It is a conceptual diagram which shows the example of a production | generation of the synthesized image shown in Embodiment 1 of this invention. 本発明の実施の形態1に示す合成画像のフレームレートの算出例を示す概念図である。It is a conceptual diagram which shows the example of calculation of the frame rate of the synthesized image shown in Embodiment 1 of this invention. 本発明の実施の形態1に示す符号化処理におけるGOP構造を示す概念図である。It is a conceptual diagram which shows the GOP structure in the encoding process shown in Embodiment 1 of this invention. 本発明の実施の形態3に示す画像処理装置および画像再生装置の全体構成を表すブロック図である。It is a block diagram showing the whole structure of the image processing apparatus and image reproduction apparatus which are shown in Embodiment 3 of this invention. 本発明の実施の形態4に示す画像処理装置および画像再生装置の全体構成を表すブロック図である。It is a block diagram showing the whole structure of the image processing apparatus and image reproduction apparatus which are shown in Embodiment 4 of this invention. 本発明の実施の形態4に示す複数の画像間の相関性の算出例を示す概念図である。It is a conceptual diagram which shows the example of calculation of the correlation between the several images shown in Embodiment 4 of this invention. 本発明の実施の形態4に示す合成画像の符号化順序を示す概念図である。It is a conceptual diagram which shows the encoding order of the synthesized image shown in Embodiment 4 of this invention.

実施の形態1.
図1はこの発明の実施の形態1における画像処理装置および画像再生装置を用いた監視カメラシステムの全体構成を表すブロック図である。まず、画像処理装置の構成について説明する。図1において、カメラ1〜Nは、例えばCCDイメージセンサ等の動画像を撮影する撮像素子、および、撮影した画像をデジタル信号に変換して画像信号101〜10Nおよび1フレーム前の画像信号111〜11Nを生成するA/Dコンバータから構成されている。フレームメモリ部11〜1Nは、出力された画像信号101〜10Nおよび1フレーム前の画像信号111〜11Nをフレーム単位で蓄積するメモリ、および、蓄積した画像信号から、受信したリード制御信号131〜13Nに基づいて画像信号を読み出す画像読出し部から構成されている。ローカルエリア特徴量算出部21〜2Nは、画像信号101〜10Nと1フレーム前の画像信号111〜11Nを所定のサイズの領域(以下、ローカルエリアとする)に分割するローカルエリア分割部と、ローカルエリア単位で画像信号101〜10Nと1フレーム前の画像信号111〜11Nとのフレーム間差分値141〜14Nをローカルエリアごとに算出し、画像信号101〜10Nが撮影された時刻情報151〜15Nを出力するフレーム間差分値算出部から構成されている。ローカルエリア画像合成制御部31aはフレーム間差分値141〜14Nおよび時刻情報151〜15Nを参照して複数カメラからの画像をローカルエリア単位で合成する組み合わせを制御し、画像合成情報161および合成画像に適したフレームレート162を出力する。ローカルエリア画像合成処理部32aは画像合成情報161およびフレームレート162を基にフレームメモリ部11〜1Nに対するリード制御信号131〜13Nを出力し、フレームメモリ部11〜1Nから読み出した画像信号121〜12Nを組み合わせて合成画像信号164を生成する。符号化制御部33は画像合成情報161およびフレームレート162を基に画像符号化を行う際のGOP(Group Of Pictures)構造163を決定する。画像符号化器34は合成画像信号164をGOP構造163に従ってフレーム間予測を用いた符号化手段により符号化し、可変長のビットストリーム165を出力する。記録媒体35は画像合成情報161、フレームレート162およびビットストリーム165を記録するHDD(Hard Disk Drive)装置である。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing the overall configuration of a surveillance camera system using an image processing apparatus and an image reproduction apparatus according to Embodiment 1 of the present invention. First, the configuration of the image processing apparatus will be described. In FIG. 1, cameras 1 to N are, for example, an image sensor that captures a moving image, such as a CCD image sensor, and image signals 101 to 10N and image signals 111 to 1 before one frame by converting the captured images into digital signals. It is comprised from the A / D converter which produces | generates 11N. The frame memory units 11 to 1N store the output image signals 101 to 10N and the image signals 111 to 11N one frame before in units of frames, and read control signals 131 to 13N received from the stored image signals. The image reading unit is configured to read an image signal based on the above. The local area feature amount calculation units 21 to 2N include a local area dividing unit that divides the image signals 101 to 10N and the image signals 111 to 11N of the previous frame into regions of a predetermined size (hereinafter referred to as local areas), Inter-frame difference values 141 to 14N between the image signals 101 to 10N and the image signals 111 to 11N of the previous frame are calculated for each local area, and time information 151 to 15N when the image signals 101 to 10N are photographed are calculated. It consists of an inter-frame difference value calculation unit for output. The local area image composition control unit 31a refers to the inter-frame difference values 141 to 14N and the time information 151 to 15N to control a combination for compositing images from a plurality of cameras in units of local areas, and generates the image composition information 161 and the composite image. A suitable frame rate 162 is output. The local area image composition processing unit 32a outputs read control signals 131 to 13N for the frame memory units 11 to 1N based on the image composition information 161 and the frame rate 162, and the image signals 121 to 12N read from the frame memory units 11 to 1N. Are combined to generate a composite image signal 164. The encoding control unit 33 determines a GOP (Group Of Pictures) structure 163 when performing image encoding based on the image synthesis information 161 and the frame rate 162. The image encoder 34 encodes the composite image signal 164 by an encoding unit using inter-frame prediction according to the GOP structure 163, and outputs a variable-length bit stream 165. The recording medium 35 is an HDD (Hard Disk Drive) device that records image composition information 161, a frame rate 162, and a bit stream 165.

次に、画像再生装置の構成を説明する。図1において、ユーザーインターフェース部36はユーザーが再生したいカメラおよび時刻を入力する入力部を備え、指定された動画像の時刻情報166およびカメラ情報167を出力する。ストリーム読み出し制御部37は時刻情報166を基に記録媒体35から必要なビットストリーム169および対応する画像合成情報170を読み出すためのリード制御信号168を出力する。画像復号器38はビットストリーム169を入力して画像復号手段により復号した合成画像信号171を出力する。ローカルエリア画像再合成制御部39は復号された合成画像信号171に対応する画像合成情報170および再生したいカメラ情報167を参照して必要な合成画像信号171を選択するためのリード制御信号172および元のカメラ画像を再合成するための画像再合成情報174を出力し、フレームメモリ部40は合成画像信号171を蓄積するメモリを備えている。ローカルエリア画像再合成処理部41はフレームメモリ部40から読み出された合成画像信号173から画像再合成情報174を基にローカルエリア単位で画像を組み合わせて元のカメラからの復号画像信号175を生成する。モニタ42は元のカメラからの復号画像を表示するモニタ装置である。   Next, the configuration of the image reproduction device will be described. In FIG. 1, a user interface unit 36 includes an input unit for inputting a camera and time that the user wants to reproduce, and outputs time information 166 and camera information 167 of a specified moving image. The stream read control unit 37 outputs a read control signal 168 for reading the necessary bit stream 169 and the corresponding image composition information 170 from the recording medium 35 based on the time information 166. The image decoder 38 receives the bit stream 169 and outputs a composite image signal 171 decoded by the image decoding means. The local area image recombination control unit 39 refers to the image composite information 170 corresponding to the decoded composite image signal 171 and the camera information 167 to be reproduced, and selects the necessary composite image signal 171 and the original control signal 172. The image recombination information 174 for recombining the camera images is output, and the frame memory unit 40 includes a memory for storing the composite image signal 171. The local area image recombination processing unit 41 generates a decoded image signal 175 from the original camera by combining images in units of local areas based on the image recombination information 174 from the composite image signal 173 read from the frame memory unit 40. To do. The monitor 42 is a monitor device that displays a decoded image from the original camera.

次に、動作について説明する。まず、カメラ1〜Nは被監視対象物等の被写体を撮影し、撮影した動画像をA/Dコンバータによりデジタル信号に変換して画像信号101〜10Nを出力する。このとき、各カメラは撮影対象の重要度や状態に応じて任意のフレームレートにて画像信号101〜10Nを出力する。   Next, the operation will be described. First, the cameras 1 to N capture a subject such as an object to be monitored, convert the captured moving image into a digital signal by an A / D converter, and output image signals 101 to 10N. At this time, each camera outputs the image signals 101 to 10N at an arbitrary frame rate in accordance with the importance and state of the shooting target.

出力された画像信号101〜10Nは、フレームメモリ部11〜1Nにおいてフレーム単位でメモリに書き込まれるとともに、ローカルエリア特徴量算出部21〜2Nに入力される。図2にローカルエリア特徴量算出部21〜2Nのフレーム間差分値算出処理のフローチャートを示す。ローカルエリア特徴量算出部21〜2Nでは、画像信号101〜10Nを読み込み(ステップS1−1)、1フレーム前にカメラ1〜Nにより撮影およびデジタル信号に変換されメモリに書き込みが完了した画像信号111〜11Nをフレームメモリ部11〜1Nから読み出し(ステップS1−2)、画像信号101〜10Nおよび1フレーム前の画像信号111〜11Nをそれぞれ複数のローカルエリアに分割する(ステップS1−3)。図3に、水平方向に5分割、垂直方向に4分割した場合の画像信号を示す。これらの画像信号についてカメラごとに比較を行い、ローカルエリア単位でフレーム間差分値141〜14Nを算出する(ステップS1−4)。ここで、フレーム間差分値とは、同じカメラにより撮影された時間の異なる画像信号において、対応する画素の差分値を所定の領域(ここでは、ローカルエリア)で累積した値である。なお、フレーム間差分値を対応する画素の差分値の2乗和としたり、所定領域の画素の平均値または画素の偏差値の差分値としたりしてもよい。   The output image signals 101 to 10N are written in the memory in units of frames in the frame memory units 11 to 1N and are input to the local area feature amount calculation units 21 to 2N. FIG. 2 shows a flowchart of the inter-frame difference value calculation processing of the local area feature amount calculation units 21 to 2N. The local area feature amount calculation units 21 to 2N read the image signals 101 to 10N (step S1-1), and the image signals 111 that have been captured and converted into digital signals by the cameras 1 to N one frame before and written to the memory are completed. To 11N are read from the frame memory units 11 to 1N (step S1-2), and the image signals 101 to 10N and the image signals 111 to 11N of the previous frame are each divided into a plurality of local areas (step S1-3). FIG. 3 shows an image signal in the case of dividing into 5 parts in the horizontal direction and 4 parts in the vertical direction. These image signals are compared for each camera, and inter-frame difference values 141 to 14N are calculated in units of local areas (step S1-4). Here, the inter-frame difference value is a value obtained by accumulating corresponding pixel difference values in a predetermined area (here, a local area) in image signals taken by the same camera and having different times. Note that the inter-frame difference value may be the sum of squares of the difference values of the corresponding pixels, or may be the difference value of the average value or the deviation value of the pixels in the predetermined area.

図3に、1フレームを水平方向に5分割、垂直方向に4分割した場合の、各ローカルエリアにおけるフレーム間差分値の算出例を示す。1フレーム前の画像と現フレームの画像間において、ローカルエリアごとに対応する位置の画素値の比較を行い、ローカルエリアごとにその差分値を累積する。監視カメラシステムにおいて、固定カメラを使用した場合は移動体が含まれるローカルエリアのみフレーム間差分値が大きくなり、移動体がない背景部分のローカルエリアはフレーム間差分値が小さい値または0に近い値となる。また、フレーム間差分値を算出した画像信号101〜10Nが撮影された時刻情報151〜15Nも同時に出力しておく(ステップS1−5)。   FIG. 3 shows an example of calculating the inter-frame difference value in each local area when one frame is divided into five in the horizontal direction and four in the vertical direction. A pixel value at a position corresponding to each local area is compared between the image of the previous frame and the current frame, and the difference value is accumulated for each local area. In the surveillance camera system, when a fixed camera is used, the inter-frame difference value is large only in the local area including the moving body, and the inter-frame difference value is small or close to 0 in the background area where there is no moving body. It becomes. Further, time information 151 to 15N when the image signals 101 to 10N for which the inter-frame difference values are calculated are also output at the same time (step S1-5).

ローカルエリア画像合成制御部31aは、フレーム間差分値141〜14Nに基づいて、全てのカメラからの画像信号121〜12Nをローカルエリア単位で組合せ等の合成画像を作成するための画像合成情報161を決定し、さらに合成画像を符号化するのに適したフレームレート162を決定し、これらを出力する。ローカルエリア画像合成処理部32aでは、画像合成情報161に基づいて、画像信号101〜10Nを合成する。これらの画像合成処理について、図4に示すフローチャートを用いて説明する。   Based on the inter-frame difference values 141 to 14N, the local area image composition control unit 31a generates image composition information 161 for creating a composite image such as a combination of image signals 121 to 12N from all cameras in units of local areas. Further, a frame rate 162 suitable for encoding the composite image is determined, and these are output. The local area image composition processing unit 32a synthesizes the image signals 101 to 10N based on the image composition information 161. These image composition processes will be described with reference to the flowchart shown in FIG.

まず、ローカルエリア画像合成制御部31aが画像合成情報161を決定する方法について説明する。図5に、N=3としてカメラ3台から撮影した画像から合成画像を作成する場合の画像合成情報161の決定方法について示す。図5において、カメラ1はエレベータホールを撮影した画像、カメラ2は建物を外から撮影した画像、カメラ3は建物への入退場ゲートを撮影した画像である。各カメラからの画像の時間方向に連続した2フレームについて、ローカルエリア単位でフレーム間差分値を算出し、フレーム間差分値はローカルエリア画像合成制御部31aに入力される(ステップS2−1)。   First, a method in which the local area image composition control unit 31a determines the image composition information 161 will be described. FIG. 5 shows a method of determining the image composition information 161 when creating a composite image from images taken from three cameras with N = 3. In FIG. 5, the camera 1 is an image of the elevator hall, the camera 2 is an image of the building taken from the outside, and the camera 3 is an image of the entrance / exit gate to the building. An inter-frame difference value is calculated in units of local areas for two frames in the time direction of images from each camera, and the inter-frame difference value is input to the local area image composition control unit 31a (step S2-1).

ローカルエリア画像合成制御部31aでは、全てのカメラ画像のローカルエリアからフレーム間差分値の大きい順に1フレーム内のローカルエリア数分の画像(この例では5×4=20個)を選択し、残りのローカルエリア単位の画像もフレーム間差分値が大きい順に組み合わせて、全部で3つに分類する(ステップS2−2)。これらの画像をそれぞれ合成することにより、3フレーム分の合成画像を生成することができる。図5の例ではフレーム間差分値が大きい20個のローカルエリアを背景が白い四角で表しており、1〜20までの番号を振っている。次にフレーム間差分値が大きい20個のローカルエリアを背景が点の四角で表しており、1〜20までの番号を振っている。残りの20個のローカルエリアを背景が斜線の四角で表しており、1〜20までの番号を振っている。このとき、各分類において差分値の大きさに応じて1〜20の番号を振る必要はなく、また、同じフレーム内のローカルエリア単位の画像は出来るだけ連続性を持たすように番号を振ることにより、カメラ画像において隣接するローカルエリアを合成画像においても近接させて配置させることができる。これにより、移動体が隣接するローカルエリア間にわたって移動する場合においても、後述するフレーム間予測を用いた符号化処理において効率的に符号化を行うことができる。以上のように、3つに分類したローカルエリア単位の画像から、3つの合成画像を生成する組合せを決定する。   In the local area image composition control unit 31a, images corresponding to the number of local areas in one frame are selected from the local areas of all the camera images in descending order of inter-frame difference values (in this example, 5 × 4 = 20), and the rest These local area unit images are also combined in descending order of the inter-frame difference value, and are classified into a total of three (step S2-2). By synthesizing these images, a synthesized image for three frames can be generated. In the example of FIG. 5, 20 local areas having large inter-frame difference values are represented by squares with a white background, and numbers 1 to 20 are assigned. Next, 20 local areas with the largest inter-frame difference values are represented by a square with a background, and numbers 1 to 20 are assigned. The remaining 20 local areas are represented by hatched squares and numbered from 1 to 20. At this time, it is not necessary to assign a number of 1 to 20 according to the size of the difference value in each classification, and by assigning a number so that images in local area units within the same frame are as continuous as possible. The adjacent local areas in the camera image can be arranged close to each other in the composite image. Thereby, even when the moving body moves between adjacent local areas, it is possible to efficiently perform the encoding in the encoding process using inter-frame prediction described later. As described above, combinations for generating three composite images are determined from the images of local area units classified into three.

図6に、図5のカメラ画像に対して、決定した組合せに基づいて合成した場合の合成画像について示す。図6の右側の合成画像のうち、合成画像1はフレーム間差分値が大きいローカルエリア単位の画像(図5において、背景が白い四角)を1〜20の順に左から右、上から下の順に組み合わせた画像である。合成画像2はフレーム間差分値が中間のローカルエリア単位の画像(図5において、背景が点の四角)を1〜20の順に組み合わせた画像である。合成画像3はフレーム間差分値が小さいローカルエリア単位の画像(図5において、背景が斜線の四角)を1〜20の順に組み合わせた画像である。ローカルエリア画像合成制御部31aでは、以上のようにローカルエリアの組合せに関する画像合成情報161をある所定の時間毎(例えば、1秒間隔)に決定し、ローカルエリア画像合成処理部32aに対して出力する(ステップS2−3)。なお、画像合成情報161は、合成画像を構成するローカルエリアの組合せの他に、合成画像を構成する画像信号の情報、例えば、各合成画像を構成するローカルエリア単位のフレーム間差分値のレベル(大きさ)、カメラ番号および位置情報と、カメラの時刻情報についても含んでいる。   FIG. 6 shows a synthesized image when the camera image in FIG. 5 is synthesized based on the determined combination. Among the composite images on the right side of FIG. 6, composite image 1 is an image in units of local areas having a large inter-frame difference value (in FIG. 5, a square with a white background) in the order of left to right and top to bottom in the order of 1-20. It is a combined image. The composite image 2 is an image obtained by combining local area unit images (in FIG. 5, squares with dots in the background) in the order of 1 to 20 with an inter-frame difference value. The composite image 3 is an image obtained by combining local area unit images with small difference values between frames (in FIG. 5, squares with diagonal lines in the background) in the order of 1 to 20. As described above, the local area image composition control unit 31a determines the image composition information 161 relating to the combination of local areas at certain predetermined time intervals (for example, at intervals of one second) and outputs them to the local area image composition processing unit 32a. (Step S2-3). The image composition information 161 includes, in addition to the combination of local areas constituting the composite image, information on image signals constituting the composite image, for example, the level of the difference value between frames in units of local areas constituting each composite image ( Size), camera number and position information, and camera time information.

次に、ローカルエリア画像合成制御部31aが各合成画像のフレームレート162を決定する方法について説明する。ローカルエリア画像合成制御部31aでは、合成画像のフレームレートを、各合成画像を構成するローカルエリアのフレーム間差分値の大きさに基づいて決定する(ステップS2−4)。すなわち、フレーム間差分値の大きいローカルエリアにより構成される合成画像にはフレームレートを高く設定し、フレーム間差分値の小さいローカルエリアにより構成される合成画像にはフレームレートを低く設定する。図7に、図6に示したカメラ1〜3からの画像信号が全て12フレーム/秒で入力される例を示す。図6に示した合成画像1はフレーム間差分値が大きいローカルエリア単位の画像を組み合わせているため、カメラから入力されたフレームレート(ここでは12フレーム/秒)の全てのフレームを設定する。合成画像2はフレーム間差分値が中間のローカルエリア単位の画像を組み合わせているため、フレームレートを落として(ここでは6フレーム/秒)設定する。合成画像3はフレーム間差分値が小さいローカルエリア単位の画像を組み合わせているため、動きがほとんどない背景画像である場合は、さらにフレームを間引いたフレームレート(ここでは3フレーム/秒)を設定する。これにより、移動体が含まれる動きの大きいローカルエリアについては滑らかな画像とすることができ、動きの少ないローカルエリアについては情報量の割り当てを少なくすることができる。ローカルエリア画像合成制御部31aは設定したフレームレートをローカルエリア画像合成処理部32a、符号化制御部33、記録媒体35にそれぞれ出力する。   Next, a method in which the local area image composition control unit 31a determines the frame rate 162 of each composite image will be described. In the local area image composition control unit 31a, the frame rate of the composite image is determined based on the size of the inter-frame difference value of the local area constituting each composite image (step S2-4). That is, a high frame rate is set for a composite image composed of a local area having a large inter-frame difference value, and a low frame rate is set for a composite image composed of a local area having a small inter-frame difference value. FIG. 7 shows an example in which all the image signals from the cameras 1 to 3 shown in FIG. 6 are input at 12 frames / second. Since the composite image 1 shown in FIG. 6 is a combination of local area unit images having a large inter-frame difference value, all frames having a frame rate (here, 12 frames / second) input from the camera are set. Since the composite image 2 is a combination of local area unit images with intermediate frame difference values, the frame rate is set to be reduced (here, 6 frames / second). Since the composite image 3 is a combination of local area unit images with small inter-frame difference values, a frame rate (here, 3 frames / second) obtained by further thinning out frames is set when the background image has little motion. . As a result, a local area with a large movement including a moving body can be made a smooth image, and an allocation of information amount can be reduced for a local area with a small movement. The local area image composition control unit 31a outputs the set frame rate to the local area image composition processing unit 32a, the encoding control unit 33, and the recording medium 35, respectively.

ローカルエリア画像合成処理部32aでは、ローカルエリア画像合成制御部31aから指示された画像合成情報161およびフレームレート162に基づいて、フレームメモリ部11〜1Nに対して読み出す画像信号を指示するリード制御信号131〜13Nを出力する(ステップS2−5)。各カメラからの画像信号101〜10Nは一旦フレームメモリ部11〜1N内のメモリに蓄積された後に、リード制御信号131〜13Nを受けたフレームメモリ部11〜1Nにより、所望の画像信号が遅延して読み出される(ステップS2−6)。ローカルエリア画像合成処理部32aでは、画像合成情報161およびフレームレート162に基づいて、図6および図7に示すように、画像信号121〜12Nから合成画像信号164を生成し(ステップS2−7)、各合成画像を所定の時間毎に順番に出力する(ステップS2−8)。所定の時間を1秒とした場合、合成画像1のフレーム1〜12を出力した後に、合成画像2のフレーム1〜6を出力し、最後に合成画像3のフレーム1〜3を順番に出力する。   In the local area image composition processing unit 32a, based on the image composition information 161 and the frame rate 162 instructed from the local area image composition control unit 31a, a read control signal that instructs the frame memory units 11 to 1N to read out image signals. 131 to 13N are output (step S2-5). After the image signals 101 to 10N from the respective cameras are temporarily stored in the memories in the frame memory units 11 to 1N, the desired image signals are delayed by the frame memory units 11 to 1N that have received the read control signals 131 to 13N. (Step S2-6). The local area image composition processing unit 32a generates a composite image signal 164 from the image signals 121 to 12N based on the image composition information 161 and the frame rate 162 as shown in FIGS. 6 and 7 (step S2-7). Each composite image is output in turn at predetermined time intervals (step S2-8). When the predetermined time is 1 second, frames 1 to 12 of composite image 1 are output, then frames 1 to 6 of composite image 2 are output, and finally frames 1 to 3 of composite image 3 are output in order. .

符号化制御部33では、合成画像信号164を符号化する際のGOP構造163を決定する。符号化制御部33は画像合成情報161およびフレームレート162を受け取り、これらの情報に基づいてGOP構造を決定する。フレームレートの高い合成画像では、フレーム間隔が短いため、フレーム間予測による符号化効率が高いことが期待でき、PピクチャやBピクチャを用いた符号化を行うようGOP構造を決定する。一方、フレームレートの低い合成画像では、フレーム間隔が長くなるため、移動体を含むローカルエリア画像から構成される合成画像である場合には、フレーム間予測による符号化を行った場合、かえって符号化効率が落ちる場合がある。従って、合成画像情報161およびフレームレートに基づいて、符号化により生じるビットストリームの容量が最小となるようにGOP構造を決定する。このとき、M値(IまたはPピクチャから次のIまたはPピクチャが発生するまでの間隔)、N値(Iピクチャから次のIピクチャが発生するまでの間隔)を変更して複数回符号化処理を行い、ビットストリームの容量が最も小さくなるGOP構造を符号化するGOP構造にしてもよい。   The encoding control unit 33 determines a GOP structure 163 for encoding the composite image signal 164. The encoding control unit 33 receives the image composition information 161 and the frame rate 162, and determines the GOP structure based on these information. A synthesized image with a high frame rate has a short frame interval, so that it can be expected that coding efficiency by inter-frame prediction is high, and a GOP structure is determined so as to perform coding using a P picture or a B picture. On the other hand, since a frame interval is long in a composite image with a low frame rate, if it is a composite image composed of local area images including moving objects, encoding is performed when inter-frame prediction is performed. Efficiency may be reduced. Therefore, based on the composite image information 161 and the frame rate, the GOP structure is determined so that the capacity of the bit stream generated by encoding is minimized. At this time, encoding is performed a plurality of times by changing the M value (interval until the next I or P picture is generated from the I or P picture) and the N value (interval until the next I picture is generated from the I picture). A GOP structure that performs processing and encodes a GOP structure having the smallest bitstream capacity may be used.

図7に示した合成画像1〜3のフレームレートに対するピクチャタイプの例を図8に示す。フレームレートの高い合成画像1は、M値=3、N値=12のBピクチャを用いたGOP構造にて符号化を行う。フレーム間差分値が中間のローカルエリア単位の画像を組み合わせた合成画像2は、合成画像1に対してフレームを間引いてフレーム間隔が2倍に伸びているため、例えばM値=2、N値=6のGOP構造にて符号化を行う。フレーム間差分値が小さいローカルエリア単位の画像を組み合わせた合成画像3は、合成画像2からさらにフレームを間引いているが、合成画像3を構成するローカルエリアの画像は背景画像であるため、フレーム間予測による符号化を用いる。例えば、M値=1、N値=3のGOP構造にて符号化を行う。なお、合成画像3を構成するローカルエリア画像が移動体を含んでおり、フレーム間予測を用いて効率的に符号化できない場合にはすべてIピクチャによって構成する。また、ここでは所定の時間を1秒に設定しているため、各合成画像において1秒間に1回Iピクチャによる符号化が行われるようGOP構造を決定している。   FIG. 8 shows an example of picture types with respect to the frame rates of the composite images 1 to 3 shown in FIG. The composite image 1 with a high frame rate is encoded with a GOP structure using a B picture with M value = 3 and N value = 12. In the composite image 2 in which the images of local area units having intermediate frame difference values are combined, the frame interval is doubled by thinning out the frames from the composite image 1, and therefore, for example, M value = 2, N value = Encoding is performed with 6 GOP structures. The composite image 3 in which the local area unit images having a small inter-frame difference value are combined is further thinned out from the composite image 2, but the local area image constituting the composite image 3 is a background image. Use predictive coding. For example, encoding is performed with a GOP structure of M value = 1 and N value = 3. In addition, when the local area image which comprises the synthetic | combination image 3 contains a moving body and cannot be encoded efficiently using inter-frame prediction, all are comprised by I picture. In addition, since the predetermined time is set to 1 second here, the GOP structure is determined so that the I picture is encoded once per second in each synthesized image.

画像符号化器34は、符号化制御部33で決定したGOP構造163に従って、入力される合成画像信号164の並べ替えおよびフレーム間予測を用いた符号化を行い、可変長のビットストリーム165を出力し、記録媒体35に記録する。またビットストリーム165と共に、対応する画像合成情報161およびフレームレート162を、記録媒体35に記録しておく。以上が、画像処理装置の動作となる。   The image encoder 34 performs rearrangement of the input composite image signal 164 and encoding using inter-frame prediction according to the GOP structure 163 determined by the encoding control unit 33, and outputs a variable-length bit stream 165 And recorded on the recording medium 35. In addition to the bit stream 165, the corresponding image composition information 161 and the frame rate 162 are recorded in the recording medium 35. The above is the operation of the image processing apparatus.

次に、画像再生装置の動作について説明する。ユーザーインターフェース部36は、ユーザーからの指示に従い、カメラ1〜Nにて撮影および記録した画像信号のうち再生したい画像の時刻情報166およびカメラ情報167を出力する。ストリーム読み出し制御部37は、時刻情報166に基づいてリード制御信号168を出力し、記録媒体35はリード制御信号168に基づいて、記録されているデータのうち再生する画像信号の生成に必要なビットストリーム169および画像合成情報170を読み出すビットストリーム169および画像合成情報170を読み出す。   Next, the operation of the image playback device will be described. The user interface unit 36 outputs time information 166 and camera information 167 of an image to be reproduced among image signals photographed and recorded by the cameras 1 to N in accordance with an instruction from the user. The stream read control unit 37 outputs a read control signal 168 based on the time information 166, and the recording medium 35 uses bits necessary for generating an image signal to be reproduced from recorded data based on the read control signal 168. The bit stream 169 and the image composition information 170 for reading the stream 169 and the image composition information 170 are read.

画像復号器38は、リード制御信号168に基づいてビットストリーム169を記録媒体35から受け取り、画像復号を行う。また、生成された合成画像信号171を出力して、フレームメモリ部40に書き込む。ここで、ローカルエリア画像再合成制御部39は、カメラ情報167および画像合成情報170に基づいて、再生したいカメラにて撮影および記録した画像信号が含まれる合成画像信号173を読み出すためのリード制御信号172をフレームメモリ部40に対して出力する。さらに、元の画像信号を再合成するための画像再合成情報174を出力する。なお、画像再合成情報174は、読み出した合成画像信号173を構成するローカルエリア単位のカメラ番号および位置情報と、カメラの時刻情報から成る情報である。   The image decoder 38 receives the bit stream 169 from the recording medium 35 based on the read control signal 168 and performs image decoding. Further, the generated composite image signal 171 is output and written in the frame memory unit 40. Here, based on the camera information 167 and the image composition information 170, the local area image recomposition control unit 39 reads a read control signal for reading a composite image signal 173 including an image signal captured and recorded by the camera to be reproduced. 172 is output to the frame memory unit 40. Further, image recombination information 174 for recombining the original image signal is output. Note that the image recombination information 174 is information including the camera number and position information in units of local areas constituting the read composite image signal 173 and the time information of the camera.

ローカルエリア画像再合成処理部41は、画像再合成情報174に基づいて合成画像信号173からローカルエリア単位で画像を抽出し、抽出した画像を組み合わせて、元のカメラ1〜Nのうち所望のカメラから撮影および記録した復号画像175を生成し、モニタ42に出力して再生表示する。   The local area image recombination processing unit 41 extracts images in units of local areas from the composite image signal 173 based on the image recombination information 174, and combines the extracted images to obtain a desired camera among the original cameras 1 to N. A decoded image 175 photographed and recorded from is generated and output to the monitor 42 for reproduction display.

以上のように、実施の形態1に係る画像処理装置および画像再生装置では、複数のカメラからの画像をローカルエリア単位でフレーム間差分値が大きい順に組み合わせて合成画像を作成し、合成画像を構成するローカルエリアのフレーム間差分値の大きさに応じてフレームレートを決定するようにしているので、動きの大きい部分には高いフレームレートを設定するため画像を劣化させることなく記録および再生することができる。一方、背景などの動きの小さい部分では、フレームレートを下げることにより情報量の割り当てを少なくして記憶することができる。また、各合成画像を構成するフレームレートおよびフレーム間差分値に応じてGOP構造のM値、N値を最適化することによって、監視カメラシステムのような画面内の一部が動く画像を符号化する場合に効率的な符号化を行うことができ、記録時間を伸ばすことが可能となる。   As described above, in the image processing apparatus and the image reproduction apparatus according to Embodiment 1, a composite image is created by combining images from a plurality of cameras in order of increasing inter-frame difference values in units of local areas. Since the frame rate is determined according to the size of the inter-frame difference value of the local area to be used, a high frame rate is set for a portion with a large movement, so that the image can be recorded and reproduced without degrading the image. it can. On the other hand, in a portion with a small amount of motion such as the background, it is possible to store the information amount with less allocation by lowering the frame rate. In addition, by optimizing the M and N values of the GOP structure according to the frame rate and inter-frame difference values that make up each composite image, an image in which a part of the screen moves, such as a surveillance camera system, is encoded In this case, efficient encoding can be performed, and the recording time can be extended.

また、カメラにより撮影された画像信号と合成画像信号との数が同じとなる場合について示したが、カメラにより撮影された画像信号と合成画像信号との数が異なる場合でも同様の効果が得られる。   Also, the case where the number of image signals captured by the camera is the same as the number of composite image signals has been described, but the same effect can be obtained even when the number of image signals captured by the camera differs from the number of composite image signals. .

実施の形態2.
実施の形態1では、ローカルエリア特徴量算出部21〜2Nにおいて、各カメラからの画像信号101〜10Nと1フレーム前の画像信号111〜11Nとのフレーム間差分値141〜14Nを算出し、ある所定時間毎に合成画像を生成する組み合わせを決定していたが、実施の形態2ではカメラ毎のフレーム間差分値をある所定の時間分累算した値に基づいて、合成画像を生成する組み合わせを決定する例について示す。実施の形態2に係る画像処理装置および画像再生装置では、図1に示す実施の形態1に係る画像処理装置および画像再生装置に対してローカルエリア画像合成制御部31aにおいて各カメラからのフレーム間差分値141〜14Nを複数フレーム間にわたってローカルエリア単位で累算しておき、その値に基づいて画像合成情報161を出力する。この場合も、実施の形態1と同様の効果を得ることができる。また、実施の形態1に示す場合と比べ、監視対象物の移動が長い時間にわたる場合においても効率的な符号化が可能となる。
Embodiment 2. FIG.
In the first embodiment, the local area feature value calculation units 21 to 2N calculate inter-frame difference values 141 to 14N between the image signals 101 to 10N from each camera and the image signals 111 to 11N of the previous frame. In the second embodiment, a combination for generating a composite image is determined based on a value obtained by accumulating a difference value between frames for each camera for a predetermined time. An example of determination will be described. In the image processing device and the image reproduction device according to the second embodiment, the local area image composition control unit 31a compares the interframe difference from each camera with respect to the image processing device and the image reproduction device according to the first embodiment shown in FIG. The values 141 to 14N are accumulated in units of local areas over a plurality of frames, and the image composition information 161 is output based on the values. Also in this case, the same effect as in the first embodiment can be obtained. Compared to the case shown in the first embodiment, more efficient encoding is possible even when the movement of the monitoring object takes a long time.

実施の形態3.
実施の形態1および2では、ローカルエリア画像合成制御部31aおいて、各カメラからのローカルエリア単位のフレーム間差分値が大きい順に画像を組み合わせるよう画像合成情報161を生成し、各合成画像に適したフレームレート162を決定していたが、実施の形態3では、フレームレートは落とさずに合成画像の高周波成分を除去することにより符号化処理の効率化を図る場合について示す。
Embodiment 3 FIG.
In Embodiments 1 and 2, the local area image composition control unit 31a generates image composition information 161 so that images are combined in descending order of inter-frame difference values from each camera, and is suitable for each composite image. Although the frame rate 162 has been determined, Embodiment 3 shows a case where the encoding process is made more efficient by removing the high-frequency component of the composite image without reducing the frame rate.

図9は、実施の形態3に係る画像処理装置および画像再生装置の全体構成を表すブロック図である。図9において、図1に示す画像処理装置と同一の符号は、同一または相当の部分を表している。ローカルエリア画像合成制御部31bでは、出力するパラメータとしてフレームレートの代わりにフィルタ情報176を出力し、ローカルエリア画像合成処理部32bは、フィルタ情報176に従って一部の合成画像に対してフィルタ処理を行う。また、符号化制御部33は画像合成情報161およびフィルタ情報176に基づいて符号化パラメータとしてGOP構造163および量子化情報177を出力する。   FIG. 9 is a block diagram illustrating the overall configuration of the image processing apparatus and the image reproduction apparatus according to the third embodiment. 9, the same reference numerals as those in the image processing apparatus shown in FIG. 1 denote the same or corresponding parts. The local area image composition control unit 31b outputs filter information 176 instead of the frame rate as an output parameter, and the local area image composition processing unit 32b performs filter processing on a part of the synthesized image according to the filter information 176. . Also, the encoding control unit 33 outputs the GOP structure 163 and the quantization information 177 as encoding parameters based on the image synthesis information 161 and the filter information 176.

次に動作について説明する。実施の形態1に示す場合と同様に、カメラ1〜Nにより撮影された画像信号101〜10Nおよび1フレーム前の画像信号111〜11Nをそれぞれ複数のローカルエリアに分割し、ローカルエリア単位でフレーム間差分値141〜14Nを算出する。ローカルエリア画像合成制御部31bは、ローカルエリア単位のフレーム間差分値141〜14Nに基づいて合成画像を構成するローカルエリアの組合せ等の画像合成情報161を決定し、合成画像を構成するローカルエリアのフレーム間差分値が所定の時間内で常に閾値より小さい合成画像に対して、この合成画像を背景画像であると判定し、ローパスフィルタをかけて高周波成分を除去するようにフィルタ情報176を出力する。フィルタ情報176は、例えばフィルタのON/OFFを表すフラグや、フィルタの強度を示すレベルや、フィルタ係数から成る情報である。   Next, the operation will be described. Similarly to the case shown in the first embodiment, the image signals 101 to 10N captured by the cameras 1 to N and the image signals 111 to 11N one frame before are each divided into a plurality of local areas, and each frame is divided in units of local areas. Difference values 141 to 14N are calculated. The local area image composition control unit 31b determines image composition information 161 such as a combination of local areas composing the composite image based on the inter-frame difference values 141 to 14N in units of local areas, and determines the local area composing the composite image. For a composite image whose inter-frame difference value is always smaller than a threshold within a predetermined time, this composite image is determined to be a background image, and filter information 176 is output so as to remove a high-frequency component by applying a low-pass filter. . The filter information 176 is information including, for example, a flag indicating ON / OFF of the filter, a level indicating the strength of the filter, and a filter coefficient.

ローカルエリア画像合成処理部32bは、合成画像を生成する際にフィルタ情報176に従って一部の合成画像に対してフィルタ処理を行う。符号化制御部33では、合成画像に応じてフレームレートは変更しないため、全ての合成画像に対して例えばM値=3、N値=12のBピクチャを用いたGOP構造163にて符号化を行うよう指示を出す。また、高周波成分を落としたローカルエリア単位の画像については、原画よりもぼけて平坦な絵柄になっているため、通常の情報量制御にて決定する量子化幅よりも値を下げるよう量子化情報177を画像符号化器34に出力する。   The local area image composition processing unit 32b performs filter processing on a part of the composite image according to the filter information 176 when generating the composite image. The encoding control unit 33 does not change the frame rate according to the composite image, and therefore, for all composite images, for example, encoding is performed with the GOP structure 163 using B pictures with M value = 3 and N value = 12. Give instructions to do. In addition, the local area unit image with the high-frequency component dropped has a flatter pattern than the original image, so the quantization information is set to be lower than the quantization width determined by normal information amount control. 177 is output to the image encoder 34.

画像符号化器34は、GOP構造163および量子化情報177に従って、入力される合成画像信号164の並べ替えおよびフレーム間予測を用いた符号化を行い、可変長のビットストリーム165を出力し、記録媒体35に記録する。またビットストリーム165と共に、対応する画像合成情報161およびフレームレート162を、記録媒体35に記録しておく。   The image encoder 34 performs rearrangement of the input composite image signal 164 and encoding using inter-frame prediction according to the GOP structure 163 and the quantization information 177, and outputs a variable-length bit stream 165 for recording. Recording on the medium 35. In addition to the bit stream 165, the corresponding image composition information 161 and the frame rate 162 are recorded in the recording medium 35.

画像再生装置では、実施の形態1に示す場合と同様に、ビットストリーム169を復号し、ローカルエリア単位で画像を組み合わせて、元のカメラ1〜Nのうち所望のカメラから撮影および記録した復号画像175を生成し、モニタ42に出力して再生表示する。   In the image reproducing apparatus, as in the case of the first embodiment, the decoded image obtained by decoding the bit stream 169, combining the images in units of local areas, and taking and recording from a desired camera among the original cameras 1 to N. 175 is generated and output to the monitor 42 for reproduction display.

以上のように、実施の形態3に係る画像処理装置および画像再生装置ではフレーム間差分値が小さい合成画像について、背景画像と判定してローパスフィルタをかけて高周波成分を除去するようにしているので、背景部分への情報量の割り当てを少なくすることが可能となり、監視カメラシステムとして注目点となる動きの大きい部分(移動体)の画質を向上させる、または記録時間を伸ばすことが可能となる。   As described above, in the image processing apparatus and the image reproduction apparatus according to the third embodiment, a synthesized image with a small inter-frame difference value is determined as a background image and a high-frequency component is removed by applying a low-pass filter. Therefore, it is possible to reduce the allocation of the information amount to the background portion, and it is possible to improve the image quality of the portion (moving body) with a large movement that is a point of interest as the surveillance camera system, or to extend the recording time.

ここでは、合成画像のフレームレートを変えない場合について示したが、復号される画像の劣化が大きくなるものの、フレームレートを合成画像を構成するローカルエリアのフレーム間差分値に応じて制御しても良い。   Although the case where the frame rate of the composite image is not changed is shown here, although the degradation of the decoded image increases, the frame rate may be controlled according to the inter-frame difference value of the local area constituting the composite image. good.

実施の形態4.
実施の形態1〜3では、複数のカメラからの画像信号をローカルエリア単位で組み合わせて合成画像を作成および符号化していたが、実施の形態4に示す画像処理装置および画像再生装置では、複数のカメラからの画像間の相関性に応じて、符号化する順序を制御することによって、効率的な符号化を行う。
Embodiment 4 FIG.
In the first to third embodiments, a composite image is created and encoded by combining image signals from a plurality of cameras in units of local areas. However, in the image processing device and the image reproduction device shown in the fourth embodiment, a plurality of images are generated. Efficient encoding is performed by controlling the encoding order in accordance with the correlation between images from the camera.

図10は、実施の形態4に係る画像処理装置および画像再生装置の全体構成を表すブロック図である。図10において、図1に示す画像処理装置および画像再生装置と同一の符号は同一または相当の部分を示している。図10において、ローカルエリア特徴量算出部21〜2Nは画像信号101〜10Nのローカルエリア単位の画素平均値181〜18Nおよび画素偏差値191〜19Nを出力する。画像相関検出部43は、各カメラからのローカルエリア単位の画素平均値181〜18N、画素偏差値191〜19Nおよび時刻情報151〜15Nを参照して複数のカメラ間の相関性を検出して画像相関情報178を出力する。画像符号化順序制御部44は、画像相関情報178に基づいて、ある所定の時間単位でフレームメモリ部11〜1Nから読み出す画像信号121〜12Nを符号化する順序を決定して、選択された画像信号200と共に前フレームとの画像相関レベル179およびカメラ選択情報180を出力する。符号化制御部33は画像相関レベル179およびカメラ選択情報180に基づいて画像符号化を行う際のGOP構造163を決定する。記録媒体35はカメラ選択情報180およびビットストリーム165を記録するHDD等の装置である。   FIG. 10 is a block diagram illustrating the overall configuration of the image processing apparatus and the image reproduction apparatus according to the fourth embodiment. 10, the same reference numerals as those of the image processing apparatus and the image reproduction apparatus shown in FIG. 1 denote the same or corresponding parts. In FIG. 10, the local area feature amount calculation units 21 to 2N output pixel average values 181 to 18N and pixel deviation values 191 to 19N in units of local areas of the image signals 101 to 10N. The image correlation detection unit 43 refers to the average pixel values 181 to 18N, the pixel deviation values 191 to 19N, and the time information 151 to 15N in units of local areas from the respective cameras, and detects the correlation between the plurality of cameras. Correlation information 178 is output. Based on the image correlation information 178, the image encoding order control unit 44 determines the order in which the image signals 121 to 12N to be read from the frame memory units 11 to 1N are encoded in a predetermined time unit, and selects the selected image. An image correlation level 179 with the previous frame and camera selection information 180 are output together with the signal 200. The encoding control unit 33 determines the GOP structure 163 for performing image encoding based on the image correlation level 179 and the camera selection information 180. The recording medium 35 is a device such as an HDD that records the camera selection information 180 and the bit stream 165.

次に、画像再生装置の構成について説明する。図10において、画像復号器38は、ビットストリーム169を入力して画像復号手段により復号した画像信号202を出力し、再生画像読み出し制御部45は復号された画像信号202に対応するカメラ選択情報201および再生したいカメラ情報167を参照して、必要な画像信号175を選択するためのリード制御信号172を出力する。   Next, the configuration of the image playback device will be described. In FIG. 10, the image decoder 38 inputs the bit stream 169 and outputs the image signal 202 decoded by the image decoding means, and the reproduction image read control unit 45 performs camera selection information 201 corresponding to the decoded image signal 202. Then, referring to the camera information 167 to be reproduced, a read control signal 172 for selecting a necessary image signal 175 is output.

次に動作について説明する。実施の形態1と同様に、カメラ1〜Nにより撮影されたデジタル変換された画像信号101〜10Nをフレームメモリ部11〜1N内のメモリにフレーム単位で書き込む。ローカルエリア特徴量算出部21〜2Nは、画像信号101〜10Nを複数のローカルエリアに分割し、カメラ毎に画像信号101〜10Nの画素平均値181〜18Nおよび画素偏差値191〜19Nをローカルエリア単位で算出し、各カメラからの画像の特徴を抽出する。   Next, the operation will be described. Similar to the first embodiment, the digitally converted image signals 101 to 10N photographed by the cameras 1 to N are written into the memories in the frame memory units 11 to 1N in units of frames. The local area feature amount calculation units 21 to 2N divide the image signals 101 to 10N into a plurality of local areas, and obtain the pixel average values 181 to 18N and the pixel deviation values 191 to 19N of the image signals 101 to 10N for each camera. Calculate in units and extract image features from each camera.

画像相関検出部43は、任意の二つのカメラからのローカルエリア単位の画素平均値および画素偏差値に基づいて、任意の2フレームの画像の相関性を判定する。例えば、カメラ3台から撮影した画像の相関性を判定する例を図11に示す。図11は、カメラ1〜3の画像のうち2つのカメラ画像間の相関性を示している。まず、ローカルエリア単位の画素平均値および画素偏差値の2フレーム間の差分を算出し、各差分値をある所定の閾値にて複数のレベルに分類する。ここでは差分値が小さい場合のレベルを小さい値に設定し、0〜9の10通りにレベル分けした例を示している。次に各ローカルエリアのレベル値を1フレーム分累算し、累算値が小さい2フレームは相関性が高い画像と判定する。図11の例では、カメラ1と3の画素平均値および画素偏差値の差分値の累積値は73となり、相関性が一番高く(累算値が小さい)、カメラ1と2の画素平均値および画素偏差値の差分値の累積値は96となり、相関性が一番小さい(累算値が大きい)と判定される。画像相関検出部43では、所定の時間単位で任意の2フレーム間の相関性を判定し、判定結果を画像相関情報178として出力する。   The image correlation detection unit 43 determines the correlation between images of any two frames based on the pixel average value and pixel deviation value in local area units from any two cameras. For example, FIG. 11 shows an example of determining the correlation between images taken from three cameras. FIG. 11 shows the correlation between two camera images among the images of the cameras 1 to 3. First, a difference between two frames of a pixel average value and a pixel deviation value in local area units is calculated, and each difference value is classified into a plurality of levels with a predetermined threshold value. Here, an example is shown in which the level when the difference value is small is set to a small value and the level is divided into 10 levels from 0 to 9. Next, the level value of each local area is accumulated for one frame, and two frames having a small accumulated value are determined as images having high correlation. In the example of FIG. 11, the cumulative value of the difference value between the pixel average value and the pixel deviation value of the cameras 1 and 3 is 73, the correlation is the highest (the accumulated value is small), and the pixel average value of the cameras 1 and 2 The accumulated value of the difference values of the pixel deviation values is 96, and it is determined that the correlation is the smallest (the accumulated value is large). The image correlation detection unit 43 determines the correlation between any two frames in a predetermined time unit, and outputs the determination result as image correlation information 178.

画像符号化順序制御部44は、画像相関情報178に基づいて所定の時間内の全てのカメラ画像信号121〜12Nの中から相関性の高い順番に選択して、符号化を行う順番を決定する。図11に示す画像信号では、カメラ1とカメラ3の画像の相関性が最も高く、また、カメラ1と2よりカメラ2と3の画像の方が相関性が高いため、図12に示すようにカメラ1→カメラ3→カメラ2の順序で符号化を行うように決定する。フレームメモリ部11〜1Nから符号化順に応じて画像信号121〜12Nを読み出すよう、リード制御信号131〜13Nを生成し、選択された画像信号200と共に、前フレームとの画像相関レベル179およびカメラ選択情報180を出力する。尚、カメラ選択情報180は、カメラ番号およびカメラの時刻情報から構成される。   Based on the image correlation information 178, the image encoding order control unit 44 selects all the camera image signals 121 to 12N within a predetermined time in order of high correlation, and determines the encoding order. . In the image signal shown in FIG. 11, the correlation between the images of the camera 1 and the camera 3 is the highest, and the images of the cameras 2 and 3 are higher in correlation than the cameras 1 and 2. It decides to perform encoding in the order of camera 1 → camera 3 → camera 2. The read control signals 131 to 13N are generated so as to read the image signals 121 to 12N from the frame memory units 11 to 1N according to the encoding order, and the image correlation level 179 with the previous frame and the camera selection are selected together with the selected image signal 200. Information 180 is output. The camera selection information 180 includes a camera number and camera time information.

符号化制御部33は、画像相関レベル179に基づいて画像信号200を符号化する際のGOP構造163を決定する。前フレームとの相関性が高い画像の場合は、フレーム間予測を行うPまたはBピクチャによる符号化を行い、相関性が低い画像の場合はフレーム内予測を行うIピクチャによる符号化を行うよう指示する。図11に示す画像信号では、カメラ1からカメラ3の画像に切り替わる部分では、両画像の相関性は高いため、フレーム間予測を用いた符号化を行い、カメラ3からカメラ2に切り替わる部分では、両画像の相関性は低いためフレーム間予測を用いない符号化を行う。これにより、単純にカメラ1→カメラ2→カメラ3の順序で符号化した場合と比べて、効率的な符号化が可能となる。また、記録媒体35には、画像符号化器34にて符号化されたビットストリーム165と共に、対応する画像信号のカメラ選択情報180も記録しておく。以上が、画像処理装置の動作となる。   The encoding control unit 33 determines the GOP structure 163 for encoding the image signal 200 based on the image correlation level 179. Instructs to encode using P or B picture for inter-frame prediction when the image is highly correlated with the previous frame, and to encode using I picture for intra-frame prediction for images with low correlation To do. In the image signal shown in FIG. 11, since the correlation between both images is high at the portion where the camera 1 is switched to the image of the camera 3, encoding using inter-frame prediction is performed, and at the portion where the camera 3 is switched to the camera 2, Since the correlation between the two images is low, encoding without using inter-frame prediction is performed. As a result, the encoding can be performed more efficiently than when the encoding is simply performed in the order of camera 1 → camera 2 → camera 3. In addition to the bit stream 165 encoded by the image encoder 34, camera selection information 180 of the corresponding image signal is also recorded on the recording medium 35. The above is the operation of the image processing apparatus.

次に、画像再生装置の動作について説明する。実施の形態1の場合と同様に、ストリーム読み出し制御部37は、ユーザーからの指示に従い時刻情報166に基づいて記録媒体35に記録されているデータのうち必要なビットストリーム169、および、カメラ選択情報201を読み出すためのリード制御信号168を出力し、記録媒体35から対応するデータを読み出す。画像復号器38は、ビットストリーム169について画像復号を行い、画像信号202をフレームメモリ部40に書き込む。再生画像読み出し制御部45は、復号された画像信号202に対応するカメラ選択情報201および再生したいカメラ情報167を参照して、フレームメモリ部40へのリード制御信号172を出力し、元のカメラ1〜Nのうち所望のカメラから撮影および記録した復号画像175をモニタ42に出力して再生表示する。   Next, the operation of the image playback device will be described. As in the case of the first embodiment, the stream read control unit 37 performs the necessary bit stream 169 among the data recorded on the recording medium 35 based on the time information 166 according to the instruction from the user, and the camera selection information. A read control signal 168 for reading 201 is output, and corresponding data is read from the recording medium 35. The image decoder 38 performs image decoding on the bit stream 169 and writes the image signal 202 in the frame memory unit 40. The playback image read control unit 45 refers to the camera selection information 201 corresponding to the decoded image signal 202 and the camera information 167 to be played back, and outputs a read control signal 172 to the frame memory unit 40, so that the original camera 1 The decoded image 175 photographed and recorded from a desired camera among -N is output to the monitor 42 and reproduced and displayed.

以上のように、実施の形態4に係る画像処理装置および画像再生装置では複数のカメラからの画像をある所定の時間内で相関性の高い順序で符号化するよう制御し、相関性の大きさに応じてGOP構造を決定するようにしているので、複数のカメラからの入力順に従って符号化を行う場合に比べて効率的な符号化を行うことができ、記録時間を伸ばすことが可能となる。   As described above, the image processing apparatus and the image reproduction apparatus according to the fourth embodiment control to encode images from a plurality of cameras in a highly correlated order within a predetermined time, and the magnitude of the correlation. Since the GOP structure is determined according to the encoding, more efficient encoding can be performed and the recording time can be extended compared to the case where encoding is performed according to the input order from a plurality of cameras. .

ここでは、異なるカメラからの画像信号間の相関性を求める指標として、画素平均値および画素偏差値を用いたが、ローカルエリアごとの画素の差分値の累積値や2乗和を用いてもよい。   Here, the pixel average value and the pixel deviation value are used as indices for obtaining the correlation between image signals from different cameras. However, a cumulative value or sum of squares of pixel difference values for each local area may be used. .

1〜N カメラ、11〜1N フレームメモリ部、21〜2N ローカルエリア特徴量算出部、31a,31b ローカルエリア画像合成制御部、32a,32b ローカルエリア画像合成処理部、33 符号化制御部、34 画像符号化器、35 記録媒体、36 ユーザーインターフェース部、37 ストリーム読み出し制御部、38 画像復号器、39 ローカルエリア画像再合成制御部、40 フレームメモリ部、41 ローカルエリア画像再合成処理部、42 モニタ、43 画像相関検出部、44 画像符号化順序制御部、45 再生画像読み出し制御部、101〜10N 画像信号、111〜11N 1フレーム前の画像信号、121〜12N 画像信号、131〜13N リード制御信号、141〜14N フレーム間差分値、151〜15N 時刻情報、161 画像合成情報、162 フレームレート、163 GOP構造、164 合成画像信号、165 ビットストリーム、166 時刻情報、167 カメラ情報、168 リード制御信号、169 ビットストリーム、170 画像合成情報、171 合成画像信号、172 リード制御信号、173 合成画像信号、174 画像再合成情報、175 復号画像信号、176 フィルタ情報、177 量子化情報、178 画像相関情報、179 画像相関レベル、180 カメラ選択情報、181〜18N 画素平均値、191〜19N 画素偏差値、200 画像信号、201 カメラ選択情報、202 画像信号。 1-N camera, 11-1N frame memory unit, 21-2N local area feature amount calculation unit, 31a, 31b local area image composition control unit, 32a, 32b local area image composition processing unit, 33 encoding control unit, 34 image Encoder, 35 recording medium, 36 user interface unit, 37 stream read control unit, 38 image decoder, 39 local area image recombination control unit, 40 frame memory unit, 41 local area image recombination processing unit, 42 monitor, 43 image correlation detection unit, 44 image coding order control unit, 45 reproduction image read control unit, 101 to 10N image signal, 111 to 11N one frame previous image signal, 121 to 12N image signal, 131 to 13N read control signal, 141-14N Inter-frame difference value, 151-15N Time information, 161 image composition information, 162 frame rate, 163 GOP structure, 164 composite image signal, 165 bit stream, 166 time information, 167 camera information, 168 read control signal, 169 bit stream, 170 image composition information, 171 composite image Signal, 172 Read control signal, 173 Composite image signal, 174 Image recombination information, 175 Decoded image signal, 176 Filter information, 177 Quantization information, 178 Image correlation information, 179 Image correlation level, 180 Camera selection information, 181-18N Pixel average value, 191 to 19N pixel deviation value, 200 image signal, 201 camera selection information, 202 image signal.

Claims (13)

動画像を撮影する複数の撮像手段と、
前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、前記ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、
算出した前記フレーム間差分値に基づいて前記ローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、
前記合成画像を構成する前記ローカルエリアの前記フレーム間差分値に基づいて、前記合成画像のフレームレートを制御するフレームレート制御手段と、
前記合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、
を備えたことを特徴とする画像処理装置。
A plurality of imaging means for capturing moving images;
A feature amount calculating unit that divides a plurality of image signals generated from moving images captured by the plurality of imaging units into a plurality of local areas, and calculates inter-frame difference values for each local area;
Image combining means for combining the images of the local area based on the calculated inter-frame difference value and generating a plurality of combined images;
Frame rate control means for controlling the frame rate of the composite image based on the inter-frame difference value of the local area constituting the composite image;
Image encoding means for performing encoding using inter-frame prediction on the synthesized image and generating a bitstream;
An image processing apparatus comprising:
前記フレームレートおよび前記合成画像を構成する前記ローカルエリアの前記フレーム間差分値に基づいて、前記合成画像の画像符号化におけるGOP(Group Of Pictures)構造を決定する符号化制御手段を備え、
前記画像符号化手段は前記GOP構造に基づいて画像符号化を行うこと、
を特徴とする請求項1記載の画像処理装置。
Coding control means for determining a GOP (Group Of Pictures) structure in image coding of the synthesized image based on the frame rate and the inter-frame difference value of the local area constituting the synthesized image;
The image encoding means performs image encoding based on the GOP structure;
The image processing apparatus according to claim 1.
前記画像合成手段は、前記複数のローカルエリアの前記フレーム間差分値の大きさの順で前記ローカルエリアの画像を分類し、分類ごとに前記ローカルエリアの画像を組み合わせて前記複数の合成画像を生成することを特徴とする請求項1または2のいずれかに記載の画像処理装置。   The image synthesizing unit classifies the images of the local area in order of the magnitude of the inter-frame difference values of the plurality of local areas, and generates the plurality of synthesized images by combining the images of the local area for each classification. The image processing apparatus according to claim 1, wherein the image processing apparatus is an image processing apparatus. 前記フレームレート制御手段は、前記合成画像に対して、他の前記合成画像であって、構成する前記ローカルエリアの前記フレーム間差分値が前記合成画像より大きい他の前記合成画像のフレームレートより落としたフレームレートを決定することを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。   The frame rate control means is different from the composite image in a frame rate of another composite image that is different from the composite image in that the inter-frame difference value of the local area to be configured is larger than the composite image. The image processing apparatus according to claim 1, wherein the frame rate is determined. 前記画像合成手段は、前記フレーム間差分値を複数フレーム分累算した値の大きさに基づいて、前記ローカルエリアの画像を組み合わせることを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。   The said image synthetic | combination means combines the image of the said local area based on the magnitude | size of the value which accumulated the said frame difference value for several frames, The any one of Claims 1-4 characterized by the above-mentioned. Image processing apparatus. 動画像を撮影する複数の撮像手段と、
前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、前記ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、
算出した前記フレーム間差分値に基づいて前記ローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、
前記合成画像を構成する前記ローカルエリアのフレーム間差分値に基づいて、前記合成画像の高周波成分を除去するフィルタ手段と、
前記複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、
を備えたことを特徴とする画像処理装置。
A plurality of imaging means for capturing moving images;
A feature amount calculating unit that divides a plurality of image signals generated from moving images captured by the plurality of imaging units into a plurality of local areas, and calculates inter-frame difference values for each local area;
Image combining means for combining the images of the local area based on the calculated inter-frame difference value and generating a plurality of combined images;
Filter means for removing high-frequency components of the composite image based on inter-frame difference values of the local area constituting the composite image;
Image encoding means for performing encoding using inter-frame prediction on the plurality of synthesized images and generating a bitstream;
An image processing apparatus comprising:
前記フィルタ手段は、前記合成画像を構成する前記ローカルエリアの前記フレーム間差分値が所定値より小さい前記合成画像に対して、高周波成分を除去することを特徴とする請求項6記載の画像処理装置。   The image processing apparatus according to claim 6, wherein the filter unit removes a high frequency component from the composite image in which the inter-frame difference value of the local area constituting the composite image is smaller than a predetermined value. . 前記画像符号化手段は、前記合成画像を構成する前記ローカルエリアの前記フレーム間差分値に基づいて、前記合成画像の量子化幅を制御することを特徴とする請求項6または7に記載の画像処理装置。   The image according to claim 6 or 7, wherein the image encoding means controls a quantization width of the composite image based on the inter-frame difference value of the local area constituting the composite image. Processing equipment. 前記画像符号化手段は、構成する前記ローカルエリアの前記フレーム間差分値が所定値以下となる前記合成画像に対して、量子化幅を下げることを特徴とする請求項8記載の画像処理装置。   The image processing apparatus according to claim 8, wherein the image encoding unit lowers a quantization width for the synthesized image in which the inter-frame difference value of the local area to be configured is equal to or less than a predetermined value. 複数の画像信号を構成するローカルエリアの画像を組み合わせて生成した複数の合成画像から、前記画像信号を構成する前記ローカルエリアの画像を抽出する画像抽出手段と、
抽出した前記ローカルエリアの画像を合成して前記画像信号を生成する画像再合成手段と、
前記生成された画像信号をモニタに表示する画像表示手段とを備え、
前記合成画像は、前記複数のローカルエリアの画像のフレーム間差分値に基づいて、前記ローカルエリア画像を組み合わせて合成された合成画像であること、
を特徴とする画像再生装置。
Image extracting means for extracting the image of the local area constituting the image signal from a plurality of synthesized images generated by combining the images of the local area constituting the plurality of image signals;
Image recombining means for generating the image signal by combining the extracted images of the local area;
Image display means for displaying the generated image signal on a monitor;
The composite image is a composite image synthesized by combining the local area images based on inter-frame difference values of the images of the plurality of local areas;
An image reproducing apparatus characterized by the above.
動画像を撮影する複数の撮像手段と、
前記複数の撮像手段により撮影された動画像より生成された複数の画像信号をそれぞれ複数のローカルエリアに分割し、前記ローカルエリアごとに前記複数の画像信号の相関性を算出する相関性算出手段と、
前記算出した相関性に基づいて、前記画像信号を符号化する順序およびGOP構造を決定する符号化制御手段と、
前記符号化する順序および前記GOP構造に基づいてフレーム間予測を用いて前記画像信号を符号化し、ビットストリームを出力する画像符号化手段と、
を備えたことを特徴とする画像処理装置。
A plurality of imaging means for capturing moving images;
A correlation calculating unit that divides a plurality of image signals generated from moving images captured by the plurality of imaging units into a plurality of local areas, respectively, and calculates a correlation of the plurality of image signals for each local area; ,
An encoding control means for determining an order and a GOP structure for encoding the image signals based on the calculated correlation;
Image encoding means for encoding the image signal using inter-frame prediction based on the encoding order and the GOP structure, and outputting a bitstream;
An image processing apparatus comprising:
画像信号の符号化を行う画像処理装置と、符号化された前記画像信号を復号およびモニタに再生する画像再生装置を備える画像処理システムであって、
前記画像処理装置は、
動画像を撮影する複数の撮像手段と、
前記複数の撮像手段により撮影された動画像より生成された前記複数の画像信号をそれぞれ複数のローカルエリアに分割し、前記ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、
算出した前記フレーム間差分値に基づいて前記ローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、
前記合成画像を構成する前記ローカルエリアの前記フレーム間差分値に基づいて、前記合成画像のフレームレートを制御するフレームレート制御手段と、
前記複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、
前記ビットストリームおよび前記合成画像を構成する前記ローカルエリアの組合せを記憶する画像記憶手段と、
を備え、
前記画像再生装置は、
前記画像記憶手段から前記ビットストリームおよび前記ローカルエリアの組合せを取得するデータ取得手段と、
前記データ取得手段により取得した前記ビットストリームを復号し、合成画像を生成する画像復号手段と、
復号された前記合成画像から、前記ローカルエリアの組合せに基づいて前記画像信号を構成する前記ローカルエリアの画像を抽出する画像抽出手段と、
抽出した前記ローカルエリアの画像を合成して前記画像信号を生成する画像再合成手段と、
前記生成された画像信号をモニタに表示する画像表示手段と、
を備えることを特徴とする画像処理システム。
An image processing system comprising: an image processing device that encodes an image signal; and an image reproduction device that decodes and reproduces the encoded image signal on a monitor,
The image processing apparatus includes:
A plurality of imaging means for capturing moving images;
A feature amount calculating unit that divides the plurality of image signals generated from the moving images captured by the plurality of imaging units into a plurality of local areas, and calculates inter-frame difference values for each local area;
Image combining means for combining the images of the local area based on the calculated inter-frame difference value and generating a plurality of combined images;
Frame rate control means for controlling the frame rate of the composite image based on the inter-frame difference value of the local area constituting the composite image;
Image encoding means for performing encoding using inter-frame prediction on the plurality of synthesized images and generating a bitstream;
Image storage means for storing a combination of the bit stream and the local area constituting the composite image;
With
The image reproduction device includes:
Data acquisition means for acquiring a combination of the bitstream and the local area from the image storage means;
Image decoding means for decoding the bitstream acquired by the data acquisition means and generating a composite image;
Image extracting means for extracting an image of the local area constituting the image signal from the decoded composite image based on a combination of the local areas;
Image recombining means for generating the image signal by combining the extracted images of the local area;
Image display means for displaying the generated image signal on a monitor;
An image processing system comprising:
画像信号の符号化を行う画像処理装置と、符号化された前記画像信号を復号およびモニタに再生する画像再生装置を備える画像処理システムであって、
前記画像処理装置は、
動画像を撮影する複数の撮像手段と、
前記複数の撮像手段により撮影された動画像より生成された前記複数の画像信号をそれぞれ複数のローカルエリアに分割し、前記ローカルエリアごとにフレーム間差分値を算出する特徴量算出手段と、
算出した前記フレーム間差分値に基づいて前記ローカルエリアの画像を組み合わせ、複数の合成画像を生成する画像合成手段と、
前記合成画像を構成する前記ローカルエリアのフレーム間差分値に基づいて、前記合成画像の高周波成分を除去するフィルタ手段と、
前記複数の合成画像に対してフレーム間予測を用いた符号化を行い、ビットストリームを生成する画像符号化手段と、
前記ビットストリームおよび前記合成画像を構成する前記ローカルエリアの組合せを記憶する画像記憶手段と、
を備え、
前記画像再生装置は、
前記画像記憶手段から前記ビットストリームおよび前記ローカルエリアの組合せを取得するデータ取得手段と、
前記データ取得手段により取得した前記ビットストリームを復号し、合成画像を生成する画像復号手段と、
復号された前記合成画像から、前記ローカルエリアの組合せに基づいて前記画像信号を構成する前記ローカルエリアの画像を抽出する画像抽出手段と、
抽出した前記ローカルエリアの画像を合成して前記画像信号を生成する画像再合成手段と、
前記生成された画像信号をモニタに表示する画像表示手段と、
を備えることを特徴とする画像処理システム。
An image processing system comprising: an image processing device that encodes an image signal; and an image reproduction device that decodes and reproduces the encoded image signal on a monitor,
The image processing apparatus includes:
A plurality of imaging means for capturing moving images;
A feature amount calculating unit that divides the plurality of image signals generated from the moving images captured by the plurality of imaging units into a plurality of local areas, and calculates inter-frame difference values for each local area;
Image combining means for combining the images of the local area based on the calculated inter-frame difference value and generating a plurality of combined images;
Filter means for removing high-frequency components of the composite image based on inter-frame difference values of the local area constituting the composite image;
Image encoding means for performing encoding using inter-frame prediction on the plurality of synthesized images and generating a bitstream;
Image storage means for storing a combination of the bit stream and the local area constituting the composite image;
With
The image reproduction device includes:
Data acquisition means for acquiring a combination of the bitstream and the local area from the image storage means;
Image decoding means for decoding the bitstream acquired by the data acquisition means and generating a composite image;
Image extracting means for extracting an image of the local area constituting the image signal from the decoded composite image based on a combination of the local areas;
Image recombining means for generating the image signal by combining the extracted images of the local area;
Image display means for displaying the generated image signal on a monitor;
An image processing system comprising:
JP2010060731A 2010-03-17 2010-03-17 Image processing unit, image reproducing unit, and image processing system Pending JP2011199354A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010060731A JP2011199354A (en) 2010-03-17 2010-03-17 Image processing unit, image reproducing unit, and image processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010060731A JP2011199354A (en) 2010-03-17 2010-03-17 Image processing unit, image reproducing unit, and image processing system

Publications (1)

Publication Number Publication Date
JP2011199354A true JP2011199354A (en) 2011-10-06

Family

ID=44877070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010060731A Pending JP2011199354A (en) 2010-03-17 2010-03-17 Image processing unit, image reproducing unit, and image processing system

Country Status (1)

Country Link
JP (1) JP2011199354A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126518A (en) * 2013-12-27 2015-07-06 キヤノン株式会社 Imaging apparatus, image processing apparatus, image processing method, program
JP2018082333A (en) * 2016-11-17 2018-05-24 Kddi株式会社 Worker terminal of remote work support system and supporter terminal
WO2022123829A1 (en) * 2020-12-08 2022-06-16 シャープ株式会社 Encoding device, display device, moving image system, program, and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126518A (en) * 2013-12-27 2015-07-06 キヤノン株式会社 Imaging apparatus, image processing apparatus, image processing method, program
JP2018082333A (en) * 2016-11-17 2018-05-24 Kddi株式会社 Worker terminal of remote work support system and supporter terminal
WO2022123829A1 (en) * 2020-12-08 2022-06-16 シャープ株式会社 Encoding device, display device, moving image system, program, and recording medium

Similar Documents

Publication Publication Date Title
JP6670812B2 (en) Encoding device and encoding method
JP4849130B2 (en) Image processing apparatus, image processing method, and program
TWI571104B (en) Image processing device, image processing method, image processing program, and recording medium
US6928234B2 (en) Picture recording apparatus and method thereof
JP4799438B2 (en) Image recording apparatus, image recording method, image encoding apparatus, and program
US20050238243A1 (en) Image coding apparatus
JP2008536438A (en) Method and apparatus for decoding video signal using reference picture
WO2014010224A1 (en) Video compression device, video decoding device, image compression device, image decoding device, imaging device, and program
KR102477784B1 (en) Image processing device and image processing method
KR100883603B1 (en) Method and apparatus for decoding video signal using reference pictures
KR20190003497A (en) Image processing apparatus and image processing method
KR102649023B1 (en) Decoding method and device, and encoding method and device
JP2009021983A (en) Monitor image recording apparatus
JPWO2018173873A1 (en) Encoding device and encoding method, and decoding device and decoding method
JP2005184419A (en) Video signal encoder and video signal recorder
JP2011199354A (en) Image processing unit, image reproducing unit, and image processing system
US20090052551A1 (en) Method and apparatus for coding moving image and imaging system
US20060120459A1 (en) Method for coding vector refinement information required to use motion vectors in base layer pictures when encoding video signal and method for decoding video data using such coded vector refinement information
JP5199956B2 (en) Image decoding apparatus and control method thereof
JP2006109114A (en) Image data compression equipment
JP2006203744A (en) Still image generating apparatus and still image generation method
JP5974691B2 (en) MOVING IMAGE COMPRESSION DEVICE, IMAGING DEVICE, AND PROGRAM
JP5165084B2 (en) Image encoding device
JP4422629B2 (en) Moving picture encoding apparatus, decoding apparatus, moving picture recording apparatus, and moving picture reproduction apparatus
JP2011055023A (en) Image encoding device and image decoding device