JP2006080832A - Image transcoder - Google Patents

Image transcoder Download PDF

Info

Publication number
JP2006080832A
JP2006080832A JP2004262043A JP2004262043A JP2006080832A JP 2006080832 A JP2006080832 A JP 2006080832A JP 2004262043 A JP2004262043 A JP 2004262043A JP 2004262043 A JP2004262043 A JP 2004262043A JP 2006080832 A JP2006080832 A JP 2006080832A
Authority
JP
Japan
Prior art keywords
image
quality
area
data
transcoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004262043A
Other languages
Japanese (ja)
Inventor
Toshihiko Hata
淑彦 秦
Naoki Kuwabara
直樹 桑原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004262043A priority Critical patent/JP2006080832A/en
Publication of JP2006080832A publication Critical patent/JP2006080832A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image transcoder capable of enhancing a compression rate of image coded data while maintaining subject quality of an image. <P>SOLUTION: The image transcoder includes: an image input means 21 for receiving coded image data 22; a quality setting means 23 for outputting region quality information 25 comprising information for setting at least temporal image quality by each region on the basis of target region information 24 comprising information of an image region and information for denoting a notice degree by each image region; a coding conversion means 26 for converting the received image data 22 into image coded data 28 with image quality on the basis of the region quality information 25 by each image region, and an image output means 27 for outputting the image coded data 28. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、符号化された画像データを変換する画像トランスコーダに係る発明に関するものである。   The present invention relates to an image transcoder for converting encoded image data.

画像トランスコーダは、符号化された画像データを入力し、それとは異なるビットレートや符号化方式の画像符号化データに変換する装置である。例えば、非特許文献1に示す画像トランスコーダでは、画像データの全領域を一律の空間的な画像品質で変換するのではなく、画像データのうち注目度合いの高い画像領域の空間的な画像品質を高くし、それ以外の画像領域である背景の空間的な画像品質を低くする画質変更型の変換が行われている。ここで、空間的な画像品質とは、画像の高周波成分を保存するレベルや画像の解像度などがある。   An image transcoder is a device that receives encoded image data and converts the encoded image data into image encoded data having a different bit rate or encoding method. For example, the image transcoder shown in Non-Patent Document 1 does not convert the entire area of the image data with a uniform spatial image quality, but the spatial image quality of an image area with a high degree of attention in the image data. An image quality change type conversion is performed to increase the image quality and decrease the spatial image quality of the background, which is the other image area. Here, the spatial image quality includes a level at which a high-frequency component of an image is stored and an image resolution.

また、非特許文献1に示す画像トランスコーダでは、背景は削除して画像データの注目度合いの高い画像領域のみ高い空間的な画像品質で変換する領域切取型の変換も行われている。このような画質変更型及び領域切取型の変換を行うことによって、送信する画像データのデータ量を減らしビットレートを低減することで、限られた伝送帯域のネットワークであっても遠隔から見たい画像領域をより詳細に観察できるようにしている。   Further, in the image transcoder shown in Non-Patent Document 1, region cropping type conversion is performed in which the background is deleted and only an image region having a high degree of attention of image data is converted with high spatial image quality. By performing such image quality change type and area cropping type conversion, the amount of image data to be transmitted is reduced and the bit rate is reduced. The region can be observed in more detail.

桑原直樹、外3名,「監視用途向け映像ゲートウェイ」,電子情報通信学会技術研究報告,平成15年9月,IE2003−57,pp.13−18Naoki Kuwabara, 3 others, “Video Gateway for Surveillance Applications”, IEICE Technical Report, September 2003, IE2003-57, pp. 13-18

セキュリティ監視や道路監視では、歩行者や車両等の移動体の存在する画像データの領域は高い優先度を持ち、ほとんど動きのない背景領域は低い優先度を有する。しかし、非特許文献1に示す画像トランスコーダで画質変更型の変換を行うと、背景領域において空間的な画像品質のみを変換してデータ量を減らすため、画像データの圧縮に限界があった。また、非特許文献1に示す画像トランスコーダで領域切取型の変換を行うと、背景領域が表示されず周囲の様子が全く分からないため、監視者が当該データのみでは状況を把握しづらいという画像の主観品質が低下する問題があった。   In security monitoring and road monitoring, image data areas where moving objects such as pedestrians and vehicles have high priority, and background areas with little movement have low priority. However, when image quality change type conversion is performed by the image transcoder shown in Non-Patent Document 1, only the spatial image quality is converted in the background area to reduce the amount of data, so that there is a limit to the compression of image data. In addition, when the region cropping type conversion is performed by the image transcoder shown in Non-Patent Document 1, the background region is not displayed and the surrounding state is not known at all. There was a problem that the subjective quality of

そこで、本発明は、上記のような問題点を解決するためになされたものであり、画像の主観品質を維持しつつ、各領域の注目度合いに応じて画像符号化データの圧縮率を高める画像トランスコーダを提供することを目的とする。   Accordingly, the present invention has been made to solve the above-described problems, and is an image that increases the compression rate of the encoded image data according to the degree of attention of each region while maintaining the subjective quality of the image. The purpose is to provide a transcoder.

本発明に係る解決手段は、符号化された画像データを入力する画像入力手段と、画像領域の情報と、画像領域毎にその注目度合いを示す情報とからなる注目領域情報に基づき、画像領域毎に少なくとも時間的な画像品質を設定する情報からなる領域品質情報を出力する品質設定手段と、入力された画像データを、画像領域毎に領域品質情報に基づく画像品質を持つ画像符号化データに変換する符号化変換手段と、画像符号化データを出力する画像出力手段とを備える。   The solving means according to the present invention is based on attention area information including image input means for inputting encoded image data, information on the image area, and information indicating the degree of attention for each image area. Quality setting means for outputting area quality information consisting of information for setting at least temporal image quality, and converting the input image data into image encoded data having image quality based on the area quality information for each image area Encoding conversion means for performing image output, and image output means for outputting encoded image data.

本発明に記載の画像トランスコーダは、領域の注目度合いに基づき、空間的な画像品質だけでなく時間的な画像品質も変化させて、入力された画像データを画像符号化データに変換するので、画像の主観品質を維持しつつ、画像符号化データの圧縮率を高め、より小さな出力ビットレートを達成できる効果がある。   Since the image transcoder described in the present invention changes not only the spatial image quality but also the temporal image quality based on the attention degree of the region, the input image data is converted into image encoded data. While maintaining the subjective quality of the image, it is possible to increase the compression rate of the encoded image data and achieve a smaller output bit rate.

(実施の形態1)
図1は、本実施の形態1に係る画像トランスコーダが適用される画像監視システムのシステム構成図である。この画像監視システムでは、道路や河川、ビルや空港等を監視するために複数のカメラ1が設置され、各カメラからのアナログ画像信号が各カメラに設けられたネットワークエンコーダ2によりMotion JPEG(Joint Photographic Expert Group)やMPEG-2(Motion Picture Expert Group phase 2)などの画像符号化データに符号化され、防災ネットワーク3に配信される。配信された画像データは、監視室に設置された画像表示端末4で復号・表示されるとともに、画像蓄積・配信サーバ5に記録される。通常、警備員が観察する画像は高品質であることが要求されるため、出力ビットレートが数Mbps以上の画像符号化データが採用され、防災ネットワーク3も100Mbpsや1Gbpsクラスの広帯域ネットワークが使用される。
(Embodiment 1)
FIG. 1 is a system configuration diagram of an image monitoring system to which the image transcoder according to the first embodiment is applied. In this image monitoring system, a plurality of cameras 1 are installed to monitor roads, rivers, buildings, airports, etc., and an analog image signal from each camera is connected to a motion encoder JPEG (Joint Photographic) by a network encoder 2 provided in each camera. It is encoded into encoded image data such as Expert Group) or MPEG-2 (Motion Picture Expert Group phase 2) and distributed to the disaster prevention network 3. The distributed image data is decoded and displayed by the image display terminal 4 installed in the monitoring room, and is recorded in the image storage / distribution server 5. Usually, the images observed by security guards are required to be of high quality, so image encoded data with an output bit rate of several Mbps or higher is adopted, and the disaster prevention network 3 also uses a broadband network of 100 Mbps or 1 Gbps class. The

一方、伝送帯域制限された事務用ネットワーク8経由して、ビルのオーナがオフィスの事務用端末9で現場を見る場合、あるいは狭帯域な公衆網10経由してモバイル端末11や自宅のパソコン12で現場を見る場合には、数Mbps以上の画像データをそのまま伝送するわけにはいかない。そのため、画像監視システムでは、ネットワークトランスコーダ6を設け、入力された高ビットレートの画像符号化データを、低ビットレートの画像符号化データに符号化変換(トランスコード)した後、ゲートウェイ7を経由して事務用ネットワーク8に配信する。   On the other hand, when the owner of a building views the site at the office terminal 9 in the office via the office network 8 whose transmission bandwidth is limited, or on the mobile terminal 11 or the personal computer 12 at home via the narrow-band public network 10. When viewing the site, image data of several Mbps or more cannot be transmitted as it is. Therefore, in the image monitoring system, the network transcoder 6 is provided, and the input high bit rate image encoded data is encoded and converted (transcoded) into the low bit rate image encoded data, and then passed through the gateway 7. And distributed to the office network 8.

そして、本実施の形態に係る画像トランスコーダでは、ネットワークトランスコーダ6に実装されている。画像トランスコーダの実装方法には、ソフトウェア的に実装する方法やハードウェア的に実装する方法を含め種々の方法がある。例えば、ネットワークトランスコーダ6本体はネットワーク機能を有する通常のパソコンを用い、画像トランスコーダをソフトウェアとしてパソコンに実装する。本発明では、画像トランスコーダの実装する方法に制限はない。   The image transcoder according to the present embodiment is mounted on the network transcoder 6. There are various image transcoder mounting methods including a software mounting method and a hardware mounting method. For example, the network transcoder 6 main body uses a normal personal computer having a network function, and the image transcoder is mounted on the personal computer as software. In the present invention, there is no limitation on the method of mounting the image transcoder.

図2は、本実施の形態に係る画像トランスコーダのブロック図である。まず、図2に示す画像トランスコーダでは、ネットワークエンコーダ2で符号化された画像データ22が画像入力手段21に入力され、画像入力手段21が画像データ22を符号化変換手段26に渡す。一方、品質設定手段23は、注目領域情報24が入力され、各領域の注目度合いに応じて領域毎に時間的・空間的な画像品質を設定する。そして、品質設定手段23は、設定した画像品質の情報を領域品質情報25として符号化変換手段26に出力する。符号化変換手段26は、領域品質情報25をパラメータとして用いて、画像データ22を符号化変換処理する。   FIG. 2 is a block diagram of the image transcoder according to the present embodiment. First, in the image transcoder shown in FIG. 2, the image data 22 encoded by the network encoder 2 is input to the image input means 21, and the image input means 21 passes the image data 22 to the encoding conversion means 26. On the other hand, the quality setting means 23 receives the attention area information 24 and sets temporal and spatial image quality for each area according to the attention level of each area. Then, the quality setting unit 23 outputs the set image quality information as region quality information 25 to the encoding conversion unit 26. The encoding conversion means 26 performs encoding conversion processing on the image data 22 using the area quality information 25 as a parameter.

符号化変換手段26は、与えられた領域品質情報25に基づいて、画像データ22とは異なる画像品質や符号化形式を有する画像符号化データ28に符号化変換する。特に、画像品質に関して、注目度合いの高い領域(注目領域)では、空間的な画像品質が高く、時間的な画像品質も高くなるよう符号化変換される。つまり、注目領域では、静止画として十分な解像度と、高いフレームレート有している。一方、注目領域以外の背景等の領域では、時間的・空間的な画像品質はともに低くなるよう符号化変換される。画像出力手段27は、符号化変換手段26で変換された画像符号化データ28を受け取り、図示していないネットワークトランスコーダ6の送信手段を介してゲートウェイ7に出力する。   The encoding conversion means 26 encodes and converts it into image encoded data 28 having an image quality and encoding format different from the image data 22 based on the given region quality information 25. In particular, with regard to image quality, in an area with a high degree of attention (attention area), encoding conversion is performed so that the spatial image quality is high and the temporal image quality is also high. That is, the attention area has a resolution sufficient for a still image and a high frame rate. On the other hand, in regions such as the background other than the region of interest, coding conversion is performed so that both temporal and spatial image quality is low. The image output means 27 receives the encoded image data 28 converted by the encoding conversion means 26 and outputs it to the gateway 7 via the transmission means of the network transcoder 6 (not shown).

ネットワークトランスコーダ6は、ネットワークエンコーダ2からストリーム形式で配信される画像データ22を受信し、逐次符号化変換を行ってネットワークに配信する。また、注目領域情報24は、カメラ毎に予め定義されており、当該内容は設定ファイルに記述されている。なお、図2には、画像データ22及び画像符号化データ28の模式図も示されている。図2に示す画像データ22は、空間的な画像品質が均一の7フレーム分のデータが示されている。また、図2に示す画像符号化データ28は、画像中央部の注目領域は高い空間的な画像品質で、且つ高い時間的な画像品質(7フレーム分のデータ)を有しているが、注目領域以外の背景は低い空間的な画像品質で、且つ低い時間的な画像品質(t0,t3,t6の3フレーム分のデータ)しか有していないことが示されている。   The network transcoder 6 receives the image data 22 distributed in the stream format from the network encoder 2, performs sequential encoding conversion, and distributes it to the network. The attention area information 24 is defined in advance for each camera, and the contents are described in the setting file. FIG. 2 also shows a schematic diagram of the image data 22 and the encoded image data 28. The image data 22 shown in FIG. 2 shows data for seven frames with uniform spatial image quality. In the encoded image data 28 shown in FIG. 2, the attention area in the center of the image has high spatial image quality and high temporal image quality (data for seven frames). It is shown that the background other than the area has low spatial image quality and low temporal image quality (data for three frames of t0, t3, and t6).

次に、本実施の形態に係る画像トランスコーダの動作について以下に説明する。まず、図3に注目領域情報24の例を、図4に画像品質テーブルの例を、図5に領域品質情報25の例をそれぞれ示す。図3に示す注目領域情報24では、一つの注目領域と背景領域の2つの領域が定義されており、領域ID=1が注目領域、領域ID=2が背景を示している。また、図3に示す注目領域情報24では、領域ID=1に注目領域の左上と右下を示す座標情報(X11,Y11)、(X12, Y12)と注目度合い”5”の情報と、領域ID=2に背景であることを示す座標情報と注目度合い”1”の情報とが格納されている。   Next, the operation of the image transcoder according to the present embodiment will be described below. First, an example of attention area information 24 is shown in FIG. 3, an example of an image quality table is shown in FIG. 4, and an example of area quality information 25 is shown in FIG. In the attention area information 24 shown in FIG. 3, two areas of one attention area and a background area are defined, with the area ID = 1 indicating the attention area and the area ID = 2 indicating the background. Further, in the attention area information 24 shown in FIG. 3, the area ID = 1, coordinate information (X11, Y11), (X12, Y12) indicating the upper left and lower right of the attention area, attention degree “5” information, and the area The coordinate information indicating the background and the information of the attention degree “1” are stored in ID = 2.

品質設定手段23は、図3に示す注目領域情報24を読み込み、予め与えられた図4(a)の画像品質テーブル32を参照して、図5に示す領域画質情報25を作成する。例えば、領域ID=1の注目領域は注目度合いが”5”であるので、時間的な画像品質は15fps、空間的な画像品質はレベル5となり、領域ID=2の背景領域は注目度合いが”1”であるので、時間的な画像品質は5fps、空間的な画像品質はレベル1と設定される。   The quality setting means 23 reads the attention area information 24 shown in FIG. 3, and creates the area image quality information 25 shown in FIG. 5 with reference to the image quality table 32 shown in FIG. For example, the attention area of area ID = 1 has a degree of attention of “5”, so the temporal image quality is 15 fps, the spatial image quality is level 5, and the background area of area ID = 2 has the attention degree of “5”. Therefore, the temporal image quality is set to 5 fps, and the spatial image quality is set to level 1.

ここで、時間的な画像品質とは、フレームレート(fps(frames per second))のことであり、1秒間に何フレームの画像で構成されているのかを示している。符号化変換手段25では、入力された画像データ22のフレームを間引くことで、時間的な画像品質の変換を実現している。なお、JPEGやJPEG2000等のフレーム内で符号化を行う場合は、単純に必要なフレームのみを符号化変換し、不要なフレームは破棄している。しかし、MPEG-2/4等のフレーム間で符号化を行う場合は、全てのBフレームあるいは全てのBフレームとPフレームを単純に間引く手法や、一部のフレームを間引いて再度動きベクトルを計算する手法など種々の手法が一般的に知られている。本実施の形態でも、一般的に知られた手法を用いるので、個々の手法についての詳細な説明は本明細書においては省略する。   Here, the temporal image quality is a frame rate (fps (frames per second)), and indicates how many frames of an image are formed per second. The encoding conversion means 25 realizes temporal image quality conversion by thinning out frames of the input image data 22. When encoding is performed within a frame such as JPEG or JPEG2000, only necessary frames are simply encoded and converted, and unnecessary frames are discarded. However, when encoding between frames such as MPEG-2 / 4, all B frames or all B frames and P frames are simply thinned out, or some frames are thinned out and motion vectors are calculated again. Various methods are generally known, such as a method to perform the above. Also in this embodiment, since a generally known method is used, detailed description of each method is omitted in this specification.

一方、空間的な画像品質とは、例えば入力された画像の高周波成分を保存するレベルを示し、全て保存するレベル5から直流成分のみ保存するレベル1まで定義されている。なお、高周波成分の除去に関しては、符号化変換の再符号化における量子化ステップを変化させることにより実現することができる。   On the other hand, spatial image quality indicates, for example, a level at which high-frequency components of an input image are stored, and is defined from level 5 for storing all to level 1 for storing only a DC component. The removal of high frequency components can be realized by changing the quantization step in the re-encoding of the encoding conversion.

画像品質テーブル32は、目的に応じて色々な定義が可能である。例えば、図4(a)では注目度合いに合わせて時間的な画像品質と空間的な画像品質の両方を変化させているのに対し、図4(b)では空間的な画像品質を最高の5に固定し、時間的な画像品質を最高の15fpsから1/5fps(5秒に1フレーム)まで変化させた空間的な画像品質を重視した画像品質テーブル32となっている。また、図4(c)は時間的な画像品質を15fpsに固定し、空間的な画像品質をレベル5から1まで変化させた時間的な画像品質を重視した画像品質テーブル32となっている。図4(c)の画像品質テーブル32は、特に動き重視する監視に適している。このように、本実施の形態に係る画像トランスコーダは、目的に応じて様々な時間的・空間的な画像品質を変化させられることが可能となる。   The image quality table 32 can be defined in various ways according to the purpose. For example, in FIG. 4A, both temporal image quality and spatial image quality are changed in accordance with the degree of attention, whereas in FIG. The image quality table 32 emphasizes the spatial image quality in which the temporal image quality is changed from the maximum 15 fps to 1/5 fps (1 frame per 5 seconds). FIG. 4C shows an image quality table 32 in which the temporal image quality is fixed at 15 fps and the temporal image quality is changed from level 5 to 1. The image quality table 32 in FIG. 4C is suitable for monitoring that emphasizes movement. As described above, the image transcoder according to the present embodiment can change various temporal and spatial image qualities according to the purpose.

さらに、品質設定手段23では、図3に示す注目領域情報24と図4に示す画像品質テーブル32とから、図5に示す領域品質情報25を作成する。図5に示す領域品質情報25では、領域ID、座標、注目度合い、時間的な画像品質、空間的な画像品質の情報が格納されている。例えば、領域ID=1の注目領域では、座標(X11,Y11)、(X12, Y12)、注目度合い”5”、時間的な画像品質”15fps”、空間的な画像品質”レベル5”となっている。   Further, the quality setting means 23 creates area quality information 25 shown in FIG. 5 from the attention area information 24 shown in FIG. 3 and the image quality table 32 shown in FIG. The area quality information 25 shown in FIG. 5 stores area ID, coordinates, attention level, temporal image quality, and spatial image quality information. For example, in the attention area of area ID = 1, the coordinates (X11, Y11), (X12, Y12), attention degree “5”, temporal image quality “15 fps”, and spatial image quality “level 5”. ing.

次に、図6から図12の画面例を用いて画像トランスコーダの動作を具体的に説明する。図6は入力される6フレーム分の画像データ22の画面例を示す。図7は、本実施の形態と対比される画面例であり、画像トランスコーダによって背景領域34のみ空間的な画像品質を低下させた場合である。つまり、図7では、全ての画像フレームに対して、人物が移動している画面下半分の注目領域33に高い空間的な画像品質を与え、建物等の背景領域34に低い空間的な画像品質を与えて変換している。   Next, the operation of the image transcoder will be specifically described with reference to the screen examples of FIGS. FIG. 6 shows a screen example of the input image data 22 for six frames. FIG. 7 is a screen example compared with the present embodiment, in which the spatial image quality of only the background area 34 is lowered by the image transcoder. That is, in FIG. 7, for all image frames, a high spatial image quality is given to the attention area 33 in the lower half of the screen where the person is moving, and a low spatial image quality is given to the background area 34 such as a building. The conversion is given.

図8は、本実施の形態に係る画像トランスコーダを用いて符号化変換を行った画面例である。図8(a)は、画像トランスコーダから出力される画像符号化データ28である。具体的には、図5に示した領域品質情報25に従っているので、注目領域33は入力された画像データ22と同じ時間的・空間的な画像品質(15fps,レベル5)で、背景領域34は入力された画像データ34より低い時間的・空間的な画像品質(5fps,レベル1)で符号化変換されている。図8(a)からも分かるように、背景領域34の画像データ22は、3フレームのうち2フレームが間引かれている。   FIG. 8 shows an example of a screen obtained by performing coding conversion using the image transcoder according to the present embodiment. FIG. 8A shows encoded image data 28 output from the image transcoder. Specifically, since the area quality information 25 shown in FIG. 5 is followed, the attention area 33 has the same temporal and spatial image quality (15 fps, level 5) as the input image data 22, and the background area 34 It is encoded and converted at a temporal and spatial image quality (5 fps, level 1) lower than the input image data 34. As can be seen from FIG. 8A, the image data 22 in the background region 34 is thinned out of the three frames.

次に、表示端末の表示モジュールでは、画像トランスコーダによって符号化変換された画像符号化データ28を受け取り、逐次フレーム毎に復号し合成表示して図8(b)示すような画面例にする。つまり、最初のフレームは、注目領域33と背景領域34からなる画像の全領域を符号化したデータであり、表示モジュールはこれを復号し表示メモリに展開してディスプレイに表示する。2番目、3番目のフレームは注目領域のみ符号化したデータであるので、表示メモリの注目領域の位置に復号した部分画像データを上書きする。これを第4フレーム以降、繰り返す。   Next, the display module of the display terminal receives the encoded image data 28 that has been encoded and converted by the image transcoder, sequentially decodes and synthesizes it for each frame, and forms a screen example as shown in FIG. In other words, the first frame is data obtained by encoding the entire area of the image including the attention area 33 and the background area 34, and the display module decodes this, expands it in the display memory, and displays it on the display. Since the second and third frames are data in which only the attention area is encoded, the decoded partial image data is overwritten at the position of the attention area in the display memory. This is repeated from the fourth frame.

図7と図8に示した画面例の比較からも明らかなように、本実施の形態では背景領域34のフレームを間引くことでより少ない画像符号化データ28に変換することができ、且つ背景領域34の動きが少ない場合に、ほぼ同じ画像の主観品質を得ることができる。また、背景領域34に動きがあったとしてもその領域が監視対象として重要でない場合には、逆にユーザが余計な動きに目をとらわれることなく、重要な領域の観察に集中できる。   As is clear from the comparison of the screen examples shown in FIGS. 7 and 8, in the present embodiment, the frame of the background area 34 can be thinned out to be converted into less image encoded data 28, and the background area When there is little movement of 34, the subjective quality of the almost same image can be obtained. Even if the background area 34 moves, if the area is not important as a monitoring target, the user can concentrate on observing the important area without being noticed by the extra movement.

図9は、本実施の形態における別の画面例である。図9(a)は、画像トランスコーダから出力される画像符号化データ28である。図9(a)に示す注目領域33の時間的・空間的な画像品質は、図8(a)と同じであるが、背景領域34の時間的な画像品質を5fps、空間的な画像品質を”レベル5”とし、背景領域34の空間的な画像品質を高く設定している。つまり、図9(a)に示す例では、背景領域34について少なくとも時間的な画像品質を低くして空間的な画像品質を向上させ、画像の主観品質を向上している。なお、図9(a)に示す例では、図8(a)で示した例に比べデータ量は増加する。また、図9(b)は、表示モジュールで表示される合成表示画面であり、注目領域33と背景領域34の空間的な画像品質が同じであるため、領域の区別が視覚できるように注目領域33の範囲を破線の矩形枠で重畳表示している。   FIG. 9 is another screen example in the present embodiment. FIG. 9A shows encoded image data 28 output from the image transcoder. The temporal and spatial image quality of the attention area 33 shown in FIG. 9A is the same as that of FIG. 8A, but the temporal image quality of the background area 34 is 5 fps, and the spatial image quality is the same. “Level 5” is set, and the spatial image quality of the background region 34 is set high. That is, in the example shown in FIG. 9A, at least the temporal image quality of the background region 34 is lowered to improve the spatial image quality, and the subjective quality of the image is improved. In the example shown in FIG. 9A, the data amount increases compared to the example shown in FIG. FIG. 9B shows a composite display screen displayed on the display module. Since the spatial image quality of the attention area 33 and the background area 34 is the same, the attention area can be visually recognized. The range 33 is superimposed and displayed in a rectangular frame with a broken line.

図10乃至図12は、2箇所の注目領域33を設定した場合の画面例である。そして、図10は、本実施の形態と対比される画面例であり、背景領域34のみ空間的な画像品質を低下させた場合である。図11は、本実施の形態で注目領域33の時間的・空間的な画像品質を(15fps,レベル5)、背景領域34を(5fps,レベル1)に設定した場合の画面例である。図12は、注目領域33の画像品質を(15fps,レベル5)、背景領域34を(5fps、レベル5)に設定した場合の画面例である。図11(a)は、画像トランスコーダから出力される画像符号化データ28であり、図11(b)は、表示モジュールで表示される合成表示画面である。   10 to 12 are examples of screens when two attention regions 33 are set. FIG. 10 shows an example of a screen compared with the present embodiment, in which only the background area 34 has a reduced spatial image quality. FIG. 11 shows a screen example when the temporal and spatial image quality of the attention area 33 is set to (15 fps, level 5) and the background area 34 is set to (5 fps, level 1) in the present embodiment. FIG. 12 shows a screen example when the image quality of the attention area 33 is set to (15 fps, level 5) and the background area 34 is set to (5 fps, level 5). FIG. 11A shows encoded image data 28 output from the image transcoder, and FIG. 11B shows a composite display screen displayed on the display module.

図12は、注目領域33の画像品質を(15fps,レベル5)、背景領域34を(5fps、レベル5)に設定した場合の画面例である。なお、図12(a)は、画像トランスコーダから出力される画像符号化データ28であり、図12(b)は、表示モジュールで表示される合成表示画面である。図7乃至図9において示した一つの注目領域33を設ける場合の場合と同様、二つの注目領域33を設ける場合も、背景領域34のみ空間的な画像品質を低下させる場合と比べよりデータを圧縮することが可能となるとともに、背景領域34の空間的な画像品質を高くしているので画像の主観品質が良くなる。   FIG. 12 shows a screen example when the image quality of the attention area 33 is set to (15 fps, level 5) and the background area 34 is set to (5 fps, level 5). 12A shows the encoded image data 28 output from the image transcoder, and FIG. 12B shows a composite display screen displayed on the display module. Similar to the case of providing one region of interest 33 shown in FIGS. 7 to 9, when two regions of interest 33 are provided, the data is compressed more than the case where only the background region 34 reduces the spatial image quality. In addition, since the spatial image quality of the background region 34 is increased, the subjective quality of the image is improved.

以上のように、本実施の形態1に記載の画像トランスコーダであれば、品質設定手段23が注目領域情報24に基づき、各領域の注目度合いに応じた時間的・空間的な画像品質を領域品質情報に設定し、符号化変換手段26が領域品質情報に基づいて、注目度合いの高い領域は時間的・空間的な画像品質を高くし、背景等の注目度合いの低い領域は少なくとも時間的な画像品質が低くなるように符号化変換するため、画像の主観品質をより良くすることが可能となる。また、監視対象として重要でない領域の時間変化にとらわれず、重要な領域の観察に集中できるという効果もある。   As described above, in the image transcoder described in the first embodiment, the quality setting unit 23 displays temporal and spatial image quality corresponding to the attention degree of each area based on the attention area information 24. Based on the area quality information, the coding conversion means 26 sets the temporal and spatial image quality in the area with a high degree of attention based on the area quality information, and the area with a low degree of attention such as the background is at least temporal. Since the encoding conversion is performed so that the image quality is lowered, the subjective quality of the image can be improved. In addition, there is an effect that it is possible to concentrate on observation of an important area without being limited by a time change of an unimportant area as a monitoring target.

なお、本実施の形態において、画像符号化データ28の符号化変換のタイミングは、ストリーミングとして逐次変換する場合について説明したが、画像データ22をファイルとして受信し、当該データを一括で変換する一括型変換など、アプリケーションに応じた種々のタイミングも考えられる。また、注目領域情報25は、カメラ毎に予め設定されている場合について説明したが、観察しているユーザから対話的に変更できる場合や、撮影場所に配置された各種センサの検知結果に応じて変更できるなど外部から動的に与えられる場合もある。   In the present embodiment, the encoding conversion timing of the encoded image data 28 has been described for the case of sequential conversion as streaming. However, the batch type that receives the image data 22 as a file and converts the data in a batch. Various timings depending on the application, such as conversion, can also be considered. In addition, the attention area information 25 has been described for a case in which the attention area information is set in advance for each camera. However, the attention area information 25 can be changed interactively by the observing user, or depending on the detection results of various sensors arranged at the shooting location. In some cases, it can be changed dynamically.

さらに、時間的な画像品質を変化させる例として、入力する画像データ22のフレームを間引く方法、空間的な画像品質を変化させる例として、量子化ステップを変える方法について上記で説明したが、本発明はこれに限定されるものではない。例えば、空間的な画像品質であれば画像の解像度を変化させる、輝度成分と色成分など色情報を変化させる方法もある。また、JPEG2000のような符号化方式であれば、画像の解像度、周波数成分、色成分の必要な部分を領域毎に組み合わせて、高品質な画像符号化データから取り出すことができる。時間的な画像品質と空間的な画像品質の両方を同時に変化させるのであれば、MPEG-2/4等で用いられる動き補償を用いて、注目度合いに応じて予測誤差の量子化ステップを変える方法などが考えられる。   Furthermore, as an example of changing the temporal image quality, the method of thinning out the frame of the input image data 22 and the method of changing the quantization step as an example of changing the spatial image quality have been described above. Is not limited to this. For example, there is a method of changing color information such as a luminance component and a color component to change the resolution of the image if the image quality is spatial. In the case of an encoding method such as JPEG2000, necessary portions of image resolution, frequency components, and color components can be combined for each region and extracted from high-quality image encoded data. If you want to change both temporal image quality and spatial image quality at the same time, use the motion compensation used in MPEG-2 / 4 etc. to change the quantization step of the prediction error according to the degree of attention And so on.

画像品質テーブル32は、一つの注目度合いに対して同じ時間的・空間的な画像品質を定義しているが、一つの注目度合いに対して複数の時間的・空間的な画像品質の組を定義し、画像の内容により選択する方式であっても構わない。例えば、画像内容を動きのある場合と動きの少ない場合に分類し、前者の画像には(時間的な画像品質15fps、空間的な画像品質レベル3)、後者の画像には(時間的な画像品質7fps、空間的な画像品質レベル5)を定義し、符号化変換手段26が画像内容を解析しながら適切な時間的・空間的な画像品質を選択する。また、画像品質テーブル32ではなく、注目度合いを変数x、時間的な画像品質及び空間的な画像品質を各々変数yt,ysとし、(yt,ys)=G(x)なる数式として定義してもよい。   The image quality table 32 defines the same temporal and spatial image quality for one degree of attention, but defines a plurality of sets of temporal and spatial image quality for one degree of attention. However, a method of selecting according to the content of the image may be used. For example, the image content is classified into a case where there is motion and a case where there is little motion. The former image (temporal image quality 15 fps, spatial image quality level 3), and the latter image (temporal image). The quality 7fps and the spatial image quality level 5) are defined, and the encoding / conversion means 26 selects an appropriate temporal / spatial image quality while analyzing the image content. Further, instead of the image quality table 32, the degree of attention is defined as a variable x, the temporal image quality and the spatial image quality are variables yt and ys, respectively, and defined as an equation of (yt, ys) = G (x). Also good.

(実施の形態2)
本実施の形態では、実施の形態1に係る画像トランスコーダに、ネットワークの帯域変動やユーザの指示に応じて符号化変換後のビットレートを動的に変更する機能を加えた構成である。なお、本実施の形態に係る画像トランスコーダも、図1に示した画像監視システムに適用できる。
(Embodiment 2)
In the present embodiment, the image transcoder according to the first embodiment has a configuration in which a function for dynamically changing the bit rate after coding conversion is added in accordance with network bandwidth fluctuations or user instructions. The image transcoder according to the present embodiment can also be applied to the image monitoring system shown in FIG.

図13は、本実施の形態に係る画像トランスコーダの機能構成を示すブロック図である。以下、図2に示した実施の形態1に係る画像トランスコーダと異なる点を中心に説明する。まず、図13に示す画像トランスコーダにおいては、ビットレート入力手段41が新たに設けられている。このビットレート入力手段41は、表示モジュールのGUI(Graphical User Interface)アプリケーションや帯域管理マネージャ等の外部モジュールから画像符号化データ28のビットレート変更の指示を受付け、品質設定手段23に新たな目標ビットレート値又は目標データ量(以下、単に目標ビットレート値という)を渡す。   FIG. 13 is a block diagram showing a functional configuration of the image transcoder according to the present embodiment. The following description will focus on differences from the image transcoder according to Embodiment 1 shown in FIG. First, a bit rate input means 41 is newly provided in the image transcoder shown in FIG. The bit rate input means 41 receives an instruction to change the bit rate of the encoded image data 28 from an external module such as a GUI (Graphical User Interface) application of the display module or a bandwidth management manager, and sets a new target bit to the quality setting means 23. A rate value or a target data amount (hereinafter simply referred to as a target bit rate value) is passed.

品質設定手段23では、受け取った新たな目標ビットレート値になるよう、注目領域情報24と画像データ22に基づき、画像データ22の領域毎の時間的・空間的な画像品質を再設定して領域品質情報25を変更する。符号化変換手段26は、新たに更新された領域品質情報25を受け取り、当該領域品質情報25に従って画像データ22の符号化変換を行う。例えば、本実施の形態では、ネットワークのトラフィックが中→大→小と時間的に変化する場合に、その変化に応じて3Mbpsの画像データ22を1Mbps→512Kbps→2Mbpsの画像符号化データ28と動的に変換させる。なお、図13では、入力された画像データのビットレートが一定で、出力される画像符号化データ28のビットレートが変化する様子が模式的に示されている。   The quality setting means 23 resets the temporal and spatial image quality for each area of the image data 22 based on the attention area information 24 and the image data 22 so that the received new target bit rate value is obtained. The quality information 25 is changed. The encoding conversion means 26 receives the newly updated region quality information 25 and performs encoding conversion of the image data 22 according to the region quality information 25. For example, in the present embodiment, when the network traffic changes in time from medium to large to small, the 3 Mbps image data 22 is changed from 1 Mbps to 512 Kbps to 2 Mbps image encoded data 28 in accordance with the change. Convert it. FIG. 13 schematically shows how the bit rate of the input image data 28 is constant and the bit rate of the output image encoded data 28 changes.

本実施の形態に係る画像トランスコーダでのビットレート制御について説明する。まず、時間的な画像品質を変更する場合、画像トランスコーダは、画像データ22のビットレートRinと目標ビットレートRoutの比Rin/Routをフレーム間引きの初期値として間引きを開始する。そして、画像トランスコーダは、ある一定時間経過後の最新ビットレートを測定し、当該ビットレートが目標ビットレートより高いか低いかで、間引き率を動的に変更する。   Bit rate control in the image transcoder according to the present embodiment will be described. First, when changing temporal image quality, the image transcoder starts decimation using the ratio Rin / Rout of the bit rate Rin of the image data 22 and the target bit rate Rout as the initial value of frame decimation. The image transcoder measures the latest bit rate after a certain period of time, and dynamically changes the thinning rate depending on whether the bit rate is higher or lower than the target bit rate.

空間的な画像品質を変更する場合、画像トランスコーダは、例えば、予め画像の統計的性質に基づいて設定された目標ビットレート毎の量子化ステップを初期値として、画像データ22の1フレーム内をマクロブロック単位に再量子化する。そして、画像トランスコーダは、再量子化後の累積データ量が目標のビットレートより高くなりそうか否かで、量子化ステップサイズを動的に調整する。本実施の形態に係るビットレート制御は、上記の時間的ビットレート制御と空間的ビットレート制御の技術を組み合わせて用いる。どのように組み合わせるかについては、種々のバリエーションがある。例えば、図14(a)に示すように、ビットレート入力手段41により入力した目標ビットレートと領域の注目度合いとに応じて、時間的な画像品質の初期値と空間的な画像品質の初期値を予め画像品質テーブル32に設定しておく。なお、画像品質テーブル32の最上段は、目標ビットレートを示している。   When changing the spatial image quality, the image transcoder uses, for example, a quantization step for each target bit rate set in advance based on the statistical properties of the image as an initial value within one frame of the image data 22. Requantize in units of macroblocks. The image transcoder dynamically adjusts the quantization step size depending on whether or not the accumulated data amount after re-quantization is likely to be higher than the target bit rate. The bit rate control according to the present embodiment uses a combination of the above temporal bit rate control and spatial bit rate control techniques. There are various variations on how to combine them. For example, as shown in FIG. 14 (a), an initial value of temporal image quality and an initial value of spatial image quality according to the target bit rate input by the bit rate input means 41 and the attention level of the area. Are set in the image quality table 32 in advance. The top level of the image quality table 32 indicates the target bit rate.

品質設定手段23は、図14に示す画像品質テーブル32を参照して目標ビットレートに応じた領域品質情報25を作成する。図15に、目標ビットレートが512bpsの場合における領域品質情報25の例を示す。次に、符号化変換手段26は、領域品質情報25の初期値を用いて、上記の時間的ビットレート制御と空間的ビットレート制御の両方を行う。なお、図14(b)に示す画像品質テーブル32は、時間的な画像品質が目標ビットレート毎に固定され空間的ビットレート制御のみ行う場合の例であり、図14(c)に示す画像品質テーブル32は、空間的な画像品質が目標ビットレート毎に固定され時間的ビットレート制御のみ行う。   The quality setting means 23 creates area quality information 25 corresponding to the target bit rate with reference to the image quality table 32 shown in FIG. FIG. 15 shows an example of the area quality information 25 when the target bit rate is 512 bps. Next, the encoding conversion means 26 performs both the temporal bit rate control and the spatial bit rate control using the initial value of the region quality information 25. The image quality table 32 shown in FIG. 14B is an example in the case where the temporal image quality is fixed for each target bit rate and only the spatial bit rate control is performed, and the image quality shown in FIG. In the table 32, the spatial image quality is fixed for each target bit rate, and only temporal bit rate control is performed.

画像品質テーブル32の内容を変えることで、目的や用途により色々な制御が可能である。また、入力される画像データ22の統計的性質がカメラ毎にかなり異なるような場合、カメラを分類して、その種類毎に適切な値が設定された画像品質テーブル32を用意し、品質設定手段23がビットレート入力手段41により変更指示があったカメラに応じて品質設定手段23を選択する。   By changing the contents of the image quality table 32, various controls are possible depending on the purpose and application. If the statistical properties of the input image data 22 are considerably different for each camera, the camera is classified, and an image quality table 32 in which appropriate values are set for each type is prepared, and quality setting means 23 selects the quality setting means 23 according to the camera instructed to change by the bit rate input means 41.

次に、図16乃至図19の画面例を用いて本実施の形態に係る画像トランスコーダの動作について説明する。図16乃至図19の画面例は、いずれも図6で示した画面例の画像データ22を本実施の形態の画像トランスコーダにより符号化変換した例である。まず、図16乃至図18は、図8の符号化変換と比べ注目領域33の画像品質は変えずに、背景領域34の画像品質のみを変更してビットレートを低減した場合の例である。具体的には、図16では背景領域34の時間的な画像品質のみを低下させた場合である。図8では3フレーム中2フレームを間引いていたのを、図16では5フレーム中4フレームを間引いている。なお、図16(a)は、画像トランスコーダから出力される画像符号化データ28であり、図16(b)は、表示モジュールで表示される合成表示画面である。   Next, the operation of the image transcoder according to the present embodiment will be described using the screen examples of FIGS. The screen examples in FIGS. 16 to 19 are examples in which the image data 22 in the screen example shown in FIG. 6 is encoded and converted by the image transcoder of the present embodiment. First, FIG. 16 to FIG. 18 show examples in which the bit rate is reduced by changing only the image quality of the background area 34 without changing the image quality of the attention area 33 as compared with the encoding conversion of FIG. Specifically, FIG. 16 shows a case where only the temporal image quality of the background region 34 is lowered. In FIG. 8, 2 out of 3 frames are thinned out. In FIG. 16, 4 out of 5 frames are thinned out. 16A shows the encoded image data 28 output from the image transcoder, and FIG. 16B shows a composite display screen displayed on the display module.

また、図17では、背景領域34の時間的・空間的な画像品質の両方を低下させた場合である。図17では4フレーム中3フレームを間引き、且つ背景領域34の空間的な画像品質を低下させている。なお、図17(a)は、画像トランスコーダから出力される画像符号化データ28であり、図17(b)は、表示モジュールで表示される合成表示画面である。さらに、図18では、背景領域34の空間的な画像品質のみ低下させた場合である。なお、図8(a)は、画像トランスコーダから出力される画像符号化データ28であり、図8(b)は、表示モジュールで表示される合成表示画面である。   FIG. 17 shows a case where both the temporal and spatial image quality of the background region 34 are lowered. In FIG. 17, 3 out of 4 frames are thinned out, and the spatial image quality of the background area 34 is reduced. FIG. 17A shows the encoded image data 28 output from the image transcoder, and FIG. 17B shows a composite display screen displayed on the display module. Further, FIG. 18 shows a case where only the spatial image quality of the background area 34 is lowered. 8A shows the encoded image data 28 output from the image transcoder, and FIG. 8B shows a composite display screen displayed on the display module.

図18に示した画面例での背景領域34の空間的な画像品質は、図17に示した画面例の背景領域34の空間的な画像品質より低下している。なお、図16乃至図18に示す画面例では、ハッチングにより空間的な画像品質のレベルを表現しており、より細かいハッチングが施されている例の方が空間的な画像品質が低いことを表している。さらに、図19に示す画面例は、図8に示す画面例と比べ、背景領域34の時間的な画像品質を向上させてビットレートを増加させている。図19では、2フレーム中1フレームを間引いている。なお、図19(a)は、画像トランスコーダから出力される画像符号化データ28であり、図19(b)は、表示モジュールで表示される合成表示画面である。   The spatial image quality of the background area 34 in the screen example shown in FIG. 18 is lower than the spatial image quality of the background area 34 in the screen example shown in FIG. In the screen examples shown in FIGS. 16 to 18, the level of spatial image quality is expressed by hatching, and the example in which finer hatching is applied indicates that the spatial image quality is lower. ing. Furthermore, the screen example shown in FIG. 19 improves the temporal image quality of the background region 34 and increases the bit rate compared to the screen example shown in FIG. In FIG. 19, one frame is thinned out of two frames. FIG. 19A shows the encoded image data 28 output from the image transcoder, and FIG. 19B shows a composite display screen displayed on the display module.

以上のように、本実施の形態に係る画像トランスコーダによれば、ビットレート入力手段41が外部モジュールから受付けたビットレートの変更指示に応じて、新たな目標ビットレート値になるよう、品質設定手段23において領域品質情報25を変更するので、帯域の制約や変動があるネットワークにおいても、安定した品質で画像を配信することができる。   As described above, according to the image transcoder according to the present embodiment, the quality setting is performed so that the bit rate input unit 41 becomes a new target bit rate value in response to the bit rate change instruction received from the external module. Since the area quality information 25 is changed by the means 23, an image can be distributed with a stable quality even in a network where there is a band limitation or fluctuation.

なお、ネットワークトランスコーダ2が、ビットレート変更に対応したタイミングに合わせて、変更されたビットレートや領域品質情報を、画像符号化データと同期して表示側に配信する構成であってもよい。これにより、GUIアプリケーションは画像の再生表示に合わせて、その画像品質を補足情報として表示することができる。   The network transcoder 2 may be configured to distribute the changed bit rate and area quality information to the display side in synchronization with the encoded image data in accordance with the timing corresponding to the bit rate change. Thereby, the GUI application can display the image quality as supplementary information in accordance with the reproduction display of the image.

(実施の形態3)
図20は、本実施の形態に係る画像トランスコーダを適用した画像監視システムのシステム構成図である。図20に示す画像監視システムと図1に示す画像監視システムとで異なる点は、ネットワークトランスコーダ2をハードウェアとして別途設けずに、画像トランスコーダの機能を画像蓄積・配信サーバ5に実装している点である。画像蓄積・配信サーバ5は、ネットワークエンコーダ2から配信される画像ストリームを受信して、常時一定時間の最新画像をエンドレス記録している。そして、画像蓄積・配信サーバ5は、記録した画像ストリームのうち重要な時間区間について最新の画像ストリームが上書きされないようにイベント記録し、別の記録領域に移動して保存記録する等の目的にあった記録を行っている。
(Embodiment 3)
FIG. 20 is a system configuration diagram of an image monitoring system to which the image transcoder according to the present embodiment is applied. The image monitoring system shown in FIG. 20 differs from the image monitoring system shown in FIG. 1 in that the function of the image transcoder is implemented in the image storage / distribution server 5 without separately providing the network transcoder 2 as hardware. It is a point. The image storage / distribution server 5 receives the image stream distributed from the network encoder 2 and always endlessly records the latest image for a fixed time. The image storage / distribution server 5 records the event so that the latest image stream is not overwritten in an important time section of the recorded image stream, and moves to another recording area to store and record. Recording.

本実施の形態に係る画像蓄積・配信サーバ5では、さらに事務用端末9やモバイル端末11等から画像蓄積・配信サーバに配信要求があると、ネットワークエンコーダ2から受信した画像ストリームあるいは保存記録した画像ストリームを画像トランスコーダにより符号化変換して低ビットレート化し、ゲートウェイ7経由で配信する。   In the image storage / distribution server 5 according to the present embodiment, when there is a distribution request from the office terminal 9 or the mobile terminal 11 to the image storage / distribution server, the image stream received from the network encoder 2 or the stored and recorded image The stream is encoded and converted by an image transcoder to reduce the bit rate, and is distributed via the gateway 7.

次に、本実施の形態に係る画像トランスコーダの機能構成を示すブロック図を、図21に示す。本実施の形態に係る画像トランスコーダと図2に示した画像トランスコーダとで異なる点は、注目領域情報生成手段51が画像データ22から注目すべき領域を抽出し、その抽出した領域の情報を用いて注目領域情報24を生成する点である。具体的には、画像監視であれば人物や車両など移動する物体、土砂崩れや火災などの事象が重要であり、それら移動体や事象が写っている画像領域を注目度合いの高い注目領域、それ以外を背景領域と判別する必要がある。   Next, FIG. 21 shows a block diagram showing a functional configuration of the image transcoder according to the present embodiment. The difference between the image transcoder according to the present embodiment and the image transcoder shown in FIG. 2 is that the region-of-interest information generation unit 51 extracts a region to be noted from the image data 22, and information on the extracted region is obtained. This is used to generate attention area information 24. Specifically, for image monitoring, moving objects such as people and vehicles, landslides, and fire events are important. Must be identified as the background area.

図21に示す注目領域情報生成手段51は、画像データ22を復号して、画像処理により移動体や事象発生の領域を抽出し、その抽出した領域の情報と、予め設定された規則に従って定義された各領域の注目度合いを示す情報とからなる注目領域情報24を生成する。画像データ22から移動体を追跡したり、事象を検知したりする手法については、従来より知られている技術であり、また画像データ22を復号することなくシーン変化等を検出する技術も公表されているため、本明細書においては詳細な説明は省略する。   The attention area information generation means 51 shown in FIG. 21 decodes the image data 22 and extracts a moving body and an event occurrence area by image processing, and is defined in accordance with the extracted area information and preset rules. The attention area information 24 including information indicating the attention degree of each area is generated. A technique for tracking a moving object or detecting an event from the image data 22 is a conventionally known technique, and a technique for detecting a scene change or the like without decoding the image data 22 has also been announced. Therefore, detailed description is omitted in this specification.

物体の移動や事象の発生により注目領域情報24が更新され、その都度、品質設定手段23は、更新された注目領域情報24に基づき領域品質情報25を更新する。そして、符号化変換手段は、更新された領域品質情報25に従って画像データ22を画像符号化データ28に符号化変換を行う。本実施の形態に係る画像トランスコーダは、注目領域情報生成手段51を設けることにより、人手を介さず自動的に移動体や事象発生の領域を抽出でき、画像の内容(コンテンツ)に応じた符号化変換を実現することができる。   The attention area information 24 is updated by the movement of the object or the occurrence of an event, and each time the quality setting means 23 updates the area quality information 25 based on the updated attention area information 24. Then, the coding conversion means performs coding conversion of the image data 22 into the image coded data 28 according to the updated region quality information 25. The image transcoder according to the present embodiment is provided with the attention area information generation means 51, so that it is possible to automatically extract a moving object or an event occurrence area without human intervention, and a code corresponding to the content (content) of the image. Conversion can be realized.

次に、図22乃至図27の画面例を用いて本実施の形態に係る画像トランスコーダの動作について説明する。なお、いずれの画面例も、図6に示した画面例の画像データ22を符号化変換した例である。まず、図22は、本実施の形態と対比される画面例であり、歩行者含む領域を注目領域33として高い空間的な画像品質で、背景領域34を低い空間的な画像品質で符号化変換した場合である。   Next, the operation of the image transcoder according to the present embodiment will be described using the screen examples of FIGS. Each screen example is an example in which the image data 22 of the screen example shown in FIG. 6 is encoded and converted. First, FIG. 22 is an example of a screen compared with the present embodiment, in which an area including a pedestrian is encoded as an attention area 33 with high spatial image quality and a background area 34 is encoded with low spatial image quality. This is the case.

次に、図23に示す画面例は、本実施の形態に係る画像トランスコーダで符号化変換した画面例である。なお、図23(a)は、画像トランスコーダから出力される画像符号化データ28であり、図23(b)は、表示モジュールで表示される合成表示画面である。図23(a)の最初のフレームでは、歩行者含む注目領域33を高い空間的な画像品質で符号化したデータと、背景領域34を低い空間的な画像品質で符号化したデータとで構成されている。しかし、図23(a)の2番目、3番目のフレームでは、当該フレームにおける注目領域33を高い空間的な画像品質で符号化したデータと、一つ前のフレームにおいて注目領域33であった画像領域を背景領域34と同じ低い空間的な画像品質で符号化したデータとから構成されている。本実施の形態に係る画像トランスコーダでは、2番目、3番目のフレームの背面領域34を間引いて符号化変換を行っており、3フレーム中2フレームの背面領域34を間引いている。   Next, the screen example shown in FIG. 23 is a screen example that is encoded and converted by the image transcoder according to the present embodiment. FIG. 23A shows the encoded image data 28 output from the image transcoder, and FIG. 23B shows a combined display screen displayed on the display module. The first frame in FIG. 23A is composed of data obtained by encoding the attention area 33 including the pedestrian with high spatial image quality and data obtained by encoding the background area 34 with low spatial image quality. ing. However, in the second and third frames in FIG. 23A, data obtained by encoding the attention area 33 in the frame with high spatial image quality and the image that was the attention area 33 in the previous frame. The area is composed of data encoded with the same low spatial image quality as the background area 34. In the image transcoder according to the present embodiment, encoding conversion is performed by thinning out the back area 34 of the second and third frames, and the back area 34 of two frames out of three frames is thinned out.

表示モジュールでは、図23(b)に示す画面例の画像符号化データを復号し、表示メモリに展開して表示している。なお、2番目、3番目のフレームにおける画像符号化データは、最初のフレームにおける画像符号化データの該当する位置に上書きする。本実施の形態では、4番目のフレーム以降も同様の動作を繰り返す。これにより、図22に示した画面例の場合に比べて、同様の画像の主観品質を維持しつつより少ない画像符号化データに符号化変換している。   In the display module, the encoded image data of the screen example shown in FIG. 23B is decoded and displayed in the display memory. The encoded image data in the second and third frames is overwritten at the corresponding position of the encoded image data in the first frame. In the present embodiment, the same operation is repeated after the fourth frame. As a result, compared to the case of the screen example shown in FIG. 22, encoding conversion is performed into fewer image encoded data while maintaining the subjective quality of the same image.

図24に示す画面例は、背景領域34の空間的な画像品質を注目領域33と同じレベルに設定した本実施の形態に係る画像トランスコーダの画面例であり、図22に示した画面例の場合に比べて、画像の主観品質を向上させたものである。なお、図24(a)は、画像トランスコーダから出力される画像符号化データ28であり、図24(b)は、表示モジュールで表示される合成表示画面である。また、図22乃至図24に示す画面例では、歩行者を含む領域は全て注目領域33として設定されており、右方向に移動する歩行者を含む注目領域33と、左方向に移動する歩行者を含む注目領域33とを含んでいた。   The screen example shown in FIG. 24 is a screen example of the image transcoder according to the present embodiment in which the spatial image quality of the background region 34 is set to the same level as the attention region 33, and is the screen example shown in FIG. Compared to the case, the subjective quality of the image is improved. 24A shows the encoded image data 28 output from the image transcoder, and FIG. 24B shows a composite display screen displayed on the display module. In the screen examples shown in FIG. 22 to FIG. 24, all the areas including the pedestrian are set as the attention area 33. The attention area 33 including the pedestrian moving in the right direction and the pedestrian moving in the left direction. And a region of interest 33 including.

しかし、図25乃至図27に示す画面例では、右方向に移動する歩行者を含む領域のみを注目領域33として設定した場合の画面例である。図25は図22に、図26は図23に、図27は図24にそれぞれ対応しており、図26は本実施の形態に係る画像トランスコーダにおいて背景領域34の時間的・空間的な画像品質を低く設定した場合、図27は背景領域34の時間的な画像品質のみ低く設定した場合である。図26又は図27の画面例となるように本実施の形態に係る画像トランスコーダを設定しても、図23又は図24の画面例となるように設定した場合と同様、画像の主観品質を維持しつつ、画像データをより圧縮することが可能となる。なお、図26(a),図27(a)は、画像トランスコーダから出力される画像符号化データ28であり、図26(b),図27(b)は、表示モジュールで表示される合成表示画面である。   However, the screen examples shown in FIGS. 25 to 27 are screen examples when only the area including the pedestrian moving in the right direction is set as the attention area 33. 25 corresponds to FIG. 22, FIG. 26 corresponds to FIG. 23, and FIG. 27 corresponds to FIG. 24. FIG. 26 shows a temporal and spatial image of the background region 34 in the image transcoder according to the present embodiment. When the quality is set low, FIG. 27 shows a case where only the temporal image quality of the background area 34 is set low. Even if the image transcoder according to the present embodiment is set so as to be the screen example of FIG. 26 or FIG. 27, the subjective quality of the image is set as in the case of the screen example of FIG. 23 or FIG. The image data can be further compressed while maintaining. FIGS. 26A and 27A show the encoded image data 28 output from the image transcoder, and FIGS. 26B and 27B show the composition displayed on the display module. It is a display screen.

以上のように、本実施の形態によれば、注目領域情報生成手段51が画像データ22から移動体や事象発生の領域を抽出して注目領域情報24を生成・更新するように構成しているので、人手を介さず自動的に画像の内容(コンテンツ)に応じた符号化変換を実現することができる。   As described above, according to the present embodiment, the attention area information generating unit 51 is configured to extract the moving object and the event occurrence area from the image data 22 and generate / update the attention area information 24. Therefore, it is possible to automatically realize the encoding conversion according to the content (content) of the image without human intervention.

なお、画像蓄積・配信サーバ5が注目領域情報24の更新タイミングに合わせて、その注目領域情報24や領域品質情報25を、画像符号化データ28と同期して表示側に配信する構成であってもよい。これにより、GUIアプリケーションでは、画像の再生表示に合わせて、その注目領域やその画像品質を補足情報として表示することができるように構成することが可能となる。また、本実施の形態においても、ネットワークトランスコーダ2を設け、当該ネットワークトランスコーダ2に画像トランスコーダを設ける構成であっても良い。さらに、実施の形態1また実施の形態2においても、本実施の形態と同様に画像トランスコーダを画像蓄積・配信サーバ5に設けて、ネットワークトランスコーダ2を設けない構成であっても良い。   The image storage / distribution server 5 distributes the attention area information 24 and area quality information 25 to the display side in synchronization with the encoded image data 28 in accordance with the update timing of the attention area information 24. Also good. Accordingly, the GUI application can be configured to display the attention area and the image quality as supplementary information in accordance with the reproduction and display of the image. Also in this embodiment, the network transcoder 2 may be provided and the network transcoder 2 may be provided with an image transcoder. Further, in the first and second embodiments, the image transcoder may be provided in the image storage / distribution server 5 and the network transcoder 2 may not be provided, as in the present embodiment.

(実施の形態4)
本実施の形態に係る画像トランスコーダも、実施の形態3と同様、図20の画像監視システムにおける画像蓄積・配信サーバに実装される。図28に、本実施の形態に係る画像トランスコーダのブロック図を示す。本実施の形態に係る画像トランスコーダと実施の形態3に係る画像トランスコーダとで異なる点は、注目領域情報生成手段51が背景画像データ61を生成する点である。符号化変換手段26は、当該背景画像データ61と画像データ22とを用いて符号化変換を行い、画像符号化データ28を出力する。注目領域情報生成手段51は、移動体追跡や事象検出に一般的に用いられている背景差分方式を採用しており、入力した画像データ22から背景画像データ61を生成することが可能である。
(Embodiment 4)
The image transcoder according to the present embodiment is also mounted on the image storage / distribution server in the image monitoring system of FIG. 20 as in the third embodiment. FIG. 28 shows a block diagram of the image transcoder according to the present embodiment. The difference between the image transcoder according to the present embodiment and the image transcoder according to the third embodiment is that the attention area information generating means 51 generates the background image data 61. The encoding conversion means 26 performs encoding conversion using the background image data 61 and the image data 22 and outputs image encoded data 28. The attention area information generation means 51 employs a background difference method that is generally used for moving object tracking and event detection, and can generate background image data 61 from the input image data 22.

次に、図29、図30の画面例を用いて本実施の形態に係る画像トランスコーダの動作について説明する。いずれの画面例も、図6に示す画面例の画像データに対し、右方向へ移動する歩行者のみを含む領域を注目領域33として符号化変換した場合の画面例である。図29(a)に示す最初のフレームでは、注目領域情報生成手段51で生成した背景画像データ61を低い空間的な画像品質で符号化し、注目領域33を高い空間的な画像品質で符号化している。図29(a)に示す2番目、3番目のフレームでは、当該フレームにおける注目領域33を高い空間的な画像品質で符号化変換している。   Next, the operation of the image transcoder according to the present embodiment will be described using the screen examples of FIGS. Each screen example is a screen example in the case where the region including only the pedestrian moving in the right direction is encoded and converted as the attention region 33 with respect to the image data of the screen example shown in FIG. In the first frame shown in FIG. 29 (a), the background image data 61 generated by the attention area information generating means 51 is encoded with a low spatial image quality, and the attention area 33 is encoded with a high spatial image quality. Yes. In the second and third frames shown in FIG. 29A, the attention area 33 in the frame is encoded and converted with high spatial image quality.

表示モジュールでは、符号化された背景画像データ61と注目領域33のデータとを復号し、作業メモリの各々別の領域に展開した後、表示メモリにコピーして図29(b)に示すように合成画面を表示する。なお、2番目、3番目のフレームについては、最初のフレームにおいて既に作業メモリ上に展開されている背景画像データ61と、各フレームの注目領域33のデータを復号して作業メモリに展開し、両データを表示メモリにコピーして合成表示している。以上の動作を第4フレーム以降も繰り返す。図30では、注目領域情報生成手段51で生成した背景画像データ61を、注目領域33と同じレベルの空間的な画像品質で符号化した例である。なお、図30(a)は、画像トランスコーダから出力される画像符号化データ28であり、図30(b)は、表示モジュールで表示される合成表示画面である。   In the display module, the encoded background image data 61 and the data of the attention area 33 are decoded, expanded in different areas of the working memory, copied to the display memory, and as shown in FIG. 29 (b). Display the composite screen. For the second and third frames, the background image data 61 already developed in the working memory in the first frame and the data of the attention area 33 of each frame are decoded and developed in the working memory. The data is copied to the display memory and displayed as a composite. The above operation is repeated after the fourth frame. FIG. 30 shows an example in which the background image data 61 generated by the attention area information generation means 51 is encoded with the same spatial image quality as the attention area 33. 30A shows the encoded image data 28 output from the image transcoder, and FIG. 30B shows a composite display screen displayed on the display module.

本実施の形態では、図26及び図27に示す画面例のように、実施の形態3に示すような一つ前のフレームにおいて注目領域33であった画像領域のデータが不要となる分、より画像符号化データ28のデータ量を低減することができ、より少ない出力ビットレートを達成することができる。また、左方向に移動する歩行者は背景画像に写らないため、注目する人や物以外を視覚的に除外した画像を表示することができる。   In the present embodiment, as in the screen examples shown in FIGS. 26 and 27, the data of the image area that was the attention area 33 in the previous frame as shown in the third embodiment becomes unnecessary. The data amount of the encoded image data 28 can be reduced, and a smaller output bit rate can be achieved. In addition, since a pedestrian who moves to the left does not appear in the background image, it is possible to display an image in which other than the person or object of interest is visually excluded.

以上のように、本実施の形態によれば、注目領域情報生成手段51が画像データ22から背景画像データ61を生成・更新し、符号化変換手段26がその背景画像データ61と画像データ22を用いて符号化変換するので、画像の主観品質を維持しつつ、より一層画像データの圧縮率を向上することができる。さらに、本実施の形態では、背景領域における不要な移動体を消去でき、注目領域の監視に最適な画像を表示できる。   As described above, according to the present embodiment, the attention area information generation unit 51 generates and updates the background image data 61 from the image data 22, and the encoding conversion unit 26 updates the background image data 61 and the image data 22. Therefore, the compression rate of the image data can be further improved while maintaining the subjective quality of the image. Furthermore, in this embodiment, unnecessary moving objects in the background area can be deleted, and an image optimal for monitoring the attention area can be displayed.

なお、本実施の形態では、注目領域情報生成手段51が入力画像符号化データを用いて背景画像を生成する構成としたが、本発明はこれに限定されるものではない。例えば、カメラ設置時に予め移動体が存在しないシーンを撮影し、当該シーンを固定の背景画像データ61として符号化変換手段26に与える構成でも良い。固定の背景画像データ61は一つではなく、時間帯や天候等の条件を変えて複数用意し符号化変換する画像符号化データの条件に合うものを選択して符号化変換手段に与えても良い。   In the present embodiment, the attention area information generating unit 51 generates the background image using the input image encoded data, but the present invention is not limited to this. For example, a configuration may be adopted in which a scene in which no moving object is present in advance when the camera is installed and the scene is given to the encoding conversion unit 26 as fixed background image data 61. The fixed background image data 61 is not limited to one, but a plurality of prepared background image data with different conditions such as time zone and weather may be prepared and selected according to the conditions of the encoded image data to be encoded and converted and supplied to the encoding conversion means. good.

また、注目領域情報生成手段51が注目領域情報24を生成・更新する場合のみ背景画像データ61を用いる構成に限定されない。注目領域情報24がカメラ毎に予め固定、ユーザーが対話的に変更、センサ信号等の外部から動的に変更する場合でも、背景画像データ61を用いて本実施の形態と同様な効果が得られる。さらに、本実施の形態においても、ネットワークトランスコーダ2を設け、当該ネットワークトランスコーダ2に画像トランスコーダを設ける構成であっても良い。   Further, the configuration is not limited to the configuration in which the background image data 61 is used only when the attention area information generation unit 51 generates and updates the attention area information 24. Even when the attention area information 24 is fixed in advance for each camera, the user interactively changes it, or dynamically changes the sensor signal or the like from the outside, the same effect as the present embodiment can be obtained by using the background image data 61. . Further, in the present embodiment, the network transcoder 2 may be provided, and the network transcoder 2 may be provided with the image transcoder.

(実施の形態5)
本実施の形態の画像トランスコーダも、実施の形態3と同様、図20の画像監視システムにおける画像蓄積・配信サーバに実装されている。図31、図32は、本実施の形態の画像トランスコーダにより符号化変換を行った後の画面例である。図31の画像例となる画像トランスコーダは、図21に示した画像例となる実施の形態3の画像トランスコーダと同様の構成を有する。しかし、本実施の形態の画像トランスコーダは、実施の形態3の画像トランスコーダと異なり、符号化変換手段26が最初のフレームにおける注目領域33と背景領域34のデータと、2番目及び3番目のフレームにおける注目領域33のデータとを、図31(b)に示すように一つのフレームの静止画データとして符号化変換を行っている。
(Embodiment 5)
Similarly to the third embodiment, the image transcoder of the present embodiment is also mounted on the image storage / distribution server in the image monitoring system of FIG. FIG. 31 and FIG. 32 are examples of screens after coding conversion is performed by the image transcoder of this embodiment. The image transcoder that is the image example of FIG. 31 has the same configuration as the image transcoder of the third embodiment that is the image example shown in FIG. However, unlike the image transcoder of the third embodiment, the image transcoder of the present embodiment is different from the image transcoder of the third embodiment in that the encoding / conversion means 26 performs the second and third data of the attention area 33 and the background area 34 in the first frame. The data of the attention area 33 in the frame is encoded and converted as still image data of one frame as shown in FIG.

図31(b)に示す画面例のように符号化変換行うことで、表示モジュールでの再生において歩行者が移動していく様子(軌跡)が一枚の静止画像として観察することできる。なお、4番目のフレーム以降についても、同様の処理を繰り返し、軌跡を示す画像を更新して表示する。また、各フレームを合成する方法としては、種々のバリエーションが考えられる。例えば、単純に3つの画像符号化データを順番に並べて、一つのフレームとして符号化データとして定義し、表示モジュールにおいて順番に復号して表示メモリに展開し、注目領域33のデータを対応する位置に上書きする。   By performing encoding conversion as in the screen example shown in FIG. 31B, it is possible to observe a state (trajectory) of a pedestrian moving as a single still image during reproduction on the display module. Note that the same processing is repeated for the fourth and subsequent frames, and the image indicating the locus is updated and displayed. In addition, various variations are conceivable as a method of synthesizing the frames. For example, the three encoded image data are simply arranged in order, defined as encoded data as one frame, decoded in order in the display module and expanded in the display memory, and the data of the attention area 33 is placed at the corresponding position. Overwrite.

また、別の方法としては、一つ前のフレームの画像符号化データから、現在のフレームにおける注目領域33に相当する部分を画像符号化データから削除し、削除した部分を当該注目領域33の画像符号化データに置き換える。具体的には、JPEG符号化であれば、マクロブロック単位に領域を設定し、ハフマン符号化を行う前のDCT(Discrete Cosine Transform)データの段階で、注目領域33のDCTデータに置き換える。さらに、上書きするあるいは置き換える際に、注目領域33の画像を半透明にし、α合成の重畳表示を行うことも可能である。   As another method, a portion corresponding to the attention area 33 in the current frame is deleted from the image encoding data from the image encoded data of the previous frame, and the deleted portion is imaged in the attention area 33. Replace with encoded data. Specifically, in the case of JPEG encoding, an area is set for each macroblock, and is replaced with DCT data of the attention area 33 at the stage of DCT (Discrete Cosine Transform) data before performing Huffman encoding. Furthermore, when overwriting or replacing, it is possible to make the image of the attention area 33 translucent and to perform α composition superposition display.

図32に示す画面例の画像トランスコーダは、図28に示す画面例となる実施の形態4の画像トランスコーダと同様の構成である。なお、図32(a)は、画像トランスコーダから出力される画像符号化データ28であり、図32(b)は、表示モジュールで表示される合成表示画面である。図32の画面例となる画像トランスコーダと図31の画面例となる画像トランスコーダとで異なる点は、背景画像データ61と画像データ22を用いて軌跡を示す画像を生成している点と、背景画像データ61と注目領域33とが同じ空間的な画像品質で符号化変換されている点である。   The image transcoder of the screen example shown in FIG. 32 has the same configuration as the image transcoder of the fourth embodiment, which is the screen example shown in FIG. FIG. 32A shows the encoded image data 28 output from the image transcoder, and FIG. 32B shows a composite display screen displayed on the display module. 32 is different from the image transcoder in the screen example of FIG. 31 in that the image showing the locus is generated using the background image data 61 and the image data 22; The background image data 61 and the attention area 33 are encoded and converted with the same spatial image quality.

以上のように、本実施の形態では、符号化変換手段26が連続する複数のフレームに対して、各フレームの注目領域33の画像符号化データが一つのフレームの静止画データとして合成されるので、ある時間間隔における注目領域33の変化を一枚の静止画像に凝縮して表示でき、変化の様子を短時間に把握することができる。なお、本実施の形態においても、ネットワークトランスコーダ2を設け、当該ネットワークトランスコーダ2に画像トランスコーダを設ける構成であっても良い。   As described above, in the present embodiment, the encoded image data of the attention area 33 of each frame is synthesized as still image data of one frame with respect to a plurality of frames in which the encoding conversion unit 26 is continuous. The change of the attention area 33 at a certain time interval can be condensed and displayed in a single still image, and the state of the change can be grasped in a short time. In this embodiment, a network transcoder 2 may be provided and an image transcoder may be provided in the network transcoder 2.

(実施の形態6)
本実施の形態に係る画像トランスコーダも、実施の形態3と同様に、図20の画像監視システムにおける画像蓄積・配信サーバ5に実装されている。本実施の形態に係る画像トランスコーダのブロック図を図33に示す。この画像トランスコーダは、実施の形態4の画像トランスコーダに実施の形態2で説明したビットレート制御機能を付加したものである。つまり、本実施の形態では、注目領域情報生成手段51にて抽出される注目領域33は歩行者の出現・消滅等に合わせて時間的に変化し、それに合わせて注目領域の面積や注目度合いも変化する。この注目度合いの変化に対し、一定の時間的・空間的な画像品質で符号化変換を行うと出力される画像符号化データ28のビットレートも変動することになる。
(Embodiment 6)
Similarly to the third embodiment, the image transcoder according to the present embodiment is also mounted on the image storage / distribution server 5 in the image monitoring system of FIG. FIG. 33 shows a block diagram of the image transcoder according to the present embodiment. This image transcoder is obtained by adding the bit rate control function described in the second embodiment to the image transcoder of the fourth embodiment. In other words, in the present embodiment, the attention area 33 extracted by the attention area information generating means 51 changes with time in accordance with the appearance / disappearance of a pedestrian, and the area and the degree of attention of the attention area accordingly. Change. When the coding conversion is performed with a certain temporal and spatial image quality, the bit rate of the encoded image data 28 to be output also varies with respect to the change in the degree of attention.

そこで、本実施の形態では、注目領域情報24が更新された際に、ビットレート入力手段41が受付けた目標ビットレート値になるよう品質設定手段26において、注目度合いや注目領域33の面積に基づき領域品質情報を更新し、符号化変換手段26に渡す。符号化変換手段26は、更新された領域品質情報25に基づき、実施の形態2で説明したビットレート制御機能により、目標ビットレート値になるよう符号化変換処理を行う。   Therefore, in the present embodiment, when the attention area information 24 is updated, the quality setting means 26 makes the target bit rate value received by the bit rate input means 41 based on the degree of attention and the area of the attention area 33. The area quality information is updated and passed to the encoding conversion means 26. Based on the updated area quality information 25, the encoding conversion unit 26 performs encoding conversion processing so as to obtain a target bit rate value by the bit rate control function described in the second embodiment.

次に、図34乃至図36の画面例を用いて本実施の形態に係る画像トランスコーダの動作について説明する。図34の画面例は、入力される画像データ22を示しており、最初の4枚のフレームには一人の歩行者、次の4枚のフレームには二人の歩行者が写っている。歩行者を注目領域33とすると、最初の4つの画像フレームと次の4つの画像フレームでは注目領域の面積がほぼ倍に変化することになる。そのため、与えられたビットレートを有効に利用し画像の内容に応じた高い画像品質で符号化変換するとすれば、最初の4フレームと次の4フレームとで各領域の時間的・空間的な画像品質の設定を変更する必要がある。   Next, the operation of the image transcoder according to the present embodiment will be described using the screen examples of FIGS. The screen example of FIG. 34 shows the input image data 22, and one pedestrian is shown in the first four frames, and two pedestrians are shown in the next four frames. Assuming that the pedestrian is the attention area 33, the area of the attention area changes almost double in the first four image frames and the next four image frames. Therefore, if the given bit rate is used effectively and encoded and converted with high image quality in accordance with the content of the image, the temporal and spatial images of each region in the first 4 frames and the next 4 frames. You need to change the quality settings.

図35の画面例では、注目領域33の時間的・空間的な画像品質は変更せずに、背景領域34の時間的な画像品質のみを変更することで対応している。例えば、最初の4フレームでは、背景領域34のフレームレートが入力画像に対して1/2、つまり2フレームに1フレームの割合で間引いていたが、次の4フレームでは、背景領域34のフレームレートが入力画像に対して1/4、つまり4フレームに1フレームの割合で間引いている。   In the screen example of FIG. 35, the temporal / spatial image quality of the attention area 33 is not changed, but only the temporal image quality of the background area 34 is changed. For example, in the first four frames, the frame rate of the background region 34 is ½ that of the input image, that is, the frame rate of the background region 34 is thinned out at a rate of one frame per two frames. Is thinned out to 1/4 of the input image, that is, at a rate of 1 frame to 4 frames.

逆に、図36に示す画面例では、注目領域33の時間的・空間的な画像品質は変更せずに、背景領域34の空間的な画像品質のみを変更することで対応している。例えば、最初の4フレームでは、背景領域34の空間的な画像品質はレベル2であるが、次の4フレームではレベル1とする。図36では、空間的な画像品質のレベルをハッチングで表現しており、最初の4フレームは一方向の斜線によるハッチング、次の4フレームは両方向の斜線によるハッチングである。図36に示す画面例では、図34に示す画面例と比べ背景領域34の空間的な画像品質は低下するが、背景領域34に重要性はないが時間変化をぼんやりと観察したい場合に適している。   Conversely, in the screen example shown in FIG. 36, the temporal and spatial image quality of the attention area 33 is not changed, but only the spatial image quality of the background area 34 is changed. For example, the spatial image quality of the background area 34 is level 2 in the first four frames, but is level 1 in the next four frames. In FIG. 36, the level of spatial image quality is expressed by hatching, the first four frames are hatched by diagonal lines in one direction, and the next four frames are hatched by diagonal lines in both directions. In the screen example shown in FIG. 36, the spatial image quality of the background area 34 is lower than that in the screen example shown in FIG. 34, but this is suitable for the case where the background area 34 is not important but it is desired to observe the time change gently. Yes.

以上のように、本実施の形態では、画像内容の変化に伴い注目領域情報24が変化した場合に、品質設定手段23が目標ビットレート値になるよう領域品質情報を更新し、更新した領域品質情報に基づき符号化変換手段26が符号化変換するので、画像内容の変化に伴い注目領域33の数や面積が変化しても、限られた帯域を有効に利用して画像の主観品質の高い符号化変換を実現することができる。   As described above, in the present embodiment, when the attention area information 24 changes with the change of the image content, the quality setting means 23 updates the area quality information so that the target bit rate value is obtained, and the updated area quality is obtained. Since the encoding conversion means 26 performs encoding conversion based on the information, even if the number and area of the attention area 33 change as the image contents change, the limited quality of the image is high by effectively using the limited band. Encoding conversion can be realized.

また、本実施の形態においても、ネットワークトランスコーダ2を設け、当該ネットワークトランスコーダ2に画像トランスコーダを設ける構成であっても良い。   Also in this embodiment, the network transcoder 2 may be provided, and the network transcoder 2 may be provided with an image transcoder.

なお、上記の説明において、画像トランスコーダの入出力は、フレーム間隔の長い準動画像符号化データであっても構わない。また、複数の注目領域33に対し同じ注目度合いを設定するとして説明したが、領域毎あるいは領域の種類(例えば右に移動する歩行者と左へ移動する歩行者)に異なる注目度合いを設定してもよい。   In the above description, the input / output of the image transcoder may be quasi-moving image encoded data having a long frame interval. In addition, although it has been described that the same attention level is set for a plurality of attention areas 33, different attention levels are set for each area or for each type of area (for example, a pedestrian moving to the right and a pedestrian moving to the left). Also good.

本発明の実施の形態1に係る画像監視システムのシステム構成図である。1 is a system configuration diagram of an image monitoring system according to Embodiment 1 of the present invention. 本発明の実施の形態1に係る画像トランスコーダのブロック図である。1 is a block diagram of an image transcoder according to Embodiment 1 of the present invention. FIG. 本発明の実施の形態1に係る注目領域情報を示す図である。It is a figure which shows attention area information which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る画像品質テーブルを示す図である。It is a figure which shows the image quality table which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る領域品質情報を示す図である。It is a figure which shows the area | region quality information which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る画像トランスコーダに入力される画像データの画面例を示す図である。It is a figure which shows the example of a screen of the image data input into the image transcoder which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る画像トランスコーダと対比する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data compared with the image transcoder which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 1 of this invention outputs. 本発明の実施の形態1に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 1 of this invention outputs. 本発明の実施の形態1に係る画像トランスコーダと対比する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data compared with the image transcoder which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 1 of this invention outputs. 本発明の実施の形態1に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 1 of this invention outputs. 本発明の実施の形態2に係る画像トランスコーダのブロック図である。It is a block diagram of the image transcoder which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る画像品質テーブルを示す図である。It is a figure which shows the image quality table which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る領域品質情報を示す図である。It is a figure which shows the area | region quality information which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 2 of this invention outputs. 本発明の実施の形態2に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 2 of this invention outputs. 本発明の実施の形態2に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 2 of this invention outputs. 本発明の実施の形態2に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 2 of this invention outputs. 本発明の実施の形態3に係る画像監視システムのシステム構成図である。It is a system block diagram of the image monitoring system which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る画像トランスコーダのブロック図である。It is a block diagram of the image transcoder which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る画像トランスコーダと対比する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data compared with the image transcoder which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 3 of this invention outputs. 本発明の実施の形態3に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 3 of this invention outputs. 本発明の実施の形態3に係る画像トランスコーダと対比する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data compared with the image transcoder which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 3 of this invention outputs. 本発明の実施の形態3に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 3 of this invention outputs. 本発明の実施の形態4に係る画像トランスコーダのブロック図である。It is a block diagram of the image transcoder which concerns on Embodiment 4 of this invention. 本発明の実施の形態4に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 4 of this invention outputs. 本発明の実施の形態4に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 4 of this invention outputs. 本発明の実施の形態5に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 5 of this invention outputs. 本発明の実施の形態5に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 5 of this invention outputs. 本発明の実施の形態6に係る画像トランスコーダのブロック図である。It is a block diagram of the image transcoder based on Embodiment 6 of this invention. 本発明の実施の形態6に係る画像トランスコーダに入力する画像データの画面例を示す図である。It is a figure which shows the example of a screen of the image data input into the image transcoder which concerns on Embodiment 6 of this invention. 本発明の実施の形態6に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 6 of this invention outputs. 本発明の実施の形態6に係る画像トランスコーダが出力する画像符号化データの画面例を示す図である。It is a figure which shows the example of a screen of the image coding data which the image transcoder concerning Embodiment 6 of this invention outputs.

符号の説明Explanation of symbols

1 カメラ、2 ネットワークエンコーダ、3 防災ネットワーク、4 画像表示端末、5 画像蓄積・配信サーバ、6 ネットワークトランスコーダ、7 ゲートウェイ、8 事務用ネットワーク、9 事務用端末、10 公衆網、11 モバイル端末、12 パソコン、21 画像入力手段、22 画像データ、23 品質設定手段、24 注目領域情報、25 領域品質情報、26 符号化変換手段、27 画像出力手段、28 画像符号化データ、32 画像品質テーブル、33 注目領域、34 背景領域、41 ビットレート入力手段、51 注目領域情報生成手段、61 背景画像データ。
1 camera, 2 network encoder, 3 disaster prevention network, 4 image display terminal, 5 image storage / distribution server, 6 network transcoder, 7 gateway, 8 office network, 9 office terminal, 10 public network, 11 mobile terminal, 12 PC, 21 image input means, 22 image data, 23 quality setting means, 24 attention area information, 25 area quality information, 26 encoding conversion means, 27 image output means, 28 image encoded data, 32 image quality table, 33 attention Area, 34 background area, 41 bit rate input means, 51 attention area information generation means, 61 background image data.

Claims (5)

符号化された画像データを入力する画像入力手段と、
画像領域の情報と、前記画像領域毎にその注目度合いを示す情報とからなる注目領域情報に基づき、前記画像領域毎に少なくとも時間的な画像品質を設定する情報からなる領域品質情報を出力する品質設定手段と、
入力された前記画像データを、前記画像領域毎に前記領域品質情報に基づく画像品質を持つ画像符号化データに変換する符号化変換手段と、
前記画像符号化データを出力する画像出力手段とを備える画像トランスコーダ。
Image input means for inputting encoded image data;
Quality of outputting region quality information consisting of information for setting at least temporal image quality for each image region based on attention region information consisting of information on the image region and information indicating the degree of attention for each image region Setting means;
Encoding conversion means for converting the input image data into image encoded data having image quality based on the area quality information for each image area;
An image transcoder comprising image output means for outputting the image encoded data.
前記符号化変換手段は、前記画像符号化データを構成する複数の連続フレームを当該連続フレームにおける少なくとも一部の画像領域の連続を含む一枚のフレームの静止画データに変換し、
前記画像出力手段は、前記静止画データを一枚の静止画像、あるいは静止画像の時系列集合として出力することを特徴とする請求項1に記載の画像トランスコーダ。
The encoding conversion means converts a plurality of continuous frames constituting the image encoded data into still image data of one frame including a continuation of at least a part of the image area in the continuous frames,
The image transcoder according to claim 1, wherein the image output means outputs the still image data as one still image or a time-series set of still images.
前記画像出力手段から出力される前記画像符号化データの目標ビットレート又は目標データ量を前記品質設定手段に入力するビットレート入力手段をさらに備え、
前記品質設定手段は、前記目標ビットレート又は前記目標データ量に基づいて、前記領域品質情報における画像領域毎の画像品質に関する情報を更新することを特徴とする請求項1又は請求項2に記載の画像トランスコーダ。
A bit rate input means for inputting a target bit rate or a target data amount of the encoded image data output from the image output means to the quality setting means;
The said quality setting means updates the information regarding the image quality for every image area in the said area quality information based on the said target bit rate or the said target data amount, The Claim 1 or Claim 2 characterized by the above-mentioned. Image transcoder.
前記画像入力手段からの前記画像データに基づいて、注目する画像領域を抽出し、当該注目する画像領域の情報を用いて前記注目領域情報を生成して、前記品質設定手段に出力する注目領域情報生成手段をさらに備えることを特徴とする請求項1乃至請求項3のいずれか1つに記載の画像トランスコーダ。   Based on the image data from the image input means, extract an attention image area, generate the attention area information using information on the attention image area, and output the attention area information to the quality setting means The image transcoder according to claim 1, further comprising a generation unit. 前記符号化変換手段は、注目する画像領域の前記画像データと背景画像のみからなる背景画像データとを組み合わせて、前記領域品質情報に基づき前記画像符号化データに符号化変換することを特徴とする請求項1乃至請求項4のいずれか1つに記載の画像トランスコーダ。
The coding conversion means combines the image data of the image area of interest and background image data consisting only of a background image, and performs coding conversion to the image coding data based on the area quality information. The image transcoder according to any one of claims 1 to 4.
JP2004262043A 2004-09-09 2004-09-09 Image transcoder Pending JP2006080832A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004262043A JP2006080832A (en) 2004-09-09 2004-09-09 Image transcoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004262043A JP2006080832A (en) 2004-09-09 2004-09-09 Image transcoder

Publications (1)

Publication Number Publication Date
JP2006080832A true JP2006080832A (en) 2006-03-23

Family

ID=36159929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004262043A Pending JP2006080832A (en) 2004-09-09 2004-09-09 Image transcoder

Country Status (1)

Country Link
JP (1) JP2006080832A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009071389A (en) * 2007-09-10 2009-04-02 Fujifilm Corp Unit and method for processing image, and program
JPWO2009119807A1 (en) * 2008-03-28 2011-07-28 日本電気株式会社 Video transcoder monitoring device, method and program thereof
JPWO2009119721A1 (en) * 2008-03-26 2011-07-28 日本電気株式会社 Video transcoder monitoring device, method and monitoring program thereof
JP2013146077A (en) * 2009-03-06 2013-07-25 Alcatel-Lucent Real-time multi-media streaming bandwidth management
WO2016110922A1 (en) * 2015-01-07 2016-07-14 Canon Kabushiki Kaisha Image decoding apparatus, image decoding method, and storage medium
JP2017085396A (en) * 2015-10-29 2017-05-18 沖電気工業株式会社 Video storage system, video storage device, and program
WO2017179271A1 (en) * 2016-04-12 2017-10-19 株式会社Nexpoint Monitor camera system and monitor camera data saving method
WO2021251370A1 (en) * 2020-06-09 2021-12-16 日本電気株式会社 Communication control system and communication control method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009071389A (en) * 2007-09-10 2009-04-02 Fujifilm Corp Unit and method for processing image, and program
JPWO2009119721A1 (en) * 2008-03-26 2011-07-28 日本電気株式会社 Video transcoder monitoring device, method and monitoring program thereof
JPWO2009119807A1 (en) * 2008-03-28 2011-07-28 日本電気株式会社 Video transcoder monitoring device, method and program thereof
JP2013146077A (en) * 2009-03-06 2013-07-25 Alcatel-Lucent Real-time multi-media streaming bandwidth management
WO2016110922A1 (en) * 2015-01-07 2016-07-14 Canon Kabushiki Kaisha Image decoding apparatus, image decoding method, and storage medium
JP2017085396A (en) * 2015-10-29 2017-05-18 沖電気工業株式会社 Video storage system, video storage device, and program
WO2017179271A1 (en) * 2016-04-12 2017-10-19 株式会社Nexpoint Monitor camera system and monitor camera data saving method
JP2017191984A (en) * 2016-04-12 2017-10-19 株式会社Nexpoint Monitoring camera system and monitoring camera data storage method
WO2021251370A1 (en) * 2020-06-09 2021-12-16 日本電気株式会社 Communication control system and communication control method
JP7444253B2 (en) 2020-06-09 2024-03-06 日本電気株式会社 Communication control system and communication control method

Similar Documents

Publication Publication Date Title
JP3086396B2 (en) Image encoding device and image decoding device
US20200107022A1 (en) 360-degree image encoding apparatus and method, and recording medium for performing the same
KR101108501B1 (en) Method for coding motion in a video sequence
JP3926572B2 (en) Image monitoring method, image monitoring apparatus, and storage medium
US20060013495A1 (en) Method and apparatus for processing image data
JP2005286472A (en) Image processing apparatus and image processing method
JPH09214970A (en) Image code converting system
JP2006245746A (en) Monitoring system
JPH10178639A (en) Image codec part and image data encoding method
JP2006080832A (en) Image transcoder
JP2005341076A (en) Image communication system, communication conference system, hierarchical encoder, server device, image communication method, image communication program, and image communication program recording medium
JPH0654310A (en) Animation picture transmitter
JP2003163914A (en) Monitor system and picture transmission unit
JP3098939B2 (en) Video encoding device and video decoding device
JP2009055236A (en) Video coder and method
JP4693096B2 (en) Multipoint conference device
JP3317327B2 (en) Moving picture coding method and apparatus
JP2005045666A (en) Transcoder
JP2006013754A (en) Dynamic image coder and dynamic image decoder
JP2007312399A (en) Image encoding device and image decoding device, and image display device and method utilizing the same
JP4241463B2 (en) Image processing device
JP3956010B2 (en) Video transmission system and video transmission control method
JP2011199354A (en) Image processing unit, image reproducing unit, and image processing system
JP3115866B2 (en) Image encoding device and image decoding device
JP4613453B2 (en) Moving picture coding system, moving picture coding method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090303