JP2006254308A - Video recording apparatus and video recording method - Google Patents
Video recording apparatus and video recording method Download PDFInfo
- Publication number
- JP2006254308A JP2006254308A JP2005071005A JP2005071005A JP2006254308A JP 2006254308 A JP2006254308 A JP 2006254308A JP 2005071005 A JP2005071005 A JP 2005071005A JP 2005071005 A JP2005071005 A JP 2005071005A JP 2006254308 A JP2006254308 A JP 2006254308A
- Authority
- JP
- Japan
- Prior art keywords
- video
- subband
- video signal
- recording
- compressed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
本発明は、入力された映像を圧縮してハードディスク等の記録媒体に記録する映像記録装置及び映像記録方法に関する。 The present invention relates to a video recording apparatus and a video recording method for compressing an input video and recording it on a recording medium such as a hard disk.
従来、上述した映像記録装置には、ユーザの操作による解像度の切り替えを可能にしたものがある(例えば、特許文献1参照)。特許文献1で開示された動画及び静止画の記録/再生方法では、例えば通常の動画フレームを320×240の画素サイズで記録するが、高画質モードボタンを押下すると、そのタイミングで取得したフレーム画像については1280×960の画素サイズで記録することを可能としている。 2. Description of the Related Art Conventionally, there is a video recording apparatus that can switch resolutions by a user operation (for example, see Patent Document 1). In the moving image and still image recording / reproducing method disclosed in Patent Document 1, for example, a normal moving image frame is recorded with a pixel size of 320 × 240, but when a high image quality mode button is pressed, a frame image acquired at that timing is recorded. Can be recorded with a pixel size of 1280 × 960.
しかしながら、従来の映像記録装置においては、解像度の切り替えはユーザの操作によるため、高解像度の映像情報を自動的に記録することができないという問題がある。 However, the conventional video recording apparatus has a problem that high-resolution video information cannot be automatically recorded because the resolution is switched by a user operation.
本発明は、係る事情に鑑みてなされたものであり、高解像度の映像情報を自動的に記録することができる映像記録装置及び映像記録方法を提供することを目的とする。 The present invention has been made in view of such circumstances, and an object thereof is to provide a video recording apparatus and a video recording method capable of automatically recording high-resolution video information.
上記目的は下記構成及び方法により達成される。
(1) 入力された映像信号を記録媒体に蓄積する映像記録装置であって、入力された映像信号を周波数変換して周波数領域映像信号を得る周波数変換手段と、前記周波数変換手段で得られた周波数領域映像信号を複数のサブバンド映像信号に分割するサブバンド分割手段と、高解像度記録指定された映像に対しては、前記サブバンド分割手段で得られた複数のサブバンド映像信号の全てを選択し、前記高解像度記録指定されなかった映像に対しては、前記サブバンド分割手段で得られた複数のサブバンド映像信号のうち低域側の一部を選択する選択手段と、前記選択手段で選択された各サブバンド映像信号を圧縮してサブバンド圧縮映像信号を生成する圧縮手段と、前記高解像度記録指定された映像に対しては、前記選択手段で選択されて前記圧縮手段で圧縮された全てのサブバンド圧縮映像信号を多重し、前記高解像度記録指定されなかった映像に対しては、前記選択手段で選択されて前記圧縮手段で圧縮された低域側の一部のサブバンド圧縮映像信号を多重する多重化手段と、前記多重化手段にて多重化されたサブバンド圧縮映像信号を前記記録媒体に記録する記録制御手段と、を備える。この構成により、高解像度の映像情報を自動的に記録することが可能となる。また、映像の全てを高解像度で記録せず、意味を持たない映像については低解像度で記録するので、記録媒体を有効に活用することができる。
The above object can be achieved by the following constitution and method.
(1) A video recording apparatus for accumulating an input video signal in a recording medium, obtained by the frequency conversion means for converting the frequency of the input video signal to obtain a frequency domain video signal, and the frequency conversion means Subband dividing means for dividing the frequency domain video signal into a plurality of subband video signals, and for a video designated for high resolution recording, all of the plurality of subband video signals obtained by the subband dividing means are Selecting means for selecting a part on the low frequency side of the plurality of subband video signals obtained by the subband dividing means for the video that is selected and not designated for high resolution recording; and the selecting means Compression means for compressing each sub-band video signal selected in step (b) to generate a sub-band compressed video signal; and for the video designated for high-resolution recording, All the sub-band compressed video signals compressed by the compression means are multiplexed, and for the video that is not designated for high-resolution recording, the low-frequency side selected by the selection means and compressed by the compression means Multiplexing means for multiplexing some of the subband compressed video signals, and recording control means for recording the subband compressed video signals multiplexed by the multiplexing means on the recording medium. With this configuration, it is possible to automatically record high-resolution video information. In addition, since all of the video is not recorded at a high resolution and a video having no meaning is recorded at a low resolution, the recording medium can be effectively used.
(2) フレーム単位で入力された映像信号を記録媒体に蓄積する映像記録装置であって、入力された映像信号を画像処理して人物が最も良く写っているフレームを検出してベストショットトリガ信号を生成するベストショットトリガ信号生成手段と、入力された映像信号を周波数変換して周波数領域映像信号を得る周波数変換手段と、前記周波数変換手段で得られた周波数領域映像信号を複数のサブバンド映像信号に分割するサブバンド分割手段と、前記ベストショットトリガ信号生成手段にてベストショットトリガ信号が生成されたときには、そのときのフレームに対応する全てのサブバンド映像信号を選択し、前記ベストショットトリガ信号が生成されなかったときには、そのときのフレームに対応する低域側の一部のサブバンド映像信号を選択する選択手段と、前記選択手段にて選択された各サブバンド映像信号を圧縮してサブバンド圧縮映像信号として出力する圧縮手段と、前記圧縮手段にて圧縮された各サブバンド映像信号を多重して圧縮映像信号として出力する多重手段と、前記多重手段からの圧縮映像信号の前記記録媒体への記録を制御する記録制御手段と、を備える。この構成により、人物の顔が最も良く映っている画像のみを高解像度で記録することができる。すなわち、入力された映像信号から高解像度の映像情報を自動的に取得して記録することができる。また、映像の全てを高解像度で記録せず、ベストショットでない映像については低解像度で記録するので、記録媒体を有効に活用することができる。 (2) A video recording apparatus for storing a video signal input in units of frames in a recording medium, and performing image processing on the input video signal to detect a frame in which a person is best reflected to detect a best shot trigger signal A best shot trigger signal generating means for generating a frequency conversion means for frequency-converting an input video signal to obtain a frequency domain video signal, and a frequency domain video signal obtained by the frequency conversion means for a plurality of subband videos When the best shot trigger signal is generated by the subband dividing means for dividing the signal and the best shot trigger signal generating means, all the subband video signals corresponding to the frame at that time are selected, and the best shot trigger is selected. When no signal was generated, some subband images on the low frequency side corresponding to the frame at that time Selection means for selecting a signal, compression means for compressing each subband video signal selected by the selection means and outputting it as a subband compressed video signal, and each subband video signal compressed by the compression means And a recording control means for controlling the recording of the compressed video signal from the multiplexing means onto the recording medium. With this configuration, it is possible to record only an image in which a person's face is best reflected with high resolution. That is, it is possible to automatically acquire and record high-resolution video information from the input video signal. In addition, since all of the video is not recorded at a high resolution and a video that is not the best shot is recorded at a low resolution, the recording medium can be used effectively.
(3) 入力された映像信号を記録媒体に蓄積する映像記録方法であって、入力された映像信号を周波数変換し、これにより得られた周波数領域映像信号を複数のサブバンド映像信号に分割し、高解像度記録指定された映像に対しては、該映像に対する複数のサブバンド映像信号の全てを圧縮してサブバンド圧縮映像信号を生成し、これにより得られた全てのサブバンド圧縮映像信号を多重して記録媒体に記録し、前記高解像度記録指定されなかった映像に対しては、該映像に対する複数のサブバンド映像信号の低域側の一部を圧縮してサブバンド圧縮映像信号を生成し、これにより得られた一部のサブバンド圧縮映像信号を多重して記録媒体に記録する。この構成により、高解像度の映像情報を自動的に記録することが可能となる。また、映像の全てを高解像度で記録せず、意味を持たない映像については低解像度で記録するので、記録媒体を有効に活用することができる。 (3) A video recording method for storing an input video signal in a recording medium, wherein the input video signal is frequency-converted, and the resulting frequency domain video signal is divided into a plurality of subband video signals. For a video designated for high resolution recording, all of the plurality of subband video signals corresponding to the video are compressed to generate a subband compressed video signal, and all the subband compressed video signals obtained thereby are Multiplexed and recorded on a recording medium, and for the video that is not designated for high-resolution recording, a part of the low frequency side of the plurality of subband video signals for the video is compressed to generate a subband compressed video signal Then, some of the sub-band compressed video signals obtained thereby are multiplexed and recorded on the recording medium. With this configuration, it is possible to automatically record high-resolution video information. In addition, since all of the video is not recorded at a high resolution and a video having no meaning is recorded at a low resolution, the recording medium can be effectively used.
(4) 映像信号を入力として受けて記録媒体に蓄積する映像記録方法であって、入力された映像信号を受けて動きがある領域のみ抽出した後、抽出した動領域の中から人物が写っている部分を抽出して人物が最も良く写っているフレームを検出してベストショットトリガ信号を生成し、入力された映像信号を周波数領域映像信号に周波数変換した後、該周波数領域映像信号を複数のサブバンド映像信号に分割し、前記ベストショットトリガ信号が生成されたときには、そのときのフレームに対応する全てのサブバンド映像信号を選択し、前記ベストショットトリガ信号が生成されなかったときには、そのときのフレームに対応する低域側の一部のサブバンド映像信号を選択し、選択した各サブバンド映像信号を圧縮してサブバンド圧縮映像信号として、各サブバンド映像信号を多重して圧縮映像信号として前記記録媒体に記録する。この構成により、人物の顔が最も良く映っている画像を高解像度で記録することができる。すなわち、この発明でも、入力された映像信号から高解像度の映像情報を自動的に取得して記録することができる。また、映像の全てを高解像度で記録せず、ベストショットでない映像については低解像度で記録するので、記録媒体を有効に活用することができる。 (4) A video recording method for receiving a video signal as input and storing it in a recording medium. After receiving an input video signal and extracting only a region with motion, a person is captured from the extracted motion region. The frame in which the person is best captured is detected to generate a best shot trigger signal, and the input video signal is frequency-converted into a frequency domain video signal. When the best shot trigger signal is generated by dividing into sub-band video signals, all sub-band video signals corresponding to the frame at that time are selected, and when the best shot trigger signal is not generated, Select a sub-band video signal on the low-frequency side corresponding to the frame of, and compress the selected sub-band video signal to sub-band compressed video No. As is recorded on the recording medium each sub-band video signals as multiplexed with the compressed video signal. With this configuration, an image in which a person's face is best reflected can be recorded with high resolution. That is, also in the present invention, high-resolution video information can be automatically acquired from an input video signal and recorded. In addition, since all of the video is not recorded at a high resolution and a video that is not the best shot is recorded at a low resolution, the recording medium can be used effectively.
本発明は、高解像度で記録したい映像を指定することにより入力された映像信号から、高解像度の映像情報を自動的に取得して記録するという効果を有する映像記録装置及び映像記録方法を提供することができるものである。 The present invention provides a video recording apparatus and a video recording method having an effect of automatically acquiring and recording high resolution video information from an input video signal by designating a video to be recorded at a high resolution. It is something that can be done.
以下、本発明を実施するための好適な実施の形態について、図面を参照して詳細に説明する。 DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments for carrying out the invention will be described in detail with reference to the drawings.
図1は、本発明の一実施の形態に係る映像記録装置の概略構成を示すブロック図である。この図において、本実施の形態の映像記録装置100は、人物を記録する監視用に用いられるものであり、動領域抽出部101と、人領域抽出部102と、ベストショット判定部103と、サブバンド分割部104と、高域用バッファ105、低域用バッファ106と、選択部107と、高域圧縮部108、低域圧縮部109と、サブバンド多重部110と、記録制御部111と、ストレージ112とを備えて構成される。
FIG. 1 is a block diagram showing a schematic configuration of a video recording apparatus according to an embodiment of the present invention. In this figure, a video recording apparatus 100 according to the present embodiment is used for monitoring to record a person, and includes a moving
なお、サブバンド分割部104は、周波数変換手段とサブバンド分割手段に対応する。また、選択部107は、選択手段に対応する。また、高域圧縮部108及び低域圧縮部109は、圧縮手段に対応する。また、サブバンド多重部110は、多重化手段に対応する。また、記録制御部111は、記録制御手段に対応する。また、動領域抽出部101、人領域抽出部102及びベストショット判定部103は、ベストショットトリガ信号生成手段を構成する。
The
動領域抽出部101は、図示しないカメラからの映像信号又は該映像信号を処理した信号を入力として受けて映像中の動きを検出し、動きのあった領域だけを抽出して動領域信号として人領域抽出部102に入力する。動領域抽出のための手法としては、最も一般的な背景差分法を用いるものとするが、フレーム間差分、オプティカルフロー、ステレオ視などの手法であっても構わない。動領域抽出部101の出力としては、動きがあった画素を「1」、動きがない画素を「0」とした2値画像を想定する。
The motion
人領域抽出部102は、動領域抽出部101より入力された動領域信号から動領域が人物かどうかを判定し、人物であると判断した場合のみ人領域信号として出力する。すなわち、人領域抽出部102は、映像中に動きがある場合のみ動作する。映像中に動きがある場合、動領域抽出部101からは動きがあった領域とそうでない領域とを区別した2値画像が出力されるが、今回は楕円ハフ法による頭部検出によって人かそうでないかを判定するものとする。楕円ハフ法を適用するためには、動領域抽出部101より入力された2値画像に対してエッジ検出を行い、検出したエッジの形状が楕円に近いかどうかを楕円ハフ変換を用いて判定する。この楕円ハフ法は、映像中に人体が写っている場合、頭部が楕円形状となるため、人かどうかを高精度に判別することができる有効な手法である。楕円ハフ法以外の手法としては、目鼻などの顔の構造を検出する手法がある。
The human
例えば、近年多く用いられるブースティング(Boosting)と呼ばれる手法では、目鼻などの顔の陰影を非常にラフなテンプレートとの比較で高速に検出することが可能である。顔の構造を検出する方法に対する楕円ハフ法の優位点は、後ろ向きなど顔の構造が明確に検出できないケースでも人物を高精度に検出できる点にある。カメラの設置位置によっては通過する人物の顔が必ずしもカメラの視野に入るとは限らないため、今回は楕円ハフ法を採用する。ドアにカメラを設置するケースなど、確実に顔構造が撮影できるような条件下であれば、顔構造を検出する方法でも構わない。 For example, a technique called boosting, which is often used in recent years, can detect a shadow of a face such as the eyes and nose at high speed by comparing with a very rough template. The advantage of the elliptical Hough method over the method of detecting the face structure is that a person can be detected with high accuracy even when the face structure cannot be clearly detected such as backwards. Depending on the camera installation position, the face of the passing person does not necessarily enter the field of view of the camera, so this time the elliptical Hough method is adopted. A method of detecting the face structure may be used as long as the face structure can be reliably photographed, such as a case where a camera is installed on the door.
ベストショット判定部103は、人領域信号から人物の写りの良さを判定し、最も良いシーンを指示する。すなわち、ベストショット判定部103は、一連の映像の中から人物が最も良く写っている1枚を選択する。本実施の形態では、「人物の顔のサイズ」、「顔のコントラスト」、「欠落がないこと」、「顔の向き」の4つを基準としてベストショットを選択する。人物の顔のサイズは楕円ハフでの適合テンプレートサイズから算出する。また、楕円テンプレートとの適合が一部に偏っている場合、欠落があると判定する。顔の向きについては、顔の横方向の輝度勾配を利用する。
The best
一般に正面向きは輝度勾配がフラットになり、右向きや左向きでは後頭部が暗く、顔部が明るくなることから輝度勾配が生じる。顔コントラストは顔部の輝度の幅から算出することができる。本実施の形態では、この4つの基準の多数決を用いてベストショット1枚を選択する。1つの基準だけが高得点を取るのではなく、多数(本例では3つ)の基準がこれまでのベストショットのパラメータよりも良い場合、最新のフレームをベストショットとし、以前のベストショットを置換する。 In general, the luminance gradient is flat in the front direction, and the luminance gradient occurs because the back of the head is dark and the face is bright in the right direction and the left direction. The face contrast can be calculated from the luminance width of the face portion. In the present embodiment, one best shot is selected using the majority of these four criteria. If only one criterion gets a high score, but many (three in this example) are better than the best shot parameters so far, the most recent frame is taken as the best shot and the previous best shot is replaced. To do.
サブバンド分割部104は、入力される映像信号を周波数変換して周波数領域映像信号にし、この周波数領域映像信号を複数のサブバンド領域に分割する。すなわち、入力される映像を周波数に基づいて一定のサブバンドに分割する。本実施の形態ではウェーブレット変換を用いた水平2段、垂直2段の分割を想定する。図2の(a)に水平2段、垂直2段の分割を行った結果を示す。この場合、「H」が高周波側、「L」が低周波側を表し、「LL」は水平方向及び垂直方向夫々が低域のサブバンド、「HL」は水平方向が高域、垂直方向が低域のサブバンド、「LH」は水平方向が低域、垂直方向が高域のサブバンド、「HH」は水平方向及び垂直方向夫々が高域のサブバンドである。「LL」が元の映像に対して1/4サイズの縮小画像となるため、サムネイル表示などに用いる縮小画像を容易に得られることがサブバンド符号化のメリットである。更に分割を水平1段、垂直1段行うことで、図2の(b)のように7つの帯域に分割できる。LLLLサブバンドが1/16サイズの縮小画像となる。
The
以上のように分割された各サブバンドは、それぞれバッファに一時的に保存される。ベストショットを決定するためにはある人物が視野から退場するまで待つ必要があるためである。退場するまでの時間は使用されるシーンによって異なるが、一概に何秒以内と決定することができずバッファ容量も有限なので、バッファ容量から規定される最大滞在時間を超えた場合の処理が必要となる。本実施の形態では最大滞在時間を超えた場合、そこまでのベストショットを確定されたベストショットとして出力し、次のフレームから新たにベストショットの判定を再開する。本実施の形態では、図2の(b)のLLLLサブバンドを低域側バッファ106に保存し、それ以外の6つのサブバンドを高域側バッファ105に保存する。
Each subband divided as described above is temporarily stored in a buffer. This is because it is necessary to wait until a person leaves the field of view to determine the best shot. The time until leaving depends on the scene used, but since it cannot be generally determined within a few seconds and the buffer capacity is also finite, processing when the maximum stay time specified by the buffer capacity is exceeded is required. Become. In this embodiment, when the maximum stay time is exceeded, the best shot up to that time is output as a confirmed best shot, and the best shot determination is restarted from the next frame. In the present embodiment, the LLLL subband shown in FIG. 2B is stored in the
選択部107は、ベストショット判定部103の出力に応じて高域用バッファ105又は低域用バッファ106からデータを読み出す。すなわち、ベストショットと判定されたフレームに対しては高域用バッファ105と低域用バッファ106の両方からデータを読み出し、ベストショットではないと判定されたフレームに対しては、低域用バッファ106からのみデータを読み出す。本実施の形態では、ベストショット判定部103でベストショットと判定されたフレームに対して全てのサブバンド(LLLL〜HH)を出力し、ベストショットではないと判定されたフレームに対して低域側の一部(LLLL)のサブバンドを選択して出力する。
The
ベストショット判定部103は、現時点までにバッファに保存されているNフレームのうち、何番目のフレームをベストショットとして確定したかを出力する。例えば、高域用バッファ105と低域用バッファ106に30フレームが保存された状態で22フレーム目をベストショットと判定した場合には「21」という数値を出力する。この出力を受けた選択部107は次のように動作する。即ち、1フレームから21フレームはベストショットでないので、低域用バッファ106に保存された1フレームから21フレーム夫々のサブバンドを読み出して低域圧縮部109に入力する。また、高域用バッファ105に保存されている1フレームから21フレーム夫々のデータは廃棄する。
The best
そして、次の22フレームはベストショットであるので、低域用バッファ106と高域用バッファ105の両方から22フレームのサブバンドを読み出して高域圧縮部108と低域圧縮部109に入力する。この場合、低域用バッファ106に保存されているLLLLサブバンドを低域圧縮部109に入力し、高域用バッファ105に保存されているLLHL、LLLH、LLHH、HL、LH、HHの各サブバンドを高域圧縮部108に入力する。
Since the next 22 frames are the best shots, 22 frames of subbands are read from both the low-
また、23フレームから30フレームまでは、1フレームから21フレームと同様にベストショットではないので、同様に低域側バッファ106に保存されている23フレームから30フレーム夫々のサブバンドを読み出して低域圧縮部109に入力する。
Also, since the 23 to 30 frames are not the best shot as the 1 to 21 frames, the sub-bands from the 23 frames to the 30 frames stored in the
高域圧縮部108は、選択部107から入力された各サブバンドを圧縮する。高域圧縮部108は、結果的にベストショットと判定されたフレームについてのみ動作することになり、高域側の6つのサブバンドについて圧縮を行う。そして、圧縮を行った高域側の6つのサブバンドをサブバンド多重部110に入力する。低域圧縮部109は、結果的に全てのフレームについて動作することになり、低域側の縮小画像について圧縮を行う。そして、圧縮を行った低域側の縮小画像をサブバンド多重部110に入力する。圧縮の手法は様々であり、本発明では特に規定するものではないが、本実施の形態では符号の出現頻度に応じて符号長を決定するハフマン符号化による圧縮を想定している。
The high
サブバンド多重部110は、高域圧縮部108又は低域圧縮部109から入力されたデータに対してヘッダなどの付加情報を付与して記録制御部111に入力する。ベストショットと判定されたフレームについては7つのサブバンド全てについて、またそれ以外のフレームについては低域側の縮小画像のみを処理対象とする。記録制御部111は、サブバンド多重部110から入力されたデータをストレージ112に記録する。特に、ストレージの種類を特定するものではないが、本例ではハードディスクドライブを想定している。
The
次に、図3を用いて上記構成の映像記録装置の動作について説明する。図3では、カメラ視野内の人の頭部を円で表現し、説明を容易にするためにベストショット判定基準として顔のサイズだけを使用して説明する。また、説明を容易にするために水平1段、垂直1段のケース(例えば図2の(a)のケース)を用いる。 Next, the operation of the video recording apparatus having the above configuration will be described with reference to FIG. In FIG. 3, the human head in the camera field of view is represented by a circle, and for ease of explanation, only the face size is used as the best shot criterion. For ease of explanation, a case of one horizontal stage and one vertical stage (for example, the case shown in FIG. 2A) is used.
0フレームの入力時、まだ人物は視野内に登場していない。人物がいないので、ベストショット判定部103は「−1(人物なし)」を出力する。これにより、第0フレームは低域のLLサブバンドのみが圧縮されてストレージ112に記録される。
At the time of 0 frame input, the person has not yet appeared in the field of view. Since there is no person, the best
第1フレームの入力時、左下に人物が登場する。第1フレームはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。この場合、以前のデータが存在しないので、第1フレームの基準を仮ベストショットとする。ベストショット判定部103は「0」を出力する。
When entering the first frame, a person appears in the lower left. The first frame is divided into subbands, the low frequency LL subband is held in the
第2フレームの入力時、人物の顔はより大きくなる。仮ベストショットは第2フレームに更新される。第2フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「1」を出力する。この第2フレームの入力により、第1フレームがベストショットでないことが確定するので、第1フレームのLLサブバンドのみが低域用バッファ106から読み出されて、圧縮処理された後にストレージ112に記録される。第1フレームの高域側データ即ちLH、HL及びHHの各サブバンドは廃棄される。
When inputting the second frame, the face of the person becomes larger. The temporary best shot is updated to the second frame. The data of the second frame is divided into subbands, the low frequency LL subband is held in the
第3フレームの入力時、人物の顔は更に大きくなる。仮ベストショットは第3フレームに更新される。第3フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「2」を出力する。この第3フレームの入力により、第2フレームがベストショットでないことが確定するので、第2フレームのLLサブバンドのみが低域用バッファ106から読み出されて、圧縮処理された後にストレージ112に記録される。第2フレームの高域側データ即ちLH、HL及びHHの各サブバンドは廃棄される。
When inputting the third frame, the face of the person becomes larger. The temporary best shot is updated to the third frame. The data of the third frame is divided into subbands, the low frequency LL subband is held in the
第4フレームの入力時、人物の顔は更に大きくなる。仮ベストショットは第4フレームに更新される。第4フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「3」を出力する。この第4フレームの入力により、第3フレームがベストショットでないことが確定するので、第3フレームのLLサブバンドのみが低域用バッファ106から読み出されて、圧縮処理された後にストレージ112に記録される。第3フレームの高域側データ即ちLH、HL及びHHの各サブバンドは廃棄される。
When inputting the fourth frame, the face of the person becomes even larger. The temporary best shot is updated to the fourth frame. The data of the fourth frame is divided into subbands, the low frequency LL subband is held in the
第5フレームの入力時、人物の顔は更に大きくなるが、顔の一部が画面外に出てしまい、欠落が生じる。したがって、仮ベストショットは第4フレームのままである。第5フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「3」を出力する。
At the time of inputting the fifth frame, the face of the person becomes larger, but part of the face goes out of the screen, resulting in omission. Therefore, the temporary best shot remains the fourth frame. The data of the fifth frame is divided into subbands, the low frequency LL subband is held in the
第6フレームの入力時、人物の顔は小さくなり、欠落も生じたままである。したがって、仮ベストショットは第4フレームのままである。第6フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「3」を出力する。
At the time of inputting the sixth frame, the face of the person becomes smaller and missing is still occurring. Therefore, the temporary best shot remains the fourth frame. The data of the sixth frame is divided into subbands, the low frequency LL subband is held in the
第7フレームの入力時、欠落はなくなるが、人物の顔はより小さくなる。したがって、仮ベストショットは第4フレームのままである。第7フレームのデータはサブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。ベストショット判定部103は「3」を出力する。
At the time of inputting the seventh frame, the omission is eliminated, but the human face becomes smaller. Therefore, the temporary best shot remains the fourth frame. The data of the seventh frame is divided into subbands, the low frequency LL subband is held in the
第8フレームの入力時、人物は画面外に移動する。したがって、ベストショットは第4フレームに確定する。ベストショット判定部103は「−1」を出力する。第8フレームのデータは、サブバンド分割され、低域のLLサブバンドが低域用バッファ106に保持され、高域のLH、HL及びHHの各サブバンドが高域用バッファ105に保持される。
When inputting the eighth frame, the person moves out of the screen. Therefore, the best shot is determined in the fourth frame. The best
第8フレームの入力で最大滞在時間を超えたとして、この時点までのベストショットが確定されたベストショットとして出力される。即ち、第4フレームのデータがベストショットとして、該フレームの全てのサブバンドが圧縮処理されてストレージ112に記録される。
If the maximum stay time is exceeded at the input of the eighth frame, the best shot up to this point is output as the determined best shot. That is, the data of the fourth frame is the best shot, and all the subbands of the frame are compressed and recorded in the
また、第5〜第8フレームのデータは、低域側のサブバンドのみが読み出されて、圧縮された後、ストレージ112に記録される。また、第5〜第8フレームの高域側データは廃棄される。
In addition, the data of the fifth to eighth frames are recorded in the
このように本実施の形態の映像記録装置100によれば、入力された映像信号を受けて動きがある領域のみ抽出した後、抽出した動領域の中から人物の顔が写っている部分のみを抽出して人物の顔が最も良く写っているフレームを検出してベストショットトリガ信号を生成し、入力された映像信号を周波数領域映像信号に周波数変換した後、該周波数領域映像信号を複数のサブバンド映像信号に分割し、ベストショットトリガ信号が生成されたときには、そのときのフレームに対応する全てのサブバンド映像信号を選択し、ベストショットトリガ信号が生成されなかったときには、そのときのフレームに対応する低域側の一部のサブバンド映像信号のみを選択し、選択した各サブバンド映像信号を圧縮してサブバンド圧縮映像信号として、各サブバンド映像信号を多重して圧縮映像信号としてストレージ112に記録するので、人物の顔が最も良く映っている画像のみを高解像度で記録することができる。すなわち、入力された映像信号から高解像度の映像情報を自動的に取得して記録することができる。また、映像の全てを高解像度で記録せず、ベストショットでない映像については低解像度で記録するので、ストレージ112を有効に活用することができる。
As described above, according to the video recording apparatus 100 of the present embodiment, after receiving an input video signal and extracting only a region where there is a motion, only a portion where a person's face is reflected is extracted from the extracted motion region. Extracting and detecting the frame in which the person's face is best captured, generating a best shot trigger signal, frequency-converting the input video signal into a frequency domain video signal, When the best shot trigger signal is generated after being divided into band video signals, all subband video signals corresponding to the frame at that time are selected, and when the best shot trigger signal is not generated, the frame at that time is selected. Select only a part of the corresponding sub-band video signal on the low-frequency side, compress each selected sub-band video signal, Since recording a subband image signal to the
なお、本実施の形態では、人物を記録する監視用として、人物の顔が最も良く写っているフレームを高解像度で記録し、その他のフレームを低解像度で記録するようにしたが、記録する対象は人物に限定されるものではなく任意であり、要は、高解像度で記録したい映像を指定すれば良く、指定した映像は高解像度で記録され、その他は低解像度で記録される。 In this embodiment, for monitoring to record a person, a frame in which the person's face is best captured is recorded at a high resolution, and other frames are recorded at a low resolution. Is not limited to a person but is arbitrary. In short, it is only necessary to designate a video to be recorded at a high resolution, the designated video is recorded at a high resolution, and the others are recorded at a low resolution.
本発明は、入力された映像信号から高解像度の映像情報を自動的に取得して記録するといった効果を有し、入力された映像信号を圧縮してハードディスク等の記録媒体に記録する映像記録装置等として有用である。 The present invention has an effect of automatically acquiring and recording high-resolution video information from an input video signal, and compressing the input video signal and recording it on a recording medium such as a hard disk. Useful as such.
100 映像記録装置
101 動領域抽出部
102 人領域抽出部
103 ベストショット判定部
104 サブバンド分割部
105 高域用バッファ
106 低域用バッファ
107 選択部
108 高域圧縮部
109 低域圧縮部
110 サブバンド多重部
111 記録制御部
112 ストレージ
DESCRIPTION OF SYMBOLS 100
Claims (4)
入力された映像信号を周波数変換して周波数領域映像信号を得る周波数変換手段と、
前記周波数変換手段で得られた周波数領域映像信号を複数のサブバンド映像信号に分割するサブバンド分割手段と、
高解像度記録指定された映像に対しては、前記サブバンド分割手段で得られた複数のサブバンド映像信号の全てを選択し、前記高解像度記録指定されなかった映像に対しては、前記サブバンド分割手段で得られた複数のサブバンド映像信号のうち低域側の一部を選択する選択手段と、
前記選択手段で選択された各サブバンド映像信号を圧縮してサブバンド圧縮映像信号を生成する圧縮手段と、
前記高解像度記録指定された映像に対しては、前記選択手段で選択されて前記圧縮手段で圧縮された全てのサブバンド圧縮映像信号を多重し、前記高解像度記録指定されなかった映像に対しては、前記選択手段で選択されて前記圧縮手段で圧縮された低域側の一部のサブバンド圧縮映像信号を多重する多重化手段と、
前記多重化手段にて多重化されたサブバンド圧縮映像信号を前記記録媒体に記録する記録制御手段と、
を備える映像記録装置。 A video recording apparatus for storing an input video signal in a recording medium,
A frequency converting means for frequency-converting the input video signal to obtain a frequency domain video signal;
Subband dividing means for dividing the frequency domain video signal obtained by the frequency converting means into a plurality of subband video signals;
For the video designated for high resolution recording, all of the plurality of subband video signals obtained by the subband dividing means are selected, and for the video not designated for high resolution recording, the subband is selected. A selecting means for selecting a part on the low frequency side from the plurality of subband video signals obtained by the dividing means;
Compression means for compressing each subband video signal selected by the selection means to generate a subband compressed video signal;
For the video designated for high resolution recording, all the sub-band compressed video signals selected by the selection means and compressed by the compression means are multiplexed, and for the video not designated for high resolution recording. Is a multiplexing means for multiplexing a part of the sub-band compressed video signal on the low frequency side selected by the selection means and compressed by the compression means;
Recording control means for recording the sub-band compressed video signal multiplexed by the multiplexing means on the recording medium;
A video recording apparatus comprising:
入力された映像信号を画像処理して人物が最も良く写っているフレームを検出してベストショットトリガ信号を生成するベストショットトリガ信号生成手段と、
入力された映像信号を周波数変換して周波数領域映像信号を得る周波数変換手段と、
前記周波数変換手段で得られた周波数領域映像信号を複数のサブバンド映像信号に分割するサブバンド分割手段と、
前記ベストショットトリガ信号生成手段にてベストショットトリガ信号が生成されたときには、そのときのフレームに対応する全てのサブバンド映像信号を選択し、前記ベストショットトリガ信号が生成されなかったときには、そのときのフレームに対応する低域側の一部のサブバンド映像信号を選択する選択手段と、
前記選択手段にて選択された各サブバンド映像信号を圧縮してサブバンド圧縮映像信号として出力する圧縮手段と、
前記圧縮手段にて圧縮された各サブバンド映像信号を多重して圧縮映像信号として出力する多重手段と、
前記多重手段からの圧縮映像信号の前記記録媒体への記録を制御する記録制御手段と、
を備える映像記録装置。 A video recording apparatus for storing a video signal input in frame units in a recording medium,
Best shot trigger signal generating means for generating a best shot trigger signal by detecting a frame in which a person is best captured by performing image processing on an input video signal;
A frequency converting means for frequency-converting the input video signal to obtain a frequency domain video signal;
Subband dividing means for dividing the frequency domain video signal obtained by the frequency converting means into a plurality of subband video signals;
When the best shot trigger signal is generated by the best shot trigger signal generation means, all subband video signals corresponding to the frame at that time are selected, and when the best shot trigger signal is not generated, then Selecting means for selecting a part of the subband video signal on the low frequency side corresponding to the frame of
Compression means for compressing each subband video signal selected by the selection means and outputting it as a subband compressed video signal;
Multiplexing means for multiplexing each subband video signal compressed by the compression means and outputting as a compressed video signal;
Recording control means for controlling recording of the compressed video signal from the multiplexing means onto the recording medium;
A video recording apparatus comprising:
入力された映像信号を周波数変換し、これにより得られた周波数領域映像信号を複数のサブバンド映像信号に分割し、
高解像度記録指定された映像に対しては、該映像に対する複数のサブバンド映像信号の全てを圧縮してサブバンド圧縮映像信号を生成し、これにより得られた全てのサブバンド圧縮映像信号を多重して記録媒体に記録し、前記高解像度記録指定されなかった映像に対しては、該映像に対する複数のサブバンド映像信号の低域側の一部を圧縮してサブバンド圧縮映像信号を生成し、これにより得られた一部のサブバンド圧縮映像信号を多重して記録媒体に記録する映像記録方法。 A video recording method for storing an input video signal in a recording medium,
The input video signal is frequency converted, and the resulting frequency domain video signal is divided into a plurality of subband video signals,
For a video designated for high resolution recording, all of the subband video signals for the video are compressed to generate a subband compressed video signal, and all the subband compressed video signals obtained thereby are multiplexed. For a video that is recorded on a recording medium and not designated for high-resolution recording, a part of the low frequency side of the plurality of subband video signals for the video is compressed to generate a subband compressed video signal. A video recording method for multiplexing a part of the subband compressed video signals obtained thereby and recording the multiplexed video signals on a recording medium.
入力された映像信号を受けて動きがある領域のみ抽出した後、抽出した動領域の中から人物が写っている部分を抽出して人物が最も良く写っているフレームを検出してベストショットトリガ信号を生成し、
入力された映像信号を周波数領域映像信号に周波数変換した後、該周波数領域映像信号を複数のサブバンド映像信号に分割し、
前記ベストショットトリガ信号が生成されたときには、そのときのフレームに対応する全てのサブバンド映像信号を選択し、前記ベストショットトリガ信号が生成されなかったときには、そのときのフレームに対応する低域側の一部のサブバンド映像信号を選択し、
選択した各サブバンド映像信号を圧縮してサブバンド圧縮映像信号として、各サブバンド映像信号を多重して圧縮映像信号として前記記録媒体に記録する映像記録方法。 A video recording method for receiving a video signal as input and storing it in a recording medium,
After extracting only the region with motion in response to the input video signal, the best shot trigger signal is detected by extracting the part where the person is reflected from the extracted motion area and detecting the frame where the person is best reflected Produces
After frequency conversion of the input video signal into a frequency domain video signal, the frequency domain video signal is divided into a plurality of subband video signals,
When the best shot trigger signal is generated, all subband video signals corresponding to the current frame are selected. When the best shot trigger signal is not generated, the low frequency side corresponding to the current frame is selected. Select some subband video signals,
A video recording method of compressing each selected subband video signal as a subband compressed video signal and multiplexing each subband video signal and recording it as a compressed video signal on the recording medium.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005071005A JP2006254308A (en) | 2005-03-14 | 2005-03-14 | Video recording apparatus and video recording method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005071005A JP2006254308A (en) | 2005-03-14 | 2005-03-14 | Video recording apparatus and video recording method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006254308A true JP2006254308A (en) | 2006-09-21 |
Family
ID=37094280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005071005A Pending JP2006254308A (en) | 2005-03-14 | 2005-03-14 | Video recording apparatus and video recording method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006254308A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008092174A (en) * | 2006-09-29 | 2008-04-17 | Fujifilm Corp | Imaging apparatus |
JP2008306602A (en) * | 2007-06-08 | 2008-12-18 | Canon Inc | Image display system, and control method thereof |
CN112005272A (en) * | 2018-07-18 | 2020-11-27 | 株式会社日立制作所 | Image analysis device, person search system, and person search method |
-
2005
- 2005-03-14 JP JP2005071005A patent/JP2006254308A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008092174A (en) * | 2006-09-29 | 2008-04-17 | Fujifilm Corp | Imaging apparatus |
JP2008306602A (en) * | 2007-06-08 | 2008-12-18 | Canon Inc | Image display system, and control method thereof |
CN112005272A (en) * | 2018-07-18 | 2020-11-27 | 株式会社日立制作所 | Image analysis device, person search system, and person search method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4687404B2 (en) | Image signal processing apparatus, imaging apparatus, and image signal processing method | |
KR101467875B1 (en) | Digital camera for varying frame rate and the controlling method thereof | |
US8682134B2 (en) | Apparatus and method for processing moving image data | |
US8045815B2 (en) | Image encoding apparatus and image encoding method | |
JP2006253768A (en) | Digital camera | |
US9918062B2 (en) | Image capturing apparatus, control method of image capturing apparatus, and image processing method | |
EP2573758B1 (en) | Method and apparatus for displaying summary video | |
JP4958758B2 (en) | Recording apparatus, reproducing apparatus, recording method, reproducing method, and program | |
JP4075748B2 (en) | Image recording device | |
JP2005109606A (en) | Signal processing method, signal processing apparatus, recording apparatus, and reproducing apparatus | |
KR101909126B1 (en) | Method and apparatus for displaying a summary video | |
JP5655668B2 (en) | Imaging apparatus, image processing method, and program | |
US8538247B2 (en) | Image processing apparatus and image processing method | |
JP2006254308A (en) | Video recording apparatus and video recording method | |
JP2008131572A (en) | Monitoring camera apparatus and photographing method of same | |
US9392169B2 (en) | Image processing apparatus, image processing method, program, and imaging apparatus | |
JP5111317B2 (en) | Digital camera | |
JP2011139306A (en) | Imaging device, and reproduction device | |
JP2007049449A (en) | Image recorder | |
US9955135B2 (en) | Image processing apparatus, image processing method, and program wherein a RAW image to be subjected to special processing is preferentially subjected to development | |
JP2005341382A (en) | Image processing apparatus, imaging apparatus, computer program and image processing method | |
JP2011101161A (en) | Imaging device, control method of the same, reproducing device, and program | |
KR101780444B1 (en) | Method for reducing noise of video signal | |
US20010005451A1 (en) | Image intermittent recording device and its method | |
JPH09233471A (en) | Image information compression-encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070309 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071113 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081015 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090127 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090526 |