JP2009130903A - Image recording apparatus, image recording method and program - Google Patents

Image recording apparatus, image recording method and program Download PDF

Info

Publication number
JP2009130903A
JP2009130903A JP2007307184A JP2007307184A JP2009130903A JP 2009130903 A JP2009130903 A JP 2009130903A JP 2007307184 A JP2007307184 A JP 2007307184A JP 2007307184 A JP2007307184 A JP 2007307184A JP 2009130903 A JP2009130903 A JP 2009130903A
Authority
JP
Japan
Prior art keywords
image data
image
face
metadata
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007307184A
Other languages
Japanese (ja)
Inventor
Tatsuto Tabuchi
達人 田渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007307184A priority Critical patent/JP2009130903A/en
Publication of JP2009130903A publication Critical patent/JP2009130903A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image recording apparatus capable of extracting a face image existent in a photographed moving picture, generating a zoomed-up image of the face, and recording the zoomed-up image of the face into an optical recording medium as a multi-angle image together with a normal image. <P>SOLUTION: The image recording apparatus comprises: a signal processing circuit 9 in which it is detected whether a face image exists in an image relating to image data or not and when the face image is detected, metadata relating to detection timing, coordinates and size of the face image are output together with the image data; and a recording and reproducing circuit 11 in which the image data and metadata are stored on a hard disk 12 under control of a microprocessor 1, the image data and the metadata are read from the hard disk 12 in dubbing, the face image is extracted on the basis of the metadata to produce face image data, and the image data and the face image data are recorded on an optical recording medium via a DVD drive 13. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、画像データを光記録媒体に記録する記録装置等に係り、特にマルチアングル対応の画像記録装置、画像記録方法及びプログラムに関する。   The present invention relates to a recording apparatus or the like that records image data on an optical recording medium, and more particularly, to a multi-angle compatible image recording apparatus, an image recording method, and a program.

従来、デジタルカメラ等の撮像装置では、撮像した画像信号から人物等の顔を検出して、該顔に対して自動的にオートフォーカス制御したり、画質補正したりすることがなされている。ここで、撮像した画像信号から顔を検出する手法としては、サンプリングした顔画像より平均的な顔画像を例えばテンプレートとして定義し、該テンプレートを用いて画像信号とマッチングする等の手法がある。   2. Description of the Related Art Conventionally, in an imaging apparatus such as a digital camera, a face such as a person is detected from a captured image signal, and autofocus control or image quality correction is automatically performed on the face. Here, as a method of detecting a face from a captured image signal, there is a method of defining an average face image as a template, for example, from a sampled face image, and matching the image signal using the template.

そして、例えば特許文献1では、画像に含まれる、顔の画像の数、それぞれの顔の画像についての、顔の位置、顔の大きさ、顔の向きを検出し、画像を順に切り替えて表示する場合、検出された顔の画像に応じた、画像の切り替えの効果を適用した画像の表示を制御する、画像処理装置が開示されている。   For example, in Patent Document 1, the number of face images included in an image, the face position, the face size, and the face orientation of each face image are detected, and the images are sequentially switched and displayed. In this case, an image processing apparatus that controls display of an image to which an image switching effect is applied in accordance with the detected face image is disclosed.

特開2007−79894号公報JP 2007-79894 A

しかしながら、特許文献1に開示されるように、画像から人物の顔を抽出し、画像の検索に用いる方式は、デジタルカメラ等の撮像装置では公知であるものの、撮影した「動画コンテンツ」の中の顔画像を抽出し、該顔のアップ画像だけを切り出して、再生させるような技術は、特許文献1でも開示されておらず、未だに提案されていない。   However, as disclosed in Patent Document 1, a method of extracting a person's face from an image and using it for searching for an image is well known in an imaging apparatus such as a digital camera. A technique for extracting a face image, cutting out only the up image of the face and reproducing it is not disclosed in Patent Document 1, and has not been proposed yet.

一方、複数のカメラで同時撮影したコンテンツを、マルチアングル画像として、1枚の光記録媒体に記録することができる主に業務用途の編集機は存在するものの、一般のユーザが簡単にマルチアングルに対応した光記録媒体を作成する技術は存在しない。   On the other hand, although there are editing machines mainly for business use that can record content shot simultaneously by multiple cameras as a multi-angle image on a single optical recording medium, ordinary users can easily change to multi-angle. There is no technology for producing a corresponding optical recording medium.

そこで、本発明は、撮影した動画の中に存在する顔画像を抽出し、顔のアップ画像を生成し、該顔のアップ画像を通常の画像と共にマルチアングル画像として光記録媒体に記録することを可能とすることを課題とする。   In view of this, the present invention extracts a face image present in a captured video, generates a face-up image, and records the face-up image together with a normal image as a multi-angle image on an optical recording medium. The challenge is to make it possible.

本発明の第1の観点による画像記録装置は、入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを画像データと共に出力する信号処理手段と、上記画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記画像データと上記メタデータを読み出し、該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを光記録媒体に記録する記録再生手段とを備える。   An image recording apparatus according to a first aspect of the present invention detects whether or not a face image exists in an image related to input image data. When the face image is detected, the face image in the image data is detected. Signal processing means for outputting metadata relating to the detection timing, coordinates, and size together with image data, the image data and the metadata are stored in a first storage means, and the first storage is used during dubbing. Means for reading out the image data and the metadata, extracting a face image based on the metadata to generate face image data, and recording / reproducing means for recording the image data and the face image data on an optical recording medium; Prepare.

従って、記録再生手段により、画像データと顔画像データが光記録媒体に顔画像データに基づく顔のアップ画像再生も行い得る状態でマルチアングル記録される。   Therefore, the recording / reproducing means records the image data and the face image data on the optical recording medium in a multi-angle state in a state where the face up image reproduction based on the face image data can be performed.

この第1の観点において、上記信号処理手段は、顔検出手段を備え、該顔検出手段により、所定の時間間隔で画像データに係る画像中の顔画像の存在を検出してもよい。更に上記顔検出手段による顔画像の検出は、人物の顔の特徴を示す部分が画像中にあるか否かを検出し、顔画像が存在する場合には、顔検出数の増減があるか否かを検出し、顔検出の増減があった場合に該増減のデータをメタデータとして記録してもよい。さらに、この第1の観点において、被写体像を撮像し、撮像信号を出力する撮像手段を備え、上記信号処理手段は、該撮像信号をアナログ/デジタル変換し、所定の信号処理を施して画像データを生成するようにしてもよい。   In the first aspect, the signal processing unit may include a face detection unit, and the face detection unit may detect the presence of a face image in the image related to the image data at a predetermined time interval. Furthermore, the detection of the face image by the face detection means detects whether or not there is a part indicating the feature of the person's face in the image, and if there is a face image, whether the number of face detections has increased or decreased. If there is an increase or decrease in face detection, the increase / decrease data may be recorded as metadata. Further, in the first aspect, the image processing apparatus includes an imaging unit that captures a subject image and outputs an imaging signal. The signal processing unit performs analog / digital conversion on the imaging signal, performs predetermined signal processing, and performs image data processing. May be generated.

本発明の第2の観点に係る画像記録装置は、入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力する信号処理手段と、上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録する記録再生手段とを備える。   The image recording apparatus according to the second aspect of the present invention detects whether or not a face image exists in an image related to input image data, and when the face image is detected, the face in the image data is detected. Signal processing means for outputting metadata relating to image detection timing, coordinates, and size together with compressed image data, the compressed image data and the metadata are stored in a first storage means, and at the time of dubbing The compressed image data and the metadata are read from the first storage means, the compressed image data is decompressed, and a face image is extracted from the decompressed image data based on the metadata to obtain face image data And recording / reproducing means for compressing the image data and the face image data and recording the compressed data on an optical recording medium.

従って、記録再生手段により、画像データと顔画像データが光記録媒体に顔画像データに基づく顔のアップ画像再生も行い得る状態で圧縮してマルチアングル記録される。   Accordingly, the image data and the face image data are compressed and multi-angle recorded on the optical recording medium in a state where the face up image reproduction based on the face image data can be performed by the recording / reproducing means.

本発明の第3の観点に係る画像記録方法は、入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力するステップと、上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録するステップとを備える。   The image recording method according to the third aspect of the present invention detects whether or not a face image exists in the image related to the input image data, and when the face image is detected, the face in the image data is detected. A step of outputting metadata relating to the timing, coordinates, and size of image detection together with the compressed image data; storing the compressed image data and the metadata in a first storage means; The compressed image data and the metadata are read from one storage means, the compressed image data is decompressed, and a facial image is extracted from the decompressed image data based on the metadata to generate facial image data And compressing the image data and the face image data and recording them on an optical recording medium.

従って、画像データと顔画像データが光記録媒体に顔画像データに基づく顔のアップ画像再生も行い得る状態でマルチアングル記録される。   Therefore, the image data and the face image data are recorded on the optical recording medium in a multi-angle state in a state where the face up image reproduction based on the face image data can be performed.

本発明の第4の観点に係るプログラムは、コンピュータが、入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力する信号処理手段と、上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録する記録再生手段として機能する。   A program according to a fourth aspect of the present invention detects whether or not a face image exists in an image related to input image data, and when the computer detects the face image, Signal processing means for outputting the metadata relating to the detection timing, coordinates and size of the face image together with the compressed image data, the compressed image data and the metadata are stored in the first storage means, and at the time of dubbing Reads the compressed image data and the metadata from the first storage means, decompresses the compressed image data, extracts a face image from the decompressed image data based on the metadata, and extracts a face image It functions as a recording / reproducing unit that generates data, compresses the image data and face image data, and records the compressed data on an optical recording medium.

従って、プログラムに基づくソフトウェア処理により、画像データと顔画像データが光記録媒体に顔画像データに基づく顔のアップ画像再生も行い得る状態でマルチアングル記録される。   Therefore, by software processing based on the program, the image data and the face image data are recorded on the optical recording medium in a multi-angle state in a state where the face up image reproduction based on the face image data can also be performed.

本発明によれば、撮影した動画の中に存在する顔画像を抽出し、顔のアップ画像を生成し、該顔のアップ画像を通常の画像と共にマルチアングル画像として光記録媒体に記録することができる画像記録装置、画像記録方法及びプログラムを提供することができる。   According to the present invention, it is possible to extract a face image present in a captured moving image, generate a face up image, and record the face up image together with a normal image as a multi-angle image on an optical recording medium. An image recording apparatus, an image recording method, and a program can be provided.

以下、図面を参照して、本発明を実施するための最良の形態(以下、単に実施の形態と称する)について詳細に説明する。   The best mode for carrying out the present invention (hereinafter simply referred to as an embodiment) will be described below in detail with reference to the drawings.

図1には本発明の第1の実施の形態に係る画像記録装置の構成を示し説明する。   FIG. 1 shows and describes the configuration of an image recording apparatus according to a first embodiment of the present invention.

この図1に示される画像記録装置は、顔インデックスサムネイル一覧と選択サムネイルに該当する場面からの再生を実現するハードディスクDVD(Digital Versatile Disc)ビデオカメラレコーダとして適用可能なものである。以下、詳述する。   The image recording apparatus shown in FIG. 1 is applicable as a hard disk DVD (Digital Versatile Disc) video camera recorder that realizes playback from a scene corresponding to a face index thumbnail list and a selected thumbnail. Details will be described below.

図1に示されるように、画像記録装置100は、全体の制御を司る制御手段としてのマイクロプロセッサ1を備えている。バッテリ2、或いはAC電源4からの電源は電源回路3を介してマクロプロセッサ1に供給され、更に電源コントロール部5を介して他回路に供給されるように構成されている。マイクロプロセッサ1には、操作入力手段としてのキー入力回路6が接続されている。撮影光学系7を入射した光の光路上には撮像素子としてCCD(Charge Coupled Device)8が配設されており、このCCD8の出力は、信号処理手段としての信号処理回路9に接続されている。信号処理回路9は、顔検出手段としての顔検出エンジン10を備えている。この信号処理回路9は、記録再生回路11を介して第1の記憶手段としてのハードディスク12、DVDドライブ13に接続されている。そして、この記録再生回路11は、マイクロプロセッサ1と接続されている。   As shown in FIG. 1, the image recording apparatus 100 includes a microprocessor 1 as a control unit that controls the whole. Power from the battery 2 or the AC power supply 4 is supplied to the macro processor 1 through the power supply circuit 3 and further supplied to other circuits through the power supply control unit 5. The microprocessor 1 is connected with a key input circuit 6 as operation input means. A CCD (Charge Coupled Device) 8 is disposed as an image pickup device on the optical path of the light incident on the photographing optical system 7, and the output of the CCD 8 is connected to a signal processing circuit 9 as signal processing means. . The signal processing circuit 9 includes a face detection engine 10 as face detection means. The signal processing circuit 9 is connected to a hard disk 12 and a DVD drive 13 as first storage means via a recording / reproducing circuit 11. The recording / reproducing circuit 11 is connected to the microprocessor 1.

このマイクロプロセッサ1は、オンスクリーンディスプレイ(OSD; On Screen Display)回路14、重畳回路15を介してLCD(Liquid Crystal Display)パネル16に接続されている。この例では、LCDパネル16は、タッチパネルで構成されている。   The microprocessor 1 is connected to an LCD (Liquid Crystal Display) panel 16 via an on-screen display (OSD) circuit 14 and a superimposing circuit 15. In this example, the LCD panel 16 is composed of a touch panel.

尚、この例では、DVDを通常/顔アングルのマルチアングル記録先として例示しているが、より詳細には、例えばブルーレイディスクやHD(High Definition)DVD等を各種の光記録媒体を記録先として採用することが可能であることは勿論である。   In this example, the DVD is exemplified as a normal / face angle multi-angle recording destination, but more specifically, for example, a Blu-ray disc, HD (High Definition) DVD or the like is used as a recording destination for various optical recording media. Of course, it is possible to adopt.

撮影光学系7には、被写体光をCCD8に集光するためのフォーカスレンズ、該フォーカスレンズを駆動してフォーカス合わせやズーミングを行うための駆動機構、開閉操作により被写体光を所定時間だけ撮像素子に入射させるシャッタ機構等を概念上含む。   The photographing optical system 7 includes a focus lens for condensing subject light on the CCD 8, a drive mechanism for driving the focus lens to perform focusing and zooming, and subject light to the image sensor for a predetermined time by opening and closing operations. Conceptually includes an incident shutter mechanism and the like.

このような構成において、マイクロプロセッサ1は、キー入力回路6の外部キー入力電圧をA/D(Analog/Digital)変換し、得られた電圧値からどのキーが押されているか判断し、或いは、タッチパネルであるLCDパネル16からの入力信号をA/D変換し、その値からLCDパネル16に表示されたGUI(Graphical User Interface)上のどのボタンが押されているか判断し、各回路を制御するための制御コマンドを発行する。   In such a configuration, the microprocessor 1 performs A / D (Analog / Digital) conversion on the external key input voltage of the key input circuit 6 and determines which key is pressed from the obtained voltage value, or An input signal from the LCD panel 16 that is a touch panel is A / D converted, and a button on a GUI (Graphical User Interface) displayed on the LCD panel 16 is determined from the value to control each circuit. Issue a control command for

また、マイクロプロセッサ1は、CCD8、信号処理回路9、記録再生回路11を制御し、映像信号のHD/SD(Standard Definition)記録再生の切り替えを行う。   Further, the microprocessor 1 controls the CCD 8, the signal processing circuit 9, and the recording / reproducing circuit 11 to switch between HD / SD (Standard Definition) recording / reproducing of the video signal.

また、マイクロプロセッサ1は、記録再生回路11を制御し、ハードディスク12に記録された管理ファイル及び記録ファイルにアクセスし、記録された映像信号を伸張(デコード)、加工して重畳回路15を介してLCDパネル16上に表示させる。   Further, the microprocessor 1 controls the recording / reproducing circuit 11, accesses the management file and the recording file recorded on the hard disk 12, decompresses (decodes) and processes the recorded video signal, and passes through the superimposing circuit 15. It is displayed on the LCD panel 16.

ここで、「管理ファイル」とは、画像データに対応した顔画像に係るメタデータを管理するファイルであり、メタデータとしては、画像データにおける顔検出のタイミングや座標、大きさ、更には顔の増減のデータが管理される。一方、「記録ファイル」とは、画像データ(通常アングル)を記録するファイルである。   Here, the “management file” is a file for managing metadata related to the face image corresponding to the image data. The metadata includes the face detection timing, coordinates and size in the image data, and also the face Increase / decrease data is managed. On the other hand, the “recording file” is a file for recording image data (normal angle).

上記表示に際しては、OSD回路14は、マイクロプロセッサ1から送られてきたコマンドを解釈し、内蔵の映像RAM上に作成された表示信号を走査単位で重畳回路15へ送る。これを受けて、重畳回路15は、記録用映像信号、または再生された映像信号とOSD回路14からの表示信号を表示してLCDパネル16上に出力する。   At the time of the display, the OSD circuit 14 interprets the command sent from the microprocessor 1 and sends the display signal created on the built-in video RAM to the superimposing circuit 15 in scanning units. In response to this, the superimposing circuit 15 displays the recording video signal or the reproduced video signal and the display signal from the OSD circuit 14 and outputs them on the LCD panel 16.

一方、撮像素子であるCCD8にて撮像され光電変換され得られた映像信号は、信号処理回路9にて所定の信号処理が施された後、画像データとして記録再生回路11によりハードディスク12や第2の記憶手段としてのDVDに記録ファイルとして記録されることになる。この信号処理回路9による所定の信号処理とは、例えば、デジタルの画像信号に変換した後、該画像信号に対して、欠陥画素補正等の前処理を施し、オートホワイトバランス調整、コントラスト調整等の所定の画質補正を行うことになる。更に圧縮画像データに変換するエンコード処理も該信号処理回路9により実施される。   On the other hand, a video signal obtained by being imaged and photoelectrically converted by the CCD 8 which is an image sensor is subjected to predetermined signal processing by the signal processing circuit 9 and then as image data by the recording / reproducing circuit 11 by the recording / reproducing circuit 11. Is recorded as a recording file on a DVD serving as a storage means. The predetermined signal processing by the signal processing circuit 9 is, for example, after converting into a digital image signal, preprocessing such as defective pixel correction is performed on the image signal, and auto white balance adjustment, contrast adjustment, etc. Predetermined image quality correction is performed. Further, the signal processing circuit 9 performs an encoding process for converting into compressed image data.

信号処理回路9は顔検出エンジン10を内蔵し、該顔検出エンジン10により画像データ中の顔を検出して、この検出した顔の画像中の時間的、空間的位置情報を映像管理ファイルに保存する。この顔検出の手法としては、サンプリングした顔画像より平均的な顔画像を例えばテンプレートとして定義し、該テンプレートを用いて画像信号とマッチングする等の手法があるが、これに限定されるものではない。   The signal processing circuit 9 incorporates a face detection engine 10, detects a face in the image data by the face detection engine 10, and stores temporal and spatial position information in the detected face image in a video management file. To do. This face detection method includes a method of defining an average face image as a template, for example, from a sampled face image, and matching the image signal with the template, but is not limited thereto. .

映像信号の記録方式としてはMPEG-4 AVC/H.264(Moving Picture Experts Group-4 Advanced Video Coding/ H.264)圧縮とAVCHD(Advanced Video Codec High Definition )(登録商標)規格を用いた高精細(HD)映像記録とMPEG-2圧縮を用いた標準(SD)信号記録に対応する。   The video signal recording format is high-definition using MPEG-4 AVC / H.264 (Moving Picture Experts Group-4 Advanced Video Coding / H.264) compression and AVCHD (Advanced Video Codec High Definition) (registered trademark) standards. Supports (HD) video recording and standard (SD) signal recording using MPEG-2 compression.

以下、本実施の形態に係る画像記録装置による特徴的な処理を説明する。   Hereinafter, characteristic processing by the image recording apparatus according to the present embodiment will be described.

図2には、DVDへのマルチアングル記録の処理の流れを概念的に示し説明する。   FIG. 2 conceptually shows and describes the flow of multi-angle recording on a DVD.

録画時には、LCDパネル16には、画面200のような「REC」の表示と共にキャプチャされている動画の様子が表示されている。   During recording, the LCD panel 16 displays the state of the captured moving image together with the display of “REC” such as the screen 200.

このキャプチャ時において、画像中に顔が検出された場合には、信号処理回路9は、メタデータを記録再生回路11側に画像データと共に供給することになる。   When a face is detected in the image at the time of capture, the signal processing circuit 9 supplies the metadata along with the image data to the recording / reproducing circuit 11 side.

記録再生回路11は、マイクロプロセッサ1による制御の下、ハードディスク12への通常画像データの記録と同時にメタデータを記録することになる(#1)。   The recording / reproducing circuit 11 records the metadata simultaneously with the recording of the normal image data on the hard disk 12 under the control of the microprocessor 1 (# 1).

次いで、この画像データをDVDドライブ13によりDVDにダビングする際には、エンコード(圧縮)された圧縮画像データをマイクロプロセッサ1によるソフトウェア処理によりデコード(伸張)し、このメタデータを基に、顔を中心とした画像を再生ズーム機能で切り出し(#2)、この顔近辺のみを切り出した画像データを再びエンコード(圧縮)して、通常画像データと一緒にDVDに記録する(#3)。   Next, when this image data is dubbed to a DVD by the DVD drive 13, the encoded (compressed) compressed image data is decoded (expanded) by software processing by the microprocessor 1, and the face is determined based on the metadata. The centered image is cut out by the reproduction zoom function (# 2), and the image data cut out only near the face is encoded (compressed) again and recorded on the DVD together with the normal image data (# 3).

以上により、マルチアングル記録が行われるようになっている(#4)。   Thus, multi-angle recording is performed (# 4).

尚、ダビング動作は、実時間で行う必要はないため、民生用のDVDビデオカメラレコーダの処理能力でも実現可能である。   Since the dubbing operation does not need to be performed in real time, the dubbing operation can be realized with the processing capability of a consumer DVD video camera recorder.

一方、十分な処理能力とバッファメモリの容量があれば、図3に示されるように、通常画像データの記録時に、同時に顔アングル画像データを生成して、マルチアングル記録をすることも可能である。即ち、この場合には、通常アングルの通常画像データを記録再生回路11に含まれる間欠バッファの第1の領域に記憶し(#11)、該通常画像データより顔を中心として画像を切り出し、この顔近辺のみを切り出した顔アングルに係る画像データを間欠バッファの第2の記憶領域に逐次記憶していく(#12)。そして、これらをDVDドライブ13によりDVDにマルチアングル記録する(#13)。   On the other hand, if there is sufficient processing capacity and buffer memory capacity, as shown in FIG. 3, it is possible to simultaneously generate face angle image data and perform multi-angle recording when recording normal image data. . That is, in this case, normal angle normal image data is stored in the first area of the intermittent buffer included in the recording / reproducing circuit 11 (# 11), and an image is cut out from the normal image data with the face at the center. Image data related to the face angle obtained by cutting out only the vicinity of the face is sequentially stored in the second storage area of the intermittent buffer (# 12). These are multi-angle recorded on the DVD by the DVD drive 13 (# 13).

こうしてマルチアングル記録された画像データは、図4に示されるような画面により再生可能となる。即ち、図4(a)は通常アングルに係る表示例を示し、図4(b)は顔アングルに係る表示例を示している。いずれの画面201,202においても、アングルを切り替える釦201a,202aをタッチパネルのGUI上に設けて、ユーザが所望とするタイミングでアングルを切り替えることができるようになっている。顔アングルで表示再生がなされている場合には、図4(b)に示されるように、顔アングルでの表示である旨を示唆するアイコン202bが表示される。   The image data recorded in a multi-angle manner in this way can be reproduced on a screen as shown in FIG. That is, FIG. 4A shows a display example related to the normal angle, and FIG. 4B shows a display example related to the face angle. In any of the screens 201 and 202, buttons 201a and 202a for switching the angle are provided on the GUI of the touch panel so that the angle can be switched at a timing desired by the user. When display reproduction is performed at the face angle, as shown in FIG. 4B, an icon 202b indicating that the display is performed at the face angle is displayed.

以下、図5のフローチャートを参照して、本発明の一実施の形態に係る画像記録装置によるマルチアングル記録に係る一連の処理を更に詳細に説明する。以下の処理の一部又は全部は、一実施の形態に係る画像記録方法に相当する。   Hereinafter, a series of processes related to multi-angle recording by the image recording apparatus according to the embodiment of the present invention will be described in more detail with reference to the flowchart of FIG. Part or all of the following processing corresponds to the image recording method according to the embodiment.

尚、以下の処理は、例えば1GOP(Group of Pictures)単位で実施される。   The following processing is performed in units of 1 GOP (Group of Pictures), for example.

撮影光学系7を介して入射した被写体光はCCD8の受光面にて受光され、光電変換され、映像信号が出力される。この映像信号は、信号処理回路9に入力され、前述したような信号処理が施され、デジタルの画像信号が生成される(ステップS1)。   The subject light incident through the photographing optical system 7 is received by the light receiving surface of the CCD 8, is photoelectrically converted, and a video signal is output. This video signal is input to the signal processing circuit 9 and subjected to the signal processing as described above to generate a digital image signal (step S1).

信号処理回路9の顔検出エンジン10は、この信号処理の過程で、顔を検出しているが、顔が検出されると(ステップS2をYesに分岐)、メタデータを抽出し(ステップS3)、画像信号をエンコードし画像データとして記録再生回路11に出力する(ステップS4)。記録再生回路11は、通常アングルに係る画像データとメタデータを間欠バッファにバッファリングすることになる(ステップS5)。   The face detection engine 10 of the signal processing circuit 9 detects a face in the process of this signal processing. When a face is detected (step S2 branches to Yes), metadata is extracted (step S3). The image signal is encoded and output as image data to the recording / reproducing circuit 11 (step S4). The recording / reproducing circuit 11 buffers the image data and metadata related to the normal angle in the intermittent buffer (step S5).

続いて、上記画像データに係る画像の中に顔が検出されたか否かを判断し、検出された場合には(ステップS6をYesに分岐)、通常アングルの画像データをマイクロプロセッサ1がソフトウェア処理によりデコードすると共に、顔のメタデータを基に、顔近辺のみを切り出した顔アングルの画像信号を生成し(ステップS7)、該顔アングルの画像信号を再びエンコードする(ステップS8)。そして、顔アングルに係る圧縮画像データとして、記録再生回路11の間欠バッファにバッファリングする(ステップS9)。   Subsequently, it is determined whether or not a face is detected in the image related to the image data. If the face is detected (Yes in step S6), the microprocessor 1 processes the normal angle image data by software processing. And a face angle image signal obtained by cutting out only the vicinity of the face based on the face metadata (step S7), and the face angle image signal is encoded again (step S8). Then, the compressed image data relating to the face angle is buffered in the intermittent buffer of the recording / reproducing circuit 11 (step S9).

こうして、記録再生回路11は、間欠バッファにバッファリングされた圧縮後の通常アングルの画像データと顔アングルの画像データをDVDドライブ13に転送し、光記録媒体としてのDVDへの書き込みを行い(ステップS10)、一連の処理を終了することになる。以上の処理によりマルチアングル記録が実現される。   In this way, the recording / reproducing circuit 11 transfers the compressed normal angle image data and the face angle image data buffered in the intermittent buffer to the DVD drive 13 and writes them to the DVD as an optical recording medium (step). S10), a series of processing ends. Multi-angle recording is realized by the above processing.

以上の処理によれば、顔アングルの画像データがマルチアングル記録により併せてDVDにダビング記録されるので、該DVDの再生時において、画像中の人物の顔のアップの再生を適宜選択し、実行することが可能となる。   According to the above processing, the face angle image data is dubbed and recorded on the DVD by multi-angle recording. Therefore, when reproducing the DVD, the reproduction of the human face in the image is appropriately selected and executed. It becomes possible to do.

尚、通常アングルの画像データ中に複数の顔が検出された場合に、複数の顔アングルの画像データをマルチアングル記録により記録することも可能である。   It should be noted that when a plurality of faces are detected in normal angle image data, it is also possible to record a plurality of face angle image data by multi-angle recording.

以下、図6のフローチャートを参照して、このような観点から改良した、改良例のマルチアングル記録に係る一連の処理を詳細に説明する。   Hereinafter, with reference to the flowchart of FIG. 6, a series of processes related to the multi-angle recording of the improved example improved from such a viewpoint will be described in detail.

ステップS11乃至S15の処理は図5のステップS1乃至S5と同様であるので、重複した説明は省略する。ステップS16において、一つ以上の顔が検出されたか否かを判断し、検出された場合には、通常アングルの画像データをマイクロプロセッサ1がソフトウェア処理によりデコードすると共に、顔のメタデータを基に、顔近辺のみを切り出した顔アングルの画像信号を生成し(ステップS17)、該顔アングルの画像信号を再びエンコードする(ステップS18)。そして、顔アングルに係る画像データとして、記録再生回路11の間欠バッファにバッファリングする(ステップS19)。   Since the processing of steps S11 to S15 is the same as that of steps S1 to S5 in FIG. In step S16, it is determined whether or not one or more faces have been detected. If detected, the normal angle image data is decoded by software processing by the microprocessor 1 and based on the face metadata. Then, an image signal of a face angle obtained by cutting out only the vicinity of the face is generated (step S17), and the image signal of the face angle is encoded again (step S18). Then, the image data relating to the face angle is buffered in the intermittent buffer of the recording / reproducing circuit 11 (step S19).

そして、全ての顔の画像データをバッファリングしたか否かを判断し(ステップS20)、全てのバッファリングを終了するまで、上記ステップS17乃至S19の処理を繰り返す。こうして、全てのバッファリングを終了すると、記録再生回路11は、間欠バッファにバッファリングされた圧縮後の通常アングルの画像データと顔アングルの画像データをDVDドライブ13に転送し、DVDへの書き込みを行い(ステップS21)、こうして改良例に係る一連の処理を終了することとなる。   Then, it is determined whether or not all face image data has been buffered (step S20), and the processes of steps S17 to S19 are repeated until all the buffering is completed. Thus, when all buffering is completed, the recording / reproducing circuit 11 transfers the compressed normal angle image data and face angle image data buffered in the intermittent buffer to the DVD drive 13 and writes them to the DVD. This is done (step S21), and thus the series of processes according to the improved example is completed.

以上の処理によれば、例えば、家族旅行などに出かけた際に記念写真を撮影した場合など、画像中に複数の人物の顔が存在する場合においては、各人の顔アングルの画像データをマルチアングル記録により記録することができるので、記録されたDVDの再生時には所望とする人物の顔アングルの画像再生を適宜に行うことが可能となる。   According to the above processing, when there are a plurality of human faces in the image, for example, when a commemorative photo is taken when going out to a family trip or the like, the image data of each person's face angle is converted into multi-image data. Since recording can be performed by angle recording, it is possible to appropriately perform image reproduction of a desired person's face angle during reproduction of the recorded DVD.

以上詳述したように、本発明の一実施の形態によれば、動画像から人物の顔を自動検出し、その結果を管理ファイル上にメタデータとして記録し、そのメタデータを基に人物の顔のアップをマルチアングル画像としてDVDに記録するビデオカメラレコーダ等の画像記録装置を提供することができる。このとき、顔に関する、動画像上の登場時間、座標などの情報は動画像の管理ファイル上にメタデータとして書くとよい。   As described above in detail, according to one embodiment of the present invention, a human face is automatically detected from a moving image, the result is recorded as metadata on a management file, and the person's face is recorded based on the metadata. It is possible to provide an image recording apparatus such as a video camera recorder that records a face-up on a DVD as a multi-angle image. At this time, information such as appearance time and coordinates on the moving image regarding the face may be written as metadata on the moving image management file.

人物の顔のアップ画像作成は、前記動画管理ファイル上の顔検出メタデータ情報を基にして動画像の該当時間付近の画像から該当座標近辺の画像を切り出して随時作成するとよい。この画像記録装置は、例えば顔検出エンジンを備えることで、動画像の撮影時に一定時間間隔で顔の検出を行うことができる。そして、顔画像の検出は、人の顔の特徴を示す部分が画像中にあるかないか、また顔画像が存在する場合には、顔検出数の増減があるかないかを検出し、顔検出の増減があった場合に管理ファイル上に顔検出情報をメタデータとして記録することとしてもよいことは勿論である。   The creation of an up-image of a person's face may be created as needed by cutting out an image near the corresponding coordinates from an image near the corresponding time of the moving image based on the face detection metadata information in the moving image management file. This image recording apparatus includes a face detection engine, for example, so that a face can be detected at regular time intervals when a moving image is captured. The face image is detected by detecting whether there is a portion indicating the characteristics of the human face in the image, and if there is a face image, whether there is an increase or decrease in the number of face detections. Of course, face detection information may be recorded as metadata on the management file when there is an increase or decrease.

従って、本発明の一実施の形態に係る画像記録装置によれば、一台の画像記録装置により、マルチアングル記録のDVDを作成することができる。そして、シーン中に含まれている顔のアップ動画と通常動画を切り替えて再生することができる。   Therefore, according to the image recording apparatus according to the embodiment of the present invention, a multi-angle recording DVD can be created by a single image recording apparatus. Then, it is possible to switch and reproduce the face-up moving image and the normal moving image included in the scene.

以上、本発明の一実施の形態について説明したが、本発明はこれに限定されることなく、その主旨を逸脱しない範囲で種々の改良・変更が可能であることは勿論である。   Although one embodiment of the present invention has been described above, the present invention is not limited to this, and it is needless to say that various improvements and changes can be made without departing from the spirit of the present invention.

例えば、顔検出に加えて、笑顔検出を実施し、該笑顔に係る顔近辺の画像を切り出し顔アングルの画像データとしてマルチアングル記録してもよい。例えば、複数の顔が存在する場合に、その顔の中の笑顔を更に優先するなどの手法が考えられる。   For example, in addition to face detection, smile detection may be performed, and an image near the face related to the smile may be cut out and recorded as multi-angle as face angle image data. For example, when there are a plurality of faces, a method of giving higher priority to smiles in the faces can be considered.

また、最初に顔を特定し、登録しておき、以降、複数の顔が検出された場合でも、この登録された顔に係る顔アングルの画像データのみを優先してマルチアングル記録するようにしてもよい。或いは、通常撮影時に顔が既にアップで撮影されている場合には、顔アングルの画像データと通常アングルの画像データが略同じサイズのものとなる場合も想定されるが、そのような場合には顔アングルの画像データの記録を行わないようにすることで処理負荷を軽減するようにしてもよい。尚、顔アングルでの記録がなされない場合であっても、ブランクを示すデータを不可することで、処理負担の増加を抑制できる。   Also, the face is first identified and registered, and even if a plurality of faces are detected thereafter, only the image data of the face angle related to the registered face is preferentially recorded in multi-angle. Also good. Alternatively, if the face has already been taken up during normal shooting, it may be assumed that the face angle image data and the normal angle image data have substantially the same size. The processing load may be reduced by not recording the face angle image data. Even when the recording is not performed at the face angle, the processing load can be prevented from increasing by disabling the data indicating the blank.

以上のほか、画像中の子供の顔を優先するように制御してもよい。   In addition to the above, control may be performed so that the child's face in the image is given priority.

本発明の第1の実施の形態に係る画像記録装置の構成図。1 is a configuration diagram of an image recording apparatus according to a first embodiment of the present invention. DVDへのマルチアングル記録の処理の流れを概念的に示す図。The figure which shows notionally the flow of the process of the multi-angle recording to DVD. DVDへのマルチアングル記録の他の処理の流れを概念的に示す図。The figure which shows notionally the flow of the other process of the multi-angle recording to DVD. LCDパネルによる再生時の画面表示例を示す図。The figure which shows the example of a screen display at the time of the reproduction | regeneration by an LCD panel. 本発明の一実施の形態に係る画像記録装置によるマルチアングル記録に係る一連の処理を更に詳細に説明するフローチャート。6 is a flowchart for explaining in more detail a series of processes related to multi-angle recording by the image recording apparatus according to the embodiment of the present invention. 本発明の一実施の形態に係る画像記録装置によるマルチアングル記録に係る一連の処理の改良例を更に詳細に説明するフローチャート。6 is a flowchart for explaining in more detail an improvement example of a series of processes related to multi-angle recording by the image recording apparatus according to the embodiment of the present invention.

符号の説明Explanation of symbols

1…マイクロプロセッサ、2…バッテリ、3…電源回路、4…AC電源、5…電源コントロール部、6…キー入力回路、7…撮影光学系、8…CCD、9…信号処理回路、10…顔検出エンジン、11…記録回路、12…ハードディスク、13…DVDドライブ、14…オンスクリーンディスプレイ回路、15…重畳回路、16…LCDタッチパネル、100…画像記録装置   DESCRIPTION OF SYMBOLS 1 ... Microprocessor, 2 ... Battery, 3 ... Power supply circuit, 4 ... AC power supply, 5 ... Power supply control part, 6 ... Key input circuit, 7 ... Imaging optical system, 8 ... CCD, 9 ... Signal processing circuit, 10 ... Face Detection engine, 11 ... recording circuit, 12 ... hard disk, 13 ... DVD drive, 14 ... on-screen display circuit, 15 ... superimposition circuit, 16 ... LCD touch panel, 100 ... image recording device

Claims (7)

入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを画像データと共に出力する信号処理手段と、
上記画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記画像データと上記メタデータを読み出し、該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを光記録媒体に記録する記録再生手段とを備えた
ことを特徴とする画像記録装置。
When detecting whether a face image exists in the image related to the input image data, and detecting the face image, metadata relating to the detection timing, coordinates, and size of the face image in the image data Signal processing means for outputting together with image data;
The image data and the metadata are stored in a first storage means. During dubbing, the image data and the metadata are read from the first storage means, and a face image is extracted based on the metadata. An image recording apparatus comprising: face image data, and recording / reproducing means for recording the image data and the face image data on an optical recording medium.
上記信号処理手段は、顔検出手段を備え、該顔検出手段により、所定の時間間隔で画像データに係る画像中の顔画像の存在を検出する
ことを特徴とする請求項1に記載の画像記録装置。
2. The image recording according to claim 1, wherein the signal processing means includes face detection means, and the face detection means detects the presence of a face image in the image related to the image data at a predetermined time interval. apparatus.
上記顔検出手段による顔画像の検出では、人物の顔の特徴を示す部分が画像中にあるか否かを検出し、顔画像が存在する場合には、顔検出数の増減があるか否かを検出し、顔検出の増減があった場合に該増減のデータもメタデータとして記録する
ことを特徴とする請求項2に記載の画像記録装置。
In the detection of the face image by the face detection means, it is detected whether or not there is a part indicating the feature of the person's face in the image, and if there is a face image, whether or not the number of face detection is increased or decreased. The image recording apparatus according to claim 2, wherein when the face detection is detected, the increase / decrease data is also recorded as metadata.
被写体像を撮像し、撮像信号を出力する撮像手段を備え、
上記信号処理手段は、該撮像信号をアナログ/デジタル変換し、所定の信号処理を施して画像データを生成する
ことを特徴とする請求項1に記載の画像記録装置。
An imaging unit that captures a subject image and outputs an imaging signal is provided.
The image recording apparatus according to claim 1, wherein the signal processing unit performs analog / digital conversion on the imaging signal and performs predetermined signal processing to generate image data.
入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力する信号処理手段と、
上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録する記録再生手段とを備えた
ことを特徴とする画像記録装置。
When detecting whether a face image exists in the image related to the input image data, and detecting the face image, metadata relating to the detection timing, coordinates, and size of the face image in the image data Signal processing means for outputting together with compressed image data;
The compressed image data and the metadata are stored in the first storage means, and when dubbing, the compressed image data and the metadata are read from the first storage means, and the compressed image data is decompressed. And a recording / reproducing unit that extracts face images from the expanded image data based on the metadata to generate face image data, compresses the image data and the face image data, and records the compressed image data on an optical recording medium. An image recording apparatus characterized by that.
入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力するステップと、
上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録するステップとを備えた
ことを特徴とする画像記録方法。
When detecting whether a face image exists in the image related to the input image data, and detecting the face image, metadata relating to the detection timing, coordinates, and size of the face image in the image data Outputting with compressed image data;
The compressed image data and the metadata are stored in the first storage means, and when dubbing, the compressed image data and the metadata are read from the first storage means, and the compressed image data is decompressed. A step of extracting a face image from the decompressed image data based on the metadata to generate face image data, compressing the image data and the face image data, and recording the compressed image data on an optical recording medium. An image recording method characterized by the above.
コンピュータが、
入力された画像データに係る画像の中に顔画像が存在するか否かを検出し、該顔画像を検出したときには、該画像データにおける顔画像の検出のタイミング、座標、大きさに係るメタデータを圧縮した画像データと共に出力する信号処理手段と、
上記圧縮した画像データと上記メタデータを第1の記憶手段に記憶し、ダビング時においては該第1の記憶手段より上記圧縮した画像データと上記メタデータを読み出し、該圧縮した画像データを伸張し、該伸張後の画像データより該メタデータに基づいて顔画像を抽出して顔画像データを生成し、上記画像データと顔画像データを圧縮して光記録媒体に記録する記録再生手段として機能する
ことを特徴とするプログラム。
Computer
When detecting whether a face image exists in the image related to the input image data, and detecting the face image, metadata relating to the detection timing, coordinates, and size of the face image in the image data Signal processing means for outputting together with compressed image data;
The compressed image data and the metadata are stored in the first storage means, and when dubbing, the compressed image data and the metadata are read from the first storage means, and the compressed image data is decompressed. The image data is extracted from the expanded image data based on the metadata to generate face image data, and the image data and the face image data are compressed and recorded on an optical recording medium. A program characterized by that.
JP2007307184A 2007-11-28 2007-11-28 Image recording apparatus, image recording method and program Pending JP2009130903A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007307184A JP2009130903A (en) 2007-11-28 2007-11-28 Image recording apparatus, image recording method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007307184A JP2009130903A (en) 2007-11-28 2007-11-28 Image recording apparatus, image recording method and program

Publications (1)

Publication Number Publication Date
JP2009130903A true JP2009130903A (en) 2009-06-11

Family

ID=40821326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007307184A Pending JP2009130903A (en) 2007-11-28 2007-11-28 Image recording apparatus, image recording method and program

Country Status (1)

Country Link
JP (1) JP2009130903A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520424A (en) * 2011-05-18 2014-08-21 インテレクチュアル ベンチャーズ ファンド 83 エルエルシー Video summary including a given person

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520424A (en) * 2011-05-18 2014-08-21 インテレクチュアル ベンチャーズ ファンド 83 エルエルシー Video summary including a given person

Similar Documents

Publication Publication Date Title
JP3632703B2 (en) Video recording apparatus and video recording method
JP4998026B2 (en) Image processing apparatus, imaging apparatus, image display control method, and computer program
JP4424396B2 (en) Data processing apparatus and method, data processing program, and recording medium on which data processing program is recorded
KR101258723B1 (en) Video reproducing device, video recorder, video reproducing method, video recording method, and semiconductor integrated circuit
EP2573758B1 (en) Method and apparatus for displaying summary video
KR20080084751A (en) Information processing apparatus, imaging apparatus, image display control method and computer program
KR101989152B1 (en) Apparatus and method for capturing still image during moving image photographing or reproducing
JP4898284B2 (en) camera
JP2008252454A (en) Camera and gui switching method in camera
CN105144700A (en) Image processing apparatus and image processing method
JP2006303961A (en) Imaging apparatus
CN105052126A (en) Imaging apparatus and imaging apparatus control method
KR101909126B1 (en) Method and apparatus for displaying a summary video
JP2007266659A (en) Imaging reproducing apparatus
JP2009225361A (en) Recording device and recording method, and editing device and editing method
US20090153704A1 (en) Recording and reproduction apparatus and methods, and a storage medium having recorded thereon computer program to perform the methods
JP2006261953A (en) Recording and reproducing device, its controlling method, and imaging apparatus
US8538247B2 (en) Image processing apparatus and image processing method
JP5332369B2 (en) Image processing apparatus, image processing method, and computer program
US20110019024A1 (en) Apparatus for recording and reproducing video images
JP5164610B2 (en) Imaging apparatus and control method thereof
JP2009290318A (en) Image capturing apparatus and zooming adjustment method
JP5118465B2 (en) Recording apparatus, reproducing apparatus, recording method, reproducing method, and program
JP2012034128A (en) Image processing apparatus and imaging apparatus using the same
JP4027122B2 (en) Imaging apparatus and control method thereof