JP2011234180A - Imaging apparatus, reproducing device, and reproduction program - Google Patents

Imaging apparatus, reproducing device, and reproduction program Download PDF

Info

Publication number
JP2011234180A
JP2011234180A JP2010103308A JP2010103308A JP2011234180A JP 2011234180 A JP2011234180 A JP 2011234180A JP 2010103308 A JP2010103308 A JP 2010103308A JP 2010103308 A JP2010103308 A JP 2010103308A JP 2011234180 A JP2011234180 A JP 2011234180A
Authority
JP
Japan
Prior art keywords
change point
moving image
face
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010103308A
Other languages
Japanese (ja)
Inventor
Koji Ishii
亨治 石井
Yoshinori Okazaki
芳紀 岡崎
Keiichi Miyazaki
桂一 宮崎
Satoshi Seto
聡 瀬戸
Tsutomu Mukai
務 向井
Yasutoshi Yamamoto
靖利 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2010103308A priority Critical patent/JP2011234180A/en
Publication of JP2011234180A publication Critical patent/JP2011234180A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an imaging apparatus, reproducing device and reproduction program capable of extracting and displaying a scene in which a significant change occurs in information on the face of a person or the like in a motion picture.SOLUTION: An imaging apparatus includes: an imaging means 201 for producing motion picture data comprised of a plurality of frames; a display means 204 for displaying an image based on the frames; a face detecting means 207 for detecting a point of change about the face of a person included in the motion picture data; a recording means 212 for recording information on a frame corresponding to the point of change; an instruction means 211 for instructing reproduction of the motion picture data; and a control means 202 which causes the display means to display thereon an image based on the frame corresponding to the point of change, among the plurality of frames constituting the motion picture data, based on the information on the frame corresponding to the point of change recorded by the recording means 212 when the reproduction of the motion picture data is instructed by the instruction means 211.

Description

本発明は、動画のフレーム画像に人物などの顔が含まれているかどうかを検出する顔検出機能を備えた撮像装置、再生装置、および再生プログラムに関するものである。   The present invention relates to an imaging device, a playback device, and a playback program having a face detection function for detecting whether a face such as a person is included in a frame image of a moving image.

特許文献1には、記録媒体に記録されている動画像のコンテンツをスライドショー的に再生することにより、動画像のコンテンツの新しい楽しみかたをユーザに提供し、ユーザを満足させられる再生装置が記載されている。   Patent Document 1 describes a playback apparatus that provides a user with a new way of enjoying moving image content by satisfying the user by playing the moving image content recorded on the recording medium in a slide show. Has been.

特許文献1に記載の再生装置は、第2の画像再生手段が出力するフレームの画像を切り換える時間間隔を条件に、静止画像出力手段が出力するフレームの画像を抽出するので、音声再生手段が出力している音声にあった、フレームの画像を抽出し、出力することができる。   The playback device described in Patent Document 1 extracts the frame image output by the still image output means on the condition of the time interval for switching the frame image output by the second image playback means. It is possible to extract and output a frame image corresponding to the voice being played.

また、特許文献1に記載の再生装置は、第2の画像再生手段が出力するフレームの画像を、前後のフレームとは独立していて、単独で記録されている基本フレームの画像、例えばMPEG2におけるI−Picture、としたので、そのフレームにかかる画像データのみ処理するだけでよい。したがって、装置本体にかかる負荷が抑えられるとともに、静止画像として出力するフレームの画像の画質を適正に保つことができる。   In addition, the playback device described in Patent Document 1 uses a frame image output by the second image playback means as an independent basic frame image that is independent of the previous and subsequent frames, for example in MPEG2. Since I-Picture is used, only the image data relating to the frame need be processed. Therefore, the load on the apparatus main body can be suppressed, and the image quality of the frame image output as a still image can be maintained appropriately.

特開2007−6348号公報JP 2007-6348 A

しかしながら、特許文献1に記載の再生装置は、第2の画像再生手段が出力するフレームの画像を切り換える時間間隔を条件に、静止画像出力手段が出力するフレームの画像を抽出するか、第2の画像再生手段が出力するフレームの画像を、前後のフレームとは独立していて、単独で記録されている基本フレームの画像としたので、動画内の人物などの顔に関する情報に有意な変化が生じたシーンを抽出して表示することはできない。   However, the playback device described in Patent Document 1 extracts the frame image output by the still image output unit, on the condition of the time interval for switching the frame image output by the second image playback unit, or the second image playback unit. Since the image of the frame output by the image playback means is an independent basic frame image that is independent of the previous and subsequent frames, a significant change occurs in information about the face of a person in the video. The extracted scene cannot be extracted and displayed.

第2の画像再生手段が出力するフレームの画像を切り換える時間間隔や前後のフレームとは独立していて、単独で記録されている基本フレームは、動画内の人物などの顔に関する情報とは無関係に決定されるからである。   The time interval for switching the image of the frame output by the second image reproduction means and the preceding and following frames are independent, and the basic frame recorded independently is independent of the information about the face such as a person in the moving image. It is because it is decided.

本発明は、前記課題を解決し、動画内の人物などの顔に関する情報に有意な変化が生じたシーンを抽出して表示することができる撮像装置、再生装置、および再生プログラムを提供することを目的とする。   The present invention provides an imaging device, a playback device, and a playback program capable of solving the above-described problems and extracting and displaying a scene in which information relating to a face such as a person in a moving image has a significant change. Objective.

前記課題を解決するために、本発明の撮像装置は、複数のフレームから構成される動画データを生成する撮像手段と、前記フレームに基づく画像を表示する表示手段と、前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、前記変化点に対応するフレームに関する情報を記録する記録手段と、前記動画データのスライドショー再生を指示する指示手段と、前記指示手段によって前記動画データのスライドショー再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、を備える、ことを特徴とする。   In order to solve the above problem, an imaging apparatus according to the present invention includes an imaging unit that generates moving image data including a plurality of frames, a display unit that displays an image based on the frames, and a human included in the moving image data. Face detecting means for detecting a change point related to the face of the user, a recording means for recording information relating to a frame corresponding to the change point, an instruction means for instructing a slide show reproduction of the moving image data, and the instruction means An image based on a frame corresponding to the change point among a plurality of frames constituting the moving image data based on information related to the frame corresponding to the change point recorded in the recording unit when a slide show reproduction is instructed And control means for displaying on the display means.

また、本発明の再生装置は、複数のフレームから構成される動画データを再生する再生手段と、前記フレームに基づく画像を表示する表示手段と、前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、前記変化点に対応するフレームに関する情報を記録する記録手段と、前記動画データのスライドショー再生を指示する指示手段と、前記指示手段によって前記動画データのスライドショー再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、を備える、ことを特徴とする。   In addition, the playback device of the present invention includes a playback unit that plays back moving image data including a plurality of frames, a display unit that displays an image based on the frame, and a change point related to a human face included in the moving image data. Face detecting means for detecting, recording means for recording information relating to a frame corresponding to the change point, instruction means for instructing slide show reproduction of the moving image data, and instruction for instructing reproduction of the moving image data by the instruction means Sometimes, based on the information about the frame corresponding to the change point recorded in the recording means, an image based on the frame corresponding to the change point among a plurality of frames constituting the moving image data is displayed on the display means. And a control means for making it possible.

また、本発明の再生プログラムは、電子計算機を、複数のフレームから構成される動画データを再生する再生手段と、前記フレームに基づく画像を表示する表示手段と、前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、前記変化点に対応するフレームに関する情報を記録する記録手段と、前記動画データのスライドショー再生を指示する指示手段と、前記指示手段によって前記動画データのスライドショー再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、して動作させる、ことを特徴とする。   In addition, the reproduction program of the present invention is a computer program that reproduces moving image data composed of a plurality of frames, a display unit that displays an image based on the frames, and a human face included in the moving image data. A face detecting means for detecting a change point relating to the image, a recording means for recording information relating to a frame corresponding to the change point, an instruction means for instructing a slide show reproduction of the moving picture data, and a slide show reproduction of the moving picture data by the instruction means. On the basis of the information about the frame corresponding to the change point recorded in the recording means, the image based on the frame corresponding to the change point among the plurality of frames constituting the moving image data is displayed. It is characterized by operating as control means for displaying on the display means.

以上のように、本発明によれば、記録手段に記録された人間の顔に関する変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させるので、動画内の人物などの顔に関する情報に有意な変化が生じたシーンを抽出して表示することができるという効果を奏する。   As described above, according to the present invention, based on the information related to the frame corresponding to the change point related to the human face recorded in the recording means, the change point corresponding to the change point among the plurality of frames constituting the moving image data. Since an image based on a frame is displayed on the display means, it is possible to extract and display a scene in which a significant change has occurred in information related to a face such as a person in a moving image.

本発明の実施の形態に係るデジタルカメラ100の外観図1 is an external view of a digital camera 100 according to an embodiment of the present invention. 本発明の実施の形態に係るデジタルカメラ100のブロック図1 is a block diagram of a digital camera 100 according to an embodiment of the present invention. 記憶媒体212内のフォルダ構成を示す図The figure which shows the folder structure in the storage medium 212 動画ファイルとフレーム位置情報の対応の一例を示す図The figure which shows an example of a response | compatibility of a moving image file and frame position information フレーム位置情報として記録されるデータの一例を示す図The figure which shows an example of the data recorded as frame position information 本発明の実施の形態に係るデジタルカメラ100の動画撮影動作を示すフローチャートThe flowchart which shows the video recording operation | movement of the digital camera 100 which concerns on embodiment of this invention. 表情変化検出機能を備えたデジタルカメラ100の動画撮影動作を示すフローチャートA flowchart showing a moving image shooting operation of the digital camera 100 having a facial expression change detection function. 被写体識別機能を備えたデジタルカメラ100の動画撮影動作を示すフローチャートA flowchart showing a moving image shooting operation of the digital camera 100 having a subject identification function. 表情変化検出機能と被写体識別機能を備えたデジタルカメラ100の動画撮影動作を示すフローチャートA flowchart showing a moving image shooting operation of the digital camera 100 having a facial expression change detection function and a subject identification function. 本発明の実施の形態に係るデジタルカメラ100のスライドショー再生動作を示すフローチャートThe flowchart which shows the slide show reproduction | regeneration operation | movement of the digital camera 100 which concerns on embodiment of this invention. 本発明の実施の形態に係るデジタルカメラ100のファイル構成の一例を示す図The figure which shows an example of the file structure of the digital camera 100 which concerns on embodiment of this invention. フレーム位置情報を利用したスライドショー再生で表示される代表画像を示す図The figure which shows the representative image displayed by the slide show reproduction | regeneration using frame position information フレーム位置情報を利用したマルチサムネイル再生で表示される代表画像を示す図The figure which shows the representative image displayed by the multi thumbnail reproduction using the frame position information

(実施の形態)
(1.外観)
以下、本発明の実施の形態に係るデジタルカメラについて、図面を参照しながら説明する。
(Embodiment)
(1. Appearance)
Hereinafter, a digital camera according to an embodiment of the present invention will be described with reference to the drawings.

図1は、本発明の実施の形態に係るデジタルカメラ100の外観図である。図1(a)は、正面図であり、図1(b)は、背面図である。本発明の実施の形態に係るデジタルカメラ100は、AVCHD規格によって規定された動画とDCF(Design rule for Camera File system)規格によって規定された静止画を記録できる。   FIG. 1 is an external view of a digital camera 100 according to an embodiment of the present invention. FIG. 1A is a front view, and FIG. 1B is a rear view. The digital camera 100 according to the embodiment of the present invention can record a moving image defined by the AVCHD standard and a still image defined by the DCF (Design rule for Camera File system) standard.

デジタルカメラ100の正面には、撮像光学系101とフラッシュ102が配されている。撮像光学系101は、被写体像をデジタルカメラ100内の撮像素子に結像させる。フラッシュ102は、静止画撮影モードにおいて、暗所での撮影の場合に、閃光を発して撮影光量の不足を補う。   An imaging optical system 101 and a flash 102 are arranged in front of the digital camera 100. The imaging optical system 101 forms a subject image on an imaging element in the digital camera 100. In the still image shooting mode, the flash 102 emits a flash to compensate for the shortage of the shooting light amount when shooting in a dark place.

デジタルカメラ100の上面には、シャッターボタン103が配されている。静止画撮影モードにおいて、シャッターボタン103を押下すると、撮像素子に結像した光学像に基づく電気信号が静止画ファイルとしてメモリカードなどの記録媒体に記録される。   A shutter button 103 is disposed on the upper surface of the digital camera 100. When the shutter button 103 is pressed in the still image shooting mode, an electrical signal based on the optical image formed on the image sensor is recorded as a still image file on a recording medium such as a memory card.

また、動画撮影モードにおいて、シャッターボタン103を押下すると、撮像素子に結像した光学像に基づく電気信号が、順次、動画ファイルとして記録媒体に記録される。再度、シャッターボタン103を押下すると、動画ファイルの記録が終了する。同時に、記録媒体に管理ファイルが存在しない場合は、管理ファイルが記録媒体に新たに作成され、記録媒体に管理ファイルが既に存在する場合は、管理ファイルが更新される。管理ファイルには、撮影時間や動画ファイルのプロファイル情報などが記載される。   Further, when the shutter button 103 is pressed in the moving image shooting mode, an electrical signal based on the optical image formed on the image sensor is sequentially recorded on the recording medium as a moving image file. When the shutter button 103 is pressed again, the recording of the moving image file ends. At the same time, if the management file does not exist on the recording medium, a management file is newly created on the recording medium. If the management file already exists on the recording medium, the management file is updated. In the management file, the shooting time, the profile information of the moving image file, and the like are described.

デジタルカメラ100の下面には、記録媒体を装着するスロット108が配されている。デジタルカメラ100を用いて静止画および動画を撮影した場合、静止画ファイルと動画ファイルは、記録媒体内の異なるフォルダに格納される。また、再生モードにおいては、記録媒体に記録された静止画ファイルに基づく静止画や動画ファイルに基づく動画を液晶モニター104に表示する。   A slot 108 for mounting a recording medium is disposed on the lower surface of the digital camera 100. When a still image and a moving image are taken using the digital camera 100, the still image file and the moving image file are stored in different folders in the recording medium. In the reproduction mode, a still image based on the still image file recorded on the recording medium and a moving image based on the moving image file are displayed on the liquid crystal monitor 104.

デジタルカメラ100の背面には、液晶モニター104、モードダイヤル105、各種操作ボタン106が配されている。液晶モニター104には、静止画撮影モードまたは動画撮影モードのとき、撮像素子に結像した光学像に基づく画像が、順次、表示される。したがって、液晶モニター104に表示された画像を確認しながら撮影のための構図を決定することができる。また、液晶モニター104は、再生モードのとき、記録媒体に記録された静止画ファイルに基づく静止画や動画ファイルに基づく動画を表示することができる。   A liquid crystal monitor 104, a mode dial 105, and various operation buttons 106 are arranged on the back of the digital camera 100. The liquid crystal monitor 104 sequentially displays images based on the optical image formed on the image sensor in the still image shooting mode or the moving image shooting mode. Therefore, it is possible to determine the composition for shooting while confirming the image displayed on the liquid crystal monitor 104. Further, the liquid crystal monitor 104 can display a still image based on the still image file recorded on the recording medium or a moving image based on the moving image file in the playback mode.

モードダイヤル105は、静止画撮影モード、動画撮影モードおよび再生モードを切り替えるためのダイヤル式のスイッチである。モードダイヤル105を操作することによって、デジタルカメラ100の動作モードを決定することができる。デジタルカメラ100の動作モードには、静止画撮影モード、動画撮影モードおよび再生モードがある。   The mode dial 105 is a dial switch for switching between a still image shooting mode, a moving image shooting mode, and a playback mode. By operating the mode dial 105, the operation mode of the digital camera 100 can be determined. The operation modes of the digital camera 100 include a still image shooting mode, a moving image shooting mode, and a playback mode.

静止画撮影モードは、シャッターボタン103を押下することにより、撮像素子に結像した光学像に基づく電気信号を静止画ファイルとして記録媒体に記録する動作モードである。静止画撮影モードは、さらに全自動撮影モード、プログラム撮影モード、シャッター速度優先撮影モード、絞り優先撮影モード、シーン別撮影モードに細分される。   The still image shooting mode is an operation mode in which an electric signal based on an optical image formed on an image sensor is recorded on a recording medium as a still image file when the shutter button 103 is pressed. The still image shooting mode is further subdivided into a fully automatic shooting mode, a program shooting mode, a shutter speed priority shooting mode, an aperture priority shooting mode, and a scene-specific shooting mode.

動画撮影モードは、シャッターボタン103を押下してから、再度、シャッターボタン103を押下するまでの間、撮像素子に結像した光学像に基づく電気信号を、順次、動画ファイルとして記録媒体に記録する動作モードである。   In the moving image shooting mode, an electric signal based on the optical image formed on the image sensor is sequentially recorded as a moving image file on a recording medium from when the shutter button 103 is pressed until the shutter button 103 is pressed again. It is an operation mode.

再生モードは、記録媒体に記録された静止画ファイルに基づく静止画や動画ファイルに基づく動画を液晶モニター104に表示する動作モードである。また、静止画ファイルのサムネイル画像と動画ファイルの代表画像を示すサムネイル画像を混在させて、撮影日時順に並べて液晶モニター104に表示することができる。液晶モニター104に表示されたサムネイル画像を選択することによって、表示を切り替えることができる。すなわち、静止画ファイルのサムネイル画像が選択された場合は、静止画ファイルに基づく静止画が液晶モニター104に表示され、動画ファイルの代表画像を示すサムネイル画像が選択された場合は、動画ファイルに基づく動画が再生される。また、静止画ファイルと動画ファイルの代表画像を混在させて、撮影日時順に並べて、所定の時間間隔ごとに順番に液晶モニター104に表示する、いわゆるスライドショー再生をすることができる。動画ファイルの代表画像がスライドショー再生された場合は、所望の代表画像が表示されているときに、各種操作ボタン106を操作することで、その代表画像以降の動画ファイルに基づく動画を再生することができる。   The playback mode is an operation mode in which a still image based on a still image file recorded on a recording medium or a moving image based on a moving image file is displayed on the liquid crystal monitor 104. Further, a thumbnail image of a still image file and a thumbnail image indicating a representative image of a moving image file can be mixed and displayed on the liquid crystal monitor 104 in order of shooting date and time. The display can be switched by selecting a thumbnail image displayed on the liquid crystal monitor 104. That is, when a thumbnail image of a still image file is selected, a still image based on the still image file is displayed on the LCD monitor 104, and when a thumbnail image indicating a representative image of a moving image file is selected, the still image file is based on the moving image file. A video is played. Also, it is possible to perform so-called slide show playback in which representative images of still image files and moving image files are mixed, arranged in order of shooting date and time, and sequentially displayed on the liquid crystal monitor 104 at predetermined time intervals. When a representative image of a moving image file is played back as a slide show, it is possible to play a moving image based on the moving image file after the representative image by operating various operation buttons 106 when the desired representative image is displayed. it can.

各種操作ボタン106は、液晶モニター104にメニュー画面を表示するためのメニューボタン106b、メニュー画面における項目を選択するために上下左右にカーソルを移動させる上下左右ボタン106a、メニュー画面においてカーソルが存在する項目の決定を指示する決定ボタン106b(メニューボタンと兼用)、液晶モニター104上のOSD(On Screen Display)表示項目を切り替えるための表示切替ボタン106c、不要な静止画ファイルまたは動画ファイルの削除を指示する削除ボタン106dから構成される。動画ファイルが削除されると、これを受けて管理ファイルが更新される。   Various operation buttons 106 include a menu button 106b for displaying a menu screen on the liquid crystal monitor 104, an up / down / left / right button 106a for moving the cursor up / down / left / right to select an item on the menu screen, and an item on which the cursor exists on the menu screen. A determination button 106b (which also serves as a menu button) for instructing determination, a display switching button 106c for switching an OSD (On Screen Display) display item on the liquid crystal monitor 104, and an instruction to delete an unnecessary still image file or moving image file It consists of a delete button 106d. When the moving image file is deleted, the management file is updated accordingly.

これらのボタンを操作することによって、静止画撮影モード、動画撮影モードおよび再生モードにおけるさらに詳細な設定をすることができる。すなわち、静止画撮影モードにおいては、露出補正、ホワイトバランス調整、フラッシュ102の発光に関する設定、顔検出機能に関する設定などを行うことができる。また、動画撮影モードにおいては、解像度やフレームレートなどを変更することができる。さらに、再生モードにおいては、液晶モニター104に表示された静止画の拡大や縮小、液晶モニター104に同時に表示するサムネイル画像の数の設定、記録媒体に記録された静止画ファイルや動画ファイルの検索などを行うことができる。
(2.構成)
図2は、本発明の実施の形態に係るデジタルカメラ100のブロック図である。
By operating these buttons, more detailed settings can be made in the still image shooting mode, the moving image shooting mode, and the playback mode. That is, in the still image shooting mode, exposure correction, white balance adjustment, settings relating to flash 102 emission, settings relating to the face detection function, and the like can be performed. In the moving image shooting mode, the resolution, the frame rate, and the like can be changed. Furthermore, in the playback mode, enlargement or reduction of the still image displayed on the LCD monitor 104, setting of the number of thumbnail images displayed simultaneously on the LCD monitor 104, searching for still image files and moving image files recorded on the recording medium, etc. It can be performed.
(2. Configuration)
FIG. 2 is a block diagram of the digital camera 100 according to the embodiment of the present invention.

本実施の形態に係るデジタルカメラ100は、記録媒体212に、メモリカードを採用する。   Digital camera 100 according to the present embodiment employs a memory card as recording medium 212.

操作手段211は、シャッターボタン103、各種操作ボタン106、モードダイヤル105から構成され、これらを通じてユーザの指示を制御手段202に出力する。   The operation unit 211 includes a shutter button 103, various operation buttons 106, and a mode dial 105, and outputs user instructions to the control unit 202 through these.

制御手段202は、操作手段211から出力されたユーザの指示にしたがって、撮像手段201、信号処理手段205、表示制御手段203、記録制御手段206を制御し、撮影、記録および再生などの処理を実行する。   The control unit 202 controls the imaging unit 201, the signal processing unit 205, the display control unit 203, and the recording control unit 206 in accordance with a user instruction output from the operation unit 211, and executes processing such as shooting, recording, and reproduction. To do.

表示手段204は、液晶モニター104から構成され、撮像素子に結像した光学像に基づく画像や、記録媒体に記録されている静止画ファイルや動画ファイルの再生画像、撮影や再生に関する設定を行うメニュー画面などを表示する。表示制御手段203は、表示手段204の表示を制御する。   The display means 204 is composed of the liquid crystal monitor 104, and is a menu for setting an image based on an optical image formed on the image sensor, a playback image of a still image file and a moving image file recorded on a recording medium, and shooting and playback settings. Display the screen. The display control unit 203 controls the display of the display unit 204.

撮像手段201は、CCD(Charge Coupled Device)などの撮像素子から構成され、制御手段202の指示にしたがって、光学像を電気信号に変換し、信号処理手段205に出力する。   The imaging unit 201 is configured by an imaging element such as a CCD (Charge Coupled Device), converts an optical image into an electrical signal in accordance with an instruction from the control unit 202, and outputs the electrical signal to the signal processing unit 205.

信号処理手段205は、静止画撮影モードにおいて、撮像手段201から出力された電気信号に対して、JPEG圧縮などの圧縮処理を行い、圧縮された静止画ファイルを記録制御手段206に出力する。   The signal processing unit 205 performs compression processing such as JPEG compression on the electrical signal output from the imaging unit 201 in the still image shooting mode, and outputs the compressed still image file to the recording control unit 206.

また、信号処理手段205は、動画撮影モードにおいて、撮像手段201から、順次、出力される電気信号に対して、MPEG(Moving Picture Experts Group)圧縮などの圧縮処理を行い、圧縮された動画ファイルを記録制御手段206に出力する。   Further, the signal processing unit 205 performs compression processing such as MPEG (Moving Picture Experts Group) compression on the electric signals sequentially output from the imaging unit 201 in the moving image shooting mode, and converts the compressed moving image file into a compressed moving image file. Output to the recording control means 206.

さらに、信号処理手段205は、静止画撮影モードおよび動画撮影モードにおいて、撮像手段201から、順次、出力される電気信号を、YC信号などの表示手段204が表示できる信号に変換し、表示制御手段203に出力する。   Further, the signal processing unit 205 converts the electrical signal sequentially output from the imaging unit 201 into a signal that can be displayed by the display unit 204 such as a YC signal in the still image shooting mode and the moving image shooting mode. It outputs to 203.

加えて、信号処理手段205は、再生モードにおいて、記録制御手段206から出力される記録媒体212内の静止画ファイルを伸張し、表示制御手段203に出力する。また、記録制御手段206から出力される記録媒体212内の動画ファイルを伸張し、表示制御手段203に出力する。   In addition, the signal processing unit 205 decompresses the still image file in the recording medium 212 output from the recording control unit 206 and outputs it to the display control unit 203 in the playback mode. Also, the moving image file in the recording medium 212 output from the recording control unit 206 is decompressed and output to the display control unit 203.

顔検出機能を有効にしている場合、信号処理手段205は、各動作モードにおいて生成した静止画あるいは動画のフレーム画像の信号を、顔検出手段207に出力する。   When the face detection function is enabled, the signal processing unit 205 outputs the still image or moving image frame image signal generated in each operation mode to the face detection unit 207.

顔検出手段207は、信号処理手段205から出力された静止画あるいは動画のフレーム画像に対して、顔情報の検出を行う。ここでいう顔情報の検出とは、パターン識別などのアルゴリズムにより、静止画あるいは動画のフレーム画像の中に人物などの顔画像が含まれているかどうか、顔画像の個数、顔画像の位置、顔画像の大きさ、顔画像の角度といった情報を検出することを指す。顔検出手段207は、これらの情報のうち少なくとも一つを検出することのできる顔検出機能を備える。また、顔検出手段207は、被写体識別機能を備えていてもよい。ここでいう被写体識別機能は、顔検出により得られた顔画像が、デジタルカメラ100自体のもつ図示しない記憶手段や記録媒体212などに記録されているデータベースに登録されている被写体であるかどうかを検出することのできる機能を指す。あるいは、顔検出手段207は、表情変化検出機能を備えていてもよい。ここでいう表情変化検出機能は、顔検出により得られた顔画像から、人物などの表情が変化したかどうかを検出することのできる機能を指す。さらに、被写体識別機能と表情変化検出機能を両方とも備えていてもよい。   The face detection unit 207 detects face information for the still image or moving image frame image output from the signal processing unit 205. The detection of face information here refers to whether a face image such as a person is included in a frame image of a still image or moving image by an algorithm such as pattern identification, the number of face images, the position of the face image, the face This refers to detecting information such as the size of the image and the angle of the face image. The face detection means 207 has a face detection function capable of detecting at least one of these pieces of information. Further, the face detection means 207 may have a subject identification function. The subject identification function here refers to whether a face image obtained by face detection is a subject registered in a database recorded in a storage unit (not shown) or a recording medium 212 of the digital camera 100 itself. Refers to a function that can be detected. Alternatively, the face detection unit 207 may have a facial expression change detection function. The expression change detection function here refers to a function that can detect whether or not an expression of a person has changed from a face image obtained by face detection. Furthermore, both a subject identification function and a facial expression change detection function may be provided.

顔検出手段207の備える機能によって検出された情報は、静止画あるいは動画のフレーム画像に対する顔検出情報として、制御手段202の指示にしたがって、制御手段202および記録制御手段206に出力される。   Information detected by the function of the face detection unit 207 is output to the control unit 202 and the recording control unit 206 in accordance with an instruction from the control unit 202 as face detection information for a frame image of a still image or a moving image.

記録制御手段206は、信号処理手段205から出力された静止画ファイルまたは動画ファイルを記録媒体212に記録する。また、制御手段202の指示にしたがって、信号処理手段205および顔検出手段207から出力された情報を元に、管理ファイルを記録媒体212に記録する。さらに、制御手段202の指示にしたがって、記録媒体212から静止画ファイルまたは動画ファイルを読み出し、信号処理手段205に出力する。加えて、制御手段202の指示にしたがって、記録媒体212内の管理ファイルを読み出し、制御手段202に出力する。
(3.ファイル構成)
(3−1.フォルダ構成)
図3は、記憶媒体212内のフォルダ構成を示す図である。フォルダ名は四角によって囲まれているが、ファイル名は四角によって囲まれていない。ROOTフォルダの下位には、DCIMフォルダとPRIVATEフォルダが作成されている。
The recording control unit 206 records the still image file or the moving image file output from the signal processing unit 205 on the recording medium 212. Further, the management file is recorded on the recording medium 212 based on the information output from the signal processing unit 205 and the face detection unit 207 in accordance with an instruction from the control unit 202. Further, in accordance with an instruction from the control unit 202, a still image file or a moving image file is read from the recording medium 212 and output to the signal processing unit 205. In addition, the management file in the recording medium 212 is read according to an instruction from the control unit 202 and output to the control unit 202.
(3. File structure)
(3-1. Folder structure)
FIG. 3 is a diagram showing a folder structure in the storage medium 212. The folder name is enclosed by a square, but the file name is not enclosed by a square. Below the ROOT folder, a DCIM folder and a PRIVATE folder are created.

DCIMフォルダは、DCF規格によって規定されたフォルダである。DCIMフォルダの下位には、100_PANAフォルダが作成されている。100_PANAフォルダは、DCF規格に基づいて命名されたフォルダであって、静止画ファイルが格納される。P1000001.jpgファイルからP100nnnn.jpgファイルは、DCF規格に基づいて命名された静止画ファイルである(nnnn=0002〜9999)。静止画ファイルに対応する管理ファイルは、存在しない。   The DCIM folder is a folder defined by the DCF standard. A 100_PANA folder is created under the DCIM folder. The 100_PANA folder is a folder named based on the DCF standard, and stores still image files. P1000001. jpg file from P100nnnn. The jpg file is a still image file named based on the DCF standard (nnnn = 0002 to 9999). There is no management file corresponding to the still image file.

PRIVATEフォルダの下位には、AVCHDフォルダが作成されている。AVCHDフォルダの下位には、BDMVフォルダが作成されている。   An AVCHD folder is created under the PRIVATE folder. A BDMV folder is created below the AVCHD folder.

BDMVフォルダの下位には、STREAMフォルダが作成されている。STREAMフォルダには、動画ファイルが格納される。00000.mtsファイルからXXXXX.mtsファイルは、動画ファイルである(XXXXX=00001〜99999)。   A STREAM folder is created below the BDMV folder. A moving image file is stored in the STREAM folder. 00000. From the mts file, XXXXXX. The mts file is a moving image file (XXXX = 00001 to 99999).

BDMVフォルダに格納されるファイルとBDMVフォルダの下位のフォルダに格納されるファイルのうち、STREAMフォルダに格納される動画ファイル以外のファイルは、管理ファイルの一例である。   Of the files stored in the BDMV folder and the files stored in the folders below the BDMV folder, files other than the moving image file stored in the STREAM folder are examples of management files.

管理ファイルの一例として、CLIPINFフォルダに格納されるクリップ情報ファイルについて説明する。BDMVフォルダの下位には、CLIPINFフォルダが作成されている。CLIPINFフォルダには、クリップ情報ファイルが格納される。00000.cpiファイルからXXXXX.cpiファイルは、クリップ情報ファイルである。クリップ情報ファイルは、動画ファイルと一対一に対応し、対応する動画ファイルの撮影時間などの情報が記載されている。   As an example of the management file, a clip information file stored in the CLIPINF folder will be described. A CLIPINF folder is created below the BDMV folder. A clip information file is stored in the CLIPINF folder. 00000. from the cpi file. The cpi file is a clip information file. The clip information file has a one-to-one correspondence with the moving image file and describes information such as the shooting time of the corresponding moving image file.

BDMVフォルダに格納されるINDEX.bdmファイル、MOVIEOBJ.bdmファイルおよびPLAYLISTフォルダに格納される00000.mplファイルからYYYYY.mplファイルについては説明を省略する。
(3−2.フレーム位置情報)
以下に、管理ファイルに記録されるフレーム位置情報について、例を挙げて説明する。図4は動画ファイルとフレーム位置情報の対応の一例を示す図である。また、図5はフレーム位置情報として記録されるデータの一例を示す図である。
INDEX.NET stored in the BDMV folder. bdm file, MOVIEOBJ. stored in the bdm file and the PLAYLIST folder. mpl file from YYYYY. Description of the mpl file is omitted.
(3-2. Frame position information)
Hereinafter, the frame position information recorded in the management file will be described with an example. FIG. 4 is a diagram showing an example of the correspondence between a moving image file and frame position information. FIG. 5 is a diagram showing an example of data recorded as frame position information.

管理ファイルには、フレーム位置情報として、再生位置情報、顔検出情報、参照画像の有無、管理番号などが記録されている。本例はあくまでも一例であり、これら以外の情報が記録されていてもよいし、ここで挙げた情報のうちのいくつかが記録されていなくても問題ない。   In the management file, playback position information, face detection information, presence / absence of a reference image, management number, and the like are recorded as frame position information. This example is merely an example, and information other than these may be recorded, and there is no problem even if some of the information listed here is not recorded.

再生位置情報は動画ファイル内におけるフレームの位置を特定するための情報である。なお、再生位置情報としては、PTS(Presentation Time Stamp)情報のほか、動画の再生時間、動画の撮影時刻、フレーム番号、パケット数、GOP(Group Of Pictures)情報、DTS(Decoding Time Stamp)情報、およびこれらの情報から算出される値を利用することもできる。   The reproduction position information is information for specifying the position of the frame in the moving image file. The playback position information includes PTS (Presentation Time Stamp) information, video playback time, video shooting time, frame number, number of packets, GOP (Group Of Pictures) information, DTS (Decoding Time Stamp) information, Also, values calculated from these pieces of information can be used.

顔検出情報は顔検出手段207に備わる顔検出機能により検出された、顔画像の有無、検出された顔画像の個数、位置、大きさ、角度などを含む情報を指す。また、顔検出手段207が被写体識別機能を備える場合は、被写体識別機能によって検出された、被写体識別の成否、識別された被写体の識別番号や名称などを含む情報を記録してもよい。また、顔検出手段207が表情変化検出機能を備える場合は、表情変化検出機能によって検出された、表情変化の有無、検出された表情種別の識別番号あるいは名称などを含む情報を記録してもよい。   The face detection information indicates information including the presence / absence of a face image, the number of detected face images, the position, the size, and the angle detected by the face detection function provided in the face detection unit 207. When the face detection unit 207 has a subject identification function, information including the success or failure of the subject identification, the identification number or name of the identified subject, and the like detected by the subject identification function may be recorded. When the face detection means 207 has a facial expression change detection function, information including the presence or absence of facial expression change, the identification number or name of the detected facial expression type, etc., detected by the facial expression change detection function may be recorded. .

参照画像の有無は、再生位置情報の指し示すフレーム画像を、動画ファイルとは別に、静止画ファイルとして保存する場合に使用する。スライドショー再生やマルチサムネイル再生など、静止画の表示を主な用途とする場合には、この情報を元に、動画内のフレーム画像から生成した静止画の参照画像を代表画像として参照することで、高速な表示が可能である。   The presence / absence of the reference image is used when the frame image indicated by the reproduction position information is saved as a still image file separately from the moving image file. When the main application is still image display such as slide show playback and multi-thumbnail playback, by referring to the reference image of the still image generated from the frame image in the moving image as the representative image based on this information, High-speed display is possible.

管理番号は再生位置情報と顔検出情報を管理するために割り振られる番号である。   The management number is a number assigned to manage reproduction position information and face detection information.

PTS情報は、動画ファイル内の各パケットに記録されるデータの表示時刻を指示するインデックス値であり、一般的に動画ファイル内のフレーム情報と一対一で割り当てられる。再生位置情報としてPTS情報を用いた場合、この数値を読み取ることで、動画ファイル内の参照したいフレームを特定することが可能である。その他の例として、再生位置情報として再生時間を利用する場合などは、フレームレートなどの情報を用いて基準となるフレームからの時間差を算出することで、参照したいフレームを特定することが可能である。
(4.動作)
(4−1.フレーム位置情報の記録動作)
(4−1−1.顔検出)
図6は、本発明の実施の形態に係るデジタルカメラ100の動画撮影動作を示すフローチャートである。
The PTS information is an index value that indicates the display time of data recorded in each packet in the moving image file, and is generally assigned one-to-one with the frame information in the moving image file. When PTS information is used as reproduction position information, it is possible to specify a frame to be referred to in the moving image file by reading this numerical value. As another example, when the playback time is used as the playback position information, it is possible to specify the frame to be referred to by calculating the time difference from the reference frame using information such as the frame rate. .
(4. Operation)
(4-1. Recording operation of frame position information)
(4-1-1. Face Detection)
FIG. 6 is a flowchart showing the moving image shooting operation of the digital camera 100 according to the embodiment of the present invention.

本発明の実施の形態に係るデジタルカメラ100は、顔検出機能が有効になっている場合、動画撮影モードで動画の撮影開始後に、信号処理手段205より出力された動画のフレーム画像に対して、顔検出手段207で顔検出を行う(S600)。顔検出手段207の備える機能によって検出された顔検出情報は、制御手段202の指示にしたがって、制御手段202および記録制御手段206に出力される。   When the face detection function is enabled, the digital camera 100 according to the embodiment of the present invention applies to the moving image frame image output from the signal processing unit 205 after starting the moving image shooting in the moving image shooting mode. Face detection is performed by the face detection means 207 (S600). Face detection information detected by the function of the face detection unit 207 is output to the control unit 202 and the recording control unit 206 in accordance with an instruction from the control unit 202.

制御手段202は、顔検出手段207から出力された顔検出情報を元に、顔検出の結果を判定する(S601)。動画のフレーム画像から人物などの顔が1つ以上検出されていない場合は、制御手段202は、そのフレーム画像に対する判定処理を終了する。一方、動画のフレーム画像から人物などの顔画像が検出されている場合は、制御手段202は、顔検出手段207から出力された顔検出情報のもつ各値に対して閾値判定を行う(S602)。この閾値判定では、検出された顔画像の個数があらかじめ指定した個数に達しているか、顔画像の検出位置があらかじめ指定した範囲に収まっているか、顔画像の領域の大きさがあらかじめ指定した範囲に収まっているか、顔画像の角度があらかじめ指定した範囲に収まっているか、といった判定条件のうちいくつかを組み合わせて実施する。これらの判定が、時間あるいはフレーム数などを基準とした一定の期間以上連続で満たされた場合、フレーム位置情報を記録するためのフラグを有効にする。これらの判定の閾値に関するパラメータは、デジタルカメラ100の設定などから変更できるようにしてもよい。   The control unit 202 determines the result of face detection based on the face detection information output from the face detection unit 207 (S601). If at least one face such as a person is not detected from the frame image of the moving image, the control unit 202 ends the determination process for the frame image. On the other hand, when a face image such as a person is detected from the frame image of the moving image, the control unit 202 performs threshold determination for each value of the face detection information output from the face detection unit 207 (S602). . In this threshold determination, the number of detected face images has reached a pre-specified number, the detection position of the face image is within a pre-specified range, or the size of the face image area is within a pre-specified range. The determination is performed by combining some of the determination conditions such as whether the angle is within the range specified in advance and whether the angle of the face image is within a predetermined range. When these determinations are satisfied continuously for a certain period of time based on time or the number of frames, a flag for recording frame position information is validated. These parameters relating to the determination threshold may be changed from the settings of the digital camera 100 or the like.

顔検出情報の閾値判定の結果、フレーム位置情報を記録するためのフラグが有効になっている場合(S603でYES)は、動画内の人物などの顔に関する情報が変化したシーンであるとみなし、記録制御手段206は、制御手段202の指示にしたがって、信号処理手段205と顔検出手段207から出力された情報を元に、動画のフレーム位置情報を管理ファイルであるクリップ情報ファイルに記録する(S604)。このとき、動画のフレーム位置情報は、動画の撮影中は一時的にデジタルカメラ100の図示しないワークメモリ上に出力し、撮影停止の際に管理ファイルであるクリップ情報ファイルに記録しても構わない。また、フレーム画像から静止画ファイルの参照画像を生成する場合は、フレーム位置情報とともに参照画像を記録する。   When the flag for recording the frame position information is valid as a result of the threshold determination of the face detection information (YES in S603), it is regarded as a scene in which information about a face such as a person in the video has changed, The recording control unit 206 records the frame position information of the moving image in the clip information file that is a management file based on the information output from the signal processing unit 205 and the face detection unit 207 in accordance with the instruction of the control unit 202 (S604). ). At this time, the frame position information of the moving image may be temporarily output to a work memory (not shown) of the digital camera 100 during shooting of the moving image, and may be recorded in a clip information file that is a management file when shooting is stopped. . When generating a reference image of a still image file from a frame image, the reference image is recorded together with the frame position information.

フレーム位置情報を記録するためのフラグが有効になっていない場合(S603でNO)、あるいは検出された顔画像に対するフレーム位置情報の記録(S604)が終了した場合、同じフレーム画像から検出された顔画像が他にあるかどうかの判定を行う(S605)。検出された顔画像がまだある場合は、その顔画像に対してS602の閾値判定より同様の処理を繰り返す。   When the flag for recording the frame position information is not valid (NO in S603), or when the recording of the frame position information for the detected face image is completed (S604), the face detected from the same frame image It is determined whether there is another image (S605). If there is still a detected face image, the same processing is repeated for the face image from the threshold determination in S602.

撮影停止操作が入力されるまで、制御手段202の指示にしたがって実行される顔検出の実行タイミングごとに、一連の処理を繰り返し実行する。   Until a photographing stop operation is input, a series of processing is repeatedly executed at each face detection execution timing executed in accordance with an instruction from the control unit 202.

この構成では、動画撮影中に人物などの顔が特定の位置に検出されたフレーム、人物などがカメラに向かって近づくことで人物などの顔が特定大きさで検出されたフレーム、人物などの顔が特定の方向を向いたフレームなどのフレーム位置情報を管理ファイルであるクリップ情報ファイルに記録することとなる。
(4−1−2.表情変化検出)
なお、顔検出手段207は、動画のフレーム画像に人物などの顔が含まれているかどうかを検出する顔検出機能に加え、追加の機能を備えていてもよい。一例として、デジタルカメラ100の顔検出手段207が、人物などの表情が変化したかどうかを検出する表情変化検出機能を備えている場合を挙げる。図7は、表情変化検出機能を備えたデジタルカメラ100の動作を示すフローチャートである。
In this configuration, a frame in which a face such as a person is detected at a specific position during video recording, a frame in which a face such as a person is detected at a specific size as the person approaches the camera, and a face such as a person Frame position information such as a frame facing in a specific direction is recorded in a clip information file that is a management file.
(4-1-2. Expression Change Detection)
Note that the face detection unit 207 may have an additional function in addition to the face detection function for detecting whether a face such as a person is included in the frame image of the moving image. As an example, a case where the face detection unit 207 of the digital camera 100 has a facial expression change detection function for detecting whether or not a facial expression such as a person has changed is given. FIG. 7 is a flowchart showing the operation of the digital camera 100 having a facial expression change detection function.

表情変化検出機能を備えている場合でも、顔検出手段207で顔検出を行い(S700)、検出された顔画像の個数を判定する(S701)処理の流れについては、表情変化検出機能を備えていない場合と同様である。しかし、表情変化検出機能を備えている場合は、顔検出情報に対する閾値判定を行う前に、表情変化検出機能により表情変化の検出を実行する(S702)。表情変化検出の実行後、表情変化検出機能を備えていない場合と同様に顔検出情報のもつ各値に対して閾値判定を行うが、表情変化が検出されているかといった判定条件を新たに加えることができる(S703)。   Even if the facial expression change detection function is provided, the face detection means 207 detects the face (S700) and determines the number of detected facial images (S701). The processing flow includes the facial expression change detection function. It is the same as when there is no. However, if a facial expression change detection function is provided, facial expression change detection is executed by the facial expression change detection function before performing threshold determination for face detection information (S702). After executing facial expression change detection, the threshold is determined for each value of the face detection information in the same way as when the facial expression change detection function is not provided, but a new criterion such as whether facial expression change is detected is added. (S703).

顔検出情報の閾値判定の結果、フレーム位置情報を記録するためのフラグが有効になっている場合(S704でYES)は、動画内の人物などの顔や表情に関する情報が変化したシーンであるとみなし、記録制御手段206は、制御手段202の指示にしたがって、信号処理手段205と表情変化検出機能を備える顔検出手段207から出力された情報を元に、動画のフレーム位置情報を管理ファイルに記録する(S705)。このとき、動画のフレーム位置情報は、動画の撮影中は一時的にデジタルカメラ100の図示しないワークメモリ上に出力し、撮影停止の際に管理ファイルに記録しても構わない。また、フレーム画像から静止画ファイルの参照画像を生成する場合は、フレーム位置情報とともに参照画像を記録する。   If the flag for recording the frame position information is valid as a result of the threshold determination of the face detection information (YES in S704), it is a scene in which information about the face and facial expression of a person in the video has changed. The recording control unit 206 records the frame position information of the moving image in the management file based on the information output from the signal processing unit 205 and the face detection unit 207 having a facial expression change detection function according to the instruction of the control unit 202. (S705). At this time, the frame position information of the moving image may be temporarily output on a work memory (not shown) of the digital camera 100 during shooting of the moving image, and may be recorded in the management file when shooting is stopped. When generating a reference image of a still image file from a frame image, the reference image is recorded together with the frame position information.

上記の処理が終わった場合、表情変化検出機能を備えていない場合と同様に、同じフレーム画像から検出された顔画像が他にあるかどうかの判定(S706)を行い、次の顔画像に対して表情変化検出の実行(S702)から、一連の処理を繰り返し実行する。   When the above processing is completed, it is determined whether there is another face image detected from the same frame image (S706) as in the case where the expression change detection function is not provided, and the next face image is determined. From the execution of facial expression change detection (S702), a series of processing is repeatedly executed.

この構成では、動画撮影中に人物などの顔が検出され、検出された人物などの表情が変化したフレームのフレーム位置情報を管理ファイルであるクリップ情報ファイルに記録することとなる。このとき、表情変化検出機能が表情の変化の種類まで判別できる場合、どんな表情に変化したかという情報もフレーム位置情報に加えて記録することができる。検出された人物などの表情の変化は、例えば、真顔から笑顔への変化を挙げることができる。
(4−1−3.被写体識別)
デジタルカメラ100の顔検出手段207が追加の機能を備えている場合の一例として、デジタルカメラ100自体のもつ図示しない記憶手段や記録媒体212などに記録されているデータベースに登録されている被写体かどうかを検出する被写体識別機能を備えている場合を挙げる。図8は、被写体識別機能を備えたデジタルカメラ100の動作を示すフローチャートである。
In this configuration, a face such as a person is detected during moving image shooting, and the frame position information of a frame whose facial expression such as the detected person has changed is recorded in a clip information file that is a management file. At this time, if the facial expression change detection function can discriminate up to the type of facial expression change, information indicating what facial expression has changed can be recorded in addition to the frame position information. The change in the facial expression of the detected person or the like can be, for example, a change from a true face to a smile.
(4-1-3. Subject identification)
As an example of the case where the face detection unit 207 of the digital camera 100 has an additional function, whether the subject is registered in a database recorded in a storage unit (not shown) or a recording medium 212 of the digital camera 100 itself A case where a subject identification function for detecting the image is provided will be described. FIG. 8 is a flowchart showing the operation of the digital camera 100 having a subject identification function.

被写体識別機能を備えている場合でも、顔検出手段207で顔検出を行い(S800)、検出された顔画像の個数を判定する(S802)処理の流れについては、被写体識別機能を備えていない場合と同様である。しかし、被写体識別機能を備えている場合は、顔検出情報に対する閾値判定を行う前に、被写体識別機能により被写体の識別を実行する(S802)。被写体識別の実行後、被写体識別機能を備えていない場合と同様に顔検出情報のもつ各値に対して閾値判定を行うが、被写体識別が成功したかどうか、あらかじめ指定した特定の被写体であるかどうか、といった判定条件を新たに加えることができる(S803)。   Even when the subject identification function is provided, the face detection unit 207 performs face detection (S800) and determines the number of detected face images (S802). It is the same. However, if the subject identification function is provided, the subject identification function is used to identify the subject (S802) before performing threshold determination for the face detection information. After the subject identification is performed, threshold determination is performed for each value of the face detection information as in the case where the subject identification function is not provided. Whether the subject identification is successful or whether the subject is a specific subject specified in advance. A determination condition such as “whether” can be newly added (S803).

顔検出情報の閾値判定の結果、フレーム位置情報を記録するためのフラグが有効になっている場合(S804でYES)は、動画内の人物などの顔や被写体の識別に関する情報が変化したシーンであるとみなし、記録制御手段206は、制御手段202の指示にしたがって、信号処理手段205と顔検出手段207から出力された情報を元に、動画のフレーム位置情報を管理ファイルに記録する(S805)。このとき、動画のフレーム位置情報は、動画の撮影中は一時的にデジタルカメラ100の図示しないワークメモリ上に出力し、撮影停止の際に管理ファイルに記録しても構わない。また、フレーム画像から静止画ファイルの参照画像を生成する場合は、フレーム位置情報とともに参照画像を記録する。   If the flag for recording the frame position information is valid as a result of the threshold determination of the face detection information (YES in S804), it is a scene in which information related to identification of a face or subject such as a person in the video has changed. The recording control unit 206 records the frame position information of the moving image in the management file based on the information output from the signal processing unit 205 and the face detection unit 207 according to the instruction of the control unit 202 (S805). . At this time, the frame position information of the moving image may be temporarily output on a work memory (not shown) of the digital camera 100 during shooting of the moving image, and may be recorded in the management file when shooting is stopped. When generating a reference image of a still image file from a frame image, the reference image is recorded together with the frame position information.

上記の処理が終わった場合、被写体識別機能を備えていない場合と同様に、同じフレーム画像から検出された顔画像が他にあるかどうかの判定(S806)を行い、次の顔画像に対して被写体識別の実行(S802)から、一連の処理を繰り返し実行する。   When the above processing is completed, as in the case where the subject identification function is not provided, it is determined whether there is another face image detected from the same frame image (S806), and the next face image is determined. A series of processing is repeatedly executed from execution of subject identification (S802).

この構成では、動画撮影中に人物などの顔が検出され、検出された人物などの顔画像に対して被写体識別が成功したフレームのフレーム位置情報を管理ファイルであるクリップ情報ファイルに記録することとなる。このとき、被写体識別機能の出力する識別結果に関する情報もフレーム位置情報に加えて記録することができる。被写体識別機能の出力する識別結果に関する情報は、例えば、識別された被写体の名称や番号を挙げることができる。
(4−1−4.被写体識別と表情変化検出)
デジタルカメラ100の顔検出手段207が追加の機能を備えている場合の一例として、被写体検出機能と表情変化検出機能の両方を備えている場合を挙げる。図9は、被写体識別機能と表情変化検出機能を備えたデジタルカメラ100の動作を示すフローチャートである。
In this configuration, a face such as a person is detected during movie shooting, and the frame position information of a frame in which subject identification has been successfully performed on the detected face image such as a person is recorded in a clip information file that is a management file. Become. At this time, information related to the identification result output by the subject identification function can also be recorded in addition to the frame position information. The information regarding the identification result output by the subject identification function can include, for example, the name and number of the identified subject.
(4-1-4. Subject identification and facial expression change detection)
As an example of the case where the face detection unit 207 of the digital camera 100 has an additional function, there is a case where both the subject detection function and the expression change detection function are provided. FIG. 9 is a flowchart showing the operation of the digital camera 100 having a subject identification function and a facial expression change detection function.

顔検出機能に付随する追加の機能を複数備えている場合でも、顔検出手段207で顔検出を行い(S900)、検出された顔画像の個数を判定する(S901)処理の流れについては、顔検出機能に付随する追加の機能を備えていない場合や、追加の機能を1つ備えている場合と同様である。しかし、追加の機能を複数備えている場合、顔検出情報に対する閾値判定を行う前に、被写体識別機能による被写体の識別(S902)と表情変化検出機能による表情変化の検出(S903)を実行する。   Even when a plurality of additional functions associated with the face detection function are provided, the face detection unit 207 performs face detection (S900) and determines the number of detected face images (S901). This is the same as when no additional function associated with the detection function is provided or when one additional function is provided. However, when a plurality of additional functions are provided, subject identification by the subject identification function (S902) and facial expression change detection by the facial expression change detection function (S903) are executed before threshold determination for the face detection information.

各追加の機能による処理実行後の流れは、追加の機能を1つ備えている場合と同様である。各追加の機能の出力する情報を含んだ顔検出情報のもつ各値に対して閾値判定を行い(S904)、フレーム位置情報を記録するフラグが有効になっているかどうかの判定(S905)を行う。フレーム位置情報を記録するためのフラグが有効になっている場合(S905でYES)は、動画内の人物などの顔や表情や被写体の識別に関する情報が変化したシーンであるとみなし、記録制御手段206は、制御手段202の指示にしたがって、信号処理手段205と顔検出手段207から出力された情報を元に、動画のフレーム位置情報を管理ファイルに記録する(S906)。上記の処理が終わった場合、同じフレーム画像から検出された顔画像が他にあるかどうかの判定(S907)を行い、次の顔画像に対して被写体識別の実行(S902)から、一連の処理を繰り返し実行する。   The flow after execution of processing by each additional function is the same as the case where one additional function is provided. A threshold is determined for each value of the face detection information including information output by each additional function (S904), and it is determined whether the flag for recording the frame position information is valid (S905). . If the flag for recording the frame position information is valid (YES in S905), it is regarded as a scene in which information relating to identification of the face, facial expression, and subject of the person in the video has changed, and the recording control means 206 records the frame position information of the moving image in the management file based on the information output from the signal processing unit 205 and the face detection unit 207 in accordance with the instruction of the control unit 202 (S906). When the above processing is completed, it is determined whether there is another face image detected from the same frame image (S907), and subject identification is performed on the next face image (S902). Repeatedly.

なお、本例では、被写体識別の実行を表情変化検出の実行より先に行っているが、これらの処理の実行順序についてはどちらを先に実行しても構わない。
(4−1−5.まとめ)
顔検出手段207の備える追加の機能の一例として、表情変化検出機能と被写体識別機能を挙げたが、まったく他の機能でも構わないし、追加の機能を備えていなくても構わない。また、追加の機能を3つ以上備えていてもよい。
In this example, subject identification is performed prior to facial expression change detection, but either of these processing execution orders may be performed first.
(4-1-5. Summary)
As an example of the additional functions provided in the face detection means 207, the expression change detection function and the subject identification function have been described. However, other functions may be used or no additional functions may be provided. Three or more additional functions may be provided.

上記のように、本発明の実施の形態に係るデジタルカメラ100は、動画撮影の際に、動画内の人物などの顔に関する情報が変化したフレームのフレーム位置情報を、管理ファイルに記録することができる。一方、動画撮影モードで動作させた場合に限らず、動画再生時に顔検出手段207を動作できる構成であれば、動画再生の際に、動画内の人物などの顔に関する情報が変化したフレームのフレーム位置情報を、管理ファイルに記録することが可能である。動画再生時に、動画内の人物などの顔に関する情報が変化したフレームのフレーム位置情報を記録する方法については、説明を省略する。   As described above, the digital camera 100 according to the embodiment of the present invention can record, in the management file, the frame position information of a frame in which information related to a face such as a person in the moving image is changed during moving image shooting. it can. On the other hand, not only when operating in the video shooting mode, but with a configuration in which the face detection means 207 can operate during video playback, the frame of the frame in which information about a face such as a person in the video has changed during video playback The position information can be recorded in the management file. The description of the method of recording the frame position information of the frame in which the information related to the face such as a person in the moving image is changed during moving image reproduction will be omitted.

したがって、本発明は、デジタルカメラ100などの撮像装置に限定されず、撮像手段201を備えない再生装置にも適用することができる。具体的な再生装置としては、静止画や動画を再生することができるビューワ、携帯電話、PDA、フォトフレーム、テレビ受像機、カーナビなどを挙げることができる。また、光ディスクプレーヤ、光ディスクレコーダ、ハードディスクレコーダなどの(記録)再生装置も、テレビ受像機などを表示手段とすることによって、本発明を適用することができる。すなわち、表示手段を備えない再生装置であっても、テレビ受像機などの表示手段に画像を出力することができる出力手段を備えた再生装置であれば、本発明を適用することができる。さらに、本発明は、電子計算機の再生プログラムとすることもできる。   Therefore, the present invention is not limited to an imaging apparatus such as the digital camera 100, and can also be applied to a playback apparatus that does not include the imaging unit 201. Specific examples of the playback device include a viewer that can play back still images and moving images, a mobile phone, a PDA, a photo frame, a television receiver, and a car navigation system. The present invention can also be applied to (recording) playback devices such as an optical disk player, an optical disk recorder, and a hard disk recorder by using a television receiver or the like as a display means. In other words, the present invention can be applied to a reproducing apparatus that does not include a display unit as long as the reproducing apparatus includes an output unit that can output an image to a display unit such as a television receiver. Furthermore, the present invention can be a reproduction program for an electronic computer.

なお、本実施の形態に係るデジタルカメラ100は、動画撮影の際に、動画内の人物などの顔に関する情報が変化したフレームのフレーム位置情報を、管理ファイルであるクリップ情報ファイルに記録することとしたが、動画内の人物などの顔に関する情報が変化したフレームのフレーム位置情報を、管理ファイルであるクリップ情報ファイル以外のファイルに記録することとしてもよい。例えば、AVCHD規格によって規定される管理ファイルとは無関係のファイルに記録することとしてもよい。このファイルは、動画ファイルごとに作成してもよいし、一つのファイルに複数の動画ファイルのフレーム位置情報を記録してもよい。また、フレーム位置情報を動画ファイルのヘッダに記録することとしてもよい。さらに、記録する形式は一つに限定するものでなく、例えば、クリップ情報ファイルと動画ファイルのヘッダといったように、複数のファイルに同時に記録してもよい。
(4−2.フレーム位置情報を利用したスライドショー再生動作)
本発明におけるフレーム位置情報は、動画内の人物などの顔に関する情報が変化したシーンの再生位置情報などを含んでいる。
The digital camera 100 according to the present embodiment records frame position information of a frame in which information about a face such as a person in the moving image is recorded in a clip information file, which is a management file, during moving image shooting. However, the frame position information of a frame in which information related to a face such as a person in the moving image is changed may be recorded in a file other than the clip information file that is a management file. For example, it may be recorded in a file unrelated to the management file defined by the AVCHD standard. This file may be created for each moving image file, or frame position information of a plurality of moving image files may be recorded in one file. The frame position information may be recorded in the header of the moving image file. Furthermore, the recording format is not limited to one. For example, the recording may be simultaneously recorded in a plurality of files such as a clip information file and a moving image file header.
(4-2. Slideshow playback operation using frame position information)
The frame position information in the present invention includes the reproduction position information of a scene in which information about a face such as a person in a moving image has changed.

そのため、再生や編集などにおいて動画内の有意なシーンを検索する際に本情報を利用することで、利便性を向上させることができる。   Therefore, the convenience can be improved by using this information when searching for a significant scene in a moving image during reproduction or editing.

一例として、本発明におけるフレーム位置情報を利用したスライドショー再生について説明する。   As an example, a slide show reproduction using frame position information in the present invention will be described.

図10は、本発明の実施の形態に係るデジタルカメラ100のスライドショー再生動作を示すフローチャートである。   FIG. 10 is a flowchart showing the slide show playback operation of the digital camera 100 according to the embodiment of the present invention.

本発明の実施の形態に係るデジタルカメラ100は、スライドショーの再生が開始されると、静止画ファイルと動画ファイルを撮影日時などの情報で並び替え、並び替え順序の最も若いファイルが動画ファイルであるかどうかの判定を行う(S1000)。並び替え順序の最も若いファイルは、撮影日時が最も新しいファイルであってもよいし、撮影日時が最も古いファイルであってもよい。   The digital camera 100 according to the embodiment of the present invention sorts still image files and moving image files according to information such as shooting date and time when a slide show is started, and the youngest file in the rearrangement order is a moving image file. It is determined whether or not (S1000). The file with the youngest rearrangement order may be the file with the newest shooting date or the file with the oldest shooting date.

該当ファイルが動画ファイルでなく静止画ファイルである場合は、デジタルカメラ100は静止画の表示処理を実行し、表示手段204には該当する静止画ファイルに基づく画像が表示される(S1006)。   When the corresponding file is not a moving image file but a still image file, the digital camera 100 executes a still image display process, and an image based on the corresponding still image file is displayed on the display unit 204 (S1006).

一方、該当ファイルが動画ファイルである場合は、デジタルカメラ100は該当する動画ファイルに対応する管理ファイルを検索し、フレーム位置情報が記録されているかどうかを判定する(S1001)。   On the other hand, if the corresponding file is a moving image file, the digital camera 100 searches for a management file corresponding to the corresponding moving image file and determines whether frame position information is recorded (S1001).

ここで、該当する動画ファイルに対応するフレーム位置情報が記録されていない場合は、本発明におけるフレーム位置情報を利用しない場合と同様の、通常の表示処理を行う(S1005)。動画ファイルの通常の表示処理には、動画ファイルに記録されているサムネイル画像や先頭フレームの画像を代表画像として表示手段204に静止画表示する方法や、動画として表示手段204に再生表示する方法などが一般的であるが、この限りではない。   Here, when the frame position information corresponding to the corresponding moving image file is not recorded, a normal display process similar to the case where the frame position information in the present invention is not used is performed (S1005). For normal display processing of a moving image file, a thumbnail image or a first frame image recorded in the moving image file is displayed as a representative image on the display unit 204, or a playback method is displayed on the display unit 204 as a moving image. However, this is not always the case.

これに対して、該当する動画ファイルに対応するフレーム位置情報が記録されている場合は、動画のフレーム位置情報を利用し、本情報に記録されている再生位置に関するフレームの画像を代表画像として表示手段204に静止画表示する(S1002)。なお、このとき表示する代表画像は、動画ファイルから直接生成してもよいし、動画ファイルとは別に記録した参照画像を利用してもよい。また、このとき、フレームの画像を代表画像として静止画表示する代わりに、動画のフレーム位置情報に記録されている再生位置から動画として再生表示してもよい。あるいは、フレームの画像を代表画像として静止画表示している際に、各種操作ボタン106の操作を行うことにより、動画のフレーム位置情報に記録されている再生位置から動画として再生表示してもよい。   On the other hand, when the frame position information corresponding to the corresponding moving image file is recorded, the frame position information of the moving image is used to display the frame image relating to the reproduction position recorded in this information as a representative image. A still image is displayed on the means 204 (S1002). The representative image displayed at this time may be generated directly from the moving image file, or a reference image recorded separately from the moving image file may be used. At this time, instead of displaying a frame image as a representative image and displaying a still image, the image may be reproduced and displayed as a moving image from the reproduction position recorded in the frame position information of the moving image. Alternatively, when a still image is displayed as a representative image of a frame image, the operation may be performed by operating various operation buttons 106 so that the image is reproduced and displayed from the reproduction position recorded in the frame position information of the movie. .

なお、動画のフレーム位置情報を利用し、本情報に記録されている再生位置に関するフレームの画像を代表画像として表示手段204に静止画表示する際は、本情報に記録されている再生位置に関するフレームから所定時間経過したあとのフレームの画像を代表画像として表示手段204に静止画表示するようにしてもよい。動画内の人物などの顔に関する情報が変化したフレームにおいては、例えば、人物などが動画内に入ってきた直後のように、顔検出手段207が人物の顔を検出したとしても、人物が画面の端に存在するなどして、代表画像とするには不適切な場合があるからである。一方、顔検出手段207が、画面の中央部の所定の領域において人物の顔を検出したときにフレーム位置情報を記録するようにすれば、このような問題を回避することもできる。   When a frame image related to the reproduction position recorded in the main information is displayed as a representative image on the display means 204 using the frame position information of the moving image, the frame related to the reproduction position recorded in the main information is displayed. A still image may be displayed on the display unit 204 as a representative image of a frame after a predetermined time has elapsed. In a frame in which information about a face such as a person in a movie has changed, even if the face detection unit 207 detects a person's face, for example, immediately after a person enters the movie, This is because it may be inappropriate for a representative image because it exists at the edge. On the other hand, if the face detecting unit 207 records the frame position information when a face of a person is detected in a predetermined area at the center of the screen, such a problem can be avoided.

上記表示処理の実行から、何らかの操作が入力される、あるいは所定の時間が過ぎ、次の画像を表示するタイミングとなると、該当する動画ファイルに対して、まだ表示していないフレーム位置情報があるかどうかを判定する(S1003)。まだ表示していないフレーム位置情報があった場合、そのフレーム位置情報に関して、S1002の表示処理を実行する。   When some operation is input from the execution of the display process or when a predetermined time has passed and it is time to display the next image, is there any frame position information not yet displayed for the corresponding video file? It is determined whether or not (S1003). If there is frame position information that has not been displayed yet, the display processing of S1002 is executed for the frame position information.

一方、まだ表示していないフレーム位置情報がなくなった場合には、該当する動画ファイルに対する処理を終了し、並び替え順序における次のファイルがあるかどうかを判定する(S1004)。この判定は、静止画ファイルの表示処理(S1006)や動画ファイルの通常の表示処理(S1005)が行われたあとにも行う。   On the other hand, if there is no frame position information that has not yet been displayed, the processing for the corresponding moving image file is terminated, and it is determined whether there is a next file in the rearrangement order (S1004). This determination is also made after the still image file display processing (S1006) and the moving image file normal display processing (S1005).

並び替え順序における次のファイルがなかった場合は、スライドショー再生を終了する。   If there is no next file in the rearrangement order, the slide show reproduction ends.

並び替え順序における次のファイルがあった場合は、並び替え順序における最後のファイルの表示処理が行われるまで、次のファイルに対して、動画ファイルであるかどうかの判定(S1000)から、一連の処理を繰り返し実行する。   If there is a next file in the rearrangement order, a determination is made from the determination (S1000) whether the next file is a moving image file until display processing of the last file in the rearrangement order is performed. Repeat the process.

図11は本発明の実施の形態に係るデジタルカメラ100のファイル構成の一例を示す図である。このファイル構成では、記憶媒体212に2つの静止画ファイル(P100001.jpg、P100002.jpg)と3つの動画ファイル(00000.mts、00001.mts、00002.mts)と3つの動画ファイルに対応するクリップ情報ファイル(00000.cpi、00001.cpi、00002.cpi)が記録されている。また、3つあるクリップ情報ファイルのうち1つに、対応する動画ファイルの3フレーム分のフレーム位置情報が記録されており、3つあるクリップ情報のうち残り2つにはフレーム位置情報が含まれていない。ただし、記憶媒体212には、ここに記載していないファイルや情報が記録されていても構わない。   FIG. 11 is a diagram showing an example of a file configuration of the digital camera 100 according to the embodiment of the present invention. In this file structure, clips corresponding to two still image files (P100001.jpg, P100002.jpg), three moving image files (00000.mts, 00001.mts, 00002.mts) and three moving image files are stored in the storage medium 212. Information files (00000.cpi, 00001.cpi, 00002.cpi) are recorded. Also, frame position information for three frames of the corresponding moving image file is recorded in one of the three clip information files, and the remaining two of the three clip information include frame position information. Not. However, the storage medium 212 may record files and information not described here.

図11に示すファイル構成について、図8のフローチャートに示すスライドショー再生動作を行った場合の実施例について説明する。スライドショーの再生が開始された際の並び替えは静止画および動画の撮影日時による順序とし、撮影日時が最も古いファイルを並び替え順序の最も若いファイルとする。図12は、フレーム位置情報を利用したスライドショー再生で表示される代表画像を示す図である。   With respect to the file structure shown in FIG. 11, an example when the slide show reproduction operation shown in the flowchart of FIG. The rearrangement when the slide show reproduction is started is the order according to the shooting date and time of the still image and the moving image, and the file with the oldest shooting date and time is set as the file with the youngest rearrangement order. FIG. 12 is a diagram illustrating a representative image displayed by slide show reproduction using the frame position information.

まず、並び替え順序の最も若いP100001.jpgに対して、動画ファイルであるかの判定(S1000)を行う。P100001.jpgは静止画ファイルであるため、表示手段204に対して静止画ファイルに基づく画像のスライドショー表示処理(S1006)を行い、並べ替え順序における次のファイルの有無の判定(S1004)を行った後、次のファイルである00000.mtsの表示処理に移行する。   First, P100001. Jpg is determined whether it is a moving image file (S1000). P100001. Since jpg is a still image file, a slide show display process of images based on the still image file is performed on the display means 204 (S1006), and the presence / absence of the next file in the rearrangement order is determined (S1004). The next file is 00000. The process shifts to mts display processing.

00000.mtsは動画ファイルであるが、管理ファイルであるクリップ情報ファイル00000.cpi内にフレーム位置情報が記録されていないため、S1001の判定の後、動画ファイルの先頭フレームの画像を代表画像として表示手段204に対して静止画表示するなどの、フレーム位置情報を利用しない場合と同様の通常の表示処理(S1005)を行う。表示処理を終えると、次のファイルの有無の判定(S1004)を行った後、次のファイルである00001.mtsの表示処理に移行する。   00000. mts is a moving image file, but a clip information file 00000. Since no frame position information is recorded in cpi, after the determination in S1001, frame position information is not used, such as displaying a still image on the display means 204 as the representative image of the first frame of the moving image file. A normal display process (S1005) similar to the above is performed. When the display process is completed, the presence / absence of the next file is determined (S1004), and then the next file is 00001. The process shifts to mts display processing.

00001.mtsは動画ファイルであり、かつ、管理ファイルであるクリップ情報ファイル00001.cpi内にフレーム位置情報が記録されているため、S1001の判定の後、本情報に記録されている再生位置情報に関するフレームの画像を代表画像として表示手段204に対して静止画表示するなどの、動画のフレーム位置情報を利用した表示処理(S1002)を行う。00001.cpiのように複数フレームのフレーム位置情報が記録されている場合は、フレーム位置情報を並び替え、並び替え順序の若い順番に使用する。並び替え順序としては、フレーム位置情報のもつ管理番号により昇順あるいは降順に並べる方法や、再生位置情報により昇順あるいは降順に並べる方法などが考えられる。1フレーム目の表示処理を終えると、次のフレーム位置情報の有無の判定(S1003)を行った後、2フレーム目の表示処理に移行する。こうして、1フレーム目の時と同様にして、2フレーム目と3フレーム目の動画のフレーム位置情報を利用した表示処理を行う。3フレーム目の表示処理を終えると、次のフレーム位置情報の有無の判定(S1003)にて、次のフレーム位置情報がこれ以上ないため、次のファイルの有無の判定(S1004)を行った後、次のファイルであるP1000002.jpgの表示処理に移行する。   00001. mts is a moving image file and a clip information file 00001. Since the frame position information is recorded in cpi, after the determination in S1001, a frame image related to the reproduction position information recorded in this information is displayed as a representative image on the display means 204. A display process (S1002) using the frame position information of the moving image is performed. 00001. When frame position information of a plurality of frames is recorded as in cpi, the frame position information is rearranged and used in a younger order. As the rearrangement order, a method of arranging in ascending order or descending order according to the management number of the frame position information, a method of arranging in ascending order or descending order according to the reproduction position information, and the like can be considered. When the display process for the first frame is completed, the presence / absence of the next frame position information is determined (S1003), and then the process proceeds to the display process for the second frame. In this way, display processing using the frame position information of the moving images of the second and third frames is performed in the same manner as in the case of the first frame. After the display processing of the third frame is completed, since there is no more next frame position information in the next frame position information determination (S1003), the next file presence determination (S1004) is performed. , The next file is P1000002. The process proceeds to jpg display processing.

P100002.jpgは静止画ファイルであるため、表示手段204に対して静止画ファイルに基づく画像のスライドショー表示処理(S1006)を行い、並べ替え順序における次のファイルの有無の判定(S1004)を行った後、次のファイルである00002.mtsの表示処理に移行する。   P100002. Since jpg is a still image file, a slide show display process of images based on the still image file is performed on the display means 204 (S1006), and the presence / absence of the next file in the rearrangement order is determined (S1004). The next file is 00002. The process shifts to mts display processing.

00002.mtsは、00000.mtsと同様に、フレーム位置情報を持たない動画ファイルであるため、フレーム位置情報を利用しない場合と同様の通常の表示処理(S1005)を行う。表示処理を終えると、次のファイルの有無の判定(S1004)にて、次のファイルがこれ以上ないため、終了処理に移行する。   00002. mts is 00000. Similar to mts, since the movie file does not have frame position information, normal display processing (S1005) similar to the case where frame position information is not used is performed. When the display process is finished, in the determination of the presence / absence of the next file (S1004), since there is no more next file, the process proceeds to the end process.

フレーム位置情報は、動画再生の際に動画内の人物などの顔に関する情報が変化したシーンに関する情報を含んでいる。そのため、このような再生方法を行うことにより、動画内の人物などの顔に関する情報に有意な変化が生じたシーンを抽出して表示することができる。一例として、本発明におけるフレーム位置情報を利用したスライドショー再生ついて説明したが、この限りでなく、動画ファイルの代表画像を並べて表示するマルチサムネイル再生の際などにも有用である。一例として、図13は、フレーム位置情報を利用したマルチサムネイル再生で表示される代表画像を示す図である。図12に示した複数の静止画像及び動画の代表画像のサムネイルが1つの画面に複数並べて表示される。   The frame position information includes information related to a scene in which information related to a face such as a person in the moving image is changed during moving image reproduction. Therefore, by performing such a reproduction method, it is possible to extract and display a scene in which a significant change has occurred in information related to a face such as a person in a moving image. As an example, the slide show reproduction using the frame position information in the present invention has been described. However, the present invention is not limited to this, and is useful for multi-thumbnail reproduction in which representative images of moving image files are displayed side by side. As an example, FIG. 13 is a diagram illustrating a representative image displayed in multi-thumbnail playback using frame position information. A plurality of thumbnails of still images and moving image representative images shown in FIG. 12 are displayed side by side on one screen.

また、動画ファイルの編集を行う際のシーン検出などに利用することも可能である。なお、被写体識別や表情変化検出によって得られた情報を参照することで、動画ファイル内のシーンを登場人物ごとにカテゴリ分類したり、特定の人物が笑顔になったときを検出するといった利用方法も可能である。したがって、本発明の利用により、利便性の向上した撮像装置、再生装置、および再生プログラムを提供することができる。   It can also be used for scene detection when editing a moving image file. In addition, by referring to information obtained by subject identification and facial expression change detection, there are also usage methods such as categorizing scenes in a video file for each character or detecting when a specific person smiles Is possible. Therefore, by using the present invention, an imaging device, a playback device, and a playback program with improved convenience can be provided.

なお、近時の顔検出手段は、犬や猫などの動物の顔を検出することができる。そのような機能を備えた顔検出手段を採用すれば、人物の顔のみならず動物の顔についても、実施の形態において説明したと同様の効果を奏することができる。   The recent face detection means can detect the faces of animals such as dogs and cats. If the face detection means having such a function is employed, the same effects as described in the embodiment can be achieved not only for the face of a person but also for the face of an animal.

本発明によれば、動画内の人物などの顔に関する情報が変化したシーンを検出し、代表画像として選択することができるため、動画の撮像手段と顔検出手段を有する撮像装置、たとえばデジタルカメラやデジタルビデオカメラに適用して有用である。また、動画の表示手段と顔検出手段を有する再生装置、たとえばテレビやパーソナルコンピュータに使用する再生プログラムに適用して有用である。   According to the present invention, a scene in which information about a face such as a person in a moving image is changed can be detected and selected as a representative image. Therefore, an imaging device having a moving image capturing unit and a face detecting unit, such as a digital camera, It is useful when applied to digital video cameras. Further, the present invention is useful when applied to a playback apparatus having a moving image display means and a face detection means, for example, a playback program used for a television or a personal computer.

100 デジタルカメラ
101 撮像光学系
102 フラッシュ
103 シャッターボタン
104 液晶モニター
105 モードダイヤル
106 各種操作ボタン
106a 上下左右ボタン
106b メニュー/決定ボタン
106c 表示切替ボタン
106d 削除ボタン
108 スロット
201 撮像手段
202 制御手段
203 表示制御手段
204 表示手段
205 信号処理手段
206 記録制御手段
207 顔検出手段
211 操作手段
212 記録媒体
DESCRIPTION OF SYMBOLS 100 Digital camera 101 Imaging optical system 102 Flash 103 Shutter button 104 Liquid crystal monitor 105 Mode dial 106 Various operation buttons 106a Up / down / left / right button 106b Menu / decision button 106c Display switching button 106d Delete button 108 Slot 201 Imaging means 202 Control means 203 Display control means 204 Display means 205 Signal processing means 206 Recording control means 207 Face detection means 211 Operation means 212 Recording medium

Claims (16)

複数のフレームから構成される動画データを生成する撮像手段と、
前記フレームに基づく画像を表示する表示手段と、
前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、
前記変化点に対応するフレームに関する情報を記録する記録手段と、
前記動画データの再生を指示する指示手段と、
前記指示手段によって前記動画データの再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、
を備える、
ことを特徴とする撮像装置。
Imaging means for generating moving image data composed of a plurality of frames;
Display means for displaying an image based on the frame;
Face detection means for detecting a change point related to a human face included in the moving image data;
Recording means for recording information about a frame corresponding to the change point;
Instruction means for instructing reproduction of the video data;
When the instruction unit is instructed to reproduce the moving image data, the change point among a plurality of frames constituting the moving image data is based on information about the frame corresponding to the change point recorded in the recording unit. Control means for causing the display means to display an image based on a frame corresponding to
Comprising
An imaging apparatus characterized by that.
前記変化点は、
前記動画データに人間の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項1に記載の撮像装置。
The change point is
It is a change point from a state in which the human face is not included in the moving image data to a state in which it is included.
The imaging apparatus according to claim 1.
前記変化点は、
前記動画データに含まれる人間の顔の表情の変化点である、
ことを特徴とする請求項1に記載の撮像装置。
The change point is
It is a change point of the facial expression of the human face included in the video data.
The imaging apparatus according to claim 1.
前記変化点は、
前記動画データに特定の人物の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項1に記載の撮像装置。
The change point is
It is a change point from a state where a face of a specific person is not included in the moving image data to a state where it is included.
The imaging apparatus according to claim 1.
前記顔検出手段は、
前記動画データに含まれる動物の顔に関する変化点を検出する、
ことを特徴とする請求項1に記載の撮像装置。
The face detection means includes
Detecting a change point related to the face of the animal included in the video data;
The imaging apparatus according to claim 1.
複数のフレームから構成される動画データを再生する再生手段と、
前記フレームに基づく画像を表示する表示手段と、
前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、
前記変化点に対応するフレームに関する情報を記録する記録手段と、
前記動画データの再生を指示する指示手段と、
前記指示手段によって前記動画データの再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、
を備える、
ことを特徴とする再生装置。
Playback means for playing back video data composed of a plurality of frames;
Display means for displaying an image based on the frame;
Face detection means for detecting a change point related to a human face included in the moving image data;
Recording means for recording information about a frame corresponding to the change point;
Instruction means for instructing reproduction of the video data;
When the instruction unit is instructed to reproduce the moving image data, the change point among a plurality of frames constituting the moving image data is based on information about the frame corresponding to the change point recorded in the recording unit. Control means for causing the display means to display an image based on a frame corresponding to
Comprising
A reproducing apparatus characterized by that.
複数のフレームから構成される動画データを再生する再生手段と、
前記フレームに基づく画像信号を出力する出力手段と、
前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、
前記変化点に対応するフレームに関する情報を記録する記録手段と、
前記動画データの再生を指示する指示手段と、
前記指示手段によって前記動画データの再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記出力手段に出力させる制御手段と、
を備える、
ことを特徴とする再生装置。
Playback means for playing back video data composed of a plurality of frames;
Output means for outputting an image signal based on the frame;
Face detection means for detecting a change point related to a human face included in the moving image data;
Recording means for recording information about a frame corresponding to the change point;
Instruction means for instructing reproduction of the video data;
When the instruction unit is instructed to reproduce the moving image data, the change point among a plurality of frames constituting the moving image data is based on information about the frame corresponding to the change point recorded in the recording unit. Control means for causing the output means to output an image based on a frame corresponding to
Comprising
A reproducing apparatus characterized by that.
前記変化点は、
前記動画データに人間の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項6または請求項7に記載の再生装置。
The change point is
It is a change point from a state in which the human face is not included in the moving image data to a state in which it is included.
The reproducing apparatus according to claim 6 or 7, characterized by the above.
前記変化点は、
前記動画データに含まれる人間の顔の表情の変化点である、
ことを特徴とする請求項6または請求項7に記載の再生装置。
The change point is
It is a change point of the facial expression of the human face included in the video data.
The reproducing apparatus according to claim 6 or 7, characterized by the above.
前記変化点は、
前記動画データに特定の人物の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項6または請求項7に記載の再生装置。
The change point is
It is a change point from a state where a face of a specific person is not included in the moving image data to a state where it is included.
The reproducing apparatus according to claim 6 or 7, characterized by the above.
前記顔検出手段は、
前記動画データに含まれる動物の顔に関する変化点を検出する、
ことを特徴とする請求項6または請求項7に記載の再生装置。
The face detection means includes
Detecting a change point related to the face of the animal included in the video data;
The reproducing apparatus according to claim 6 or 7, characterized by the above.
電子計算機を、
複数のフレームから構成される動画データを再生する再生手段と、
前記フレームに基づく画像を表示する表示手段と、
前記動画データに含まれる人間の顔に関する変化点を検出する顔検出手段と、
前記変化点に対応するフレームに関する情報を記録する記録手段と、
前記動画データの再生を指示する指示手段と、
前記指示手段によって前記動画データの再生が指示されたときに、前記記録手段に記録された前記変化点に対応するフレームに関する情報に基づいて、前記動画データを構成する複数のフレームのうち前記変化点に対応するフレームに基づく画像を前記表示手段に表示させる制御手段と、
して動作させる、
ことを特徴とする再生プログラム。
Electronic calculator
Playback means for playing back video data composed of a plurality of frames;
Display means for displaying an image based on the frame;
Face detection means for detecting a change point related to a human face included in the moving image data;
Recording means for recording information about a frame corresponding to the change point;
Instruction means for instructing reproduction of the video data;
When the instruction unit is instructed to reproduce the moving image data, the change point among a plurality of frames constituting the moving image data is based on information about the frame corresponding to the change point recorded in the recording unit. Control means for causing the display means to display an image based on a frame corresponding to
Make it work,
A reproduction program characterized by that.
前記変化点は、
前記動画データに人間の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項12に記載の再生プログラム。
The change point is
It is a change point from a state in which the human face is not included in the moving image data to a state in which it is included.
The reproduction program according to claim 12, wherein:
前記変化点は、
前記動画データに含まれる人間の顔の表情の変化点である、
ことを特徴とする請求項12に記載の再生プログラム。
The change point is
It is a change point of the facial expression of the human face included in the video data.
The reproduction program according to claim 12, wherein:
前記変化点は、
前記動画データに特定の人物の顔が含まれない状態から含まれる状態への変化点である、
ことを特徴とする請求項12に記載の再生プログラム。
The change point is
It is a change point from a state where a face of a specific person is not included in the moving image data to a state where it is included.
The reproduction program according to claim 12, wherein:
前記顔検出手段は、
前記動画データに含まれる動物の顔に関する変化点を検出する、
ことを特徴とする請求項12に記載の再生プログラム。
The face detection means includes
Detecting a change point related to the face of the animal included in the video data;
The reproduction program according to claim 12, wherein:
JP2010103308A 2010-04-28 2010-04-28 Imaging apparatus, reproducing device, and reproduction program Pending JP2011234180A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010103308A JP2011234180A (en) 2010-04-28 2010-04-28 Imaging apparatus, reproducing device, and reproduction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010103308A JP2011234180A (en) 2010-04-28 2010-04-28 Imaging apparatus, reproducing device, and reproduction program

Publications (1)

Publication Number Publication Date
JP2011234180A true JP2011234180A (en) 2011-11-17

Family

ID=45323038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010103308A Pending JP2011234180A (en) 2010-04-28 2010-04-28 Imaging apparatus, reproducing device, and reproduction program

Country Status (1)

Country Link
JP (1) JP2011234180A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140048407A (en) * 2012-10-12 2014-04-24 삼성전자주식회사 Apparatus and method for processing a image of camera device and terminal equipment having a camera
JP2018502340A (en) * 2015-12-01 2018-01-25 小米科技有限責任公司Xiaomi Inc. Video classification method and apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140048407A (en) * 2012-10-12 2014-04-24 삼성전자주식회사 Apparatus and method for processing a image of camera device and terminal equipment having a camera
KR101953614B1 (en) * 2012-10-12 2019-05-22 삼성전자주식회사 Apparatus and method for processing a image of camera device and terminal equipment having a camera
JP2018502340A (en) * 2015-12-01 2018-01-25 小米科技有限責任公司Xiaomi Inc. Video classification method and apparatus
US10115019B2 (en) 2015-12-01 2018-10-30 Xiaomi Inc. Video categorization method and apparatus, and storage medium

Similar Documents

Publication Publication Date Title
KR101436639B1 (en) Information processing apparatus, imaging apparatus, image display control method and recording medium
JP5528008B2 (en) Playback apparatus and playback method
KR20080084725A (en) Image processing apparatus, imaging apparatus, image display control method and computer program
JP2006197428A (en) Imaging apparatus, and recording method, and processing apparatus and method for photographed image data
JP2011070687A (en) System, method and program for recording data
EP1347455A2 (en) Contents recording/playback apparatus and contents edit method
JP4506832B2 (en) Image processing apparatus, index generation apparatus, imaging apparatus, index generation method, and program
KR101319544B1 (en) Photographing apparatus for detecting appearance of person and method thereof
US8818165B2 (en) Data processing apparatus, data processing method, and computer program
JP2012085000A (en) Image reproducing device, image recording device, and image recording and reproducing system
JP2007166501A (en) Image recording apparatus, image recording and reproducing method, program and computer readable storage medium
US8531575B2 (en) Image production device, image production method, and program for driving computer to execute image production method
JP2005260749A (en) Electronic camera and control program thereof
JP2011234180A (en) Imaging apparatus, reproducing device, and reproduction program
US8379109B2 (en) Image processing apparatus
JP2012044451A (en) Image reproduction device, control method therefor, image reproduction program, and recording medium
JP4698961B2 (en) Electronic camera and electronic camera control program
JP5769434B2 (en) Movie recording device, information processing device
JP5575494B2 (en) Imaging device, recording device, file management device, display device, and file management program
JP2007200409A (en) Image pickup device, recording device, and recording method
JP2006217060A (en) Recording apparatus, recording and reproducing apparatus, recording method, and recording and reproducing method
JP3780252B2 (en) Recording / reproducing apparatus and recording / reproducing method
JP2012156588A (en) Moving image recorder
US10410674B2 (en) Imaging apparatus and control method for combining related video images with different frame rates
JP2005339645A (en) Recording and reproducing device, its recording and reproducing method, program and recording medium