JP4835545B2 - Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program - Google Patents

Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program Download PDF

Info

Publication number
JP4835545B2
JP4835545B2 JP2007217875A JP2007217875A JP4835545B2 JP 4835545 B2 JP4835545 B2 JP 4835545B2 JP 2007217875 A JP2007217875 A JP 2007217875A JP 2007217875 A JP2007217875 A JP 2007217875A JP 4835545 B2 JP4835545 B2 JP 4835545B2
Authority
JP
Japan
Prior art keywords
image
face
display
unit
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007217875A
Other languages
Japanese (ja)
Other versions
JP2009055156A (en
Inventor
武史 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007217875A priority Critical patent/JP4835545B2/en
Publication of JP2009055156A publication Critical patent/JP2009055156A/en
Application granted granted Critical
Publication of JP4835545B2 publication Critical patent/JP4835545B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、画像再生装置、撮像装置、および画像再生方法、並びにコンピュータ・プログラムに関する。さらに詳細には、動画像データの早送りや巻き戻し処理において人物の顔を検出し、検出した顔情報の表示処理を実行する画像再生装置、撮像装置、および画像再生方法、並びにコンピュータ・プログラムに関する。   The present invention relates to an image reproduction device, an imaging device, an image reproduction method, and a computer program. More specifically, the present invention relates to an image reproduction device, an imaging device, an image reproduction method, and a computer program that detect a human face in fast-forwarding or rewinding processing of moving image data and executing display processing of the detected face information.

昨今、動画像データの記録メディアとしてDVDやハードディスク(HD)などの大容量のメディアが利用されている。DVDやハードディスク(HD)は、例えばビデオカメラやTV放送などの記録メディアとして利用されている。   Recently, large-capacity media such as DVDs and hard disks (HD) are used as moving image data recording media. DVDs and hard disks (HD) are used as recording media such as video cameras and TV broadcasts.

このようなメディアに記録される動画像データは、多くの場合、例えばMPEG圧縮など、所定の圧縮アルゴリズムに従った圧縮(符号化)処理がなされて記録される。再生時には復号処理を行って表示部に表示されることになる。すなわち、このようなメディアを利用したデータ記録再生機器にはデータの圧縮処理(エンコード)および復号処理(デコード)を実行するコーデックが備えられている。なお、再生専用機器には、復号処理のみを実行するデコーダが備えられる。   In many cases, moving image data recorded on such media is recorded after being compressed (encoded) in accordance with a predetermined compression algorithm such as MPEG compression. At the time of reproduction, a decoding process is performed and displayed on the display unit. That is, a data recording / reproducing device using such a medium is provided with a codec that performs data compression processing (encoding) and decoding processing (decoding). Note that the reproduction-only device includes a decoder that executes only the decoding process.

一般的なDVDプレーヤーやHDレコーダー等、動画コンテンツを再生する機器において、早送り再生処理や、巻き戻し再生処理を実行する場合、1秒間に1,2枚の画像を復号して再生表示する構成となっている。なお、DVDの再生、サーチ、スキャン処理を開示した従来技術として例えば特許文献1(特開2006−269066号公報)がある。   In a device that reproduces moving image content, such as a general DVD player or HD recorder, when fast-forward playback processing or rewind playback processing is executed, one or two images are decoded and reproduced and displayed per second. It has become. For example, Japanese Patent Laid-Open No. 2006-269066 discloses a conventional technique that discloses DVD playback, search, and scan processing.

すなわち、一般的なDVDプレーヤーやHDレコーダーに記録されたデータの早送り再生処理や、巻き戻し再生処理を行う場合は、時間的に離散した飛び飛びの画像表示が行われる。   That is, when performing fast forward playback processing and rewind playback processing of data recorded on a general DVD player or HD recorder, temporally discrete image display is performed.

このような時間的に間隔を空けた画像表示を行うのは、画像の復号処理を行うデコーダの性能の制約が1つの要因であるが、早送りや巻き戻し再生画像を、例えば30フレーム/秒等の高フレームレートで表示しても画像表示がめまぐるしく変わり、ユーザが視覚的に認識できず不快に感じるという理由もある。   Such a time-spaced image display is caused by a limitation in the performance of a decoder that performs image decoding processing, but fast-forward and rewind playback images, for example, 30 frames / second, etc. Even when the image is displayed at a high frame rate, the image display changes rapidly, and there is also a reason that the user feels uncomfortable because it cannot be visually recognized.

しかし一方で、1秒間に1、2フレームだけの離散的表示を行うと以下のような問題が発生する。
(a)画像表示されるサンプリング数が少ないため、希望するシーンの頭出しをしにくい
(b)早送りや巻き戻しの速度を実感しにくいため早送り/巻き戻し速度を調整しにくく、希望するシーンまですばやく移動できない
これらの使用上の不便が発生する。
特開2006−269066号公報
On the other hand, however, the following problems occur when discrete display of only one or two frames per second is performed.
(A) Because the number of displayed images is small, it is difficult to cue the desired scene. (B) It is difficult to adjust the fast-forward / rewind speed because it is difficult to feel the fast-forward / rewind speed. Inability to move quickly These inconveniences occur.
JP 2006-269066 A

本発明は、上述の問題点に鑑みてなされたものであり、動画像の早送り再生や巻き戻し再生などの特殊再生処理を実行する際に、画像中に含まれる顔領域を判別し、動画像の早送り再生や巻き戻し再生画像に併せて検出された顔画像の静止画を表示することで、ユーザの希望するシーンの確認を容易にすることを可能とした画像再生装置、撮像装置、および画像再生方法、並びにコンピュータ・プログラムを提供することを目的とする。   The present invention has been made in view of the above-described problems. When executing special playback processing such as fast-forward playback and rewind playback of a moving image, the present invention determines a face area included in the image, and An image reproducing device, an imaging device, and an image that can facilitate confirmation of a scene desired by a user by displaying still images of face images detected together with fast-forward playback and rewind playback images It is an object to provide a reproduction method and a computer program.

本発明の第1の側面は、
動画像データの再生処理を実行する画像再生装置であり、
動画像データを構成する画像フレームから顔領域の検出を実行する顔検出部と、
前記顔検出部の検出した顔のスコアを算出するショットスコア算出部と、
前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択部と、
前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御部と、
前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示部と、
を有することを特徴とする画像再生装置にある。
The first aspect of the present invention is:
An image playback device that executes playback processing of moving image data,
A face detection unit for detecting a face area from image frames constituting moving image data;
A shot score calculation unit for calculating a score of the face detected by the face detection unit;
A best shot image selection unit that selects a face image with a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image control unit that executes control for displaying the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward reproduction image or the rewind reproduction image of the moving image data;
Under the control of the display image control unit, a display unit that displays a fast-forward reproduction image or a rewind reproduction image of moving image data, and a best shot image,
An image reproducing apparatus having the above.

さらに、本発明の画像再生装置の一実施態様において、前記ショットスコア算出部は、前記顔検出部の検出した顔の各々について、顔の方向に応じた顔方向スコアと、顔らしさを示す顔検出スコアとの少なくともいずれかをサブスコアとして算出し、算出したサブスコアに基づいて総合スコアとしてのショットスコアの算出処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the image reproduction device of the present invention, the shot score calculation unit, for each of the faces detected by the face detection unit, a face direction score corresponding to the direction of the face, and a face detection indicating the face-likeness At least one of the scores is calculated as a sub-score, and a shot score calculation process as a total score is executed based on the calculated sub-score.

さらに、本発明の画像再生装置の一実施態様において、前記ショットスコア算出部は、前記サブスコアの各々に対応する重みを設定し、サブスコアの重み付け和を総合スコアとしてのショットスコアとして算出する構成であることを特徴とする。   Furthermore, in an embodiment of the image reproduction device of the present invention, the shot score calculation unit sets a weight corresponding to each of the subscores, and calculates a weighted sum of the subscores as a shot score as a total score. It is characterized by that.

さらに、本発明の画像再生装置の一実施態様において、前記表示画像制御部は、前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像中の顔領域に貼り付けて表示部に表示する制御を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the image reproduction device of the present invention, the display image control unit pastes the best shot image on a face area in a fast-forward reproduction image or a rewind reproduction image of the moving image data. It is the structure which performs the control displayed on this.

さらに、本発明の画像再生装置の一実施態様において、前記表示画像制御部は、前記表示部に表示する前記ベストショット画像の移動速度を予め設定した上限速度以下になるように表示制御を行う構成であることを特徴とする。   Furthermore, in one embodiment of the image reproducing device of the present invention, the display image control unit performs display control so that a moving speed of the best shot image displayed on the display unit is equal to or lower than a preset upper limit speed. It is characterized by being.

さらに、本発明の画像再生装置の一実施態様において、前記表示画像制御部は、前記表示部に表示する動画像データの早送り再生画像または巻き戻し再生画像の輝度レベルまたはコントラスト制御を実行して輝度レベルの変化を抑制した表示制御を行う構成であることを特徴とする。   Furthermore, in one embodiment of the image reproduction device of the present invention, the display image control unit executes luminance level or contrast control of a fast-forward reproduction image or a rewind reproduction image of moving image data displayed on the display unit to perform luminance It is characterized in that the display control is performed while suppressing the level change.

さらに、本発明の画像再生装置の一実施態様において、前記表示画像制御部は、前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像の表示領域と別領域に表示する制御を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the image reproduction device of the present invention, the display image control unit controls the best shot image to be displayed in a region different from a display region of the fast-forward reproduction image or the rewind reproduction image of the moving image data. It is the structure which performs.

さらに、本発明の画像再生装置の一実施態様において、前記顔検出部は、動画像データを構成する画像フレームから顔領域の検出を実行するとともに、検出した顔の識別を実行する構成であり、前記表示画像制御部は、前記顔検出部の検出した顔識別情報を表示部に表示するベストショット画像に併せて表示する制御を行う構成であることを特徴とする。   Furthermore, in one embodiment of the image reproduction device of the present invention, the face detection unit is configured to detect a face area from an image frame constituting moving image data and to identify the detected face. The display image control unit is configured to control to display the face identification information detected by the face detection unit together with the best shot image displayed on the display unit.

さらに、本発明の第2の側面は、
動画像データの記録および再生処理を実行する撮像装置であり、
撮像部から入力する動画像データを構成する画像フレームから顔領域の検出を実行する顔検出部と、
前記顔検出部の顔領域検出情報を、動画像データに対応するタグ情報として、動画像データに併せて記録メディアに記録するデータ記録部と、
前記データ記録部に記録された動画像データの再生時に前記タグ情報を利用して、顔領域を検出して、検出した顔のスコアを算出するショットスコア算出部と、
前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択部と、
前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御部と、
前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示部と、
を有することを特徴とする撮像装置にある。
Furthermore, the second aspect of the present invention provides
An imaging device that performs recording and playback processing of moving image data,
A face detection unit for detecting a face area from image frames constituting moving image data input from an imaging unit;
A data recording unit that records the face area detection information of the face detection unit as tag information corresponding to the moving image data on a recording medium together with the moving image data;
A shot score calculation unit that detects a face region using the tag information when reproducing moving image data recorded in the data recording unit, and calculates a score of the detected face;
A best shot image selection unit that selects a face image with a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image control unit that executes control for displaying the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward reproduction image or the rewind reproduction image of the moving image data;
Under the control of the display image control unit, a display unit that displays a fast-forward reproduction image or a rewind reproduction image of moving image data, and a best shot image,
There exists in an imaging device characterized by having.

さらに、本発明の第3の側面は、
動画像データの再生処理を実行する画像再生装置における画像再生方法であり、
顔検出部が、動画像データを構成する画像フレームから顔領域の検出を実行する顔検出ステップと、
ショットスコア算出部が、前記顔検出部の検出した顔のスコアを算出するショットスコア算出ステップと、
ベストショット画像選択部が、前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択ステップと、
表示画像制御部が、前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御ステップと、
表示部が、前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示ステップと、
を有することを特徴とする画像再生方法にある。
Furthermore, the third aspect of the present invention provides
An image reproduction method in an image reproduction apparatus that performs reproduction processing of moving image data,
A face detection step in which a face detection unit executes detection of a face region from image frames constituting moving image data;
A shot score calculating unit that calculates a score of the face detected by the face detecting unit;
The best shot image selection unit selects a face image having a high score calculated by the shot score calculation unit as a best shot image, and selects from each preset image frame section; and
A display image in which a display image control unit executes control to display the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward playback image or the rewind playback image of the moving image data. Control steps;
A display step for displaying a fast-shot playback image or a rewind playback image of the moving image data together with a best shot image under the control of the display image control unit;
An image reproduction method characterized by comprising:

さらに、本発明の画像再生方法の一実施態様において、前記ショットスコア算出ステップは、前記顔検出部の検出した顔の各々について、顔の方向に応じた顔方向スコアと、顔らしさを示す顔検出スコアとの少なくともいずれかをサブスコアとして算出し、算出したサブスコアに基づいて総合スコアとしてのショットスコアの算出処理を実行するステップであることを特徴とする。   Furthermore, in an embodiment of the image reproduction method of the present invention, the shot score calculation step includes a face direction score corresponding to the face direction and a face detection indicating the face-likeness for each of the faces detected by the face detection unit. In this step, at least one of the score is calculated as a sub-score, and a shot score calculation process as a total score is executed based on the calculated sub-score.

さらに、本発明の画像再生方法の一実施態様において、前記ショットスコア算出ステップは、前記サブスコアの各々に対応する重みを設定し、サブスコアの重み付け和を総合スコアとしてのショットスコアとして算出するステップであることを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the shot score calculating step is a step of setting a weight corresponding to each of the sub-scores and calculating a weighted sum of the sub-scores as a shot score as a total score. It is characterized by that.

さらに、本発明の画像再生方法の一実施態様において、前記表示画像制御ステップは、前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像中の顔領域に貼り付けて表示部に表示する制御を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the display image control step includes a step of pasting the best shot image on a face area in a fast-forward reproduction image or a rewind reproduction image of the moving image data. It is the step which performs the control displayed on this.

さらに、本発明の画像再生方法の一実施態様において、前記表示画像制御ステップは、前記表示部に表示する前記ベストショット画像の移動速度を予め設定した上限速度以下になるように表示制御を行うステップであることを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the display image control step performs display control so that a moving speed of the best shot image displayed on the display unit is equal to or lower than a preset upper limit speed. It is characterized by being.

さらに、本発明の画像再生方法の一実施態様において、前記表示画像制御ステップは、前記表示部に表示する動画像データの早送り再生画像または巻き戻し再生画像の輝度レベルまたはコントラスト制御を実行して輝度レベルの変化を抑制した表示制御を行うステップであることを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the display image control step executes luminance level or contrast control of a fast-forward reproduction image or a rewind reproduction image of moving image data displayed on the display unit to perform luminance control. It is a step of performing display control in which a change in level is suppressed.

さらに、本発明の画像再生方法の一実施態様において、前記表示画像制御ステップは、前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像の表示領域と別領域に表示する制御を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the display image control step is a control for displaying the best shot image in a separate area from the display area of the fast-forward reproduction image or the rewind reproduction image of the moving image data. It is the step which performs.

さらに、本発明の画像再生方法の一実施態様において、前記顔検出ステップは、動画像データを構成する画像フレームから顔領域の検出を実行するとともに、検出した顔の識別を実行するステップであり、前記表示画像制御ステップは、前記顔検出ステップにおいて検出した顔識別情報を表示部に表示するベストショット画像に併せて表示する制御を行うことを特徴とする。   Furthermore, in one embodiment of the image reproduction method of the present invention, the face detection step is a step of performing detection of a face region from an image frame constituting moving image data and identifying the detected face. In the display image control step, the face identification information detected in the face detection step is controlled to be displayed together with the best shot image displayed on the display unit.

さらに、本発明の第4の側面は、
画像再生装置において、動画像データの再生処理を実行させるコンピュータ・プログラムであり、
顔検出部に、動画像データを構成する画像フレームから顔領域の検出を実行させる顔検出ステップと、
ショットスコア算出部に、前記顔検出部の検出した顔のスコアを算出させるショットスコア算出ステップと、
ベストショット画像選択部に、前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択させるベストショット画像選択ステップと、
表示画像制御部に、前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行させる表示画像制御ステップと、
表示部に、前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示させる表示ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
Furthermore, the fourth aspect of the present invention provides
In the image reproduction device, a computer program for executing reproduction processing of moving image data,
A face detection step for causing the face detection unit to detect a face area from image frames constituting moving image data;
A shot score calculation step for causing the shot score calculation unit to calculate the score of the face detected by the face detection unit;
A best shot image selection step for causing the best shot image selection unit to select a face image having a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image that causes the display image control unit to execute control to display the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward playback image or the rewind playback image of the moving image data. Control steps;
Under the control of the display image control unit on the display unit, a display step of displaying a fast-forward reproduction image or a rewind reproduction image of the moving image data and a best shot image, and
There is a computer program characterized by comprising:

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能な汎用コンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータ・システム上でプログラムに応じた処理が実現される。   The computer program of the present invention is, for example, a computer program that can be provided by a storage medium or a communication medium provided in a computer-readable format to a general-purpose computer system that can execute various program codes. . By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の一実施例の構成によれば、動画像データを構成する画像フレームから顔領域の検出を実行し、検出した顔のスコアを算出して、スコアの高い顔画像をベストショット画像として予め設定した画像フレーム区間各々から選択し、動画像データの早送り再生画像または巻き戻し再生画像の顔領域部分、あるいは別領域に表示する構成とした。本構成によれば、ユーザの注目が集まりやすい人物の顔画像が、予め定められたフレーム区間(例えば300フレーム)に1つの静止画として表示されることになり、視聴者が容易に人物を特定することが可能であり、その人物の登場するシーンの把握も容易に行うことが可能となる。   According to the configuration of one embodiment of the present invention, face area detection is performed from image frames constituting moving image data, a score of the detected face is calculated, and a face image with a high score is preliminarily set as a best shot image. Each of the set image frame sections is selected and displayed in the face area portion or another area of the fast-forward playback image or the rewind playback image of the moving image data. According to this configuration, a face image of a person that is likely to attract the user's attention is displayed as one still image in a predetermined frame section (for example, 300 frames), and the viewer can easily identify the person. The scene in which the person appears can be easily grasped.

以下、図面を参照しながら本発明の実施形態に係る画像再生装置、撮像装置、および画像再生方法、並びにコンピュータ・プログラムの詳細について説明する。   Hereinafter, the details of an image playback device, an imaging device, an image playback method, and a computer program according to embodiments of the present invention will be described with reference to the drawings.

本発明の一実施例に係る画像再生装置の機能構成図を図1に示す。本発明の画像再生装置100は、図1に示すように、画像入力部101、顔検出部102、ショットスコア算出部103、ベストショット画像選択部104、表示画像制御部105、画像表示部106を有する。   FIG. 1 shows a functional block diagram of an image reproduction apparatus according to an embodiment of the present invention. As shown in FIG. 1, the image reproduction apparatus 100 of the present invention includes an image input unit 101, a face detection unit 102, a shot score calculation unit 103, a best shot image selection unit 104, a display image control unit 105, and an image display unit 106. Have.

画像入力部101は、例えばDVDやHDなどの記録メディアに記録された復号された動画像データを入力する。画像入力部101の前段には、画像復号処理を実行するデコーダがあり、画像入力部101はデコーダを介して復号された動画像データを入力する。   The image input unit 101 inputs the decoded moving image data recorded on a recording medium such as a DVD or HD. There is a decoder that executes an image decoding process in the preceding stage of the image input unit 101, and the image input unit 101 inputs the moving image data decoded through the decoder.

なお、本実施例では、画像再生装置100の画像表示部106に早送り再生画像または巻き戻し再生画像の表示を行う。すなわち通常再生レートより高速の再生レートでの画像表示を実行する。この高速レートの動画像データが画像入力部101に入力され、画像入力部101から表示画像制御部106および顔検出部102に供給される。   In this embodiment, a fast-forward playback image or a rewind playback image is displayed on the image display unit 106 of the image playback device 100. That is, image display is executed at a playback rate faster than the normal playback rate. The high-speed rate moving image data is input to the image input unit 101 and supplied from the image input unit 101 to the display image control unit 106 and the face detection unit 102.

顔検出部102は、入力動画像データを構成する各フレームにおいて顔検出を行い、検出結果をショットスコア算出部103に出力する。ショットスコア算出部103は、顔検出部102の検出した顔画像がユーザにとって見やすい画像であるかどうかを表す指標の「ショットスコア」を算出する。ショットスコアはその顔画像の向きや遮蔽具合などから算出され、早送り画像中にその人物の代表的画像として画面に貼り付ける画像の選択に用いる。ショットスコア算出部103の算出したショットスコア情報は、ベストショット画像選択部104に入力される。   The face detection unit 102 performs face detection in each frame constituting the input moving image data, and outputs the detection result to the shot score calculation unit 103. The shot score calculation unit 103 calculates a “shot score” that is an index indicating whether the face image detected by the face detection unit 102 is an image that is easy for the user to see. The shot score is calculated from the orientation of the face image, the degree of shielding, and the like, and is used for selecting an image to be pasted on the screen as a representative image of the person in the fast-forward image. The shot score information calculated by the shot score calculation unit 103 is input to the best shot image selection unit 104.

ベストショット画像選択部104は、ショットスコア算出部103の算出したショットスコア情報を利用して、画像表示部106に表示される画像から一定区間過去のフレーム(例えば過去300フレーム(通常再生時における約10秒間の画像フレーム等)において、最もショットスコアの高い顔画像をその人物のベストショットとして選択する処理を実行する。   Using the shot score information calculated by the shot score calculation unit 103, the best shot image selection unit 104 uses a past frame (for example, the past 300 frames (about about the time of normal playback) from the image displayed on the image display unit 106. In a 10-second image frame or the like, a process of selecting the face image with the highest shot score as the best shot of the person is executed.

表示画像制御部105は、画像入力部101から動画像データを入力し、画像表示部106に表示する早送り再生画像または巻き戻し再生画像の調整処理を行う。早送りや巻き戻し再生では、高レートの画像表示が行われることになるので通常再生時と同様の輝度レベルで表示を行うと、視聴者に光感受性発作を発生させる恐れがある。表示画像制御部105は、光感受性発作を起こさない程度に表示画像の輝度変化が十分小さくなるように背景画像のコントラストを下げるなどの表示画像の制御を実行する。すなわち、表示画像制御部105は、画像表示部106に表示する動画像データの早送り再生画像または巻き戻し再生画像の輝度レベルまたはコントラスト制御を実行して輝度レベルの変化を抑制した表示制御を行う。   The display image control unit 105 inputs moving image data from the image input unit 101 and performs adjustment processing of a fast-forward reproduction image or a rewind reproduction image displayed on the image display unit 106. In fast-forward and rewind playback, high-rate image display is performed. Therefore, if display is performed at the same luminance level as during normal playback, there is a risk of causing a photosensitive seizure to the viewer. The display image control unit 105 executes control of the display image such as lowering the contrast of the background image so that the change in luminance of the display image is sufficiently small to the extent that no photosensitive seizure occurs. That is, the display image control unit 105 performs display control in which the luminance level or contrast control of the fast-forward playback image or the rewind playback image of the moving image data displayed on the image display unit 106 is executed to suppress a change in the brightness level.

また、表示画像制御部105は、早送りまたは巻き戻し再生画像に、ベストショット選択部104の選択したベストショット顔の静止画像を、例えば、早送りまたは巻き戻し再生画像の顔領域部分に貼り付け、画像表示部106に出力して表示する。   In addition, the display image control unit 105 pastes the still image of the best shot face selected by the best shot selection unit 104 on the fast-forward or rewind playback image, for example, on the face area portion of the fast-forward or rewind playback image. The data is output and displayed on the display unit 106.

なお、ベストショット画像選択部104は、ショットスコア算出部103の算出したショットスコア情報を利用して、画像表示部106に表示される画像から一定区間過去のフレーム(例えば過去300フレーム(通常再生時における約10秒間の画像フレーム等)において、最もショットスコアの高い顔画像をその人物のベストショットとして選択する処理を実行するが、ベストショットを選択する区間を調整することで、登場人物に貼り付けられる顔画像の更新頻度を調整することが出来る。例えば、ベストショットを選択する区間を長くするとユーザにとっては静止画が張り付いているように見えるし、区間を短くすると動画が張り付いているように見える。   The best shot image selection unit 104 uses the shot score information calculated by the shot score calculation unit 103 to use a frame in the past of a certain section from the image displayed on the image display unit 106 (for example, the past 300 frames (during normal playback) In the image frame of about 10 seconds, etc.), the face image with the highest shot score is selected as the best shot of the person, but it is pasted to the character by adjusting the section for selecting the best shot. For example, if the interval for selecting the best shot is lengthened, it will appear to the user that a still image is stuck, and if the interval is shortened, the video will be stuck. Looks like.

なお、画像を貼り付ける位置に関しては、急激な位置変化があるとユーザが目で追いにくくなってしまうので、表示画像制御部105は、顔の位置変化速度[v]を、予め設定した閾値[vlimit]以下、すなわち、
v<vlimit
とする顔移動速度の制御を行う構成としてもよい。顔の位置変化速度[v]の制約の式の例を以下の(式1)に示す。
As for the position where the image is pasted, the display image control unit 105 sets the face position change speed [v] to a preset threshold [[ vlimit], ie,
v <vlimit
It is good also as a structure which controls control of the face moving speed to be. An example of a constraint equation for the face position change speed [v] is shown in the following (Formula 1).

・・・(式1)
上記式において、
,t:t<tを満足するフレーム時間、
x(t),y(t):時刻tにおける、xy画像平面中における顔位置のx座標データおよびy座標データ、
である。
... (Formula 1)
In the above formula,
t 1 , t 2 : frame time satisfying t 1 <t 2 ,
x (t), y (t): x-coordinate data and y-coordinate data of the face position in the xy image plane at time t,
It is.

なお、上記の顔の位置変化速度[v]の制約ほかに、顔の変化位置と時間におけるスプライン曲線の関係等の制約を用いて、顔の移動制御を行う構成としてもよい。   In addition to the restriction on the face position change speed [v], the face movement control may be performed using restrictions such as the relationship between the face change position and the spline curve in time.

図2に、画像表示部106に表示される早送り画像の画像例を示す。従来のアナログ記録式のVTRやテープ式のDVと比較して、HDDレコーダーやDVD、PCのデジタルコンテンツ再生アプリケーションは1画面のデジタルデータを完全に読み込むことが出来るため、早送り画像においてもノイズの無い綺麗な画像を読み込むことが出来る。そのため、早送り中の画像においても顔認識の処理を行うことが出来る。   FIG. 2 shows an example of a fast-forward image displayed on the image display unit 106. Compared to conventional analog recording type VTR and tape type DV, HDD recorder, DVD, and PC digital content playback application can read digital data of one screen completely, so there is no noise even in fast-forward images A beautiful image can be read. Therefore, face recognition processing can be performed even in an image being fast-forwarded.

一方、一般にドラマや映画、バラエティー番組などのコンテンツにおいてユーザが希望するシーンを選択するためには、大まかな背景と登場人物が分かればよい。しかし一般的には、登場人物は必ずしも正面を向いていないし明瞭には映っていないことがあるため、表示される画像のタイミングによってはユーザが登場人物の顔の識別をしにくいことがある。   On the other hand, in general, in order to select a scene desired by a user in contents such as a drama, a movie, and a variety program, it is only necessary to know a rough background and characters. However, in general, the characters are not always facing the front and may not be clearly visible, so that depending on the timing of the displayed image, it may be difficult for the user to identify the characters' faces.

また、現在の一般的なHDDレコーダーやDVDプレーヤーの早送り時の画面は、1秒間に1,2枚の画像を時間離散的に表示するものが主である。これは画像デコーダの性能の制約もあるが、早送り画像を30fpsのフルフレームで表示できたとしても画像表示がめまぐるしく変わり、ユーザが視覚的に認識できず不快に感じるという理由もある。   Moreover, the screen at the time of fast-forwarding of the present general HDD recorder or DVD player mainly displays one or two images per second in a time discrete manner. Although this is limited by the performance of the image decoder, even if a fast-forward image can be displayed at a full frame of 30 fps, the image display changes rapidly, and there is also a reason that the user cannot recognize visually and feels uncomfortable.

ここで、ユーザの注目が集まる登場人物の、顔部分の画像の位置変化とテクスチャ変化を十分小さくして見やすくし、顔以外の背景部分の輝度変化を光感受性発作対策レベルに小さくすることで、ユーザは大まかな背景情報を見ながら、登場人物を把握することが出来るようになる。これにより、早送り速度の調整や希望するシーンへの移動が容易になる。   Here, by making the position change and texture change of the image of the face part of the character that attracts the user's attention sufficiently small and easy to see, and by reducing the brightness change of the background part other than the face to the light-sensitive seizure countermeasure level, The user can grasp the characters while viewing the rough background information. This facilitates adjustment of the fast-forward speed and movement to a desired scene.

[ショットスコア計算]
ショットスコア算出部103におけるショットスコアの算出処理、すなわち、検出された顔画像から、表示画像に貼り付けるための代表的な顔画像を選択する処理の詳細について説明する。
[Shot score calculation]
Details of the shot score calculation process in the shot score calculation unit 103, that is, a process of selecting a representative face image to be pasted on the display image from the detected face image will be described.

図3に、顔検出部102において検出された顔画像およびスコア設定例を示す。図3に示す顔画像は以下のとおりである。
A:帽子によって顔に影がある顔画像
B:斜め右上を向いている顔画像
C:正面を向いている顔画像
D:左を向いている顔画像
FIG. 3 shows a face image and score setting example detected by the face detection unit 102. The face image shown in FIG. 3 is as follows.
A: Face image with a shadow on the face by a hat B: Face image facing diagonally upper right C: Face image facing front D: Face image facing left

また、これらの顔の各々について、[顔角度]、[顔方向スコア]、[顔検出スコア]、[ショットスコア]の設定例を示している。
[ショットスコア]は、表示画像に貼り付けるための代表的な顔画像を選択するために適用する総合スコアである。
[顔方向スコア]と、[顔検出スコア]は、総合スコアである[ショットスコア]を算出するために用いられるサブスコアである。
[顔角度]は、サブスコアとしての[顔方向スコア]の算出パラメータとして利用される。
以下、代表的な顔画像を選択するための指標となるショットスコアの計算方法について説明する。
In addition, for each of these faces, setting examples of [Face Angle], [Face Direction Score], [Face Detection Score], and [Shot Score] are shown.
[Shot Score] is a total score applied to select a representative face image to be pasted on the display image.
[Face Direction Score] and [Face Detection Score] are sub-scores used to calculate [Shot Score], which is an overall score.
[Face angle] is used as a calculation parameter of [Face direction score] as a sub-score.
Hereinafter, a method of calculating a shot score that serves as an index for selecting a representative face image will be described.

なお、以下に説明する例は、
(a)検出顔の方向に基づく顔方向スコア、
(b)検出顔の顔画像らしさに基づく顔検出スコア、
これら2種類のサブスコアを用いて総合スコアとしてのショットスコアを算出する例である。なお、このスコア算出例は一例であり、上記(a),(b)以外にも登場人物の顔の識別しやすさを表す指標があれば、ショットスコアの計算に参入する他のサブスコアを利用する設定としてもよい。以下、
(a)検出顔の方向に基づく顔方向スコア、
(b)検出顔の顔画像らしさに基づく顔検出スコア、
これらのサブスコアの算出処理の詳細について説明する。
The example described below is
(A) a face direction score based on the direction of the detected face;
(B) a face detection score based on the face image likeness of the detected face;
This is an example of calculating a shot score as an overall score using these two types of sub-scores. Note that this score calculation example is an example, and if there is an index indicating the ease of identification of the character's face other than the above (a) and (b), other sub-scores participating in the calculation of the shot score are used. It is good also as a setting to do. Less than,
(A) a face direction score based on the direction of the detected face;
(B) a face detection score based on the face image likeness of the detected face;
Details of the sub-score calculation processing will be described.

((a)顔方向スコア)
顔検出部102は、顔検出処理に際して、正面顔と横顔の判別を行う。例えば正面顔と横顔の学習データを保持し、検出された顔画像と学習データとを照合し、検出した顔画像が正面顔と横顔の判別を行う。なお、このような顔の検出とともに顔の方向を認識する技術については、例えば、以下の文献に開示された技術を適用することができる。
[佐部 浩太郎,日台 健一,"ピクセル差分特徴を用いた実時間任意姿勢顔検出器の学習",第10回画像センシングシンポジウム講演論文集,pp.547−552,2004]
((A) Face direction score)
The face detection unit 102 determines a front face and a side face during face detection processing. For example, the learning data of the front face and the side face is held, the detected face image and the learning data are collated, and the detected face image determines the front face and the side face. As a technique for recognizing the face direction together with such face detection, for example, the technique disclosed in the following document can be applied.
[Kotaro Sabe, Kenichi Hidai, "Learning a real-time arbitrary posture face detector using pixel difference features", Proceedings of the 10th Image Sensing Symposium, pp. 547-552, 2004]

この顔方向の認識技術を用い、検出された顔画像の方向を得て、顔の方向情報をショットスコア算出部103に出力する。ショットスコア算出部103は、顔検出部102から入力する顔方向角度情報を利用して顔方向スコアを算出する。正面に近い角度ほどユーザにとって顔の識別がしやすいため、高いスコアを割り当てる。Yaw方向の顔方向角度を用いた[顔方向スコア]の計算式の例を以下の(式2)に示す。
顔方向スコア=(90−(顔検出角度[deg])/90
・・・(式2)
Using this face direction recognition technology, the direction of the detected face image is obtained, and face direction information is output to the shot score calculation unit 103. The shot score calculation unit 103 calculates the face direction score using the face direction angle information input from the face detection unit 102. Since the face is easier for the user to identify the face closer to the front, a higher score is assigned. An example of a calculation formula of [Face Direction Score] using the face direction angle in the Yaw direction is shown in (Formula 2) below.
Face direction score = (90− (face detection angle [deg]) / 90
... (Formula 2)

図3に示す顔画像およびスコア設定例では、顔角度情報に基づいて上記算出式(式2)を適用して算出した顔方向スコアを示している。
正面を向いている顔画像A,Cは、顔角度=0degであり、顔方向スコア=1となり最高スコア値が設定され、顔画像Bは、顔角度=36degであり、顔方向スコア=0.6となり、顔画像Dは、顔角度=−45degであり、顔方向スコア=0.5に設定されている。
The face image and score setting example shown in FIG. 3 shows the face direction score calculated by applying the above calculation formula (Formula 2) based on the face angle information.
The face images A and C facing the front have a face angle = 0 deg, the face direction score = 1, and the highest score value is set. The face image B has a face angle = 36 deg, and the face direction score = 0. The face image D is set to face angle = −45 deg and face direction score = 0.5.

((b)顔検出スコア)
顔検出部102は、画像フレームからの顔検出処理に際して得られるスコアを閾値処理することで、対象画像が顔か非顔かを判定する。なお、この処理は、前述した文献[佐部 浩太郎,日台 健一,"ピクセル差分特徴を用いた実時間任意姿勢顔検出器の学習",第10回画像センシングシンポジウム講演論文集,pp.547−552,2004]に示されている。なお、この文献においては、顔検出処理に際して得られるスコアを「重み付け多数決の値」として説明している。このスコアは一般に顔画像らしさを表し、このスコアが高いほど鮮明に顔が映っていることを判断する指標として用いることができる。
((B) Face detection score)
The face detection unit 102 determines whether the target image is a face or a non-face by performing threshold processing on a score obtained in face detection processing from an image frame. This process is described in the above-mentioned document [Kotaro Sabe, Kenichi Hidai, "Learning a Real-Time Arbitrary Posture Face Detector Using Pixel Difference Features", Proc. 547-552, 2004]. In this document, the score obtained in the face detection process is described as a “weighted majority value”. This score generally represents the likelihood of a face image, and the higher the score, the more clearly it can be used as an index for determining that the face is reflected clearly.

図3に示す顔画像およびスコア設定例では、顔検出スコアを0〜1.0の範囲で、正規化した値として設定している。
顔画像Aは帽子の影が顔の上部にかかっているため、顔検出されているがスコアが低い。BやDに関しても、顔が正面でないために正面顔に比べて顔検出の難度が高いためにスコアがやや低い。Cは正面顔で遮蔽も無いため、顔検出スコアが高い。
In the face image and score setting example shown in FIG. 3, the face detection score is set as a normalized value in the range of 0 to 1.0.
Since the face image A has a hat shadow on the top of the face, the face is detected but the score is low. Regarding B and D, since the face is not the front, the face detection is more difficult than the front face, so the score is slightly lower. Since C is a front face and has no shielding, the face detection score is high.

(ショットスコア)
ショットスコア算出部103は、上記のサブスコアである顔方向スコアと顔検出スコアから、その顔画像の代表的度合いを示す総合スコアとしてのショットスコアを求める。各サブスコアが正規化されているデータである場合は、各サブスコアを単純に加算、あるいは乗算することで、総合スコアとしてのショットスコアを求めることができる。また、各スコアの重要度合いを統計的処理で求めれば、重み付き和でショットスコアを定義することが出来る。
(Shot score)
The shot score calculation unit 103 obtains a shot score as a total score indicating the representative degree of the face image from the face direction score and the face detection score, which are the sub-scores. When each sub-score is normalized data, a shot score as a total score can be obtained by simply adding or multiplying each sub-score. If the importance level of each score is obtained by statistical processing, the shot score can be defined by a weighted sum.

ここでは、複数のサブスコアから総合スコアとしてのショットスコア[Sall]を求めるにあたって、
(a)第1サブスコアである顔方向スコアに対する重み[Wdir]、
(b)第2サブスコアである顔検出スコアに対する重み[Wfd]、
これらのサブスコア対応重みを設定し、
各サブスコアに重みを乗算して、スコア対応重み付き和を計算することで、総合スコアであるショットスコア[Sall]を求める。すなわち、
(a)第1サブスコアである顔方向スコア[Sdir]に対する重み[Wdir]、
(b)第2サブスコアである顔検出スコア[Sfd]に対する重み[Wfd]、
として設定した場合、以下の式(式3)に従って、ショットスコア[Sall]を算出する。
ショットスコア[Sall]=(Sdir×Wdir)+(Sfd×Wfd)
・・・(式3)
上記式(式3)に従って、複数のサブスコアから総合スコアとしてのショットスコア[Sall]を求める。
Here, in obtaining a shot score [Sall] as a total score from a plurality of sub-scores,
(A) Weight [Wdir] for the face direction score as the first sub-score,
(B) Weight [Wfd] for the face detection score which is the second sub-score,
Set these subscore-corresponding weights,
Each sub-score is multiplied by a weight, and a score-corresponding weighted sum is calculated to obtain a shot score [Sall] that is an overall score. That is,
(A) Weight [Wdir] for the face direction score [Sdir] as the first sub-score,
(B) Weight [Wfd] for the face detection score [Sfd] as the second sub-score,
Is set, the shot score [Sall] is calculated according to the following equation (Equation 3).
Shot score [Sall] = (Sdir × Wdir) + (Sfd × Wfd)
... (Formula 3)
A shot score [Sall] as a total score is obtained from a plurality of sub-scores according to the above formula (Formula 3).

図3に示す顔画像およびスコア設定例では、
(a)第1サブスコアである顔方向スコア[Sdir]に対する重み[Wdir]=0.6、
(b)第2サブスコアである顔検出スコア[Sfd]に対する重み[Wfd]=0.4、
これらのサブスコア重みの設定を行った場合のショットスコアの値を示している。
In the face image and score setting example shown in FIG.
(A) Weight [Wdir] = 0.6 for the face direction score [Sdir] as the first sub-score,
(B) Weight [Wfd] = 0.4 for the face detection score [Sfd] as the second sub-score,
The values of shot scores when these subscore weights are set are shown.

図3に示す例では、
A:帽子によって顔に影がある顔画像:ショットスコア=(1×0.6)+(0.3×0.4)=0.72、
B:斜め右上を向いている顔画像:ショットスコア=(0.6×0.6)+(0.7×0.4)=0.64、
C:正面を向いている顔画像:ショットスコア=(1×0.6)+(0.9×0.4)=0.96、
D:左を向いている顔画像:ショットスコア=(0.5×0.6)+(0.8×0.4)=0.62、
これらのショットスコアが算出される。この例では、顔画像Cがもっともショットスコアの値が高いため、代表的画像として選択されることになる。
In the example shown in FIG.
A: Face image with shadow on face by hat: Shot score = (1 × 0.6) + (0.3 × 0.4) = 0.72
B: Face image facing diagonally upper right: Shot score = (0.6 × 0.6) + (0.7 × 0.4) = 0.64
C: Face image facing front: Shot score = (1 × 0.6) + (0.9 × 0.4) = 0.96
D: Face image facing left: Shot score = (0.5 × 0.6) + (0.8 × 0.4) = 0.62
These shot scores are calculated. In this example, since the face image C has the highest shot score value, it is selected as a representative image.

このようにして、ショットスコア算出部103の算出したショットスコア情報は、ベストショット画像選択部104に入力され、ベストショット画像選択部104は、ショットスコア算出部103の算出したショットスコア情報を利用して、画像表示部106に表示される画像から一定区間過去のフレーム(例えば過去300フレーム(通常再生時における約10秒間の画像フレーム等)において、最もショットスコアの高い顔画像をその人物のベストショットとして選択する処理を実行する。表示画像制御部105は、早送りまたは巻き戻し再生画像に、ベストショット選択部104の選択したベストショット顔の静止画像を、例えば、早送りまたは巻き戻し再生画像の顔領域部分に貼り付け、画像表示部106に出力して表示する。   In this way, the shot score information calculated by the shot score calculation unit 103 is input to the best shot image selection unit 104, and the best shot image selection unit 104 uses the shot score information calculated by the shot score calculation unit 103. The face image having the highest shot score in the past frame (for example, the past 300 frames (for example, an image frame of about 10 seconds during normal playback)) from the image displayed on the image display unit 106 is the best shot of the person. The display image control unit 105 selects the best shot face still image selected by the best shot selection unit 104 as the fast forward or rewind reproduction image, for example, the face area of the fast forward or rewind reproduction image. Affixed to the part, output to the image display unit 106 and displayed.

[表示画像作成処理]
次に、表示画像制御部105の実行する表示画像作成処理について説明する。表示画像制御部105は、早送りあるいは巻き戻し画面の表示画面調整、すなわち前述したように、光感受性発作(光過敏症)対策のためコントラストを落とす処理を行う。さらに、ショットスコア算出部103の算出したショットスコア情報に従って、ベストショット画像選択部104の選択した最もショットスコアの高い顔画像(ベストショット画像)を、早送りあるいは巻き戻し画面における顔位置に貼り付けて、画像表示部106に出力、表示する。表示画像制御部105は、動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、画像フレーム区間毎に選択されたベストショット画像を画像表示部106に表示する制御を実行する。
[Display image creation processing]
Next, display image creation processing executed by the display image control unit 105 will be described. The display image control unit 105 performs display screen adjustment of the fast forward or rewind screen, that is, as described above, a process of reducing the contrast in order to prevent photosensitivity attacks (photosensitivity). Further, according to the shot score information calculated by the shot score calculation unit 103, the face image with the highest shot score (best shot image) selected by the best shot image selection unit 104 is pasted to the face position on the fast forward or rewind screen. , Output and display on the image display unit 106. The display image control unit 105 executes control to display the best shot image selected for each image frame section on the image display unit 106 in synchronization with the display of the fast-forward playback image or the rewind playback image of the moving image data.

具体的な表示例を図4に示す。図4に示すように、画像表示部106に表示される画像は、早送りまたは巻き戻しによる高レートの再生画像201に、人の顔の静止画211,212が張り付けられた表示画像となる。顔の静止画211,212は、それぞれショットスコア算出部103の算出したショットスコア情報に従って、ベストショット画像選択部104の選択した最もショットスコアの高い顔画像(ベストショット画像)であり、画像表示部106に表示される画像から一定区間過去のフレーム(例えば過去300フレーム(通常再生時における約10秒間の画像フレーム等)において、最もショットスコアの高い顔画像である。   A specific display example is shown in FIG. As shown in FIG. 4, the image displayed on the image display unit 106 is a display image in which still images 211 and 212 of a human face are pasted on a high-rate playback image 201 by fast forward or rewind. The face still images 211 and 212 are face images (best shot images) having the highest shot score selected by the best shot image selection unit 104 according to the shot score information calculated by the shot score calculation unit 103, respectively. The face image with the highest shot score in a frame in a certain interval past the image displayed in 106 (for example, the past 300 frames (such as an image frame of about 10 seconds during normal playback)).

なお、前述したように、顔の静止画211,212を貼り付ける位置は、早送りまたは巻き戻しによる高レートの再生画像201の顔の位置であるが、急激な位置変化があるとユーザが目で追いにくくなってしまうので、表示画像制御部105は、顔の位置変化速度[v]を、予め設定した閾値[vlimit]以下、すなわち、
v<vlimit
とする顔移動速度の制御を行う構成としてもよい。顔の位置変化速度[v]の制約式は、例えば先に説明した(式1)に従ったものとなり、表示画像制御部105は、制約に従って顔の静止画211,212の表示位置を変化させる処理を行う。
As described above, the position where the face still images 211 and 212 are pasted is the position of the face of the high-rate playback image 201 by fast-forwarding or rewinding. Since it becomes difficult to follow, the display image control unit 105 sets the face position change speed [v] to be equal to or less than a preset threshold value [vlimit], that is,
v <vlimit
It is good also as a structure which controls control of the face moving speed to be. The constraint formula for the face position change speed [v] is, for example, according to (Formula 1) described above, and the display image control unit 105 changes the display position of the still images 211 and 212 of the face according to the constraint. Process.

さらに、図5に示す画像再生装置230のように、先に図1を参照して説明した画像再生装置の顔検出部に顔識別機能を持たせる構成としてもよい。図5に示す顔検出および顔識別部231は、画像入力部101から入力する画像フレームに含まれる顔領域を検出し、さらに検出された顔が誰の顔であるかを識別する顔識別処理を実行する。顔データベース232には、顔の特徴情報と人物名などの人の識別情報が対応付けられたデータが格納され、顔検出および顔識別部231は、画像入力部101から入力する画像フレームから検出した顔領域の特徴情報と、顔データベース232に格納された顔の特徴情報とを照合し、照合度の高い人物をその検出顔の人物であると判断し、顔データベース232に登録された人物名情報を検出された顔情報とともに、ショットスコア算出部103に出力する。   Further, as in the image reproduction device 230 shown in FIG. 5, the face detection unit of the image reproduction device described above with reference to FIG. 1 may have a face identification function. The face detection and face identification unit 231 shown in FIG. 5 detects a face area included in the image frame input from the image input unit 101, and further performs a face identification process for identifying who the detected face is. Execute. The face database 232 stores data in which facial feature information and human identification information such as a person name are associated with each other, and the face detection and face identification unit 231 detects from an image frame input from the image input unit 101. The face area feature information and the face feature information stored in the face database 232 are collated, a person with a high matching degree is determined to be the person of the detected face, and the person name information registered in the face database 232 Are output to the shot score calculation unit 103 together with the detected face information.

人物名は、さらに、ベストショット画像選択部104を介して、ベストショットの顔画像に対応する情報として表示画像制御部105に入力される。表示画像制御部105は、ベストショット画像選択部104の選択した最もショットスコアの高い顔画像(ベストショット画像)とともに、顔検出および顔識別部231が検出した人物名を、早送りあるいは巻き戻し画面における顔位置に貼り付けて、画像表示部106に出力、表示する。   The person name is further input to the display image control unit 105 through the best shot image selection unit 104 as information corresponding to the face image of the best shot. The display image control unit 105 displays the person name detected by the face detection and face identification unit 231 together with the face image (best shot image) having the highest shot score selected by the best shot image selection unit 104 on the fast forward or rewind screen. The image is pasted on the face position and output and displayed on the image display unit 106.

具体的な表示例を図6に示す。図6に示すように、画像表示部106に表示される画像は、早送りまたは巻き戻しによる高レートの再生画像201に、人の顔の静止画211,212が張り付けられ、さらに、顔検出および顔識別部231において特定した人物識別情報251,252として人物名が貼り付けられた表示画像となる。顔の静止画211,212は、それぞれショットスコア算出部103の算出したショットスコア情報に従って、ベストショット画像選択部104の選択した最もショットスコアの高い顔画像(ベストショット画像)であり、画像表示部106に表示される画像から一定区間過去のフレーム(例えば過去300フレーム(通常再生時における約10秒間の画像フレーム等)において、最もショットスコアの高い顔画像である。   A specific display example is shown in FIG. As shown in FIG. 6, the image displayed on the image display unit 106 has a human face still image 211, 212 pasted on a high-rate playback image 201 by fast-forwarding or rewinding. It becomes a display image in which a person name is pasted as the person identification information 251 and 252 specified in the identification unit 231. The face still images 211 and 212 are face images (best shot images) having the highest shot score selected by the best shot image selection unit 104 according to the shot score information calculated by the shot score calculation unit 103, respectively. The face image with the highest shot score in a frame in a certain interval past the image displayed in 106 (for example, the past 300 frames (such as an image frame of about 10 seconds during normal playback)).

その他の表示例として、早送り画面と検出された顔画像を別のウインドウに表示する図7のような表示形式としてもよい。図7に示す例は、早送りまたは巻き戻しによる高レートの再生画像301とは別の独立した表示領域に、再生画像301に含まれる人の顔の静止画311,312を表示し、さらに、顔検出および顔識別部231において特定した人物の人物識別情報351,352としての人物名を表示した表示画像である。   As another display example, the fast-forward screen and the detected face image may be displayed in a separate window as shown in FIG. In the example shown in FIG. 7, still images 311 and 312 of human faces included in the reproduction image 301 are displayed in an independent display area different from the high-rate reproduction image 301 by fast-forwarding or rewinding. It is a display image displaying a person name as person identification information 351, 352 of a person specified by the detection and face identification unit 231.

この表示例の場合、顔画像が画面中を移動しないため、画像中の登場人物の位置は把握できないが、誰が登場しているかを把握しやすい利点がある。   In the case of this display example, since the face image does not move on the screen, the position of the character in the image cannot be grasped, but there is an advantage that it is easy to grasp who is appearing.

なお、顔検出や顔識別処理等の顔認識処理は、画像表示部106に対する画像表示の実行時、すなわち早送り再生や巻き戻し再生の実行時に並列に行う構成としてもよいが、例えば、画像再生装置がビデオカメラなどの装置である場合、動画の録画処理実行時や機器が使用されていない休閑時に実行し、顔検出や顔識別情報を各画像フレームに対応するタグ情報として、記録メディアに画像データとともに記録する構成としてもよい。早送りや、巻き戻し再生の実行時にそのタグ情報を読み込んで、顔の静止画や人物名などのデータを貼り付けた表示データを生成する構成としてもよい。   Note that face recognition processing such as face detection and face identification processing may be performed in parallel when image display is performed on the image display unit 106, that is, when fast-forward playback or rewind playback is performed. If the device is a video camera or other device, it is executed during video recording processing or when the device is not in use, and the image data is recorded on the recording media as face information and face identification information as tag information corresponding to each image frame. It is good also as a structure recorded with it. The tag information may be read when fast-forwarding or rewinding reproduction is performed, and display data pasted with data such as a still image of a face or a person name may be generated.

すなわち、顔検出部は、記録メディアに対する動画像の記録処理に際して、記録する動画像データを構成する画像フレームから顔領域の検出を実行し、データ記録部が、該検出情報をタグ情報として記録メディアに記録する。   That is, the face detection unit detects a face area from the image frame constituting the moving image data to be recorded in the moving image recording process on the recording medium, and the data recording unit uses the detection information as tag information to record the recording medium. To record.

ショットスコア算出部は、データ記録部に記録された動画像データの再生時にタグ情報を利用して、顔領域を検出して、検出した顔のスコアを算出し、ベストショット画像選択部は、ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択し、表示画像制御部が、動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する。   The shot score calculation unit uses the tag information when reproducing the moving image data recorded in the data recording unit, detects the face area, calculates the score of the detected face, and the best shot image selection unit A face image with a high score calculated by the score calculation unit is selected as a best shot image from each preset image frame section, and the display image control unit synchronizes with the display of the fast-forward playback image or the rewind playback image of the moving image data. Then, control for displaying the best shot image selected for each image frame section on the display unit is executed.

早送りや巻き戻し再生の実行時に顔検出や顔認識処理を行う場合はタグ情報等を保存する記憶メディアが不要になり、タグ情報を管理する機構も不要となるが、リアルタイムに計算処理が実行できる高速な計算ユニットを必要とする。一方、機器の休閑時に顔認識処理を行う場合は、顔検出や顔認識処理の処理速度を高速とする要求がないので高速な計算ユニットは必要とならないという逆のメリットがある。   When face detection or face recognition processing is performed during fast forward or rewind playback, a storage medium for storing tag information and the like is unnecessary, and a mechanism for managing tag information is also unnecessary, but calculation processing can be executed in real time. Requires a fast computing unit. On the other hand, when the face recognition process is performed when the device is in a quiet period, there is no need to increase the processing speed of the face detection or the face recognition process.

また、上述の実施例では、ベストショット画像選択部104の選択した最もショットスコアの高い顔画像(ベストショット画像)を表示する画像の区間は、例えば300フレーム(通常再生時における約10秒間の画像フレーム)とする設定とし、300フレームごとに1つのベストショットを選択する処理例として説明したが、ベストショット画像選択の時間区間は、画像表示の一貫性を持たせるためにユーザがコントロールする早送り再生速度や巻き戻し再生速度に応じて変更する方法が考えられる。顔の位置変化速度の制約値などのパラメータについても同様である。   In the above-described embodiment, the section of the image displaying the face image (best shot image) having the highest shot score selected by the best shot image selection unit 104 is, for example, 300 frames (an image of about 10 seconds during normal reproduction). Frame), and a processing example in which one best shot is selected every 300 frames has been described. However, the time interval for selecting the best shot image is fast-forward playback that is controlled by the user in order to provide consistent image display. A method of changing according to the speed and the rewind playback speed can be considered. The same applies to parameters such as the constraint value of the face position change speed.

例えば、ベストショット画像選択の時間区間に関して、5倍速で早送りをしている場合は標準速度における10秒間を、10倍速で早送りしている場合は標準速度における20秒間を設定とするなどの制御を行うことで、顔画像の更新頻度を早送り速度の違いにかかわらず一定にすることが出来る。   For example, regarding the time interval for selecting the best shot image, control is performed such that 10 seconds at the standard speed is set when fast-forwarding is performed at 5 times speed, and 20 seconds at the standard speed is set when fast-forwarding is performed at 10 times speed. By doing so, the update frequency of the face image can be made constant regardless of the fast-forwarding speed.

この場合、ユーザの操作情報を入力する入力部からの情報を、ベストショット画像選択部104や、表示画像制御部105に入力し、この入力情報に応じてベストショット画像選択部104がベストショット画像選択の時間区間を変更し、表示画像制御部105が表示する顔画像の移動速度を制御する処理を行う。   In this case, information from the input unit for inputting user operation information is input to the best shot image selection unit 104 and the display image control unit 105, and the best shot image selection unit 104 responds to this input information. A process of changing the selection time interval and controlling the moving speed of the face image displayed by the display image control unit 105 is performed.

本発明の画像再生装置によれば、早送り時にユーザは高フレームレート(例えば1秒間に30フレーム程度)の画像を視覚的に負担無く見ることが出来るため、
(a)見たいシーンを飛ばすことなく、的確に頭だしすることが出来るようになる
(b)早送り速度を視覚的に把握しやすくなり、希望するシーンまですばやく移動できるようになる
これらの効果がもたらされる。
According to the image reproducing apparatus of the present invention, the user can visually view an image with a high frame rate (for example, about 30 frames per second) without a burden during fast-forwarding.
(A) You will be able to cue accurately without skipping the scene you want to see. (B) It will be easier to grasp the fast-forward speed visually, and you can move quickly to the desired scene. Brought about.

本発明の構成では、ユーザの注目が集まりやすい登場人物の顔画像は、予め定められたフレーム区間(例えば300フレーム)に1つの静止画として表示されることになり、更新頻度が低い(秒間1,2フレーム程度)画像として表示され、視聴者としてのユーザが容易に人物を特定することが可能となる。また、人物の顔画像は、前述したように移動速度の制約が適応されるため、ユーザが目で動きを追いやすく、さらに、背景画像は光感受性発作(光過敏症)対策チェックを行い、短時間における大きな輝度の変化を抑えるように背景画像をコントロールされているので、ユーザの視覚的負担が軽減される。ユーザは、シーン状況と早送り速度を視覚的に把握しやすくなるので、早送り速度の調整や停止タイミング等のコントロールをしやすくなる。   In the configuration of the present invention, the facial image of the character that is likely to attract the attention of the user is displayed as one still image in a predetermined frame section (for example, 300 frames), and the update frequency is low (1 per second). , About two frames), and is displayed as an image, so that a user as a viewer can easily identify a person. In addition, as described above, the movement speed restriction is applied to the human face image, so that the user can easily follow the movement with the eyes, and the background image is checked for countermeasures against light-sensitive seizures (photosensitivity). Since the background image is controlled so as to suppress a large change in luminance over time, the visual burden on the user is reduced. Since the user can easily grasp the scene situation and the fast-forward speed visually, the user can easily adjust the fast-forward speed and control the stop timing.

最後に、本発明の画像再生装置の一例として撮像装置であるビデオカメラのハードウェア構成例について図8を参照して説明する。ビデオカメラ500は、レンズ、CCD(Charge Coupled Device)などの撮像部501において取得した撮影信号をアナログ信号処理部502に入力し、アナログ信号処理部502においてノイズ除去等の処理を行い、A/D変換部503においてデジタル信号に変換される。デジタル変換されたデータは、デジタル信号処理部504において、データ圧縮などのデジタル信号処理がなされた後、例えばフラッシュメモリなどによって構成される記録デバイス515に記録される。さらに、モニタ517、ビューファインダ(EVF)516に表示される。   Finally, an example of a hardware configuration of a video camera that is an imaging apparatus as an example of the image reproducing apparatus of the present invention will be described with reference to FIG. The video camera 500 inputs a shooting signal acquired by the imaging unit 501 such as a lens or a charge coupled device (CCD) to the analog signal processing unit 502, performs processing such as noise removal in the analog signal processing unit 502, and performs A / D The conversion unit 503 converts the digital signal. The digitally converted data is subjected to digital signal processing such as data compression in the digital signal processing unit 504 and then recorded in a recording device 515 configured by, for example, a flash memory. Further, it is displayed on the monitor 517 and the viewfinder (EVF) 516.

操作部511は、カメラ本体にあるシャッター等の他、記録デバイス515に記録されたデータの再生指定スイッチ、早送り再生や巻き戻し再生などの処理開始を行うためのスイッチ類が含まれる。   The operation unit 511 includes, for example, a shutter provided in the camera body, and switches for starting processing such as a playback designation switch for data recorded in the recording device 515 and fast-forward playback and rewind playback.

制御部510は、CPUを有し、ビデオカメラの実行する各種の処理の制御を予めメモリ(ROM)520などに格納されたプログラムに従って実行する。メモリ(EEPROM)512は不揮発性メモリであり、画像データ、各種の補助情報、プログラムなどが格納される。メモリ(ROM)520は、制御部(CPU)510が使用するプログラムや演算パラメータ等を格納する。メモリ(RAM)521は、制御部(CPU)510において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。   Control unit 510 has a CPU, and executes control of various processes executed by the video camera in accordance with a program stored in advance in memory (ROM) 520 or the like. A memory (EEPROM) 512 is a non-volatile memory, and stores image data, various auxiliary information, programs, and the like. A memory (ROM) 520 stores programs, calculation parameters, and the like used by the control unit (CPU) 510. The memory (RAM) 521 stores programs used in the control unit (CPU) 510, parameters that change as appropriate during execution thereof, and the like.

記録デバイス515に記録されたデータの早送り再生や巻き戻し再生などの処理要求が操作部511から入力されると、制御部510の制御の下、先に図1〜図7を参照して説明した処理が実行される。すなわち、記録デバイス515に格納された画像データがデジタル信号処理部504に入力されて復号が実行される。   When a processing request such as fast-forward playback or rewind playback of data recorded in the recording device 515 is input from the operation unit 511, it has been described above with reference to FIGS. Processing is executed. That is, the image data stored in the recording device 515 is input to the digital signal processing unit 504, and decoding is performed.

顔検出部505は復号画像から顔領域の検出を行い、検出結果をデジタル信号処理部504に入力する。デジタル信号処理部504は、先に説明したショットスコアの算出、ベストショット画像の選択、選択されたベストショット画像の選択などの処理を実行し、さらにモニタ517に表示する早送りまたは巻き戻し再生画像にベストシッョト画像の貼り付けを行って出力する。   The face detection unit 505 detects a face area from the decoded image and inputs the detection result to the digital signal processing unit 504. The digital signal processing unit 504 performs processing such as the above-described calculation of the shot score, selection of the best shot image, selection of the selected best shot image, and the like to the fast forward or rewind playback image displayed on the monitor 517. Paste the best shot image and output.

なお、上述の説明ではショットスコアの算出、ベストショット画像の選択、表示画像の制御は、デジタル信号処理部504において実行する構成として説明したが、これらの処理は制御部510において実行してもよく、また両者において協同的に実行する構成としてもよい。   In the above description, the calculation of the shot score, the selection of the best shot image, and the control of the display image have been described as being executed by the digital signal processing unit 504. However, these processes may be executed by the control unit 510. Moreover, it is good also as a structure which performs both in cooperation.

また、図8に示す顔検出部505は、顔認識を実行する処理部として設定してもよい。例えば、メモリ(EEPROM)のデータ記録領域の一部に先に図5を参照して説明した顔データベースを設定する構成として、顔検出部505において顔検出に併せて顔識別を実行し、検出された顔に対応する人物名などをデジタル信号処理部504を介して表示部としてのモニタ517に出力する構成としてもよい。   Further, the face detection unit 505 illustrated in FIG. 8 may be set as a processing unit that performs face recognition. For example, as a configuration in which the face database described above with reference to FIG. 5 is set in a part of the data recording area of the memory (EEPROM), the face detection unit 505 performs face identification along with face detection and is detected. The person name corresponding to the face may be output to the monitor 517 as the display unit via the digital signal processing unit 504.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   The series of processing described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run. For example, the program can be recorded in advance on a recording medium. In addition to being installed on a computer from a recording medium, the program can be received via a network such as a LAN (Local Area Network) or the Internet and can be installed on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の一実施例の構成によれば、動画像データを構成する画像フレームから顔領域の検出を実行し、検出した顔のスコアを算出して、スコアの高い顔画像をベストショット画像として予め設定した画像フレーム区間各々から選択し、動画像データの早送り再生画像または巻き戻し再生画像の顔領域部分、あるいは別領域に表示する構成とした。本構成によれば、ユーザの注目が集まりやすい人物の顔画像が、予め定められたフレーム区間(例えば300フレーム)に1つの静止画として表示されることになり、視聴者が容易に人物を特定することが可能であり、その人物の登場するシーンの把握も容易に行うことが可能となる。   As described above, according to the configuration of the embodiment of the present invention, the face area is detected from the image frame constituting the moving image data, the score of the detected face is calculated, and the face having a high score is obtained. An image is selected from each image frame section set in advance as a best shot image and displayed in the face area portion of the fast-forward playback image or the rewind playback image of the moving image data, or in another area. According to this configuration, a face image of a person that is likely to attract the user's attention is displayed as one still image in a predetermined frame section (for example, 300 frames), and the viewer can easily identify the person. The scene in which the person appears can be easily grasped.

本発明の一実施例に係る画像再生装置の構成および実行する画像再生処理について説明するブロック図である。It is a block diagram explaining the structure of the image reproduction apparatus which concerns on one Example of this invention, and the image reproduction process to perform. 本発明の一実施例に係る画像再生装置の画像表示部に表示される早送り画像の表示画像例を示す図である。It is a figure which shows the example of a display image of the fast-forward image displayed on the image display part of the image reproduction apparatus which concerns on one Example of this invention. 本発明の一実施例に係る画像再生装置の顔検出部において検出された顔画像およびスコア設定例を示す図である。It is a figure which shows the face image detected in the face detection part of the image reproduction apparatus which concerns on one Example of this invention, and a score setting example. 本発明の一実施例に係る画像再生装置の画像表示部に表示される表示画像の一例を示す図である。It is a figure which shows an example of the display image displayed on the image display part of the image reproduction apparatus which concerns on one Example of this invention. 本発明の一実施例に係る画像再生装置の構成および実行する画像再生処理について説明するブロック図である。It is a block diagram explaining the structure of the image reproduction apparatus which concerns on one Example of this invention, and the image reproduction process to perform. 本発明の一実施例に係る画像再生装置の画像表示部に表示される早送り画像の表示画像例を示す図である。It is a figure which shows the example of a display image of the fast-forward image displayed on the image display part of the image reproduction apparatus which concerns on one Example of this invention. 本発明の一実施例に係る画像再生装置の画像表示部に表示される早送り画像の表示画像例を示す図である。It is a figure which shows the example of a display image of the fast-forward image displayed on the image display part of the image reproduction apparatus which concerns on one Example of this invention. 本発明の一実施例に係る画像再生装置としてのビデオカメラのハードウェア構成例について説明する図である。It is a figure explaining the hardware structural example of the video camera as an image reproduction apparatus which concerns on one Example of this invention.

符号の説明Explanation of symbols

100 画像再生装置
101 画像入力部
102 顔検出部
103 ショットスコア算出部
104 ベストショット画像選択部
105 表示画像制御部
106 画像表示部
201 再生画像
211,212 顔の静止画
230 画像再生装置
231 顔検出および顔識別部
232 顔データベース
251,252 人物識別情報
301 再生画像
311,312 顔の静止画
351,352 人物識別情報
500 ビデオカメラ
501 撮像部
502 アナログ信号処理部
503 A/D変換部
504 デジタル信号処理部
505 顔検出部
510 制御部
511 操作部
512 メモリ
515 記録デバイス
516 ビューファインダ
517 モニタ
520 メモリ(ROM)
521 メモリ(RAM)
DESCRIPTION OF SYMBOLS 100 Image reproduction apparatus 101 Image input part 102 Face detection part 103 Shot score calculation part 104 Best shot image selection part 105 Display image control part 106 Image display part 201 Reproduction image 211,212 Still image of face 230 Image reproduction apparatus 231 Face detection and Face identification unit 232 Face database 251, 252 Person identification information 301 Playback image 311, 312 Face still image 351, 352 Person identification information 500 Video camera 501 Imaging unit 502 Analog signal processing unit 503 A / D conversion unit 504 Digital signal processing unit 505 Face detection unit 510 Control unit 511 Operation unit 512 Memory 515 Recording device 516 Viewfinder 517 Monitor 520 Memory (ROM)
521 Memory (RAM)

Claims (18)

動画像データの再生処理を実行する画像再生装置であり、
動画像データを構成する画像フレームから顔領域の検出を実行する顔検出部と、
前記顔検出部の検出した顔のスコアを算出するショットスコア算出部と、
前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択部と、
前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御部と、
前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示部と、
を有することを特徴とする画像再生装置。
An image playback device that executes playback processing of moving image data,
A face detection unit for detecting a face area from image frames constituting moving image data;
A shot score calculation unit for calculating a score of the face detected by the face detection unit;
A best shot image selection unit that selects a face image with a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image control unit that executes control for displaying the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward reproduction image or the rewind reproduction image of the moving image data;
Under the control of the display image control unit, a display unit that displays a fast-forward reproduction image or a rewind reproduction image of moving image data, and a best shot image,
An image reproducing apparatus comprising:
前記ショットスコア算出部は、
前記顔検出部の検出した顔の各々について、
顔の方向に応じた顔方向スコアと、顔らしさを示す顔検出スコアとの少なくともいずれかをサブスコアとして算出し、算出したサブスコアに基づいて総合スコアとしてのショットスコアの算出処理を実行する構成であることを特徴とする請求項1に記載の画像再生装置。
The shot score calculation unit
For each of the faces detected by the face detection unit,
At least one of a face direction score corresponding to the face direction and a face detection score indicating the likelihood of a face is calculated as a subscore, and a shot score calculation process as a total score is executed based on the calculated subscore. The image reproducing apparatus according to claim 1, wherein:
前記ショットスコア算出部は、
前記サブスコアの各々に対応する重みを設定し、サブスコアの重み付け和を総合スコアとしてのショットスコアとして算出する構成であることを特徴とする請求項2に記載の画像再生装置。
The shot score calculation unit
The image reproducing device according to claim 2, wherein a weight corresponding to each of the sub-scores is set, and a weighted sum of the sub-scores is calculated as a shot score as a total score.
前記表示画像制御部は、
前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像中の顔領域に貼り付けて表示部に表示する制御を実行する構成であることを特徴とする請求項1に記載の画像再生装置。
The display image control unit
2. The control according to claim 1, wherein the best shot image is pasted on a face area in the fast-forward playback image or the rewind playback image of the moving image data and displayed on a display unit. Image playback device.
前記表示画像制御部は、
前記表示部に表示する前記ベストショット画像の移動速度を予め設定した上限速度以下になるように表示制御を行う構成であることを特徴とする請求項4に記載の画像再生装置。
The display image control unit
5. The image reproducing device according to claim 4, wherein display control is performed so that a moving speed of the best shot image displayed on the display unit is equal to or lower than a preset upper limit speed.
前記表示画像制御部は、
前記表示部に表示する動画像データの早送り再生画像または巻き戻し再生画像の輝度レベルまたはコントラスト制御を実行して輝度レベルの変化を抑制した表示制御を行う構成であることを特徴とする請求項1に記載の画像再生装置。
The display image control unit
The display control is performed by executing a luminance level or contrast control of a fast-forward reproduction image or a rewind reproduction image of moving image data displayed on the display unit to suppress a change in luminance level. The image reproducing device described in 1.
前記表示画像制御部は、
前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像の表示領域と別領域に表示する制御を実行する構成であることを特徴とする請求項1に記載の画像再生装置。
The display image control unit
2. The image playback apparatus according to claim 1, wherein the best shot image is configured to execute control for displaying the best shot image in a region different from a display region of the fast-forward playback image or the rewind playback image of the moving image data.
前記顔検出部は、
動画像データを構成する画像フレームから顔領域の検出を実行するとともに、検出した顔の識別を実行する構成であり、
前記表示画像制御部は、
前記顔検出部の検出した顔識別情報を表示部に表示するベストショット画像に併せて表示する制御を行う構成であることを特徴とする請求項1に記載の画像再生装置。
The face detection unit
The face area is detected from the image frames constituting the moving image data, and the detected face is identified.
The display image control unit
The image reproducing apparatus according to claim 1, wherein control is performed to display face identification information detected by the face detection unit together with a best shot image displayed on a display unit.
動画像データの記録および再生処理を実行する撮像装置であり、
撮像部から入力する動画像データを構成する画像フレームから顔領域の検出を実行する顔検出部と、
前記顔検出部の顔領域検出情報を、動画像データに対応するタグ情報として、動画像データに併せて記録メディアに記録するデータ記録部と、
前記データ記録部に記録された動画像データの再生時に前記タグ情報を利用して、顔領域を検出して、検出した顔のスコアを算出するショットスコア算出部と、
前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択部と、
前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御部と、
前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示部と、
を有することを特徴とする撮像装置。
An imaging device that performs recording and playback processing of moving image data,
A face detection unit for detecting a face area from image frames constituting moving image data input from an imaging unit;
A data recording unit that records the face area detection information of the face detection unit as tag information corresponding to the moving image data on a recording medium together with the moving image data;
A shot score calculation unit that detects a face region using the tag information when reproducing moving image data recorded in the data recording unit, and calculates a score of the detected face;
A best shot image selection unit that selects a face image with a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image control unit that executes control for displaying the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward reproduction image or the rewind reproduction image of the moving image data;
Under the control of the display image control unit, a display unit that displays a fast-forward reproduction image or a rewind reproduction image of moving image data, and a best shot image,
An imaging device comprising:
動画像データの再生処理を実行する画像再生装置における画像再生方法であり、
顔検出部が、動画像データを構成する画像フレームから顔領域の検出を実行する顔検出ステップと、
ショットスコア算出部が、前記顔検出部の検出した顔のスコアを算出するショットスコア算出ステップと、
ベストショット画像選択部が、前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択するベストショット画像選択ステップと、
表示画像制御部が、前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行する表示画像制御ステップと、
表示部が、前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示する表示ステップと、
を有することを特徴とする画像再生方法。
An image reproduction method in an image reproduction apparatus that performs reproduction processing of moving image data,
A face detection step in which a face detection unit executes detection of a face region from image frames constituting moving image data;
A shot score calculating unit that calculates a score of the face detected by the face detecting unit;
The best shot image selection unit selects a face image having a high score calculated by the shot score calculation unit as a best shot image, and selects from each preset image frame section; and
A display image in which a display image control unit executes control to display the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward playback image or the rewind playback image of the moving image data. Control steps;
A display step for displaying a fast-shot playback image or a rewind playback image of the moving image data together with a best shot image under the control of the display image control unit;
An image reproduction method comprising:
前記ショットスコア算出ステップは、
前記顔検出部の検出した顔の各々について、
顔の方向に応じた顔方向スコアと、顔らしさを示す顔検出スコアとの少なくともいずれかをサブスコアとして算出し、算出したサブスコアに基づいて総合スコアとしてのショットスコアの算出処理を実行するステップであることを特徴とする請求項10に記載の画像再生方法。
The shot score calculating step includes:
For each of the faces detected by the face detection unit,
At least one of a face direction score corresponding to the face direction and a face detection score indicating the likelihood of a face is calculated as a sub-score, and a process of calculating a shot score as a total score is executed based on the calculated sub-score. The image reproduction method according to claim 10.
前記ショットスコア算出ステップは、
前記サブスコアの各々に対応する重みを設定し、サブスコアの重み付け和を総合スコアとしてのショットスコアとして算出するステップであることを特徴とする請求項11に記載の画像再生方法。
The shot score calculating step includes:
The image reproducing method according to claim 11, wherein a weight corresponding to each of the sub-scores is set, and a weighted sum of the sub-scores is calculated as a shot score as a total score.
前記表示画像制御ステップは、
前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像中の顔領域に貼り付けて表示部に表示する制御を実行するステップであることを特徴とする請求項10に記載の画像再生方法。
The display image control step includes:
11. The step of executing control for pasting the best shot image on a face area in a fast-forward playback image or a rewind playback image of the moving image data and displaying the best shot image on a display unit. Image playback method.
前記表示画像制御ステップは、
前記表示部に表示する前記ベストショット画像の移動速度を予め設定した上限速度以下になるように表示制御を行うステップであることを特徴とする請求項13に記載の画像再生方法。
The display image control step includes:
The image reproduction method according to claim 13, wherein display control is performed so that a moving speed of the best shot image displayed on the display unit is equal to or lower than a preset upper limit speed.
前記表示画像制御ステップは、
前記表示部に表示する動画像データの早送り再生画像または巻き戻し再生画像の輝度レベルまたはコントラスト制御を実行して輝度レベルの変化を抑制した表示制御を行うステップであることを特徴とする請求項10に記載の画像再生方法。
The display image control step includes:
11. The step of performing display control in which luminance level or contrast control of a fast-forward reproduction image or a rewind reproduction image of moving image data displayed on the display unit is executed to suppress a change in luminance level. The image reproduction method described in 1.
前記表示画像制御ステップは、
前記ベストショット画像を、前記動画像データの早送り再生画像または巻き戻し再生画像の表示領域と別領域に表示する制御を実行するステップであることを特徴とする請求項10に記載の画像再生方法。
The display image control step includes:
11. The image reproduction method according to claim 10, wherein the best shot image is displayed in a region different from a display region of the fast-forward reproduction image or the rewind reproduction image of the moving image data.
前記顔検出ステップは、
動画像データを構成する画像フレームから顔領域の検出を実行するとともに、検出した顔の識別を実行するステップであり、
前記表示画像制御ステップは、
前記顔検出ステップにおいて検出した顔識別情報を表示部に表示するベストショット画像に併せて表示する制御を行うことを特徴とする請求項10に記載の画像再生方法。
The face detection step includes
A step of performing detection of a face region from image frames constituting moving image data and identifying the detected face;
The display image control step includes:
The image reproduction method according to claim 10, wherein control for displaying the face identification information detected in the face detection step together with a best shot image displayed on a display unit is performed.
画像再生装置において、動画像データの再生処理を実行させるコンピュータ・プログラムであり、
顔検出部に、動画像データを構成する画像フレームから顔領域の検出を実行させる顔検出ステップと、
ショットスコア算出部に、前記顔検出部の検出した顔のスコアを算出させるショットスコア算出ステップと、
ベストショット画像選択部に、前記ショットスコア算出部の算出したスコアの高い顔画像をベストショット画像として、予め設定した画像フレーム区間各々から選択させるベストショット画像選択ステップと、
表示画像制御部に、前記動画像データの早送り再生画像または巻き戻し再生画像の表示に同期させて、前記画像フレーム区間毎に選択されたベストショット画像を表示部に表示する制御を実行させる表示画像制御ステップと、
表示部に、前記表示画像制御部の制御の下、動画像データの早送り再生画像または巻き戻し再生画像と、ベストショット画像を併せて表示させる表示ステップと、
を有することを特徴とするコンピュータ・プログラム。
In the image reproduction device, a computer program for executing reproduction processing of moving image data,
A face detection step for causing the face detection unit to detect a face area from image frames constituting moving image data;
A shot score calculation step for causing the shot score calculation unit to calculate the score of the face detected by the face detection unit;
A best shot image selection step for causing the best shot image selection unit to select a face image having a high score calculated by the shot score calculation unit as a best shot image from each of preset image frame sections;
A display image that causes the display image control unit to execute control to display the best shot image selected for each image frame section on the display unit in synchronization with the display of the fast-forward playback image or the rewind playback image of the moving image data. Control steps;
Under the control of the display image control unit on the display unit, a display step of displaying a fast-forward reproduction image or a rewind reproduction image of the moving image data and a best shot image, and
A computer program characterized by comprising:
JP2007217875A 2007-08-24 2007-08-24 Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program Expired - Fee Related JP4835545B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007217875A JP4835545B2 (en) 2007-08-24 2007-08-24 Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007217875A JP4835545B2 (en) 2007-08-24 2007-08-24 Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program

Publications (2)

Publication Number Publication Date
JP2009055156A JP2009055156A (en) 2009-03-12
JP4835545B2 true JP4835545B2 (en) 2011-12-14

Family

ID=40505851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007217875A Expired - Fee Related JP4835545B2 (en) 2007-08-24 2007-08-24 Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program

Country Status (1)

Country Link
JP (1) JP4835545B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011010276A (en) * 2009-05-22 2011-01-13 Sanyo Electric Co Ltd Image reproducing apparatus and imaging apparatus
US20110096135A1 (en) * 2009-10-23 2011-04-28 Microsoft Corporation Automatic labeling of a video session
US10334218B2 (en) 2015-06-25 2019-06-25 Mitsubishi Electric Corporation Video reproduction device and video reproduction method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001167110A (en) * 1999-12-08 2001-06-22 Matsushita Electric Ind Co Ltd Picture retrieving method and its device
JP4778158B2 (en) * 2001-05-31 2011-09-21 オリンパス株式会社 Image selection support device
JP3984029B2 (en) * 2001-11-12 2007-09-26 オリンパス株式会社 Image processing apparatus and program
JP2005227957A (en) * 2004-02-12 2005-08-25 Mitsubishi Electric Corp Optimal face image recording device and optimal face image recording method
JP4685465B2 (en) * 2005-02-01 2011-05-18 パナソニック株式会社 Monitoring and recording device

Also Published As

Publication number Publication date
JP2009055156A (en) 2009-03-12

Similar Documents

Publication Publication Date Title
JP4618166B2 (en) Image processing apparatus, image processing method, and program
US10536661B2 (en) Tracking object of interest in an omnidirectional video
KR100827846B1 (en) Method and system for replaying a movie from a wanted point by searching specific person included in the movie
US9210319B2 (en) Method and system for capturing important objects using a camera based on predefined metrics
US9426409B2 (en) Time-lapse video capture with optimal image stabilization
JP4241709B2 (en) Image processing device
JP4775306B2 (en) Image processing apparatus, imaging apparatus, image display control method, and computer program
US9407804B2 (en) Method, apparatus, and non-transitory medium for generating a synthetic image from a series of captured images
US8421871B2 (en) Method and apparatus for image pickup and image processing
JP5863400B2 (en) Similar image search system
JP4645707B2 (en) Content data processing device
JP4645356B2 (en) VIDEO DISPLAY METHOD, VIDEO DISPLAY METHOD PROGRAM, RECORDING MEDIUM CONTAINING VIDEO DISPLAY METHOD PROGRAM, AND VIDEO DISPLAY DEVICE
JP2008288767A (en) Information processor, method, and program
US9363431B2 (en) Method and system for capturing important objects using a camera based on predefined metrics
TWI588590B (en) Video generating system and method thereof
US20170004140A1 (en) Method, apparatus and system for applying an annotation to a portion of a video sequence
KR20100103776A (en) Image processor, animation reproduction apparatus, and processing method and program for the processor and apparatus
WO2014065033A1 (en) Similar image retrieval device
JP4835545B2 (en) Image reproducing apparatus, imaging apparatus, image reproducing method, and computer program
JP6214762B2 (en) Image search system, search screen display method
US20090158157A1 (en) Previewing recorded programs using thumbnails
JP2010147950A (en) Device and method for processing image, and imaging device
JPH09247617A (en) Video signal recording/reproducing device
JP2006229467A (en) Photo movie creating apparatus, photo movie creating program, and object recognition method
KR102066857B1 (en) object image tracking streaming system and method using the same

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110912

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4835545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees