JPWO2014155961A1 - 画像生成装置、撮影装置、画像生成方法及びプログラム - Google Patents

画像生成装置、撮影装置、画像生成方法及びプログラム Download PDF

Info

Publication number
JPWO2014155961A1
JPWO2014155961A1 JP2015507992A JP2015507992A JPWO2014155961A1 JP WO2014155961 A1 JPWO2014155961 A1 JP WO2014155961A1 JP 2015507992 A JP2015507992 A JP 2015507992A JP 2015507992 A JP2015507992 A JP 2015507992A JP WO2014155961 A1 JPWO2014155961 A1 JP WO2014155961A1
Authority
JP
Japan
Prior art keywords
image
frame
unit
information
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015507992A
Other languages
English (en)
Other versions
JP6295442B2 (ja
Inventor
森岡 芳宏
芳宏 森岡
窪田 憲一
憲一 窪田
秀晃 畠中
秀晃 畠中
山内 栄二
栄二 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2014155961A1 publication Critical patent/JPWO2014155961A1/ja
Application granted granted Critical
Publication of JP6295442B2 publication Critical patent/JP6295442B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • H04N1/3875Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming combined with enlarging or reducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2621Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)

Abstract

撮影された画像の撮影情報を抽出するカメラワーク情報抽出部(315)と、撮影情報と撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定する構図情報計算部(316)と、撮影された画像から切り出し枠を用いて新たな画像を切り出し、所定サイズに変換する構図情報整形部(317)を備える。この構成により、画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、視聴者が見やすく好ましい画像となる。

Description

本開示は、ビデオカメラ等で撮影された画像から画像の一部を切り出して新たな画像を生成する画像生成装置及びそれを備えた撮影装置、さらには、撮影された画像から画像の一部を切り出して新たな画像を生成する方法及びプログラムに関する。
特許文献1には、動画撮影時に撮影操作に集中しなくても、注目被写体の動画を取得可能な撮像装置について記載されている。さらに特許文献1には、撮影された画像から特定被写体を検出し、特定被写体を含む一部の領域を切り出し画像として抽出し、切り出し画像の解像度を向上させる構成が開示されている。
特開2009−147727号公報
本開示の画像生成装置および本開示の撮影装置は、撮影された画像の撮影情報を抽出するカメラワーク情報抽出部と、撮影情報と撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定する構図情報計算部と、撮影された画像から切り出し枠を用いて新たな画像を切り出し、所定サイズに変換する構図情報整形部とを備える。
本開示の画像生成装置および本開示の撮影装置は、画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、視聴者が見やすく好ましい画像となる。
図1は、実施の形態1に係るビデオカメラの斜視図である。 図2は、実施の形態1に係るビデオカメラの概略構成を示すブロック図である。 図3は、図2の構図情報計算部の詳細を示すブロック図である。 図4は、実施の形態1に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図5は、ビデオカメラ100で撮影された画像の一例を示す図である。 図6は、図5の撮影された画像の一例において、人物の検出とフレーム間の動きを検出した結果を説明する図である。 図7は、図5の撮影された画像の一例において、図6の人物検出とフレーム間の動きを検出した結果から切り出し枠の決定を説明する図である。 図8は、実施の形態1に係る制約条件の一例を示す図である。 図9は、図7で決定した切り出し枠を説明する図である。 図10は、図9の各フレームの切り出し枠を元の撮影した画像のサイズに引き伸ばした図である。 図11は、実施の形態2に係るビデオカメラの概略構成を示すブロック図である。 図12は、図11の構図情報計算部の詳細を示すブロック図である。 図13は、実施の形態2に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図14は、実施の形態1に係るビデオカメラ100で撮影された画像の切り出しを説明する図である。 図15は、実施の形態2に係るビデオカメラ1100で撮影された画像の切り出しを説明する図である。 図16は、実施の形態3に係るビデオカメラの概略構成を示すブロック図である。 図17は、実施の形態3に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図18は、実施の形態3に係る撮影された画像と新たに生成する画像の属性情報の記録を説明する図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために、提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
(実施の形態1)
特許文献1のように、撮影された画像から特定の被写体を含む領域を抽出し、抽出した画像に基づいて画像を生成し、それらをつなぎ合わせて動画を生成すると、視聴者に見やすい画像が生成できない場合がある。
例えば、動画の撮影時に構図等を考慮して撮影された動画から特定の被写体を含む領域だけを抽出すると、構図が崩れ、視聴者が見にくい画像となることがある。さらに、生成された動画が、動きの激しい動画や激しい明滅を含むような動画が生成されることがある。
本開示は、かかる点に鑑みてなされたものであり、その目的とするところは、撮影された画像の一部を切り出して新たな画像を生成する場合に、その生成される画像が視聴者に見やすい画像となる画像生成装置及びそれを備えた撮影装置、さらには、撮影された画像から画像の一部を切り出して新たな画像を生成する方法及びプログラムを提供することにある。
<1.ビデオカメラの構成>
図1は、撮影装置の一例としてのビデオカメラ100の斜視図である。ビデオカメラ100は画像を撮影し、それを記録し、再生するものである。また、ビデオカメラ100は撮影した画像から新たな画像を生成する。
図2は、ビデオカメラ100の概略構成を示すブロック図である。
ビデオカメラ100は、レンズ群200、撮像素子201、画像AD変換部(Analog Digital Converter)202と画像信号処理部203、画像信号圧縮部204、レンズ制御モジュール205、姿勢検出部206、外部入力部207、マイクロフォン208、音声AD変換部(Analog Digital Converter)209、音声信号圧縮部210、画像信号伸張部211、映像表示部212、音声信号伸張部213、音声出力部214、出力I/F(Interface)215、制御部300、クロック301と記憶部302を備えている。このビデオカメラ100が画像生成装置及び撮影装置を構成する。
レンズ群200は、複数のレンズで構成されており、被写体からの入射光を撮像素子201上に結像させる。また、レンズ群200は、複数のレンズ間の距離を調整可能に構成されており、レンズ間の距離を変えることによって焦点距離やズーム倍率を変化させる。焦点距離やズーム倍率の調整は、ユーザが手動で行ってもよいし、制御部300が行ってもよい。
撮像素子201は、入射する光を電気信号に変換する。撮像素子201は、CCD又はCMOSで構成されている。撮像素子201は、撮像面上の任意の範囲の電気信号を出力する。また、撮像素子201は、画像に関する情報以外にも、3原色点の色度空間情報、白色の座標、及び3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、及び3原色または輝度信号のガンマ情報等の情報も出力することが可能である。そのため、撮像素子201からの出力は、画像AD変換部202だけでなく制御部300の後述するカメラワーク情報抽出部315にも入力される。
画像AD変換部202は、撮像素子201が出力するアナログの電気信号をデジタル信号に変換する。
画像信号処理部203は、画像AD変換部202が出力したデジタル信号を増幅させ、ホワイトバランス調整、色味補正等の所定の処理を行う。画像信号処理部203は、例えば、画像信号変換用のICで構成されている。画像信号処理部203からの出力は、画像信号圧縮部204だけでなく制御部300の後述する画像解析部313にも入力される。
画像信号圧縮部204は、画像信号処理部203から出力されるデジタル映像信号に所定の符号化変換を行い、データ量を圧縮する。符号化変換の具体例としては、MPEG2、MPEG4、H264/MPEG4 AVC等の符号化方式がある。画像信号圧縮部204からの出力は、制御部300へ入力される。画像信号圧縮部204は、例えば、画像信号圧縮伸張用のICで構成されている。画像信号圧縮部204は、画像信号処理部203から出力されるデジタル映像信号だけでなく、制御部300の後述する構図情報整形部317から出力される信号も入力され、この入力された信号に所定の符号化変換を行い、データ量を圧縮する。
レンズ制御モジュール205は、レンズ群200の状態を検出したり、レンズ群200を動作させたりするものである。レンズ制御モジュール205は、レンズ制御用モータと、レンズ位置センサを有している。レンズ位置センサは、レンズ群200を構成する複数のレンズ間の距離又は位置関係等を検出する。レンズ位置センサは、その検出信号を制御部300に出力する。レンズ制御モジュール205は、2種類のレンズ制御モータを有している。1つのレンズ制御モータは、制御部300から制御信号に基づいて、レンズ群200を光軸方向に移動させる。これにより、レンズ群200の複数のレンズ間の距離が変更され、レンズ群200の焦点距離及びズーム倍率が調整される。もう1つのレンズ制御モータは、制御部300から制御信号に基づいて、レンズ群200のうちの少なくとも1つのレンズ、例えば、像ぶれ補正用のレンズを光軸に直交する面内で移動させる。これにより、像ぶれを補正する。
姿勢検出部206は、ビデオカメラ100本体の姿勢状態を検出する。姿勢検出部206は、加速度センサ、角速度センサ、仰角・俯角センサを有する。これらのセンサにより、撮影時にビデオカメラ100がどのような姿勢になっているかを認識できる。加速度センサ及び角速度センサは、ビデオカメラ100の姿勢を詳細に検出するために、直交3軸方向、すなわち、ビデオカメラ100の上下方向、前後方向、左右方向の姿勢をそれぞれ検出できることが好ましい。
なお、姿勢検出部206は、上記の構成に限らず、上記センサの何れかだけで構成されていてもよいし、上記センサ以外のセンサを有していてもよい。
外部入力部207は、ビデオカメラ100に外部からの情報を入力する。外部入力部207からの信号は、制御部300へ入力される。また、図2において外部入力部207からの信号は、制御部300のカメラワーク情報抽出部315だけに入力されているが、レンズ制御部311等の入力操作に対応する部分にも入力される。撮影時には、この外部入力部207を介してビデオカメラ100に外部からの各種情報が入力される。例えば、外部入力部207は、ユーザからの情報の入力を受け付ける入力インタフェースの1つである入力ボタンや、ビデオカメラ100が三脚に設置されているか否かを検出する三脚センサを含む。ユーザが入力ボタンを操作することによって、撮影の開始、終了、撮影された画像の再生、撮影された画像の記憶部302への記録及び後述する撮影された画像の一部を切り出して新たな画像を生成する等、ユーザからの各種要求をビデオカメラ100に伝えることが可能である。三脚センサは、ビデオカメラ100の三脚が固定される部分に設けられたスイッチで構成されている。三脚センサにより、三脚を使用した撮影か否かを判定できる。
なお、入力ボタンや三脚センサに限らず、タッチパネル、ジョイスティック、等、ユーザからの指示内容を受け付けることができるデバイスであれば何でもよい。
マイクロフォン208は、ビデオカメラ100が画像を撮影している時に、ビデオカメラ100の周囲の音を収音し、電気信号に変換して、アナログ音声信号として出力する。
音声AD変換部209は、マイクロフォン208が出力するアナログ音声信号データをデジタル音声信号である音声データに変換する。
音声信号圧縮部210は、音声AD変換部209が出力したデジタル音声信号を予め決められた符号化方式で符号化する。符号化にはMP3(MPEG Audio Layer−3)やAAC(Advanced Audio Coding)等の方式がある。音声信号圧縮部210は、例えば、音声信号圧縮用のICで構成されている。
画像信号伸張部211は、制御部300から出力される映像信号を復号する。画像信号伸張部211からの出力は、映像表示部212に入力される。
映像表示部212は、ビデオカメラ100に記録した画像や、ビデオカメラ100でリアルタイムに撮影している画像、過去に撮影した画像や、後述する撮影した画像から一部の画像を切り出して新たに生成した画像を表示する。それ以外にも、映像表示部212は、撮影に関する情報や機器情報等の各種情報を表示する。映像表示部212は、例えば、タッチパネル式の液晶ディスプレイで構成されている。タッチパネル式の映像表示部212は、外部入力部207としても機能する。画像信号伸張部211は、例えば、画像信号伸張用のICで構成されている。
音声信号伸張部213は、制御部300から出力される音声信号を復号する。音声信号伸張部213は、例えば、音声信号伸張用のICで構成されている。
音声信号伸張部213からの出力は、音声出力部214に入力される。音声出力部214は、画像に付随する音声を出力する。それ以外にも、音声出力部214は、ビデオカメラ100からユーザへ報知する警告音を出力する。音声出力部214は、例えば、スピーカーで構成されている。
出力I/F215は、映像信号をビデオカメラ100から外部へ出力するためのインタフェースである。具体的は出力I/F215は、ビデオカメラ100と外部機器とをケーブルで接続する場合のケーブルインタフェースや、映像信号をメモリカードに記録する場合のメモリカードインタフェース等である。
制御部300は、ビデオカメラ100の全体を制御する。制御部300は、撮像素子201、画像信号処理部203、画像信号圧縮部204、レンズ制御モジュール205、姿勢検出部206、外部入力部207、音声AD変換部209、音声信号圧縮部210、画像信号伸張部211、音声信号伸張部213、出力I/F215及び記憶部302等との間で信号の授受が可能に構成されている。本実施の形態では、制御部300は、CPUで構成されている。制御部300は、記憶部302に格納されたプログラムを読み込んで実行することによってビデオカメラ100の各種制御を実行する。制御部300が実行する制御の例としては、例えば、レンズ群200の焦点距離やズームの制御や、姿勢検出部206や外部入力部207からの入力信号の処理や、画像信号処理部203、画像信号圧縮部204、音声信号圧縮部210、画像信号伸張部211及び音声信号伸張部213等のICの動作制御等である。また、図示は省略するが、制御部300とレンズ制御モジュール205等との間では、適宜、信号がAD変換又はDA変換される。なお、制御部300は、IC等の集積回路で構成することもできる。
クロック301は、ビデオカメラ100内で動作する制御部300等に処理動作の基準となるクロック信号を供給する。なお、クロック301は、利用する集積回路や扱うデータによって、単一または複数のクロックを用いることも可能である。また、ひとつの発振子のクロック信号を任意の倍数に乗じて使用してもよい。
記憶部302は、ROM(Read Only Memory)、RAM(Random Access Memory)及びHDD(Hard Disk Drive)を含んでいる。ROMは、制御部300が処理するプログラムやプログラムを動作させるための各種データを記憶しておく。RAMは、制御部300が処理するプログラム実行時に使用するメモリ領域等として使用される。また、RAMは、ICのメモリ領域としても使用され得る。HDDは、画像信号圧縮部204により符号化変換された映像データや音声信号圧縮部210により符号化変換された音声データや、後述する撮影された画像から画像の一部を切り出して生成した画像等の各種データを保存する。また、HDDは、制御部300で実行するプログラムを記憶している。なお、記憶部302は、HDDに限られず、半導体メモリに記憶されていてもよいし、SDメモリカード、CD−ROMやDVD等の可搬型記録媒体を含んでいてもよい。
次に、制御部300について詳細に説明する。ここでは、制御部300のうち、撮影された画像から画像の一部を切り出して新たな画像を生成するために必要な構成について説明する。制御部300は、一般的なビデオカメラと同様の機能を発揮させるための構成、例えば、撮影した画像を記録したり、再生したりする構成も有する。
制御部300は、レンズ制御モジュール205を制御するレンズ制御部311と、撮像素子201を制御する撮像制御部312と、画像信号処理部203からの出力を解析する画像解析部313と、音声AD変換部209からの出力を解析する音声解析部314と、ビデオカメラ100の撮影状態を生成するカメラワーク情報抽出部315と、ビデオカメラ100が撮影した画像を解析・分析し、新たに生成する画像の切り出し枠を決定する構図情報計算部316と、決定した切り出し枠を用いて新たに画像を生成する構図情報整形部317と、映像信号と音声信号とを多重化する多重化部318と、再生を行う再生部319を有している。制御部300は、記憶部302に記憶されたプログラムを読み込んで実行することによって、後述する各種の処理を実現する。
レンズ制御部311は、レンズ制御モジュール205のレンズ位置センサの検出信号及び姿勢検出部206の各種センサの検出信号が入力されている。レンズ制御部311は、これらの検出信号及び撮像素子201等の他の構成要素からの情報に基づいて、レンズ群200を適正に配置させるための制御信号をレンズ制御モータに出力する。こうして、レンズ制御部311は、ズーム制御、フォーカス制御、像ぶれ補正制御等を行う。また、レンズ制御部311は、レンズ群200の制御信号をカメラワーク情報抽出部315へ出力する。また、姿勢検出部206の各種センサの検出信号は、カメラワーク情報抽出部315へも出力されている。
撮像制御部312は、撮像素子201の動作を制御する。撮像素子201に対して、撮影時の露出量、撮影速度、及び感度等を制御する。撮像制御部312から出力される制御信号は、撮像素子201だけでなく、カメラワーク情報抽出部315へも出力される。
画像解析部313は、画像信号処理部203からの映像データに基づいて画像の特徴を抽出する。画像解析部313は、画像の色情報、例えば、画像に含まれる色の分布の情報や、ホワイトバランス情報を検出する。色の分布の検出は、デジタル映像信号を形成するデータに含まれる色情報を確認することで実現可能である。また、画像解析部313は、画像に人物の顔が含まれている場合には、画像の中から顔検出を行う。顔検出については、パターンマッチング等を用いることにより実現可能である。
音声解析部314は、音声AD変換部209からの音声データを解析して、特徴のある音を抽出するものである。ここで特徴のある音とは、例えば、撮影者の声、特定の単語の発音、歓声、及び銃声等がある。これらの音は、これらの音が持つ特有の周波数を予め登録しておき、それとの比較により判別するなどの方法等によって抽出可能である。また、これ以外にも、例えば、音の入力レベルが所定レベル以上のときに特徴のある音であると判定するようにしてもよい。
カメラワーク情報抽出部315は、撮影している画像に関する撮影情報を抽出する。カメラワーク情報抽出部315には、撮像素子201、姿勢検出部206、外部入力部207、レンズ制御部311、撮像制御部312、画像解析部313及び音声解析部314からの出力信号が入力されている。カメラワーク情報抽出部315は、これらの出力信号に基づいて撮影情報を抽出する。
この画像に関する撮影情報には、画像の撮影時の撮影装置の状態やカメラワークなどの撮影に関する情報、画像そのものが含む被写体や背景に関する情報、画像に付帯する音声に関する情報が含まれる。例えば、撮影時の撮影装置に関する情報の例としては、焦点距離、ズーム倍率、露出、撮影速度、感度、3原色点の色空間情報、ホワイトバランス、3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、3原色または輝度信号のガンマ情報、色分布、顔認識情報、カメラ姿勢、例えば、加速度、角速度、仰角・俯角等であり、撮影時刻、例えば、撮影開始時刻、終了時刻であり、撮影インデックス情報、ユーザ入力内容、フレームレート、サンプリング周波数等が挙げられる。例えば、カメラワーク情報抽出部315は、レンズ制御部311の制御信号に基づいて、焦点距離やズーム倍率を撮影情報として抽出する。また、カメラワーク情報抽出部315は、姿勢検出部206の検出信号に基づいて、加速度、角速度、仰角・俯角等のカメラ姿勢を検出し、検出したカメラ姿勢からカメラの向きを左右に振る動作であるパン、カメラの向きを上下に振るティルト等の撮影時のビデオカメラ100のカメラの動作を撮影情報として抽出する。さらには、ビデオカメラ100を動作させた後にビデオカメラ100を静止させて撮影した部分を撮影情報として抽出することができる。このように、カメラワーク情報抽出部315は、入力された信号そのものから撮影情報を抽出する場合もあれば、入力された信号と組み合わせたり、分析したりすることによって撮影情報を抽出する場合もある。
構図情報計算部316は、カメラワーク情報抽出部315で抽出された撮影情報に基づいて、新たに生成する画像の切り出し枠を決定する。この切り出し枠の決定の詳細については後述する。
構図情報整形部317は、構図情報計算部316で決定した切り出し枠に基づいて、画像信号処理部203から出力された撮影した画像から新たに画像を生成する。生成した画像は画像信号圧縮部204へ出力する。画像の生成の詳細については後述する。
多重化部318は、画像信号圧縮部204からの符号化映像データと音声信号圧縮部210からの符号化音声データを多重化して出力する。多重化部318により多重化されたデータは、記憶部302に格納される。多重化の方式としては、例えば、MPEGのTS(Transport Stream)方式等である。ただし、これに限定されるものではない。
なお、本実施の形態では、多重化する場合を例として示しているが、必ずしも多重化しなくてもよい。
これらカメラワーク情報抽出部315、構図情報計算部316、構図情報整形部317及び多重化部318の処理は、撮影時、詳しくは、撮影中又は撮影直後に逐次、実行される。
再生部319は、撮影の終了後に、ユーザの入力に基づいて切り出した画像の再生を実行する。詳しくは、再生部319は、記憶部302に記憶された多重化されたデータを読み出し、再生させるべき部分の符号化映像データ及び符号化音声データをそれぞれ画像信号伸張部211及び音声信号伸張部213に出力する。出力された符号化映像データ及び符号化音声データはそれぞれ、画像信号伸張部211及び音声信号伸張部213で復号され、映像表示部212及び音声出力部214から出力される。こうして、画像の中から撮影した画像から切り出した画像の再生が実行される。
<2.新たな画像の生成>
次に、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を、撮影された画像の一例を用いて説明する。撮影された画像から画像の一部を切り出して、新たな画像を生成する処理は、カメラワーク情報抽出部315と構図情報計算部316と構図情報整形部317で行う。
図3は構図情報計算部316の詳細な構成を示す図である。カメラワーク情報抽出部315から出力された撮影情報を入力信号とする。入力された撮影情報から撮影した画像に人物が含まれているか、人物が含まれている場合、顔がどちらを向いているか、人物が誰なのか等を検出する人検出部401と、入力された撮影情報から画像の1コマの単位であるフレームのフレーム間において人物や物体が動いているかどうかを検出する動き検出部402と、前後のフレームにおいて特徴的な図形が動いているかどうか、すなわちビデオカメラ100を固定して撮影しているかどうかを検出するエッジ検出部403と、撮影情報と人検出部401の検出結果と動き検出部402の検出結果とエッジ検出部403の検出結果とから切り出し枠を決定する切り出し枠決定部404とで構成される。
図4は、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。
図5は、ビデオカメラ100で撮影された画像の一例を示す図である。図5において、撮影した画像を画像の1コマの単位であるフレームで示している。画像は、フレームF1、フレームF2、フレームF3、フレームF4、フレームF5、フレームF6、フレームF7、フレームF8、フレームF9の順で撮影された一例である。この画像は、ビデオカメラ100を三脚で固定して撮影されたものである。フレームF1では、人物Aが撮影された画面のやや左側に正面を向いて立っており、全身が撮影されている。フレームF2はフレームF1に対して、人物AがフレームF1で立っていた位置で、撮影しているビデオカメラ100から見て、右を向いている。フレームF3はフレームF2に対して、撮影された画面の右端に人物Bが見えている。フレームF4はフレームF3に対して、人物Bが、撮影している画面の右端から左側に向かって歩いている。フレームF5はフレームF4に対して、人物Bが、人物Aの右隣りまで歩いてきた。フレームF6はフレームF5に対して、人物Bは、人物Aの右隣りで立ち止まっている。また、人物Aは顔を左に向けた。フレームF7はフレームF6に対して、人物Aは左側に向きを変えて左端に向かって歩き始めた。フレームF8はフレームF7に対して、人物Bが正面を向いた。フレームF9はフレームF8に対して、人物Aが撮影された画面の左端に消えようとしている。図5の撮影された画像の一例を用いて、新たな画像を生成する手順を説明する。
(ステップS401)カメラワーク情報抽出部315は、撮影している画像に関する撮影情報を抽出する。カメラワーク情報抽出部315には、撮像素子201、姿勢検出部206、外部入力部207、レンズ制御部311、撮像制御部312、画像解析部313及び音声解析部314からの出力信号が入力されている。カメラワーク情報抽出部315は、これらの出力信号に基づいて撮影情報を抽出する。
この画像に関する撮影情報には、画像の撮影時の撮影装置の状態やカメラワークなどの撮影に関する情報、画像そのものが含む被写体や背景に関する情報、画像に付帯する音声に関する情報が含まれる。例えば、撮影時の撮影装置に関する情報の例としては、焦点距離、ズーム倍率、露出、撮影速度、感度、3原色点の色空間情報、ホワイトバランス、3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、3原色または輝度信号のガンマ情報、色分布、顔認識情報、カメラ姿勢、例えば、加速度、角速度、仰角・俯角等であり、撮影時刻、例えば、撮影開始時刻、終了時刻であり、撮影インデックス情報、ユーザ入力、フレームレート、サンプリング周波数等が挙げられる。例えば、カメラワーク情報抽出部315は、レンズ制御部311の制御信号に基づいて、焦点距離やズーム倍率を撮影情報として抽出する。また、カメラワーク情報抽出部315は、姿勢検出部206の検出信号に基づいて、加速度、角速度、仰角・俯角等のカメラ姿勢を検出し、検出したカメラ姿勢からカメラの向きを左右に振る動作であるパン、カメラの向きを上下に振るティルト等の撮影時のビデオカメラ100のカメラの動作を撮影情報として抽出する。さらには、ビデオカメラ100を動作させた後にビデオカメラ100を静止させて撮影した部分を撮影情報として抽出することができる。このように、カメラワーク情報抽出部315は、入力された信号そのものから撮影情報を抽出する場合もあれば、入力された信号と組み合わせたり、分析したりすることによって撮影情報を抽出する場合もある。
(ステップS402)次にカメラワーク情報抽出部315で抽出した撮影情報を用いて人検出、動き検出、エッジ検出を行う。
人検出部401は、撮影情報から人物を検出する。人物の検出は単に人であるかを検出してもいいし、記憶部302にあらかじめ認識させたい人物の情報を登録しておき、登録しておいた情報と比較することで検出した人物が誰かを検出してもよい。また、検出した人物が正面を向いているか後ろを向いているかの向きも検出する。さらに人検出部401は、撮影された画像の遠近法の観点から画像に映し出される人物を検出してもよい。例えば、画像に映し出されている人物Aと人物Bがあった場合に、人物Aが人物Bよりも大きく写っている場合には、人物Aが前方に配置され、人物Bが後方に配置されていると検出してもよい。
動き検出部402は、フレーム間で動きのある部分を特定し、その部分について、前のフレームから後のフレームに対してどのような方向に、どれくらいの速さで動いているかを特定する。「動き」を検出する技術は、フレーム間の動きベクトル等の技術を用いて実現することが可能である。
エッジ検出部403は、撮影された画像において、背景となる部分を特定する分析を行う。具体的には「動き」を特定する処理において、「動き」の大きさが小さい部分を背景として認識する。これにより背景部分を識別できる。
エッジ検出部403は、撮影された画像の被写体の輪郭の強さやテクスチャに基づいて背景部分を特定してもよい。さらに、撮影された画像の色についての情報、例えばR、G、Bのそれぞれについて色の分布情報をヒストグラムにした情報を解析して背景部分を特定してもよい。さらに、エッジ検出部403は、特定した背景部分において、建物の窓枠や道路標識など特徴的な図形が動いているかどうか、すなわちビデオカメラ100を固定して撮影しているかどうかも検出する。
図6は、図5の撮影された画像の一例において、人物の検出とフレーム間の動きを検出した結果を説明する図である。
フレームF1において、人物Aは人検出されて人物であると検出され、検出した結果が人検出枠w11で囲まれて表示されている。
フレームF2において、人物Aは人検出で継続して人物であると検出され、検出した結果が人検出枠w21で囲まれて表示されている。
フレームF3において、人物Aは人検出で継続して人物であると検出され、検出した結果が人検出枠w31で囲まれて表示されている。
フレームF4において、人検出で人物Aに加えて人物Bを人物であると検出され、検出した結果が人物Aに対しては人検出枠w41で、人物Bに対して人検出枠w42で表示されている。さらにフレームF4ではフレームF3に対して人物Bが左側に歩いたことを動き検出で検出され、検出された「動き」が動きベクトルV4で表示されている。
フレームF5において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w51、人検出枠w52で囲まれて表示されている。さらにフレームF5ではフレームF4に対して人物Bは引き続き左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV5で表示されている。
フレームF6において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w61、人検出枠w62で囲まれて表示されている。
フレームF7において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w71、人検出枠w72で囲まれて表示されている。さらにフレームF7ではフレームF6に対して人物Aは左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV7で表示されている。
フレームF8において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w81、人検出枠w82で囲まれて表示されている。
フレームF9において、人物Aは撮影された画面の左端に消えようとしているため人検出されず、人物Bは人検出で継続して人物であると検出され、検出した結果が人検出枠w92で囲まれて表示されている。さらにフレームF9ではフレームF8に対して人物Aは左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV9で表示されている。
ここで、図6において、人検出枠の検出は、人検出部401で行い、動きベクトルの検出は動き検出部402で行った。図6において、撮影情報にビデオカメラ100が固定された状態で撮影されていたため、エッジ検出部403における検出は実施しなかった。
(ステップS403)切り出し枠決定部404は、撮影情報と人検出部401の検出結果と動き検出部402の検出結果とエッジ検出部403の検出結果とから切り出し枠を決定する。
図7は、図5の撮影された画像の一例において、図6の人検出結果とフレーム間の動きを検出した結果から切り出し枠を決定する方法を説明する図である。
撮影された画像から一部の画像を切り出す場合に、守るべき制約条件がある。図8は制約条件の一例を示す図である。制約条件の種類としては、枠そのものの制約、フレーム毎の制約、フレーム間にまたがる制約等がある。
枠そのものの制約として、切り出す画像の枠の大きさ(サイズ)の制約がある。例えば、切り出す枠は撮影された画面の1/4以上であるという制約である。さらにフレーム間の切り出す画像の枠の大きさ(サイズ)の変化量の制約、例えば、大きさの変化量はW%以内(Wは小数)等、の制約がある。
フレーム毎の制約は、フレームの構図に関する制約である。フレームの構図に関する制約として、三分割構図、三角構図、対角線構図、日の丸構図、シンメトリー構図がある。三分割構図は、切り出す画面の縦横を等間隔に引いた水平線と垂直線それぞれ2本ずつで画面を上下・左右方向にそれぞれ3等分して9等分すると仮定し、それらの線上や線同士の交点上に構図上の重要な要素を配置する制約である。三角構図は、画面の中央部に高い木やビルなどを配置し、三角形に配置する制約である。対角線構図は、並木や道路・木の枝など、直線的に伸びる被写体を対角線上に配置する制約である。日の丸構図は、被写体を日の丸のように真ん中に配置する制約である。シンメトリー構図は、被写体を左右対称や上下対称に配置する制約である。フレームの構図に関する制約のうち、どれか1つにあてはまるように構図を決定する。
フレーム間の制約は、フレーム間のカメラワークに関する制約である。フレーム間のカメラワークに関する制約は、撮影しているビデオカメラの左右の移動時間、例えば、S1秒以上S2秒以下、上下の移動時間、例えばS3秒以上S4秒以下、ズームの縮小時間、例えば、S5秒以上S6秒以下、ズームの拡大時間、例えばS7秒以上S8秒以下等の制約である(S1、S2、S3、S4、S5、S6、S7、S8は小数)。制約条件は記憶部302に記憶されている。フレーム間のカメラワークに関する制約は、全てにおいて制約を満たすように構図を決定する。
これらの制約条件を満たすように切り出し枠を決定する。制約条件である、枠そのものの制約、フレーム毎の制約、フレーム間の制約を全て満たすように構図を決定できない場合は、それぞれの制約に優先順位を付与し、できる限りの制約条件を満たすように構図を決定する。例えば優先順位として、優先度の高い順として枠そのものの制約、フレーム間の制約、フレーム毎の制約とする。
まず、撮影された画像は、撮影条件として三脚で固定されて撮影されている。従って、画像を切り出す時に画像は固定されていることを前提として決定する。
フレームF1において、人検出されているのは人物Aのみの人検出枠w11であり、動きベクトルは検出されていないため、人検出枠w11から切り出し枠を決定する。切り出し枠は撮影された画面の1/4以上であることが望ましく、人検出枠w11は人物Aが正面を向いて立っている。制約条件である枠そのものの制約と、フレームの構図に関する制約から、人物Aを全身から胸より上の部分のみかつ人物Aが中心に配置される構図、例えば、シンメトリー構図に従う構図になるように切り出し枠n1を決定する。
フレームF2において、人検出枠w21の人物Aは右を向いたので、制約条件である切り出す画像の枠の大きさの制約、フレームF1で切り出した切り出し枠n1との間の切り出す画像の枠の大きさの変化量の制約、フレームの構図に関する制約、フレーム間のカメラワークに関する制約から、人物Aを全身から胸より上の部分のみで、人物Aを切り出し枠の左側に配置される構図、例えば、三分割構図になるように切り出し枠n2を決定する。
フレームF3において、人物Aは人検出で継続して人物であると検出され、検出した結果を人検出枠w31で囲まれて表示されているので、切り出し枠n2と同じ切り出し枠を切り出し枠n3として決定する。
フレームF4において人検出枠w41、人検出枠w42、動きベクトルV4とから切り出し枠を決定する。人物Aと人物Bの両方を胸から上の部分で切り出すために、切り出す画像の枠の大きさの制約、フレームF2で切り出した切り出し枠n2との間の切り出す画像の枠の大きさの変化量の制約とフレーム間のカメラワークに関する制約で左右の移動時間から切り出し枠n4を決定する。この場合、切り出し枠n2の中に人物Bの顔が全て入るように切り出されていないが、フレームの構図に関する制約よりも、フレーム間カメラワークに関する制約を優先させて決定したためである。
フレームF5において、人検出枠w51、人検出枠w52、動きベクトルV5で表示されている。制約条件である切り出す画像の枠の大きさの制約、フレームF4で切り出した切り出し枠n4との間の切り出す画像の枠の大きさの変化量の制約、フレームの構図に関する制約、フレーム間のカメラワークに関する制約から、切り出し枠n5を決定する。
フレームF6において、フレームF5に対して大きな変化がないため、切り出し枠n5と同じ位置の切り出し枠を切り出し枠n6として決定する。
フレームF7において、人検出枠w71、人検出枠w72、動きベクトルV7とから切り出し枠を決定する。人物Aと人物Bの両方を胸から上の部分で切り出し、かつ人物Aは動いているので、フレームF6で切り出した切り出し枠n6との間の切り出す画像の枠の大きさの変化量の制約を優先して、切り出し枠n7を決定する。
フレームF8において、フレームF7に対して大きな変化がないため、切り出し枠n7と同じ位置の切り出し枠を切り出し枠n8として決定する。
フレームF9において、人物Aは撮影された画面の左端に消えようとしているため人検出されず、動きベクトルV9は検出されているので、人物Bを中心として制約条件を満たすように切り出し枠n9を決定する。
図9は、図7で決定した切り出し枠を説明する図である。切り出し枠決定部404は、上述したように各フレームについて切り出し枠を決定した。
(ステップS404)構図情報整形部317は、画像信号処理部203の出力信号を構図情報計算部316で切り出した切り出し枠で切り取り、切り取った画像を撮影した画像と同じ大きさに引き伸ばし、新たな画像を生成する。新たに生成した画像は、画像信号圧縮部204に出力する。
図10は、図9の各フレームの切り出し枠を元の撮影した画像のサイズに引き伸ばした図である。新たな画像として、フレームNF1、フレームNF2、フレームNF3、フレームNF4、フレームNF5、フレームNF6、フレームNF7、フレームNF8、フレームNF9が生成される。
<3.まとめ>
以上により、本実施の形態で説明するビデオカメラ100は、撮影した画像の一部を切り出して新たな画像を生成する。その生成される新たな画像は、記憶部302に記録された制約条件に基づいて、撮影された画像から切り出される。そのため、ビデオカメラ100での画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、より好ましい画像となる。
なお、本実施の形態で説明した制約条件は、一例であり、これに限らず、上述した制約条件のうちの少なくとも1つを制約条件としてもよいし、他の制約条件を用いてもよい。他の制約条件として、例えば、道路や川など曲線でできているものの曲線を取り入れてS字状に配置するS字型構図や、道路や川などのカーブを取り入れてC字状に配置するC字型構図がある。
また、図5の撮影された画像は、人物のみであったが、人物と自動車等の物体が複数動いている画像から切り出す場合は、切り出し枠の決定を、検出した人物や物体全ての重心から切り出し枠を決定するとしてもよいし、切り出す中心となる人物や物体を予め優先度をつけて付与しておき、優先度に基づいて切り出し枠を決定してもよい。さらに優先度は、外部入力部207から指定してもよい。
なお、本実施の形態において、新たに生成した画像は、多重化部318で撮影した画像と一緒に多重化され、記憶部302に記憶された後に再生部319で再生するものとしていたが、記憶部302で記憶させる前に再生部319から再生させてもよい。
なお、本実施の形態において、新たに生成する画像のサイズは撮影した画像のサイズに引き伸ばしたが、撮影した画像のサイズである必要はなく、サイズは外部入力部207から指定してもよいし、あらかじめ決めておいてもよい。
(実施の形態2)
実施の形態1において、撮影した画像から新たな画像を生成する際に、制約条件を満たしたとしても、生成された新たな画像のフレーム間で画像が滑らかにならない場合がある。例えば、撮影しているビデオカメラ100のズーム速度が所定速度よりも速い場合や、人物や物体の動きが所定速度よりも早い場合等である。本実施の形態では、生成する新たな画像のフレーム間で滑らかにするための補間処理について説明する。
図11は、実施の形態2に係るビデオカメラ1100の概略構成を示すブロック図である。ビデオカメラ1100は、新たな画像を生成する時の切り出し枠を決定する点で実施の形態1のビデオカメラ100と異なる。具体的には、ビデオカメラ1100の基本的な構成は、ビデオカメラ100と略同様である。そこで、実施の形態1と同様の構成については、同様の符号を付して説明を省略し、異なる部分を中心に説明する。
実施の形態1に対して異なる構成として、ビデオカメラ1100は、実施の形態1のビデオカメラ100に対して、制御部1300の構成が異なる。制御部1300は、実施の形態1の制御部300に対して、構図情報計算部1316の構成が異なる。
図12は、構図情報計算部1316の構成の詳細を示すブロック図である。
構図情報計算部1316は、切り出し枠決定部404で切り出し枠を仮決定した後に、フレーム間の切り出し枠の連続性から切り出した画像が滑らかに再生できるように切り出し枠を補間処理する。切り出し枠の補間処理は、スプライン補間処理やラグランジュ補間処理を用いる。
図13は、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。図4の実施の形態1のフローチャートと異なる点は、ステップS403とステップS404の間にステップS1301が追加されている点である。
ステップS1301において、切り出し枠決定部404で切り出し枠を仮決定した後に、フレーム間の切り出し枠の連続性から切り出した画像が滑らかに再生できるように切り出し枠を補間する。切り出し枠の補間は、スプライン補間やラグランジュ補間を用いる。
次に、切り出し枠を補間処理していない場合と切り出し枠を補間処理した場合でどのように切り出した画像が変化するかを説明する。図14は、ビデオカメラ100で撮影された画像の切り出しを説明する図である。すなわち、切り出し枠を補間処理していない場合の一例である。図15は、ビデオカメラ1100で撮影された画像の切り出しを説明する図である。すなわち、切り出し枠を補間処理した場合の一例である。図14の上段は、ビデオカメラ100で撮影した画像であり、画像は、フレームF21、フレームF22、フレームF23の順で撮影された一例である。図15の上段はビデオカメラ1100で撮影した画像であり、ビデオカメラ100と同じように撮影した画像なため、同じフレーム番号とし、フレームF21、フレームF22、フレームF23の順で撮影されたものとする。図14の上段において、実施の形態1で説明したように切り出し枠を決定する。フレームF21に対して切り出し枠w21、フレームF22に対して切り出し枠w22、フレームF23に対して切り出し枠w23を決定する。図14の中段は各フレームについて、切り出し枠を取り出したものである。図14の下段は各フレームの切り出し枠を撮影時の大きさに引き伸ばし、新たな画像であるフレームNF21、フレームNF22、フレームNF23が生成されたものである。
図14の新たに生成された画像は、フレーム間で人物のサイズが急激に変化している。本実施の形態では、フレーム間の人物のサイズを緩やかに変化させる。図15の上段において、実施の形態1で説明したように切り出し枠を決定する。この時点では決定した切り出し枠は確定したものではなく、仮決定である。フレームF21に対して切り出し枠w21、フレームF22に対して切り出し枠w22、フレームF23に対して切り出し枠w23を決定する。フレームF22の切り出し枠w22を基準としてフレームF21の切り出し枠w21とフレームF23の切り出し枠w23を補間処理する。図15の上段において、フレームF21の切り出し枠w21を補間方向i1に補間処理し、切り出し枠w31とする。図15の上段において、フレームF23の切り出し枠w23を補間方向i3に補間処理し、切り出し枠w33とする。図15の中段は各フレームについて、切り出し枠を取り出したものである。図15の下段は各フレームの切り出し枠を撮影時の大きさに引き伸ばし、新たな画像であるフレームNF31、フレームNF22、フレームNF33が生成されたものである。図14の下段の新たな画像と比較して、フレーム間で人物のサイズが緩やかに変化している、すなわち画像が滑らかになっている。
以上により、本実施の形態で説明するビデオカメラ1100は、撮影した画像の一部を切り出して新たな画像を生成する。その生成される新たな画像は、記憶部302に記録された制約条件に基づいて、撮影された画像から切り出され、さらにフレーム間で補間処理される。そのため、ビデオカメラ1100での画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、滑らかでより自然な画像となる。
(実施の形態3)
本実施の形態では、ビデオカメラによって撮影した画像から新たに生成された画像の記録について説明する。
実施の形態1では、ビデオカメラ100によって撮影された画像から新たに画像を生成し、記録する構成について説明した。本実施の形態では、新たに画像を生成せず、新たな画像に対する属性情報を生成する構成について説明する。
図16は、実施の形態3に係るビデオカメラ2100の概略構成を示すブロック図である。ビデオカメラ2100は、新たな画像を生成せずに新たな画像を生成するための属性情報を記録する点で実施の形態1のビデオカメラ100と異なる。具体的には、基本的にはビデオカメラ2100の基本的な構成は、ビデオカメラ100と略同様である。そこで、実施の形態1と同様の構成については、同様の符号を付して説明を省略し、異なる部分を中心に説明する。
実施の形態1に対して異なる構成として、ビデオカメラ2100は、実施の形態1のビデオカメラ100に対して、画像信号処理部2203、画像信号圧縮部2204、制御部2300、記憶部2302の構成が異なる。画像信号処理部2203は、出力されるデジタル映像信号が制御部2300の構図情報整形部2317に入力されていない点で異なる。これは制御部2300において新たな画像を生成しないためである。画像信号圧縮部2204は、制御部2300から出力されるデジタル映像信号を入力していない点で異なる。制御部2300において新たな画像を生成しないためである。
制御部2300は、実施の形態1の制御部300に対して、カメラワーク情報抽出部2315、構図情報整形部2317、多重化部2318、再生部2319の構成が異なる。カメラワーク情報抽出部2315は、抽出した撮影情報を構図情報整形部2317に入力する点で異なる。構図情報整形部2317は、カメラワーク情報抽出部2315で抽出した撮影情報と、構図情報計算部316で決定した切り出し枠を属性情報として多重化部2318へ出力する。多重化部2318では、属性情報を、撮影した画像とともに記憶部2302に記録する。再生部2319は、記憶部2302に記録された撮影した画像と付属情報に基づいて、新たな画像の再生を実行する。
図17は、実施の形態3に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。実施の形態1の図4のフローチャートと異なる点は、ステップS403で切り出し枠を決定した後、ステップS404をステップS1701に変更している点である。ステップS1701において、構図情報整形部2317において、カメラワーク情報抽出部2315で抽出した撮影情報と、構図情報計算部316で決定した切り出し枠を属性情報として多重化部2318へ出力する。多重化部2318は、撮影された画像、画像に付随する音声、属性情報を一つのデータに多重化する。多重化されたデータは記憶部2302に記録される。
図18は、撮影された画像と新たに生成する画像の属性情報の記録を説明する図である。撮影された画像データと共に、属性情報を撮影された画像データの付属する情報として記録する。属性情報には、撮影情報と決定した切り出し枠を記録する。
決定した切り出し枠は、元の撮影された画像の左上を基準として、そこから矩形の切り出し枠の左上が、横方向及び縦方向へのオフセット量の情報、及び切り出し枠の横方向と縦方向の大きさの情報、で示すことができる。
なお、属性情報と撮影された画像、画像に付随する音声とは必ずしも多重化する必要はない。属性情報と、撮影された画像、画像に付随する音声を記憶部2302において関連付けて記憶することができれば、それぞれに個別のデータとして保持するものであってもよい。属性情報と撮影された画像、画像に付随する音声との関連付けは、例えば新たに両者の関連を示す別のデータを生成するものであってもよいし、属性情報と撮影された画像、画像に付随する音声を、記憶部2302に記録する際のファイルシステム管理における一つのグループとして、例えばファイルシステム内における同一ディレクトリ下に、格納するなどで対応するものであってもよい。
また、図18の一例では、属性情報は、撮影された画像の特定のフレームのみに設ける場合を例示したが本実施の形態はこれに限定されない。例えば、すべてのフレームに属性情報を設けるものであってもよい。また、撮影された画像中において、符号化時に基準となるフレーム、を選択してそのフレームのみに属性情報を設けるものであってもよい。
さらに、撮影された画像、画像に付随する音声と属性情報とは多重化されたのちに、符号化するものであってもよい。反対に、撮影された画像、画像に付随する音声を符号化した後に、符号化された撮影画像、画像に付随する音声と属性情報を多重化するものであってもよい。また、属性情報は符号化の対象としてもよいし、しなくてもよい。
以上により、本実施の形態で説明するビデオカメラ2100は、撮影した画像の撮影情報と、撮影した画像の一部を切り出すための切り出し枠を撮影した画像の付属情報として記録する。記録された撮影した画像と付属情報に基づいて、新たな画像を再生する。これにより撮影された画像と新しく生成された画像を効率的に記録、管理することができる。
本開示は、画像を撮影して記録するビデオカメラ等に適用可能である。
100,1100,2100 ビデオカメラ
200 レンズ群
201 撮像素子
202 画像AD変換部
203,2203 画像信号処理部
204,2204 画像信号圧縮部
205 レンズ制御モジュール
206 姿勢検出部
207 外部入力部
208 マイクロフォン
209 音声AD変換部
210 音声信号圧縮部
211 画像信号伸張部
212 映像表示部
213 音声信号伸張部
214 音声出力部
215 出力I/F
300,1300,2300 制御部
301 クロック
302,2302 記憶部
311 レンズ制御部
312 撮像制御部
313 画像解析部
314 音声解析部
315,2315 カメラワーク情報抽出部
316,1316 構図情報計算部
317,2317 構図情報整形部
318,2318 多重化部
319,2319 再生部
本開示は、ビデオカメラ等で撮影された画像から画像の一部を切り出して新たな画像を生成する画像生成装置及びそれを備えた撮影装置、さらには、撮影された画像から画像の一部を切り出して新たな画像を生成する方法及びプログラムに関する。
特許文献1には、動画撮影時に撮影操作に集中しなくても、注目被写体の動画を取得可能な撮像装置について記載されている。さらに特許文献1には、撮影された画像から特定被写体を検出し、特定被写体を含む一部の領域を切り出し画像として抽出し、切り出し画像の解像度を向上させる構成が開示されている。
特開2009−147727号公報
本開示の画像生成装置および本開示の撮影装置は、撮影された画像の撮影情報を抽出するカメラワーク情報抽出部と、撮影情報と撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定する構図情報計算部と、撮影された画像から切り出し枠を用いて新たな画像を切り出し、所定サイズに変換する構図情報整形部とを備える。
本開示の画像生成装置および本開示の撮影装置は、画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、視聴者が見やすく好ましい画像となる。
図1は、実施の形態1に係るビデオカメラの斜視図である。 図2は、実施の形態1に係るビデオカメラの概略構成を示すブロック図である。 図3は、図2の構図情報計算部の詳細を示すブロック図である。 図4は、実施の形態1に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図5は、ビデオカメラ100で撮影された画像の一例を示す図である。 図6は、図5の撮影された画像の一例において、人物の検出とフレーム間の動きを検出した結果を説明する図である。 図7は、図5の撮影された画像の一例において、図6の人物検出とフレーム間の動きを検出した結果から切り出し枠の決定を説明する図である。 図8は、実施の形態1に係る制約条件の一例を示す図である。 図9は、図7で決定した切り出し枠を説明する図である。 図10は、図9の各フレームの切り出し枠を元の撮影した画像のサイズに引き伸ばした図である。 図11は、実施の形態2に係るビデオカメラの概略構成を示すブロック図である。 図12は、図11の構図情報計算部の詳細を示すブロック図である。 図13は、実施の形態2に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図14は、実施の形態1に係るビデオカメラ100で撮影された画像の切り出しを説明する図である。 図15は、実施の形態2に係るビデオカメラ1100で撮影された画像の切り出しを説明する図である。 図16は、実施の形態3に係るビデオカメラの概略構成を示すブロック図である。 図17は、実施の形態3に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。 図18は、実施の形態3に係る撮影された画像と新たに生成する画像の属性情報の記録を説明する図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために、提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
(実施の形態1)
特許文献1のように、撮影された画像から特定の被写体を含む領域を抽出し、抽出した画像に基づいて画像を生成し、それらをつなぎ合わせて動画を生成すると、視聴者に見やすい画像が生成できない場合がある。
例えば、動画の撮影時に構図等を考慮して撮影された動画から特定の被写体を含む領域だけを抽出すると、構図が崩れ、視聴者が見にくい画像となることがある。さらに、生成された動画が、動きの激しい動画や激しい明滅を含むような動画が生成されることがある。
本開示は、かかる点に鑑みてなされたものであり、その目的とするところは、撮影された画像の一部を切り出して新たな画像を生成する場合に、その生成される画像が視聴者に見やすい画像となる画像生成装置及びそれを備えた撮影装置、さらには、撮影された画像から画像の一部を切り出して新たな画像を生成する方法及びプログラムを提供することにある。
<1.ビデオカメラの構成>
図1は、撮影装置の一例としてのビデオカメラ100の斜視図である。ビデオカメラ100は画像を撮影し、それを記録し、再生するものである。また、ビデオカメラ100は撮影した画像から新たな画像を生成する。
図2は、ビデオカメラ100の概略構成を示すブロック図である。
ビデオカメラ100は、レンズ群200、撮像素子201、画像AD変換部(Analog Digital Converter)202と画像信号処理部203、画像信号圧縮部204、レンズ制御モジュール205、姿勢検出部206、外部入力部207、マイクロフォン208、音声AD変換部(Analog Digital Converter)209、音声信号圧縮部210、画像信号伸張部211、映像表示部212、音声信号伸張部213、音声出力部214、出力I/F(Interface)215、制御部300、クロック301と記憶部302を備えている。このビデオカメラ100が画像生成装置及び撮影装置を構成する。
レンズ群200は、複数のレンズで構成されており、被写体からの入射光を撮像素子201上に結像させる。また、レンズ群200は、複数のレンズ間の距離を調整可能に構成されており、レンズ間の距離を変えることによって焦点距離やズーム倍率を変化させる。焦点距離やズーム倍率の調整は、ユーザが手動で行ってもよいし、制御部300が行ってもよい。
撮像素子201は、入射する光を電気信号に変換する。撮像素子201は、CCD又はCMOSで構成されている。撮像素子201は、撮像面上の任意の範囲の電気信号を出力する。また、撮像素子201は、画像に関する情報以外にも、3原色点の色度空間情報、白色の座標、及び3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、及び3原色または輝度信号のガンマ情報等の情報も出力することが可能である。そのため、撮像素子201からの出力は、画像AD変換部202だけでなく制御部300の後述するカメラワーク情報抽出部315にも入力される。
画像AD変換部202は、撮像素子201が出力するアナログの電気信号をデジタル信号に変換する。
画像信号処理部203は、画像AD変換部202が出力したデジタル信号を増幅させ、ホワイトバランス調整、色味補正等の所定の処理を行う。画像信号処理部203は、例えば、画像信号変換用のICで構成されている。画像信号処理部203からの出力は、画像信号圧縮部204だけでなく制御部300の後述する画像解析部313にも入力される。
画像信号圧縮部204は、画像信号処理部203から出力されるデジタル映像信号に所定の符号化変換を行い、データ量を圧縮する。符号化変換の具体例としては、MPEG2、MPEG4、H264/MPEG4 AVC等の符号化方式がある。画像信号圧縮部204からの出力は、制御部300へ入力される。画像信号圧縮部204は、例えば、画像信号圧縮伸張用のICで構成されている。画像信号圧縮部204は、画像信号処理部203から出力されるデジタル映像信号だけでなく、制御部300の後述する構図情報整形部317から出力される信号も入力され、この入力された信号に所定の符号化変換を行い、データ量を圧縮する。
レンズ制御モジュール205は、レンズ群200の状態を検出したり、レンズ群200を動作させたりするものである。レンズ制御モジュール205は、レンズ制御用モータと、レンズ位置センサを有している。レンズ位置センサは、レンズ群200を構成する複数のレンズ間の距離又は位置関係等を検出する。レンズ位置センサは、その検出信号を制御部300に出力する。レンズ制御モジュール205は、2種類のレンズ制御モータを有している。1つのレンズ制御モータは、制御部300から制御信号に基づいて、レンズ群200を光軸方向に移動させる。これにより、レンズ群200の複数のレンズ間の距離が変更され、レンズ群200の焦点距離及びズーム倍率が調整される。もう1つのレンズ制御モータは、制御部300から制御信号に基づいて、レンズ群200のうちの少なくとも1つのレンズ、例えば、像ぶれ補正用のレンズを光軸に直交する面内で移動させる。これにより、像ぶれを補正する。
姿勢検出部206は、ビデオカメラ100本体の姿勢状態を検出する。姿勢検出部206は、加速度センサ、角速度センサ、仰角・俯角センサを有する。これらのセンサにより、撮影時にビデオカメラ100がどのような姿勢になっているかを認識できる。加速度センサ及び角速度センサは、ビデオカメラ100の姿勢を詳細に検出するために、直交3軸方向、すなわち、ビデオカメラ100の上下方向、前後方向、左右方向の姿勢をそれぞれ検出できることが好ましい。
なお、姿勢検出部206は、上記の構成に限らず、上記センサの何れかだけで構成されていてもよいし、上記センサ以外のセンサを有していてもよい。
外部入力部207は、ビデオカメラ100に外部からの情報を入力する。外部入力部207からの信号は、制御部300へ入力される。また、図2において外部入力部207からの信号は、制御部300のカメラワーク情報抽出部315だけに入力されているが、レンズ制御部311等の入力操作に対応する部分にも入力される。撮影時には、この外部入力部207を介してビデオカメラ100に外部からの各種情報が入力される。例えば、外部入力部207は、ユーザからの情報の入力を受け付ける入力インタフェースの1つである入力ボタンや、ビデオカメラ100が三脚に設置されているか否かを検出する三脚センサを含む。ユーザが入力ボタンを操作することによって、撮影の開始、終了、撮影された画像の再生、撮影された画像の記憶部302への記録及び後述する撮影された画像の一部を切り出して新たな画像を生成する等、ユーザからの各種要求をビデオカメラ100に伝えることが可能である。三脚センサは、ビデオカメラ100の三脚が固定される部分に設けられたスイッチで構成されている。三脚センサにより、三脚を使用した撮影か否かを判定できる。
なお、入力ボタンや三脚センサに限らず、タッチパネル、ジョイスティック、等、ユーザからの指示内容を受け付けることができるデバイスであれば何でもよい。
マイクロフォン208は、ビデオカメラ100が画像を撮影している時に、ビデオカメラ100の周囲の音を収音し、電気信号に変換して、アナログ音声信号として出力する。
音声AD変換部209は、マイクロフォン208が出力するアナログ音声信号データをデジタル音声信号である音声データに変換する。
音声信号圧縮部210は、音声AD変換部209が出力したデジタル音声信号を予め決められた符号化方式で符号化する。符号化にはMP3(MPEG Audio Layer−3)やAAC(Advanced Audio Coding)等の方式がある。音声信号圧縮部210は、例えば、音声信号圧縮用のICで構成されている。
画像信号伸張部211は、制御部300から出力される映像信号を復号する。画像信号伸張部211からの出力は、映像表示部212に入力される。
映像表示部212は、ビデオカメラ100に記録した画像や、ビデオカメラ100でリアルタイムに撮影している画像、過去に撮影した画像や、後述する撮影した画像から一部の画像を切り出して新たに生成した画像を表示する。それ以外にも、映像表示部212は、撮影に関する情報や機器情報等の各種情報を表示する。映像表示部212は、例えば、タッチパネル式の液晶ディスプレイで構成されている。タッチパネル式の映像表示部212は、外部入力部207としても機能する。画像信号伸張部211は、例えば、画像信号伸張用のICで構成されている。
音声信号伸張部213は、制御部300から出力される音声信号を復号する。音声信号伸張部213は、例えば、音声信号伸張用のICで構成されている。
音声信号伸張部213からの出力は、音声出力部214に入力される。音声出力部214は、画像に付随する音声を出力する。それ以外にも、音声出力部214は、ビデオカメラ100からユーザへ報知する警告音を出力する。音声出力部214は、例えば、スピーカーで構成されている。
出力I/F215は、映像信号をビデオカメラ100から外部へ出力するためのインタフェースである。具体的は出力I/F215は、ビデオカメラ100と外部機器とをケーブルで接続する場合のケーブルインタフェースや、映像信号をメモリカードに記録する場合のメモリカードインタフェース等である。
制御部300は、ビデオカメラ100の全体を制御する。制御部300は、撮像素子201、画像信号処理部203、画像信号圧縮部204、レンズ制御モジュール205、姿勢検出部206、外部入力部207、音声AD変換部209、音声信号圧縮部210、画像信号伸張部211、音声信号伸張部213、出力I/F215及び記憶部302等との間で信号の授受が可能に構成されている。本実施の形態では、制御部300は、CPUで構成されている。制御部300は、記憶部302に格納されたプログラムを読み込んで実行することによってビデオカメラ100の各種制御を実行する。制御部300が実行する制御の例としては、例えば、レンズ群200の焦点距離やズームの制御や、姿勢検出部206や外部入力部207からの入力信号の処理や、画像信号処理部203、画像信号圧縮部204、音声信号圧縮部210、画像信号伸張部211及び音声信号伸張部213等のICの動作制御等である。また、図示は省略するが、制御部300とレンズ制御モジュール205等との間では、適宜、信号がAD変換又はDA変換される。なお、制御部300は、IC等の集積回路で構成することもできる。
クロック301は、ビデオカメラ100内で動作する制御部300等に処理動作の基準となるクロック信号を供給する。なお、クロック301は、利用する集積回路や扱うデータによって、単一または複数のクロックを用いることも可能である。また、ひとつの発振子のクロック信号を任意の倍数に乗じて使用してもよい。
記憶部302は、ROM(Read Only Memory)、RAM(Random Access Memory)及びHDD(Hard Disk Drive)を含んでいる。ROMは、制御部300が処理するプログラムやプログラムを動作させるための各種データを記憶しておく。RAMは、制御部300が処理するプログラム実行時に使用するメモリ領域等として使用される。また、RAMは、ICのメモリ領域としても使用され得る。HDDは、画像信号圧縮部204により符号化変換された映像データや音声信号圧縮部210により符号化変換された音声データや、後述する撮影された画像から画像の一部を切り出して生成した画像等の各種データを保存する。また、HDDは、制御部300で実行するプログラムを記憶している。なお、記憶部302は、HDDに限られず、半導体メモリに記憶されていてもよいし、SDメモリカード、CD−ROMやDVD等の可搬型記録媒体を含んでいてもよい。
次に、制御部300について詳細に説明する。ここでは、制御部300のうち、撮影された画像から画像の一部を切り出して新たな画像を生成するために必要な構成について説明する。制御部300は、一般的なビデオカメラと同様の機能を発揮させるための構成、例えば、撮影した画像を記録したり、再生したりする構成も有する。
制御部300は、レンズ制御モジュール205を制御するレンズ制御部311と、撮像素子201を制御する撮像制御部312と、画像信号処理部203からの出力を解析する画像解析部313と、音声AD変換部209からの出力を解析する音声解析部314と、ビデオカメラ100の撮影状態を生成するカメラワーク情報抽出部315と、ビデオカメラ100が撮影した画像を解析・分析し、新たに生成する画像の切り出し枠を決定する構図情報計算部316と、決定した切り出し枠を用いて新たに画像を生成する構図情報整形部317と、映像信号と音声信号とを多重化する多重化部318と、再生を行う再生部319を有している。制御部300は、記憶部302に記憶されたプログラムを読み込んで実行することによって、後述する各種の処理を実現する。
レンズ制御部311は、レンズ制御モジュール205のレンズ位置センサの検出信号及び姿勢検出部206の各種センサの検出信号が入力されている。レンズ制御部311は、これらの検出信号及び撮像素子201等の他の構成要素からの情報に基づいて、レンズ群200を適正に配置させるための制御信号をレンズ制御モータに出力する。こうして、レンズ制御部311は、ズーム制御、フォーカス制御、像ぶれ補正制御等を行う。また、レンズ制御部311は、レンズ群200の制御信号をカメラワーク情報抽出部315へ出力する。また、姿勢検出部206の各種センサの検出信号は、カメラワーク情報抽出部315へも出力されている。
撮像制御部312は、撮像素子201の動作を制御する。撮像素子201に対して、撮影時の露出量、撮影速度、及び感度等を制御する。撮像制御部312から出力される制御信号は、撮像素子201だけでなく、カメラワーク情報抽出部315へも力される。
画像解析部313は、画像信号処理部203からの映像データに基づいて画像の特徴を抽出する。画像解析部313は、画像の色情報、例えば、画像に含まれる色の分布の情報や、ホワイトバランス情報を検出する。色の分布の検出は、デジタル映像信号を形成するデータに含まれる色情報を確認することで実現可能である。また、画像解析部313は、画像に人物の顔が含まれている場合には、画像の中から顔検出を行う。顔検出については、パターンマッチング等を用いることにより実現可能である。
音声解析部314は、音声AD変換部209からの音声データを解析して、特徴のある音を抽出するものである。ここで特徴のある音とは、例えば、撮影者の声、特定の単語の発音、歓声、及び銃声等がある。これらの音は、これらの音が持つ特有の周波数を予め登録しておき、それとの比較により判別するなどの方法等によって抽出可能である。また、これ以外にも、例えば、音の入力レベルが所定レベル以上のときに特徴のある音であると判定するようにしてもよい。
カメラワーク情報抽出部315は、撮影している画像に関する撮影情報を抽出する。カメラワーク情報抽出部315には、撮像素子201、姿勢検出部206、外部入力部207、レンズ制御部311、撮像制御部312、画像解析部313及び音声解析部314からの出力信号が入力されている。カメラワーク情報抽出部315は、これらの出力信号に基づいて撮影情報を抽出する。
この画像に関する撮影情報には、画像の撮影時の撮影装置の状態やカメラワークなどの撮影に関する情報、画像そのものが含む被写体や背景に関する情報、画像に付帯する音声に関する情報が含まれる。例えば、撮影時の撮影装置に関する情報の例としては、焦点距離、ズーム倍率、露出、撮影速度、感度、3原色点の色空間情報、ホワイトバランス、3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、3原色または輝度信号のガンマ情報、色分布、顔認識情報、カメラ姿勢、例えば、加速度、角速度、仰角・俯角等であり、撮影時刻、例えば、撮影開始時刻、終了時刻であり、撮影インデックス情報、ユーザ入力内容、フレームレート、サンプリング周波数等が挙げられる。例えば、カメラワーク情報抽出部315は、レンズ制御部311の制御信号に基づいて、焦点距離やズーム倍率を撮影情報として抽出する。また、カメラワーク情報抽出部315は、姿勢検出部206の検出信号に基づいて、加速度、角速度、仰角・俯角等のカメラ姿勢を検出し、検出したカメラ姿勢からカメラの向きを左右に振る動作であるパン、カメラの向きを上下に振るティルト等の撮影時のビデオカメラ100のカメラの動作を撮影情報として抽出する。さらには、ビデオカメラ100を動作させた後にビデオカメラ100を静止させて撮影した部分を撮影情報として抽出することができる。このように、カメラワーク情報抽出部315は、入力された信号そのものから撮影情報を抽出する場合もあれば、入力された信号と組み合わせたり、分析したりすることによって撮影情報を抽出する場合もある。
構図情報計算部316は、カメラワーク情報抽出部315で抽出された撮影情報に基づいて、新たに生成する画像の切り出し枠を決定する。この切り出し枠の決定の詳細については後述する。
構図情報整形部317は、構図情報計算部316で決定した切り出し枠に基づいて、画像信号処理部203から出力された撮影した画像から新たに画像を生成する。生成した画像は画像信号圧縮部204へ出力する。画像の生成の詳細については後述する。
多重化部318は、画像信号圧縮部204からの符号化映像データと音声信号圧縮部210からの符号化音声データを多重化して出力する。多重化部318により多重化されたデータは、記憶部302に格納される。多重化の方式としては、例えば、MPEGのTS(Transport Stream)方式等である。ただし、これに限定されるものではない。
なお、本実施の形態では、多重化する場合を例として示しているが、必ずしも多重化しなくてもよい。
これらカメラワーク情報抽出部315、構図情報計算部316、構図情報整形部317及び多重化部318の処理は、撮影時、詳しくは、撮影中又は撮影直後に逐次、実行される。
再生部319は、撮影の終了後に、ユーザの入力に基づいて切り出した画像の再生を実行する。詳しくは、再生部319は、記憶部302に記憶された多重化されたデータを読み出し、再生させるべき部分の符号化映像データ及び符号化音声データをそれぞれ画像信号伸張部211及び音声信号伸張部213に出力する。出力された符号化映像データ及び符号化音声データはそれぞれ、画像信号伸張部211及び音声信号伸張部213で復号され、映像表示部212及び音声出力部214から出力される。こうして、画像の中から撮影した画像から切り出した画像の再生が実行される。
<2.新たな画像の生成>
次に、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を、撮影された画像の一例を用いて説明する。撮影された画像から画像の一部を切り出して、新たな画像を生成する処理は、カメラワーク情報抽出部315と構図情報計算部316と構図情報整形部317で行う。
図3は構図情報計算部316の詳細な構成を示す図である。カメラワーク情報抽出部315から出力された撮影情報を入力信号とする。入力された撮影情報から撮影した画像に人物が含まれているか、人物が含まれている場合、顔がどちらを向いているか、人物が誰なのか等を検出する人検出部401と、入力された撮影情報から画像の1コマの単位であるフレームのフレーム間において人物や物体が動いているかどうかを検出する動き検出部402と、前後のフレームにおいて特徴的な図形が動いているかどうか、すなわちビデオカメラ100を固定して撮影しているかどうかを検出するエッジ検出部403と、撮影情報と人検出部401の検出結果と動き検出部402の検出結果とエッジ検出部403の検出結果とから切り出し枠を決定する切り出し枠決定部404とで構成される。
図4は、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。
図5は、ビデオカメラ100で撮影された画像の一例を示す図である。図5において、撮影した画像を画像の1コマの単位であるフレームで示している。画像は、フレームF1、フレームF2、フレームF3、フレームF4、フレームF5、フレームF6、フレームF7、フレームF8、フレームF9の順で撮影された一例である。この画像は、ビデオカメラ100を三脚で固定して撮影されたものである。フレームF1では、人物Aが撮影された画面のやや左側に正面を向いて立っており、全身が撮影されている。フレームF2はフレームF1に対して、人物AがフレームF1で立っていた位置で、撮影しているビデオカメラ100から見て、右を向いている。フレームF3はフレームF2に対して、撮影された画面の右端に人物Bが見えている。フレームF4はフレームF3に対して、人物Bが、撮影している画面の右端から左側に向かって歩いている。フレームF5はフレームF4に対して、人物Bが、人物Aの右隣りまで歩いてきた。フレームF6はフレームF5に対して、人物Bは、人物Aの右隣りで立ち止まっている。また、人物Aは顔を左に向けた。フレームF7はフレームF6に対して、人物Aは左側に向きを変えて左端に向かって歩き始めた。フレームF8はフレームF7に対して、人物Bが正面を向いた。フレームF9はフレームF8に対して、人物Aが撮影された画面の左端に消えようとしている。図5の撮影された画像の一例を用いて、新たな画像を生成する手順を説明する。
(ステップS401)カメラワーク情報抽出部315は、撮影している画像に関する撮影情報を抽出する。カメラワーク情報抽出部315には、撮像素子201、姿勢検出部206、外部入力部207、レンズ制御部311、撮像制御部312、画像解析部313及び音声解析部314からの出力信号が入力されている。カメラワーク情報抽出部315は、これらの出力信号に基づいて撮影情報を抽出する。
この画像に関する撮影情報には、画像の撮影時の撮影装置の状態やカメラワークなどの撮影に関する情報、画像そのものが含む被写体や背景に関する情報、画像に付帯する音声に関する情報が含まれる。例えば、撮影時の撮影装置に関する情報の例としては、焦点距離、ズーム倍率、露出、撮影速度、感度、3原色点の色空間情報、ホワイトバランス、3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、3原色または輝度信号のガンマ情報、色分布、顔認識情報、カメラ姿勢、例えば、加速度、角速度、仰角・俯角等であり、撮影時刻、例えば、撮影開始時刻、終了時刻であり、撮影インデックス情報、ユーザ入力、フレームレート、サンプリング周波数等が挙げられる。例えば、カメラワーク情報抽出部315は、レンズ制御部311の制御信号に基づいて、焦点距離やズーム倍率を撮影情報として抽出する。また、カメラワーク情報抽出部315は、姿勢検出部206の検出信号に基づいて、加速度、角速度、仰角・俯角等のカメラ姿勢を検出し、検出したカメラ姿勢からカメラの向きを左右に振る動作であるパン、カメラの向きを上下に振るティルト等の撮影時のビデオカメラ100のカメラの動作を撮影情報として抽出する。さらには、ビデオカメラ100を動作させた後にビデオカメラ100を静止させて撮影した部分を撮影情報として抽出することができる。このように、カメラワーク情報抽出部315は、入力された信号そのものから撮影情報を抽出する場合もあれば、入力された信号と組み合わせたり、分析したりすることによって撮影情報を抽出する場合もある。
(ステップS402)次にカメラワーク情報抽出部315で抽出した撮影情報を用いて人検出、動き検出、エッジ検出を行う。
人検出部401は、撮影情報から人物を検出する。人物の検出は単に人であるかを検出してもいいし、記憶部302にあらかじめ認識させたい人物の情報を登録しておき、登録しておいた情報と比較することで検出した人物が誰かを検出してもよい。また、検出した人物が正面を向いているか後ろを向いているかの向きも検出する。さらに人検出部401は、撮影された画像の遠近法の観点から画像に映し出される人物を検出してもよい。例えば、画像に映し出されている人物Aと人物Bがあった場合に、人物Aが人物Bよりも大きく写っている場合には、人物Aが前方に配置され、人物Bが後方に配置されていると検出してもよい。
動き検出部402は、フレーム間で動きのある部分を特定し、その部分について、前のフレームから後のフレームに対してどのような方向に、どれくらいの速さで動いているかを特定する。「動き」を検出する技術は、フレーム間の動きベクトル等の技術を用いて実現することが可能である。
エッジ検出部403は、撮影された画像において、背景となる部分を特定する分析を行う。具体的には「動き」を特定する処理において、「動き」の大きさが小さい部分を背景として認識する。これにより背景部分を識別できる。
エッジ検出部403は、撮影された画像の被写体の輪郭の強さやテクスチャに基づいて背景部分を特定してもよい。さらに、撮影された画像の色についての情報、例えばR、G、Bのそれぞれについて色の分布情報をヒストグラムにした情報を解析して背景部分を特定してもよい。さらに、エッジ検出部403は、特定した背景部分において、建物の窓枠や道路標識など特徴的な図形が動いているかどうか、すなわちビデオカメラ100を固定して撮影しているかどうかも検出する。
図6は、図5の撮影された画像の一例において、人物の検出とフレーム間の動きを検出した結果を説明する図である。
フレームF1において、人物Aは人検出されて人物であると検出され、検出した結果が人検出枠w11で囲まれて表示されている。
フレームF2において、人物Aは人検出で継続して人物であると検出され、検出した結果が人検出枠w21で囲まれて表示されている。
フレームF3において、人物Aは人検出で継続して人物であると検出され、検出した結果が人検出枠w31で囲まれて表示されている。
フレームF4において、人検出で人物Aに加えて人物Bを人物であると検出され、検出した結果が人物Aに対しては人検出枠w41で、人物Bに対して人検出枠w42で表示されている。さらにフレームF4ではフレームF3に対して人物Bが左側に歩いたことを動き検出で検出され、検出された「動き」が動きベクトルV4で表示されている。
フレームF5において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w51、人検出枠w52で囲まれて表示されている。さらにフレームF5ではフレームF4に対して人物Bは引き続き左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV5で表示されている。
フレームF6において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w61、人検出枠w62で囲まれて表示されている。
フレームF7において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w71、人検出枠w72で囲まれて表示されている。さらにフレームF7ではフレームF6に対して人物Aは左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV7で表示されている。
フレームF8において、人物A、人物Bはそれぞれ人検出で継続して人物であると検出され、検出した結果がそれぞれ人検出枠w81、人検出枠w82で囲まれて表示されている。
フレームF9において、人物Aは撮影された画面の左端に消えようとしているため人検出されず、人物Bは人検出で継続して人物であると検出され、検出した結果が人検出枠w92で囲まれて表示されている。さらにフレームF9ではフレームF8に対して人物Aは左側に移動しているので、動き検出で検出され、検出された「動き」が動きベクトルV9で表示されている。
ここで、図6において、人検出枠の検出は、人検出部401で行い、動きベクトルの検出は動き検出部402で行った。図6において、撮影情報にビデオカメラ100が固定された状態で撮影されていたため、エッジ検出部403における検出は実施しなかった。
(ステップS403)切り出し枠決定部404は、撮影情報と人検出部401の検出結果と動き検出部402の検出結果とエッジ検出部403の検出結果とから切り出し枠を決定する。
図7は、図5の撮影された画像の一例において、図6の人検出結果とフレーム間の動きを検出した結果から切り出し枠を決定する方法を説明する図である。
撮影された画像から一部の画像を切り出す場合に、守るべき制約条件がある。図8は制約条件の一例を示す図である。制約条件の種類としては、枠そのものの制約、フレーム毎の制約、フレーム間にまたがる制約等がある。
枠そのものの制約として、切り出す画像の枠の大きさ(サイズ)の制約がある。例えば、切り出す枠は撮影された画面の1/4以上であるという制約である。さらにフレーム間の切り出す画像の枠の大きさ(サイズ)の変化量の制約、例えば、大きさの変化量はW%以内(Wは小数)等、の制約がある。
フレーム毎の制約は、フレームの構図に関する制約である。フレームの構図に関する制約として、三分割構図、三角構図、対角線構図、日の丸構図、シンメトリー構図がある。三分割構図は、切り出す画面の縦横を等間隔に引いた水平線と垂直線それぞれ2本ずつで画面を上下・左右方向にそれぞれ3等分して9等分すると仮定し、それらの線上や線同士の交点上に構図上の重要な要素を配置する制約である。三角構図は、画面の中央部に高い木やビルなどを配置し、三角形に配置する制約である。対角線構図は、並木や道路・木の枝など、直線的に伸びる被写体を対角線上に配置する制約である。日の丸構図は、被写体を日の丸のように真ん中に配置する制約である。シンメトリー構図は、被写体を左右対称や上下対称に配置する制約である。フレームの構図に関する制約のうち、どれか1つにあてはまるように構図を決定する。
フレーム間の制約は、フレーム間のカメラワークに関する制約である。フレーム間のカメラワークに関する制約は、撮影しているビデオカメラの左右の移動時間、例えば、S1秒以上S2秒以下、上下の移動時間、例えばS3秒以上S4秒以下、ズームの縮小時間、例えば、S5秒以上S6秒以下、ズームの拡大時間、例えばS7秒以上S8秒以下等の制約である(S1、S2、S3、S4、S5、S6、S7、S8は小数)。制約条件は記憶部302に記憶されている。フレーム間のカメラワークに関する制約は、全てにおいて制約を満たすように構図を決定する。
これらの制約条件を満たすように切り出し枠を決定する。制約条件である、枠そのものの制約、フレーム毎の制約、フレーム間の制約を全て満たすように構図を決定できない場合は、それぞれの制約に優先順位を付与し、できる限りの制約条件を満たすように構図を決定する。例えば優先順位として、優先度の高い順として枠そのものの制約、フレーム間の制約、フレーム毎の制約とする。
まず、撮影された画像は、撮影条件として三脚で固定されて撮影されている。従って、画像を切り出す時に画像は固定されていることを前提として決定する。
フレームF1において、人検出されているのは人物Aのみの人検出枠w11であり、動きベクトルは検出されていないため、人検出枠w11から切り出し枠を決定する。切り出し枠は撮影された画面の1/4以上であることが望ましく、人検出枠w11は人物Aが正面を向いて立っている。制約条件である枠そのものの制約と、フレームの構図に関する制約から、人物Aを全身から胸より上の部分のみかつ人物Aが中心に配置される構図、例えば、シンメトリー構図に従う構図になるように切り出し枠n1を決定する。
フレームF2において、人検出枠w21の人物Aは右を向いたので、制約条件である切り出す画像の枠の大きさの制約、フレームF1で切り出した切り出し枠n1との間の切り出す画像の枠の大きさの変化量の制約、フレームの構図に関する制約、フレーム間のカメラワークに関する制約から、人物Aを全身から胸より上の部分のみで、人物Aを切り出し枠の左側に配置される構図、例えば、三分割構図になるように切り出し枠n2を決定する。
フレームF3において、人物Aは人検出で継続して人物であると検出され、検出した結果を人検出枠w31で囲まれて表示されているので、切り出し枠n2と同じ切り出し枠を切り出し枠n3として決定する。
フレームF4において人検出枠w41、人検出枠w42、動きベクトルV4とから切り出し枠を決定する。人物Aと人物Bの両方を胸から上の部分で切り出すために、切り出す画像の枠の大きさの制約、フレームF2で切り出した切り出し枠n2との間の切り出す画像の枠の大きさの変化量の制約とフレーム間のカメラワークに関する制約で左右の移動時間から切り出し枠n4を決定する。この場合、切り出し枠nの中に人物Bの顔が全て入るように切り出されていないが、フレームの構図に関する制約よりも、フレーム間カメラワークに関する制約を優先させて決定したためである。
フレームF5において、人検出枠w51、人検出枠w52、動きベクトルV5で表示されている。制約条件である切り出す画像の枠の大きさの制約、フレームF4で切り出した切り出し枠n4との間の切り出す画像の枠の大きさの変化量の制約、フレームの構図に関する制約、フレーム間のカメラワークに関する制約から、切り出し枠n5を決定する。
フレームF6において、フレームF5に対して大きな変化がないため、切り出し枠n5と同じ位置の切り出し枠を切り出し枠n6として決定する。
フレームF7において、人検出枠w71、人検出枠w72、動きベクトルV7とから切り出し枠を決定する。人物Aと人物Bの両方を胸から上の部分で切り出し、かつ人物Aは動いているので、フレームF6で切り出した切り出し枠n6との間の切り出す画像の枠の大きさの変化量の制約を優先して、切り出し枠n7を決定する。
フレームF8において、フレームF7に対して大きな変化がないため、切り出し枠n7と同じ位置の切り出し枠を切り出し枠n8として決定する。
フレームF9において、人物Aは撮影された画面の左端に消えようとしているため人検出されず、動きベクトルV9は検出されているので、人物Bを中心として制約条件を満たすように切り出し枠n9を決定する。
図9は、図7で決定した切り出し枠を説明する図である。切り出し枠決定部404は、上述したように各フレームについて切り出し枠を決定した。
(ステップS404)構図情報整形部317は、画像信号処理部203の出力信号を構図情報計算部316で切り出した切り出し枠で切り取り、切り取った画像を撮影した画像と同じ大きさに引き伸ばし、新たな画像を生成する。新たに生成した画像は、画像信号圧縮部204に出力する。
図10は、図9の各フレームの切り出し枠を元の撮影した画像のサイズに引き伸ばした図である。新たな画像として、フレームNF1、フレームNF2、フレームNF3、フレームNF4、フレームNF5、フレームNF6、フレームNF7、フレームNF8、フレームNF9が生成される。
<3.まとめ>
以上により、本実施の形態で説明するビデオカメラ100は、撮影した画像の一部を切り出して新たな画像を生成する。その生成される新たな画像は、記憶部302に記録された制約条件に基づいて、撮影された画像から切り出される。そのため、ビデオカメラ100での画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、より好ましい画像となる。
なお、本実施の形態で説明した制約条件は、一例であり、これに限らず、上述した制約条件のうちの少なくとも1つを制約条件としてもよいし、他の制約条件を用いてもよい。他の制約条件として、例えば、道路や川など曲線でできているものの曲線を取り入れてS字状に配置するS字型構図や、道路や川などのカーブを取り入れてC字状に配置するC字型構図がある。
また、図5の撮影された画像は、人物のみであったが、人物と自動車等の物体が複数動いている画像から切り出す場合は、切り出し枠の決定を、検出した人物や物体全ての重心から切り出し枠を決定するとしてもよいし、切り出す中心となる人物や物体を予め優先度をつけて付与しておき、優先度に基づいて切り出し枠を決定してもよい。さらに優先度は、外部入力部207から指定してもよい。
なお、本実施の形態において、新たに生成した画像は、多重化部318で撮影した画像と一緒に多重化され、記憶部302に記憶された後に再生部319で再生するものとしていたが、記憶部302で記憶させる前に再生部319から再生させてもよい。
なお、本実施の形態において、新たに生成する画像のサイズは撮影した画像のサイズに引き伸ばしたが、撮影した画像のサイズである必要はなく、サイズは外部入力部207から指定してもよいし、あらかじめ決めておいてもよい。
(実施の形態2)
実施の形態1において、撮影した画像から新たな画像を生成する際に、制約条件を満たしたとしても、生成された新たな画像のフレーム間で画像が滑らかにならない場合がある。例えば、撮影しているビデオカメラ100のズーム速度が所定速度よりも速い場合や、人物や物体の動きが所定速度よりも早い場合等である。本実施の形態では、生成する新たな画像のフレーム間で滑らかにするための補間処理について説明する。
図11は、実施の形態2に係るビデオカメラ1100の概略構成を示すブロック図である。ビデオカメラ1100は、新たな画像を生成する時の切り出し枠を決定する点で実施の形態1のビデオカメラ100と異なる。具体的には、ビデオカメラ1100の基本的な構成は、ビデオカメラ100と略同様である。そこで、実施の形態1と同様の構成については、同様の符号を付して説明を省略し、異なる部分を中心に説明する。
実施の形態1に対して異なる構成として、ビデオカメラ1100は、実施の形態1のビデオカメラ100に対して、制御部1300の構成が異なる。制御部1300は、実施の形態1の制御部300に対して、構図情報計算部1316の構成が異なる。
図12は、構図情報計算部1316の構成の詳細を示すブロック図である。
構図情報計算部1316は、切り出し枠決定部404で切り出し枠を仮決定した後に、フレーム間の切り出し枠の連続性から切り出した画像が滑らかに再生できるように切り出し枠を補間処理する。切り出し枠の補間処理は、スプライン補間処理やラグランジュ補間処理を用いる。
図13は、撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。図4の実施の形態1のフローチャートと異なる点は、ステップS403とステップS404の間にステップS1301が追加されている点である。
ステップS1301において、切り出し枠決定部404で切り出し枠を仮決定した後に、フレーム間の切り出し枠の連続性から切り出した画像が滑らかに再生できるように切り出し枠を補間する。切り出し枠の補間は、スプライン補間やラグランジュ補間を用いる。
次に、切り出し枠を補間処理していない場合と切り出し枠を補間処理した場合でどのように切り出した画像が変化するかを説明する。図14は、ビデオカメラ100で撮影された画像の切り出しを説明する図である。すなわち、切り出し枠を補間処理していない場合の一例である。図15は、ビデオカメラ1100で撮影された画像の切り出しを説明する図である。すなわち、切り出し枠を補間処理した場合の一例である。図14の上段は、ビデオカメラ100で撮影した画像であり、画像は、フレームF21、フレームF22、フレームF23の順で撮影された一例である。図15の上段はビデオカメラ1100で撮影した画像であり、ビデオカメラ100と同じように撮影した画像なため、同じフレーム番号とし、フレームF21、フレームF22、フレームF23の順で撮影されたものとする。図14の上段において、実施の形態1で説明したように切り出し枠を決定する。フレームF21に対して切り出し枠w21、フレームF22に対して切り出し枠w22、フレームF23に対して切り出し枠w23を決定する。図14の中段は各フレームについて、切り出し枠を取り出したものである。図14の下段は各フレームの切り出し枠を撮影時の大きさに引き伸ばし、新たな画像であるフレームNF21、フレームNF22、フレームNF23が生成されたものである。
図14の新たに生成された画像は、フレーム間で人物のサイズが急激に変化している。本実施の形態では、フレーム間の人物のサイズを緩やかに変化させる。図15の上段において、実施の形態1で説明したように切り出し枠を決定する。この時点では決定した切り出し枠は確定したものではなく、仮決定である。フレームF21に対して切り出し枠w21、フレームF22に対して切り出し枠w22、フレームF23に対して切り出し枠w23を決定する。フレームF22の切り出し枠w22を基準としてフレームF21の切り出し枠w21とフレームF23の切り出し枠w23を補間処理する。図15の上段において、フレームF21の切り出し枠w21を補間方向i1に補間処理し、切り出し枠w31とする。図15の上段において、フレームF23の切り出し枠w23を補間方向i3に補間処理し、切り出し枠w33とする。図15の中段は各フレームについて、切り出し枠を取り出したものである。図15の下段は各フレームの切り出し枠を撮影時の大きさに引き伸ばし、新たな画像であるフレームNF31、フレームNF22、フレームNF33が生成されたものである。図14の下段の新たな画像と比較して、フレーム間で人物のサイズが緩やかに変化している、すなわち画像が滑らかになっている。
以上により、本実施の形態で説明するビデオカメラ1100は、撮影した画像の一部を切り出して新たな画像を生成する。その生成される新たな画像は、記憶部302に記録された制約条件に基づいて、撮影された画像から切り出され、さらにフレーム間で補間処理される。そのため、ビデオカメラ1100での画像撮影時に熟練した撮影技術等がなくても、撮影した画像から新たに生成される画像は、滑らかでより自然な画像となる。
(実施の形態3)
本実施の形態では、ビデオカメラによって撮影した画像から新たに生成された画像の記録について説明する。
実施の形態1では、ビデオカメラ100によって撮影された画像から新たに画像を生成し、記録する構成について説明した。本実施の形態では、新たに画像を生成せず、新たな画像に対する属性情報を生成する構成について説明する。
図16は、実施の形態3に係るビデオカメラ2100の概略構成を示すブロック図である。ビデオカメラ2100は、新たな画像を生成せずに新たな画像を生成するための属性情報を記録する点で実施の形態1のビデオカメラ100と異なる。具体的には、基本的にはビデオカメラ2100の基本的な構成は、ビデオカメラ100と略同様である。そこで、実施の形態1と同様の構成については、同様の符号を付して説明を省略し、異なる部分を中心に説明する。
実施の形態1に対して異なる構成として、ビデオカメラ2100は、実施の形態1のビデオカメラ100に対して、画像信号処理部2203、画像信号圧縮部2204、制御部2300、記憶部2302の構成が異なる。画像信号処理部2203は、出力されるデジタル映像信号が制御部2300の構図情報整形部2317に入力されていない点で異なる。これは制御部2300において新たな画像を生成しないためである。画像信号圧縮部2204は、制御部2300から出力されるデジタル映像信号を入力していない点で異なる。制御部2300において新たな画像を生成しないためである。
制御部2300は、実施の形態1の制御部300に対して、カメラワーク情報抽出部2315、構図情報整形部2317、多重化部2318、再生部2319の構成が異なる。カメラワーク情報抽出部2315は、抽出した撮影情報を構図情報整形部2317に入力する点で異なる。構図情報整形部2317は、カメラワーク情報抽出部2315で抽出した撮影情報と、構図情報計算部316で決定した切り出し枠を属性情報として多重化部2318へ出力する。多重化部2318では、属性情報を、撮影した画像とともに記憶部2302に記録する。再生部2319は、記憶部2302に記録された撮影した画像と付属情報に基づいて、新たな画像の再生を実行する。
図17は、実施の形態3に係る撮影された画像から画像の一部を切り出して新たな画像を生成する手順を説明するフローチャートである。実施の形態1の図4のフローチャートと異なる点は、ステップS403で切り出し枠を決定した後、ステップS404をステップS1701に変更している点である。ステップS1701において、構図情報整形部2317において、カメラワーク情報抽出部2315で抽出した撮影情報と、構図情報計算部316で決定した切り出し枠を属性情報として多重化部2318へ出力する。多重化部2318は、撮影された画像、画像に付随する音声、属性情報を一つのデータに多重化する。多重化されたデータは記憶部2302に記録される。
図18は、撮影された画像と新たに生成する画像の属性情報の記録を説明する図である。撮影された画像データと共に、属性情報を撮影された画像データの付属する情報として記録する。属性情報には、撮影情報と決定した切り出し枠を記録する。
決定した切り出し枠は、元の撮影された画像の左上を基準として、そこから矩形の切り出し枠の左上が、横方向及び縦方向へのオフセット量の情報、及び切り出し枠の横方向と縦方向の大きさの情報、で示すことができる。
なお、属性情報と撮影された画像、画像に付随する音声とは必ずしも多重化する必要はない。属性情報と、撮影された画像、画像に付随する音声を記憶部2302において関連付けて記憶することができれば、それぞれに個別のデータとして保持するものであってもよい。属性情報と撮影された画像、画像に付随する音声との関連付けは、例えば新たに両者の関連を示す別のデータを生成するものであってもよいし、属性情報と撮影された画像、画像に付随する音声を、記憶部2302に記録する際のファイルシステム管理における一つのグループとして、例えばファイルシステム内における同一ディレクトリ下に、格納するなどで対応するものであってもよい。
また、図18の一例では、属性情報は、撮影された画像の特定のフレームのみに設ける場合を例示したが本実施の形態はこれに限定されない。例えば、すべてのフレームに属性情報を設けるものであってもよい。また、撮影された画像中において、符号化時に基準となるフレーム、を選択してそのフレームのみに属性情報を設けるものであってもよい。
さらに、撮影された画像、画像に付随する音声と属性情報とは多重化されたのちに、符号化するものであってもよい。反対に、撮影された画像、画像に付随する音声を符号化した後に、符号化された撮影画像、画像に付随する音声と属性情報を多重化するものであってもよい。また、属性情報は符号化の対象としてもよいし、しなくてもよい。
以上により、本実施の形態で説明するビデオカメラ2100は、撮影した画像の撮影情報と、撮影した画像の一部を切り出すための切り出し枠を撮影した画像の付属情報として記録する。記録された撮影した画像と付属情報に基づいて、新たな画像を再生する。これにより撮影された画像と新しく生成された画像を効率的に記録、管理することができる。
本開示は、画像を撮影して記録するビデオカメラ等に適用可能である。
100,1100,2100 ビデオカメラ
200 レンズ群
201 撮像素子
202 画像AD変換部
203,2203 画像信号処理部
204,2204 画像信号圧縮部
205 レンズ制御モジュール
206 姿勢検出部
207 外部入力部
208 マイクロフォン
209 音声AD変換部
210 音声信号圧縮部
211 画像信号伸張部
212 映像表示部
213 音声信号伸張部
214 音声出力部
215 出力I/F
300,1300,2300 制御部
301 クロック
302,2302 記憶部
311 レンズ制御部
312 撮像制御部
313 画像解析部
314 音声解析部
315,2315 カメラワーク情報抽出部
316,1316 構図情報計算部
317,2317 構図情報整形部
318,2318 多重化部
319,2319 再生部

Claims (6)

  1. 撮影された画像の撮影情報を抽出するカメラワーク情報抽出部と、
    前記撮影情報と前記撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定する構図情報計算部と、
    前記撮影された画像から前記切り出し枠を用いて新たな画像を切り出し、所定サイズに変換する構図情報整形部と、
    を備える画像生成装置。
  2. 前記制約条件は、切り出し枠のサイズに関する制約、画像の1コマの単位であるフレーム間の切り出し枠のサイズの変化量に関する制約、画像の1コマの単位であるフレームの構図に関する制約とフレーム間にまたがるカメラワークに関する制約のうち少なくとも1つを含む、
    請求項1に記載の画像生成装置。
  3. 前記撮影情報は、
    画像の撮影時の状態やカメラワークに関する情報、画像そのものが含む被写体や背景に関する情報と画像に付帯する音声に関する情報のうち少なくとも1つを含む、
    請求項1に記載の画像生成装置。
  4. 画像を取得する撮像系と、
    請求項1乃至3のいずれか1つに記載の画像生成装置と、
    を備えた撮影装置。
  5. 撮影された画像の撮影情報を抽出し、
    前記撮影情報と前記撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定し、
    前記撮影された画像から前記切り出し枠を用いて新たな画像を切り出し、所定サイズに変換する、画像生成方法。
  6. 撮影された画像の撮影情報を抽出すること、
    前記撮影情報と前記撮影された画像から、制約条件に基づいて、新たな画像を切り出すための切り出し枠を決定すること、
    前記撮影された画像から前記切り出し枠を用いて新たな画像を切り出し、所定サイズに変換すること、をコンピュータに実行させるためのプログラム。
JP2015507992A 2013-03-26 2014-02-26 画像生成装置、撮影装置、画像生成方法及びプログラム Expired - Fee Related JP6295442B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013063446 2013-03-26
JP2013063446 2013-03-26
PCT/JP2014/001004 WO2014155961A1 (ja) 2013-03-26 2014-02-26 画像生成装置、撮影装置、画像生成方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2014155961A1 true JPWO2014155961A1 (ja) 2017-02-16
JP6295442B2 JP6295442B2 (ja) 2018-03-20

Family

ID=51622984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015507992A Expired - Fee Related JP6295442B2 (ja) 2013-03-26 2014-02-26 画像生成装置、撮影装置、画像生成方法及びプログラム

Country Status (3)

Country Link
US (1) US9762811B2 (ja)
JP (1) JP6295442B2 (ja)
WO (1) WO2014155961A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10205885B2 (en) * 2016-01-26 2019-02-12 Canon Kabushiki Kaisha Image capturing apparatus for controlling shutter speed during panning shooting and method for controlling the same
CN109657526B (zh) * 2017-10-12 2020-12-01 飞狐信息技术(天津)有限公司 一种基于人脸识别的图片智能裁剪方法和系统
CN109922261A (zh) * 2019-03-05 2019-06-21 维沃移动通信有限公司 拍摄方法及移动终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009147727A (ja) * 2007-12-14 2009-07-02 Sanyo Electric Co Ltd 撮像装置及び画像再生装置
JP2010062853A (ja) * 2008-09-03 2010-03-18 Fujifilm Corp 情報処理装置、方法およびプログラム
JP2011188210A (ja) * 2010-03-08 2011-09-22 Olympus Imaging Corp 撮影機器及び撮影システム
JP2012217132A (ja) * 2011-03-31 2012-11-08 Sony Corp 画像処理装置、画像処理方法、画像処理プログラムおよび撮像装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4201809B2 (ja) * 2006-11-13 2008-12-24 三洋電機株式会社 手ぶれ補正装置及び方法並びに撮像装置
JP2012205037A (ja) 2011-03-25 2012-10-22 Olympus Imaging Corp 画像処理装置および画像処理方法
JP5848551B2 (ja) * 2011-08-26 2016-01-27 キヤノン株式会社 学習装置、学習装置の制御方法、検出装置、検出装置の制御方法、およびプログラム
CN104115487A (zh) * 2012-02-20 2014-10-22 索尼公司 图像处理装置、图像处理方法和程序
JP2015097301A (ja) * 2012-03-09 2015-05-21 ソニー株式会社 画像処理装置、画像処理方法、プログラム
JP2015111746A (ja) * 2012-04-09 2015-06-18 ソニー株式会社 画像処理装置、画像処理方法、プログラム
WO2013187047A1 (ja) * 2012-06-13 2013-12-19 パナソニック株式会社 物体検出装置
JP5925068B2 (ja) * 2012-06-22 2016-05-25 キヤノン株式会社 映像処理装置、映像処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009147727A (ja) * 2007-12-14 2009-07-02 Sanyo Electric Co Ltd 撮像装置及び画像再生装置
JP2010062853A (ja) * 2008-09-03 2010-03-18 Fujifilm Corp 情報処理装置、方法およびプログラム
JP2011188210A (ja) * 2010-03-08 2011-09-22 Olympus Imaging Corp 撮影機器及び撮影システム
JP2012217132A (ja) * 2011-03-31 2012-11-08 Sony Corp 画像処理装置、画像処理方法、画像処理プログラムおよび撮像装置

Also Published As

Publication number Publication date
US20160080661A1 (en) 2016-03-17
WO2014155961A1 (ja) 2014-10-02
US9762811B2 (en) 2017-09-12
JP6295442B2 (ja) 2018-03-20

Similar Documents

Publication Publication Date Title
US11902704B2 (en) Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object
JP5685732B2 (ja) 映像抽出装置、プログラム及び記録媒体
US8218033B2 (en) Sound corrector, sound recording device, sound reproducing device, and sound correcting method
JP2009156888A (ja) 音声補正装置及びそれを備えた撮像装置並びに音声補正方法
WO2015098110A1 (ja) 撮像装置、撮像システムおよび撮像方法
JP6295442B2 (ja) 画像生成装置、撮影装置、画像生成方法及びプログラム
JP6314321B2 (ja) 画像生成装置、撮影装置、画像生成方法及びプログラム
JP2012151544A (ja) 撮像装置及びプログラム
JP6295443B2 (ja) 画像生成装置、撮影装置、画像生成方法及びプログラム
US20160172004A1 (en) Video capturing apparatus
JP2014236276A (ja) 画像処理装置、撮像装置および画像処理プログラム
JP2009302665A (ja) 撮像装置および撮像装置用プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180122

R151 Written notification of patent or utility model registration

Ref document number: 6295442

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees