JP2010011076A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP2010011076A
JP2010011076A JP2008167893A JP2008167893A JP2010011076A JP 2010011076 A JP2010011076 A JP 2010011076A JP 2008167893 A JP2008167893 A JP 2008167893A JP 2008167893 A JP2008167893 A JP 2008167893A JP 2010011076 A JP2010011076 A JP 2010011076A
Authority
JP
Japan
Prior art keywords
image
metadata
analysis
data
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008167893A
Other languages
English (en)
Other versions
JP5153478B2 (ja
Inventor
Takashi Oya
崇 大矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008167893A priority Critical patent/JP5153478B2/ja
Priority to US12/492,048 priority patent/US8363886B2/en
Publication of JP2010011076A publication Critical patent/JP2010011076A/ja
Application granted granted Critical
Publication of JP5153478B2 publication Critical patent/JP5153478B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0048Type of connection
    • H04N2201/0049By wire, cable or the like
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3252Image capture parameters, e.g. resolution, illumination conditions, orientation of the image capture device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3254Orientation, e.g. landscape or portrait; Location or order of the image data, e.g. in memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8047Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】撮影された画像のデータに、より広範囲のメタデータを付与することができる画像処理装置及び画像処理方法等を提供する。
【解決手段】撮像手段におけるファインダ画像のデータを取得する(ステップS502)。その後、ファインダ画像のデータの解析を行い、ファインダ画像の特徴量を抽出する(ステップS504)。その後、解析の結果に基づいてメタデータを作成する(ステップS507)。そして、記撮像手段において撮影された静止画像のデータにメタデータを付与する(ステップS508)。
【選択図】図2

Description

本発明は、デジタルカメラ等により取得された画像データの処理に好適な画像処理装置及び画像処理方法等に関する。
映像中の被写体及び事象を解析し、メタデータを自動的に生成する技術が知られている。このような自動生成技術においては、ある映像から抽出されたメタデータを、抽出元の映像に対して付与するのが一般的である。例えばデジタルカメラの場合、撮影した1枚の静止画像から抽出したメタデータを当該画像のヘッダ部に記録する方式が一般的である。
特許文献1には、撮影画像中の人物を外部データベースと連動して認識し、画像にメタデータを付与するカメラが開示されている。また、特許文献2には、録画映像から文字情報を抽出してメタデータとして付与するカメラが開示されている。また、特許文献3には、撮影画像中に、予め登録された被写体人物が存在する場合には、関連情報を画像に重畳して表示する電子カメラが開示されている。
特開2004−062868号公報 特開2005−039354号公報 特開2006−165822号公報
しかしながら、これらの従来の技術により付与されたメタデータのみでは、その後の活用が十分とはいえない。例えば、撮影画像の閲覧時に利用可能なメタデータが不足することもある。
本発明は、撮影された画像のデータに、より広範囲のメタデータを付与することができる画像処理装置及び画像処理方法等を提供することを目的とする。
本願発明者は、前記課題を解決すべく鋭意検討を重ねた結果、以下に示す発明の諸態様に想到した。
本発明に係る画像処理装置は、撮像手段における撮影確認用の画像のデータを取得する撮影確認用画像データ取得手段と、前記撮影確認用の画像のデータの解析を行う画像解析手段と、前記画像解析手段による解析の結果に基づいてメタデータを作成するメタデータ作成手段と、前記撮像手段において撮影された画像のデータに前記メタデータを付与するメタデータ付与手段と、を有することを特徴とする。
本発明に係る画像処理方法は、撮像手段における撮影確認用の画像のデータを取得する撮影確認用画像データ取得ステップと、前記撮影確認用の画像のデータの解析を行う画像解析ステップと、前記画像解析ステップにおける解析の結果に基づいてメタデータを作成するメタデータ作成ステップと、前記撮像手段において撮影された画像のデータに前記メタデータを付与するメタデータ付与ステップと、を有することを特徴とする。
本発明によれば、撮影確認用の画像のデータの解析結果に基づいて作成したメタデータを付与することにより、画像の撮影の前後の状況及び周囲の状況等を当該画像のデータにメタデータとして付与することができる。つまり、当該画像に含まれていないものに基づくメタデータをも付与することができる。例えば、撮影地点の周囲の看板にある文字情報、撮影前後にその場に同席した人物の情報等をメタデータとして付与することができる。このため、より広範囲のメタデータを付与することが可能となる。
以下、本発明の実施形態について添付の図面を参照して具体的に説明する。
(第1の実施形態)
先ず、第1の実施形態について説明する。第1の実施形態では、カメラが画像処理装置として機能する。図1は、本発明の第1の実施形態に係るカメラを示す図である。
第1の実施形態に係るカメラ(撮像装置)100には、撮像系101、画像処理部102、撮影制御部103、CPU105、ROM106、RAM107、及び位置姿勢検出部108が設けられている。つまり、撮像系101が画像処理装置に内蔵されている。ROM106には、CPU105が実行するプログラムが格納されている。このプログラムには、例えば、後述の静止画像データにメタデータを付与するためのプログラムが含まれている。また、カメラ100には、外部記憶インタフェース(I/F)111が設けられており、この外部記憶I/F111に、メモリカード等の外部メモリ(記録媒体)112が装着される。また、カメラ100には、操作デバイスインタフェース(I/F)113が設けられており、この操作デバイスI/F113に、ボタン及びスイッチ等の操作デバイス114が接続されている。操作デバイス114は、例えばユーザがカメラ100の動作を制御する際に用いられる。また、カメラ100には、表示デバイスインタフェース(I/F)115が設けられており、この表示デバイスI/F115に、液晶表示装置又は有機EL表示装置等の表示デバイス116が接続されている。更に、カメラ100には、外部機器との通信を行う通信インタフェース(I/F)117が設けられている。通信I/F117としては、例えば、USB(Universal Serial Bus)インタフェース及びLAN(Local Area Network)インタフェースが挙げられるが、他のものが用いられてもよい。つまり、通信方式は特に限定されない。
また、このカメラ100には、動作モードとして、静止画撮影モード、動画撮影モード、再生モード、PC制御モード等の複数の動作モードが設定されている。これらの動作モードの選択は、例えばユーザにより操作デバイス114を介して行われる。
撮像系101には、図示しないが、光学系及び撮像素子が設けられており、撮影制御部(焦点制御手段)103がこれらのフォーカス、ズーム、絞り、シャッタースピード及び感度等の制御を行う。そして、撮像系101から入力された被写体画像の画像データに対して、画像処理部102が、雑音除去処理、現像処理、符号化処理等を施す。このような画像処理後の画像データは、CPU105の指示に基づいて、適宜、ファインダ画像データ又は静止画像データとして、RAM107、外部メモリ112又はビデオメモリ(図示せず)等に保存される。なお、ファインダ画像データは撮影確認用の小画像(撮影確認用画像)のデータであるのに対し、静止画像データはレリーズ要求によって撮影された画像のデータである。ファインダ画像データの解像度は、例えばQVGA(320×200画素)程度である。
次に、上述の画像データにメタデータを付与するためのプログラムに基づくカメラ100の動作について説明する。図2は、カメラ100の動作(メタデータ付与の際の処理)を示すフローチャートである。
先ず、CPU105は、ステップS501において、動作モードが静止画撮影モードに設定されているか否かの判別を行う。そして、静止画撮影モードに設定されていれば、ステップS502において、CPU105は、撮影確認用画像データ取得手段として、ファインダ画像データを取得する。そして、CPU105は、ファインダ画像データをRAM107又はビデオメモリに保存し、また、表示デバイス116に表示する。
次いで、CPU105は、ステップS503において、取得したファインダ画像データが解析可能なものであるか否かの判別を行う。これは、手ぶれ又はぼけ等により画像の特徴量の抽出が不可能な場合があるからである。そして、解析可能なものであれば、ステップS504において、CPU105は、画像解析手段として、ファインダ画像データの解析を行い、ファインダ画像の特徴量を抽出し、RAM107に格納する。ここでの格納方式は、例えば構造体表現等のプログラム言語で表現される任意の形式である。画像の特徴量としては、例えば、図3に示すように、ファインダ画像300内の人物検出301の特徴量、顔検出302の特徴量及び文字検出303の特徴量等が挙げられる。また、顔認識の特徴量、人物認識の特徴量、被写体物体の特徴量、シーンの特徴量等も挙げられる。
ステップS504の後、及びステップS503において解析不可能と判別した場合、ステップS505において、CPU105は、メタデータが作成可能な状態か否かの判別を行う。本実施形態では、CPU105は、静止画像が撮影された場合に、メタデータが作成可能な状態と判別し、ステップS507に進み、一方、静止画像が撮影されていない場合には、作成不可能な状態と判別し、ステップS502に戻る。ステップS502〜S505の処理は、例えば1フレーム毎に行われる。
なお、静止画像の撮影はカメラ100の操作デバイス114に含まれるレリーズボタンの押下により行われる。CPU105は、この操作をレリーズイベントとして検出し、このイベントを検出した場合には、ステップS509において、静止画像の撮影処理を行う。続いて、ステップS510において、CPU105は、ステップS504における処理と同様にして、静止画像の特徴量を抽出し、RAM107に格納する。このとき、静止画像は画像サイズが大きいため、適宜、これに適した処理を適用することが好ましい。
そして、上述のように、CPU105は、静止画像が撮影された場合に、メタデータが作成可能な状態と判別し、静止画像が撮影されていない場合には、作成不可能な状態と判別するのである。
ステップS507において、CPU105は、メタデータ作成手段として、ステップS504において抽出した特徴量に基づいてメタデータを作成し、RAM107に格納する。つまり、メタデータとしては、例えば、顔検出情報、顔認識情報、人物認識情報、被写体物体情報、文字情報、及びシーン情報等が挙げられる。このとき、ステップS510において抽出した特徴量に基づくメタデータを併せて作成してもよい。なお、メタデータの種類は、これらに限定されない。
次いで、ステップS508において、CPU105は、メタデータ付与手段として、ステップS507で作成したメタデータをステップS509〜S510を介して取得した静止画像データに付与し、この静止画像データを、例えば外部メモリ112に保存する。その後、CPU105は、一連の処理でRAM107に格納したメタデータ等の情報を消去し、ステップS501に戻る。
ここで、メタデータの記述例について説明する。図4は、XML形式のメタデータの記述例を示す図である。図4に示す例には、静止画像の撮影の直前のファインダ画像データから作成されたメタデータの一覧が記述されている。
例えば、人物認識情報として<person>タブを用いて、相対検出時刻、人物ID(人物弁別情報)、人物名、顔検出領域、顔サムネイル画像(人物顔画像情報)が記述されている。更に、人物の属性を示す人物属性情報が記述されてもよい。相対検出時刻とは、メタデータを抽出したファインダ画像データの撮影時刻を、静止画像の撮影時刻からの相対時間で表現した時刻である。人物ID及び人物名を求めるためには、一般的な顔画像の弁別処理により、予め登録した顔画像データベースとの照合を行えばよい。顔検出位置は静止画座標表現であるが、これはファインダ画像と撮影された静止画像との間でのずれが所定の範囲内(同一を含む)の視線方向であった場合に意味をもつ。ずれが所定の範囲内にあるか否かは、位置姿勢検出部108及び画像処理部102を用いて判断することができる。そして、ずれが所定の範囲内にある場合には、CPU105は、ファインダ画像における座標情報を、撮影された静止画像の座標情報に変換してメタデータを作成する。また、顔サムネイル情報は顔画像をサムネイル画像として添付するものであり、<face_image>タグとして表現される。サムネイル画像は対応するファインダ画像から切り出されて添付される。このようなサムネイル画像の例としては、顔に限定されることはなく、後述する文字情報が検出された場合、当該文字情報を含む物体領域を切り出して添付することも可能である。文字情報を含む物体の例としては、シール、ナンバープレート、看板やネオンサイン等が挙げられる。
他のメタデータとして、シーン情報が<scene>タグにより記述されるものがある。シーンの例としては、屋内、屋外、風景、海、山、及び街等の背景及び場所、春、夏、秋、及び冬等の季節、並びに入学式、卒業式、運動会、遠足、及び結婚式等のイベント情報がある。これらの情報の抽出には、公知の技術を採用すればよい。
更に他のメタデータとして、文字情報が<text>タブによって記述されるものがある。ここでも顔情報と同様に、相対検出時刻が記述されている。文字情報は画像中に存在する文字を文字認識処理により抽出したものである。また、顔領域及び文字領域等の画像そのものをメタデータとして付与することも可能である。
なお、静止画像から作成するメタデータも同様な方法によって表現することができる。但し、静止画像から作成するメタデータの相対検出時刻は0になる。メタデータの表現形式としては、
また、メタデータの記述形式としては、上述のXML形式の他に、画像のヘッダに添付するための形式がある。例えばJPEG画像のヘッダに記述するExif2.1が該当する。この場合、Exifのフォーマットに基づいて記述を行うこととなる。また、ステップS508では、メタデータが静止画像データの画像ヘッダに付与される。
このような本実施形態によれば、図5に示すような処理が行われ、静止画像の撮影前のファインダ画像データから作成されたメタデータが付与された静止画像データが得られる。図5は、カメラ100において取得する画像を時間軸上に並べて示す図である。上述のように、本実施形態では、静止画像210の撮影前であっても、静止画撮影モードに設定されていれば、CPU105は、ステップS502〜S505の処理により、1フレーム毎にファインダ画像データf1、・・・、fmを順次取得する。この間、新たなファインダ画像データを取得する度に、CPU105は、その前に取得しているファインダ画像データを上書き消去する。また、CPU105は、上書き消去の前に特徴量の抽出を行っている(ステップS504)。なお、ファインダ画像及び静止画像の撮影範囲は互いに同一であるが、上述のように、ファインダ画像は静止画像と比較して解像度が低い。また、ファインダ画像及び静止画像の取得を同時に行うことはできない。但し、このようなファインダ画像であっても、QVGA(320×200画素)程度の解像度があれば、手ぶれ及びぼけ等の事情がなければ、画像解析によって顔の検出及び弁別等が可能である。また、撮影された文字の認識も可能である。
そして、静止画像210の撮影が行われると、ステップS505〜S508の処理により、CPU105が静止画像210のデータに、ファインダ画像データf1〜fmから抽出して作成したメタデータを付与する。このとき、CPU105は、静止画像210から抽出された特徴量(ステップS510)からもメタデータを作成し、これをファインダ画像データf1〜fmから作成したメタデータとマージして、静止画像210のデータのヘッダに付与する。この際、CPU105は、基本情報として、撮影日時、撮影パラメータ、位置姿勢検出部108から得た画像の向き情報等も同時に付与する。そして、CPU105は、このデータを、例えば外部メモリ112に保存する。なお、JPEG画像のヘッダにメタデータを付与するフォーマットは例えばExif2.1に定義されているが、本発明ではメタデータのフォーマットは特定のものに限定されない。
このようにして静止画像データに付与されたメタデータは、例えば、画像ブラウザにおいて、表示及び検索等に利用される。例えばネットワーク家電向けの標準規格である、DLNA(Digital Living Network Alliance)で利用される通信規格の一つにUPnP(Universal Plug and Play)のCDS(Content Directory Service)がある。CDS機能をカメラが持つことによって、ブラウザはネットワーク経由で様々な検索を行うことが可能である。また、撮影の際にこの機能を利用することによって、被写体以外に撮影静止画像に添付したい周囲の状況及び被写体情報をメタデータとして意図的に作成することができる。
このように、本実施形態によれば、静止画像の撮影前のファインダ画像データからメタデータを作成して静止画像データに付与しているので、静止画像に対して関連性の高いメタデータを得ることができる。つまり、撮影された静止画像に含まれていないものに基づくメタデータをも付与することができる。例えば、撮影地点の周囲の看板にある文字情報、撮影前後にその場に同席した人物の情報等をメタデータとして付与することができる。このため、より広範囲のメタデータを付与することが可能となる。この結果、その静止画像の閲覧の際に、多様な表示及び検索等を行うことも可能となり、閲覧の際の利便性を向上させることができる。
また、ステップS503において、手ぶれ又はぼけ等のために解析可能なものでないと判別したファインダ画像データについては特徴量の抽出を省略することとしているため、CPU105の負荷を低減して、処理を効率化することができる。なお、ぼけの有無は撮影制御部103が制御を行うAF処理の状態から判別できる。また、手ぶれの有無は、振動検出手段として撮像系101の振動を検出する位置姿勢検出部108の検出結果から判別できる。更に、位置姿勢検出部108からは、位置情報を検出することも可能である。従って、ファインダ表示中も常に位置検出を行い、静止画像における撮影地点と一定以上離れた地点で撮影されたファインダ画像データから抽出した特徴量については、メタデータの作成に用いないようにしてもよい。また、当該特徴量からメタデータを作成しても、当該メタデータを静止画像データに付与しないようにしてもよい。このような処理を行うことにより、ファインダ画像が不良な場合には画像解析処理を省略して、効率的にメタデータを作成することができる。
また、複数のファインダ画像データの特徴量を用いてメタデータを作成した場合、同一又は類似のメタデータが作成される可能性が高い。従って、メタデータの作成に一定の基準を設けて、メタデータの情報量(例えば個数)を制限することが好ましい。例えば、文字情報等の同一性の検証が容易である特徴量については、同一のメタデータを消去してもよい。また、顔検出及び顔弁別等については、信頼度を導出し、信頼度が所定の基準値よりも高い特徴量を用いて作成したメタデータを除いて削除するようにしてもよい。信頼度は顔らしさを表すものであり、多くの顔検出処理において取得可能なパラメータである。また、単純に静止画像の撮影画像との時間間隔の短いファインダ画像データの特徴量を用いて作成したメタデータを除いて削除するようにしてもよい。これらの場合、CPU105が、制限設定手段としてメタデータの情報量に制限を設定し、導出手段として文字情報、人物情報等の信頼度を抽出し、信頼度が高いものから順に制限を限度にしてメタデータを付与することとなる。このような処理を行うことにより、重複したメタデータを排除し、信頼度の高いもののみを採用して、効率的にメタデータを作成することができる。
(第2の実施形態)
次に、第2の実施形態について説明する。第2の実施形態では、静止画像の撮像前のファインダ画像データから作成したメタデータのみならず、静止画像の撮像後のファインダ画像データからもメタデータを作成し、これらを静止画像データに付与する。他の構成は第1の実施形態と同様である。以下、第1の実施形態と相違する点を中心にして説明する。
第2の実施形態では、CPU105は、静止画像の撮影の前後に取得されたファインダ画像データからメタデータを作成する。このとき、CPU105は、メタデータを作成する対象とするファインダ画像データを、次のような3つの規則のいずれかに従って特定する。これは、ある静止画像の撮影後のファインダ画像データは、その次に撮影される静止画像の撮影前のファインダ画像データにも該当するため、判断基準を設けておくことにより、どちらの静止画像にメタデータを付与することになるのか明確にするためである。
第1の判断基準は、2回の静止画像の撮影の間に取得されたファインダ画像から作成したメタデータを、両静止画像のメタデータとして採用し得るとするものである。つまり、これらのメタデータは、2つの静止画像データに付与される。
第2の判断基準は、静止画像の撮影時刻の前後の所定の時間内(例えばΔt秒間内)に取得されたファインダ画像から作成したメタデータを、当該静止画像のメタデータとして採用するというものである。
第3の判断基準では、先の静止画像の撮影時刻をt1、後の静止画像の撮影時刻をt2とし、更に、これらの間の時刻t1+Δtmを決めておく。そして、時刻t1から時刻t1+Δtmまでに取得したファインダ画像から作成したメタデータを、先の静止画像のメタデータとして採用する。また、時刻t1+Δtmから時刻t2+Δtmまでに取得したファインダ画像から作成したメタデータを、後の静止画像のメタデータとして採用する。
そして、第1の実施形態と同様に、図2に示すフローチャートに沿った処理と同様の処理を行う。但し、ステップS507では、第1の実施形態では、静止画像の撮影が行われたか否かという観点で判別しているのに対し、上述の3種類の判断基準のいずれか一つを用いて、メタデータの作成が可能な状態となっているか否かという観点で判別を行う。
このような規則に則った処理の結果、図6に示すように、静止画像210のデータに、その撮影前のファインダ画像データf1〜fmから作成した第1のメタデータのみならず、撮影後のファインダ画像データfm+1〜fnから作成した第2のメタデータも付与されることとなる。
このような第2の実施形態によれば、静止画像の撮影前だけでなく、撮影後であっても、ユーザがメタデータとして付与したい対象にカメラを向けることによりメタデータを追加することができる。これにより、メタデータ付与作業における利便性をより一層向上することができる。
(第3の実施形態)
次に、第3の実施形態について説明する。第3の実施形態に係るカメラシステムでは、カメラの本体ではなく、カメラに接続されたカメラアダプタによりカメラを制御し、カメラアダプタがメタデータの付与処理を行う。つまり、第3の実施形態では、カメラアダプタが画像処理装置として機能する。図7は、本発明の第3の実施形態におけるカメラアダプタを示す図である。
第3の実施形態におけるカメラアダプタ200には、カメラ100と同様に、CPU105、ROM106、RAM107、位置姿勢検出部108、外部記憶I/F111、操作デバイスI/F113及び表示デバイスI/F115が設けられている。また、通信I/F117も設けられている。なお、ROM106には、CPU105が実行するプログラムがされており、このプログラムには、例えば、静止画像データにメタデータを付与するためのプログラムが含まれている。カメラアダプタ200は、例えばネットワーク通信機能を有する小型のコンピュータであり、主としてUSB等のシリアル接続を用いて外部のカメラ(撮像装置)150に接続される。カメラアダプタ200に接続されたカメラ150は、例えばPC連携モードで動作する。
なお、カメラ150には、図示しないが、カメラ100と同様に、撮像系、画像処理部、撮影制御部、ROM、RAM及びCPU等が設けられている。
このように構成されたカメラシステムでは、カメラ150の制御はカメラアダプタ200により行われる。つまり、主としてカメラアダプタ200内のCPU105がROM106に格納されたプログラムを実行することにより、カメラ150の動作が制御される。例えば、静止画撮影モードの開始・終了、カメラアダプタ200への画像データの転送等の要求がカメラアダプタ200からカメラ150に対してなされる。
次に、このようなカメラシステムの動作について説明する。図8は、第3の実施形態におけるカメラ150及びカメラアダプタ200の動作を示すシーケンス図である。
先ず、ステップS701において、カメラ150が起動し、ステップS702において、カメラアダプタが起動する。
次いで、ステップS703において、カメラ150の動作モードが、外部からの制御が可能なモード、例えばPC連携モードに設定される。
その後、ステップS710において、カメラアダプタ200からカメラ150に対して通信要求を行う。ステップS711において、カメラ150がこれを承認すると、ステップS712において、通信が確立する。
続いて、ステップS713において、カメラアダプタ200はカメラ150に対して撮影モード開始の要求を行う。すると、カメラ150は、ステップS714において、撮影モードを開始する。
次いで、カメラアダプタ200は、ステップS720において、ファインダ画像の要求を行う。これに対し、カメラ150は、ファインダ画像データを取得し、ステップS721において、ファインダ画像データをカメラアダプタ200に送信する。
その後、カメラアダプタ200は、ステップS722において、ファインダ画像データから、メタデータ作成のための画像の特徴量の抽出を行い、ステップS723において、画像の特徴量をRAM107等に保存する。
続いて、カメラアダプタ200は、ステップS724において、メタデータの作成可否の判別を行う。この判別では、第1及び第2の実施形態におけるステップS505の判別と同様に、どのタイミングでメタデータの作成、及び、静止画像データへの付与処理が可能か判別するためである。そして、作成不可と判別した場合は、ステップS720に戻って処理を続ける。一方、作成可能と判別した場合は、ステップS725において、カメラアダプタ200は、メタデータの作成及び静止画像データへの付与を行う。そして、ステップS720に戻って処理を続ける。
本実施形態では、このような一連の処理をカメラアダプタ200が行うので、カメラ150自体に高度な処理機能がない場合、例えば第1及び第2の実施形態のようなプログラムが備えられていない場合でも、有用なメタデータを作成して付与することができる。
また、静止画像の撮影は、ステップS730で画像撮影イベントが発生した場合に行われる。即ち、画像撮影要求イベントが発生すると、カメラアダプタ200は、ステップS731において、カメラ150に対して画像撮影を要求する。これに対し、カメラ150は、ステップS732において、静止画像の撮影を行い、ステップS733において、当該静止画像の画像データをカメラアダプタ200に送信する。
その後、カメラアダプタ200は、ステップS734において、静止画像データに対して画像解析処理を行い、メタデータとして必要な情報を保存し、ステップS720に戻って処理を続ける。なお、図8のシーケンス図において終了処理は省略している。
第3の実施形態では、カメラ150とカメラアダプタ200とが分離しているため、カメラアダプタ200が所定の機能を備えていれば、カメラ150が高度な画像処理機能及び画像解析機能等を備えていない場合でも、有用なメタデータを付与することができる。また、複数のカメラ150に対して、同一のカメラアダプタ200を用いることも可能である。更に、カメラアダプタ200として可搬性のあるものを用いれば、持ち運びも容易である。
なお、本発明は静止画像の撮影に限定されることはなく、動画撮影が可能なデジタルカメラ及びデジタルビデオカメラ等の撮像装置に適用することも可能である。これらの場合、録画開始モードに設定する録画待機(録画停止)の状態となり、ファインダ画像が有効になる。そして、録画開始ボタンが押下されると、録画が開始される。このような動画撮影が可能な撮像装置に本発明を適用する際には、録画待機状態におけるファインダ画像を用いて上述の実施形態と同様の処理を行えばよい。この結果、ファインダ画像から作成したメタデータをその後に撮影した動画像に付与することが可能となる。
また、本発明の実施形態は、例えばコンピュータがプログラムを実行することによって実現することができる。また、プログラムをコンピュータに供給するための手段、例えばかかるプログラムを記録したCD−ROM等のコンピュータ読み取り可能な記録媒体又はかかるプログラムを伝送するインターネット等の伝送媒体も本発明の実施形態として適用することができる。また、上記のプログラムも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体及びプログラムプロダクトは、本発明の範疇に含まれる。
本発明の第1の実施形態に係るカメラを示す図である。 カメラ100の動作(メタデータ付与の際の処理)を示すフローチャートである。 画像の特徴量の例を示す図である。 XML形式のメタデータの記述例を示す図である。 第1の実施形態でカメラ100において取得する画像を時間軸上に並べて示す図である。 第2の実施形態でカメラ100において取得する画像を時間軸上に並べて示す図である。 本発明の第3の実施形態におけるカメラアダプタを示す図である。 第3の実施形態におけるカメラ150及びカメラアダプタ200の動作を示すシーケンス図である。
符号の説明
100:カメラ
101:撮像系
102:画像処理部
103:撮影制御部
105:CPU
106:ROM
107:RAM
108:位置姿勢検出部
111:外部記憶インタフェース(I/F)
112:外部メモリ(記録媒体)
113:操作デバイスインタフェース(I/F)
114:操作デバイス
115:表示デバイスインタフェース(I/F)
116:小型ディスプレイ
117:通信インタフェース(I/F)
150:カメラ
200:カメラアダプタ

Claims (16)

  1. 撮像手段における撮影確認用の画像のデータを取得する撮影確認用画像データ取得手段と、
    前記撮影確認用の画像のデータの解析を行う画像解析手段と、
    前記画像解析手段による解析の結果に基づいてメタデータを作成するメタデータ作成手段と、
    前記撮像手段において撮影された画像のデータに前記メタデータを付与するメタデータ付与手段と、
    を有することを特徴とする画像処理装置。
  2. 前記撮像手段を内蔵していることを特徴とする請求項1に記載の画像処理装置。
  3. 前記撮像手段を備えた撮像装置と通信する通信手段を有することを特徴とする請求項1に記載の画像処理装置。
  4. 前記メタデータ作成手段は、前記撮像手段における撮影の少なくとも前又は後の時刻において前記撮影確認用画像データ取得手段により取得されたデータについての前記画像解析手段による解析の結果に基づいて、前記メタデータを作成することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. 前記メタデータ作成手段は、前記撮像手段における撮影の時刻から所定の時間内に前記撮影確認用画像データ取得手段により取得されたデータについての前記画像解析手段による解析の結果に基づいて、前記メタデータを作成することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  6. 前記撮像手段の振動を検出する振動検出手段を有し、
    前記画像解析手段は、前記振動検出手段が前記撮像手段の振動を検出した場合には、前記解析を省略することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記撮像手段における焦点を制御する焦点制御手段を有し、
    前記画像解析手段は、前記焦点制御手段が前記焦点の制御を行っている場合には、前記解析を省略することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 前記メタデータ付与手段は、
    前記メタデータの情報量に制限を設ける制限設定手段と、
    前記画像解析手段による解析の結果の信頼度を導出する導出手段と、
    を有し、
    前記信頼度が高いものから順に、前記制限を限度に前記メタデータの付与を行うことを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
  9. 前記メタデータ作成手段は、前記メタデータとして、前記画像に含まれる背景に関するデータを作成することを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記メタデータ作成手段は、前記メタデータとして、前記画像に含まれる文字に関するデータを作成することを特徴とする請求項1乃至9のいずれか1項に記載の画像処理装置。
  11. 前記メタデータ作成手段は、前記メタデータとして、前記画像に含まれる人物に関するデータを作成することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記メタデータ作成手段は、前記人物に関するデータとして、人物弁別情報、人物顔画像情報及び人物属性情報を含む群から選択された少なくとも1つの情報を作成することを特徴とする請求項11に記載の画像処理装置。
  13. 前記メタデータ作成手段は、前記撮影確認用画像データ取得手段が前記画像のデータを取得した時と前記撮像手段における撮影の時との間での前記撮像手段の位置及び姿勢のずれが所定の範囲内にある場合、前記撮影確認用の画像における座標情報を、前記撮像手段において撮影された画像における座標情報に変換して、前記メタデータを作成することを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。
  14. 前記画像解析手段は、前記撮像手段において撮影された画像のデータの解析も行い、
    前記メタデータ作成手段は、前記撮像手段において撮影された画像のデータについての前記解析の結果にも基づいて前記メタデータを作成することを特徴とする請求項1乃至13のいずれか1項に記載の画像処理装置。
  15. 撮像手段における撮影確認用の画像のデータを取得する撮影確認用画像データ取得ステップと、
    前記撮影確認用の画像のデータの解析を行う画像解析ステップと、
    前記画像解析ステップにおける解析の結果に基づいてメタデータを作成するメタデータ作成ステップと、
    前記撮像手段において撮影された画像のデータに前記メタデータを付与するメタデータ付与ステップと、
    を有することを特徴とする画像処理方法。
  16. コンピュータに、
    撮像手段における撮影確認用の画像のデータを取得する撮影確認用画像データ取得ステップと、
    前記撮影確認用の画像のデータの解析を行う画像解析ステップと、
    前記画像解析ステップにおける解析の結果に基づいてメタデータを作成するメタデータ作成ステップと、
    前記撮像手段において撮影された画像のデータに前記メタデータを付与するメタデータ付与ステップと、
    を実行させることを特徴とするプログラム。
JP2008167893A 2008-06-26 2008-06-26 画像処理装置及び画像処理方法 Active JP5153478B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008167893A JP5153478B2 (ja) 2008-06-26 2008-06-26 画像処理装置及び画像処理方法
US12/492,048 US8363886B2 (en) 2008-06-26 2009-06-25 Image processing apparatus for providing metadata to captured image and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008167893A JP5153478B2 (ja) 2008-06-26 2008-06-26 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2010011076A true JP2010011076A (ja) 2010-01-14
JP5153478B2 JP5153478B2 (ja) 2013-02-27

Family

ID=41447489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008167893A Active JP5153478B2 (ja) 2008-06-26 2008-06-26 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US8363886B2 (ja)
JP (1) JP5153478B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012029035A (ja) * 2010-07-23 2012-02-09 Nikon Corp 電子カメラ及び画像処理プログラム
JP2012055445A (ja) * 2010-09-07 2012-03-22 Pentax Ricoh Imaging Co Ltd 撮像装置及びゲームシステム
JP2013524348A (ja) * 2010-03-31 2013-06-17 マイクロソフト コーポレーション 注釈付き情報の作成及び伝搬
JP2018190430A (ja) * 2018-06-14 2018-11-29 株式会社ニコン テキスト生成装置、電子機器及びプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5493531B2 (ja) * 2009-07-17 2014-05-14 三菱電機株式会社 映像音声記録再生装置および映像音声記録再生方法
US8320644B2 (en) * 2010-06-15 2012-11-27 Apple Inc. Object detection metadata
JP7317566B2 (ja) * 2019-04-26 2023-07-31 キヤノン株式会社 撮像装置、その制御方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
JP2006129048A (ja) * 2004-10-28 2006-05-18 Nikon Corp デジタルカメラ
JP2008141635A (ja) * 2006-12-05 2008-06-19 Nikon Corp カメラ、および画像検索プログラム
JP2008148220A (ja) * 2006-12-13 2008-06-26 Seiko Epson Corp 撮影装置、撮影方法及び制御プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738015B2 (en) * 1997-10-09 2010-06-15 Fotonation Vision Limited Red-eye filter method and apparatus
US7302118B2 (en) * 2002-02-07 2007-11-27 Microsoft Corporation Transformation of images
US7680342B2 (en) * 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
JP2005039354A (ja) 2003-07-16 2005-02-10 Matsushita Electric Ind Co Ltd メタデータ入力方法と編集システム
US20050018057A1 (en) * 2003-07-25 2005-01-27 Bronstein Kenneth H. Image capture device loaded with image metadata
US7528868B2 (en) * 2003-12-18 2009-05-05 Eastman Kodak Company Image metadata attachment
JP4720167B2 (ja) 2004-12-03 2011-07-13 株式会社ニコン 電子カメラおよびプログラム
US7826657B2 (en) * 2006-12-11 2010-11-02 Yahoo! Inc. Automatically generating a content-based quality metric for digital images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
JP2006129048A (ja) * 2004-10-28 2006-05-18 Nikon Corp デジタルカメラ
JP2008141635A (ja) * 2006-12-05 2008-06-19 Nikon Corp カメラ、および画像検索プログラム
JP2008148220A (ja) * 2006-12-13 2008-06-26 Seiko Epson Corp 撮影装置、撮影方法及び制御プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524348A (ja) * 2010-03-31 2013-06-17 マイクロソフト コーポレーション 注釈付き情報の作成及び伝搬
JP2012029035A (ja) * 2010-07-23 2012-02-09 Nikon Corp 電子カメラ及び画像処理プログラム
JP2012055445A (ja) * 2010-09-07 2012-03-22 Pentax Ricoh Imaging Co Ltd 撮像装置及びゲームシステム
JP2018190430A (ja) * 2018-06-14 2018-11-29 株式会社ニコン テキスト生成装置、電子機器及びプログラム

Also Published As

Publication number Publication date
US8363886B2 (en) 2013-01-29
US20090324007A1 (en) 2009-12-31
JP5153478B2 (ja) 2013-02-27

Similar Documents

Publication Publication Date Title
JP5153478B2 (ja) 画像処理装置及び画像処理方法
KR101720774B1 (ko) 디지털 촬영 장치 및 그의 사진 제공 방법
TW201011696A (en) Information registering device for detection, target sensing device, electronic equipment, control method of information registering device for detection, control method of target sensing device, information registering device for detection control progr
US20100066847A1 (en) Imaging apparatus and program
TW201417575A (zh) 影像自動字幕
CN102915549B (zh) 一种图像文件的处理方法及装置
US9973649B2 (en) Photographing apparatus, photographing system, photographing method, and recording medium recording photographing control program
JP2015002423A (ja) 画像処理装置、サーバ及び記憶媒体
US20110096994A1 (en) Similar image retrieval system and similar image retrieval method
JP2008005154A (ja) 画像処理装置及びその制御方法
US8532439B2 (en) Reproduction apparatus and reproduction method
JP2016189544A (ja) 画像撮影装置、画像撮影方法、プログラムおよび記録媒体
JP6230386B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6724919B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6214762B2 (ja) 画像検索システム、検索画面表示方法
JP2009049886A (ja) 画像検索装置、撮影装置、画像検索方法及びプログラム
JP6221487B2 (ja) 情報処理装置、画像表示システム、情報処理装置における画像表示方法及びプログラム
JP5249090B2 (ja) 表示装置
US20190130944A1 (en) Information processor, information processing method, and program
JP6028605B2 (ja) 情報処理装置、情報処理装置におけるデータ付与方法及びプログラム
JP6146108B2 (ja) 情報処理装置、画像表示システム、画像表示方法及びプログラム
JP2019101783A (ja) 情報処理装置及び方法
JP6222313B2 (ja) 情報処理装置、情報処理装置におけるデータ付与方法及びプログラム
JP2011139279A (ja) 画像処理装置、カメラ、および画像処理プログラム
JP2010157960A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5153478

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3