JP4906685B2 - 撮像装置、その制御方法及びプログラム - Google Patents

撮像装置、その制御方法及びプログラム Download PDF

Info

Publication number
JP4906685B2
JP4906685B2 JP2007295989A JP2007295989A JP4906685B2 JP 4906685 B2 JP4906685 B2 JP 4906685B2 JP 2007295989 A JP2007295989 A JP 2007295989A JP 2007295989 A JP2007295989 A JP 2007295989A JP 4906685 B2 JP4906685 B2 JP 4906685B2
Authority
JP
Japan
Prior art keywords
image
comparison
pattern
subject information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007295989A
Other languages
English (en)
Other versions
JP2009124439A (ja
JP2009124439A5 (ja
Inventor
太 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007295989A priority Critical patent/JP4906685B2/ja
Priority to US12/265,606 priority patent/US8917936B2/en
Publication of JP2009124439A publication Critical patent/JP2009124439A/ja
Publication of JP2009124439A5 publication Critical patent/JP2009124439A5/ja
Application granted granted Critical
Publication of JP4906685B2 publication Critical patent/JP4906685B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、デジタルカメラ等の撮像装置に関し、特に撮像装置で撮影された画像データを保存及び管理する技術に関する。
JEITA(電子情報技術産業協会)では、デジタルカメラの画像フォーマットとして、DCF(Design rule for Camera File system)を制定している。DCFは、デジタルカメラで撮影した画像データをコンパクトフラッシュ(登録商標)メモリ等のリムーバブルメモリに記録する際のディレクトリ構造、ファイルフォーマットを規定したものである。
DCFでは、ファイル構造はExif(Exchange imagefile format)98で定義されている。また、画像データはJPEG(Joint Photographic Expert Group)方式で圧縮され,サムネイルは非圧縮で大きさは160画素×120画素とされるようになっている。更に画像データは、Exifタグにより、撮影時のカメラ情報を記録可能なようになっている。
ここで、カメラ情報とは、日付、カメラのメーカ名、機種名、ソフトウェアのバージョン、シャッタースピード、絞り、自動露出プログラム、写真内容の記述等である。これらカメラ情報のうち、写真内容の記述以外は、デジタルカメラの製造時、或いは画像撮影時に自動的に取り込むことが可能である。
上記カメラ情報の中で、写真内容の記述としては、例えば「2007年度○△小学校 入学式」や、「xx水族館 イルカショー」というような、何処で何を、といったような被写体や撮影場所等に関する個別具体的な情報が記述されることが一般的である。
このような写真内容に関する個別具体的な情報を撮影時に自動的に取り込むようにすることは、操作性において非常に有効である。このような自動取り込みを実現する手段としては、例えば自動GPS(Global Positioning System)情報を利用することや画像認識を利用すること等が考えられる。
しかしながら、GPSや画像認識では、場所に関しては東京の新宿等の一般的な地理情報を、顔に関しては一致/不一致を認識できても、観光地、遊園地、美術館、テーマパークの名称等の写真(画像データ)管理に必要な個別具体的な情報を得ることはできない。そのため、従来は、撮像した画像データに関する個別具体的な情報、即ち説明データを自動的に画像データに付して管理することができなかった。
このような問題を解決するため、例えば特許文献1では、被写体を説明する説明データをインデックスと共に格納したファイルをメモリカードに予め記憶しておき、撮影する前或いは撮影した後にインデックスを入力するようにした技術が開示されている。詳細には、撮影した画像データをファイル形式でメモリカードに格納すると共に、説明データに係るファイルと画像データに係るファイルとを、入力に係るインデックスを用いて関連付けるようにしている。
また、特許文献2では、動画像に現れる認識対象物体から、明るさの異なる複数画像それぞれに現れる認識対象物体から文字領域を抽出し、文字領域と辞書画像とのマッチング処理により文字領域に記されている文字を認識する技術が開示されている。詳細には、明るさの異なる複数画像それぞれのパターン認識結果のうちマッチング処理におけるマッチング度が高いものをパターン認識結果として出力するようにしている。この技術によれば、日中に通常の画像では周辺物の影の影響により暗すぎて認識に不適切な文字を、明るさの異なる画像にてパターン認識に適切な状態にすることができる。また、夜間に通常の画像では周辺からの光量照射により明るすぎて認識に不適切な文字を、明るさの異なる画像にて適切な状態にすることができる。これにより、パターン認識性能を向上することができる。
特開2003−198909号公報 特開2003−242440号公報 特開昭52−156624号公報 特開平4−346333号公報 特開平8−036597号公報
しかしながら、特許文献1の技術では、被写体を説明する説明データをメモリカードに予め記憶しなければならず、撮影場所等の情報が特定されていない状況下では入力ができない。そのため、情報が特定できない場合には、カメラ或いはPC等から情報を入力する必要があり、このような作業はカメラ等の入力方法に制約があるようなデバイスの場合には、文字入力が非常に煩わしいという課題があった。
また、特許文献2は、動画像における撮影環境に起因する明るさの変化に文字認識を最適化するためのものであり、撮影場所等の情報を自動的に画像データに関連付して管理するものではない。
本発明は上記の課題を解決するものであり、撮像した画像に関する個別具体的な情報をパターン認識を利用し自動的に画像に関連付けして、容易に画像を管理できるようにすることを目的とする。
本発明の撮像装置は、被写体の画像を撮像する撮像手段と、前記撮像手段の撮影前の取り込み画像からパターン認識を行うパターン認識手段と、前記パターン認識手段の認識結果を記憶する第1の記憶手段と、前記第1の記憶手段が記憶した認識結果と、前記パターン認識手段がパターン認識した最新の認識結果とを比較するパターン比較手段と、前記パターン比較手段の比較結果に応じて、前記第1の記憶手段が記憶した認識結果を更新する更新手段と、前記撮像手段が撮影した画像と、前記第1の記憶手段が記憶した認識結果とを関連付けする関連付手段とを有することを特徴とする。
また、本発明の撮像装置の制御方法は、被写体の画像を撮像する撮像手段を備えた撮像装置の制御方法であって、前記撮像手段の撮影前の取り込み画像からパターン認識を行うパターン認識ステップと、前記パターン認識ステップの認識結果を記憶手段に記憶する第1の記憶ステップと、前記第1の記憶ステップで記憶した認識結果と、前記パターン認識ステップでパターン認識した最新の認識結果とを比較するパターン比較ステップと、前記パターン比較ステップの比較結果に応じて、前記第1の記憶ステップで記憶した認識結果を更新する更新ステップと、前記撮像手段が撮影した画像と、前記第1の記憶ステップで記憶した認識結果とを関連付けする関連付ステップとを有することを特徴とする。
また、本発明のプログラムは、上述の撮像装置の制御方法をコンピュータに実行させるためのプログラムである
本発明によれば、撮影した画像に関する個別具体的な情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができ、操作性の向上を実現すると共に画像の管理を容易にすることができる。
以下、本発明の好適な実施の形態について図面を参照して詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態に係るデジタルカメラ(撮像装置)の構成を示すブロック図である。
図1において100はデジタルカメラある。11は撮影レンズ、12は絞り機能を備えるシャッター、14は光学像を電気信号に変換する撮像素子、16は撮像素子14のアナログ信号出力をディジタル信号に変換するA/D変換器である。また10は、撮影レンズ11を含む撮像部を覆うことにより、該撮像部の汚れや破損を防止するバリアである保護部である。
18はタイミング発生回路であり、撮像素子14、A/D変換器16、D/A変換器26にクロック信号や制御信号を供給する。タイミング発生回路18は、メモリ制御回路22やシステム制御回路50により制御される。
20は画像処理回路であり、A/D変換器16からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。画像処理回路20はまた、撮像した画像データを用いて所定の演算処理を行うことで、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理の一部を行っている。そしてシステム制御回路50が画像処理回路20による所定の演算処理の演算結果に基づき、露光制御手段40、測距制御手段42に対して制御を行うことで、上記TTL方式のAF処理、AE処理、EF処理が行われる。画像処理回路20はまた、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
58は顔検出部であり、画像処理回路20からのデータ或いはメモリ制御回路22からのデータに対して所定の顔検出処理を行い、画像に顔があるかどうかを検出するものである。このような技術については既に多くの手法が顔認識技術として実現されている。
例えば、特許文献3では、撮影画像から人の顔を抽出する手法として、原画像から肌色データを抽出し、肌色範囲と判断された測光点のクラスタを顔とする方法が提案されている。
また、特許文献4では、測光データを色相と彩度に変換し、この2次元ヒストグラムを作成、解析することで顔領域を判断する方法が提案されている。
また、特許文献5では、人の顔の形状に相当する顔候補領域を抽出し、その領域内の特徴量から顔領域を決定するという方法が提案されている。なお、本発明では、顔検出方法についてはどのような方法を使用しても構わない。
59はパターン検出部であり、予め記憶された辞書データ74を用いて、画像にABC、123、一二三、ひらがな、カタカナ、漢字等の文字や登録された会社ロゴ、標識、顔、絵文字、熟語等があるかどうかを検出する。このような検出技術については既に多くの手法がパターン認識技術として実現されている。本発明では、文字検出方法についてはどのような方法を使用しても良くここでは言及しない。
57はコード変換部であり、パターン検出部59で検出したパターンをコードデータ(以下、コード情報)に変換する。即ち、OCR(Optical Character Reader)処理を行う。
72は被写体情報生成部であり、ライブビュー時の取り込み画像から被写体情報を生成する。71は被写体比較部であり、被写体情報生成部72が生成した情報を所定の対象と比較する。なお、被写体情報生成部72及び被写体比較部71の詳細については後述する。
73はコード比較部であり、コード変換部57によって変換された前コード情報と新コード情報とを辞書データ74を参照しながら比較する。なお、詳細は後述するがライブビュー時においては、画像取込の際にパターン検出部59によりパターン検出が随時行われており、順次取り込まれる画像に応じてコード情報が更新されるようになっている。
22はメモリ制御回路であり、A/D変換器16、タイミング発生回路18、画像処理回路20、画像表示メモリ24、D/A変換器26、メモリ30、圧縮・伸長回路32を制御する。なお、A/D変換器16からのデータは、画像処理回路20及びメモリ制御回路22を介して、或いは直接メモリ制御回路22を介して、画像表示メモリ24或いはメモリ30に書き込まれる。
24は画像表示メモリ、26はD/A変換器、28はTFT・LCD等からなる画像表示部である。画像表示メモリ24に書き込まれた表示用の画像データはD/A変換器26を介して画像表示部28により表示される。画像表示部28を用いて撮像した画像データを逐次表示すれば、電子ファインダー機能を実現することが可能である。画像表示部28はまた、システム制御回路50の指示により任意に表示をON/OFFすることが可能であり、表示をOFFにした場合にはデジタルカメラ100の電力消費を大幅に低減することができる。
30は撮影した静止画像や動画像を格納するためのメモリであり、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶容量を備えている。これにより、デジタルカメラ100は、複数枚の静止画像を連続して撮影する連射撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。メモリ30はまた、システム制御回路50の作業領域としても使用することが可能である。
32は圧縮・伸長回路であり、適応離散コサイン変換(ADCT)等により画像データを圧縮及び伸長する。圧縮・伸長回路32はメモリ30に格納された画像を読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。
40は露光制御手段であり、絞り機能を備えるシャッター12を制御し、またフラッシュ48と連携することによりフラッシュ調光機能も有するものである。42は測距制御手段であり、撮影レンズ11のフォーカシングを制御する。44はズーム制御手段であり、撮影レンズ11のズーミングを制御する。46はバリア制御手段であり、バリアである保護部10の動作を制御する。48はフラッシュであり、AF補助光の投光機能、フラッシュ調光機能も有する。
上述したように露光制御手段40、測距制御手段42はTTL方式を用いて制御されており、撮像した画像データを画像処理回路20が演算した演算結果に基づき、システム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う。
50はデジタルカメラ100全体を制御するシステム制御回路、52はシステム制御回路50の動作用の定数、変数、プログラム等を記憶するメモリである。
54は表示部であり、システム制御回路50でのプログラムの実行に応じて、文字、画像、音声等を用いて動作状態やメッセージ等を表示する。表示部54は、デジタルカメラ100の操作部近辺の視認し易い位置に単数或いは複数個所設置され、例えばLCDやLED等の液晶表示装置、スピーカーや発音素子等の組み合わせにより構成されている。表示部54はまた、その一部の機能が光学ファインダー104内に設置されている。
表示部54の表示内容のうち、LCD等に表示するものとしては、シングルショット/連写撮影表示、セルフタイマー表示、圧縮率表示、記録画素数表示、記録枚数表示、残撮影可能枚数表示、シャッタースピード表示等がある。また、絞り値表示、露出補正表示、フラッシュ表示、赤目緩和表示、マクロ撮影表示、ブザー設定表示、時計用電池残量表示、電池残量表示、エラー表示等がある。更には、複数桁の数字による情報表示、記録媒体200及び210の着脱状態表示、通信I/F動作表示、日付・時刻表示等がある。
また、表示部54の表示内容のうち、光学ファインダー104内に表示するものとしては、合焦表示、手振れ警告表示、フラッシュ充電表示、シャッタースピード表示、絞り値表示、露出補正表示等がある。
56は電気的に消去・記録可能な不揮発性メモリであり、例えばEEPROM等が用いられる。
60、62、64、66、68及び70は、システム制御回路50の各種の動作指示を入力するための操作手段であり、スイッチ、ダイアル、タッチパネル、視線検知によるポインティング、音声認識装置等の単数或いは複数の組み合わせで構成される。以下、これらの操作手段の具体的な説明を行う。
60はモードダイアルスイッチであり、電源オフ、自動撮影モード、撮影モード、パノラマ撮影モード、再生モード、マルチ画面再生・消去モード、PC接続モード等の各機能モードを切り替え設定することができる。
62はシャッタースイッチSW1であり、不図示のシャッタースイッチの操作途中でONとなり、AF処理、AE処理、AWB処理、EF処理等の動作開始を指示する。64はシャッタースイッチSW2であり、不図示のシャッタースイッチの操作完了でONとなり、撮影記録の一連の処理の動作開始を指示する。具体的には、まず撮像素子14から読み出した信号を、A/D変換器16、メモリ制御回路22を介してメモリ30に画像データを書き込む露光処理を指示する。次に画像処理回路20やメモリ制御回路22での演算を用いた現像処理を指示する。最後に、メモリ30から画像データを読み出し、圧縮・伸長回路32で圧縮を行い、記録媒体200或いは210に画像データを書き込む記録処理を指示する。
66は画像表示ON/OFFスイッチであり、画像表示部28のON/OFFを設定することができる。この機能により、光学ファインダー104を用いて撮影を行う際に、TFT・LCD等からなる画像表示部28への電流供給を遮断することにより、省電力を図ることが可能となる。
68はクイックレビューON/OFFスイッチであり、撮影直後に撮影した画像データを自動再生するクイックレビュー機能を設定する。なお、本実施の形態では特に、画像表示部28をOFFとした場合におけるクイックレビュー機能の設定をする機能を備えるものとする。
70は各種ボタンやタッチパネル等からなる操作部であり、メニューボタン、セットボタン、マクロボタン、マルチ画面再生改ページボタン、フラッシュ設定ボタン、単写/連写/セルフタイマー切り替えボタン等を含む。また、メニュー移動+(プラス)ボタン、メニュー移動−(マイナス)ボタン、再生画像移動+(プラス)ボタン、再生画像−(マイナス)ボタン、撮影画質選択ボタン、露出補正ボタン、日付/時間設定ボタン等を含む。
80は電源制御手段であり、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成されている。電源制御手段80は電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。
82及び84はコネクタであり、86は電源手段である。電源手段86はアルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。
90及び94はメモリカードやハードディスク等の記録媒体とのインタフェース、92及び96はメモリカードやハードディスク等の記録媒体と接続を行うコネクタである。98は記録媒体着脱検知手段であり、コネクタ92又は96に記録媒体200又は210が装着されているか否かを検知する。
なお、本実施の形態では、記録媒体を取り付けるインタフェース及びコネクタを2系統持つものとして説明しているが、もちろん記録媒体を取り付けるインタフェース及びコネクタを単数或いは複数、いずれの系統数を備える構成としても構わない。また、異なる規格のインタフェース及びコネクタを組み合わせて備えるような構成としても構わない。
インタフェース及びコネクタとしては、例えばPCMCIAカードやCF(コンパクトフラッシュ)カード等の規格に準拠したものを用いることができる。インタフェース90及び94、そしてコネクタ92及び96をPCMCIAカードやCF(コンパクトフラッシュ)カード等の規格に準拠したものを用いて構成した場合には、LANカードやモデムカード等の各種通信カードを接続することができる。そして、接続した場合には、他のコンピュータやプリンタ等の周辺機器との間で画像データや画像データに付属した管理情報を転送し合うことができる。なお、LANカードやモデムカード以外にも、例えば、USBカード、IEEE1394カード、P1284カード、SCSIカード、PHS等の通信カードを接続することも可能である。
104は光学ファインダーであり、画像表示部28による電子ファインダー機能を使用すること無しに、光学ファインダー104のみを用いて撮影を行うことを可能とする。また、光学ファインダー104内には、表示部54の一部の機能、例えば、合焦表示、手振れ警告表示、フラッシュ充電表示、シャッタースピード表示、絞り値表示、露出補正表示等が設置されている。
110は通信手段であり、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、LAN、無線通信等の各種通信機能を有する。112はコネクタ或いはアンテナであり、通信手段110によりデジタルカメラ100を他の機器と有線又は無線で接続する。
200はメモリカードやハードディスク等の記録媒体である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部202、デジタルカメラ100とのインタフェース204、及びデジタルカメラ100と接続を行うコネクタ206を備えている。210はメモリカードやハードディスク等の記録媒体である。記録媒体210は、半導体メモリや磁気ディスク等から構成される記録部212、デジタルカメラ100とのインタフェース214、及びデジタルカメラ100と接続を行うコネクタ216を備えている。
次に、以上のような構成を備えたデジタルカメラ100の本発明の主眼となる動作を図2−1及び図2−2を参照して説明する。図2−1は、デジタルカメラ100がライブビュー動作中に実行する処理のフローチャートであり、図2−2はデジタルカメラ100が撮影記録処理を指示された場合に実行する処理のフローチャートである。
まず図2−1のステップS201において、デジタルカメラ100は、ライブビュー撮影を開始し、画像取込を行う。詳細には、撮影レンズ11から入力された光学像を撮像素子14により電気信号に変換し、A/D変換器16によりアナログ信号出力をディジタル信号に変換し、画像処理回路20により撮像した画像データを用いて所定の演算処理し、撮影前の画像取込を行う。
次にステップS202において、デジタルカメラ100は、パターン検出部59によりパターン領域が存在するか否かを判定する。判定の結果、パターン領域がなかったら、画像取込(S201)に戻り、パターン領域が存在すればステップS203へと進む。
ステップS203において、デジタルカメラ100は、パターン領域に対して、コード変換部57によりOCR処理を行い、コード情報を生成する。なお、ステップS201〜S203の処理は、本発明でいうパターン認識手段による一処理例に対応する。
次にステップS204において、デジタルカメラ100は、ステップS203でのOCRの結果(コード情報、本発明でいう認識結果)と前コード情報とをコード比較部73にて比較し、有効性の判定を行う。判定結果が有効性無しであれば前コード情報を更新せず、有効性有りであればステップS205においてコード情報を最新のコード情報に更新し、画像取込(S201)に戻る。なお、ステップS204処理は、本発明でいうパターン比較手段の一処理例に対応し、ステップS205の処理は、本発明でいう更新手段及び第1の記憶手段の一処理例に対応する。
以上のように、デジタルカメラ100においては、ライブビュー動作中には、ライブビュー表示のために取り込んだ画像において所定の間隔でパターン領域を検出し、それをコード情報として記憶及び更新するようにしている。
次に図2−2を参照して、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理を説明する。なお、図2−2の処理は図2−1の処理と並行的に行われるものである。
まずステップS206において、デジタルカメラ100は、シャッタースイッチSW2(64)が押されたか否かの監視を行う。押された場合はステップS207において、保存されているコード情報を読み出し、ステップS208において撮影画像を生成する。
そして、ステップS209において、デジタルカメラ100は、ステップS207で取得したコード情報を撮影画像に付加(関連付け)し、インタフェース90及び94を介してCFやSDカード等の記録媒体に書き込みを行う。なお、ステップS209の処理は、本発明でいう関連付手段に一処理例に対応する。
ここで図4−1〜図4−8を用いて、図2−1及び図2−2を用いて説明した処理の具体的な動作を説明する。まず図4−1等を参照して、従来の問題点を説明する。
図4−1に示す画像401の撮影を行えば、写真を見ただけで「二〇〇七年度入学式」のときに撮影したものであることがわかる。しかしながら、図4−2に示す画像402の撮影を行えば、写真を見ただけで「二〇〇七年度入学式」のときに撮影したものであることが辛うじてわかるかもしれないが、情報としては不十分である。さらに、図4−3に示す画像403の撮影を行えば、写真を見ただけでは「二〇〇七年度入学式」であることはわからない。
そこで、図4−3に示すような画像403の撮影を行った場合でも、例えば図4−8に示すようにコード情報(図中408a)を印刷時や画像表示時に見えるようにすれば、該写真を見ただけで「二〇〇七年度入学式」であることがわかるようになる。
しかしながら、従来の撮像装置では、文字列検索を行う場合や画像408のような印刷画像、表示画像を得るために、パソコンやカメラで文字情報を付加する又は文字情報を予め登録して画像と文字情報との関連付けを行う等の非常に煩わしい作業が必要であった。
本発明に係るデジタルカメラ100では、このような煩わしい作業を解消する。以下、図4−1〜図4−3を参照して、デジタルカメラ100の動作を具体的に説明する。
まず図4−1に示す画像をライブビュー表示のために画像取込(ステップS201)すると、ここで示す画像401の場合はパターン検出部59にてパターン領域が存在(ステップS202)すると判定される。ここでは、401aに示す領域をパターン領域として検出したものとする。
そして、コード変換部57にてOCR処理(ステップS203)が行われ、OCR処理の結果を用いて、コード比較部73にて前コード情報と比較(ステップS204)する。ここでは、OCR処理の結果であるコード情報が新規であるため、コード情報を更新(ステップS205)し、画像取込(ステップS201)に戻る。
次にユーザーは、構図、フォーカス位置、露出等を表示部54を見ながら変更し、図4−2に示す画像402を経て、図4−3に示すような画像403を最適な撮影ポイントとして探したとする。この場合、その途中過程にある図4−2に示す画像402は、ライブビュー表示のために画像取込(ステップS201)されており、画像402はパターン検出部59により402aに示すパターン領域が存在(ステップS202)すると判定されている。そして、コード変換部57にてOCR処理(ステップS203)が行われ、OCR処理の結果を用いて、コード比較部73にて前コード情報と比較(ステップS204)される。ここでの比較においては、今回のコード情報が前コード情報より少ない(有効性が低い)ので、コード情報は更新されない。従って、前コード情報は更新されず、前回の「二〇〇七年度入学式」が残ることになる。なお、コード情報の有効性の比較については、辞書データ74を参照しながら行われるが、例えば文字の明確さ等に基づき判断するようにする。
次に図4−3に示す画像403も、ライブビュー表示のための画像取込(ステップS201)がなされている。そして画像403の場合には、パターン検出部59にてパターン領域が存在(S202)しないと判定されるので、前コード情報は更新されず、ここでも「二〇〇七年度入学式」が残ることになる。
ここでシャッタースイッチ64が押される(ステップS206)と、ステップS205で保存された「二〇〇七年度入学式」情報が読み出される(ステップS207)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS208)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS209)。以上のように処理がなされることで、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
以上のように、第1の実施の形態に係るデジタルカメラ100では、ライブビュー動作中にパターン領域を検出し、撮影画像に関する個別具体的なコード情報として記憶しておき、撮影された撮影画像に関連付けて管理するようにした。このようなデジタルカメラ100では、撮影画像に関する個別具体的なコード情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができるため、操作性の向上を実現することができる。また、特にカメラ等の入力方法に一部制約があるデバイスにおいては、非常に煩わしい文字入力の頻度を少なくできるため、操作性向上の効果が高い。
また、撮影画像において個別具体的なコード情報を認識できなかった場合にも、記憶したコード情報を該撮影画像に関連付けて管理できるため、文字情報の付加という作業を軽減するだけではなく、関連する一連の撮影画像の良好な管理を助援することもできる。
(第2の実施の形態)
以下、本発明の第2の実施の形態について説明する。本実施の形態では、パターン領域の検出後のコード情報の更新の判断に被写体情報を考慮する。なお、本実施の形態に係るデジタルカメラは、第1の実施の形態と同様であるため引用する符号は同一のものとし、説明は省略する。
第2の実施の形態に係るデジタルカメラ100の本発明の主眼となる動作を図3−1及び図3−2を参照して説明する。図3−1は、デジタルカメラ100がライブビュー動作中に実行する処理のフローチャートであり、図3−2は、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理のフローチャートである。
まず図3−1のステップS301において、デジタルカメラ100は、ライブビュー撮影を開始し、画像取込を行う。詳細には、撮影レンズ11から入力された光学像を撮像素子14により電気信号に変換し、A/D変換器16によりアナログ信号出力をディジタル信号に変換し、画像処理回路20により撮像した画像データを用いて所定の演算処理し、画像取込を行う。
次にステップS302において、デジタルカメラ100は被写体情報生成部72により、被写体情報を生成する。被写体情報の詳細については後述する。なお、ステップS302の処理は、本発明でいう被写体情報生成手段の一処理例に対応する。
次にステップS303において、デジタルカメラ100は被写体比較部71により前被写体情報との関連性が一致しているか否かを判定する。一致していなかったらステップS313へと進み、一致していればステップS304へと進む。なお、ステップS303の処理は、本発明でいう被写体情報比較手段の一処理例に対応する。
ステップS304において、デジタルカメラ100は、パターン検出部59によりパターン領域が存在するか否かを判定し、存在していなければ、画像取込(S301)に戻る。存在していれば、ステップS305においてコード変換部57によりOCR処理を行う。なお、ステップS304及びS305の処理は、本発明でいうパターン認識手段の一処理例に対応する。
次にステップS306において、デジタルカメラ100はコード比較部73によりOCRの結果と前コード情報とを比較し、有効性の判定を行う。判定の結果、有効性が低ければ前コード情報を更新せず、画像取込(S301)に戻る。一方、有効性が高ければ、ステップS307において、ステップS302にて生成した被写体情報を保存し、ステップS308において、コード情報を更新し、画像取込(S301)に戻る。なお、ステップS306の処理は、本発明でいうパターン比較手段の一処理例に対応し、ステップS307の処理は、第2の記憶手段の一処理例に対応し、ステップS308の処理は、本発明でいう第1の記憶手段の一処理例に対応する。
一方、ステップS303において、被写体比較部71により前被写体情報との関連性が一致していないと判定された場合のステップS313においては、まずデジタルカメラ100がパターン検出部59によりパターン領域が存在するか否か判定する。存在しない場合はステップS317にてコード情報の初期化を行い、画像取込(S301)に戻り、パターン領域が存在する場合はステップS314に進む。
ステップS314において、デジタルカメラ100は、ステップS313でのパターン領域に対して、コード変換部57によりOCR処理する。そして、ステップS315においてステップS302で生成した被写体情報を保存し、ステップS316においてコード情報を更新して、画像取込(S301)に戻る。
次に図3−2を参照して、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理を説明する。なお、図3−2の処理は図3−1の処理と並行的に行われるものである。
まずステップS309において、デジタルカメラ100は、シャッタースイッチSW2(64)が押されたか否かの監視を行う。押された場合はステップS310において、保存されているコード情報を読み出し、ステップS311において、撮影画像を生成する。
そして、ステップS312において、デジタルカメラ100は、ステップS310で取得したコード情報を撮影画像に付加し、インタフェース90及び94を介してCFやSDカード等の記録媒体に書き込みを行う。
次に図4−1〜図4−8を用いて、図3−1及び図3−2を用いて説明した処理の具体的な動作を説明する。
まず図4−1に示す画像をライブビュー表示のために画像取込(ステップS301)をして、被写体情報生成部72により図4−1(b)に示すような被写体情報を生成する(S302)。次に被写体比較部71により前被写体情報と一致するか判定を行うが(S303)、ここでは新規の被写体情報であるため判定は一致しないとされ、パターン検出部59によりパターン領域の存在の判定が行われる(S304)。ここで、画像401には401aに示すパターン領域が存在するので、コード変換部57によりOCR処理が行われる(S305)。そしてOCR処理の結果を用いて、前コード情報と比較を行うが(S306)、新規のため判定結果は有効性が高いとされ、ステップS302で生成した被写体情報を保存し(S307)、コード情報を保存し(S308)、画像取込(S301)に戻る。
なお、ここで被写体情報とは、図4−1(b)に示すような情報であり、本例においては、輪郭画像415、文字情報、焦点距離情報、レンズ距離情報、人数情報等を含むものである。このような被写体情報は、画像の輪郭部分を抽出したり、コード情報を抽出したり、顔認識技術による人数情報を特定したり、被写体との距離情報やレンズ焦点距離情報を取得したりして得る。或いは、図示しないが画像を何分割かに分けるゾーン分割、オブジェクト認識等の技術により被写体を特定する等、複数の手法を用いて被写体情報としたりすることも一般的に行われている。
更なる方法としては、パターン認識が行われた画像から連続的に画像が拡大・縮小・移動が行われているか監視することにより、被写体情報の判定に利用することも可能である。しかしながら、連続的に監視する方法では、オートパワーオフにより撮影が中断された、空や地面のみの画像となってしまった、レンズが交換された、レンズキャップがされてしまった等の課題がある。そのため、前記方法や時間情報との併用により精度を高めることも可能であるが、ここではその方法については言及しない。
次にユーザーは、構図、フォーカス位置、露出等を表示部54を見ながら変更し、図4−2に示す画像402を経て、図4−3に示すような画像403を最適な撮影ポイントとして探したとする。この場合、その途中過程にある図4−2に示す画像402は、ライブビュー表示のために画像取込(S301)されており、画像402から被写体情報生成部72により被写体情報が生成される(S302)。そして被写体比較部71により前被写体情報と一致するか判定をされ(S303)、ここでは画像の一部が一致しているため判定結果は一致とされる。そしてパターン検出部59によりパターン領域の存在判定がされる(S304)。画像402においては402aに示すパターン領域が存在するので、コード変換部57にてOCR処理(S305)が行われる。そしてOCR処理の結果を用いて、前コード情報との比較(S306)をされるが、前コード情報の方がより有効性が高いので、コード情報は更新されずに、画像取込(S301)に戻る。
次に図4−3に示す画像403においても、ライブビュー表示のための画像取込(ステップS301)がなされ、画像403から被写体情報生成部72により被写体情報が生成される(S302)。そして被写体比較部71により前被写体情報と一致するか判定をされ(S303)、ここでは画像の一部が一致しているため判定結果は一致とされ、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像403においてはパターン領域が存在しないので、コード変換部57によるOCR処理は行われず、コード情報も更新されず、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像を生成(ステップS311)する。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
更に、図4−4に示す画像404を撮影した場合について説明する。
図4−4に示す画像を撮影する場合、画像404はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−4(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部が一致しているので、判定結果は一致となり、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像404においてはパターン領域が存在しないため、コード変換部57によるOCR処理は行われず、コード情報も更新されないので、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−4に示す画像404を撮影する場合においても、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
更に図4−5に示す画像405を撮影した場合について説明する。
図4−5に示す画像を撮影する場合、画像405はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−5(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部が一致しているので、判定結果は一致となり、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像405においてはパターン領域が存在しないため、コード変換部57によるOCR処理は行われず、コード情報も更新されないので、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、90及び94のインタフェースを介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−5に示す画像405を撮影する場合においても、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
更に図4−6に示す画像406を撮影した場合について説明する。
図4−6に示す画像を撮影する場合、画像406はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−6(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部も一致していないので、判定結果は不一致となり、パターン検出部59によりパターン領域の存在判定がされる(S313)。画像406においてはパターン領域(406a)が存在するため、コード変換部57によるOCR処理が行われ(S314)、コード情報を「○△小学校入学式」に更新し、画像取込(S301)に戻る。
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS316で保存された「○△小学校入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像にはコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−6に示す画像406を撮影する場合においては、「○△小学校入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
更に図4−7に示す画像407を撮影した場合について説明する。
図4−7に示す画像を撮影する場合、画像407はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−7(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部も一致していないので、判定結果は不一致となり、パターン検出部59によりパターン領域の存在判定がされる(S313)。画像407においてはパターン領域が存在しないため、コード変換部57によるOCR処理が行われず、コード情報を初期化(S317)し、画像取込(S301)に戻る。
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308及びS316で保存された情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像にはコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされ、図4−7に示す画像407を撮影する場合においては、コード情報がないことが撮影画像に自動的に関連付けされる。そして、コード情報を検索、画像表示、印刷といった文字合成等に誤って利用されないようにする。
以上のように、第2の実施の形態のデジタルカメラ100では、ライブビュー動作中にパターン領域を検出し個別具体的なコード情報として記憶すると共に、被写体情報を特定しておき、被写体情報を考慮して、コード情報を更新するようにした。そして、コード情報を撮影された撮影画像に関連付けて管理するようにした。このようなデジタルカメラ100では、撮影画像に関する個別具体的なコード情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができるため、操作性の向上を実現することができる。また、特にカメラ等の入力方法に一部制約があるデバイスにおいては、非常に煩わしい文字入力の頻度を少なくできるため、操作性向上の効果が高い。また、コード情報を前回と今回の被写体情報を比較し比較結果に応じて管理することで、誤ったコード情報を撮影画像に関連付けしなくなり、更なる操作性の向上を実現することができる。
ここで、図5(a)〜(d)は、図1で示した辞書データ74の一部の例であり、「Bitmap」から文字に変換するためのデータ等を示している。パターン検出部59、コード変換部57に対し、図5のような辞書データを含むことで、顔から人名、標識から標識名、会社ロゴから会社名を特定することが可能となる。
以上で説明した実施の形態においては、パターン検出部59により、文字で構成されたパターン領域を検出するようにし、それをコード情報とする例を挙げたが、本発明はこの態様に限定されるものではない。例えば会社ロゴ、標識、顔等をパターン領域として検出し、それをコード情報としてもよく、更にそれらに対応する文字列に変換して印刷画像或いは表示画像に付加するようにしてもよい。
なお、本発明を実現するために、上述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記録した記録媒体を用いても良い。この場合には記録媒体をシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによって本発明の目的が達成される。
この場合、記録媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記録媒体は本発明を構成することになる。
プログラムコードを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
また、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)等が実際の処理の一部又は全部を行う場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。この場合には、書き込まれたプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行ってもよい。
本発明の実施の形態に係るデジタルカメラの構成を示すブロック図である。 本発明の第1の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。 本発明の第1の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。 本発明の第2の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。 本発明の第2の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。 本発明の実施の形態に係るデジタルカメラが備える辞書データの一例を示した図である。
符号の説明
14 撮像素子
50 システム制御回路
57 コード変換部
59 パターン検出部
71 被写体比較部
72 被写体情報生成部
73 コード比較部
74 辞書データ
100 デジタルカメラ

Claims (13)

  1. 被写体の画像を撮像する撮像手段と、
    前記撮像手段の撮影前の取り込み画像からパターン認識を行うパターン認識手段と、
    前記パターン認識手段の認識結果を記憶する第1の記憶手段と、
    前記第1の記憶手段が記憶した認識結果と、前記パターン認識手段がパターン認識した最新の認識結果とを比較するパターン比較手段と、
    前記パターン比較手段の比較結果に応じて、前記第1の記憶手段が記憶した認識結果を更新する更新手段と、
    前記撮像手段が撮影した画像と、前記第1の記憶手段が記憶した認識結果とを関連付けする関連付手段とを有することを特徴とする撮像装置。
  2. 前記撮像手段が撮影した画像においてパターン認識されなかった場合に、前記第1の記憶手段が記憶した認識結果を、該撮影した画像に関連付けするようにしたことを特徴とする請求項1に記載の撮像装置。
  3. 前記撮像手段の撮影前の取り込み画像から被写体情報を生成する被写体情報生成手段と、
    前記被写体情報生成手段が生成した被写体情報を記憶する第2の記憶手段と、
    前記第2の記憶手段が記憶した被写体情報と、前記被写体情報生成手段が生成した最新の被写体情報とを比較する被写体情報比較手段とを備え、
    前記パターン比較手段は、前記被写体情報比較手段の比較結果に応じて、前記第1の記憶手段が記憶した認識結果と、前記パターン認識手段がパターン認識した最新の認識結果とを比較することを特徴とする請求項1又は2に記載の撮像装置。
  4. 前記パターン比較手段は、前記被写体情報比較手段の比較結果が一致している場合に、比較を行うことを特徴とする請求項3に記載の撮像装置。
  5. 前記パターン比較手段は、前記被写体情報比較手段の比較結果が一致していない場合に、比較を行わず、
    前記更新手段は、前記第1の記憶手段が記憶した認識結果を更新することを特徴とする請求項4に記載の撮像装置。
  6. 前記撮像手段の撮影前の取り込み画像とは、ライブビュー表示のための画像であることを特徴とする請求項1〜5のいずれか1項に記載の撮像装置。
  7. 被写体の画像を撮像する撮像手段を備えた撮像装置の制御方法であって、
    前記撮像手段の撮影前の取り込み画像からパターン認識を行うパターン認識ステップと、
    前記パターン認識ステップの認識結果を記憶手段に記憶する第1の記憶ステップと、
    前記第1の記憶ステップで記憶した認識結果と、前記パターン認識ステップでパターン認識した最新の認識結果とを比較するパターン比較ステップと、
    前記パターン比較ステップの比較結果に応じて、前記第1の記憶ステップで記憶した認識結果を更新する更新ステップと、
    前記撮像手段が撮影した画像と、前記第1の記憶ステップで記憶した認識結果とを関連付けする関連付ステップとを有することを特徴とする撮像装置の制御方法。
  8. 前記撮像手段が撮影した画像においてパターン認識されなかった場合に、前記第1の記憶ステップで記憶した認識結果を、該撮影した画像に関連付けするようにしたことを特徴とする請求項7に記載の撮像装置の制御方法。
  9. 前記撮像手段の撮影前の取り込み画像から被写体情報を生成する被写体情報生成ステップと、
    前記被写体情報生成ステップで生成した被写体情報を前記記憶手段に記憶する第2の記憶ステップと、
    前記第2の記憶ステップで記憶した被写体情報と、前記被写体情報生成ステップで生成した最新の被写体情報とを比較する被写体情報比較ステップとを有し、
    前記パターン比較ステップでは、前記被写体情報比較ステップでの比較結果に応じて、前記第1の記憶ステップで記憶した認識結果と、前記パターン認識ステップでパターン認識した最新の認識結果とを比較することを特徴とする請求項7又は8に記載の撮像装置の制御方法。
  10. 前記パターン比較ステップでは、前記被写体情報比較ステップでの比較結果が一致している場合に、比較を行うことを特徴とする請求項9に記載の撮像装置の制御方法。
  11. 前記パターン比較ステップでは、前記被写体情報比較ステップでの比較結果が一致していない場合に、比較を行わず、
    前記更新ステップでは、前記第1の記憶ステップで記憶した認識結果を更新することを特徴とする請求項10に記載の撮像装置の制御方法。
  12. 前記撮像手段の撮影前の取り込み画像とは、ライブビュー表示のための画像であることを特徴とする請求項7〜11のいずれか1項に記載の撮像装置の制御方法。
  13. 請求項7〜11の何れか1項に記載の撮像装置の制御方法をコンピュータに実行させるためのプログラム。
JP2007295989A 2007-11-14 2007-11-14 撮像装置、その制御方法及びプログラム Active JP4906685B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007295989A JP4906685B2 (ja) 2007-11-14 2007-11-14 撮像装置、その制御方法及びプログラム
US12/265,606 US8917936B2 (en) 2007-11-14 2008-11-05 Image pickup apparatus and method for controlling the same for associating captured image with stored preceding recognition result

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007295989A JP4906685B2 (ja) 2007-11-14 2007-11-14 撮像装置、その制御方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012002594A Division JP5587351B2 (ja) 2012-01-10 2012-01-10 撮像装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2009124439A JP2009124439A (ja) 2009-06-04
JP2009124439A5 JP2009124439A5 (ja) 2010-12-24
JP4906685B2 true JP4906685B2 (ja) 2012-03-28

Family

ID=40623760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007295989A Active JP4906685B2 (ja) 2007-11-14 2007-11-14 撮像装置、その制御方法及びプログラム

Country Status (2)

Country Link
US (1) US8917936B2 (ja)
JP (1) JP4906685B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4906685B2 (ja) 2007-11-14 2012-03-28 キヤノン株式会社 撮像装置、その制御方法及びプログラム
JP4999760B2 (ja) * 2008-04-07 2012-08-15 キヤノン株式会社 撮像装置、撮像装置の制御方法、プログラム及び記録媒体
KR101714050B1 (ko) * 2010-11-01 2017-03-08 삼성전자주식회사 휴대단말기의 데이터 표시장치 및 방법
US11557288B2 (en) * 2020-04-10 2023-01-17 International Business Machines Corporation Hindrance speech portion detection using time stamps

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2257598B (en) * 1991-07-12 1994-11-30 Hochiki Co Surveillance monitor system using image processing
WO2000026851A1 (fr) * 1998-10-29 2000-05-11 Mitsuo Nakayama Scanner d'image et dispositif de reconnaissance optique de caracteres mettant en oeuvre ledit scanner
US6351574B1 (en) * 1998-12-11 2002-02-26 International Business Machines Corporation Interactive verification of OCRed characters
US6563948B2 (en) * 1999-04-29 2003-05-13 Intel Corporation Using an electronic camera to build a file containing text
JP3425408B2 (ja) * 2000-05-31 2003-07-14 株式会社東芝 文書読取装置
JP4704601B2 (ja) * 2000-11-01 2011-06-15 富士通株式会社 文字認識方法,プログラム及び記録媒体
JP4239442B2 (ja) * 2001-07-24 2009-03-18 カシオ計算機株式会社 電子カメラ、及びそのプログラム
TWI299471B (en) * 2001-08-24 2008-08-01 Toshiba Kk Person recognition apparatus
JP2003198909A (ja) 2001-12-26 2003-07-11 Canon Inc 撮像装置、その制御方法、及び制御プログラム
JP4084578B2 (ja) * 2002-02-20 2008-04-30 富士通株式会社 文字認識方法及びその装置
US7289685B1 (en) * 2002-04-04 2007-10-30 Ricoh Co., Ltd. Paper based method for collecting digital data
JP3919617B2 (ja) * 2002-07-09 2007-05-30 キヤノン株式会社 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US7137076B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
JP4314016B2 (ja) * 2002-11-01 2009-08-12 株式会社東芝 人物認識装置および通行制御装置
JP4193691B2 (ja) * 2003-12-26 2008-12-10 カシオ計算機株式会社 撮像装置、動画ファイルの記録方法、及びプログラム
JP2006031299A (ja) * 2004-07-15 2006-02-02 Hitachi Ltd 文字認識方法、文字データの修正履歴処理方法およびシステム
JP2006101156A (ja) * 2004-09-29 2006-04-13 Casio Comput Co Ltd 情報処理装置及び情報処理プログラム
US20060080543A1 (en) * 2004-10-11 2006-04-13 Chien-Wu Yen Method of customizing the startup logo of a projector
JP2006165944A (ja) * 2004-12-07 2006-06-22 Hitachi Ltd イメージデータへの登録方法及び装置、登録プログラム及びそれを記録した記録媒体、並びにイメージデータの検証方法及び装置、検証プログラム及びそれを記録した記録媒体
KR100594806B1 (ko) * 2004-12-28 2006-06-30 삼성전자주식회사 레터박스 경계를 검출하는 디스플레이장치 및 이를 이용한영상 디스플레이 방법
US20060204098A1 (en) * 2005-03-07 2006-09-14 Gaast Tjietse V D Wireless telecommunications terminal comprising a digital camera for character recognition, and a network therefor
JP2007011738A (ja) * 2005-06-30 2007-01-18 Sanyo Electric Co Ltd 文字処理装置
US7949191B1 (en) * 2007-04-04 2011-05-24 A9.Com, Inc. Method and system for searching for information on a network in response to an image query sent by a user from a mobile communications device
JP4906685B2 (ja) 2007-11-14 2012-03-28 キヤノン株式会社 撮像装置、その制御方法及びプログラム
US8036417B2 (en) * 2008-06-11 2011-10-11 Eastman Kodak Company Finding orientation and date of hardcopy medium
KR20100064533A (ko) * 2008-12-05 2010-06-15 삼성전자주식회사 카메라를 이용한 문자 크기 자동 조절 장치 및 방법

Also Published As

Publication number Publication date
US8917936B2 (en) 2014-12-23
JP2009124439A (ja) 2009-06-04
US20090123072A1 (en) 2009-05-14

Similar Documents

Publication Publication Date Title
JP4262082B2 (ja) 画像処理装置及びその制御方法とプログラム及び記憶媒体
US7756362B2 (en) Image processing apparatus, control method therefor, computer program, and computer-readable storage medium
JP3862404B2 (ja) 画像処理装置およびその方法、画像ファイルフォーマット、記憶媒体
US8373787B2 (en) Image processing apparatus, image processing system, control method of the image processing apparatus, and recording medium having recorded thereon a computer program for executing the control program
EP1715671A1 (en) Image sensing apparatus and white balance correction method
US8908906B2 (en) Image processing apparatus and image processing method, and computer program for causing computer to execute control method of image processing apparatus
JP4891270B2 (ja) 画像編集装置、画像編集方法及びプログラム
JP2006197243A (ja) 撮像装置及び撮像方法及びプログラム及び記憶媒体
JP2005176136A (ja) 画像処理装置、画像再生方法、プログラムおよび記憶媒体
JP2004120069A (ja) 画像処理装置、画像処理方法および該方法を実現するためのプログラム
JP4906685B2 (ja) 撮像装置、その制御方法及びプログラム
JP2007028070A (ja) 画像保存装置、画像保存方法及び制御プログラム
JP2009044444A (ja) 撮像装置、そのホワイトバランス制御方法、プログラムおよび記憶媒体
KR100756155B1 (ko) 화상 처리 장치, 그 제어 방법 및 기억 매체
US8301012B2 (en) Image reproducing apparatus for reproducing images recorded in accordance with different rules and control method therefor
JP2007328694A (ja) 画像処理装置、及びデジタルカメラ
JP4498169B2 (ja) 画像処理装置及びその制御方法
JP5587351B2 (ja) 撮像装置及びその制御方法
JP4574382B2 (ja) 情報検索装置及びその制御方法、プログラム、記憶媒体
JP4574426B2 (ja) データ処理装置装置およびデータ処理方法
JP5111215B2 (ja) 撮像装置及びその制御方法、並びにプログラム及び記憶媒体
JP4902512B2 (ja) 撮像装置及びその制御方法及びプログラム
JP2007251414A (ja) 画像撮像装置、当該装置の制御方法及び制御プログラム
JP2008124900A (ja) 画像処理装置
JP2002044577A (ja) 画像処理装置および画像処理装置の制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120110

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4906685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3