JP4251643B2 - 画像撮像装置、および、プログラム - Google Patents

画像撮像装置、および、プログラム Download PDF

Info

Publication number
JP4251643B2
JP4251643B2 JP2005083299A JP2005083299A JP4251643B2 JP 4251643 B2 JP4251643 B2 JP 4251643B2 JP 2005083299 A JP2005083299 A JP 2005083299A JP 2005083299 A JP2005083299 A JP 2005083299A JP 4251643 B2 JP4251643 B2 JP 4251643B2
Authority
JP
Japan
Prior art keywords
image
character string
captured
information
captured image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005083299A
Other languages
English (en)
Other versions
JP2006268245A (ja
Inventor
麗子 坂元
Original Assignee
株式会社カシオ日立モバイルコミュニケーションズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社カシオ日立モバイルコミュニケーションズ filed Critical 株式会社カシオ日立モバイルコミュニケーションズ
Priority to JP2005083299A priority Critical patent/JP4251643B2/ja
Publication of JP2006268245A publication Critical patent/JP2006268245A/ja
Application granted granted Critical
Publication of JP4251643B2 publication Critical patent/JP4251643B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像撮像装置、および、プログラムに関し、特に、撮像機能を有する移動体通信端末等による情報取得に好適な画像撮像装置、および、プログラムに関する。
デジタル撮像技術の進展に伴い、撮像装置の小型化・高性能化が進み、近時では、移動体通信端末などにも撮像機能が備えられている。このような撮像機能は、通常の写真撮影を可能にすることはもとより、2次元コードなどのコードシンボルを認識して情報を取得する用途などにも利用されている(例えば、特許文献1)。
特に、通信機能を有する移動体通信端末では、例えば、インターネット上のウェブサイトへアクセスするためのアドレス情報であるURL(Uniform Resource Locator)を示す2次元コードを撮影することで、当該URLが示すウェブサイトにアクセスできるため、ユーザがURLを入力する必要がなく便利である。
しかしながら、このようなコードシンボルの認識などでは、通常の写真撮影とは異なる処理が必要となる。このため、従来の移動体通信端末などにおいては、通常の写真撮影とは異なる動作モードを用意し、ユーザが撮影毎にモードを切り換える必要があった。このような操作は、ユーザにとって煩雑なものであり、モード切換のためにシャッタチャンスを逃してしまうなどの不都合もあった。また、ユーザがモード選択を誤ったり、モード切換を忘れたりする場合もある。例えば、通常の写真撮影をおこなうときに、コードシンボル認識モードになっていると、撮影中に認識動作が実行され、撮影が中断されるなどの不都合が生じる。
また、2次元コードなどのコードシンボル以外にも、例えば、種々の広告媒体や書面などに示されている文字情報などを認識して利用することができれば、ユーザの利便性がより向上することが期待される。よって、撮像機能を有する移動体通信端末などで、種々の情報を簡単、かつ、効率的に取得できる手法の確立が望まれている。
特開2004−62290号公報
本発明は、上記実状に鑑みてなされたものであり、撮像により種々の情報を効率的に取得できる画像撮像装置等を提供することを目的とする。
上記目的を達成するため、本発明の第1の観点にかかる画像撮像装置は、
画像撮像モードにおいて撮像された画像を表示すると共に、その撮像された撮像画像を記録する機能を有する画像撮像装置であって、
前記画像撮像モードで撮像された画像の記録を行うためのシャッタ操作の有無を検出するシャッタ検出手段と、
前記シャッタ検出手段によりシャッタ操作が検出された際は、その時に撮像された撮像画像を記録する撮像画像記録手段と、
前記シャッタ操作により撮像された撮像画像を解析し、その撮像画像内に特定処理の実行が可能な特定のオブジェクトが撮像されているか否か当該特定のオブジェクトについての特徴情報に基づいて検出するオブジェクト検出手段と、
当該オブジェクト検出手段が前記撮像画像内に前記特定のオブジェクトが撮像されていると検出した際に、当該オブジェクトを検出したことを通知し、当該オブジェクトの抽出を所望するか否かをユーザに問い合わせる問い合わせ手段と、
当該問い合わせ手段に対して、ユーザが前記特定のオブジェクトの抽出の実行を指示した場合、前記オブジェクト検出手段が検出した前記特定のオブジェクトを認識し、認識した情報に基づく処理を実行すると共に、当該撮像画像の記録を削除する処理実行手段と、
前記オブジェクト検出手段が前記撮像画像内に前記特定のオブジェクトを検出しない場合、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させる復帰手段と、
を備えたことを特徴とする。
上記画像撮像装置において、
前記復帰手段は、前記問い合わせ手段に対して、ユーザが前記オブジェクトの抽出の実行を指示しない場合に、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させることが望ましい。
上記画像撮像装置において、
前記オブジェクト検出手段は、前記撮像画像記録手段が撮像した画像の階調分布特性に基づいて、その撮像画像内に前記特定のオブジェクトが撮像されているか否かを検出することが望ましい。
上記画像撮像装置において、
前記オブジェクト検出手段は、前記撮像画像記録手段による撮像動作と並行して、オブジェクトの検出をおこなうことが望ましい。
上記画像撮像装置は、
記オブジェクト検出手段が検出したオブジェクトの種類がコードシンボルであるか文字列であるかを判別するオブジェクト判別手段をさらに備えていることが望ましく、この場合、
前記情報取得手段は、
前記オブジェクト判別手段が、前記画像に示されているオブジェクトがコードシンボルであると判別した場合、当該コードシンボルをデコードして情報を取得することが望ましい。
上記画像撮像装置において、
前記オブジェクト判別手段は、
前記画像に示されているオブジェクトが文字列である場合、当該文字列の特性を判別する文字列特性判別手段をさらに備えていることが望ましく、この場合、
前記処理実行手段は、前記文字列特性判別手段が判別した文字列特性に応じた認識動作を実行することが望ましい。
上記画像撮像装置において、
前記文字列特性判別手段は、
前記文字列が所定のアドレス情報であるか否かを判別し、
所定のアドレス情報である場合には、前記特徴情報に基づいて、当該アドレス情報が完全であるか否かを判別し、
前記処理実行手段は、
前記文字列特性判別手段により、前記アドレス情報が完全でないと判別された場合、前記撮像画像記録手段が記録した複数の画像データから、前記アドレス情報を取得することが望ましい。
上記画像撮像装置において、
前記文字列特性判別手段は、
前記文字列が所定のアドレス情報ではないと判別した場合、前記特徴情報に基づいて、当該文字列の言語を判別し、
前記処理実行手段は、
前記文字列特性判別手段が判別した言語に応じた動作を実行することが望ましい。
上記画像撮像装置において、
前記処理実行手段は、取得した複数の情報の重複部分を検出し、検出した重複部分に基づいて、該複数の情報を調整する文字列調整手段をさらに備えていることが望ましい。
上記画像撮像装置において、
前記文字列調整手段は、前記処理実行手段が複数の画像データから所定のアドレス情報を取得した場合、各画像データで認識された文字列の重複部分を検出し、検出した重複部分と、前記特徴情報と、に基づいて各文字列を結合することで、一のアドレス情報となるよう調整することが望ましい。
上記画像撮像装置において、
前記文字列調整手段は、前記処理実行手段が取得した情報が、所定のアドレス情報以外の文字列である場合、取得済みの文字列情報と、新たに取得した文字列情報との重複部分があるか否かを判別し、重複部分がある場合には、当該重複部分に基づいて、前記取得済みの文字列情報と、前記新たに取得した文字列情報とを結合することで、一の情報となるよう調整することが望ましい。
上記目的を達成するため、本発明の第2の観点にかかるプログラムは、
コンピュータに、
画像撮像モードにおいて撮像された画像を表示する機能と、
前記画像撮像モードで撮像された画像の記録を行うためのシャッタ操作の有無を検出する機能と、
シャッタ操作が検出された際は、その時に撮像された撮像画像を記録する機能と、
前記シャッタ操作により撮像された撮像画像を解析し、その撮像画像内に特定処理の実行が可能な特定のオブジェクトが撮像されているか否かを当該特定のオブジェクトについての特徴情報に基づいて検出する機能と、
前記撮像画像内に前記特定のオブジェクトが撮像されていると検出した際に、当該オブジェクトを検出したことを通知し、当該オブジェクトの抽出を所望するか否かをユーザに問い合わせる機能と、
当該問い合わせに対して、ユーザが前記オブジェクトの抽出の実行を指示した場合、前記検出したオブジェクトを認識し、認識した情報に基づく処理を実行すると共に、当該撮像画像の記録を削除する機能と、
前記撮像画像内に前記特定のオブジェクトを検出しない場合、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させる機能と、
を実現させることを特徴とする。
本発明によれば、撮像機能を有する装置での撮像画像から自動的にオブジェクトの検出やオブジェクトの種類を判別するので、ユーザによる煩雑な操作を必要とせずに、種々の情報を簡単、かつ、効率的に取得することができる。
以下、本発明にかかる実施形態を、図面を参照して説明する。ここでは、本発明にかかる画像撮像装置を移動体通信端末によって実現する場合を例に以下説明する。
本発明の実施形態にかかる移動体通信端末100は、例えば、携帯電話やPHS(Personal Handyphone System)などといった移動体通信用の端末装置(電話機)であり、基本機能である音声通話機能の他に、少なくとも、撮像機能を備えているものとする。以下、図面を参照して、本実施形態にかかる移動体通信端末100の構成を説明する。
図1は、本実施形態にかかる移動体通信端末100の外観を示す模式図である。移動体通信端末100の外観上の構成には、図1に示すような、アンテナ121、操作部131、音声入力部132、レンズ部134、音声出力部141、表示部142、などが含まれる。このような移動体通信端末100の内部構成を、図2を参照して説明する。
図2は、移動体通信端末100の内部構成を示すブロック図である。図示するように、本実施形態にかかる移動体通信端末100は、制御部110、通信制御部120、入力制御部130、出力制御部140、記憶部150、画像処理部160、などから構成される。
制御部110は、例えば、CPU(Central Processing Unit:中央演算処理装置)などから構成され、移動体通信端末100の各部を制御する。
通信制御部120は、データ通信部122、受信部123、および、送信部124などを含み、移動体通信端末100の通信動作を実現するための構成である。ここで、移動体通信端末100によりおこなわれるデータ通信および音声通話で送受信される情報は、アンテナ121を介して入出力される。
データ通信部122は、所定の通信ネットワーク(例えば、インターネットなど)を介して他の装置とのデータ通信をおこなう。本実施形態かかる移動体通信端末100では、例えば、電子メールの送受信やウェブサイトへのアクセスをおこなう。
受信部123と送信部124は、所定の送受信回路などから構成され、他の電話機から音声信号を受信するとともに、ユーザの発話音声を送信することで、移動体通信網等を介した他の電話機との音声通話を実現する。
入力制御部130は、操作部131、音声入力部132、画像入力部133などを含み、これらを制御することで、種々の入力を受け付け、制御部110に入力する。
操作部131は、例えば、カーソルキーや、数字や文字を入力するための英数字キー、機能などを指定するためのボタンなどから構成され、ユーザによって操作されることで、種々の選択指示や文字入力などに用いられる。また、操作部131を構成するボタンが、移動体通信端末100の撮像機能を利用する際のシャッタボタンなどとして機能する。
音声入力部132は、例えば、マイクロフォンなどから構成され、音声通話時のユーザの発話音声や動画撮影時の外部音声などを集音し、電気信号に変換して入力する。
画像入力部133は、イメージセンサ(例えば、CCD(Charge Coupled Device:電荷結合素子)やCMOS(Complementally Metal Oxide Semiconductor:相補型金属酸化物半導体)などを用いたイメージセンサ)、AD変換器(アナログ−デジタル変換器)、などから構成された撮像装置であり、外光を集光して結像するレンズ部134からの入射光を光電変換することで画像データを生成する。より詳細には、レンズ部134からの入射光をイメージセンサが電荷に変換して蓄積し、この電気信号をAD変換器によりデジタル信号に変換することで、デジタルデータで構成される画像データが生成される。なお、画像入力部133は、イメージセンサが蓄積する電荷量や蓄積した電荷の転送などを制御することで、いわゆる電子シャッタ機能を実現しているものとする。このような画像入力部133により、移動体通信端末100の撮像機能が実現され、撮像による画像データの取得がおこなわれる。
入力制御部130は、操作部131、音声入力部132、画像入力部133からの信号を制御部110に入力する。制御部110は、入力制御部130からの入力信号を、出力制御部140や記憶部150などに送出する。
出力制御部140は、音声出力部141や表示部142などを含み、これらを制御することで種々の情報を出力する。ここで、出力制御部140は、制御部110から送られた信号に基づいた出力をおこなう。
音声出力部141は、例えば、スピーカなどから構成され、音声通話における着話音声の他、着信音、撮影時のシャッタ音、ガイダンス音声、アラーム音、などの音声を出力する。
表示部142は、例えば、液晶表示装置(LCD:Liquid Crystal Display)などから構成され、種々の画像表示をおこなう。表示部142は、移動体通信端末100の機能選択画面などを表示出力する他、画像入力部133による撮像画像などを表示出力する。また、移動体通信端末100の撮像機能を利用する際には、画像入力部133から入力される画像信号に基づく画像表示をおこなうことで、いわゆるビューファインダとして機能する。
記憶部150は、例えば、所定の半導体記憶装置(例えば、ROM(Read Only Memory)やRAM(Random Access Memory)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリ、着脱式のメモリカード、など)から構成され、種々の情報を記憶する。本実施形態では、記憶部150に複数の記憶領域が用意される。記憶部150に用意される記憶領域の例を図3に示す。
図示するように、記憶部150には、プログラム格納領域151、機能データ格納領域152、画像データ格納領域153、特徴情報格納領域154、言語情報格納領域155、取得情報格納領域156、などの記憶領域が用意される。
プログラム格納領域151には、制御部110が実行するプログラムが格納される。制御部110は、プログラム格納領域151に格納されているプログラムを実行することで、移動体通信端末100の制御および後述する各処理を実行する。また、必要に応じて画像処理部160がプログラム格納領域151に格納されているプログラムを実行する。
機能データ格納領域152は、移動体通信端末100の各機能に必要なデータが格納される。例えば、各種画面を構成する画像データや、送受信した電子メールやアドレス帳を示すデータ、URLリストを構成するデータ、などが格納される。
画像データ格納領域153には、画像入力部133が生成した撮像画像の画像データが格納される。画像データ格納領域153に記録される情報の例を図4(a)に示す。図示するように、画像データ格納領域153には、撮像動作毎に割り当てられる一意の識別情報(撮像ID)を主キーとしたレコードが作成されている。各レコードには、当該撮像により生成された画像データが記録されるとともに、連続撮像対象であるか否かを示すフラグ(連続識別フラグ)、連続撮像対象である場合に、検出対象となるオブジェクトの種類を示す情報(検出対象)、連続撮像対象である場合に、いずれの撮像画像に付随するかを示す情報(元画像)、などが記録される。連続識別フラグは、例えば、数値により示されるものとし、本実施形態では、「0」が連続撮像対象外であることを示し、「1」が連続撮像対象であることを示すこととする。
特徴情報格納領域154には、画像処理部160による撮像画像に対する画像処理によっておこなわれる解析に用いられるデータが格納される。本実施形態では、画像処理部160が撮像画像の特性を検出することで、当該画像中に所定のオブジェクト(例えば、2次元コードなどのコードシンボル、ウェブサイトへのアクセスや電子メールの送信に用いられるアドレス情報(URL(Uniform Resource Locator)や電子メールアドレス)、アドレス情報以外の一般文字情報、など)が示されているか否かを検出するものとする。よって、特徴情報格納領域154には、検出対象となっているオブジェクトを識別するための特徴情報が格納される。
特徴情報格納領域154に記録される情報の例を図4(b)に示す。図示するように、特徴情報格納領域154には、検出対象毎に予め規定された特徴情報が記録される。例えば、2次元コードなどのコードシンボルについての特徴情報としては、各コードシンボルに設定されている固有の特徴(例えば、切り出しシンボルやL型ガイドセルなど)を示す情報が記録される。この場合、コードシンボルに固有の形状を示すデータなどが特徴情報として記録されるものとする。
また、アドレス情報についての特徴情報として、各アドレス情報に固有の特徴的な文字列を示すテキストデータなどが記録される。例えば、URLの場合、URLの先頭に用いられる文字列や記号(例えば、「http:」や「https:」などといったプロトコル名を示す文字列と記号との組み合わせ、など)、および、URLの終端に用いられる文字列や記号(例えば、「.co.jp/」や「.com/」などといったトップレベルドメインを示す文字列と記号との組み合わせや、「.htm」や「.asp」などといったウェブページのファイル形式やサービス種別を示す文字列と記号との組み合わせ、など)が特徴情報として記録される。また、電子メールアドレスの場合では、メールアカウントとドメイン名との区切りに用いられている記号(「@」)や、電子メールアドレスの終端に用いられる文字列や記号(例えば、「.co.jp」などのトップレベルドメイン)などが特徴情報として記録される。
一般文字情報の特徴情報としては、例えば、複数の言語の種類を識別するための特徴情報が記録される。この場合、例えば、各言語で用いられる文字や単語が言語毎に記録される。
言語情報格納領域155には、撮像画像から検出された一般文字情報を認識するためのデータが記録される。ここでは、一般文字が検出された場合、検出された文字の言語に対応する辞書データや辞書プログラムなどが格納される。
取得情報格納領域156には、後述する各処理によって、撮像画像から検出されたオブジェクトから取得された情報が格納される。例えば、2次元コードが撮像画像から検出された場合、当該2次元コードをデコードして得られた情報(例えば、URLなど)が取得情報格納領域156に格納される。また、撮像画像から文字が検出された場合には、文字認識処理によりテキストデータに変換された文字情報が格納される。
取得情報格納領域156に記録される情報の例を図4(c)に示す。図示するように、取得情報格納領域156には、撮像画像から抽出したオブジェクトからテキストデータへの変換動作毎に一意に割り当てられた識別情報(変換ID)を主キーとしたレコードが作成されている。各レコードには、当該変換動作により変換されたテキストデータが格納されるとともに、格納日時を示す情報や撮像画像からの取得時のオブジェクト種類を示す情報、などが記録される。
画像処理部160は、例えば、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)などといった専用回路等によって構成され、制御部110などとの協働により、画像入力部133で生成された撮像画像に所定の画像処理をおこなうことで、撮像画像中にコードシンボルや文字列が含まれているか解析し、含まれている場合には、文字認識処理などをおこなうことで、テキストデータとして抽出する。このような処理をおこなう画像処理部160は、図5に示すような機能構成を有する。
図示するように、画像処理部160は、オブジェクト検出部161、オブジェクト判別部162、コード認識部163、文字認識部164、文字列特性判別部165、および、文字列調整部166として機能する。
オブジェクト検出部161は、画像入力部133が生成した撮像画像に画像処理をおこなうことで、撮像画像の特性を検出し、検出した画像特性に基づいて、当該画像中にオブジェクトが示されているか否かを判別して検出する。オブジェクト検出部161は、例えば、撮像画像におけるヒストグラム分布を取得し、このヒストグラム分布に現れる特徴(画像特性)に基づいて、撮像画像中にオブジェクトが示されているか否かを判別する。
オブジェクト判別部162は、オブジェクト検出部161が検出したオブジェクトの種類を判別する。オブジェクト判別部162は、例えば、撮像画像のヒストグラム分布に現れる特徴に基づいて、検出されたオブジェクトがコードシンボルであるか文字であるかを判別する。また、検出されたオブジェクトの形状を認識し、認識した形状と、特徴情報格納領域154に格納されている特徴情報とを照合することにより、検出されたオブジェクトの種類を特定する。例えば、2次元コードが検出された場合には、切り出しように設定されている特徴部分の形状に基づいて、2次元コードの種類を判別する。また、検出された文字の形状が、例えば、URLに特有に用いられる文字や記号を示している場合には、検出された文字の種類がURLであると判別する。
なお、オブジェクト判別部162は、撮像画像に対し、例えば、2値化処理をおこなうことにより、画像中の最暗部と最明部のみが示されるよう画像処理をおこなう。そして、一方の画素値を示している画素部分(例えば、最暗部(黒色部分)の画素部分)を、オブジェクトを示している領域として認識する。オブジェクト判別部162はまた、認識した領域の形状と、特徴情報格納領域154に格納されている特徴情報が示す形状とを照合することで、撮像されたオブジェクトの種類を判別する。
コード認識部163は、2次元コードなどのコードシンボルを認識し、コード化されている情報を取得する。例えば、ウェブサイトにアクセスするためのURLがコード化されている場合、コードシンボルをデコードして当該URLを示すテキストデータとして取得する。本実施形態では、オブジェクト判別部162により、撮像画像中のオブジェクトがコードシンボルを示していると判別された場合、当該コードシンボルを認識してデコードする。ここで、コード認識部163によるコードシンボルの認識は、対象とするコードシンボルに対応した既知のデコード手法を用いておこなわれるものとする。
文字認識部164は、オブジェクト判別部162により、検出されたオブジェクトが文字(アドレス情報または一般文字情報)を示していると判別された場合に、当該オブジェクトが示している文字を認識し、対応するテキストデータに変換する。ここで、文字認識部164による文字認識は、既知の文字認識手法を用いておこなわれるものとする。
文字列特性判別部165は、文字認識部164により文字認識された文字列(記号を含む)の特性を判別する。本実施形態では、一の撮像画像から抽出された文字列の完全性の判別、および、複数の撮像画像から抽出された文字列の連続性の判別をおこなう。本実施形態にかかる文字列特性判別部165は、例えば、URLを撮影した場合に、対象とするURLの全体が取得されたか否かの判別(完全性の判別)をおこなう他、例えば、一連の文書などを複数の撮像画像に分割して撮像した場合に、各撮像画像から抽出された文字列の重複部分を識別することなどにより、これらの文字列間の連続性などを識別して、関連のある文字列であるか否かを判別する。
文字列調整部166は、文字列特性判別部165により、複数の撮像画像から抽出された文字列間に関連性があると判別された場合に、これらの文字列の重複部分を削除して結合させ、ひとまとまりの文字情報となるよう調整する。
このような機能を有する画像処理部160は、ASICなどの専用回路から構成することで、予めプログラムされたハードウェア処理で実現可能であることはもとより、例えば、制御部110とは異なる論理回路(CPUなど)から構成し、プログラムを随時実行するソフトウェア処理により実現されてもよい。この場合、上記画像処理部160の各機能構成の動作を実現するためのプログラムをプログラム格納領域151に格納し、画像処理部160を構成する論理回路がこれを実行することで、上記各機能構成が実現される。また、このようなプログラムを制御部110が実行することにより、制御部110が画像処理部160として機能するように構成してもよい。
以上示した移動体通信端末100の各構成は、移動体通信端末100によって本発明を実現するために必要な構成であり、その他の構成についての詳細な説明は省略する。すなわち、移動体通信端末100は、上記各構成以外にも、移動体通信端末としての基本的な機能や、付加的な機能を実現するための構成を必要に応じて備えているものとする。
以上のような構成の移動体通信端末100を用いて撮影する場合の動作を以下説明する。ここでは、移動体通信端末100のユーザが、移動体通信端末100の撮像機能により任意の撮影をおこなった場合に移動体通信端末100にて実行される「撮像処理」を、図6に示すフローチャートを参照して説明する。なお、本実施形態では、通話などの通信を主機能とする移動体通信端末を本発明にかかる画像撮像装置としている。よって、移動体通信端末100では、少なくとも、ユーザが通常の通信をおこなうモードと、撮影(撮像)をおこなうモード(撮像モード)とが用意されているものとし、撮像モードが選択されたことを契機に、以下に説明する「撮像処理」が開始されるものとする。撮像モードが選択されることによって、画像入力部133が動作状態となるとともに、操作部131の所定のボタン等が撮影動作に必要なインタフェース(例えば、シャッタボタンなど)として機能する。
撮像モードが選択され、画像入力部133が動作状態になると、レンズ部134からの入射光が随時光電変換され、表示部142に随時表示される。すなわち、画像入力部133の電子シャッタ機能により、光電変換された電気信号が連続的に表示部142に送出されることで、表示部142がビューファインダとして機能する。ユーザは、ビューファインダをみながら構図などを決定し、任意の撮影タイミングで操作部131を操作することで、移動体通信端末100にシャッタ動作を指示する。
ユーザによるボタン操作により、シャッタ動作を指示する信号が操作部131から制御部110に入力されると(ステップS101:Yes)、画像入力部133は、シャッタ動作(電子シャッタ機能の実行など)をおこなって、当該指示タイミングにおける画像データを生成する。制御部110は、画像入力部133が生成した画像データを、撮像画像として、記憶部150の画像データ格納領域153に格納する(ステップS102)。
撮像画像が画像データ格納領域153に格納されると、当該撮像画像を対象として、オブジェクトの検出や判別をおこなうための「オブジェクト検出処理」が画像処理部160により実行される(ステップS200)。
このオブジェクト検出処理は、撮像動作のバックグラウンドで実行されるものとする。すなわち、撮像モードが選択されている間は、撮像動作と並行してオブジェクト検出処理が実行される(ステップS103:No、ステップS101)。また、撮像モードの終了が選択された場合(ステップS103:Yes)に、オブジェクト検出処理が終了していなければ、オブジェクト検出処理が終了するまで撮像モードが維持される(ステップS104:No)。一方、撮像モードの終了が選択された時点でオブジェクト検出処理が終了していれば、撮像処理を終了する(ステップS103:Yes、S104:Yes)。
ここで、図7に示すフローチャートを参照して、オブジェクト検出処理の詳細を説明する。
オブジェクト検出処理が開始されると、画像処理部160のオブジェクト検出部161が、直前に撮像され、記憶部150の画像データ格納領域153に格納された画像データのヒストグラム分布を求め、このヒストグラム分布に基づいて、撮像画像に所定のオブジェクトが示されているか否かの検出をおこなう(ステップS201)。ここでのヒストグラムは、例えば、明るさの階調(輝度階調)毎の画素数を示すものとする。例えば、RGBのそれぞれを8ビットで階調表示する場合、RGB輝度の階調範囲は0〜255となる。ここでは、階調値「0」が最も暗い「黒」を示し、階調値「255」が最も明るい「白」を示しているものとする。
ここで、本実施形態では、検出対象とするオブジェクトとして、2次元コード(コードシンボル)、URL(アドレス情報)、文章(一般文字)を対象とする。「2次元コード」は、移動体通信端末などで読み取られることを目的として、例えば、物品(商品のパッケージやカードなど。以下同じ)や紙面(雑誌、書籍、新聞、など。以下同じ)、ポスターなどに示されているものを想定する。「URL」は、ウェブサイトを通知することを目的として、物品や紙面、ポスターや看板などに示されているものを想定する。「文書」は、紙面に印字されている記事などの文字を想定する。
このようなオブジェクトは、認識されやすくするため、通常、白地に黒色で示されている。よって、このようなオブジェクトを、その認識を目的として撮像した場合、最も暗い部分(黒色部分)と最も明るい部分(白色部分)に画素が偏る傾向となる。すなわち、図8(a)に示すようなヒストグラム分布となる。一方、風景やスナップその他一般的な撮影により得られる撮像画像(以下、「一般画像」とする)では、通常、最暗部と最明部との中間部分にも多くの画素が分布することになる。この場合は、図8(b)に示すようなヒストグラム分布となる。
つまり、オブジェクトを撮像対象とした画像と一般画像との間には、全く異なる顕著な特徴がヒストグラム分布に現れることになる。よって、撮像画像のヒストグラム分布を分析することにより、オブジェクトを撮像対象とした画像であるか、一般画像であるかを判別することができる。すなわち、撮像画像からオブジェクトの有無を検出することができる。
よって、オブジェクト検出部161は、まず、このようなヒストグラム分析により、オブジェクトが撮像対象であるか否かを判別する。すなわち、階調範囲の中間領域に画素分布がない場合はオブジェクトを撮像対象とした画像であると判別し、ある場合には一般画像であると判別する(ステップS202)。
撮像画像が一般画像である場合(ステップS202:No)、オブジェクト検出処理を終了し、図6に示す撮像処理のフローに戻る。すなわち、撮像された画像が画像データ格納領域153に格納された後に撮像動作が継続される。
オブジェクトが撮像対象であると判別した場合(ステップS202:Yes)、画像処理部160は、その旨を制御部110に通知する。
制御部110は、画像処理部160からの通知に応じて、割り込み処理をおこない、撮像画像からオブジェクトが検出された旨、および、当該オブジェクトの抽出を所望するか否かをユーザに問い合わせる画面(以下、「検出通知画面」とする)を生成して表示部142に表示する(ステップS203)。上述したように、このオブジェクト検出処理は、撮像動作のバックグラウンドでおこなわれているので、フォアグラウンドの撮像動作に割り込みをかけて検出通知画面の表示をおこなう。この場合、表示部142では、図9に示すように、撮像モード時のビューファインダ画面上に、検出通知画面が表示される。
ユーザは、表示部142に表示された検出通知画面に従って、オブジェクト検出の要否を入力する。すなわち、例えば、要否を示す回答のそれぞれに割り当てられている操作部131のボタンを選択的に操作することにより入力をおこなう。ここで、ユーザがオブジェクトの抽出を意図して撮像した場合には、オブジェクト抽出の実行を指示する操作をおこなう。一方、例えば、撮像した画像に偶然オブジェクトが写り込んでいた場合や、撮像画像のヒストグラム分布がオブジェクトを撮像対象とした場合と偶然近似していた場合など、オブジェクトの撮影をユーザが意図していなかった場合には、オブジェクト抽出を実行しない旨を指示する操作をおこなう。
制御部110は、ユーザによる操作部131の操作に基づいて、ユーザがオブジェクト抽出の実行を指示したか否かを判別する(ステップS204)。ユーザがオブジェクト抽出の実行を指示していない場合(ステップS204:No)は、オブジェクト検出処理を終了する。この場合、検出通知画面の表示を終了し、撮像モードにおける撮像動作に戻る。
一方、ユーザがオブジェクト抽出の実行を指示した場合(ステップS204:Yes)、制御部110は、画像処理部160に、オブジェクト検出処理の継続を指示する。
画像処理部160のオブジェクト判別部162は、制御部110からの指示に応じて、ヒストグラム分布をさらに分析することにより、撮像されたオブジェクトの種類を判別する。上述したように、本実施形態では、「2次元コード」、「URL」、「文章」を検出対象オブジェクトとしているが、2次元コードと文字(URLおよび文章)とでは、撮像画像においてオブジェクトを示す領域の割合がそれぞれ異なり、この違いがヒストグラム分布に現れる。
つまり、2次元コードを移動体通信端末100で認識させることを目的に撮影する場合、適切に認識させるために、通常、接写で撮影することになる。この場合、図10(a)に示すように、撮像画像の中で、2次元コードを示す領域の割合が高くなる。よって、図10(b)に示すように、このような画像のヒストグラム分布では、最明部(白色部分)の画素量に対して、最暗部(黒色部分)の画素量が比較的多くなる。
一方、URLや文章などの文字を撮影する場合、認識可能な範囲でなるべく多くの文字を写し込むには、接写ではなく、撮影対象からある程度距離をおいて撮影することになる。この結果、図11(a)に示すように、撮像画像中には、対象とする文字の周囲部分も多く写り込むことになる。この場合、図11(b)に示すようなヒストグラム分布となり、最明部の画素量に対する最暗部の画素量が比較的少なくなる。
すなわち、撮像されたオブジェクトが2次元コードであるか文字かによって、最暗部の画素量と最明部の画素量との比率(以下、「明暗比率」とする)が異なってくる。よって、このような特性に基づいて、2次元コードと文字とを峻別するための閾値を明暗比率に設定し、撮像画像における明暗比率と閾値とを比較することで、検出されたオブジェクトが2次元コードであるか文字であるかを判別することができる。ここで、本実施形態では、明暗比率を「最暗部の画素数/最明部の画素数」で表すものとする。この場合、最暗部の画素数が最明部の画素数より多いと、明暗比率は1以上となる。よって、本実施形態では、明暗比率における閾値の例として、数値「1」を用いることとする。
つまり、オブジェクト判別部162は、撮像画像における明暗比率を算出し(ステップS205)、算出結果が1以上であれば、撮像されているオブジェクトが2次元コードであると判別し、明暗比率が1未満であれば、撮像されているオブジェクトが文字であると判別する(ステップS206)。
撮像画像から算出された明暗比率が1以上であり、2次元コードが示されていると判別されると(ステップS206:Yes)、オブジェクト判別部162は、撮像画像中から2次元コードが示されている部分を切り出し(ステップS207)、切り出した2次元コードの形状に基づいて、当該2次元コードの種類を判別する(ステップS208)。
ここでは、オブジェクト判別部162が、撮像画像に対し2値化処理をおこない、各画素の階調値が0か255となるよう変換する。上述したように、オブジェクトは、白地に黒色で示されているので、2値化処理後の画像中で階調値が0となっている画素が、オブジェクトを示していることになる。よって、オブジェクト判別部162は、階調値が0の画素のみを抽出することで、オブジェクトを示す部分を撮像画像から切り出す。そして、切り出したオブジェクト画像の形状と、特徴情報格納領域154に格納されている2次元コードの特徴情報が示す形状とを照合することで、撮像された2次元コードの種類を判別する。
2次元コードの種類が判別されると、コード認識部163により、判別された2次元コードの種類に応じたデコード動作が実行される。ここでは、オブジェクト判別部162により切り出されたオブジェクト画像が示す2次元コードのコード部分を解析することにより、当該2次元コードによってコード化されている情報を認識する(ステップS209)。例えば、URLがコード化されている場合には、当該URLを示すテキストデータが取得される。
2次元コードが認識されると、コード認識部163は、デコードにより取得した情報を、記憶部150の取得情報格納領域156に格納して(ステップS210)、処理を終了する。この場合、図6に示す撮像処理のフローに戻る。
一方、検出されたオブジェクトが文字である場合(ステップS206:No)、オブジェクト判別部162および文字認識部164により、検出された文字の種類を判別し、種類に応じた動作をおこなうための「文字認識処理」が実行される(ステップS300)。この文字認識処理の詳細を、図12に示すフローチャートを参照して説明する。
処理が開始されると、オブジェクト判別部162が、上記オブジェクト検出処理のステップS207と同様の処理により、検出されたオブジェクトを示す部分の切り出しをおこなう(ステップS301)。
次に、文字認識部164により、ステップS301で切り出されたオブジェクトが示す文字を認識し、対応するテキストデータに変換する(ステップS302)。変換されたテキストデータは、記憶部150の取得情報格納領域156に格納される。
撮像されたオブジェクトが文字認識されて、テキストデータに変換されると、オブジェクト判別部162は、変換されたテキストデータが示す文字と、特徴情報格納領域154に格納されているURLの特徴情報とを照合することにより、撮像画像に示されている文字がURLを示しているか否かを判別する(ステップS303)。ここでは、URLの特徴情報のうち、URLの先頭を示す文字列が、変換されたテキストデータに示されているか否かを判別する。
変換されたテキストにURLの先頭文字列が含まれていない場合、オブジェクト判別部162は、撮像されたオブジェクトがURL以外の文字(この場合、一般文字による文章)であると判別する(ステップS303:No)。この場合、文章を認識し、認識結果に応じた動作をおこなうための「文章認識処理」が実行される(ステップS500)。この文章認識処理の詳細は後述する。
一方、URLの先頭文字列が含まれている場合、オブジェクト判別部162は、撮像されたオブジェクトがURLを示していると判別する(ステップS303:Yes)。この場合、文字列特性判別部165が、当該撮像画像に示されているURLの完全性を判別する。ここでは、URLの特徴情報が示す文字列のうち、URLの終端を示す文字列が、変換されたテキストデータに示されているか否かを判別することにより、当該撮像画像中に、一のURLの全体が含まれているか否か、すなわち、当該URLが完全であるか否かを判別する(ステップS304)。つまり、同一の撮像画像から、URLの先頭文字列と終端文字列の両方が認識された場合、URL全体が一の画像中に収まっていることになる。
当該撮像画像中からURL全体が検出されない場合(ステップS304:No)、撮像画像からURL全体を取得するための「連続撮像処理」が実行される(ステップS400)。連続撮像処理の詳細は後述する。
一方、検出されたURLが完全である場合(ステップS304:Yes)、文字列特性判別部165は、制御部110に、その旨を通知するとともに、文字認識部164によって変換された、当該URLを示すテキストデータを送出する。
文字列特性判別部165からの通知に応じて、制御部110は、撮像画像から抽出され、テキストデータとして認識されたURLを用いた処理をおこなう(ステップS305)。ここでは、例えば、認識されたURLをハイパーリンク形式で表示部142に表示し、ユーザが、表示されているURLを指定する操作をおこなった場合に、当該URLが示すウェブサイトにアクセスするための処理を実行する。また、例えば、記憶部150の機能データ格納領域152に構成されているURLリストへの追加などをおこなう。
認識されたURLを用いた処理が終了すると、制御部110は、取得情報格納領域156に格納されている当該URL情報、および、画像データ格納領域153に格納されている当該撮像画像の画像データを削除して(ステップS306)、処理を終了する。すなわち、図7に示すオブジェクト検出処理のフローに戻る。
ここで、ステップS304で、当該撮像画像からURL全体が検出されない場合に実行される連続撮像処理の詳細を図13に示すフローチャートを参照して説明する。
上記文字認識処理のステップS304で、一の撮像画像からURL全体が検出されなかった場合、文字列特性判別部165は、その旨を制御部110に通知するとともに、ステップS302で変換されたテキストデータを制御部110に送出する。
制御部110は、文字列特性判別部165からの通知に応じて、変換されたテキストデータと、撮像画像中に撮像対象オブジェクトが完全に含まれていない旨を示すメッセージを示すとともに、連続して当該オブジェクトをさらに撮影するか否かを問い合わせる画面(以下、「連続撮影確認画面」とする)を表示部142に表示する(ステップS401)。この場合、制御部110は、フォアグラウンドでおこなわれている撮像動作に対する割り込み処理により、図14に示すように、表示部142のビューファインダ画面上に連続撮影確認画面を表示する。
ユーザは、表示部142に表示されている連続撮影確認画面により、現時点で認識されているURLを確認し、取得対象としているURLの未取得部分の撮影が必要な場合には、操作部131を操作し、連続撮影をおこなう旨の指示を入力する。一方、未取得部分の撮影は不要である場合には、連続撮影をおこなわない旨の指示を入力する。
制御部110は、操作部131からの入力信号に基づいて、連続撮影の実行が指示されたか否かを判別する(ステップS402)。
連続撮影をおこなわないとする指示である場合(ステップS402:No)、処理を終了し、図12に示す文字認識処理のフローに戻る。この場合、制御部110は、例えば、認識した不完全なURL情報を用いた処理をおこなうか否かをユーザに問い合わせ、ユーザの指示に応じた処理をおこなってもよい。例えば、当該不完全なURL情報のユーザによる修正やURLリストへの追加、あるいは、URL情報の消去などをおこなう。
一方、連続撮影の実行が指示された場合(ステップS402:Yes)、制御部110は、記憶部150の画像データ格納領域153にアクセスし、現在オブジェクトの検出をおこなっている撮像画像(以下、「元画像」とする)の撮像IDを取得した後に撮像動作に戻り(ステップS403)、次の撮像、すなわち、シャッタ動作指示を待機する(ステップS404)。
ユーザによる操作部131の操作により、次の撮像がおこなわれると、制御部110は、画像データ格納領域153(図4(a)参照)に新たなレコードを作成し、撮像された画像の画像データを格納するとともに、当該レコードの「連続識別フラグ」に「1」を記録する。これにより、当該撮像画像が、対象オブジェクトを完全に取得するための連続撮像対象であることが示される。さらに、「検出対象」に「URL」を記録するとともに、当該撮像前に取得した元画像の撮像IDを「元画像」に記録する。すなわち、連続撮像された画像データの格納時には、連続撮像に関する情報が併せて記録される(ステップS405)。
連続撮像された画像データが格納されると、制御部110は、当該画像に対するオブジェクト抽出処理の実行を画像処理部160に指示する。制御部110からの指示に応じて、画像処理部160の文字認識部164により、撮像画像に含まれている文字部分(URL)の抽出・認識がおこなわれる(ステップS406)。ここでは、文字認識により、対応するテキストデータに変換され、記憶部150の取得情報格納領域156に格納される。なお、検出対象がURLであることが既に認識されているので、オブジェクトの検出動作やオブジェクトの種類を判別する動作は省略される。
連続撮像画像からURLを示すテキストデータが抽出されると、文字列調整部166により、元画像から抽出されたテキストデータと、連続撮像画像から抽出されたテキストデータとの間の調整および結合がおこなわれる。ここでは、2つのテキストデータ間で、重複している文字列を検出し、一方のテキストデータから当該重複部分を削除して結合させる(ステップS407)。
このとき、文字列調整部166は、特徴情報格納領域154にURLの特徴情報として記録される文法情報を参照して文字列の調整をおこなう。すなわち、URLを構成する文字列は、文章とは異なり、必ずしも意味をなす文字列であるとは限らないため、同じ文字が連続する場合もある。したがって、単純に文字の重複部分のみに基づいて結合させると、不正確な結果となる場合もある。ここで、URLの文法情報として、「.」(ドット)や「/」(スラッシュ)が区切り記号として用いられていることが示されているので、文字列調整部166は、対象とする双方のテキストデータに含まれている区切り記号の位置を基準に重複部分の検出をおこなうことで、正確な結合をおこなうことができる。
文字列調整部166は、このようにして結合した文字列を取得情報格納領域156に格納する。
文字列調整部166により、元画像から抽出されたテキストデータと、連続撮像画像から抽出されたテキストデータとの結合がおこなわれると、文字列特性判別部165により、結合されたテキストデータの完全性が判別される(ステップS408)。ここでは、特徴情報格納領域154に格納されているURLの特徴情報のうち、URLの終端を示す文字列を参照し、当該文字列が結合後のテキストデータに含まれているか否かを判別することで、URL全体を表しているか否かを判別する。
結合後のURLが依然完全ではない場合(ステップS408:No)、ステップS401に戻り、さらなる連続撮像をおこなう。
一方、結合後のURLが完全である場合(ステップS408:Yes)、文字列特性判別部165は、制御部110に、その旨を通知するとともに、文字列調整部166によって結合された、当該URLを示すテキストデータを送出する。
制御部110は、文字列特性判別部165からの通知に応じて、制御部110は、抽出されたURLを用いた処理をおこなう(ステップS409)。ここでは、例えば、抽出されたURLをハイパーリンク形式で表示部142に表示し、ユーザが、表示されているURLを指定する操作をおこなった場合に、当該URLが示すウェブサイトにアクセスするための処理を実行する。また、例えば、記憶部150の機能データ格納領域152に構成されているURLリストへの追加などをおこなう。
抽出されたURLを用いた処理が終了すると、制御部110は、取得情報格納領域156に格納されている当該URL情報、および、画像データ格納領域153に格納されている当該撮像画像の画像データを削除して(ステップS410)、処理を終了する。すなわち、図12に示す文字認識処理のフローに戻る。
次に、上記文字認識処理のステップS303で、検出されたオブジェクトが文章であると判別された場合に実行される「文章認識処理」の詳細を図15に示すフローチャートを参照して説明する。
処理が開始されると、画像処理部160の文字列特性判別部165により、検出された文字の種類が判別される(ステップS501)。ここでは、変換されたテキストデータが示す文字と、特徴情報格納領域154に格納されている一般文字情報の特徴情報とを照合することにより、抽出された文字で構成されている文章の言語などを判別する。
検出された文章の言語が判別されると、文字列特性判別部165は、その旨を文字列調整部166に通知する。文字列調整部166は、文字列特性判別部165からの通知に応じて、記憶部150の取得情報格納領域156にアクセスし、取得済みの情報(テキストデータ)のうち、オブジェクト種類が同一のものがあるか否かを判別する。
ここでは、種類が「文章」であると判別されたオブジェクトを処理対象としているので、文字列調整部166は、取得情報格納領域156に記録されている取得済みデータのうち、オブジェクト種類が「文章」となっているデータがあるか否かを判別する(ステップS502)。
同一オブジェクト種類のテキストデータがある場合(ステップS502:Yes)、文字列調整部166は、該当するレコードに記録されている格納日時情報に基づいて、直近に取得された文章データ(すなわち、撮像画像から取得された文章を示すテキストデータ。以下、「直近文章データ」とする。)を特定して取得する(ステップS503)。そして、文字列調整部166は、取得した直近文章データと、今回取得したテキストデータとの間の連続性(関連性)を判別する(ステップS504)。
ここでは、文字列調整部166が、直近文章データと今回取得したテキストデータとの間に重複部分があるか否かを判別することで、両者の連続性(関連性)を判別する。文字列調整部166は、例えば、対象としている文章の行単位で重複があるか否かを判別する。
直近文章データと今回取得したテキストデータとの間に重複部分が検出され、両者の間に連続性(関連性)があると判別された場合(ステップS504:Yes)、文字列調整部166は、今回取得したテキストデータから当該重複部分を削除し、残りのテキストデータを直近文章データに結合して、取得情報格納領域156に格納する(ステップS505)。
これにより、例えば、取得対象とする文章の全範囲が1回の撮像では写しきれず、複数回に分けて所望する範囲を撮影した場合に、撮像毎に取得されたテキストデータを結合してひとまとまりのデータ(例えば、同一ファイル)として記録することができる。
データの結合がおこなわれると、制御部110は、取得情報格納領域156から当該データを取得し、表示部142に表示する(ステップS506)。また、制御部110は、記憶部150の言語情報格納領域155にアクセスし、ステップS501で判別された言語に対応する辞書プログラムを起動し、認識された文章に対する辞書機能を実行する(ステップS507)。ここでは、例えば、表示されている文章中でユーザが指定した単語の意味などを辞書データに基づいて出力する。
一方、ステップS502で、オブジェクト種類が同一のデータがないと判別された場合(ステップS502:No)、もしくは、ステップS504で、直近文章データとの連続性(関連性)がないと判別された場合(ステップS504:No)は、ステップS506で、取得したテキストデータを表示部142に表示し、辞書機能を実行する(ステップS507)。
すなわち、直近に取得した文章との連続性(関連性)がない場合、取得されたテキストデータは、取得済みのデータとは独立して取得情報格納領域156に格納されることになる。
ユーザは、表示部142に表示されている文章を参照する他、必要に応じて辞書機能を利用する。また、操作部131の所定のキーを操作することによって、次の動作もしくは文章表示の終了を指示する。
制御部110は、ユーザによる操作部131の操作に基づいて、文章表示の終了が指示されたか否かを判別する(ステップS508)。文章表示の終了が指示されるまでは、取得された文章の表示と辞書機能の実行が継続される(ステップS508:No)。
一方、文章表示の終了が指示された場合には(ステップS508:Yes)、文章認識処理を終了し、図12に示す文字認識処理のフローに戻る。
上記の各処理で示した動作により、ユーザが移動体通信端末100を用いて撮影をおこなった場合に、撮像画像中にオブジェクトが示されているか否かを移動体通信端末100が自動的に判別する。よって、従来は、コードシンボルや文字の認識を目的とした撮影であるか、通常の撮影であるか、などを撮影毎にユーザが指定していたが、上記実施形態の移動体通信端末100によれば、ユーザがこのような指定をおこなう必要がない。
また、このようなオブジェクトの検出動作は、撮像動作のバックグラウンドでおこなわれているので、検出結果を待つことなく撮影を続行することができる。つまり、オブジェクト認識を目的としない通常撮影の場合でもオブジェクト検出処理が実行されるが、撮像動作のバックグラウンドでおこなわれているので、検出処理が終了するまで次の撮影が中断されてしまうことがない。よって、ユーザは、撮影目的がオブジェクト認識であるか通常撮影であるかにかかわらず、任意のタイミングでシャッタ操作するのみでよい。
そして、移動体通信端末100でオブジェクトを検出した場合には、その旨がユーザに通知される。よって、ユーザがオブジェクト認識を目的とした撮影をおこなった場合はこの通知を待って認識処理にかかる指示をおこなえばよい。一方、通常撮影をおこなっている時に、意図しないオブジェクト検出がされた場合には、通知に対して、認識処理をおこなわない旨の指示をおこなうだけで撮影を続行することができる。
また、オブジェクト認識を目的とした撮影の際にも、検出されたオブジェクトの種類を移動体通信端末100が自動的に判別するので、対象とするオブジェクトの種類をユーザが予め指定する必要もない。
さらに、URLなどといった、利用するためには完全性が求められる情報が検出された場合には、撮像画像から取得された当該情報の完全性を移動体通信端末100が自動的に判別し、完全性がない場合には、複数の撮像画像から正確に情報を取得することができる。
また、複数の撮像動作によって文章などを撮影した場合、複数の撮像画像から認識された文章間の連続性(関連性)を移動体通信端末100が自動的に判別し、関連のある文章であれば、結合して1つのデータ(ファイル)として扱うことができる。よって、ユーザは、取得した文章データの編集などをおこなう必要がなく、所望する範囲を撮影するだけで自動的にデータが分類される。
以上説明したように、本願発明を上記実施形態の如く適用することで、ユーザが煩雑な操作をすることなく、撮像による情報取得を効率的におこなうことができる。
上記実施形態は一例であり、本発明の適用範囲はこれに限られない。すなわち、種々の応用が可能であり、あらゆる実施の形態が本発明の範囲に含まれる。
上記実施形態では、撮像動作のバックグラウンドでオブジェクト検出処理をおこなうことで、撮影の中断等を生じさせずにオブジェクトの検出を可能としたが、例えば、装置の処理能力が低く、撮像動作とオブジェクト検出処理を同時に実行できないような場合には、撮像動作中にオブジェクト検出処理を実行し、オブジェクト検出処理が終了した時点で撮像動作に復帰するようにしてもよい。このような場合であっても、上述したオブジェクト検出処理では、まず、一般画像か否かの判別をおこない、一般画像であればすぐに処理を終了する。また、一般画像か否かの判別は、輝度階調のヒストグラム分布に基づいておこなうため、処理が簡易である。したがって、オブジェクトの認識を目的としない撮影をおこなっている場合は、オブジェクト処理による撮影中断時間が短く、ユーザの撮影動作を妨げることがない。
また、上記実施形態では、認識対象として、2次元コード、URL、文章を例示したが、認識対象はこれに限られず任意である。例えば、1次元バーコード、電子メールアドレス、などを対象としてもよい。
また、上記実施形態では、撮像機能を有する移動体通信端末に本発明を適用した場合を示したが、本発明を適用可能な装置はこれに限られない。すなわち、コードシンボルや文字を撮像して画像処理をおこなえる装置であればよく、例えば、デジタルスチルカメラやデジタルビデオカメラ、あるいは、撮像機能を有するパーソナルコンピュータやPDA(Personal Data Assistance:携帯情報端末)などの装置に本発明を適用してもよい。
また、本発明を実現するための装置は、専用装置によって構成可能であることはもとより、プログラムの適用により、既存の装置を本発明にかかる画像撮像装置として機能させることもできる。すなわち、撮像機能を有する装置において、動作プログラムの更新や追加が可能である場合、上述した各処理を実現するためのプログラムを適用し、当該装置の制御部(CPUなど)が、適用したプログラムを実行することで、上述の各処理が実現され、本発明にかかる画像撮像装置として機能する。
このようなプログラムの提供方法は任意であり、例えば、インターネットなどの通信媒体を介して提供可能である他、所定の記録媒体(例えば、CD−ROM、DVD、メモリカード、など)にプログラムを格納して配布してもよい。
本発明の実施形態にかかる移動体通信端末の外観を模式的に示す図であり、(a)は移動体通信端末の正面を示し、(b)は移動体通信端末の背面を示す。 図1に示す移動体通信端末の内部構成を示すブロック図である。 図2に示す記憶部に構成される記憶領域の例を示す図である。 図3に示す記憶領域に格納される情報の例を示す図であり、(a)は画像データ格納領域に格納される情報の例を示し、(b)は特徴情報格納領域に格納される情報の例を示し、(c)は取得情報格納領域に格納される情報の例を示す。 図2に示す画像処理部により実現される機能構成を示すブロック図である。 本発明の実施形態にかかる「撮像処理」を説明するためのフローチャートである。 図6に示す撮像処理において実行される「オブジェクト検出処理」を説明するためのフローチャートである。 図7に示すオブジェクト検出処理におけるオブジェクト検出方法を説明するための図であり、(a)はオブジェクトを撮像した場合のヒストグラム分布の例を示し、(b)は一般画像のヒストグラム分布の例を示す。 図7に示すオブジェクト検出処理で出力される「検出通知画面」の表示例を示す図である。 図7に示すオブジェクト検出処理における、オブジェクト判別の方法を説明するための図であり、(a)は2次元コードを撮影した場合の撮像画像の例を示し、(b)はこの場合のヒストグラム分布の例を示す。 図7に示すオブジェクト検出処理における、オブジェクト判別の方法を説明するための図であり、(a)は文字列を撮影した場合の撮像画像の例を示し、(b)はこの場合のヒストグラム分布の例を示す。 図7に示すオブジェクト検出処理で実行される「文字認識処理」を説明するためのフローチャートである。 図12に示す文字認識処理で実行される「連続撮像処理」を説明するためのフローチャートである。 図13に示す連続撮像処理で出力される「連続撮影確認画面」の表示例を示す図である。 図12に示す文字認識処理で実行される「文章認識処理」を説明するためのフローチャートである。
符号の説明
100…移動体通信端末、110…制御部、120…通信制御部、130…入力制御部、133…画像入力部、140…出力制御部、150…記憶部、151…プログラム格納領域、152…機能データ格納領域、153…画像データ格納領域、154…特徴情報格納領域、155…言語情報格納領域、156…取得情報格納領域、160…画像処理部、161…オブジェクト検出部、162…オブジェクト判別部、163…コード認識部、164…文字認識部、165…文字列特性判別部、166…文字列調整部

Claims (12)

  1. 画像撮像モードにおいて撮像された画像を表示すると共に、その撮像された撮像画像を記録する機能を有する画像撮像装置であって、
    前記画像撮像モードで撮像された画像の記録を行うためのシャッタ操作の有無を検出するシャッタ検出手段と、
    前記シャッタ検出手段によりシャッタ操作が検出された際は、その時に撮像された撮像画像を記録する撮像画像記録手段と、
    前記シャッタ操作により撮像された撮像画像を解析し、その撮像画像内に特定処理の実行が可能な特定のオブジェクトが撮像されているか否か当該特定のオブジェクトについての特徴情報に基づいて検出するオブジェクト検出手段と、
    当該オブジェクト検出手段が前記撮像画像内に前記特定のオブジェクトが撮像されていると検出した際に、当該オブジェクトを検出したことを通知し、当該オブジェクトの抽出を所望するか否かをユーザに問い合わせる問い合わせ手段と、
    当該問い合わせ手段に対して、ユーザが前記特定のオブジェクトの抽出の実行を指示した場合、前記オブジェクト検出手段が検出した前記特定のオブジェクトを認識し、認識した情報に基づく処理を実行すると共に、当該撮像画像の記録を削除する処理実行手段と、
    前記オブジェクト検出手段が前記撮像画像内に前記特定のオブジェクトを検出しない場合、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させる復帰手段と、
    を備えたことを特徴とする画像撮像装置。
  2. 前記復帰手段は、前記問い合わせ手段に対して、ユーザが前記オブジェクトの抽出の実行を指示しない場合に、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させる、
    ことを特徴とする請求項1に記載の画像撮像装置。
  3. 前記オブジェクト検出手段は、前記撮像画像記録手段が撮像した画像の階調分布特性に基づいて、その撮像画像内に前記特定のオブジェクトが撮像されているか否かを検出する、
    ことを特徴とする請求項1に記載の画像撮像装置。
  4. 前記オブジェクト検出手段は、前記撮像画像記録手段による撮像動作と並行して、オブジェクトの検出をおこなう、
    ことを特徴とする請求項1に記載の画像撮像装置。
  5. 記オブジェクト検出手段が検出したオブジェクトの種類がコードシンボルであるか文字列であるかを判別するオブジェクト判別手段をさらに備え、
    前記処理実行手段は、
    前記オブジェクト判別手段が、前記画像に示されているオブジェクトがコードシンボルであると判別した場合、当該コードシンボルをデコードして情報を取得する、
    ことを特徴とする請求項に記載の画像撮像装置。
  6. 前記オブジェクト判別手段は、
    前記画像に示されているオブジェクトが文字列である場合、当該文字列の特性を判別する文字列特性判別手段をさらに備え、
    前記処理実行手段は、前記文字列特性判別手段が判別した文字列特性に応じた認識動作を実行する、
    ことを特徴とする請求項に記載の画像撮像装置。
  7. 前記文字列特性判別手段は、
    前記文字列が所定のアドレス情報であるか否かを判別し、
    所定のアドレス情報である場合には、前記特徴情報に基づいて、当該アドレス情報が完全であるか否かを判別し、
    前記処理実行手段は、
    前記文字列特性判別手段により、前記アドレス情報が完全でないと判別された場合、前記撮像画像記録手段が記録した複数の画像データから、前記アドレス情報を取得する、
    ことを特徴とする請求項に記載の画像撮像装置。
  8. 前記文字列特性判別手段は、
    前記文字列が所定のアドレス情報ではないと判別した場合、前記特徴情報に基づいて、当該文字列の言語を判別し、
    前記処理実行手段は、
    前記文字列特性判別手段が判別した言語に応じた動作を実行する、
    ことを特徴とする請求項またはに記載の画像撮像装置。
  9. 前記処理実行手段は、取得した複数の情報の重複部分を検出し、検出した重複部分に基づいて、該複数の情報を調整する文字列調整手段をさらに備える、
    ことを特徴とする請求項1乃至のいずれか1項に記載の画像撮像装置。
  10. 前記文字列調整手段は、前記処理実行手段が複数の画像データから所定のアドレス情報を取得した場合、各画像データで認識された文字列の重複部分を検出し、検出した重複部分と、前記特徴情報と、に基づいて各文字列を結合することで、一のアドレス情報となるよう調整する、
    ことを特徴とする請求項に記載の画像撮像装置。
  11. 前記文字列調整手段は、前記処理実行手段が取得した情報が、所定のアドレス情報以外の文字列である場合、取得済みの文字列情報と、新たに取得した文字列情報との重複部分があるか否かを判別し、重複部分がある場合には、当該重複部分に基づいて、前記取得済みの文字列情報と、前記新たに取得した文字列情報とを結合することで、一の情報となるよう調整する、
    ことを特徴とする請求項または10に記載の画像撮像装置。
  12. コンピュータに、
    画像撮像モードにおいて撮像された画像を表示する機能と、
    前記画像撮像モードで撮像された画像の記録を行うためのシャッタ操作の有無を検出する機能と、
    シャッタ操作が検出された際は、その時に撮像された撮像画像を記録する機能と、
    前記シャッタ操作により撮像された撮像画像を解析し、その撮像画像内に特定処理の実行が可能な特定のオブジェクトが撮像されているか否かを当該特定のオブジェクトについての特徴情報に基づいて検出する機能と、
    前記撮像画像内に前記特定のオブジェクトが撮像されていると検出した際に、当該オブジェクトを検出したことを通知し、当該オブジェクトの抽出を所望するか否かをユーザに問い合わせる機能と、
    当該問い合わせに対して、ユーザが前記オブジェクトの抽出の実行を指示した場合、前記検出したオブジェクトを認識し、認識した情報に基づく処理を実行すると共に、当該撮像画像の記録を削除する機能と、
    前記撮像画像内に前記特定のオブジェクトを検出しない場合、当該撮像画像の記録を維持して、新たなシャッタ操作による撮像動作に復帰させる機能と、
    を実現させることを特徴とするプログラム。
JP2005083299A 2005-03-23 2005-03-23 画像撮像装置、および、プログラム Expired - Fee Related JP4251643B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005083299A JP4251643B2 (ja) 2005-03-23 2005-03-23 画像撮像装置、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005083299A JP4251643B2 (ja) 2005-03-23 2005-03-23 画像撮像装置、および、プログラム

Publications (2)

Publication Number Publication Date
JP2006268245A JP2006268245A (ja) 2006-10-05
JP4251643B2 true JP4251643B2 (ja) 2009-04-08

Family

ID=37204184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005083299A Expired - Fee Related JP4251643B2 (ja) 2005-03-23 2005-03-23 画像撮像装置、および、プログラム

Country Status (1)

Country Link
JP (1) JP4251643B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5010928B2 (ja) * 2007-01-16 2012-08-29 ユーテック株式会社 2次元コード読取装置
WO2009107277A1 (ja) * 2008-02-27 2009-09-03 シャープ株式会社 液晶表示装置、および、液晶表示装置における画像処理方法
JP5216828B2 (ja) * 2010-09-29 2013-06-19 株式会社東芝 画像処理装置、方法及びプログラム
KR101907414B1 (ko) * 2011-12-13 2018-10-15 삼성전자주식회사 촬영 이미지 기반의 문자 인식 장치 및 방법

Also Published As

Publication number Publication date
JP2006268245A (ja) 2006-10-05

Similar Documents

Publication Publication Date Title
KR100767920B1 (ko) 휴대 단말 장치 및 휴대 전화기
JP4566740B2 (ja) 携帯端末装置
US8774767B2 (en) Method and apparatus for providing phonebook using image in a portable terminal
KR100610558B1 (ko) 통신기능과 촬상기능을 구비한 전자기기, 화상표시방법 및 화상표시프로그램이 기록된 기록매체
JP3766431B1 (ja) 合焦状態表示手段を備える携帯端末装置及び合焦状態表示方法
EP1742179A1 (en) Method and apparatus for controlling image in wireless terminal
JP2005267146A (ja) 画像認識機能を利用した電子メール作成方法および装置
JPWO2008149709A1 (ja) 携帯端末、携帯端末の制御方法、携帯端末の制御プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
EP1492046A1 (en) Method for recognizing characters in a portable terminal having an image input unit
JP4251643B2 (ja) 画像撮像装置、および、プログラム
JP2003169187A (ja) 情報処理端末
KR101451562B1 (ko) 휴대용 단말기의 데이터 저장 방법 및 장치
JP2002521971A (ja) 複数のキーデータ及び制御入力、表示、ワイヤレス通信及びデータ処理、並びに通信を供給するカメラを伴うデジタルハンドヘルドキーボード志向の装置
JP4618356B2 (ja) 電子機器、及び、プログラム
JP2009005194A (ja) 画像処理装置、方法及びプログラム
JP2005033346A (ja) 情報処理装置、情報処理方法及びソフトウェア
JP5999582B2 (ja) 情報出力装置及びプログラム
KR100399016B1 (ko) 아이엠티-2000을 통한 문서인식/음성낭독방법
JP2013073309A (ja) 画像注目領域抽出方法、並びに当該方法を実現する電子機器、システム、及びプログラム
KR100821159B1 (ko) 핫코드를 인식하는 이동통신 단말기 및 그 방법
JP4446242B2 (ja) データ送信装置、メールデータ送信方法、および、メールデータ送信プログラム
JP2009159379A (ja) 情報処理装置
JP2006209559A (ja) 携帯端末および携帯端末における表示方法
JP5061838B2 (ja) 携帯型情報処理装置
JP2002176674A (ja) 撮像手段付き携帯電話装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees