JP2015090500A - 画像認識装置、画像認識プログラム、画像認識方法、撮像装置 - Google Patents

画像認識装置、画像認識プログラム、画像認識方法、撮像装置 Download PDF

Info

Publication number
JP2015090500A
JP2015090500A JP2013228967A JP2013228967A JP2015090500A JP 2015090500 A JP2015090500 A JP 2015090500A JP 2013228967 A JP2013228967 A JP 2013228967A JP 2013228967 A JP2013228967 A JP 2013228967A JP 2015090500 A JP2015090500 A JP 2015090500A
Authority
JP
Japan
Prior art keywords
image
recognition
unit
image recognition
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013228967A
Other languages
English (en)
Inventor
岡 浩二
Koji Oka
浩二 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013228967A priority Critical patent/JP2015090500A/ja
Publication of JP2015090500A publication Critical patent/JP2015090500A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 画像認識結果における誤認識を防止する。
【解決手段】 認識画像を取得する画像取得部と、抽出条件に基づいて、認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出部と、対象画像に対する画像認識処理を施して認識結果を出力する認識部と、を有してなる。ここで、抽出条件は、認識画像における個別画像の大きさに関する条件であり、認識画像または2値画像に含まれる基準画像の大きさに対する個別画像の大きさの比である。
【選択図】図15

Description

本発明は、画像認識装置と、情報処理装置を画像認識装置として機能させる画像認識プログラムと、情報処理装置が実行する画像認識方法と、画像認識装置を有する撮像装置とに関するものである。
デジタルカメラなどの撮像装置により撮像した画像から、画像に含まれる文字など個別の画像を抽出し、抽出した個別の画像について画像認識を行い、認識結果を出力する、画像認識技術が知られている。
ところで、画像認識技術では、認識対象の画像の状態によっては、画像認識の結果に誤認識が生じるおそれがあるため、認識対象の画像を補正する必要がある。
なお、画像認識技術における補正の例としては、2値画像から文字矩形と文章領域を抽出し画像の斜め補正を行う技術が開示されている(例えば、特許文献1参照)。
また、画像認識技術における補正の別の例としては、歪んで変形して見える画像から、自動的に文字を読み取る技術が開示されている(例えば、特許文献2参照)。
しかしながら、文字画像などの認識対象を含む画像に、ナンバープレートの止めネジや表面の汚れなど、認識対象ではない画像が含まれる場合には、止めネジや汚れなどを文字であると誤認識する場合がある。
つまり、認識対象ではない画像が含まれる画像について画像認識処理を行った場合には、画像認識処理後に認識結果をユーザが確認し、誤認識した結果を修正する必要がある。このような修正処理は、ユーザの画像認識処理への利便性を低下させていた。
本発明は、画像認識結果における誤認識を防止することができる画像認識装置を提供することを目的とする。
本発明は、認識画像を取得する画像取得部と、抽出条件に基づいて、認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出部と、対象画像に対する画像認識処理を施して認識結果を出力する認識部と、を有してなり、抽出条件は、認識画像における個別画像の大きさに関する条件である、ことを特徴とする。
本発明によれば、画像認識結果における誤認識を防止することができる。
本発明に係る撮像装置の実施の形態を示す正面図である。 上記撮像装置の上面図である。 上記撮像装置の背面図である。 上記撮像装置の機能構成例を示す機能ブロック図である。 上記撮像装置によるスルー画表示処理を示すフローチャートである。 上記撮像装置の画像取り込み後の認識画像のスルー画表示を示す模式図である。 上記撮像装置の2値画像のスルー画表示を示す模式図である。 上記撮像装置による画像認識処理を示すフローチャートである。 上記撮像装置の撮像時の確認画面を示す模式図である。 上記撮像装置の対象画像の確認画面を示す模式図である。 斜め補正前の認識画像を示す模式図である。 斜め補正後の認識画像を示す模式図である。 取り込み後の認識画像を示す模式図である。 2値化変換後の2値画像を示す模式図である。 対象画像の特定後の2値化画像を示す模式図である。 誤認識が生じている画像認識処理結果を示す模式図である。 上記撮像装置による画像認識処理結果を示す模式図である。 上記撮像装置によるヘッダー情報付加処理を示すフローチャートである。 上記ヘッダー情報付加処理後のファイルフォーマットを示す模式図である。 上記撮像装置による画像データ保存処理を示すフローチャートである。 上記認識画像保存処理後のファイルフォーマットを示す模式図である。 上記撮像装置のLCDモニタの画面遷移を示す模式図である。 上記撮像装置のメモリテーブルを示す模式図である。 本発明に係る撮像装置の別の実施の形態における取り込み後の認識画像を示す模式図である。 上記撮像装置による画像認識処理結果を示す模式図である。
以下、本発明に係る画像認識装置と、情報処理装置を画像認識装置として機能させる画像認識プログラムと、情報処理装置が実行する画像認識方法と、画像認識装置を有する撮像装置との実施の形態について、図面を参照しながら説明する。
●撮像装置(1)●
まず、本発明に係る撮像装置の実施の形態について、説明する。ここで、本発明に係る撮像装置は、本発明に係る画像認識装置を有してなる。以下の説明において、撮像装置の一機能として画像認識処理が実現される場合を説明する。
●撮像装置の構成
図1は、本発明に係る撮像装置の実施の形態を示す正面図である。同図において、撮像装置1の筐体であるカメラボディCBの正面には、ストロボ発光部3、ファインダ4の対物面、リモコン受光部6及び撮像レンズを含む撮像光学系を構成する鏡胴ユニット7が配置されている。カメラボディCBの一方の側面部には、メモリカード装填室及び電池装填室の蓋2が設けられている。
図2は、撮像装置1の上面図である。同図において、カメラボディCBの上面には、レリーズスイッチSW1が配置されている。また、カメラボディCBの上面には、モードダイヤルSW2及びサブ液晶ディスプレイ(サブLCD(Liquid Crystal Display))(以下「液晶ディスプレイ」を「LCD」という。)11が配置されている。
図3は、撮像装置1の背面図である。同図において、カメラボディCBの背面には、ファインダ4の接眼部、AF用発光ダイオード(以下「発光ダイオード」を「LED(Light Emitting Diode)」という。)8が配置されている。また、同図において、ストロボLED9、被写体画像と拡大画像及び各種設定画面を表示する表示部としてのLCDモニタ10が配置されている。
また、図3において、カメラボディCBの背面には、電源スイッチ13、広角方向ZOOMスイッチSW3、望遠方向ズームスイッチSW4、セルフタイマの設定及び解除スイッチSW5、メニュースイッチSW6が配置されている。
また、図3において、カメラボディCBの背面には、上移動及びストロボセットスイッチSW7、右移動スイッチSW8、ディスプレイスイッチSW9、下移動及びマクロスイッチSW10が配置されている。
さらに、図3において、カメラボディCBの背面には、左移動及び画像確認スイッチSW11、OKスイッチSW12、クイックアクセススイッチSW13が配置されている。
●撮像装置の機能ブロック
次に、撮像装置1の機能ブロックの例について説明する。図4は、撮像装置1の機能構成例を示す機能ブロック図である。撮像装置1の各種動作(処理)は、デジタル信号処理IC(Integrated Circuit)等で構成されるデジタルスチルカメラプロセッサ104(以下「プロセッサ104」という。)と、プロセッサ104において動作する撮像プログラムによって制御される。
画像処理手段であるプロセッサ104は、第1のCCD(Charge
Coupled Device)信号処理ブロック104−1と、第2のCCD信号処理ブロック104−2とを有する。また、プロセッサ104は、CPU(Central Processing Unit)ブロック104−3と、ローカルSRAM(Static
Random Access Memory)104−4とを有する。
また、プロセッサ104は、USB(Universal
Serial Bus)ブロック104−5と、シリアルブロック104−6とを有する。また、プロセッサ104は、JPEG(Joint Photographic Experts Group)CODECブロック104−7と、リサイズ(RESIZE)ブロック104−8とを有する。
また、プロセッサ104は、TV信号表示ブロック104−9と、メモリカードコントローラブロック104−10と、を有してなる。これら各ブロックは相互にバスラインで接続されている。
プロセッサ104の外部には、RAW−RGB画像データ、YUV画像データ及びJPEG画像データを保存するためのSDRAM(Synchronous Dynamic Random Access Memory)103が配置されている。また、プロセッサ104の外部には、RAM(Random Access Memory)107が配置されている。
さらに、プロセッサ104の外部には、内蔵メモリ120及び撮像プログラムである制御プログラムが格納されているROM(Read Only Memory)108、が配置されている。SDRAM103とRAM107とROM108は、バスラインを介してプロセッサ104に接続している。
プロセッサ104は、ROM108に格納されている各種制御プログラムを実行し、各種制御プログラムによる機能を実現する。
SDRAM103は、フレームメモリに相当する。ROM108に格納されている各種制御プログラムには、本発明に係る画像認識装置の動作を実現するプログラムである、画像認識プログラムが含まれる。
つまり、撮像装置1において、ROM108に格納される画像認識プログラムをプロセッサ104に実行させ、SDRAM103、RAM107、記憶部に相当する内蔵メモリ120を使用することにより、本発明に係る画像認識方法を実行している。すなわち、撮像装置1は、本発明に係る画像認識装置の画像取得部と抽出部と認識部と変換部と基準値変更部との機能を有している。
プロセッサ104は、主にCPUブロック104−3等がバスで接続されたコンピュータを実体とし、ROM108に記憶された画像認識プログラムをCPUブロック104−3が実行する。つまり、プロセッサ104では、以上の構成により画像データに対して以下で説明する認識画像の2値化処理と画像認識処理が施される。
画像認識プログラムは、あらかじめ、ROM108に記憶される。ここで、画像認識プログラムは、メモリカード192に記憶させて、メモリカードスロット191を介してROM108に読み込むことができる。あるいは、ネットワーク(不図示)を介して画像認識プログラムをROM108にダウンロードしてもよい。
撮像光学系を構成する鏡胴ユニット7は、ZOOMレンズ7−1aを有するZOOM光学系7−1、FOCUSレンズ7−2aを有するFOCUS光学系7−2、絞り7−3a、を有する絞りユニット7−3を備える。また、鏡胴ユニット7は、メカニカルシャッタ(メカシャッタ)7−4aを有するメカシャッタユニット7−4を備える。
ZOOM光学系7−1は、ZOOMモータ7−1bによって駆動される。また、FOCUS光学系7−2は、FOCUSレンズ移動手段としてのFOCUSモータ7−2bによって駆動される。また、絞りユニット7−3は、絞りモータ7−3bによって駆動される。さらに、メカシャッタユニット7−4は、メカシャッタモータ7−4bによって駆動される。
ZOOMモータ7−1b、FOCUSモータ7−2b、絞りモータ7−3b及びメカシャッタモータ7−4bの各モータは、モータードライバ7−5によって駆動される。モータードライバ7−5はプロセッサ104のCPUブロック104−3によって動作が制御される。
鏡胴ユニット7を構成するズームレンズ7−1aとFOCUSレンズ7−2aは、撮像素子であるCCD101の受光面上に被写体像を結像させる撮像レンズを構成する。CCD101は、受光面に結像された被写体像を電気的な画像信号に変換してF/E(Front/End)−IC102に出力する。
なお、撮像装置1において、撮像素子は、CCDに限定されず、例えばCMOS(Complementary Metal Oxide Semiconductor)を用いてもよい。
F/E−IC102は、CDS(相関2重サンプリング部)102−1、AGC(Auto Gain Control)102−2及びA/D(Analog/Digital)変換部102−3を有する。F/E−IC102は、被写体像から変換された画像信号に対して、所定の処理を施し、デジタル信号に変換する。変換されたデジタル画像信号は、CCD信号処理ブロック104−1に入力される。これらの信号処理動作は、プロセッサ104のCCD信号処理ブロック104−1から出力されるVD信号(垂直駆動信号)とHD信号(水平駆動信号)により、TG(Timing Generator)102−4を介して制御される。
CCD信号処理ブロック104−1は、CCD101からF/E−IC102を経由して入力されたデジタル画像データに対して、ホワイトバランス調整及びγ調整等の信号処理を行うとともに、VD信号及びHD信号を出力する。
また、CPUブロック104−3は、不図示のストロボ回路を制御して動作させることによってストロボ発光部3から照明光を発光させる。
USBブロック104−5は、USBコネクタ122に結合される。シリアルブロック104−6は、シリアルドライバ回路123−1を介してRS−232Cコネクタ123−2に結合される。
TV信号表示ブロック104−9は、LCDドライバ117を介してLCDモニタ10に結合され、また、TV信号表示ブロック104−9は、ビデオアンプ(AMP)118を介してビデオジャック119にも結合される。
メモリカードコントローラブロック104−10は、メモリカードスロット191のカード接点に結合されている。メモリカード192がこのメモリカードスロット191に装填されると、メモリカード192の接点に接触して電気的に接続され、装填されたメモリカード192に画像ファイルを記憶する。
●撮像装置の動作●
次に、撮像装置1の動作について説明をする。図1から図3に示した撮像装置1において、モードダイヤルSW2を操作し、「記録モード(撮影モード)」を選択すると、撮像装置1は記録モードでの動作を開始する。より詳しくは、図3に示した操作keyユニット(SW1〜SW13)に含まれるモードダイヤルSW2の状態が記録モード−オンになったことを、CPUブロック104−3が検知することで、記録モードでの動作が開始する。
CPUブロック104−3はモータードライバ7−5を制御し、鏡胴ユニット7を撮像可能な位置に移動させる。さらに、CCD101、F/E−IC102及びLCDモニタ10等の各部に電源が投入されて動作が開始される。各部の電源が投入されると、ファインダモードでの動作が開始する。
ファインダモードで動作中の撮像装置1は、撮像レンズを介してCCD101の受光面に結像された被写体像に係る画像信号がCDS102−1に出力される。このアナログRGB信号は、AGC(自動利得制御回路)102−2を介してA/D変換部102−3にてデジタル画像信号に変換される。
このデジタル画像信号に含まれるR・G・Bの各信号は、プロセッサ104内の第2のCCD信号処理ブロック104−2が具備するYUV変換手段によって、YUV画像データに変換されて、フレームメモリとしてのSDRAM103に記録される。
なお、第2のCCD信号処理ブロック104−2は、RGB画像信号に対してフィルタリング処理等の適切な処理を施してYUV画像データへと変換する。
YUV画像データは、CPUブロック104−3によって読み出されて、TV信号表示ブロック104−9を介してビデオアンプ118及びビデオジャック119に送られて、これに接続されたTV(テレビジョン)にて表示される。
また、CPUブロック104−3によって読み出されたYUV画像データは、LCDドライバ117を介してLCDモニタ10に送られて表示に供される。この処理が1/30秒間隔で行われて表示が更新され、撮像対象とする被写体をLCDモニタ10の表示によって視認しながら撮像することができるファインダモードでの動作となる。
CCD101は複数の駆動モード(駆動条件)を設定することができる。この駆動モードによって、CCD101から出力される画像信号の出力条件を変更することができる。
●スルー画表示処理
次に、撮像装置1によるスルー画表示処理について説明する。ここで、撮像装置1において、スルー画表示処理は、後述する画像認識処理を行う前に行われる。
図5は、撮像装置1によるスルー画表示処理を示すフローチャートである。同図に示すように、撮像装置1では、撮像光学系を介して被写体像が認識画像としてCCD101に取り込まれる(S101)。
図6は、撮像装置1の画像取り込み後の認識画像のスルー画表示を示す模式図である。同図に示すように、撮像装置1に取り込まれた後の認識画像は、LCDモニタ10にカラー画像でスルー画表示される。
撮像装置1は、認識画像を2値化された画像(以下「2値画像」という。)に変換する2値化変換処理を行うにあたり、輝度成分の値を0または1のいずれに変換するかの基準値(閾値)を変更する必要があるか否かをユーザに確認する(S102)。
ここで、基準値変更は、画像認識処理の対象となる文字などの対象画像の下地の着色の有無、着色度合、着色のグラデーションの状態、あるいは画像上の影の度合などに鑑みて行う。また、基準値変更の要否は、例えばメニュースイッチSW6から受け付ける。
2値化変換処理の基準値の変更が必要な場合には(S102:Yes)、撮像装置1では基準値を変更する(S103)。撮像装置1において、YUV画像の輝度成分を使用して2値化を行う場合は、輝度成分は0〜255の値をとるため、基準値もこの値の中から選択される。
撮像装置1では、変換部の処理として認識画像をS103によって設定された基準値に基づいてYUV画像の輝度成分を使用して2値画像に変換する(S104)。ここで、S104の処理は、本発明に係る画像認識装置の変換部による処理に相当する。
変換後の2値画像では、基準値以上の場合には画素値が“1”に設定され、基準値以下の場合には画素値が“0”に設定される。
なお、基準値の変更が不要な場合には(S102:No)、認識画像は変更前の基準値に基づいて2値画像に変換される。
図7は、撮像装置1の2値画像のスルー画表示を示す模式図である。同図に示すように、撮像装置1では、変換後の2値画像をLCDモニタ10にスルー画表示する(S105)。
撮像装置1は、LCDモニタ10に文字情報を表示するなどして、表示されている2値画像の状態が適切であるか否かをユーザに確認させ、その確認結果をメニュースイッチSW6などから受け付ける(S106)。
ここで、2値画像の状態が適切であるか否かとは、表示されている2値画像により文字認識などの画像認識処理を行うことができるか否かを意味する。
2値画像の状態が適切である場合には(S106:Yes)、撮像装置1は、スルー画表示処理を終了するか否か(他にスルー画表示処理を行う必要がある認識画像があるか否か)をユーザに確認する(S107)。
なお、2値画像の状態が適切ではない旨の入力があった場合には(S106:No)、撮像装置1では、S103の処理に戻り、2値化の基準値変更処理を行う。
スルー画表示処理を行う必要がある認識画像がない場合には(S107:Yes)、撮像装置1は、スルー画表示処理を終了する。
また、スルー画表示処理を行う必要がある認識画像がある場合には(S107:No)、撮像装置1は、S101の処理に戻り、認識画像の取り込みを行う。ここで、CCD1として30FPSのものを用いる場合には、約33msec周期で認識画像の取り込み処理が行われる。
2値画像のスルー画表示を行うことで、撮像装置1は、2値画像が画像認識処理に適しているか否かなどの状態をユーザに目視にて確認させることができる。
●画像認識処理
次に、撮像装置1による画像認識処理について説明する。以下の説明において、画像認識処理の一例として、撮像装置1により車両のナンバープレートを撮像し、ナンバープレートの文字情報を認識する処理を示す。
撮像装置1は、画像認識処理を行う認識モードと、通常の撮像画像の取得処理を行う撮影モードとの2つの動作モードを備える。ここで、認識モードと撮影モードとは、切替可能である。
認識モードでは、画像認識処理による認識結果が内蔵メモリ120に記憶される。また、撮影モードでは、撮像画像が認識結果と関連付けて内蔵メモリ120に記憶される。
図8は、撮像装置1による画像認識処理を示すフローチャートである。同図に示すように、撮像装置1では、LCDモニタ10に文字情報を表示するなどして、画像認識処理を行う認識モードであるか否かをユーザに確認させ、その確認結果をメニュースイッチSW6などから受け付ける(S201)。
画像認識処理は、認識画像(カラー画像)または認識画像を上述の2値化変換した2値画像を用いて行う。
なお、認識モードではない場合(通常の認識画像を取得する撮影モードである場合)には(S201:No)、画像認識処理は実行されず、S201の処理に戻る。
認識モードである場合には(S201:Yes)、撮像装置1は、先のスルー画表示処理を行う際に取得した認識画像または2値画像において画像認識処理を行う認識領域を特定する(S202)。
図9は、撮像装置の撮像時の確認画面を示す模式図である。同図に示すように、撮像装置1のLCDモニタ10には、認識画像のスルー画上に認識領域を示す枠A1が表示される。ユーザは、上移動及びストロボセットスイッチSW7、右移動スイッチSW8、下移動及びマクロスイッチSW10、左移動及び画像確認スイッチSW11などを操作して枠A1の位置を適切な位置に移動させることができる。
図10は、撮像装置1の対象画像の確認画面を示す模式図である。同図に示すように、枠A1が画像認識処理の対象であるナンバープレート上にある場合には、OKスイッチSW12を操作して、枠A1の位置を確定する。
次に、撮像装置1は、認識画像が傾斜のついた位置から撮像された場合に正面から撮像した画像のように補正する、いわゆる斜め補正を行うか否かをユーザに確認する(S203)。
斜め補正を行う場合には(S203:Yes)、撮像装置1は、認識画像に対して斜め補正を行う(S204)。ここで、斜め補正の処理については、公知の画像処理方法により行う。
図11は、斜め補正前の認識画像を示す模式図である。同図には、斜め補正が必要な認識画像のナンバープレートNPを示す。
図12は、斜め補正後の認識画像を示す模式図である。同図に示すように、斜め補正後の認識画像によれば、ナンバープレートNPの正面から撮像したのと同様の画像を得ることができる。
なお、斜め補正を行わない場合には(S203:No)、撮像装置1は、S205の処理に移行する。
撮像装置1は、抽出条件に基づいて、認識画像または2値画像に含まれる個別画像の特定を行う(S205)。
図13は、取り込み後の認識画像を示す模式図である。また、図14は、2値化変換後の2値画像を示す模式図である。
個別画像とは、認識画像または2値画像に含まれる画像認識処理を行う対象画像の候補となる1または複数の画像をいう。図13,14に示すように、認識画像または2値画像に含まれるナンバープレートNPの数字N1,N2や文字C1,C2やネジSの画像が、個別画像に該当する。
撮像装置1は、対象画像の抽出条件を確定する(S206)。ここで、対象画像の抽出条件とは、認識画像または2値画像における個別画像の大きさに関する条件である。つまり、対象画像の抽出条件とは、認識画像または2値画像に含まれる基準画像の大きさに対する個別画像の大きさの比である。
また、基準画像とは、画像認識処理を行う対象画像を含む所定の面積を有する領域の画像をいう。図13,14において、ナンバープレートNPの画像は、数字N1,N2や文字C1,C2などの対象画像を含む所定の面積を有する領域の画像であるため、基準画像に該当する。ここで、基準画像の大きさに対する個別画像の大きさの数値範囲は、あらかじめROM108などに記憶させておく。
図13,14に示すように、数字N1,N2や文字C1,C2は、ナンバープレートNPの全体の大きさ(面積)において十分な大きさ(面積)を有している。つまり、数字N1,N2の画像や文字C1,C2の画像は、画像認識処理を行う認識画像または2値画像に含まれるナンバープレートNPの画像の大きさに対して十分な大きさを有しているため、対象画像に該当する。
一方、図13,14に示すように、ネジSは、ナンバープレートNPの全体の大きさにおいて十分な大きさを有していない。つまり、ネジSの画像は、画像認識処理を行う認識画像または2値画像に含まれるナンバープレートNPの画像の大きさに対して十分な大きさを有していないため、対象画像に該当しない。
撮像装置1は、対象画像の抽出条件確定後、確定した抽出条件に基づいて対象画像の抽出を行う(S207)。
図15は、対象画像の特定後の2値化画像を示す模式図である。同図に示すように、ナンバープレートNPを含む2値画像において、上述の抽出条件により、数字N1と文字C1の個別画像は対象画像T1として特定される。また、上述の抽出条件により、文字C2の個別画像は、対象画像T2として特定される。さらに、数字N2の個別画像は対象画像T3として特定される。
一方、ネジSの個別画像は、上述の抽出条件により対象画像には該当しないため、対象画像として特定されていない。
撮像装置1は、対象画像の抽出した後、その対象画像に対して画像認識処理を施す(S208)。
図16は、誤認識が生じている画像認識処理結果を示す模式図である。同図において、上述の抽出条件に基づくことなく画像認識処理を施したため、認識画像または2値画像に含まれるネジSを文字や数字の個別画像であると誤認識して誤認識文字F1,F2として処理している。
図17は、画像認識処理結果を示す模式図である。同図に示すように、撮像装置1は、本発明に係る画像認識方法における抽出条件に基づいて対象画像を抽出して、画像認識処理を行っている。このため、撮像装置1は、ネジSを文字や数字などの画像と誤認識せず、認識すべき対象である数字N1,N2や文字C1,C2の画像(対象画像)のみを認識して認識結果を出力することができる。
そして、撮像装置1は、認識結果を内蔵メモリ120に記憶する。
以上説明したように、撮像装置1によれば、抽出条件に基づいて対象画像のみを認識して認識結果を出力するため、画像認識結果における誤認識を防止することができる。
●ヘッダー情報付加処理
次に、撮像装置1による、撮像画像を含むファイル(以下「画像ファイル」という。)に上述の画像認識処理による画像認識結果をヘッダー情報として付加して保存する、ヘッダー情報付加処理について説明する。
ここで、ヘッダー情報付加処理とは、例えば車両のナンバープレートの画像認識処理後、そのナンバープレートを付けた車両の画像を撮像して、撮像画像に画像認識結果を関連付けて保存する処理である。
図18は、撮像装置によるヘッダー情報付加処理を示すフローチャートである。同図に示すように、撮像装置1では、上述の画像認識処理を行った後、ユーザによりレリーズスイッチSW1(シャッター)が押下されたか否かを確認して、撮像画像の取得がされたか否かを確定する(S301)。
レリーズスイッチSW1が押下されない場合には、撮像装置1はS301の処理を繰り返す。
レリーズスイッチSW1が押下された場合には、撮像装置1は画像を撮像する(S302)。
画像の撮像後、撮像装置1は、撮像画像を圧縮し、Exif(Exchangeable
image file format)形式のファイル(画像ファイル)を作成する(S303)。
撮像装置1では、画像ファイルの作成後、先に処理した画像認識結果を例えばExifのヘッダーに設定する(S304)。ここで、画像認識結果は、Exifの付属情報であるユーザコメント領域の他に、メーカノート領域にも設定することができる。
画像認識結果を設定後、撮像装置1は、画像ファイルをRAM107やメモリカード192に記録する(S305)。
図19は、ヘッダー情報付加処理後のファイルフォーマットを示す模式図である。同図に示すように、ヘッダー情報付加処理後のファイルフォーマットには、撮像画像(主画像データ)IDと共にサムネイル画像SIと画像ヘッダーIHとが記録される。ここで、画像ヘッダーIHには、上述の画像認識処理による画像認識結果が記録される。
以上説明したように、撮像装置1は、ヘッダー情報付加処理を行うことにより、画像ファイルに画像認識結果を含めて記録することができる。
●認識画像保存処理
次に、撮像装置1による、画像ファイルと共に画像認識処理に用いた認識画像を保存する、認識画像保存処理について説明する。
図20は、撮像装置による画像データ保存処理を示すフローチャートである。同図に示すように、撮像装置1は、上述の画像認識処理を行った後、ユーザによりレリーズスイッチSW1(シャッター)が押下されたか否かを確認して、撮像画像の取得がされたか否かを確定する(S401)。
レリーズスイッチSW1が押下されない場合には、撮像装置1はS401の処理を繰り返す。
レリーズスイッチSW1が押下された場合には、撮像装置1は画像を撮像する(S402)。
画像の撮像後、撮像装置1は、撮像画像を圧縮し、Exif形式のファイル(画像ファイル)を作成する(S403)。
撮像装置1は、画像ファイルの作成後、先に処理した画像認識結果をExifのヘッダーに設定する(S404)。
また、撮像装置1は、画像認識結果と共に画像認識処理に用いた認識画像も画像ファイルに追加する(S405)。
画像認識結果と認識画像とを設定後、撮像装置1は、画像ファイルをRAM107やメモリカード192に記録する(S406)。
図21は、認識画像保存処理後のファイルフォーマットを示す模式図である。同図に示すように、認識画像保存処理後のファイルフォーマットには、撮像画像(主画像データ)IDと共にサムネイル画像SIと画像ヘッダーIHと認識画像RDとが記録される
以上説明したように、撮像装置1は、認識画像保存処理を行うことにより、画像ファイルに画像認識結果と認識画像とを含めて保存することができる。
●撮像装置の画面遷移
次に、撮像装置1による、LCDモニタ10の画面遷移動作について説明する。
図22は、撮像装置1のLCDモニタ10の画面遷移を示す模式図である。同図に示すようにLCDモニタ10には、画像ファイル再生画面10Aと、画像認識結果表示画面10Bと、認識画像表示画面10Cとが表示される。
ここで、画像ファイル再生画面10Aとは、画像ファイルに含まれる通常の撮像画像をLCDモニタ10に再生(表示)する画面である。
また、画像認識結果表示画面10Bとは、通常の撮像画像、認識画像、または2値画像と同時に、画像認識結果をLCDモニタ10に表示する画面である。図22において、画像認識結果表示画面10Bには、通常の撮像画像に画像認識結果を重畳して表示している。
図23は、撮像装置のメモリテーブルを示す模式図である。画像認識結果表示画面10Bには、同図に示すような画像認識結果と共に画像ヘッダーに保存される画像ファイルに関連するその他の情報(車両に関する詳細情報など)を表示することもできる。
さらに、認識画像表示画面10Cとは、画像認識処理に用いた認識画像をLCDモニタ10に表示する画面である。
図22に示すように、撮像装置1では、ディスプレイスイッチSW9を押下するたびに、画像ファイル再生画面10Aと、画像認識結果表示画面10Bと、認識画像表示画面10Cとの表示を切り替えることができる。
そのため、撮像装置1では、画像ファイルに含まれる画像認識結果を、撮像画像と同時に確認することができる。
以上説明した実施の形態によれば、撮像装置1は、抽出条件に基づいて基準画像の大きさに対して所定の大きさの比を有する対象画像のみを抽出して、画像認識処理を行うため、画像認識結果における誤認識を防止することができる。
●撮像装置(2)●
次に、本発明に係る撮像装置の別の実施の形態について、先に説明した実施の形態の撮像装置との相違点を中心に説明する。
図24は、本発明に係る撮像装置の別の実施の形態における取り込み後の認識画像を示す模式図である。同図に示すように、撮像装置1では、画像認識処理を行う認識画像として、先に説明した車両のナンバープレートのほかに、例えば工事現場における記録用の白板100を対象にすることもできる。
ここで、白板100には、例えば工事名、工種、測点、撮影日、撮影地点などの文字が表示されている。
図25は、撮像装置1による画像認識処理結果を示す模式図である。同図に示すように、撮像装置1では、白板100に表示されている文字を前述の画像認識処理により、誤認識することなく文字情報100Aとして認識することができる。
1 撮像装置
2 蓋
3 ストロボ発光部
4 ファインダ
6 リモコン受光部
7 鏡胴ユニット
7−1 ZOOM光学系
7−2 FOCUS光学系
7−3 ユニット
7−4 メカシャッタユニット
7−5 モータードライバ
9 ストロボLED
10 LCDモニタ
10A 画像ファイル再生画面
10B 画像認識結果表示画面
10B 認識画像表示画面
13 電源スイッチ
100 白板
101 CCD
102 F/E−IC
102−1 CDS
102−3 A/D変換部
103 SDRAM
104 デジタルスチルカメラプロセッサ
104−1 CCD信号処理ブロック
104−2 CCD信号処理ブロック
104−3 CPUブロック
104−5 USBブロック
104−6 シリアルブロック
104−7 CODECブロック
104−9 TV信号表示ブロック
104−10 メモリカードコントローラブロック
108 ROM
114 ストロボ回路
117 LCDドライバ
118 ビデオアンプ
119 ビデオジャック
120 内蔵メモリ
122 USBコネクタ
123−1 シリアルドライバ回路
123−2 RS−232Cコネクタ
1021 CDS
191 メモリカードスロット
192 メモリカード
A1 枠
C1 文字
C2 文字
F1 誤認識文字
F2 誤認識文字
IH 画像ヘッダー
ID 主画像データ
N1 数字
N2 数字
NP ナンバープレート
RD 認識画像
SI サムネイル画像
T1 対象画像
T2 対象画像
特許第3866600号公報 特許第4760362号公報

Claims (11)

  1. 認識画像を取得する画像取得部と、
    抽出条件に基づいて、前記認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出部と、
    前記対象画像に対する画像認識処理を施して認識結果を出力する認識部と、
    を有してなり、
    前記抽出条件は、前記認識画像における前記個別画像の大きさに関する条件である、
    ことを特徴とする画像認識装置。
  2. 前記認識画像を2値画像に変換する変換部、
    を備え、
    前記抽出部は、前記抽出条件に基づいて、前記2値画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出し、
    前記抽出条件は、前記2値画像における前記個別画像の大きさに関する条件である、
    請求項1記載の画像認識装置。
  3. 前記抽出条件は、前記認識画像または2値画像に含まれる基準画像の大きさに対する前記個別画像の大きさの比である、
    請求項1または2記載の画像認識装置。
  4. 前記2値画像の基準値を変更する基準値変更部と、
    を備え、
    前記変換部は、前記基準値に基づいて前記認識画像を前記2値画像に変換する、
    請求項2または3記載の画像認識装置。
  5. 前記認識結果が表示される表示部、
    を備え、
    前記表示部には、前記認識結果が、前記2値画像と同時に表示される、
    請求項2乃至4のいずれかに記載の画像認識装置。
  6. 前記認識結果が表示される表示部、
    を備え、
    前記表示部には、前記認識結果が、前記認識画像と同時に表示される、
    請求項1記載の画像認識装置。
  7. 認識画像を取得する画像取得ステップと、
    抽出条件に基づいて、前記認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出ステップと、
    前記対象画像に対する画像認識処理を施して認識結果を出力する認識ステップと、
    を情報処理装置に実行させる画像認識プログラムであり、
    前記抽出条件は、前記認識画像における前記個別画像の大きさに関する条件である、
    ことを特徴とする画像認識プログラム。
  8. 認識画像を取得する画像取得ステップと、
    抽出条件に基づいて、前記認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出ステップと、
    前記対象画像に対する画像認識処理を施して認識結果を出力する認識ステップと、
    を情報処理装置が実行する画像認識方法であり、
    前記抽出条件は、前記認識画像における前記個別画像の大きさに関する条件である、
    ことを特徴とする画像認識方法。
  9. 取得した認識画像に含まれる個別画像を画像認識する画像認識装置を有してなる撮像装置であって、
    前記画像認識装置は、
    認識画像を取得する画像取得部と、
    抽出条件に基づいて、前記認識画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出する抽出部と、
    前記対象画像に対する画像認識処理を施して認識結果を出力する認識部と、
    を有してなり、
    前記抽出条件は、前記認識画像における前記個別画像の大きさに関する条件である、
    ことを特徴とする撮像装置。
  10. 認識モードと撮影モードとの2つの動作モードが切替可能であって、
    前記画像認識装置が出力する前記認識結果を記憶する記憶部と、
    前記記憶部に記憶された前記認識結果が表示される表示部と、
    を備え、
    前記認識モードに切り替えられているときに、前記画像認識装置が出力する前記認識結果が前記記憶部に記憶され、
    前記撮影モードに切り替えられているときに、前記画像認識装置が取得した撮像画像が前記認識結果と関連付けて前記記憶部に記憶され、
    前記記憶部に関連付けて記憶されている前記認識結果と前記撮像画像とは、同時に前記表示部に表示される、
    請求項9記載の撮像装置。
  11. 前記認識画像を2値画像に変換する変換部、
    を備え、
    前記抽出部は、前記抽出条件に基づいて、前記2値画像に含まれる複数の個別画像の中から、画像認識処理を行う対象画像を抽出し、
    前記抽出条件は、前記2値画像における前記個別画像の大きさに関する条件であり、
    前記認識モードに切り替えられているときに、前記画像認識装置が出力する前記認識結果と、前記画像認識装置が変換した前記2値画像と、が関連付けて前記記憶部に記憶され、
    前記撮影モードに切り替えられているときに、前記画像認識装置が出力する前記認識結果と、前記画像認識装置が取得した撮像画像と、が関連付けて前記記憶部に記憶され、
    前記記憶部に関連付けて記憶されている前記認識結果と前記2値画像と前記撮像画像とは、同時に前記表示部に表示される、
    請求項9または10記載の撮像装置。
JP2013228967A 2013-11-05 2013-11-05 画像認識装置、画像認識プログラム、画像認識方法、撮像装置 Pending JP2015090500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013228967A JP2015090500A (ja) 2013-11-05 2013-11-05 画像認識装置、画像認識プログラム、画像認識方法、撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013228967A JP2015090500A (ja) 2013-11-05 2013-11-05 画像認識装置、画像認識プログラム、画像認識方法、撮像装置

Publications (1)

Publication Number Publication Date
JP2015090500A true JP2015090500A (ja) 2015-05-11

Family

ID=53194016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013228967A Pending JP2015090500A (ja) 2013-11-05 2013-11-05 画像認識装置、画像認識プログラム、画像認識方法、撮像装置

Country Status (1)

Country Link
JP (1) JP2015090500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139383A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字鮮明化システム、文字鮮明化プログラム、及び文字鮮明化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261464A (ja) * 1996-03-26 1997-10-03 Sharp Corp 画像2値化装置
JP2003016384A (ja) * 2001-06-29 2003-01-17 Toshiba Corp 光学的文字認識装置及び認識結果画面の表示方法
JP2004240701A (ja) * 2003-02-06 2004-08-26 Hitachi Ltd 旅行時間計測システム,コーン,車番認識システム
JP2006094082A (ja) * 2004-09-24 2006-04-06 Casio Comput Co Ltd 画像撮影装置およびプログラム
JP2008217347A (ja) * 2007-03-02 2008-09-18 Canon Inc ナンバープレート認識装置、その制御方法、コンピュータプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261464A (ja) * 1996-03-26 1997-10-03 Sharp Corp 画像2値化装置
JP2003016384A (ja) * 2001-06-29 2003-01-17 Toshiba Corp 光学的文字認識装置及び認識結果画面の表示方法
JP2004240701A (ja) * 2003-02-06 2004-08-26 Hitachi Ltd 旅行時間計測システム,コーン,車番認識システム
JP2006094082A (ja) * 2004-09-24 2006-04-06 Casio Comput Co Ltd 画像撮影装置およびプログラム
JP2008217347A (ja) * 2007-03-02 2008-09-18 Canon Inc ナンバープレート認識装置、その制御方法、コンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
篠原陽介,外2名: ""画像の明るさと文字配置の考慮によるナンバープレート認識法の改良"", 電子情報通信学会技術研究報告, vol. 105, no. 536, JPN6017037021, 13 January 2006 (2006-01-13), pages 7 - 12, ISSN: 0003762062 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139383A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字鮮明化システム、文字鮮明化プログラム、及び文字鮮明化方法

Similar Documents

Publication Publication Date Title
JP5381060B2 (ja) 撮像装置およびその画像処理方法
KR101634247B1 (ko) 피사체 인식을 알리는 디지털 촬영 장치, 상기 디지털 촬영 장치의 제어 방법
JP5387949B2 (ja) 撮像装置、再生表示装置、撮像記録方法および再生表示方法
TWI459126B (zh) 可產生廣角影像之影像處理裝置、影像處理方法及記錄媒體
CN101334578A (zh) 图像拍摄装置、图像拍摄方法以及计算机程序
JP2007310813A (ja) 画像検索装置およびカメラ
JP5272551B2 (ja) 撮像装置及び方法
US8797445B2 (en) Digital photographing device and method of controlling the same
JP2010141583A (ja) 撮像装置、画像データ補正方法、プログラム及び記録媒体
JP2009089220A (ja) 撮像装置
US20130076940A1 (en) Photographing apparatus and method of detecting distortion thereof
JP2011024123A (ja) 3次元画像撮像装置及び3次元画像表示方法
JP5942260B2 (ja) 撮像装置、画像再生装置
JP5544917B2 (ja) 撮像装置及び撮像方法
JP2015090500A (ja) 画像認識装置、画像認識プログラム、画像認識方法、撮像装置
JP4714561B2 (ja) 撮像装置および撮像方法
JP5799690B2 (ja) 撮像装置及びその制御方法
JP4514138B2 (ja) 固体撮像素子の駆動方法およびデジタルカメラ
JP2010020081A (ja) 撮像装置及び撮像方法、並びに制御プログラム及び記憶媒体
JP2008072675A (ja) 撮像装置
JP5641411B2 (ja) 撮像装置、電子機器、画像処理システムおよびコンピュータ読み取り可能な記録媒体
JP5641415B2 (ja) 撮像装置および電子機器
JP2010016783A (ja) 撮像装置
KR20130030817A (ko) 촬상 장치 및 촬상 방법
JP2011139123A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170928

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180320