JP2005122609A - 撮像物認識装置 - Google Patents

撮像物認識装置 Download PDF

Info

Publication number
JP2005122609A
JP2005122609A JP2003359148A JP2003359148A JP2005122609A JP 2005122609 A JP2005122609 A JP 2005122609A JP 2003359148 A JP2003359148 A JP 2003359148A JP 2003359148 A JP2003359148 A JP 2003359148A JP 2005122609 A JP2005122609 A JP 2005122609A
Authority
JP
Japan
Prior art keywords
image
object recognition
display
reading
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003359148A
Other languages
English (en)
Inventor
Takenori Kawamata
武典 川又
Yuichi Okano
祐一 岡野
Hiroyasu Miyahara
景泰 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2003359148A priority Critical patent/JP2005122609A/ja
Publication of JP2005122609A publication Critical patent/JP2005122609A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 カメラで表示物を撮像してその内容を認識する撮像物認識装置を用いる場合、表示物の位置あわせが難しく、表示物を撮像した画像の画質によっては、表示物を認識できない場合があった。
【解決手段】 カメラ2が撮像した画像を認識して情報を抽出できるかどうかにより、画像の結像状態を判定する画面状態検出部6を備えて、判定した画面の結像状態をディスプレイ3に表示することにより、表示物を撮像して得た画像の結像状態を利用者が確認できるようにした。
【選択図】 図1

Description

この発明は、表示物の画像を撮像し、その画像を認識して情報を抽出する装置に係るものであり、特に適切に画像を認識するように表示物と装置との位置関係を調整する技術に関する。
従来、携帯電話は筐体サイズの制約から、テンキーを用いて文字入力するしかなかった。しかし近年、カメラ付きの携帯電話市場が急速に拡大しており、携帯電話への文字入力を効率化する目的として、携帯電話のカメラで撮像したバーコードを読み取り、バーコード中の文字、画像、音楽データなどを自動的に入力するバーコード読取機能やURL(Uniform Resource Locator)、メールアドレスなどの文字を読み取る文字認識機能が注目されている。
このようなカメラを用いた認識装置は、任意の距離にある表示物を認識しうるものではなく、ピントが合う距離にカメラの位置を合わせて撮像する必要がある。そのため、利用者は、例えば携帯電話の液晶画面に撮像物をプレビュー表示させて、携帯電話を表示物に近づけたり、遠ざけたりしながら使用しているのが実情である。このような位置合わせの方法は、利用者にとってきわめて使いづらいものであり、このような認識機能がせっかく携帯電話の使い勝手を向上する機能であるにもかかわらず、テンキーによる文字入力の代替手段として日常的に認識機能を用いて文字入力や情報入力を行うまでには至っていなかった。
一方、カメラと表示物との位置合わせを行うための技術としては、カメラから表示物までの距離を測定し、適切な距離範囲に存在する場合に、振動を与えることによりユーザに通知する方法がある(例えば、特許文献1)。
特開平11−328296公報 「光学情報読取装置」
従来の光学情報読取装置によれば、表示物までの距離をセンサで測定して、カメラの位置合わせを行うこととしている。したがってこのような構成を実現するには、距離測定用のセンサを搭載する必要がある。新たに距離測定用センサを搭載する構成を採用すると、部品点数の増加とそれに伴うコストの増加を招く。また携帯電話は筐体サイズが限られており、表面にセンサを露出させる余裕もなく、さらに重量の増加も商品の魅力を高める意味では逆効果となる。
また、表示物にはさまざまな粒度(表示物の特徴の抽出のしやすさ)のものがある。すなわち、粒度の粗い表示物(表示物の特徴を抽出する上でそれほど高い解像度が要求されない表示物)では、それほど厳密にピントが合っていなくても画像を認識する上では支障がない場合もあれば、粒度が細かい表示物(表示物の特徴を抽出する上で高い解像度が要求される表示物)を認識するには、相当厳密にピントを合わせなければ正しく認識できないこともある。このように、現実の表示物は多様性に富んでおり、それに対して距離のみでピントを合わせることは現実的でない。この発明は、かかる問題を解決することを目的とする。
この発明に係る撮像物認識装置は、表示物を撮像する画像入力手段と、
前記画像入力手段が撮像した画像における前記表示物の読取度合いを評価する読取度合い評価手段と、
前記結像評価手段が識別した読取度合いを利用者に報知する報知手段と、
前記画像入力手段が撮像した画像から前記表示物を認識する認識手段と、
を備えたものである。
このように、この発明に係る撮像物認識装置は、撮像した画像における表示物の読取度合いに応じて、バーコードや文字などの表示物とデジタルカメラなどの画像入力手段との位置関係が適切かどうかを利用者に報知するようにしたので、距離計測用のセンサなど、距離を取得する部品を用いなくとも、利用者が適切に位置合わせを行って最適な表示物の画像を取得し、効率的に表示物から情報を入力することができるのである。
以下、この発明の実施の形態について、図を用いて説明する。
実施の形態1.
図1は、この発明の実施の形態1による撮像物認識装置の構成を示すブロック図である。図において、撮像物認識装置1は、カメラ2、ディスプレイ3、操作キー4、画像認識部5、画像状態検出部6、記憶部7、制御部8から構成されている。
カメラ2は、たとえばCCD(Charged Coupled Device)カメラなどのカメラであり、感光素子が組み込まれていて、これらが電荷(静電気)を蓄え次々に転送することによって撮像した画像を電気信号として出力する部位である。図2は、撮像物認識装置1の背面図であって、図の撮像物認識装置1の背面にカメラ2が装着された例を示すものである。ただし、カメラ2は必ずしも撮像物認識装置1の背面に装着されている必要はなく、例えば、ヒンジ機構などを有していて自由にカメラの向きを回動して正面側にある表示物と背面側にある表示物とを撮像できるような構成となっていてもよい。
ディスプレイ3は、例えば液晶ディスプレイによって構成されており、カメラ2が撮像した画像(動画又は静止画)を表示するようになっており、カメラ2のファインダーとしても機能するものである。
操作キー4は、撮像物認識装置1に装着されているテンキーである。図3は撮像物認識装置1の正面図であって、ディスプレイ3は撮像物認識装置1の液晶ディスプレイによって構成されていること、及び、テンキー4の装着状態を示す図である。
画像認識部5はカメラ2が撮像した表示物を認識する部位である。また画像状態検出部6は、カメラ2が撮像した表示物の画像の読取度合いを判定して、その状況をディスプレイ3などの報知手段に報知する部位である。なお、画像認識部5及び画像状態検出部6は、後述する制御部8と別体の要素として構成してもよいが、制御部8とコンピュータソフトウェアとを組み合わせて各部位に該当する機能を実行するように構成してもよい。また制御部8がASIC(Application Specific Integrated Circuit:特定用途向けIC)を用いた回路として構成されている場合は、回路の一部に画像認識部5と画像状態検出部6に相当する機能を組み込むようにしておいてもよい。
記憶部7は、カメラ2が撮像した画像を記憶するメモリであって、ランダム・アクセス・メモリや不揮発性記憶装置であるフラッシュメモリなどによって構成される。制御部8はCPU(中央演算装置)またはASICによって構成されており、撮像物認識装置1全体の動作を制御する部位である。バス9は、カメラ2、ディスプレイ3、操作キー4、画像認識部5、画像状態検出部6、記憶部7、制御部8の各部位間の電気信号を伝送するための伝送路である。
なおカメラ2は請求項1における画像入力手段に対応する。ディスプレイ3と画像状態検出部6は請求項1における報知手段に対応する。また画像認識部5は請求項1における認識手段に対応する。
次に、撮像物認識装置1の使用方法を図を用いて説明する。まず利用者は撮像物認識装置1の背面に装着されたカメラ2を表示物にかざして、表示物を撮像する。例えば図4は、撮像物認識装置1によって表示物を撮像する様子を示す図であって、図4は、利用者は利用者の手10で撮像物認識装置1を把持し、表示物であるバーコード11を撮像する様子を示すものである。図5は、利用者がバーコード11の撮像を開始した場合のディスプレイ3の表示内容の例を示す拡大図である。図において、ディスプレイ3の液晶表示領域3aには、モード表示部3bと読取度合いインジケータ3c、位置合わせ用グリッド3dが表示されており、さらにカメラ2によって撮像された現在のバーコード11のイメージが表示されている。このうち、読取度合いインジケータ3cは、バーコード11の画像のピントが合っているかどうかを示す表示領域であり、この例では2つの矩形を結合して表示している。
利用者は、図5のようなディスプレイを見ながら、表示物であるバーコード11を適切に認識するように撮像物認識装置1を移動する。図6は、読取度合いインジケータ3cの表示の遷移を示す連続拡大図である。図において、状態1は読取度合いインジケータ3cの2つの矩形表示(アイコン)のどちらも強調表示されていない、あるいは矩形の枠のみが表示されている状態である。図の状態2は、2つのアイコンのうち1つだけが強調表示、あるいは何らかの色で着色された状態を示すものである。状態3は、2つのアイコンの双方が強調表示、あるいは何らかの色で着色された状態を示すものである。
読取度合いインジケータ3cの2つのアイコンが強調表示されている状態で、利用者は操作キー4の中のいずれかのボタンに割り振られている決定ボタンを押下すると、撮像物認識装置1は撮像されている画像の内容であるバーコード11をデコードして、図7に示すようにデコード結果3eを表示する。また図6の状態3が一定時間継続した場合に、自動的にバーコード11のデコードを開始するような構成としてもよい。利用者はデコード結果3eを視認することで、撮像物認識装置1が適切に表示物であるバーコード11の内容を認識したかどうかを確認する。
このように、表示物であるバーコード11の読取度合いを利用者に報知する読取度合いインジケータ3cを備えたことにより、利用者は現在の撮像物認識装置1が表示物に対して適切な位置にあるかどうかを把握でき、容易に撮像物認識装置1の位置を調整しうるのである。
また、この例では、2つの矩形形状から構成されるアイコンの表示を変更することで、段階的に画像の読取度合いを表示するようにした。撮像物認識装置1の目的は、表示物の画像を撮像して内容を認識することにある。したがって内容が認識であるのであれば、表示物を撮像して得た画像の画質の詳細を気にする必要は本来なく、画像の結像状態を良好な状態に保つことは、表示物から情報を抽出するための手段に過ぎない。したがって、利用者は撮像物認識装置1の位置が適切かどうかさえ認知すれば十分である。このことから、段階的に撮像状況を報知することによって、操作方法を単純にし、より使いやすくしているのである。
なお、この例では2つのアイコンが全く強調表示されない、1つのアイコンのみ強調表示されている、2つのアイコンが強調表示されている、という3つのステータスを表すようにしている。しかしながら、より多くのステータスを表示するようにしてもよいことはいうまでもない。
さらに、この例では、表示物であるバーコード11の画像(プレビュー画像)の近くに読取度合いインジケータ3cを表示することとしているので、バーコード11の実際の画像を見ながら読取度合いインジケータ3cを通じて読取度合いをほぼ同時に確認できる。したがって利用者はディスプレイ3のみを見つめていれば、適切かつ簡便に撮像物認識装置1の位置合わせを行うことができるのであり、極めて使い勝手のよい撮像物認識機能を提供するのである。
続いて、撮像物認識装置11の動作を図を用いて説明する。図8は、撮像物認識装置11の処理を示したフローチャートである。図のステップST101において、制御部8はカメラ2を介して表示物であるバーコード11を撮像し、その画像を記憶部7に記憶させる。ここではその結果として、図9に示すようなバーコード11の画像を取得したものとする。図9のバーコード画像は、例えば表示物であるバーコード11から撮像物認識装置1までの距離が短すぎて焦点が合わないために、鮮明さを欠いている。
次に、ステップST102において、画像状態検出部6は、図9のバーコード画像を図10に示すように一定間隔dで横方向にスキャンし、デコードが成功したスキャンライン数を求める。そしてこのスキャンライン数が所定値以上かどうかを判定することを通じて、表示物であるバーコード11の読取度合いを判定する。その結果、読取度合いが許容できるものであるならば、ステップST104に進む(ステップST102:Yes)。また許容できるものでなければ、ステップST103に進む(ステップST103:No)。ここでは、図9のバーコード画像が鮮明さを欠いているために、デコードが成功したスキャンライン数は0であるとし、その結果、ステップST103に進むこととする。
このように、撮像物認識装置1は、複雑なアルゴリズムによる画像処理を施して読取度合いを識別するのではなく、バーコード読み取りに適したスキャンラインによるデコードの成否に基づいて、画像の読取度合いを取得することとしたので、少ない演算量で高速に読取度合いを取得することができる。
なお、各スキャンラインのデコードの成否に替えて、各スキャンラインと交差するエッジを検出するようにしてもよい。すなわち、各スキャンライン上で隣り合う画素間で濃度値(画素値)の差を算出し、このスキャンラインの走査において画素値間の差が所定値以上となる回数に基づいて読取度合いを判定するのである。このような方法によっても、デコードの成否と同様に少ない演算量で画像の読取度合いは十分に把握できる。
続いて、ステップST103において、画像状態検出部6は、デコードが成功したスキャンコード数に対応して、読取度合いインジケータ3cの表示を変更する。ここでは、例えばスキャンコード数が0の場合は図6の状態1を表示する。スキャンコード数が1及び2の場合は、図6の状態2を表示する。そしてスキャンコード数が3以上となった場合には、図6の状態3を表示するものとする。そうすると、図9に示した現在のバーコード画像ではデコードに成功したスキャンコード数が0だから、状態1のように読取度合いインジケータ3cが表示されることになる。利用者は、読取度合いインジケータ3cの状態を確認して、撮像物認識装置1の位置を変更する。
一方、撮像物認識装置1はステップST101に戻り、制御部8はカメラ2を介して再びバーコード11の画像を撮像する(ステップST101)。この結果、例えば図11に示すようなバーコード画像を得たものとする。図11のバーコード画像は、図9のバーコード画像ほどではないにせよ、未だ鮮明さを欠いた画像である。撮像物認識装置1は、図9のバーコード画像の場合と同じように、図11のバーコード画像からデコードに成功したスキャンライン数を求め、このスキャンライン数が3以上かどうかを判定する(ステップST102)。この画像も鮮明さに欠いているが、それでも1つのスキャンラインでデコードが成功したものとする。しかし、スキャンライン数が基準となる3未満なので、画像状態検出部6は読取度合いインジケータ3cを状態2のように表示する。利用者は、再び読取度合いインジケータ3cの状態を確認して、撮像物認識装置1の位置を変更する。
その間、再び撮像物認識装置1はステップST101に戻り、制御部8はカメラ2を介して再びバーコード11の画像を撮像する(ステップST101)。この結果、例えば図11に示すようなバーコード画像を得たものとする。図12のバーコード画像は、画質がかなり改善されている。撮像物認識装置1は、図9、図11のバーコード画像と同じように、図12のバーコード画像からデコードに成功したスキャンライン数を求め、このライン数が3以上かどうかを判定する(ステップST102)。ここではデコードに成功したスキャンライン数が3であるものとする。そうすると、ステップST104に進み、制御部8は、画像認識部5を呼び出して、バーコード画像のデコードを行わせる。
続くステップST105において、画像認識部5はデコードしたバーコードの内容を図7の3eのように表示する。これによって、表示物であるバーコード11が撮像物認識装置1によって適切に認識されたことを利用者は確認する。
以上から明らかなように、この発明の実施の形態1の撮像物認識装置によれば、表示物であるバーコードを撮像して、その画像の読取度合いを利用者に報知することとしたので、利用者は報知される読取度合いに応じて撮像物認識装置を、バーコードの読み取りが適切に行える位置に容易に移動でき、その結果、バーコード読み取りを通じて、効率的に情報入力を行うことができるのである。
また、バーコードの認識を行う画像認識部5と画像の結像状態を識別する画像状態検出部6を別個の部位として構成し、一定の読取度合いとなるまでバーコード認識を行わないこととし、その間、画像の結像状態だけを取得して読取度合いインジケータ3cに表示することとしたので、画像の撮像から画像の結像状態の報告までのターンアラウンドを短くできる。その結果、利用者の操作に対するレスポンスが良好な撮像物認識装置を構成しうるのである。
さらに、バーコードの認識を行う画像認識部5と画像の結像状態を識別する画像状態検出部6を別個の部位として構成したので、画像状態検出部6は画像の結像状態を識別するために、画像認識部5とは独立した判断方法を採用することが可能となる。したがって、例えば、すでに説明したようなスキャンライン上のエッジを検出するような方法の他、エッジの先鋭度やオートフォーカスカメラで使用しているピントの一致度情報に基づいて結像状態を判断してもよい。
なお、画像認識部5と画像状態検出部6とを別個の部位として構成することは必須ではない。つまり、両者を一体不可分として構成し、毎回画像認識部5によってバーコード読み取りを行う構成としていても、距離測定センサを用いずに撮像物の内容を認識するというこの発明の特徴が失われるものではない。
なお、上記の撮像物認識装置1では、ディスプレイ3に読取度合いインジケータ3cを表示して、表示物の画像の読取度合いを報知することとしたが、この他にも、例えば「適切な位置にあります」のような音声ガイドを出力するようにしてもよい。撮像物認識装置1が携帯電話である場合には、受話スピーカや着信音用スピーカを有しているので、音声を出力することは容易である。またディスプレイ3以外のLCD部品(例えば、通常では受話した場合に点滅するようなLCD)を点滅させることで、適切な位置に撮像物認識装置1があることを報知するようにしてもよい。
実施の形態2.
実施の形態1では、撮像物認識装置1を用いてバーコードを読み取る場合について説明した。これに対して、この発明の実施の形態2では、同じく撮像物認識装置1を用いて2次元バーコードを読み取る例について説明する。2次元バーコードを読みとるために必要となる撮像物認識装置1の構成は実施の形態1で説明したものと同様であって、画像認識部5及び画像状態検出部6の処理が異なる。そこで、以下においては撮像物認識装置1の動作についてのみ説明することとする。
図13は、撮像物認識装置1が2次元バーコードを読みとる処理を表すフローチャートである。図において、図8と同一の符号を付した処理は実施の形態1と同様であるので、実施の形態2特有の処理を行う部分についてのみ説明することとし、他は説明を省略する。また2次元バーコードの例として、図14に示すような2次元バーコード12を読みとることとする。
まず図13のステップST101において、実施の形態1と同様に撮像物認識装置1は2次元バーコード12を撮像する。その結果、図15に示すようなバーコードの画像を取得したものとする。図15のバーコード画像は、例えばバーコード12から撮像物認識装置1までの距離が短すぎて焦点が合わないために、鮮明さを欠いたものとなっている。
次に、ステップST201において、画像状態検出部6は、2次元バーコード画像の読み取りを行う。2次元バーコードの読取方法は「JIS X 0510:1999 2次元コードシンボル−QRコード−基本仕様」に記載されている。これによれば、
(1)QRコード(2次元バーコード)の3つの隅にある位置検出シンボルを検出して、画像中のQRコードの位置を検出する。
(2)内部の読み取りとデコードを行う。
という2つのステップを経てデコードすることとされている。またこの規格によれば、QRコードには誤り訂正コードが付加されているので、(2)の処理に伴ってデータ部のデコードの際に、全体データに対して正しくデコードができたデータ部の割合を算出することも可能である。
そこで、この例では、画像状態検出部6は、上記の2つのステップのうち(1)のみの処理を行うこととする。そして位置検出シンボルの検出を行うことができた場合はステップST202に進む(ステップST201:Yes)。しかし図15に示すバーコードの画像は鮮明でないため、位置検出シンボルの検出に失敗することになり、ステップST103に進む(ステップST201:No)。ステップST103では、実施の形態1と同様に読取度合いインジケータ3cの2つのアイコンを全く強調表示しない図6の状態1のようにする。利用者は、読取度合いインジケータ3cの状態を確認して、撮像物認識装置1の位置を変更する。
このように、位置検出シンボルの検出可否に基づいて読取度合いを判断し、読取度合いインジケータに反映して利用者に報知することで、2次元バーコードから情報を読みとることが可能か否かを利用者が直接的に確認しながら、撮像物認識装置1の位置を調整することが可能となる。
その間、撮像物認識装置1はステップST101に戻り、2次元バーコード12の次の画像を撮像する。図16は、新たに撮像された2次元バーコードの画像の例であり、図15の画像に比べると若干鮮明さが増している。次に撮像物認識装置1は、この画像から位置検出シンボルの検出を行う(ステップST201)。そうすると、図16では符号13、14、15で示される位置検出シンボルを抽出することができる。その結果、ステップST104に進む(ステップST201:Yes)。
ステップST104では、画像認識手段5が2次元バーコード12をデコードする。そして、QRコードに付加されている誤り訂正コードを用いて、デコード割合を算出する。続くステップST202において、算出したデコード割合が所定値、例えば50%以上かどうかを評価する。図16の2次元バーコードの画像の場合、位置検出シンボルに囲まれた内部の画像はあまり鮮明でなく、デコード割合も50%に満たないものとする。そして、デコード割合が50%未満の場合は、ステップST103に進む(ステップST202:No)。ステップST103では、読取度合いインジケータ3cのアイコンを1つだけ強調表示して、図6の状態2のようにする。
このように、デコード割合から読取度合いを判断して、その状況を読取度合いインジケータに表示して利用者に報知するので、利用者は2次元バーコード読み取りが可能な状況にあるかどうかを直接的に確認しながら、撮像物認識装置1の位置を調整することが可能となる。
また、図6に示した単に読取度合いインジケータ3cのように、単純な報知方法だけでなく、例えば、デコードに適した位置に早く到達できるように、今までの認識処理(ステップST104)で最もデコード割合が高かった場合の画像内における2次元バーコードの位置を記憶部7に記憶させておき、ディスプレイに2次元バーコードのプレビューを表示する際に、最もデコード割合が高かった2次元バーコードの位置を記憶部7から読み出して表示してもよい。図17の矩形3fはこのようにして得られた矩形であり、過去に何度か試行されたデコード処理のうちで最もデコード割合の高かったときの2次元バーコードの画像内における位置を示すものである。なお、矩形3fの位置よりもさらにデコード割合が高い試行があった場合には、矩形3fの位置を更新するようにしておく。
なおこの場合の記憶部7は、請求項13の最適位置記憶手段の例をなすものである。
このような領域を明示して利用者に報知することで、2次元バーコードのプレビュー画像がこの矩形3fの近くに表示され、サイズも矩形3fと同程度であれば、2次元バーコード12が認識されやすくなることを直感的に理解できるようになり、より簡単に位置合わせを行うことができる。
図13のフローチャートの説明に戻る。撮像物認識装置1は、利用者が撮像物認識装置1の位置を調整している間に、ステップST101に戻り、2次元バーコード12の次の画像を撮像する。図18は、このようにして得た新しい2次元バーコードの画像の例である。次にステップST201で、図18の2次元バーコード画像から位置検出シンボル13、14、15を検出する。図18の2次元バーコード画像においても位置検出シンボル13〜15ははっきりと表示されているからステップST104に進み(ステップST201:Yes)、ステップST104で2次元バーコードのデコードを行う。そしてその結果、デコード割合が50%以上となったものとすると、この場合はステップST105に進む(ステップST202:Yes)。そしてステップST105において、2次元バーコードのデコード結果を表示する。図19は、2次元バーコードのデコード結果を表示したディスプレイ3の状態を示す図である。
以上から明らかなように、この発明の実施の形態2の撮像物認識装置によれば、表示物である2次元バーコードを撮像して、その画像の読取度合いを利用者に報知することとしたので、利用者は報知される読取度合いに応じて撮像物認識装置を、2次元バーコードの読み取りが適切に行える位置に容易に移動でき、その結果、2次元バーコード読み取りを通じて、効率的に情報入力を行うことができるのである。
さらに2次元バーコードの認識を行う画像認識部5と、画像の結像状態を識別する画像状態検出部6を別個の部位として構成し、画像状態検出部6ではQRコードの位置検出シンボルの検出のみを行って、その都度、画像の読取度合いを表示するようにしたので、画像の撮像から画像の結像状態の報告までのターンアラウンドを短くできる。その結果、利用者の操作に対するレスポンスが良好な撮像物認識装置を構成しうるのである。
なおステップST104で、2次元バーコードのデコード割合をパーセンテージで表現したものを記憶しておき、ステップST103でこのデコード割合をディスプレイ3に表示するようにしてもよい。こうすることで、基準(この例では50%)をクリアするまでにどの程度調整を行えばよいかを利用者が知ることになり、調整が容易になる。
また画像状態検出部6において、位置検出シンボルを検出した場合に、合わせて相互の垂直位置・水平位置を検出し、それぞれの垂直位置と水平位置とを比較することで、回転(2次元バーコード全体が画像平面内で傾いている状態)が発生していると判断した場合には、そのことをディスプレイ3を介して利用者に報知するようにしてもよい。
具体的にいえば、位置検出シンボルの画像内での水平座標と垂直座標を取得し、それぞれの位置検出シンボルの座標値の差を求めて、この差が一定値を超えた場合に、回転が発生していると判断する。また座標位置の評価を行う対象は、位置検出シンボルには限られない。すなわち、例えば表示物の左上隅、右上隅、左下隅、右下隅の点などの基準点の位置を求めて、それぞれの水平座標と垂直座標を評価するようにしてもよい。
2次元バーコード読み取りを効率的に行うには、画像の回転を一定範囲内に抑制する必要があるが、このように回転を検出して利用者に報知することで、利用者は適切に回転した状態を是正することができる。
さらに、画像状態検出部6において、2次元バーコードの上端と下端、左端と右端とをそれぞれ検出し、上端の長さと下端の長さ、左端の長さと右端の長さとを比較して、2次元バーコードの表示面がカメラ2に対して傾いていることを検出し、そのことをディスプレイ3を介して利用者に報知するようにしてもよい。具体的にいえば、例えば表示物の左上隅、右上隅、左下隅、右下隅の点などの基準点の位置を求めて、それぞれの水平座標間の差および垂直座標間の差を評価する。
ここで、例えば左上隅、右上隅、左下隅、右下隅をそれぞれP1、P2、P3、P4とする。そうすると、表示物の表示面がカメラの撮像面に対して平行であれば、P1とP2の水平座標間の差と、P3とP4の水平座標の差は、2次元バーコードの場合、ほぼ等しくなるはずである。そこでP1とP2の水平座標間の差と、P3とP4の水平座標間の差が一定値以上食い違った場合に、表示物の表示面がカメラの撮像面に対して傾斜していると判断するのである。
2次元バーコードの認識率は、2次元バーコードを真正面から撮像した場合が当然最もよく、効率的に認識されるので、表示面が傾いていることを報知することで、利用者は適切に傾斜を是正し、効率的に認識操作を行うことができる。
また、読取度合いインジケータ3cは複数の矩形を列挙して、現在の読取度合いを表現することとしているが、デコード割合をパーセンテージ(”数値”%などの文字列)で表示してもよい。
実施の形態3.
実施の形態1及び2による撮像物認識装置はバーコードや2次元バーコードを認識することを目的とするものであった。一方、バーコードや2次元バーコードの認識機能と同じように携帯電話に装着されているデジタルカメラを用いて、印刷物などに表示されている文字を認識する機能も提案され始めてきている。このような文字認識機能においても、適切に文字を認識する上で、文字を撮像した画像の読取度合いが問題になる。そこで、この発明の実施の形態3では、表示物として文字を対象とした場合の構成例について説明する。
図20は、この発明の実施の形態3による撮像物認識装置の構成を示すブロック図である。図において、撮像物認識装置16は、実施の形態1及び2における撮像物認識装置1と同様にカメラ2、ディスプレイ3、操作キー4、画像認識部5、画像状態検出部6、記憶部7、制御部8を備えており、さらにこれに加えて認識辞書17を新たな構成要素として追加している。認識辞書17は、文字の形状と文字との対応付けを記憶する辞書データであって、ROM(Read Only Memory)などの不揮発性メモリやCD−ROMドライブなどの記憶媒体に記憶されている。なお、認識辞書17は撮像物認識装置16の筐体内に一体不可分で実装されている必要は必ずしもなく、例えば撮像物認識装置16が無線通信機能を有してインターネットなどを経由し、外部機器にアクセスすることができる場合は、その外部機器から認識辞書16をロードするようにしておいてもよい。
その他、図20において、図1と同一の符号を付した構成要素については、実施の形態1と同様であるので説明を省略する。また撮像物認識装置16の具体的な背面図及び正面図は、図2及び図3で示した撮像物認識装置1の背面図及び正面図と同様であるので、省略する。
次に、撮像物認識装置16の使用の方法を説明する。図21は撮像物認識装置16の使用方法を示した図であって、図に示すように利用者は手10で撮像物認識装置16を把持し、背面のカメラ2によって例えば表示物である文字18を撮像する。利用者が図21のように撮像物認識装置16によって文字18を撮像すると、撮像物認識装置16のディスプレイ3にはそのことを示す表示がなされる。図22は、撮像物認識装置16が文字認識を開始すると、表示されるディスプレイ3の表示内容の例を示す拡大図である。図において、文字画像18はカメラ2によって撮像されたものである。
また、矩形3gは読取度合いインジケータであって、現在撮像されている文字の画像の状態を示す表示領域である。実施の形態1及び2では、読取度合いインジケータは2つの矩形から構成されていたが、この例では3つの矩形から構成されるものとする。図23は、読取度合いインジケータ3gの遷移状態を示す連続拡大図である。図において、状態1は読取度合いインジケータ3gを構成する3つの矩形表示(アイコン)の何れも強調表示されていない、あるいは矩形の枠のみが表示されている状態である。図の状態2は、3つのアイコンのうち1つだけが強調表示、あるいは何らかの色で着色された状態を示すものである。状態3は、2つのアイコンが強調表示、あるいは何らかの色で着色された状態を示すものである。そして状態3は、3つのアイコンがすべて強調表示、または何らかの色で着色された状態を示すものである。
次に、撮像物認識装置16の動作を図を用いて説明する。図24は、撮像物認識装置16の動作を表したフローチャートである。図のステップST301において、制御部8はカメラ2を通して文字18を撮像する。ここでは図25に示すような文字18の画像が得られたものとする。
続いてステップST302において、画像状態検出部6は図25の画像から文字領域を抽出する。そのためにはまず、入力画像の輝度情報をもとに、2値画像を求める。そしてここで得られた2値画像の黒画素の数を水平方向に加算して、黒画素ヒストグラムを求める。次に、黒画素の頻度数が一定値以上となる連続部分を文字列の上端および下端として文字領域を求める。なお、左端と右端については、画像領域の左端と右端をそのまま用いる。その結果、図26の矩形19内の領域が文字領域として抽出されたものとする。
次に、ステップST303において、画像状態検出部6は、ステップST302において抽出した文字領域の高さが基準値を超えているかどうかを評価する。そして読み取り対象となる画像内の文字高さが基準値以下となる場合にステップST303に進み、基準値を超える場合には、ステップST305に進む。これは、文字高さが不十分な場合には、文字の構成要素の照合のために必要となる解像度が得られず、撮像物認識装置16と表示物である文字18との位置関係の調整が必要だからである。なお、ここでは図26の矩形19の高さを画素数に基づいて算出することとし、得られた高さが10画素であるとする。そして、基準値を15画素とする。その結果、この矩形の高さは基準値以下となるので、ステップST304に進む(ステップST303:No)。なお、基準値を超える場合については、後述する。
ステップST304において、画像状態検出部6は、ディスプレイ3の読取度合いインジケータ3gを状態1として表示する。これによって利用者は、撮像物認識装置16と文字18との位置関係が不適切であることを確認して、位置関係の調整を行う。
このように、読み取り対象となる画像内の文字高さが十分でない場合には、そのことを読取度合いインジケータ3gに表示して利用者に報知することとしたので、文字の構成要素の照合のために必要な解像度が得られない場合に、利用者はそのことを確認でき、位置関係を是正できる。
なお、この例では、横書き文字を前提に説明しているので、まずは文字の大きさを表す要素として文字の高さを基準に読取度合いを判定している。しかし縦書き文字を前提にした場合には、文字の大きさを表す要素として文字の幅を基準に読取度合いを判定するようにしてもよい。
その一方で、撮像物認識装置16の制御部8は、カメラ2を介して再び文字18を撮像する(ステップST301)。その結果、図27に示すような画像が得られたものとする。続いて、画像状態検出部6は、文字領域の抽出を行う(ステップST302)。その結果、図28の矩形20のような文字領域を抽出したものとする。そして、画像状態検出部6は、この矩形20の高さを求める。その結果、矩形20の高さは20画素であったものとする。この場合は、基準値の15画素を超えているので、ステップS305に進む(ステップST303:Yes)。
ステップST305において、画像状態検出部6は、文字毎の文字矩形を抽出する。そこでまず画像状態検出部6は、図27の画像を2値化して、図29に示すような画像を得る。そして、この2値化された画像において黒画素数を垂直方向に加算し、黒画素ヒストグラムを求める。ついで、この黒画素ヒストグラムを水平方向にスキャンし、黒画素の頻度数が一定値以上となる連続部分を各文字の領域と判断して、文字毎の矩形領域として抽出する。なおこの処理では、新たに各矩形領域の左端と右端のみを決定し、上端と下端については、ステップST302で抽出した文字領域矩形の上端と下端を用いるようにする。図30は、このようにして得られた文字毎の矩形領域を示す図である。図の矩形21、22、23はそれぞれ、画像の黒画素分布の状況から独立した文字領域であると認識された矩形領域である。この図から明らかなように矩形21と矩形23は、人間が認識する個別の文字には対応していない。これは文字18を撮像した画像である図27に示した画像が不鮮明であるため、文字毎に領域を分解できないためである。
ステップST306において、画像状態検出部6は、上述したような文字毎の矩形に分解できない場合を排除するために、ステップST305で抽出した文字毎の矩形のうち、水平方向長さが最大の矩形を選択して、その矩形の垂直方向長さと水平方向長さとの比(縦横比)を算出し、この縦横比が基準値(例えば2.0)以下となるかどうかを評価する。例えば、図30の場合は、矩形23が選択される。矩形23の縦横比が3.0であるとすると、基準値以下とはならないために、ステップST307に進む(ステップST306:No)。なお、基準値以下となる場合については後述する。
ステップST307において、画像状態検出部6は、ディスプレイ3の読取度合いインジケータ3gを状態2として表示する。これによって利用者は、撮像物認識装置16と文字18との位置関係が不適切であることを確認して、位置関係の調整を行う。
このように、文字毎の領域の縦横比を求めて、その縦横比が所定値より大きい場合に、表示物の画像が適切な読取度合いにないと判断して、そのことを読取度合いインジケータ3gに表示して利用者に報知することとしたので、利用者は文字の読取度合いが適切になるように表示物である文字と撮像物認識装置1との位置関係を調整することができる。
その後、撮像物認識装置16の制御部8は、カメラ2を介して再び文字18を撮像する(ステップST301)。その結果、図31に示すような画像が得られたものとする。続いて、画像状態検出部6は、文字領域の抽出を行う(ステップST302)。その結果、図32の矩形24のような文字領域を抽出したものとする。そして、画像状態検出部6は、この矩形24の高さを求める。その結果、矩形24の高さは18画素であったものとする。この場合は、基準値の15画素を超えているので、ステップS305に進む(ステップST303:Yes)。そして図33に示すように文字毎の矩形領域25〜32(以下、文字矩形25〜32と呼ぶ)を抽出する(ステップST305)。次に、文字毎の矩形のうち、水平方向長さが最大の矩形を選択して、その矩形の垂直方向長さと水平方向長さとの比(縦横比)を算出する。ここでは、矩形31の水平方向長さが最大であるとして、その縦横比を求めたところ、1.2であったとする。画像状態検出部6は、この縦横比が基準値(2.0)以下となるので、ステップST308に進む(ステップST306:Yes)。
ステップST308において、画像認識部5は、文字を照合する処理として、文字矩形25〜32のそれぞれから得られる特徴値と、認識辞書17に記憶されている文字の特徴値との一致度を求め、文字矩形毎に最も一致度の高い文字を選択して、その一致度をその文字矩形の一致度とする。
続くステップST309において、画像認識部5は、ステップST308で求めた各文字矩形の一致度が基準値を超えるかどうかを評価する。文字矩形25〜32の各文字についてそれぞれの一致度を単純に基準値と比較してもよいが、ここでは、左端と右端の文字矩形、すなわち文字矩形25と文字矩形32だけを基準値と比較するようにする。一般にカメラで撮像した画像は端部に近づくほど歪みなどの影響によって劣化する。したがって端部に近い位置にある文字矩形についての照合処理の評価値が低くなる傾向が強い。そこで、端部に近い位置の文字矩形の照合における一致度が基準値を超えていれば、文字列全体としても、所定の基準以上で照合しうるものと考えることができる。
このように、カメラで撮像した画像の性質に基づいて、画像の端部に近い文字のみを選択して、基準値と比較することとしたので、少ない演算量で画像の読取度合いを判定でき、その結果、利用者に対するレスポンスの向上を実現できるのである。
なお、画像認識部5ではなく、画像状態検出部6がステップST308が両端の文字矩形25と32について認識辞書17を参照して一致度を算出しておき、ステップST309でその2つの文字矩形の一致度が基準値を超えるかどうかを評価するようにしてもよい。こうすることで、最も演算量を要する認識辞書17を参照しての照合処理の回数を大きく減らすことができ、利用者に対するレスポンスを向上させることができる。
この結果として、文字矩形25と文字矩形32のいずれか一方の一致度が基準値以下の場合は、ステップST310に進み(ステップST309:No)、読取度合いインジケータ3gを状態3に表示する。この場合には、ステップST301に戻って、撮像物認識装置16の位置を再び調整する。一方、文字矩形25と文字矩形32の双方の一致度が基準値を超えた場合には、ステップST311に進み(ステップST309:Yes)、各文字に最も一致度が高かった認識辞書17の文字を結果表示する。
以上から明らかなように、この発明の実施の形態3の撮像物認識装置によれば、表示物である文字までの距離を測定する距離測定センサのような部品を必要とせずに、撮像物認識装置と表示物である文字との距離を適切に調節して、文字認識をすることができるのである。
また、文字領域の高さ、各文字の縦横比、文字列の両端の文字の一致度などによって、段階的に文字を撮像して得た画像の状態を判定して、その状況を利用者に報知することとしたので、利用者は撮像物認識装置を文字認識に最適な位置に移動することが容易になるのである。
さらに、画像認識部5と画像状態検出部6とを別個の構成要素として構成し、さらに文字領域の高さ、各文字の縦横比の評価、あるいは場合によっては、文字列の両端の文字の一致度を画像状態検出部6に評価させる構成としたので、画像の結像状態を高速に判定し、利用者に対するレスポンスを良好にすることができる。
実施の形態4.
実施の形態1乃至3による撮像物認識装置は、表示物を撮像した画像の読取度合いを読取度合いインジケータを通して利用者に報知することで、利用者にその状態を確認しながら撮像物認識装置と表示物との位置関係を調整せしめるものであった。しかし読取度合いインジケータのような方法で画像の状態を確認させる以外に、表示物の画像の認識を試行してみて、認識が失敗した場合に、なぜ認識が失敗したかを利用者が判断するための判断材料となる情報を提示する構成を採用してもよい。この発明の実施の形態4による撮像物認識装置は、かかる特徴を有するものである。
図34は、この発明の実施の形態4による撮像物認識装置の構成を示すブロック図である。図の撮像物認識装置33は、カメラ2、ディスプレイ3、操作キー4、画像認識部5、記憶部7、制御部8、画像切り出し部34から構成されており、画像切り出し部34を除いては、実施の形態1による撮像物認識装置1の相当する構成要素と同様である。また画像切り出し部34は、撮像された画面の一部を切り出す部位であるが、制御部8によって実行されるコンピュータプログラムとして構成してもよい。またこの画像切り出し部は、請求項18における画像切り出し手段の例に相当するものである。
また、図35は撮像物認識装置33のディスプレイ3に表示される画面の例を示す図である。図において、2次元バーコード35はカメラ2によって撮像され、その一部だけがディスプレイ3に表示されている。点線矩形枠3fは、この発明の実施の形態4による撮像物認識装置1が認識対象とする範囲を利用者に案内するために、ディスプレイ3に表示されているガイドラインである。以降の説明において、点線矩形枠3fを、ガイドライン3fと呼ぶこととする。
次に、撮像物認識装置1の処理を図を用いて説明する。図36は撮像物認識装置1の処理を示すフローチャートである。図のステップST401において、カメラ2で撮像された2次元バーコード35の画像は一旦、記憶部7に格納されるとともに、ディスプレイ3に表示される。当初は撮像物認識装置1の電源を入れただけ、あるいは撮像物認識装置1が携帯電話などである場合には、2次元バーコード読み取り機能を起動しただけの状態であるので、利用者は特に表示物である2次元バーコードと撮像物認識装置1との位置関係には気を使っていない。したがって図34のように2次元バーコード35の一部だけしか表示されていない状態が生じうる。
続いてステップST402において、制御部8は、例えば操作キー4を用いて、利用者が撮像物認識装置1に対して認識指示を行ったかどうかを調べる。認識指示とは、利用者がディスプレイ3に2次元バーコード35が表示されている状態を見ながら行う操作をいう。利用者が操作キー4を押下すると、操作キー4は割り込み信号を発生させて制御部8にイベントを通知する。制御部8は、割り込み処理によってそれまで行っていた処理を中断し、操作キー4から通知されたイベントを一旦バッファ(記憶部7の中に待ち行列として設けられることが多い)に格納した後、中断したそれまでの処理を再開する。ステップST402では、このバッファに操作キー4の押下に基づくイベントが記憶されているかどうかを調べることで、認識指示の有無を判断する。
その結果、認識指示がない場合は、ステップST401に戻る(ステップST402:No)。そして再びカメラ2によって撮像された画像をディスプレイ3に表示し、認識指示の有無を調べる、という処理を繰り返す。その間に、利用者はガイドライン3fに合わせて2次元バーコード35が撮像されるように撮像物認識装置33の位置を調整する。図37は、このような状態のディスプレイ3の様子を表す図である。そして、ガイドライン3f内部に2次元バーコード35が表示されている状態で、利用者が認識指示を行ったものとする。この場合は、ステップST403に進む(ステップST402:Yes)。
ステップST403において、画像切り出し部34は、カメラ2で撮像された画像からガイドライン3fの内部の部分画像を切り出す。そして、ステップST404において、画像認識部5は、切り出した部分画像内の2次元バーコードを認識する。
続くステップST405において、画像認識部5による2次元バーコードの認識が成功したかどうかを評価する。その結果失敗した場合は、ステップST406に進む(ステップST405:No)。ステップST406では、制御部8はガイドライン3fの内部の画像を拡大して、ディスプレイ3に表示する。図38は、画像認識部5による認識が失敗した場合に表示される画面の例を示した図である。利用者はこの画面の状況を確認した上で、次回に読み取りできるように撮像物認識装置33の位置を調整する。その後、撮像物認識装置33はステップST401に戻る。
このように、2次元バーコードを拡大して表示することで、利用者は画像の状況を目視により容易に確認できる。その結果、カメラ2で撮像した画像そのままの大きさでは、利用者が認知できなかった阻害要因を素早く判断して修正し、再試行することが可能となるのである。
一方、画像認識部5による2次元バーコードの認識が成功した場合には、ステップS408に進む(ステップST405:Yes)。この場合は、実施の形態2のステップST105と同様の処理を行い、その後処理を終了する。
以上から明らかなように、この発明の実施の形態4の撮像物認識装置によれば、認識処理が失敗した場合に、失敗した原因を利用者が認知できるように原因となった画像を表示することとしたので、利用者は原因を修正して再試行することが容易になるのである。
なお、この例ではガイドライン3fを固定として画像切り出しを行うこととしたが、2次元バーコードの場合は位置検出シンボルによって表示位置を特定できるので、画像切り出しを行う領域を動的に決定するようにしてもよい。すなわち、位置検出シンボルに基づいて2次元バーコードの表示領域を特定し、この表示領域を画像切り出し部34が切り出すようにするのである。そして画像認識部5がこの領域の認識に失敗した場合に、2次元バーコードが表示されている領域の拡大画像をディスプレイ3に表示する。
こうすることで、利用者が画像の位置合わせを行う必要がなくなる上、拡大画像を通じて、撮像物の認識を阻害する要因を発見しやすくなるため、利用者は素早く判断して修正し、再試行することが可能となるのである。
また2次元バーコードの画像をディスプレイ3に表示しうる最大の大きさに拡大する以外に、例えば現在の2次元バーコードの画像を所定の比率(例えば水平・垂直双方に10%ずつ)で拡大するようにしてもよい。
この発明は、例えばデジタルカメラ機能を搭載した携帯情報端末に適用することができる。
この発明の実施の形態1による撮像物認識装置の構成を示すブロック図である。 この発明の実施の形態1の撮像物認識装置の背面図である。 この発明の実施の形態1の撮像物認識装置の正面図である。 この発明の実施の形態1の撮像物認識装置によって表示物を撮像する様子を示す図である。 この発明の実施の形態1の撮像物認識装置のディスプレイの表示内容の例を示す拡大図である。 この発明の実施の形態1の読取度合いインジケータの遷移状態を示す連続拡大図である。 この発明の実施の形態1の撮像物認識装置が画像認識した状態のディスプレイの表示内容の例を示す図である。 この発明の実施の形態1の撮像物認識装置の処理を示すフローチャートである。 この発明の実施の形態1の撮像物認識装置が撮像したバーコードの画像の例を示す図である。 この発明の実施の形態1の撮像物認識装置におけるバーコードのスキャンラインの構成を示す図である。 この発明の実施の形態1の撮像物認識装置が撮像したバーコードの別の画像の例を示す図である。 この発明の実施の形態1の撮像物認識装置が撮像したバーコードの別の画像の例を示す図である。 この発明の実施の形態2の撮像物認識装置の処理のフローチャートである。 この発明の実施の形態2で読みとる2次元バーコードの例を示す図である。 この発明の実施の形態2の撮像物認識装置が撮像した2次元バーコードの画像の例を示す図である。 この発明の実施の形態2で読みとる2次元バーコードの別の例を示す図である。 この発明の実施の形態2の撮像物認識装置のディスプレイを示す図である。 この発明の実施の形態2で読みとる2次元バーコードの別の例を示す図である。 この発明の実施の形態2による2次元バーコードのデコード結果を表示したディスプレイ3の状態を示す図である。 この発明の実施の形態3による撮像物認識装置の構成を示すブロック図である。 この発明の実施の形態3の撮像物認識装置によって表示物を撮像する様子を示す図である。 この発明の実施の形態3の撮像物認識装置のディスプレイの表示内容の例を示す拡大図である。 この発明の実施の形態3の読取度合いインジケータの遷移状態を示す連続拡大図である。 この発明の実施の形態3の撮像物認識装置の処理を示すフローチャートである。 この発明の実施の形態3の撮像物認識装置が撮像した文字の画像の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の画像から抽出した文字領域の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の別の画像の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の別の画像から抽出した文字領域の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の画像を2値化した画像の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の画像から抽出した文字毎の領域の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の別の画像の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の別の画像から抽出した文字領域の例を示す図である。 この発明の実施の形態3の撮像物認識装置が撮像した文字の別の画像から抽出した文字毎の領域の例を示す図である。 この発明の実施の形態4の撮像物認識装置の構成を示すブロック図である。 この発明の実施の形態4の撮像物認識装置の画面の例を示した図である。 この発明の実施の形態4の撮像物認識装置の処理を示すフローチャートである。 この発明の実施の形態4の撮像物認識装置の別の画面の例を示した図である。 この発明の実施の形態4の撮像物認識装置の認識後に表示される画面の例を示した図である。
符号の説明
1,16,34 撮像物認識装置、
2 カメラ、
3 ディスプレイ、
4 操作キー
5 画像認識部、
6 画像状態検出部、
7 記憶部、
8 制御部、
17 認識辞書。

Claims (21)

  1. 表示物の画像を撮像する画像入力手段と、
    前記画像入力手段が撮像した画像における前記表示物の読取度合いを評価して出力する読取度合い評価手段と、
    前記読取度合い評価手段が出力した読取度合いを利用者に報知する報知手段と、
    前記画像入力手段が撮像した画像から前記表示物を認識する認識手段と、
    を備えたことを特徴とする撮像物認識装置。
  2. 前記報知手段は、前記読取度合いを段階的に利用者に報知することを特徴とする請求項1に記載の撮像物認識装置。
  3. 前記報知手段は、前記読取度合いとともに前記画像入力手段が撮像した画像を表示することを特徴とする請求項1に記載の撮像物認識装置。
  4. 前記認識手段は、前記読取度合いが所定の状態となった場合に、前記表示物を認識することを特徴とする請求項1に記載の撮像物認識装置。
  5. 前記読取度合い評価手段は、前記画像における前記表示物の位置を特定する基準点を求めて、それら基準点の垂直位置又は水平位置のずれから前記画像の回転を検出し、
    前記報知手段は、前記画像の回転の発生を利用者に報知することを特徴とする請求項1に記載の撮像物認識装置。
  6. 前記読取度合い評価手段は、前記画像に前記表示物が表示されている位置を特定する基準点を求め、それら基準点間の距離から表示物の傾斜を検出し、
    前記報知手段は、前記画像の傾斜の発生を利用者に報知することを特徴とする請求項1に記載の撮像物認識装置。
  7. 前記画像入力手段は、バーコードを前記表示物として撮像し、
    前記認識手段は、前記バーコードをデコードすることを特徴とする請求項1に記載の撮像物認識装置。
  8. 前記読取度合い評価手段は、前記バーコードにおいてデコード可能なスキャンライン数に基づいて前記読取度合いを決定することを特徴とする請求項7に記載の撮像物認識装置。
  9. 前記読取度合い評価手段は、前記画像入力手段が撮像した画像に水平方向スキャンラインを設定し、そのスキャンライン上の隣接する画素間で濃度差が所定値以上となる画素をエッジとして検出して、検出されたエッジの数に基づいて前記読取度合いを決定することを特徴とする請求項7に記載の撮像物認識装置。
  10. 前記読取度合い評価手段は、前記画像入力手段が撮像した画像に垂直方向スキャンラインを設定し、そのスキャンライン上の隣接する画素間で濃度差が所定値以上となる画素をエッジとして検出して、検出されたエッジの数に基づいて前記読取度合いを決定することを特徴とする請求項7に記載の撮像物認識装置。
  11. 前記画像入力手段は、2次元バーコードを前記表示物として撮像し、
    前記認識手段は、前記2次元バーコードをデコードすることを特徴とする請求項1に記載の撮像物認識装置。
  12. 前記読取度合い評価手段は、前記2次元バーコードの位置検出シンボルを検出するとともに、この位置検出シンボルの検出の有無に基づいて前記読取度合いを決定することを特徴とする請求項11に記載の撮像物認識装置。
  13. 前記認識手段は、前記2次元バーコードをデコードするとともに、そのデコード結果とQRコードの誤り訂正コードとからデコード割合を算出し、
    前記読取度合い評価手段は、前記デコード割合に基づいて前記読取度合いを決定することを特徴とする請求項11又は12の撮像物認識装置。
  14. 前記2次元バーコードの画像内位置とその位置における前記2次元バーコードのデコード割合とを記憶する最適位置記憶手段を備え、
    前記認識手段は、前記デコード割合を算出した後、そのデコード割合が前記最適位置記憶手段に記憶されている前記画像内位置のデコード割合より高い場合に、今回のデコード割合と今回デコードした2次元バーコードの画像内位置を前記最適位置記憶手段に記憶させ、
    前記報知手段は、前記読取度合いを利用者に報知するとともに、前記画像入力手段が撮像した画像と、前記最適位置記憶手段により記憶されている前記画像内位置と、を表示することを特徴とする請求項11の撮像物認識装置。
  15. 文字パターンと文字とを記憶する文字認識辞書を備え、
    前記画像入力手段は、文字を表示物として撮像し、
    前記認識手段は、前記文字認識辞書を参照して前記表示物の文字を文字認識することを特徴とする請求項1に記載の撮像物認識装置。
  16. 前記報知手段は、前記画像入力手段が撮像した画像から文字の表示領域を抽出し、その領域の大きさに基づいて前記表示物の読取度合いを利用者に報知することを特徴とする請求項15に記載の撮像物認識装置。
  17. 前記報知手段は、前記画像入力手段が撮像した画像から各文字の表示領域を抽出し、その領域の縦横比に基づいて前記表示物の読取度合いを利用者に報知することを特徴とする請求項15に記載の撮像物認識装置。
  18. 前記報知手段は、前記画像入力手段が撮像した画像からこの画像の端部に近い文字領域の文字パターンと前記文字認識辞書に記憶される文字パターンとを照合して一致度を算出し、この一致度に基づいて前記表示物の読取度合いを利用者に報知することを特徴とする請求項15に記載の撮像物認識装置。
  19. 表示物を撮像する画像入力手段と、
    前記画像入力手段が撮像した画像から前記表示物を認識し、認識成否を出力する認識手段と、
    前記画像入力手段が撮像した画像の所定の領域を切り出し画像として切り出す画像切り出し手段と、
    前記画像入力手段が撮像した画像を表示するとともに、前記認識手段が前記表示物の認識に失敗した場合に、前記画像切り出し手段が切り出した切り出し画像を表示する報知手段と、
    を備えたことを特徴とする撮像物認識装置。
  20. 前記報知手段は、前記画像入力手段が撮像した画像とともに前記表示物の認識に適する画像内の表示物の位置を示すガイドラインを表示し、
    前記画像切り出し手段は、前記ガイドラインの内部の領域を前記切り出し画像として切り出すことを特徴とする請求項19に記載の撮像物認識装置。
  21. 前記画像切り出し手段は、前記表示物が表示されている領域を前記切り出し画像として切り出し、
    前記報知手段は、前記切り出し画像に表示される表示物を拡大して表示することを特徴とする請求項19に記載の撮像物認識装置。
JP2003359148A 2003-10-20 2003-10-20 撮像物認識装置 Pending JP2005122609A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003359148A JP2005122609A (ja) 2003-10-20 2003-10-20 撮像物認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003359148A JP2005122609A (ja) 2003-10-20 2003-10-20 撮像物認識装置

Publications (1)

Publication Number Publication Date
JP2005122609A true JP2005122609A (ja) 2005-05-12

Family

ID=34615470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003359148A Pending JP2005122609A (ja) 2003-10-20 2003-10-20 撮像物認識装置

Country Status (1)

Country Link
JP (1) JP2005122609A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034942A (ja) * 2005-07-29 2007-02-08 Kobe Steel Ltd 情報処理装置及びそのプログラム
JP2007207010A (ja) * 2006-02-02 2007-08-16 Denso Wave Inc 携帯型二次元コード読取装置
JP2009176036A (ja) * 2008-01-24 2009-08-06 Toshiba Tec Corp データコード読み取り装置
JP2014045794A (ja) * 2012-08-29 2014-03-17 Kyocera Corp 電子機器、制御方法およびプログラム
US20180276461A1 (en) 2017-03-21 2018-09-27 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium
US10412265B2 (en) 2015-10-06 2019-09-10 Canon Kabushiki Kaisha Information processing apparatus that displays a prompt to move the apparatus and information processing method
KR102120092B1 (ko) * 2019-08-02 2020-06-09 주식회사 딥파인 인공 지능을 이용하는 쇼핑 카트 및 상품 인식 방법
WO2021025237A1 (ko) * 2019-08-02 2021-02-11 주식회사 딥파인 쇼핑 카트 및 그의 상품 인식 방법, 이를 이용한 쇼핑 서비스 제공 시스템 및 방법
CN112904629A (zh) * 2019-12-04 2021-06-04 源奇科技股份有限公司 可调式光投射器与可调式光侦测器
KR20210069603A (ko) * 2017-07-10 2021-06-11 김남현 바이너리 코드를 이용한 온라인-오프라인 데이터 통합·관리·공유 방법 및 시스템

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10198753A (ja) * 1997-01-07 1998-07-31 Denso Corp 2次元コード読取装置
JPH11328296A (ja) * 1998-05-14 1999-11-30 Denso Corp 光学情報読取装置
JP2000040121A (ja) * 1998-07-23 2000-02-08 Toshiba Tec Corp コード読み取り装置
JP2000306036A (ja) * 1999-04-19 2000-11-02 Keyence Corp 光学読み取り装置、及び光学読み取り方法、並びに光学読み取りシステム
JP2001184452A (ja) * 1999-12-27 2001-07-06 Olympus Optical Co Ltd バーコード読取装置
JP2002042055A (ja) * 2000-07-24 2002-02-08 Japan Science & Technology Corp カラー文書画像からの文字抽出方法
JP2002176509A (ja) * 2000-12-06 2002-06-21 Tohoku Ricoh Co Ltd 携帯型情報読取装置
JP2002182838A (ja) * 2000-12-14 2002-06-28 Ricoh Co Ltd 座標入力装置
JP2002196870A (ja) * 2000-09-08 2002-07-12 Ricoh Co Ltd 画像形成装置及び文書管理システム
JP2002277727A (ja) * 2001-03-16 2002-09-25 Fuji Photo Film Co Ltd 合焦音発生方法及び装置
JP2003085473A (ja) * 2001-09-14 2003-03-20 Matsushita Electric Ind Co Ltd 光学的情報読取装置、光学的情報読取システム、及び、工程管理システム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10198753A (ja) * 1997-01-07 1998-07-31 Denso Corp 2次元コード読取装置
JPH11328296A (ja) * 1998-05-14 1999-11-30 Denso Corp 光学情報読取装置
JP2000040121A (ja) * 1998-07-23 2000-02-08 Toshiba Tec Corp コード読み取り装置
JP2000306036A (ja) * 1999-04-19 2000-11-02 Keyence Corp 光学読み取り装置、及び光学読み取り方法、並びに光学読み取りシステム
JP2001184452A (ja) * 1999-12-27 2001-07-06 Olympus Optical Co Ltd バーコード読取装置
JP2002042055A (ja) * 2000-07-24 2002-02-08 Japan Science & Technology Corp カラー文書画像からの文字抽出方法
JP2002196870A (ja) * 2000-09-08 2002-07-12 Ricoh Co Ltd 画像形成装置及び文書管理システム
JP2002176509A (ja) * 2000-12-06 2002-06-21 Tohoku Ricoh Co Ltd 携帯型情報読取装置
JP2002182838A (ja) * 2000-12-14 2002-06-28 Ricoh Co Ltd 座標入力装置
JP2002277727A (ja) * 2001-03-16 2002-09-25 Fuji Photo Film Co Ltd 合焦音発生方法及び装置
JP2003085473A (ja) * 2001-09-14 2003-03-20 Matsushita Electric Ind Co Ltd 光学的情報読取装置、光学的情報読取システム、及び、工程管理システム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034942A (ja) * 2005-07-29 2007-02-08 Kobe Steel Ltd 情報処理装置及びそのプログラム
JP2007207010A (ja) * 2006-02-02 2007-08-16 Denso Wave Inc 携帯型二次元コード読取装置
JP4635889B2 (ja) * 2006-02-02 2011-02-23 株式会社デンソーウェーブ 携帯型二次元コード読取装置
JP2009176036A (ja) * 2008-01-24 2009-08-06 Toshiba Tec Corp データコード読み取り装置
JP4523975B2 (ja) * 2008-01-24 2010-08-11 東芝テック株式会社 データコード読み取り装置
US8458036B2 (en) 2008-01-24 2013-06-04 Toshiba Tec Kabushiki Kaisha Datacode reading apparatus
JP2014045794A (ja) * 2012-08-29 2014-03-17 Kyocera Corp 電子機器、制御方法およびプログラム
US10412265B2 (en) 2015-10-06 2019-09-10 Canon Kabushiki Kaisha Information processing apparatus that displays a prompt to move the apparatus and information processing method
US20180276461A1 (en) 2017-03-21 2018-09-27 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium
US11010603B2 (en) 2017-03-21 2021-05-18 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium
KR20210069603A (ko) * 2017-07-10 2021-06-11 김남현 바이너리 코드를 이용한 온라인-오프라인 데이터 통합·관리·공유 방법 및 시스템
KR102559401B1 (ko) * 2017-07-10 2023-07-24 김남현 바이너리 코드를 이용한 온라인-오프라인 데이터 통합·관리·공유 방법 및 시스템
KR102120092B1 (ko) * 2019-08-02 2020-06-09 주식회사 딥파인 인공 지능을 이용하는 쇼핑 카트 및 상품 인식 방법
WO2021025237A1 (ko) * 2019-08-02 2021-02-11 주식회사 딥파인 쇼핑 카트 및 그의 상품 인식 방법, 이를 이용한 쇼핑 서비스 제공 시스템 및 방법
CN112904629A (zh) * 2019-12-04 2021-06-04 源奇科技股份有限公司 可调式光投射器与可调式光侦测器

Similar Documents

Publication Publication Date Title
CN106295638B (zh) 证件图像倾斜校正方法和装置
EP2064651B1 (en) System and method for decoding and analyzing barcodes using a mobile device
Ohbuchi et al. Barcode readers using the camera device in mobile phones
US8774453B2 (en) Method and arrangement for retrieving information comprised in a barcode
US7946491B2 (en) Method, apparatus, and computer program product for providing a camera barcode reader
EP1941421B1 (en) Code reader
KR101354899B1 (ko) 파노라마 사진 촬영 방법
JP2010218061A (ja) 画像処理装置
CN101102572A (zh) 在便携式终端中拍摄名片的装置和方法
WO2013044875A1 (zh) 线性条码识别方法和系统
US20070140564A1 (en) 2-Dimensional code region extraction method, 2-dimensional code region extraction device, electronic device, 2-dimensional code region extraction program, and recording medium containing the program
JP2007034625A (ja) 情報表示装置
JP2005122609A (ja) 撮像物認識装置
JP2007207010A (ja) 携帯型二次元コード読取装置
US9007508B2 (en) Portable device, photographing method, and program for setting a target region and performing an image capturing operation when a target is detected in the target region
JP4182937B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP2002176509A (ja) 携帯型情報読取装置
JP4103909B2 (ja) 携帯情報端末及び画像処理方法
JP2005182745A (ja) 画像処理方法および装置並びにプログラム
JP5482925B2 (ja) 画像撮像装置及びプログラム
JP3723948B2 (ja) カメラ付き携帯電話、バーコード読み取り方法、及びプログラム
JP5228016B2 (ja) 光学符号読取装置
JP5279799B2 (ja) 文字認識装置、文字認識システム、文字認識方法及びプログラム
JP4306619B2 (ja) 移動体通信端末、その撮像制御方法およびプログラム
JP3900083B2 (ja) 画像通信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091020