JP2018092270A - 読み取り装置、読み取りプログラム及び読み取り方法 - Google Patents

読み取り装置、読み取りプログラム及び読み取り方法 Download PDF

Info

Publication number
JP2018092270A
JP2018092270A JP2016233415A JP2016233415A JP2018092270A JP 2018092270 A JP2018092270 A JP 2018092270A JP 2016233415 A JP2016233415 A JP 2016233415A JP 2016233415 A JP2016233415 A JP 2016233415A JP 2018092270 A JP2018092270 A JP 2018092270A
Authority
JP
Japan
Prior art keywords
image
barcode
reading
recognized
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016233415A
Other languages
English (en)
Inventor
英之 藤川
Hideyuki Fujikawa
英之 藤川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016233415A priority Critical patent/JP2018092270A/ja
Priority to PCT/JP2017/040390 priority patent/WO2018101000A1/ja
Publication of JP2018092270A publication Critical patent/JP2018092270A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

【課題】歪み補正を行った後の画像について文字認識できるか否かを判断する場合よりも、画像が文字認識できないと判断するまでに要する時間を短くすることを目的とする。
【解決手段】予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する判定部と、前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する制御部と、を有する読み取り装置が提供される。
【選択図】図11

Description

本発明は、読み取り装置、読み取りプログラム及び読み取り方法に関する。
伝票等の同一フォームの書類を処理することがある。例えば、宅配業者は、荷物に付された伝票の住所に荷物を配達する。住人が不在の場合、宅配業者は、不在伝票を作成する際に伝票の名前や住所を手書きで書く必要が生じる。しかしながら、手書きで入力する作業は煩雑なだけでなく、誤入力により誤配送を招く恐れがある。
そこで、宅配業者は、リーダを用いて手書きの伝票から画像を読み込み、読み込んだ画像をデジタル化してコンピュータに転送することで大まかな住所を把握することが行われている。これにより、過去の配送情報や地図情報から届け先の大まかなエリアを特定することができる。
伝票に対してリーダが傾いていると読み込んだ画像が歪む。そこで、リーダで読み込んだ画像の歪みの程度を判断して、その歪みを補正した後の画像に対して文字認識をする技術が提案されている。例えば、サーバは、バーコードを検出すると、その歪みの状態とサイズに基づいて撮像した画像を正規化し、正規化した認識対象領域の画像を切り出して手書きした数字等をデータ化する技術が知られている(例えば、特許文献1参照)。
また、読み込んだ画像の歪みを補正する際、その補正量が増加すると、これに従い解像度が低下することが知られている(例えば、特許文献2参照)。
特開2002−304597号公報 特開2009−251542号公報
しかしながら、特許文献1では、画像の歪みを補正した後に所定領域の手書きの数字等をデータ化しても、画像の歪みが大きい場合には解像度の低下等により文字認識できないこととなり、画像の歪みを補正した処理が無駄になってしまう。
また、リーダで読み取った画像をリーダ側で文字認識せずに、リーダからコンピュータに送信して、コンピュータが受信した画像の文字認識を行う場合、文字認識処理以外に通信処理が発生する。よって、コンピュータ側で文字認識できたか否かの結果が出るまでに若干のタイムラグが生じる。この結果、例えば多数の伝票についてリーダで逐次読み込み、文字認識することを繰り返す処理では、一の伝票について文字認識できたか否かの結果が出る前に、次の伝票の読み取り動作に移っている場合がある。この場合、次の伝票の読み取り動作に移ってから、前の伝票の読み取りができなかったことが分かると、読み取り動作に手戻りが生じる。
リーダで読み取った画像をリーダ側で文字認識する場合、コンピュータに画像を送信する時間を省くことができる。しかし、リーダ側に文字認識処理が可能な処理能力の高い演算機能を持たせる必要が生じるため、画像の読み取りと画像の切り抜き程度の低機能のリーダを用いたシステムを構築できない。
そこで、1つの側面では、本発明は、歪み補正を行った後の画像について文字認識できるか否かを判断する場合よりも、画像が文字認識できないと判断するまでに要する時間を短くすることを目的とする。
1つの実施態様では、予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する判定部と、前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する制御部と、を有する読み取り装置が提供される。
1つの側面では、歪み補正を行った後の画像について文字認識できるか否かを判断する場合よりも、画像が文字認識できないと判断するまでに要する時間を短くすることができる。
一実施形態に係る読み取りシステムの全体構成の一例を示す図。 伝票の読み取り例を説明するための図。 一実施形態に係る読み取りシステムの全体構成の一例を示す図。 一実施形態に係るバーコードリーダ及びタブレット端末の機能構成の一例を示す図。 一実施形態に係るバーコードリーダ及びタブレット端末のハードウェア構成の一例を示す図。 一実施形態に係るバーコードリーダが垂直な場合の読み取り限界エリアの一例を示す図。 各角度及び焦点距離を説明するための図。 一実施形態に係るバーコードリーダが傾いた場合の読み取り限界エリア及び規定範囲算出の一例を示す図。 一実施形態に係るOCR認識と解像度の一例を示す図。 一実施形態に係る読み取り処理の一例を示すフローチャート。 一実施形態に係るOCR認識処理の一例を示すフローチャート。
以下、本発明の実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省く。
<はじめに>
物流や流通業務においては、高齢者等がタイプして伝票を作成することが困難な場合がある等の理由により伝票を完全に電子化することは難しく、マニュアル操作で手書きの文字をシステムに入力し、デジタルに変換しなければならない状況が生じる。そのため、手書きの伝票を電子化し、将来的には完全電子化に移行させ、マニュアル操作での煩雑な作業をなくすことが望まれる。
そこで、OCR(Optical character recognition)読取機能付きハンディターミナルといった高機能なOCR機器等を使用して、例えば図1の右側に示す流れで文字を認識する。
まず、OCR機器等は、撮像センサを使用して、射影変換などにより台形補正したバーコードBCの画像を撮影する。次に、OCR機器等は、読み取った画像をメモリに蓄積し、規定されたバーコードの寸法条件規則や、パターン画像マッチング等のバーコード認識エンジンにより画像処理、誤り検出及び誤り補正を行う。OCR機器等は、誤り補正後の画像を解読し、解読したバーコードデータの文字列を得る。
[読み取りシステムの全体構成]
本実施形態では、上記のような高機能なOCR機器等を使用せずに、図1に示すように、撮像センサ101による撮像機能を有する低機能のバーコードリーダ10とタブレット端末20とを使用して読み取りシステム1を構築する。この場合、低機能のバーコードリーダ10に、処理能力の高いOCR機器の機能、そのためのデータベース処理を行うことが可能な高機能MPU(Micro-processing unit)及び高速なデータ伝送が可能な通信モジュール等を実装することは困難である。また、そもそもバーコードリーダ10側でOCR処理を行うことが難しい。
これに対して、タブレット端末20がOCR処理を行う場合、通信処理によるタイムラグが大幅に発生する。具体的には、バーコードリーダ10からタブレット端末20にバーコードデータを転送し、タブレット端末20が転送されたバーコードデータをOCR処理して伝票の文字が認識できたかどうかを判定するような制御では、文字認識の結果がでるまでに時間を要する。その結果、文字認識できない場合、次の伝票の読み取り動作に入っていたとしても前の画像の読み取りができないために、次の伝票の読み取りに手戻りが発生することとなり、作業性が悪くなる。
例えば、OCR読取時に、画像認識ライブラリ(以下、「ライブラリ」という。)に記憶された画像と撮影した画像とをマッチングする技術では、様々な画像認識エンジンが存在するが、必要な文字認識精度を得るためには、最低限必要な解像度が要求される。最低限必要な解像度の一例としては、例えば1文字200dpi(dots per inch)が挙げられる。
手で持つバーコードリーダ10の場合、バーコードリーダ10を伝票に対して垂直状態に保ち、伝票と正対して読み込むことは少なく、バーコードリーダ10が傾いて、台形や斜めの歪み(以下、「台形歪み」ともいう。)が生じた画像が撮影される。タブレット端末20は、台形歪みの補正を実行した後の画像に対して画像認識エンジンにより画像のマッチング処理を行い、マッチングした画像を使用して伝票の文字認識を行う。
しかしながら、低機能のバーコードリーダ10は、低解像度の撮像センサ101を使用して画像を撮像する。タブレット端末20が、解像度の低い画像の台形歪みを補正すると更に画像が劣化するために認識率が低下し、伝票の文字が正しく認識されず、次の伝票の読み取りに手戻りが発生する結果となる。したがって、本実施形態に係る読み取りシステム1では、低機能のバーコードリーダ10又はタブレット端末20が、図1の右側に示すように、台形形状の補正を行った後の画像に対してマッチング処理を行い、文字を認識する手順では手戻りを防止することは困難である。
読み込み対象の伝票の一例を示す図2を用いてい具体的に説明する。各伝票には、バーコードBCが付与されている。また、伝票には、OCR処理により読み込むべき対象が表示された欄(以下、「OCR対象エリアRA」という。)が予め定められている。ここでは、伝票の郵便番号を記載する欄(OCR対象エリア1)、電話番号を記載する欄(OCR対象エリア2)をOCR対象エリアRAとしている。しかしながら、OCR対象エリアRAは、これに限らず、OCR認識対象となる文字等が書かれたエリアが指定される。本実施形態に係るOCR対象エリアRA内の画像は、文字認識すべき画像の一例であり、バーコードBCは、文字認識すべき画像に対応する特定の情報(マーク)の一例である。
なお、読み込み対象の書類は、伝票に限らず、所定のレイアウトの定型的な書類であればよく、バーコードBCに対するOCR対象エリアRAの相対位置は固定されている。また、バーコードBCは、読み込み対象の書類に予め付与された基準となるマークの一例であり、基準となるマークは、バーコードBCに限らず、QR(Quick Response)コードやその他の記号、文字、数字及びこれらの組み合わせであってもよい。この場合、マークは規定のサイズであり、書類毎にバラツキがなく、マークに対するOCR対象エリアRAの相対位置は固定である。
バーコードリーダ10が伝票に対して垂直状態にある場合、バーコードBC及びOCR対象エリアRAは、図2の右上の撮像画像の一例に示すように撮影され、OCR対象エリアRA内の数字は、図2の左下の読取OKの画像に示すように台形状や斜めに歪んでいない。この場合、ライブラリに記憶された画像とのマッチングにより、伝票の数値を正しく認識でき、次の伝票の読み取りに手戻りは発生しない。
一方、バーコードリーダ10が伝票に対して垂直状態でない場合、バーコードBC及びOCR対象エリアRAは、図2の中央下の読取NGの画像に示すように台形や斜めに歪む。この場合、台形歪みを補正すると画像の解像度が劣化するためにライブラリに記憶された画像とのマッチングにより認識される数値に誤りが生じ(図9(b)参照)、認識率が低下し、伝票の数値を正しく認識できないために次の伝票の読み取りに手戻りが発生する。
また、バーコードリーダ10が伝票に対して垂直状態にある場合であっても、図2の右下の読取NGの画像に示すように画像に欠けがある場合には、伝票の文字を正しく認識できず、次の伝票の読み取りに手戻りが発生する。
そこで、本実施形態に係る読み取りシステム1では、伝票の画像を読み取った段階で、バーコードリーダ10は、実際に台形歪みの補正を行うことなく、読み取った伝票の画像が、台形歪みを補正しても文字認識できない画像か否かを判断する。そして、台形歪みを補正しても文字認識できないようであれば、バーコードリーダ10は、文字認識を行う前の段階で伝票の再撮影を行う。これにより、台形歪みの補正を行った後の画像について文字認識できるか否かを判断する場合に比べて、撮像画像が文字認識できないと判断するまでに要する時間を短くすることができる。これにより、手戻りの発生を防止することができる。
また、本実施形態に係る読み取りシステム1では、バーコードリーダ10側でOCR処理、つまり、文字認識処理を行うことはないので、バーコードリーダ10側に処理能力の高い演算機能を持たせる必要がない。これにより、本実施形態では、低機能のバーコードリーダ10とタブレット端末20とを使用して読み取りシステム1を構築することができる。
図3に示すように、本実施形態に係る読み取りシステム1では、バーコードリーダ10に替えてカメラ機能を持つスマートフォン100やその他の携帯端末を使用することができる。この場合、スマートフォン100等に設けられたカメラ106が撮影したバーコードの画像が、タブレット端末20に転送される。本実施形態に係るバーコードリーダ10及びスマートフォン100は、読み取り装置の一例である。
また、本実施形態に係るタブレット端末20は、情報処理装置の一例である。情報処理装置の他の例としては、パーソナルコンピュータ及びPDA(Personal Digital Assistants)が挙げられる。情報処理装置は、HMD(Head Mount Display)、FMD(Face Mount Display)等のウェアラブル表示デバイスであってもよい。
以下では、カメラ106又はバーコードリーダ10の撮像センサ101の画角をαで示す。また、撮像されたバーコードBCの台形歪みを補正しても文字認識できない画像か否かの判断に使用するバーコードエリアをCAで示す。また、撮像センサ101の読み取りエリアをOAで示す。また、バーコードリーダ10の撮像センサ101から伝票までの焦点距離をDで示す。OCR対象エリアRA及び読み取りエリアOAは、規定の寸法である。バーコードエリアCAは、予め算出されている。バーコードエリアCAとOCR対象エリアRAとの相対位置関係は固定である。また、画角αは、撮像センサ101に固有の値を持つ。
[機能構成]
本実施形態に係る読み取りシステム1に含まれるバーコードリーダ10及びタブレット端末20の機能構成の一例について、図4を参照しながら説明する。バーコードリーダ10及びタブレット端末20は、Bluetooth(登録商標)等の無線ネットワークを介して接続される。なお、無線ネットワーク30に替えて有線ネットワークを利用しても良い。
(バーコードリーダの機能構成)
本実施形態に係るバーコードリーダ10は、撮像部11、画像処理部12、記憶部13、アラーム部14、通信部15、判定部16及び制御部17を有する。撮像部11は、センサ読取範囲OAの伝票を撮影し、画像処理部12及び判定部16は、伝票の撮像画像を読み込む。
判定部16は、記憶部13に記憶されたデータベース131を参照し、予め設定された規定範囲を示すバーコードエリアCAと、読み込んだ画像内のバーコードBCの座標データとを比較する。バーコードBCがバーコードエリアCA内である場合、制御部17は、画像が文字認識できる(画像の読取OK)と判定し、アラーム部14は、読取OKのアラームを通知する。これにより、バーコードリーダ10の使用者に画像の読取が成功したことを知らせることができる。通信部15は、読取OKとなった画像データとバーコードBCのデータを無線ネットワーク30を介してタブレット端末20に転送する。なお、通信部15は、撮像した画像データからOCR対象エリアRAの画像データとバーコードBCのデータとを分けて転送してもよいし、バーコードBCを含んだ撮像画像のデータをそのまま転送してもよい。
判定部16によりバーコードBCがバーコードエリアCA外である場合、制御部17は、画像が文字認識できない(画像の読取NG)と判定し、アラーム部14は、アラームを通知せず、次の画像データの撮像を指示する。通信部15は、読取NGとなった画像データをタブレット端末20に転送しない。これにより、文字認識できないと判定された、読取NGの画像は、文字認識の対象から除外される。
画像処理部12は、画像の明暗を制御する処理、伝票から転送すべき箇所の画像を切り抜く処理、画像の二値化処理等の処理を行う。画像処理部12は、OCR認識処理、その他の負荷が高い画像処理は行わない。
記憶部13は、予め設定された規定範囲(バーコードエリアCA)を保持するデータベース131と、読み取り処理プログラム132とを記憶する。読み取り処理プログラム132は、読み取り処理を実行するための手順が示されたプログラムである。
(タブレット端末の機能構成)
本実施形態に係るタブレット端末20は、通信部21、制御部22、記憶部23、アプリケーション実行部24、演算部25及びOCR認識部26を有する。通信部21は、バーコードリーダ10の通信部15から読取OKの画像データを受信する。読取OKの画像データには、バーコードBCのデータが含まれる。
制御部22は、バーコードBCのデータをアプリケーション実行部24に送り、それ以外の画像データをOCR認識部26に送る。OCR認識部26は、画像データのOCR認識を行い、画像データの文字、数字、記号等を認識する。具体的には、OCR認識部26は、画像認識エンジンを用いて、OCRデータベース231に記憶されたライブラリの画像と画像データとを比較及びマッチングすることで画像データの数値等を認識し、OCR認識結果であるOCRデータを得る。制御部22は、OCR認識部26からOCRデータを取得し、アプリケーション実行部24に引き渡す。
アプリケーション実行部24は、バーコードBCのデータ及びOCRデータに基づき所定のアプリケーションを実行する。例えば、アプリケーション実行部24は、OCR認識結果に示された、OCR対象エリアRAに記入された数値列から大まかな住所を所定のユーザに提供する。ただし、アプリケーション実行部24が提供するサービスは、これに限らない。
演算部25は、バーコードエリアCAを算出する。記憶部23は、OCRデータベース231と、規定範囲算出プログラム233とを記憶する。規定範囲算出プログラム233は、バーコードエリアCAを設定するための手順が示されたプログラムである。
[ハードウェア構成]
次に、本実施形態に係る読み取りシステム1に含まれるバーコードリーダ10及びタブレット端末20のハードウェア構成の一例について、図5を参照しながら説明する。
(バーコードリーダのHW構成)
本実施形態に係るバーコードリーダ10は、撮像センサ101、LED(Light emitting diode)102、MPU103、通信モジュール104及びRAM(Random Access Memory)105を有する。各部は、バスBで相互に接続されている。
撮像センサ101は、所定の焦点距離Dで画角αの範囲内の伝票を撮影する。なお、撮像部11の機能は、例えば、撮像センサ101により実現可能である。
LED102は、読取OKのアラームを通知する際に点灯したり、読取OKのアラームを通知する色に変わったりすることでアラームを出力する手段の一例である。読取OKのアラームの通知は、LED102による点灯や色の変化に限らず、バーコードリーダ10を振動させたり、バーコードリーダ10から所定の音を出力したり、これらを組み合わせたりしてもよい。なお、アラーム部14の機能は、例えば、LED102により実現可能である。
MPU103は、RAM105から、読み取り処理プログラム132を読み出し、読み取り処理を実行することで、撮像した画像が文字認識できるか否かを判定する。画像処理部12及び判定部16の機能は、例えば記憶部13にインストールされた読み取り処理プログラム132が、MPU103に実行させる処理により実現される。
通信モジュール104は、伝票の撮像画像(バーコードBC及び読取OKの画像)のデータを無線ネットワーク30を介してタブレット端末20に送信する。通信部15の機能は、例えば、通信モジュール104により実現可能である。
RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリである。記憶部13の機能は、例えば、RAM105により実現可能である。
(タブレット端末のHW構成)
本実施形態に係るタブレット端末20は、入力装置201、出力装置202、外部I/F203、RAM204、ROM(Read Only Memory)205、MPU206、通信モジュール207、及びHDD(Hard Disk Drive)208を有する。各部は、バスBで相互に接続されている。
入力装置201は、タッチパネルを含み、タブレット端末20のタッチ操作に応じた入力情報を入力する。出力装置202は、例えば、ディスプレイからOCR認識処理結果等を表示する。
通信モジュール207は、タブレット端末20を無線ネットワーク30に接続するインターフェースである。これにより、タブレット端末20は、通信モジュール207を介して、バーコードリーダ10とデータ通信を行うことができる。通信部21の機能は、例えば、通信モジュール207により実現可能である。
HDD208は、プログラムやデータを格納している不揮発性の記憶装置である。格納されるプログラムやデータには、タブレット端末20の全体を制御する基本ソフトウェア及びアプリケーションソフトウェアがある。例えば、HDD208には、各種のデータベースやプログラム等が格納されてもよい。
外部I/F203は、外部装置とのインターフェースである。外部装置には、記録媒体203aなどがある。これにより、タブレット端末20は、外部I/F203を介して記録媒体203aの読み取り及び/又は書き込みを行うことができる。記録媒体203aには、CD(Compact Disk)、及びDVD(Digital Versatile Disk)、ならびに、SDメモリカード(SD Memory card)やUSBメモリ(Universal Serial Bus memory)等がある。
ROM205は、電源を切っても内部データを保持することができる不揮発性の半導体メモリである。ROM205には、ネットワーク設定等のプログラム及びデータが格納されている。RAM204は、プログラムやデータを一時保持する揮発性の半導体メモリである。記憶部13の機能は、例えば、RAM204、ROM205、HDD208及びネットワークを介してタブレット端末20に接続されるクラウド上のサーバ等に格納され得る。
なお、図4は機能に着目したブロック図を描いており、これらの機能ブロックで示した各部のソフトウェアを実行するプロセッサは、図5に示したハードウェアである。
[バーコードエリアCA]
本実施形態では、撮像されたバーコードBCの画像を用いて、撮像画像の台形歪みの補正をしても文字認識できない画像か否かを判断する。以下では、この判断に使用するバーコードエリアCAの算出について説明する。
本実施形態では、予め規定されたレイアウトの伝票を撮影し、撮像画像にバーコードBCが含まれることを前提とし、バーコードBCのサイズ、種別、バーコードBCの位置からOCR対象エリアRAの座標が一義に決まることが条件となっている。
バーコードBCは、そのバーの長さが予め分かっているので、バーコードの手前部分と奥側部分の長さの差から、バーコードBCがどの程度傾いて撮影されたかを特定できる。そこで、本実施形態では、文字認識できるか否かを、その傾きが台形歪みを補正した場合に文字認識できる範囲の傾きの範囲(規定範囲)に収まっているか否かで、判断できる。
規定範囲を示すバーコードエリアCAは、タブレット端末20により予め算出される。算出されたバーコードエリアCAのデータは、バーコードリーダ10に送られ、データベース131に記憶される。本実施形態では、撮影されたバーコードBCがバーコードエリアCAに収まっている場合、撮像画像内のOCR対象エリアAの文字認識は可能であると判定される。撮影されたバーコードBCがバーコードエリアCAに収まっていない場合、撮像画像内のOCR対象エリアAの文字認識は不可能であると判定される。
図6(a)に示すように、バーコードリーダ10を垂直状態にし、規定された撮像センサ101の焦点距離がD、センサ画角がαであるとき、OCR対象エリアRAが撮像センサ101の読取エリア(以下、「センサ読取エリアOA」という。)外とならないバーコードエリアCAの座標は確定できる。
バーコードリーダ10が垂直状態に保持されていることを条件として、OCR対象エリアRAがセンサ読取エリアOA外とならないバーコードエリアを、以下、「水平配置限界のバーコードエリアCA’」という。水平配置限界のバーコードエリアCA’の一例としては、x座標の最小がx1、最大がx+(X−x2)、y座標の最小が0、最大がy+(Y−y7)により画定される領域が挙げられる。
図6(a)に示すようにバーコードリーダ10が焦点距離Dで垂直に配置された場合には、このようにして設定された水平配置限界のバーコードエリアCA’を用いて、撮像されたバーコードBCが、水平配置限界のバーコードエリアCA’内に納まっていれば、OCR対象エリアRAがセンサ読取エリアOA内に納まることになる。図6(b)の(0,0)−(X,Y)の範囲は、センサ読取エリアOAを示す。なお、OCR対象エリアRAの座標には、撮像センサ101の焦点距離Dによりセンサ読取エリアOAに対して水平距離のマージンm1、m2、m3、m4が求められる。
タブレット端末20により算出された水平配置限界のバーコードエリアCA’の座標に対して、焦点距離D以外にも、スキュー角、ピッチ角及びチルト角と、センサ解像度と、バーコード認識エンジンの特性によってバーコードエリアの最終の限界領域を示すバーコードエリアCAの座標が定まる。
図7には、バーコードエリアCAの座標を確定する一要因となるピッチ角、スキュー角、チルト角及び焦点距離が示されている。ピッチ角は、バーコードリーダ10の左右の傾きにより生じるバーコードの左右の傾きを示す。スキュー角は、バーコードリーダ10の前後の傾きにより生じるバーコードの前後の傾きを示す。チルト角は、バーコードリーダ10の撮像面に対する回転方向の傾きにより生じるバーコードの回転方向の傾きを示す。
図8は、バーコードリーダ10が傾いた場合のバーコードエリアCAの読み取り限界の算出例を示す。バーコードリーダ10が様々な方向に傾き、台形状や斜めに画像が撮像される場合、台形歪みが生じ、その歪を補正したときに解像度が低下する。その影響でバーコードエリアCAは、図6(b)に示した水平配置限界のバーコードエリアCA’よりも縮小する。
図8(a)は、バーコードリーダ10にピッチ角又はスキュー角の傾きが生じている場合の撮像画像のOCR対象エリアRAに書かれた1文字当たりの読み取り可能な解像度が、画像認識エンジンにより限定され、ピッチ角及びスキュー角のそれぞれの読取限界の範囲が定められる。
図9(a)に示すように、十分な解像度が得られている場合、タブレット端末20は、OCRデータベース231に記憶されたライブラリの画像とOCR対象エリアRA内の認識対象画像とのマッチングを行い、認識対象画像の文字認識を正しく行うことができる。ところが、図9(b)に示すように、台形歪みが生じた画像については、台形歪みの補正後の画像の1文字あたりの解像度が歪みの程度で著しく劣化する。このため、台形歪みの補正後の認識対象画像とライブラリの画像とのマッチングを行った場合、正しいマッチング候補だけでなく、誤認識の候補も一定確率で選出される可能性が高まっていく。画像認識エンジンや、認識のためのライブラリ、画像を二値化する際の閾値などによって必要とされる解像度が異なり、使用する画像認識エンジン等によって予め文字認識に必要な解像度は得られる。本実施形態では仮に200dpiとする。
図8(b)には、このようにして定められたピッチ角での読取限界の一例、スキュー角での読取限界の一例が示されている。同様にして、チルト角に対する配置限界から、図8(b)に示すチルト角での読取限界の範囲が確定される。その結果、ピッチ角、スキュー角及びチルト角のそれぞれの読取限界の条件を満たす領域が、最終的なバーコードエリアCAとなる。最終的なバーコードエリアCAは、水平配置限界のバーコードエリアCAに対して縮小されている。
最終的に規定されたバーコードエリアCAでは、画像の台形補正による解像度の劣化が画像認識エンジンの特性により規定されているため、バーコードエリアCAにバーコードBCが収まる画像であれば、OCR対象エリアRAの文字は認識可能であると判断できる。
加えて、OCR対象エリアRAがセンサエリアOA内に投影される焦点距離Dや画角αの条件は事前に算出でき、結果として図8(b)に示すように、すべての条件を満たすバーコードエリアCAの座標が定義可能となる。
このように、本実施形態では、当初の水平配置限界のバーコードCA’に対して、台形歪みの補正後の画像の解像度の低下を考慮して、ピッチ角、スキュー角及びチルト角のそれぞれの読取限界の条件を満たす領域を決定し、その領域をOCR対象領域RAの文字認識が可能なバーコードエリアCAとする。つまり、バーコードBCがバーコードエリアCA内に収まっていれば、文字認識が可能な解像度の画像であると判断できる。これに加えて、バーコードBCがバーコードエリアCA内に収まっていれば、画像の欠けも生じていない画像であると判断できる。
以上により定義したバーコードエリアCAを、予めバーコードリーダ10の記憶部13のデータベース131に記憶しておき、バーコードリーダ10が行う読み取り処理において使用する。バーコードエリアCAは、製品設計時や出荷時にデータベース131に記憶される。タブレット端末20に無線ネットワーク30を介して複数のバーコードリーダ10が接続される場合、バーコードリーダ10毎にバーコードエリアCAを算出し、各バーコードリーダ10のデータベース131に記憶することが好ましい。
[読み取り処理]
最後に、本実施形態に係る読み取り処理の一例について図10及び図11を参照して説明する。図10は、本実施形態に係る読み取り処理の一例を示したフローチャートである。図10の左側のフローは、バーコードリーダ10の動作を示し、右側のフローは、タブレット端末20の動作を示す。図11は、図10のステップS44にて呼び出されるOCR認識処理の一例を示したフローチャートである。
図10の読み取り処理は、タブレット端末20で動作するアプリケーション上で撮像した画像データの待機処理が開始している状態において、バーコードリーダ10のトリガーダウンやタブレット端末20からの指示により開始される。
まず、バーコードリーダ10の撮像部11は、スキャン処理を実行する(ステップS20)。撮像部11は、バーコードエリアCAとOCR対象エリアRAを包含するセンサ読取エリアOAを撮像する。
次に、撮像部11は、バーコードBCの読取に成功か否かを判定する(ステップS22)。撮像部11は、バーコードBCの読取に失敗したと判定した場合、ステップS20に戻り、スキャン処理を繰り返す。
一方、撮像部11が、バーコードBCの読取に成功したと判定した場合、画像処理部12は、バーコードデータの解析処理を実行する(ステップS24)。次に、判定部16は、バーコードBCが、バーコードエリアCA(規定範囲)内の座標にあるか否かを判定する(ステップS26)。
判定部16が、バーコードBCがバーコードエリアCA内の座標にあると判定した場合、アラーム部14は、読取OKを示す処理を実行する(ステップS28)。読取OKを示す処理の一例としては、音や光や振動の出力によるアラームの通知が挙げられる。これにより、バーコードリーダ10の使用者に音や振動などで伝票の画像データ及びバーコードデータを転送したことを通知することができる。
アラームを通知した後、通信部15は、タブレット端末20へ伝票の画像データ及びバーコードデータの転送を行い(ステップS30)、本処理を終了する。
一方、ステップS22において、判定部16が、バーコードBCがバーコードエリアCA(規定範囲)内の座標にないと判定した場合、制御部17は、アラーム等の通知処理を行わず直ちにステップS20に戻り、撮像部11は、次のスキャン処理を実行する(ステップS20)。
なお、画像処理部12は、バーコードリーダ10及びタブレット端末20間の通信速度が遅いことを考慮して、撮像した画像データのうち、バーコードデータ及びOCR対象エリアRAの画像データのみを切り出してタブレット端末20に転送してもよい。これにより、撮像センサ101が撮影した全ての画像を転送するよりも転送時間を短縮することが可能となる。
タブレット端末20では、通信部21が、バーコードデータ及び画像データを受信する(ステップS42)。次に、制御部22は、OCR認識処理を実行する(ステップS44)。次に、制御部22は、アプリケーション実行部24が実行するアプリケーションに、認識対象画像の認識結果を示すOCRデータを受け渡し、所定のアプリケーションを実行させ、本処理を終了する。
ステップS44にて呼び出されるOCR認識処理では、図11に示すように、制御部22が、受信した画像データの台形歪みを補正し(ステップS441)、補正後のOCR対象エリアRAの認証対象画像とOCRデータベース231内のライブラリの画像とのマッチングを行う(ステップS442)。制御部22は、マッチングにより認識対象画像に含まれる文字や数字を認識し(ステップS443)、本処理を終了する。
以上に説明したように、本実施形態に係る読み取り処理では、バーコードリーダ10が、伝票を読み取った段階で、その読み取った伝票の画像が、画像データの台形歪みを補正しても文字認識できない画像か否かを判断する。
文字認識できるか否かは、読み取った画像が、予め規定した、台形歪み補正した場合に文字認識できる規定範囲内に収まっているか否かで判断される。読み取った画像が規定範囲内に収まっている場合、読み取った画像は、OCR処理時に文字認識が可能な解像度が確保され、かつ、読み取った画像に欠けは生じていないと判定できる。一方、読み取った画像が規定範囲内に収まっていない場合、読み取った画像は、OCR処理時に台形歪みを補正しても文字認識が可能な解像度が確保されていない、又は、読み取った画像に欠けが生じていると判定できる。
このようにして読み取った画像が、台形歪みを補正しても文字認識できない又は画像に欠けがあると判定された場合には、文字認識を行う前に、その段階で伝票の再撮影を指示する。これにより、手戻りを防止できる。この結果、本実施形態に係る読み取りシステム1によれば、撮像した画像データの台形歪み補正をしてから文字認識の処理を行い、文字認識できるか否かを判断する場合に比べて、画像データが文字認識できないと判断するまでに要する時間を短くすることができる。
また、本実施形態に係る読み取りシステム1では、バーコードリーダ10側でOCR認識処理を行わないため、バーコードリーダ10側に処理能力の高い演算機能を持たせる必要がない。これにより、本実施形態では、低機能のバーコードリーダ10とタブレット端末20とを使用して読み取りシステム1を構築することができる。
バーコードリーダ10は、撮像した画像データを画像処理し、バーコードBCの座標を認識する。本実施形態では、バーコードスキャン時の位置及び角度に応じた台形歪みの程度からOCR認識可能な1文字あたりの特定解像度が確保できるバーコードエリアCA(規定範囲)が予め設定されている。これにより、バーコードリーダ10は、バーコードエリアCAにバーコードBCの座標が収まっているかを判断するだけで、撮像画像に対する台形歪みの補正をすることなく、OCR対象エリアRAの文字等が認識可能か否かを判定することができる。
バーコードリーダ10は、OCR対象エリアRAの文字等が認識可能と判定した場合、画像データ及びバーコードデータの転送を、バーコードリーダ10の使用者にアラームにより通知する。これにより、バーコードリーダ10を使う使用者は、伝票がOCR認識できているかどうかを意識する必要なく、バーコードBCを読んでいるという感覚でありながら、タブレット端末20側でより正確にOCR認識させることが可能なデータのみを転送できる。このようにして、低機能で比較的安価なバーコードリーダ10と、汎用性のある比較的安価なタブレット端末20を用いてOCR認識処理によるデジタル化を推進することができる。
以上、読み取り装置、読み取りプログラム及び読み取り方法を上記実施形態により説明したが、本発明に係る読み取り装置、読み取りプログラム及び読み取り方法は上記実施形態に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能である。また、上記実施形態及び変形例が複数存在する場合、矛盾しない範囲で組み合わせることができる。
例えば、上記実施形態に係る読み取りシステム1の構成は一例であり、本発明の範囲を限定するものではなく、用途や目的に応じて様々なシステム構成例があることは言うまでもない。例えば、複数のバーコードリーダ10がタブレット端末20に接続されていてもよい。また、複数台のタブレット端末20でOCR認識処理を分散処理してもよい。また、用途や目的に応じて、複数台のうち1台のタブレット端末20に選択的にOCR認識処理機能を集約させてもよい。
以上の説明に関し、更に以下の項を開示する。
(付記1)
予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する判定部と、
前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する制御部と、
を有する読み取り装置。
(付記2)
前記判定部は、前記画像の解像度及び前記画像の欠けに基づき設定された規定範囲を参照して、前記文字認識すべき画像の歪みの程度を判定する、
付記1に記載の読み取り装置。
(付記3)
前記判定部は、前記文字認識すべき画像に対応する特定の情報が、前記規定範囲内に表示されていない場合、前記画像の歪みを補正しても前記画像が文字認識できないと判定する、
付記1又は2に記載の読み取り装置。
(付記4)
予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する処理と、
前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する処理と、
をコンピュータに実行させるための読み取りプログラム。
(付記5)
前記判定する処理は、前記画像の解像度及び前記画像の欠けに基づき設定された規定範囲を参照して、前記文字認識すべき画像の歪みの程度を判定する、
付記4に記載の読み取りプログラム。
(付記6)
前記判定する処理は、前記文字認識すべき画像に対応する特定の情報が、前記規定範囲内に表示されていない場合、前記画像の歪みを補正しても前記画像が文字認識できないと判定する、
付記4又は5に記載の読み取りプログラム。
(付記7)
予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定し、
前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する、
ことをコンピュータが実行する読み取り方法。
(付記8)
前記判定する処理は、前記画像の解像度及び前記画像の欠けに基づき設定された規定範囲を参照して、前記文字認識すべき画像の歪みの程度を判定する、
付記7に記載の読み取り方法。
(付記9)
前記判定する処理は、前記文字認識すべき画像に対応する特定の情報が、前記規定範囲内に表示されていない場合、前記画像の歪みを補正しても前記画像が文字認識できないと判定する、
付記7又は8に記載の読み取り方法。
1 読み取りシステム
10 バーコードリーダ
11 撮像部
12 画像処理部
13 記憶部
14 アラーム部
15 通信部
16 判定部
20 タブレット端末
21 通信部
22 制御部
23 記憶部
24 アプリケーション実行部
25 演算部
26 OCR認識部
101 カメラ
102 LED
103 MPU
104 通信モジュール
105 RAM
131 データベース
132 読み取り処理プログラム
201 入力装置
202 出力装置
203 外部I/F
204 RAM
205 ROM
206 MPU
207 通信モジュール
208 HDD
231 OCRデータベース
233 規定範囲算出プログラム
BC バーコード
CA バーコードエリア
RA OCR対象エリア
OA センサの読み取りエリア
α センサー画角
D 焦点距離

Claims (5)

  1. 予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する判定部と、
    前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する制御部と、
    を有する読み取り装置。
  2. 前記判定部は、前記画像の解像度及び前記画像の欠けに基づき設定された規定範囲を参照して、前記文字認識すべき画像の歪みの程度を判定する、
    請求項1に記載の読み取り装置。
  3. 前記判定部は、前記文字認識すべき画像に対応する特定の情報が、前記規定範囲内に表示されていない場合、前記画像の歪みを補正しても前記画像が文字認識できないと判定する、
    請求項1又は2に記載の読み取り装置。
  4. 予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定する処理と、
    前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する処理と、
    をコンピュータに実行させるための読み取りプログラム。
  5. 予め設定された規定範囲を記憶した記憶部を参照して、文字認識すべき画像の歪みの程度を判定し、前記画像の歪みを補正しても前記画像が文字認識できないかを判定し、
    前記文字認識できないと判定した場合、前記画像を文字認識の対象から除外する、
    ことをコンピュータが実行する読み取り方法。
JP2016233415A 2016-11-30 2016-11-30 読み取り装置、読み取りプログラム及び読み取り方法 Pending JP2018092270A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016233415A JP2018092270A (ja) 2016-11-30 2016-11-30 読み取り装置、読み取りプログラム及び読み取り方法
PCT/JP2017/040390 WO2018101000A1 (ja) 2016-11-30 2017-11-09 読み取り装置、読み取りプログラム及び読み取り方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016233415A JP2018092270A (ja) 2016-11-30 2016-11-30 読み取り装置、読み取りプログラム及び読み取り方法

Publications (1)

Publication Number Publication Date
JP2018092270A true JP2018092270A (ja) 2018-06-14

Family

ID=62242420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016233415A Pending JP2018092270A (ja) 2016-11-30 2016-11-30 読み取り装置、読み取りプログラム及び読み取り方法

Country Status (2)

Country Link
JP (1) JP2018092270A (ja)
WO (1) WO2018101000A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020030646A (ja) * 2018-08-23 2020-02-27 カシオ計算機株式会社 携帯端末装置、情報記録方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021190900A (ja) * 2020-06-01 2021-12-13 キヤノン株式会社 画像読取装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002304597A (ja) * 2001-04-04 2002-10-18 Sakana Ryutsu Net:Kk 梱包箱に記入された手書き数値情報の認識方式
JP2006229685A (ja) * 2005-02-18 2006-08-31 Oki Electric Ind Co Ltd 帳票歪み判定装置
JP4670657B2 (ja) * 2006-01-24 2011-04-13 富士ゼロックス株式会社 画像処理装置、画像処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020030646A (ja) * 2018-08-23 2020-02-27 カシオ計算機株式会社 携帯端末装置、情報記録方法、及びプログラム

Also Published As

Publication number Publication date
WO2018101000A1 (ja) 2018-06-07

Similar Documents

Publication Publication Date Title
US8289403B2 (en) Image processing system
US9100576B2 (en) Camera positioning tool for symbology reading
US8881986B1 (en) Decoding machine-readable code
US9076242B2 (en) Automatic correction of skew in natural images and video
US20050082370A1 (en) System and method for decoding barcodes using digital imaging techniques
JP2017187988A (ja) コード認識装置
JP2011130439A (ja) 画像比較および文書認証のための画像位置合わせの方法
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
WO2011129113A1 (ja) 帳票処理装置及び帳票処理方法及び記録媒体
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
US8903201B2 (en) Method and apparatus for enhanced document capture
WO2018101000A1 (ja) 読み取り装置、読み取りプログラム及び読み取り方法
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
JP2008234291A (ja) 文字認識装置及び文字認識方法
US10834281B2 (en) Document size detecting by matching between image of entire document and read size image
JP5720623B2 (ja) 二次元コード読取装置
US20140226020A1 (en) Image processor, non-transitory computer readable medium and object matching device
JP6507865B2 (ja) 情報処理装置、画像形成システム、画像形成装置
JP6098386B2 (ja) プロジェクタ
US20170344517A1 (en) Information processing apparatus and program
JP2007299098A (ja) Qrコード読取装置
JP2020107039A (ja) 画像処理装置、読取装置、および、コンピュータプログラム
US9661179B2 (en) Image processing device, information processing method, and non-transitory computer-readable medium
JP6310314B2 (ja) 携帯型光学式読取装置、該携帯型光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム
JP2006106906A (ja) 文字読取装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180706

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180717

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180907