JP2017220266A - 帳票読取装置、プログラムおよび帳票読取方法 - Google Patents

帳票読取装置、プログラムおよび帳票読取方法 Download PDF

Info

Publication number
JP2017220266A
JP2017220266A JP2017181269A JP2017181269A JP2017220266A JP 2017220266 A JP2017220266 A JP 2017220266A JP 2017181269 A JP2017181269 A JP 2017181269A JP 2017181269 A JP2017181269 A JP 2017181269A JP 2017220266 A JP2017220266 A JP 2017220266A
Authority
JP
Japan
Prior art keywords
item name
image
character
item
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017181269A
Other languages
English (en)
Inventor
義正 岩田
Yoshimasa Iwata
義正 岩田
明弘 宇田
Akihiro Uda
明弘 宇田
康裕 中島
Yasuhiro Nakajima
康裕 中島
石川 幸弘
Yukihiro Ishikawa
幸弘 石川
信輔 櫻木
Shinsuke Sakuragi
信輔 櫻木
麻衣 北村
Mai Kitamura
麻衣 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2017181269A priority Critical patent/JP2017220266A/ja
Publication of JP2017220266A publication Critical patent/JP2017220266A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】帳票の読取情報の定義を容易に行う。
【解決手段】実施形態の帳票読取装置は、画面制御部、項目定義情報記憶部、文字認識部を備える。画面制御部は帳票の画像と、帳票の画像から読み取るべき文字の項目名の中からユーザが所望の項目名を指定するための複数の項目名指定部と、複数の項目名指定部に対応して設けられた複数の表示欄とを有する画面を出力する。項目定義情報記憶部には項目名毎に、エリアから読み取るべき文字データの文字種、文字数を含む定義情報が記憶されている。文字認識部は画面の複数の項目名指定部の中から所望の項目名指定部が指定され、帳票の画像から読取対象のエリアが指定された場合、定義情報に基づいて、指定されたエリアから切り出した画像部分を文字認識し、得られた前記文字認識結果の文字データを前記項目名指定部に対応する前記表示欄に表示する。
【選択図】図1

Description

本発明の実施形態は、帳票の画像から文字を読み取る帳票読取装置、プログラムおよび帳票読取方法に関する。
例えばコンピュータなどの帳票読取装置では、デジタルカメラなどの光学式の読取装置で取得した帳票の画像(デジタル写真など)を、文字認識アプリケーションソフトウェア(以下「OCRソフト」と称す)を利用して文字認識する技術が知られている。
読取り対象の帳票が例えば複数枚からなる契約書類などの場合、各ページ毎に独自の項目の配置が採用されており、同じ項目名を用いているといえども配置が異なるため、帳票読取装置には事前に各ページを読み取る(文字認識する)ための帳票の定義情報(読取情報の定義)をページ毎に定義しておく必要がある。帳票の定義情報とは、例えば認識項目名、その項目名に対応する読取り位置の座標(x座標,y座標)、サイズ、文字種、文字数などである。
また帳票読取装置に新たな帳票を読み取らせる場合には、上記読取情報の定義をすべての文字認識対象の項目名について手入力および設定する必要がある。このため、帳票読み取りのための事前準備に多大な時間と労力が必要であった。
特開2005−216102号公報
このように従来の帳票読取装置の場合、読取り対象の帳票1ページ毎に、認識項目名に対応する座標、サイズ、文字種、文字数などを一々手入力し帳票を読み取るための読取情報を事前に設定しておく必要がある。また複数枚綴りの帳票の場合、同じ項目名を読み取ることも多く、一度読み取った情報を再度読み取るのは効率的ではない。
本発明が解決しようとする課題は、帳票を読み取るための事前の準備が容易で、かつ帳票の情報のうち所望の箇所を読み取ることができる帳票読取装置、プログラムおよび帳票読取方法を提供することにある。
実施形態の帳票読取装置は、帳票を光学的に読み取って得られた帳票の画像から文字を読み取る帳票読取装置であり、画面制御部、項目定義情報記憶部、文字認識部を備える。画面制御部は前記帳票の画像と、前記帳票の画像から読み取るべき文字の項目名の中からユーザが所望の項目名を指定するための複数の項目名指定部と、前記複数の項目名指定部に対応して設けられた複数の表示欄とを有する画面を出力する。項目定義情報記憶部には項目名毎に、前記エリアから読み取るべき文字データの文字種、文字数を含む定義情報が記憶されている。文字認識部は前記画面の複数の項目名指定部の中から所望の項目名指定部が指定され、前記帳票の画像から読取対象のエリアが指定された場合、前記項目定義情報記憶部の定義情報に基づいて、指定された前記エリアから切り出した画像部分を文字認識し、得られた前記文字認識結果の文字データを前記項目名指定部に対応する前記表示欄に表示する。
第1実施形態の帳票読取システムの構成を示す図である。 帳票読取システムのタブレットの構成を示す図である。 帳票画像DBの内容を示す図である。 エントリ項目定義体DBの内容を示す図である。 文字種辞書DBの内容を示す図である。 エントリ情報DBの内容を示す図である。 帳票画像を表示したエントリ画面の一例を示す図である。 第1実施形態の帳票読取システム全体の動作を示すフローチャートである。 画像取得部の動作を示すフローチャートである。 画面制御部の動作を示すフローチャートである。 読取エリアの指定方法の一例を示す図である。 文字認識部の動作を示すフローチャートである。 エントリ情報更新部の動作を示すフローチャートである。 第2実施形態の帳票読取システムの構成を示す図である。 第2実施形態の帳票読取システムの動作を示す図である。 画像取得部の他の構成例を示す図である。 第4実施形態の帳票読取システムの構成を示す図である。 第4実施形態のタブレットの構成を示す図である。 第4実施形態の文字認識依頼部、文字認識確定部の動作を示すフローチャートである。 読取エリアの指定方法の他の例を示す図である。
以下、図面を参照して実施形態を詳細に説明する。図1は第1実施形態の帳票読取システムの構成を示すブロック図である。
(第1実施形態)
図1に示すように、この第1実施形態の帳票読取システムは、電子機器または携帯端末としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8とを備える。外部システム8は例えばサーバコンピュータなどである。
タブレット端末1は画像取得部としてのカメラ部2、タッチパネル3、CPU4、メモリ5、通信インターフェース6(以下「通信I/F6」と称す)などを備える。
このタブレット端末1ではメモリ5に記憶されているソフトウェアをCPU4が読み出し、そのソフトウェアの処理を実行することで、タブレット端末1が、帳票を読み取る帳票読取装置として機能する。
カメラ部2は例えばCCDカメラなどであり、読取り対象の帳票、例えば帳票Aの帳票イメージ(帳票画像)を撮像、つまり光学的に読み取り、読み取った帳票画像をメモリ5に記憶する。撮像部としては、この端末1に内蔵されたカメラ部2の他、例えば外部接続したCCDセンサなどを備えたデジタルカメラなどであってもよい。
タッチパネル3は情報の表示機能と入力機能の2つの機能を備えており、カメラ部2で撮像した帳票画像を液晶画面に表示すると共に、操作者が液晶画面に表示された画像(絵や写真など)の点または領域に手で触れて操作(タッチ操作)することにより、触れられた画面位置の情報を感知して操作情報(信号)として出力する。すなわちタッチパネル3はカメラ部2により撮像された帳票画像71(図3,図7参照)を表示することが可能であり、タッチ操作が可能なものである。
メモリ5には、帳票画像データベース12(以下「帳票画像DB12」と称す)、エントリ項目定義体データベース(エントリ項目定義体DB41(図4参照)、文字種辞書データベース(文字種辞書DB42(図5参照))などの記憶領域が設定されている。
帳票画像DB12には、カメラ部2により取得された帳票画像71が記憶される(詳細は後述する)。またメモリ5にはエントリ項目定義体DB41および文字種辞書DB42が記憶されている。エントリ項目定義体DB41は文字認識用の定義情報である。文字種辞書DB42は帳票ID毎またはエントリ項目毎に設定されている文字種の辞書である。メモリ5は各部により帳票画像の処理が行われる際の作業領域として機能する。通信I/F6はネットワーク7を通じて外部システム8と通信する。
CPU4は帳票画像71とこの帳票画像71から読み取るべき文字の項目名72と各項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図7参照)をタッチパネル3に表示する画面制御部として機能する。
またCPU4はエントリ画面70に対するタッチ操作により、オペレータにより所望の項目名を指定するタップ操作とこの項目名に対応する読取り対象のエリアが指定された場合、指定されたエリアを文字認識し、得られた文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5に記憶すると共に、文字データを認識結果の表示欄73に表示する文字認識部として機能する。
この帳票読取システムの機能としては、図2に示すように、画像取得部10、画面制御部20、文字認識部40、エントリ情報更新部50などを有する。
画像取得部10はカメラ部2、帳票画像書込部11、帳票画像記憶部としての帳票画像データベース12(以下「帳票画像DB12」と称す)を有する。カメラ部2は帳票Aを光学的に読み取って帳票の画像を取得する。帳票画像書込部11はカメラ部2により取得された帳票画像71を取得し帳票画像DB12に記憶する(書き込む)。各DBはメモリ5の記憶領域に構築される。すなわち画像取得部10はカメラ部2により取得された帳票画像71をメモリ5に記憶する。
図3に示すように、帳票画像DB12には、帳票画像71毎のIDと各IDに対応したバイナリデータ(画像データまたはイメージデータなどともいう)とが記憶される。
画面制御部20は帳票画像読出部21、画面生成部22、OCR対象帳票受付部23、OCR対象エントリ項目受付部24、OCR対象エントリ項目エリア受付部25を有する。
OCRとはオプチカル・キャラクタ・レコグニション(光学文字認識)またはオプチカル・キャラクタ・リーダ(光学式文字読取装置)の略称であり、ここでは前者を指す。
画面制御部20は帳票画像71の表示欄と帳票画像71から読み取るべき文字のエントリ項目の項目名72の表示欄とこの項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図7参照)をタッチパネル3に表示(出力)する。
画面制御部20は帳票画像71の所望の位置がタップ操作により指定されることで、その指定位置に存在する読取対象の文字画像を囲む枠線80(図11参照)を表示し、枠線80内を認識対象のエリアとして特定する。この他、帳票画像71の所望のエリアがスライド操作により始点と終点が指定されることで、読取対象の文字画像を囲む枠線80を表示し、枠線80内を認識対象のエリアとしてもよい。
帳票画像読出部21は帳票画像DB12に記憶されている帳票画像71を読み出し画面生成部22へ渡し、エントリ画面70に帳票画像71を表示させる。
画面生成部22はエントリ画面70を生成および表示し、帳票画像読出部21から渡された帳票画像71のサムネイル一覧と、サムネイル一覧の中から指定されたサムネイルの帳票画像71をエントリ画面70に表示する。
また画面生成部22は入力された帳票IDをキーワードにしてエントリ項目定義体DB41を参照して処理対象の帳票Aのエントリ項目を抽出しエントリ画面70内の左端にエントリ項目一覧を縦に表示する。
なおこの例では、帳票Aに紐付けたエントリ項目を抽出したが、エントリ項目をバッチ単位で抽出してもよく、本実施形態はエントリ項目を抽出の仕方に限定されるものではない。
OCR対象帳票受付部23はエントリ画面70に表示された帳票画像71のサムネイルのうち、タップ(選択または指定)されたサムネイルの帳票画像71を読取処理対象の画像としてエントリ画面70全体に表示する。
OCR対象エントリ項目受付部24はエントリ画面70に表示されたエントリ項目一覧のうち例えばチェックボックスのような選択できる方法で(以下、「チェックボックス」と称する)項目名72をタップ(選択または指定)されたエントリ項目をアクティブにする。
OCR対象エントリ項目エリア受付部25はエントリ項目をタップした後に帳票画像71に対して行われたタップ操作を検出し、そのタップ位置から文字認識対象エリアを特定する。文字認識対象エリアを特定には、いくつかの方法があるが、一例として、タップされた1点から横方向に一定の範囲(矩形の範囲)にある画像を文字認識対象とする。
文字認識部40は文字認識部としてのOCRエンジン44、認識結果記憶部43、ベリファイ部45、エントリ項目定義体DB41、文字種辞書DB42を有する。
OCRエンジン44はエントリ画面70に対するタッチ操作により、所望のエントリ項目の項目名とこの項目名に対応する読取り対象のエリアが指定された場合、指定されたエリアの画像部分を文字認識し、得られた文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5(認識結果記憶部43)に記憶すると共に、認識結果の文字データを表示欄73に表示する。
認識結果記憶部43には認識結果の文字データと読み取りの際に帳票画像から切り出した文字画像と読取り範囲の位置情報とが対応して認識結果として記憶される。
ベリファイ部45は認識結果記憶部43に記憶された認識結果の文字データに対するベリファイ処理を行う。具体的には、ベリファイ部45は読み取り対象エリアに印字されているべき文字数(予め設定されている文字数)と実際に認識された認識結果の文字数とを比較し一致するか否かをチェックする。文字数の他、文字種に対しても行う。文字種のベリファイ処理だけを行ってもよい。
すなわちベリファイ部45は文字認識した結果として得られた文字データの文字種および/または文字数を、予め設定された項目毎の文字種および/または文字数と比較し、不一致の場合、アラートを出力する。
図4に示すように、エントリ項目定義体DB41には、項目名、定義情報(文字種)、定義情報(文字数)などが対応付けて記憶されている。項目名は、例えば「氏名」、「住所」、「電話番号」…など、定義情報(文字種)は、例えば「かな」、「漢字」など、定義情報(文字数)は「20」、「50」、「10」などの数値が設定されている。この他、定義情報としては文字のサイズなども設定されている。
つまりエントリ項目定義体DB41には、各エントリ項目に対応する定義情報が記憶されている。定義情報は例えば認識対象の項目名、その項目名に対応する読取エリア(読取位置)に記載されているべき文字のサイズ、文字種、文字数などである。
図5に示すように、文字種辞書DB42には、複数の文字種の異なる辞書を識別するためのID、タイプ、ルールが対応付けて記憶されている。IDとしては、例えば「1」,「2」などの数値、タイプとしては「かな」、「英語」など、ルールとしては、「かな」であれば「あいうえお…」、「英語」であれば「abcdef…」などが設定されている。
すなわち文字種辞書DB42には、項目毎に記載されているべき文字の文字種の辞書が記憶されており、文字認識の際にOCRエンジン44により使用される。OCRエンジン44はエントリ項目定義体DB41から得た文字種に紐付く辞書を文字種辞書DB42から読み出す。
エントリ情報更新部50はエントリ情報DB51、エントリ情報書込部52、エントリ情報送信部53を有する。
図6に示すように、エントリ情報DB51には、項目名、認識結果、帳票ID、座標などが対応付けて記憶されている。項目名は、例えば「氏名」、「住所」、「電話番号」…など、認識結果は、「氏名」であれば「○×太郎」、「住所」であれば「東京都XX市XX町1−1−1」、「電話番号」であれば「0123456789」などである。
座標は、読取対象のエリアを2次元的に示す矩形の頂点の4つのポイントのx座標,y座標が一対で記憶されている。
すなわちエントリ情報DB51には、項目名と、認識結果記憶部43の認識結果と、OCR対象帳票受付部23によって受け付けられた帳票に紐付く帳票IDと、OCR対象エントリ項目エリア受付部25によって受け付けられたエリア情報(x座標,y座標)が記憶される。
エントリ情報書込部52は認識結果記憶部43より認識結果を読み出してエントリ情報DB51に書き込む。エントリ情報送信部53はエントリ情報DB51に記憶されている情報を、ネットワーク7を通じて外部システム8へ送信する。
図7に示すように、エントリ画面70には、文字読取対象の帳票画像71が画面全体に表示される他、この帳票画像71から読み取るべき文字の項目名72と各項目名72のチェックボックスと各項目名72に対応する認識結果の表示欄73とが画面左側に表示される。この例では、読み取るべき文字の項目名72として、例えばID、氏名、住所、電話番号、生年月日などを例示している。
続いて、図8乃至図14を参照してこの第1実施形態の帳票読取システムの動作を説明する。まず、図8のフローチャートを参照してこの帳票読取システムの全体的な動作(概要動作)を説明する。
この帳票読取システムの場合、オペレータがタブレット端末1の電源を入れて文字読取用のプログラムである文字認識アプリケーションソフトウェアを起動すると、タッチパネル3にエントリ画面70が表示される。
続いて、オペレータは、紙の帳票Aを電子データ化するために、エントリ画面70の帳票取り込み釦(図示せず)を操作すると、画像取得部10は、カメラ部2を起動し、エントリ画面70をカメラ撮像用のモニタ画面にする。
オペレータがモニタ画面をみながら、モニタ画面内に処理対象の帳票Aを入れて撮影すると(図8のステップS101)、カメラ部2は撮像した帳票画像71を帳票画像書込部11に出力する。帳票画像書込部11は撮影された帳票画像71を帳票画像DB12に書き込む。帳票画像71は撮影された枚数分、つまり1枚以上取り込まれる。帳票Aの撮影を終了した後、モニタ画面を閉じると、エントリ画面70になる。
ここで、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、画面制御部20は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み込み、エントリ画面70に帳票画像71のサムネイルを表示し、メッセージなどを表示して選択を促す。
ここで、オペレータがエントリ画面70のサムネイルの中から所望のサムネイルを選択すると(ステップS102)、指定されたサムネイルに対応する文字認識対象の帳票画像71がエントリ画面70全体に操作用として表示される(図7参照)。
ここで、オペレータがエントリ画面70の項目名のチェックボックス72を指で選択し、続いて帳票画像71のOCR箇所を指定すると、画面制御部20は、その指定されたOCR箇所を受け付け(ステップS103)、そのOCR箇所にある文字画像を読取対象として特定する。
OCRエンジン44は、特定された文字画像を切り出し、エントリ項目定義体DB41からエントリ項目定義体と、文字種辞書DB42から文字種の辞書を読み出して、これらを参照して文字認識し(ステップS104)、認識結果の文字データを認識結果記憶部43に記憶するとともに表示欄73に表示する。
エントリ画面70の表示欄73に表示された文字データをオペレータが確認し、誤読していれば、表示欄73の文字データを修正し、修正不要であれば、次の項目名のチェックボックス72をタップする。
この操作(動作)を繰り返して、オペレータとして所望の項目の文字データが得られた後、オペレータがエントリ画面70のエントリ釦(図示せず)をタップすると、エントリ情報更新部50が認識結果を認識結果記憶部43から取り込んで一定のエントリ形式の情報に変換してエントリ情報DB51の内容を更新した後(ステップS105)、外部システム8へ送信する。この外部システム8では、例えば複数のタブレット端末1から送信されてきたエントリ情報を収集し、顧客情報管理システム等に取り込むなどの処理を行う。
次に各部の詳細な動作を説明する。まず図9を参照して画像取得部10の動作を説明する。この場合、帳票Aをカメラ部2が撮影し(ステップS201)、撮影された帳票画像71が帳票画像書込部11により帳票画像DB12へ書き込まれる(ステップS202)。
対象となる全ての帳票、例えば帳票A以外に帳票B、帳票Cなどを撮影し終えると(ステップS203のYes)、処理を終了し、対象となる全ての帳票を撮影し終えていなければ(ステップS203のNo)、ステップS201に戻り、処理を繰り返す。
続いて、図10を参照して画面制御部20の動作を説明する。この場合、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、帳票画像読出部21は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み出し(ステップS301)、タッチパネル3のエントリ画面70に帳票画像71のサムネイル一覧を表示する(ステップS302)。
ここで、オペレータがエントリ画面70のサムネイル一覧の中から所望のサムネイルを選んで、タッチパネル3をタップ操作(サムネイルを指定)すると、OCR対象帳票受付部23はサムネイルの指定を受け付け(ステップS303)、指定されたサムネイルに対応する帳票画像71をOCR対象として確定し(ステップS304)、エントリ画面70ほぼ全体に操作用として表示する(図7参照)。
続いて、オペレータがエントリ画面70の項目名のチェックボックス72を選び、指でタップしてエントリ項目の項目名を指定すると、OCR対象エントリ項目受付部24はOCR対象のエントリ項目の項目名指定を受け付け(ステップS305)、OCRエンジン44をアクティブにして、OCR箇所(読取エリア)が指定されるのを待機する。
ここで、オペレータが、図11に示すように、指でタッチパネル3(エントリ画面70)の帳票画像71のOCR箇所をタップして読取エリア(の開始点)をポイントで指定すると、OCR対象エントリ項目エリア受付部25は、そのポイントされた位置を受け付け、その位置から一定の方向(水平方向)にある文字画像を囲む枠線80を表示する(ステップS306)。
続いて、図12を参照して文字認識部40の動作を説明する。この場合、OCRエンジン44は、エントリ項目の項目名と枠線80で特定された読取エリアの座標に基づいて帳票画像71から文字画像を切り出し、エントリ項目定義体DB41からエントリ項目定義体と、文字種辞書DB42から文字種の辞書を読み出して、これらの情報を参照して文字認識し(ステップS501)、得られた認識結果を認識結果記憶部43に記憶すると共に、認識結果の文字データをエントリ項目の項目名に対応する表示欄73に表示する(ステップS502)。
これと同時に、ベリファイ部45が、認識結果記憶部43に記憶された認識結果の文字データに対して文字種および文字数のベリファイ処理を行う(ステップS502)。
ベリファイ処理の結果、ベリファイ処理が不成功に終わった場合、つまり予め設定されている辞書の文字種およびエントリ項目定義体の文字数と、認識結果の文字データの文字種および文字数が不一致の場合(ステップS503のNo)、ベリファイ部45はアラートを出力し(ステップS504)、エントリ画面70上に警告メッセージを表示する。
なお認識結果を認識結果記憶部43に記憶する前にベリファイ処理を行ってもよい。また文字の文字種および文字数のベリファイ処理を別々に分けて行ってもよい。さらにベリファイ処理が不成功に終わった場合に警告メッセージの表示だけでなく警告音を発報してもよい。また警告音のみを発報してもよい。
続いて、図13を参照してエントリ情報更新部50の動作を説明する。認識結果の文字データがエントリ画面70の表示欄73に表示された後、その文字データをオペレータが確認し、誤読していれば、表示欄73の文字データをキー入力などで手修正し、修正不要であれば、次の項目名をタップする。
この操作(動作)を繰り返して、オペレータとして所望の項目の文字データが得られた後、オペレータがエントリ画面70のエントリ釦(図示せず)をタップすると、エントリ情報書込部52が認識結果を認識結果記憶部43から取り込んで(ステップS601)、一定のエントリ形式の情報に変換してエントリ情報DB51に書き込み(ステップS602)、エントリ情報DB51の内容を更新する。
その後、一定時間が経過または一定量のデータがエントリ情報DB51に蓄積されると、エントリ情報送信部53がエントリ情報DB51の情報を外部システム8へ送信する(ステップS603)。なお時間の経過またはデータの量によらず、エントリ情報DB51の情報が更新された段階でエントリ情報DB51の情報を外部システム8へ順次送信してもよい。
このように第1実施形態によれば、文字認識を行う帳票の読取情報(帳票定義)として、従来は認識対象の項目名とこの項目内容として入る文字データの属性情報と項目名に対応する読取対象のエリアの位置情報(座標)とを一々対応付けて手作業で定義する必要があったが、本実施形態では、項目名とこの項目内容として入る文字データの属性情報だけを事前に設定しておき、作業に時間を要する読取対象の文字のエリアの位置情報については帳票Aを実際に読み取る際にオペレータによるタップ操作またはスライド操作で指定するようにしたので、帳票Aを読み取るための事前の準備が容易になり、かつ帳票Aの情報のうち所望の箇所を選んで読み取ることができるようになる。また項目名と読取結果とで管理することで、一度読み取った項目については読み取らず、項目を重複することなく効率よく読み取ることができる。
(第2実施形態)
続いて、図14を参照して第2実施形態を説明する。なおこの第2実施形態において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
図14に示すように、この第2実施形態の帳票読取システムは、訂正部46と訂正履歴DB47を備える。
訂正部46は以前と同じ読取エリアが指定された場合に訂正履歴DB47に保管されている訂正後の認識結果を読み出して、今回の認識結果として表示欄73に表示すると共に、認識結果記憶部43に記憶する。訂正履歴DB47には訂正部46により文字認識後に手入力などで訂正した認識結果、つまり訂正後の認識結果が記憶(保管)される。
訂正部46は表示欄73に表示された文字データが訂正された場合に、訂正された認識結果を訂正履歴DB47(メモリ5)に記憶する。訂正部46は文字認識の際に、以前と同じエリアが指定された場合、訂正履歴DB47(メモリ5)に記憶した認識結果の訂正履歴を参照して、訂正履歴から読み出した認識結果を文字認識部40の認識結果として表示欄73に表示させる。
続いて、図15を参照してこの第2実施形態の動作を説明する。
この第2実施形態の場合、文字認識部40において、例えば「氏名」などのエントリ項目を選び、この項目に対応する読取エリアを指定し文字を認識し(図15のステップS701)、文字認識した結果の文字データとして例えば「○×大郎」が表示欄73に表示されたものとする。
ここで、認識結果に誤読があった場合、手入力で「○×太郎」と訂正を行うと、訂正部46はエントリ項目の項目名「氏名」の認識結果(文字、文字種、座標など)を訂正後の「○×太郎」と対応付けて訂正履歴として訂正履歴DB47に保管する。
これ以降、例えば申込人氏名などのエントリ項目の項目名が選ばれて、訂正を行ったのと同じ読取エリア(OCR認識対象エリア)が指定された場合(ステップS704)、訂正部46は訂正履歴DB47に保管されている訂正後の認識結果を読み出して、今回の認識結果として表示欄73に表示すると共に(ステップS705)、認識結果記憶部43に記憶する。
このようにこの第2実施形態によれば、文字認識した認識結果に誤読があった場合に認識結果を訂正部46にて訂正し認識結果の訂正履歴として訂正履歴DB47に保管しておき、前と同じ項目で新たな読取エリアが指定されたときに訂正履歴DB47に保管されている訂正後の認識結果「○×太郎」を読み出して今回の「申込人氏名」のエントリ項目の項目名に対する認識結果として表示欄73に「○×太郎」を表示することで、以前の訂正履歴が生かされ、手操作による訂正回数を削減することができ、オペレータへの作業負担の軽減と作業効率を向上することができる。
(第3実施形態)
続いて、図16を参照して第3実施形態を説明する。なおこの第3実施形態において第1および第2実施形態と同じ構成には同一の符号を付しその説明は省略する。
図16に示すように、この第3実施形態は、タブレット端末1の画像取得部10の構成要素としてカメラ部2を持たない例である。
この場合、タブレット端末1の外部にストレージ13を設けておき、帳票Aをデジタルカメラ2aやスキャナ9などの画像取得手段で事前に撮影して、得られた帳票画像71をストレージ13に保存しておく。ストレージ13としては、例えばハードディスク装置やフラッシュメモリなどの他、クラウドサービスなどのネットワークストレージを利用するものとする。
タブレット端末1を利用した文字読取操作を行うときに、タブレット端末1における画像取得の際に、帳票画像書込部11がネットワーク7または通信ケーブルなどを通じて外部のストレージ13にアクセスして処理対象の帳票画像71を取得し、帳票画像DB12に書き込む。以下の動作は第1および第2実施形態と同様である。
このようにこの第3実施形態によれば、カメラ機能のないタブレット端末1などでも、別の場所において帳票Aから得た帳票画像を用いて文字の読み取りを行うことができ、複数の人で作業を分担して行うことができる。
(第4実施形態)
続いて、図17、図18を参照して第4実施形態を説明する。なお、この第4実施形態において第1乃至第3実施形態と同じ構成には同一の符号を付しその説明は省略する。
図17に示すように、この第4実施形態の帳票読取システムは、電子機器または携帯端末としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8と、同じくネットワーク7を介して接続された外部文字認識システム82(例えばクラウドサービスとして存在するシステム)とを備える。
図18に示すように、タブレット端末1には、画像取得部10、画面制御部20、文字認識依頼部401、文字認識確定部402、エントリ情報更新部50を備え、タブレット端末1とネットワーク7を介して接続された外部文字認識システム82には、文字認識部811、エントリ項目定義体DB8141、文字種辞書DB8142、ベリファイ部8145を備えている。
文字認識依頼部401は、OCR対象帳票受付部23で指定された帳票画像と、OCR対象エントリ項目エリア受付部25で指定されたエントリ項目座標に基づき、帳票画像のうちの一部の画像を切り出す画像切出部4011と、この画像切出部4011により切り出された、切り出し画像データのファイル(以下「切り出し画像ファイル」と称す)と、OCR対象エントリ項目受付部24で指定されたエントリ項目の項目名とを、ネットワークなどに接続された外部文字認識システム81に文字認識を依頼する文字認識依頼送受信部4012とを有する。
続いて、図9乃至13、図19を参照してこの第4実施形態の帳票読取システムの動作を説明する。
まず図9を参照して画像取得部10の動作を説明する。この場合、帳票Aをカメラ部2が撮影し(ステップS201)、撮影された帳票画像71が帳票画像書込部11により帳票画像DB12へ書き込まれる(ステップS202)。
対象となる全ての帳票を撮影し終えると(ステップS203のYes)、処理を終了し、対象となる全ての帳票を撮影し終えていなければ(ステップS203のNo)、ステップS201に戻り、処理を繰り返す。
続いて、図10を参照して画面制御部20の動作を説明する。この場合、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、帳票画像読出部21は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み出し(ステップS301)、タッチパネル3のエントリ画面70に帳票画像71のサムネイル一覧を表示する(ステップS302)。
ここで、オペレータがエントリ画面70のサムネイル一覧の中から所望のサムネイルを選んで、タッチパネル3をタップ操作(サムネイルを指定)すると、OCR対象帳票受付部23はサムネイルの指定を受け付け(ステップS303)、指定されたサムネイルに対応する帳票画像71をOCR対象として確定し(ステップS304)、エントリ画面70ほぼ全体に操作用として表示する(図7参照)。
続いて、オペレータがエントリ画面70の項目名のチェックボックス72を選び、指でタップしてエントリ項目の項目名を指定すると、OCR対象エントリ項目受付部24はOCR対象のエントリ項目の項目名の指定を受け付ける(ステップS305)。
ここで、オペレータが、図11に示すように、指でタッチパネル3(エントリ画面70)の帳票画像71のOCR箇所をタップして読取エリア(の開始点)をポイントで指定すると、OCR対象エントリ項目エリア受付部25は、そのポイントされた位置を受け付け、その位置から一定の方向(水平方向)にある文字画像を囲む枠線80を表示する(ステップS306)。
続いて、図19を参照して文字認識依頼部401、文字認識確定部402の動作を説明する。
文字認識依頼部401の画像切出部4011は、枠線80で特定された読取エリアの座標に基づいて帳票画像71から文字画像を切り出して、切り出し画像ファイルとする(ステップS5001)。文字認識依頼送受信部4012は、この切り出し画像ファイルとOCR対象エントリ項目受付部24で受け付けたエントリ項目の項目名とを、外部文字認識システム81にネットワークを介して送信し、文字認識を依頼する(ステップS5002)。
外部文字認識システム81は、タブレット端末1から受信した切り出し画像ファイルを、文字認識部811にて文字認識し、認識結果文字データを対象のエントリ項目の項目名と対応させ、エントリ項目定義体DB8141からエントリ項目定義体の対応する項目名(例えば氏名)の定義情報1(文字種、例えば漢字)、定義情報2(文字数、例えば20)と、文字種辞書DB8142から文字種の辞書を読み出して、これらの情報を参照して文字認識結果を確定し(ステップS5004)、確定した認識結果をベリファイ処理する(ステップS5005)。ベリファイ処理後にネットワークを介して、エントリ項目名と文字データをタブレット端末1の文字認識依頼送受信部4012に送信する(ステップS5006)。
文字認識確定部402のエントリ項目内容生成部4021は、受信した認識結果文字データとエントリ項目の項目名とを、対応させて生成し確定するとともに(ステップS5007)、認識結果の文字データをエントリ項目に対応する表示欄73に表示する。
なお、エントリ情報更新部の処理以降については、第1実施形態で説明したとおりであり、その説明は省略する。
このように第4実施形態によれば、文字認識をタブレット端末1外であって、例えばクラウドサービス上に存在する文字認識システムで構成することにより、負荷がかかる文字認識処理は外部の文字認識システムにて行い、タブレット端末1内の処理をより軽く実現することができる。
本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
上記実施形態では、読取エリアの指定を1カ所ポイントすることで実現したが、この他、例えば図20に示すように、タブレット端末1のタッチ操作機能の一つであるスライド操作の機能を利用して、読取エリアの始点と終点を連続した指の移動で指定することで始点と終点で挟まれた範囲の文字画像を囲む枠線80を表示して読取エリアを指定してもよい。
この場合、読取エリアが規定のサイズを超えるような場合に第1実施形態(図11)のような自動エリア指定に比べてエリアの指定の間違いが少なくなるという利点がある。
この他、例えば文字画像の周囲をなぞるように指をスライド操作して範囲を指定してもよい。
この他、上記実施形態では、オペレータがエントリ画面70で、エントリ項目の項目名を指定した後に、文字認識対象エリアを特定するという順番で説明したが、文字認識対象エリアを特定してから、エントリ項目の項目名を指定するという順番で構成してもよい。
また上記実施形態では、表示機能と入力機能を一体化したタッチパネル3を有するタブレット端末1を例にして説明したが、この他、例えば表示機能と入力機能を別個に備えたノート形コンピュータや、LCDパネルなどの表示装置とキーボードなどの入力装置とを別個に用意し外部接続したコンピュータや、キーボード、マウス、ポインティングデバイスなどの入力装置を備え、表示装置のみを外部接続した構成のコンピュータまたは表示装置を備え入力装置のみを外部接続した構成のコンピュータであってもよい。
さらに上記実施形態では、各構成要素を、タブレット(コンピュータ)のメモリなどにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROMなどの記録媒体やフラッシュメモリ、リムーバブルメディア:Removable mediaなどが含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
上記実施形態では、帳票画像の取得機能から文字認識および訂正機能、外部システム8へのエントリ機能などをタブレット端末1に収容した例と、文字認識機能を外部文字認識システム81で実現する例を説明したが、タブレット端末1は、帳票画像の取得機能を収容し、その他の機能(画像処理、画像切り出し、文字認識)を外部文字認識システム81で実現してもよい。また、一部の機能、例えば訂正機能などを外部システム(クラウドサービスなど)で実現してもよい。
さらにタブレット端末1にカメラ部2とタッチパネル3とWebブラウザ(通信インターフェース)の機能だけを搭載し、他の機能を外部システム8(クラウドサービスなど)で実現してもよい。
A…帳票、1…タブレット端末、2…カメラ部、3…タッチパネル、5…メモリ、6…通信インターフェース(通信I/F)、7…ネットワーク、8…外部システム、9…スキャナ、10…画像取得部、11…帳票画像書込部、12…帳票画像データベース(帳票画像DB)、13…ストレージ、20…画面制御部、21…帳票画像読出部、22…画面生成部、23…OCR対象帳票受付部、24…OCR対象エントリ項目受付部、25…OCR対象エントリ項目エリア受付部、40…文字認識部、43…認識結果記憶部、44…OCRエンジン、45…ベリファイ部、46…訂正部、50…エントリ情報更新部、52…エントリ情報書込部、53…エントリ情報送信部、41…エントリ項目定義体データベース(エントリ項目定義体DB)、42…文字種辞書データベース(文字種辞書DB)、47…訂正履歴データベース(訂正履歴DB)、51…エントリ情報データベース(エントリ情報DB)、81…外部文字認識システム、401…文字認識依頼部、402…文字認識確定部、811…文字認識部、8141…エントリ項目定義体データベース(エントリ項目定義体DB)、8142…文字種辞書データベース(文字種辞書DB)、8145…ベリファイ部、4011…画像切出部、4012…文字認識依頼送受信部、4021…エントリ項目内容生成部、4022…エントリ項目データベース(エントリ項目DB)。

Claims (5)

  1. 帳票を光学的に読み取って得られた帳票の画像から文字データを読み取る帳票読取装置において、
    前記帳票の画像と、前記帳票の画像から読み取るべき文字の項目名の中からユーザが所望の項目名を指定するための複数の項目名指定部と、前記複数の項目名指定部に対応して設けられた複数の表示欄とを有する画面を出力する画面制御部と、
    項目名毎に、前記エリアから読み取るべき文字データの文字種、文字数を含む定義情報が記憶された項目定義情報記憶部と、
    前記画面の複数の項目名指定部の中から所望の項目名指定部が指定され、前記帳票の画像から読取対象のエリアが指定された場合、前記項目定義情報記憶部の定義情報に基づいて、指定された前記エリアから切り出した画像部分を文字認識し、得られた前記文字認識結果の文字データを前記項目名指定部に対応する前記表示欄に表示する文字認識部と、
    を具備する帳票読取装置。
  2. 前記文字認識部による文字認識結果の文字データが訂正された場合に、訂正された前記文字データを記憶する訂正部を備える請求項1記載の帳票読取装置。
  3. 前記訂正部は、
    文字認識の際に、以前と同じエントリ項目名のエリアが2回目以降に指定された場合、前記文字認識結果の履歴を参照して、前記履歴から読み出した認識結果の文字データを前記表示欄に表示させる請求項2記載の帳票読取装置。
  4. 帳票を光学的に読み取って得られた前記帳票の画像から文字を読み取るコンピュータにおいて、
    前記コンピュータを、
    前記帳票の画像と、前記帳票の画像から読み取るべき文字の項目名の中からユーザが所望の項目名を指定するための複数の項目名指定部と、前記複数の項目名指定部に対応して設けられた複数の表示欄とを有する画面を出力する画面制御部と、
    項目名毎に、前記エリアから読み取るべき文字データの文字種、文字数を含む定義情報が記憶された項目定義情報記憶部と、
    前記画面の複数の項目名指定部の中から所望の項目名指定部が指定され、前記帳票の画像から読取対象のエリアが指定された場合、前記項目定義情報記憶部の定義情報に基づいて、指定された前記エリアから切り出した画像部分を文字認識し、得られた前記文字認識結果の文字データを前記項目名指定部に対応する前記表示欄に表示する文字認識部
    として機能させるプログラム。
  5. 帳票を光学的に読み取って得られた帳票の画像から文字データを読み取る帳票読取装置における帳票読取方法において、
    前記帳票の画像と、前記帳票の画像から読み取るべき文字の項目名の中からユーザが所望の項目名を指定するための複数の項目名指定部と、前記複数の項目名指定部に対応して設けられた複数の表示欄とを有する画面を出力し、
    項目名毎に、前記エリアから読み取るべき文字データの文字種、文字数を含む定義情報を記憶し、
    前記画面の複数の項目名指定部の中から所望の項目名指定部が指定され、前記帳票の画像から読取対象のエリアが指定された場合、前記定義情報に基づいて、指定された前記エリアから切り出した画像部分を文字認識し、得られた前記文字認識結果の文字データを前記項目名指定部に対応する前記表示欄に表示する
    帳票読取方法。
JP2017181269A 2017-09-21 2017-09-21 帳票読取装置、プログラムおよび帳票読取方法 Pending JP2017220266A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017181269A JP2017220266A (ja) 2017-09-21 2017-09-21 帳票読取装置、プログラムおよび帳票読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017181269A JP2017220266A (ja) 2017-09-21 2017-09-21 帳票読取装置、プログラムおよび帳票読取方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013230736A Division JP6230878B2 (ja) 2013-11-06 2013-11-06 帳票読取装置、プログラムおよび帳票読取システム

Publications (1)

Publication Number Publication Date
JP2017220266A true JP2017220266A (ja) 2017-12-14

Family

ID=60658034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017181269A Pending JP2017220266A (ja) 2017-09-21 2017-09-21 帳票読取装置、プログラムおよび帳票読取方法

Country Status (1)

Country Link
JP (1) JP2017220266A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019234865A1 (ja) * 2018-06-06 2019-12-12 株式会社Pfu 検査装置、制御方法及び制御プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (ja) * 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd 名刺認識装置
JP2001101340A (ja) * 1999-10-04 2001-04-13 Oki Electric Ind Co Ltd 文字読取装置および文字認識方法
JP2011248669A (ja) * 2010-05-27 2011-12-08 Ricoh Co Ltd 文書管理プログラム、記録媒体、情報処理装置、及び文書管理方法
JP2013196479A (ja) * 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2013230736A (ja) * 2012-04-27 2013-11-14 Nhk Spring Co Ltd 車両用シート

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (ja) * 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd 名刺認識装置
JP2001101340A (ja) * 1999-10-04 2001-04-13 Oki Electric Ind Co Ltd 文字読取装置および文字認識方法
JP2011248669A (ja) * 2010-05-27 2011-12-08 Ricoh Co Ltd 文書管理プログラム、記録媒体、情報処理装置、及び文書管理方法
JP2013196479A (ja) * 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2013230736A (ja) * 2012-04-27 2013-11-14 Nhk Spring Co Ltd 車両用シート

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019234865A1 (ja) * 2018-06-06 2019-12-12 株式会社Pfu 検査装置、制御方法及び制御プログラム
JPWO2019234865A1 (ja) * 2018-06-06 2021-01-07 株式会社Pfu 検査装置、制御方法及び制御プログラム
JP7039693B2 (ja) 2018-06-06 2022-03-22 株式会社Pfu 検査装置、制御方法及び制御プログラム

Similar Documents

Publication Publication Date Title
US9785627B2 (en) Automated form fill-in via form retrieval
JP6230878B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
WO2013004036A1 (zh) 结合文字识别和图像匹配的名片识别方法
US20140233837A1 (en) Systems and methods for storing image properties for recreating an image
US20130120430A1 (en) Electronic device and text reading guide method thereof
US10423825B2 (en) Retrieval device, retrieval method, and computer-readable storage medium for computer program
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
US9681016B2 (en) Methods and systems for capturing, sharing, and printing annotations
US9934212B2 (en) Methods and systems for capturing, sharing, and printing annotations
US10084936B2 (en) Display system including an image forming apparatus and a display apparatus
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
JP2017151913A (ja) Pdfファイル管理システム、pdfファイル管理サーバ、pdfファイルデータ取得サーバ、pdfファイル管理方法、pdfファイルデータ取得方法、pdfファイル管理プログラム、およびpdfファイルデータ取得プログラム
EP3049914B1 (en) User-initiated data recognition and data conversion process
JP2017220266A (ja) 帳票読取装置、プログラムおよび帳票読取方法
US20150039643A1 (en) System for storing and searching image files, and cloud server
JP4474231B2 (ja) 文書リンク情報取得システム
KR20100124952A (ko) 문자인식을 이용한 휴대형 단말기의 증강현실 기반 실시간 ar컨텐츠 제공시스템 및 그 방법
US10165149B2 (en) Methods and systems for automatically generating a name for an electronic document
JP6707112B2 (ja) ユーザ情報入力支援システム
JP6397084B2 (ja) ユーザ情報入力支援システム
JP6165595B2 (ja) 帳票識別システム
KR101659886B1 (ko) 명함 주문 시스템 및 방법
JP7231529B2 (ja) 情報端末装置、サーバ及びプログラム
US20240040232A1 (en) Information processing apparatus, method thereof, and program thereof, and information processing system
JP5804430B2 (ja) 書籍情報処理装置、書籍情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20180918

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190618

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191210