JP5134383B2 - Ocr装置、証跡管理装置及び証跡管理システム - Google Patents

Ocr装置、証跡管理装置及び証跡管理システム Download PDF

Info

Publication number
JP5134383B2
JP5134383B2 JP2008018172A JP2008018172A JP5134383B2 JP 5134383 B2 JP5134383 B2 JP 5134383B2 JP 2008018172 A JP2008018172 A JP 2008018172A JP 2008018172 A JP2008018172 A JP 2008018172A JP 5134383 B2 JP5134383 B2 JP 5134383B2
Authority
JP
Japan
Prior art keywords
image
character string
trail management
character
trail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008018172A
Other languages
English (en)
Other versions
JP2009181225A (ja
Inventor
健 永崎
正史 恵木
正和 藤尾
龍之進 川口
勝美 丸川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008018172A priority Critical patent/JP5134383B2/ja
Publication of JP2009181225A publication Critical patent/JP2009181225A/ja
Application granted granted Critical
Publication of JP5134383B2 publication Critical patent/JP5134383B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Description

本発明は、紙の帳票を入力する業務において修正履歴を保管するための、帳票読取を行うOCR装置技術、及び当該OCR装置と連携した証跡管理技術に関する。
企業における様々な業務活動において、内部統制のための証跡ログを残すことが社会的に求められている。証跡ログとは、誰が、いつ、何の業務を、どのように処理したか、という業務遂行に関わる様々な履歴を意味する。データ入力業務に関して言えば、OCR(Optical Character Reader)装置を用いて帳票を読取り、OCR読取結果を修正インタフェース上に表示し、当該読取結果に存在する読取誤りや読取欠損を人手で修正するという一連のプロセスについて、これら情報処理の履歴を証跡ログとして残す必要がある。
OCR装置の一般的な機能及び、それを用いた帳票入力業務の形態については、特許文献1や特許文献2に概要が記されている。特許文献1には、OCR装置内の基本的な処理の流れが述べられている。帳票の自動読取りを行う場合、帳票内に記載されている文字コード、文字行、罫線、枠等を抽出し、データ入力が必要な帳票上の特定領域の読取りを行い、これをテキストファイルとして外部記憶装置に出力する。特許文献2には、OCRの読取精度を向上する手段として、OCRの認識結果に形態素解析を適用する手法が記されている。いずれも、OCR装置を使って、紙帳票あるいは帳票画像上のデータを入力するための高精度なシステムを提案している。
特開平6−52156号公報 特開平5−108891号公報 特開平9−319824号公報 特開2000−251012号公報
一般に、内部統制と言う場合、紙文書をOCR装置により読取って認識結果をテキストファイルとして出力し、この出力ファイルを業務システムに登録した上で、業務システム上で証跡管理を行うという流れになる。しかし、このような証跡管理システムでは、紙や帳票画像の必要箇所を入力したかどうかといった履歴の管理はシステムの範疇外になる。また、既存のOCR技術を使っても100%正しい読取は保証されないため、認識結果の修正を考慮したシステムが必要となる。
OCR装置を使ったデータ入力業務を内部統制に適合したものとするためには、紙又は画像上に記載された必要データを全て入力したか否か、オペレータの修正結果も含めて履歴を管理できるかが重要なポイントとなる。このことは、OCR読取結果及び修正結果として得られたテキスト情報だけでなく、それが紙面・画面上の何処に書かれているかも証跡ログとして残す必要があるということを意味する。これら修正の履歴や、読取結果のテキストと画像の対応などの、全ての履歴を手作業で証跡ログとして残すことは、本来の業務(帳票入力)からすれば余分な手間である。従って、OCR装置と連携して、修正の履歴や、読取結果のテキストと画像の対応関係等の履歴を、証跡ログとして効率良く収集及び保存するためのシステムが必要となる。
本発明は、内部統制向けのログの自動収集と保存を負担なく遂行することを可能とする方法及び装置を提供することを目的とする。
本発明では、次のアプローチを採用する。まず、OCR装置からの出力形態を、単純な画像と読取テキストから、証跡管理支援画像というデータ形式に変更する。更に、OCR認識結果の修正アプリケーション上において、修正イベントを検知して、当該イベントを行った人物と時間、更にどのような修正をしたかを自動的に保存する。更に、修正アプリケーション上では、証跡管理支援画像に含まれたデータを使って画像の再解析を行い、修正したデータ内容に対応する画像上の位置を検知することで、画像上の何処に対応する修正であるかを検出し、これをログとして保存する。これにより、OCR装置と連携して、修正の履歴や、読取結果のテキストと画像の対応関係等の履歴を、証跡ログとして効率良く収集及び保存する。
本発明のシステムは、OCR装置と証跡管理装置から構成される。OCR装置は、画像撮像部と処理部と記憶部と表示部とを備える。画像撮像部は帳票を撮像することによって当該帳票の電子画像データを取得し、処理部は記憶部に蓄えられた辞書を元に帳票画像を読取り、証跡管理を支援する情報(認識仮説)を上記電子画像データに埋込んで文書画像(証跡管理支援画像)として記憶部に出力する。証跡管理装置は、処理部と記憶部と表示部と入力部を備え、表示部に上記読取結果と画像を表示し、入力部によりオペレータによる認識結果の修正を受付け、当該修正ログを記憶部に保存する。読取り結果に修正が行われた場合には、認識結果の修正箇所と文書画像上の対応付けを、記憶部に蓄えられた上記証跡管理支援画像を元に、処理部で対応関係を計算することで、自動的な画像対応付けを行う。証跡管理支援画像に記録された認識仮説を使うことで、対応付けに掛かる処理時間の短縮と効率化を図る。
OCR装置から出力される証跡管理支援画像を用いて修正箇所に対応する画像上の対応付けを自動計算によって行うことで、内部統制向け証跡管理の効率化を図ることができる。
以下、図面を参照して本発明の実施の形態を説明する。
初めに、本実施例の前提となるハードウェア構成について述べる。図1は、OCR装置及び証跡管理装置の一実施例を示すハードウェア構成図である。OCR装置では、画像撮像部である画像撮像装置101により紙文書を電子画像データに変換し、それを記憶部である外部記憶装置105及びメモリ106に蓄えて、中央処理部(CPU)である中央演算装置107により読取を行う。本実施例に係わるOCRプログラム及び証跡管理プログラムは、外部記憶装置105又はメモリ106に蓄えられているか、通信装置109を介して装置に導入され、これら記憶部に記憶される。OCRプログラムは、撮像された電子データ画像に対して、中央演算装置107が帳票読取処理を行い、証跡管理支援画像として識別結果を出力する。帳票を読取る場合は、記憶部である外部記憶装置105又はメモリ106に蓄えられた文字識別辞書を参照し、帳票上に書かれた文字パタンを認識する。これらの処理は、操作端末装置102を通して操作者であるオペレータが操作可能であり、処理結果は表示端末装置103を通して表示される。処理結果などの情報は、必要に応じて外部記憶装置105に蓄積又は通信装置109を通して外部装置にデータとして送信される。上記装置群は内部バス108によって繋がっている。入力された伝票類はソータ装置104によって、定義された箱に分配・集積される。言い換えるなら、画像撮像装置101とソータ装置104を除けば、通常のパーソナルコンピュータ(PC)などのコンピュータシステムで構成されうる。証跡管理装置では、上記OCR装置から出力された画像、及び認識結果を表示端末装置103に表示し、操作端末装置102を通して操作者であるオペレータが認識結果の修正を行い、修正ログを証跡として外部記憶装置105又はメモリ106に蓄える。OCR装置による認識結果の確認及び修正を行ったオペレータに関する情報は、操作端末装置102へのログイン情報から取得され、証跡ログに記述される。
図2は、従来法と本発明の方法による内部統制向けの帳票処理及び証跡ログ管理処理の違いを模式化したものである。
まず従来のフローでは、帳票文書群(紙)201をOCR装置202に掛けて読取りを行う。OCRの出力は、203に示すように、紙画像を電子化した文書画像と、OCR読取結果であるテキストファイルである。次に、修正装置204を使って読取結果の修正を行う。このフローでは、OCR出力結果が読取結果テキストと文書画像であるため、テキストと文書画像を並べて表示し、それに対して修正を行う。その際、内部統制に対応するために、修正した結果、修正した人物、修正日時、修正内容と対応する画像上の箇所をデータベース又はファイルに修正ログ205として、人手で転記する必要がある。
これに対し、本発明による処理フローでは、紙文書群206をOCR装置207に掛けて読取を行う。OCRからは、紙画像を電子化した文書画像と、読取テキスト、更にはOCR装置内部で解析した結果として得られた文字行抽出や文字切出や文字認識の不確定性を情報として持つ読取仮説データ、及び文書の罫線情報や枠情報や文字行情報を持つ文書構造データ、読み取った項目名と対応するデータの関係、などのデータ群を文書画像の中に埋め込んだ証跡管理支援画像が、ファイル又はメモリに出力される(208)。次に、証跡管理装置209を使って読取結果の修正処理を行う。証跡管理装置は、OCR出力結果である文書画像、読取結果のテキスト、及び付加情報を持つ証跡管理支援画像を入力として受ける。次に証跡管理装置は、証跡管理支援画像から文書画像とOCR読取結果テキストを抽出し、それを別々のウィンドウなどにして並べて表示し、オペレータがそれに対して修正を行う。追加修正したデータに対応する画像上の修正入力箇所は、証跡管理支援画像に含まれる認識仮説データを用いて証跡管理装置内で計算することができる。これを、点検時刻及び点検したオペレータの情報とともに、修正ログ210として自動的に蓄積する。
208で出力されるデータは、対応する紙文書又は文書画像を一意的に同定する文書IDコードを持ち、磁気記憶装置などに恒久的に保存できる。保存する形態としては、文書画像、読取結果テキスト、読取仮説データ、文書構造データを別個にデータベース上に持つ場合と、これらのデータを付加情報として文書画像ファイル(証跡管理支援画像)中に埋め込んで持つことが考えられる。前者のメリットは文書画像とOCRが付加したデータ(読取結果テキストなどのこと)を別個に扱うため、文書の閲覧や検索が、それぞれ独立の既存ツールを使ってできることにある。但し、証跡管理を考えた場合、データが別々の箇所で管理されるのは履歴管理上好ましい形態ではない。後者のメリットは文書画像ファイルのみを管理するだけで、画像とOCR読取結果と読取仮設の全情報にアクセスできる点である。後者の場合、前者のように文書IDを使って、認識仮説データと文書画像の間のリンクを張る必要が無いため、文書管理が容易になる。
図3、図4に、帳票読取りから修正・ログ保存に至るまでの一連の流れをイメージで示す。本システムでは、まず、OCR装置に帳票301が入力され読取が行われる。但し、この帳票には読取りの難しい箇所として手書きでの修正部分302や、帳票枠に掛かるチェック303などが存在する。この帳票を読取って修正画面(OCR読取結果&修正GUI)上に表示した例が304である。外乱要因302、303が存在したため、この例ではOCR読取に失敗した箇所として305、306が存在する。次に証跡管理装置を用いて、OCRの認識結果に対する修正を行う。
文書画像ファイル(証跡管理支援画像)を読み込んだ証跡管理装置の画面上には、OCR装置によって読み取られた帳票の画像と、図3に示したOCR読取結果&修正GUIが、例えば別ウィンドウで同時に表示される。オペレータは、帳票の画像とその読み取り結果を見比べて、必要なときには修正操作を行う。また、証跡管理支援画像には、後述するように、OCRで読み取られた文字列の認識仮説データとして識別文字コードと識別文字類似度、画像上で位置座標等のデータが埋め込まれているので、証跡管理装置は、それらのデータを用いて修正文字列に対応する画像上の修正入力箇所の座標位置を計算し、帳票の各レコードの画像証跡ログを自動生成する。
修正後の画面例が401である。ここでは402、403の2箇所に対して修正が行われたものとする。証跡管理装置では、修正されたテキスト「川崎」「タチカワミツル」に対して、対応する画像上の領域を自動的に計算し、これを画像証跡ログとしてファイルに出力する。証跡ログの例は図4の下段、404、405、406、407に示されている。ここには、修正されたテキストか否か、認識結果のテキスト又は修正されたテキスト、画像上の対応位置、修正・点検した時刻及び担当者の氏名が記録されている。
先頭に「自動」と表示されているログ404、405はOCR読み取り結果に修正が施されなかったことを表し、「修正」と表示されたログ406、407はオペレータによる修正があったことを表す。ログ404を例に説明すると、「秦野」はOCRで読み取られた文字列であり、「画像(20,60,220,240)は、それが帳票画像上のx方向20ドットから60ドットまで、y方向220ドットから240ドットまでの矩形領域に位置することを意味する。これらの情報は、証跡管理支援画像に埋め込まれたデータから自動的に取得される。また、点検時刻は証跡管理装置にデータを読み込んだ時刻が記録され、点検した担当者の氏名は証跡管理装置へのログイン情報から取得される。
OCR読み取り結果が修正された時、証跡管理装置では、OCR装置が出力する証跡管理支援画像に埋め込まれた認識仮説データを用いて、帳票画像内の位置と修正箇所との対応関係を計算し直す。このため、オペレータが対応関係をマウスや電子ペンなどの機器を用いて指定し直すよりも、対応関係の計算時間の短縮化が図ることができ、さらに修正ログを自動的に蓄えるため、証跡管理に対する効率化を図ることが出来る。また、修正テキストに対応する画像上の領域を、画像全面から再度探すのではなく、修正インタフェース上の配置を見ることで、当該テキストの探索範囲を限定できる。例えば「川崎」は「所属」欄に属する項目であり、既に読まれている「秦野」というテキストの下に位置する。こういった修正インタフェース上の情報を使うことで、証跡管理支援画像上の探索範囲を限定できる。すなわち、「川崎」という項目が新たに入力された場合、既読の「秦野」の位置を使い、その下に位置する画像上の文字列群の中から「川崎」という単語を探索し直せばよい。このように、修正インタフェースとの連動により、帳票全画面に対応する情報を見る必要がなくなる。
探索範囲の限定について、もう少し詳細に説明する。オペレータによる修正箇所が修正画面上の表の、A1行B1列に位置したとする。項目リストが縦に配置されているとすれば、B1列に対応する項目名が分かる。先ほどの例で言えば「川崎」という修正に対応する項目名は「所属」である。また、同様に修正箇所に最も隣接した既存読取項目も判明する。例えば、縦系列で最も近い既存読取項目の位置がA0行B1列であり、その項目は修正箇所の上にある(つまりA0<A1)とする。更に、横系列ではA1行B2列であったとする。すると、修正箇所に相当する文字列は、修正箇所A1列B1行に対応する項目名がある縦の系列で、行の位置がA0行以下にある場所であると限定できる。更に、横方向の既存読取り箇所が存在するならば、縦の位置と横の位置の交差付近にある画像が読取り対象であると限定できる。
「川崎」という修正項目に関しては、「秦野」が最も近い同項目(所属)・縦系列の既存読取項目にあたる。「秦野」という読取結果は、証跡管理支援画像の中に、後述する図7(a)の形態で保持されている。図7(a)には文字行の読取結果のテキスト「秦野」と、その外接矩形座標(20,60,220,240)が格納されている。「川崎」という修正項目は修正画面インタフェース上で「所属」に属し、「秦野」の下の欄に入力されたテキストであるから、従って「川崎」という文字列を検索する位置はy方向(画像の上から下へと縦に伸びる方向)240ドット以下に位置する文字列と推定できる。また、x方向については20ドットから60ドットの範囲近傍であると推定できる。そこで、証跡管理画像に含まれる認識仮説データの中から、x方向が20ドットから60ドットの近傍範囲、y方向が240ドット以下の条件を満たすものに探索範囲を限定して、「川崎」と読めるものを探すこととなる。この場合、「川崎」と書かれた部分については、後述する図7(b)及び図7(c)の形態を持つ文字行仮説として、証跡管理画像中に保持されている。図7(b)には「川崎」という画像に対応する文字行の位置と、それに対応する仮説詳細情報が記録される。仮説詳細情報は図7(c)の集合で表される。図7(c)の集合としての仮説詳細情報のコンセプトは図8にある。これらについては後ほど詳述する。証跡管理装置は、このように修正インタフェース上の配置を利用して修正箇所に対応する画像上の領域の探索範囲を限定する。
図5は、OCR読取から修正ログの証跡保存までの一連の処理の流れを説明する図である。まず、帳票501がOCR装置に入力される。OCR読取処理502では、当該帳票の画像をスキャンし、指定された項目名に従って、項目名の箇所と、それに対応するデータの箇所を読み取る。その結果、読み取ったテキストと、当該項目名、画像上の位置などが判明する。読み取った結果のテキスト、その属性(どの項目名に対応するデータか、という情報)、更にOCR読取で抽出した文字パタンや罫線、文字行などの仮説、及び帳票画像データが一つにまとまって、証跡管理支援画像503としてファイルに出力される。証跡管理支援画像については後ほど詳述する。
ここで、OCR読取処理502の内部の処理過程を簡単に説明する。OCR読取処理502では、入力された電子画像データを元にして、罫線抽出、枠構造解析、読取対象枠の位置推定等の文書構造解析を行う。このとき使う認識処理には既知の技術(特許文献3、特許文献4など)を利用する。次に、文書構造解析の結果を受けて、読取対象である文字行を抽出する。次に、文字行画像から文字パタン候補の切出しと、各文字パタンの文字識別を行う。文字切出パタンと識別結果を併せて文字列仮説と称する。読取対象とする文書において、書かれ得る文字表記列が事前に決まっている場合は、文字列仮説に対して表記解析を行う。これにより、文字切出や文字識別の曖昧性を含んだ文字列仮設は、文字列テキストに変換される。OCR読取処理502で使われる項目名定義では、読取対象である項目と、項目名称、そのデータ属性などが記される。例えば、(BANK、銀行名|銀行|金融機関、漢字)などは、帳票中の読取対象として銀行の名称があり、それをBANKという項目名とすること、帳票上の銀行の名称が書かれるエリアのタイトルは、銀行名又は銀行又は金融機関、として書かれること、銀行の名称が漢字で書かれることを表す。これら読取対象項目を列挙したものが項目名定義となる。例に示した項目名定義は最小限の表記であり、このほかにも、当該項目名が書かれる位置、項目名の配置関係などを記述することがある。
次に、修正作業に移る。504以降の処理は、証跡管理装置上での処理になる。修正作業は504に示す修正画面インタフェース上で行われる。修正IF表示の際は、その表示方法を定義した辞書を用いる。例えば、上記BANKとして読取った項目群を、画面ウィンドウ上の高さY1、横X1の位置から、1行あたりの高さY2で、下方向に順に表示し、OCR装置で読み取られた帳票画像の下に修正入力項目を設ける、というようにインタフェースツール群の配置と、そこに表示する項目の記述が、修正IF定義辞書には記される。
マウスやキーボードにより修正するデータを入力すると、修正イベント検知処理505によって、それが検出される。修正箇所が既にOCRで読み取られた箇所であり、文字列の長さが変わらないようであれば、条件判断506によって再解析の必要無しということで、修正ログだけが蓄積され(508)、次の修正イベント待ちの状態となる。修正箇所が新しい行である場合、文字列が大幅に修正された場合などは、再解析が必要と判断されて処理507に移る。処理507では証跡管理支援画像に埋め込まれた認識仮説データを元に、入力された修正テキストに対応する画像上の領域の対応付けを行い、それを証跡ログとして処理508でデータに蓄える。前述のように、修正テキストは画像全面から再度探すのではなく、修正インタフェース上の配置を見ることで、当該テキストの探索範囲を限定する。修正終了ボタンが押されるなどした場合は、条件判断509によって処理を抜ける。504から509の処理が、修正のある間、繰返し行われる。修正作業が終わった場合は終了処理に移行する。最終的に、帳票画像、読取テキスト、対応関係、修正履歴が出力されて、以上の処理が終わる(510)。
証跡管理支援画像について、図6、図7、図8により説明する。図6は、OCR装置の出力である証跡管理支援画像のデータ構造について示したものである。図7は、証跡管理支援画像の認識仮説データとして蓄えられる情報の中身を示したものである。図8は認識仮説データの例である。
図6は、認識仮説データを文書画像上に埋め込む場合の一例を示したものである。この図ではTIFFなどのタグ形式画像ファイルを想定している。一般にタグ形式画像ファイルでは、ファイルの先頭ブロックにタグ情報が格納され、画像データ本体はタグからリンクを貼られた位置に存在する。タグ情報中にはそれぞれタグID番号が存在し、それにより、このタグの指すデータが画像データであるか、作成者や作成日時などのデータであるかを区別する。認識仮説データを加える場合は、このタグ情報をブロックに追加し、認識仮説データ用のタグIDと認識仮説データの登録先へのポインタを張れば可能となる。ここでは601のブロックには画像データが、602にはOCRによる認識結果(認識仮説)データが格納されている。これらが一体のファイルとなった603が証跡管理支援画像となる。
図7(a)は文字行の読取結果を表す。読取結果には、文字行の行ID番号、当該文字行に外接する矩形の座標、当該文字行に続く行候補の行ID番号、帳票上に書かれた文字列を読み取ったテキスト、号外文字行の属性が含まれる。文字行の属性には、当該文字行が項目名であるのかデータであるのかの情報、当該テキストが金額を表すか、商品名を表すか等を示す情報、項目名との対応関係(配置の上下、左右)の情報を含む。図7(b)は、文字行の読取仮説を表し、ここには最終的に決定しなかった文字パタンの仮説や、認識結果の仮説が含まれる。図7(a)と図7(b)の文字行情報が集まって、1枚の画像に対する仮説情報となる。各行における文字切出及び文字識別の多重仮説は、図7(c)に示す単一文字パタンの仮説情報が複数集まって構成される。すなわち、図7(b)項番4の当該文字行の仮説詳細情報は、図7(c)の集合(配列)として表される。図7(c)の文字切出及び文字識別の多重仮説は、文字パタンのID番号と、文字行上で次に続き得る文字パタンへのID番号とを持つ。更に当該文字パタンの文字識別の多重仮説は、複数の識別コード及び識別した文字の類似度についての情報を含む。
図8は認識仮説データの例である。801は元の画像、803、804、805は認識仮説データが含む情報を模式的に表している。白丸803は文字間の区切りを示し、線804は文字パタンを表す。805は、文字パタンに対する認識結果のデータである。
図7に示した行IDを用いて文字行単位での情報のまとまりを識別し、文字切出及び文字識別仮説によって当該文字行から単語を検出し、行座標情報を用いて修正テキストに対する画像上の位置をログとして出力することができる。更に、文字認識や文字パタン切出しの複数の仮説を類似度等の情報と共に保持するため、修正テキストに対応する画像上の対応領域の計算が容易となる。更に、項目間の対応関係を持つことで、文字の探索範囲を限定することができる。これら認識仮説と、修正テキストの間の対応関係の計算は、文法駆動型の動的計画法による文字列探索と、ベイズネットで表現された文字列間の配置関係に関する拘束条件を解く弛緩アルゴリズムとを組み合わせることで、解くことができる。
図8に示すような、文字認識や文字パタン切出しの複数の仮説を保持することの利点として、次の例が挙げられる。「本日月山」は「ホンジツ+ツキヤマ」と「ホンミョウサン(本明山)」の2通りの解釈ができる。このような切出しの曖昧性に関わる不確定文字がある場合、OCRの認識結果を一意的に確定する事はできない。このような場合は、複数の仮説をそのまま保持し、修正テキストが確定した段階で計算する方が、事前に文字列を確定するよりも計算が容易になる。すなわち、「日」と「月」をそれぞれ独立の文字と読むか、あるいはまとめて「明」と読むのか、両方の可能性を仮説として証跡画像中に保持する。その後、オペレータが修正データを入力した後で、文字列を確定する。
また、証跡管理支援画像を用いれば、修正オペレータに対して、入力が不足している旨の警告、あるいは、入力に不整合があるケースについて、システム側から警告を発する機能を作る事ができる。例えば、証跡管理支援画像にある文字行仮説について、当該文字行仮説に対応する修正が無い、あるいは確定した読取り結果が存在しない場合、これを未入力文字行として検出し、警告を発する事ができる。あるいはオペレータが入力したテキスト列に対して、当該テキスト列に対応する文字切出仮説と文字認識仮説を探索し、テキスト列に対して不読文字・文字認識尤度の低いパタンが一定割合以上で生じる場合、これをOCR認識結果と不整合があるとして、注意を促す警告を発することができる。
本発明は、紙の帳票又を処理する帳票読取システムへの証跡管理に適用できる。
OCR装置及び証跡管理装置の標準的なハード構成図である。 帳票読取から証跡収集に至る既存・新規システムの比較構成図である。 証跡収集の対象となる修正画面インタフェース例1である。 証跡収集の対象となる修正画面インタフェース例2である。 OCR読取から証跡管理に至る一連の処理の機能ブロック図である。 証跡管理支援画像の構成例である。 証跡管理支援画像に含まれる読取仮設の構成例である。 読取仮設に含まれる文字切出し、文字認識仮設の例である。
符号の説明
101 画像撮像装置
102 操作端末装置
103 表示端末装置
104 ソータ装置
105 外部記憶装置
106 メモリ
107 中央演算装置
108 内部バス
109 通信装置
201 従来環境における読取対象の書類
202 従来環境におけるOCR装置
203 従来環境におけるOCR装置の出力である読取結果のデータ
204 従来環境における結果表示及び入力装置
205 従来環境における修正ログの蓄積
206 本発明における読取対象の書類
207 本発明におけるOCR装置
208 本発明におけるOCR装置の出力である証跡管理支援画像
209 本発明における結果表示及び入力装置
210 本発明における修正ログの蓄積

Claims (7)

  1. 処理部と、表示部と、入力部と、記憶部とを有し、
    帳票の画像データと、前記画像データ上の項目名及びデータ個所の文字列に関して、各文字列の前記画像データ上での座標情報、OCR読み取り結果としての文字列テキストあるいは文字認識の候補としての認識仮説データ、各文字列と項目名との位置関係を含む付加情報とを1つの画像ファイルにまとめた証跡管理支援画像を読み込み、
    前記表示部に、前記帳票の画像と、前記OCR読み取り結果としての文字列テキストを表示し、
    前記入力部から、前記読み取り結果に対する修正を受け付け、
    前記処理部は、
    修正された文字列に対応する前記画像上の位置を、前記証跡管理支援画像に含まれる認識仮説データを参照して取得し、証跡ログとして、前記入力部から受け付けた修正内容と関連付けして前記記憶部に保存し、
    修正された文字列に対応する前記画像上の位置の探索範囲を、前記文字列と項目名との位置関係を利用して限定する
    ことを特徴とする証跡管理装置。
  2. 請求項1記載の証跡管理装置において、前記処理部は、前記OCR読み取り結果としての文字列テキストに対応する前記画像上の位置を、前記証跡管理支援画像に含まれる前記各文字列の前記画像データ上での座標情報を参照して取得し、証跡ログとして、前記文字列テキストに関連付けして前記記憶部に保存することを特徴とする証跡管理装置。
  3. 請求項1記載の証跡管理装置において、前記証跡管理支援画像はタグ形式画像ファイルであることを特徴とする証跡管理装置。
  4. 撮像部と第1の処理部とを有するOCR装置と、第2の処理部と表示部と入力部と記憶部とを有する証跡管理装置からなる証跡管理システムであって、
    前記OCR装置は、前記撮像部によって帳票を撮像して当該帳票の画像データを取得し、前記第1の処理部によって、帳票の項目に関する情報を記憶した項目名辞書を用いて、前記帳票の画像データから項目名とそれに対応するデータ箇所の文字列を読み取り、各文字列について前記画像データ上の座標情報、文字認識結果としての文字列テキストあるいは文字認識の候補としての認識仮説データ、当該文字列と項目名との位置関係を含む付加情報を取得し、前記帳票の画像データと前記付加情報を1つの画像ファイルにまとめた証跡管理支援画像を出力し、
    前記証跡管理装置は、前記表示部に前記証跡管理支援画像から抽出した帳票の画像と、前記OCR読み取り結果としての文字列テキストを表示し、前記入力部から前記読み取り結果に対する修正を受け付け、前記第2の処理部によって、修正された文字列に対応する前記画像上の位置を、前記証跡管理支援画像に含まれる認識仮説データを参照して取得し、証跡ログとして、前記入力部から受け付けた修正内容と関連付けして前記記憶部に保存し、前記第2の処理部によって、修正された文字列に対応する前記画像上の位置の探索範囲を、前記文字列と項目名との位置関係を利用して限定する
    ことを特徴とする証跡管理システム。
  5. 請求項記載の証跡管理システムにおいて、前記画像ファイルはタグ形式画像ファイルであることを特徴とする証跡管理システム。
  6. 請求項記載の証跡管理システムにおいて、前記第2の処理部は、前記OCR装置による文字認識結果としての文字列テキストに対応する前記画像上の位置を、前記証跡管理支援画像に含まれる前記各文字列の前記画像データ上での座標情報を参照して取得し、証跡ログとして、前記文字列テキストに関連付けして前記記憶部に保存することを特徴とする証跡管理システム。
  7. 前記認識仮説データには、文字パタンの識別情報、当該文字パタンの前記画像情報上における座標情報、当該文字パタンに続く文字パタンの識別情報、当該文字パタンの識別文字コード、及び当該文字パタンの識別文字類似度を含むことを特徴とする請求項記載の証跡管理システム。
JP2008018172A 2008-01-29 2008-01-29 Ocr装置、証跡管理装置及び証跡管理システム Expired - Fee Related JP5134383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008018172A JP5134383B2 (ja) 2008-01-29 2008-01-29 Ocr装置、証跡管理装置及び証跡管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008018172A JP5134383B2 (ja) 2008-01-29 2008-01-29 Ocr装置、証跡管理装置及び証跡管理システム

Publications (2)

Publication Number Publication Date
JP2009181225A JP2009181225A (ja) 2009-08-13
JP5134383B2 true JP5134383B2 (ja) 2013-01-30

Family

ID=41035184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008018172A Expired - Fee Related JP5134383B2 (ja) 2008-01-29 2008-01-29 Ocr装置、証跡管理装置及び証跡管理システム

Country Status (1)

Country Link
JP (1) JP5134383B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5346967B2 (ja) * 2011-02-25 2013-11-20 三菱電機インフォメーションシステムズ株式会社 Faxocrシステムおよびfaxocrプログラム
JP5833956B2 (ja) 2012-03-06 2015-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書を校正する情報処理装置、方法およびプログラム
JP7432568B2 (ja) * 2021-10-05 2024-02-16 ウイングアーク1st株式会社 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
JP3750406B2 (ja) * 1999-03-19 2006-03-01 三菱電機株式会社 文書ファイリング装置
JP2002109242A (ja) * 2000-09-29 2002-04-12 Glory Ltd 帳票処理方法および装置並びに帳票処理プログラムを記憶した記憶媒体
JP4461769B2 (ja) * 2003-10-29 2010-05-12 株式会社日立製作所 文書検索・閲覧手法及び文書検索・閲覧装置
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Also Published As

Publication number Publication date
JP2009181225A (ja) 2009-08-13

Similar Documents

Publication Publication Date Title
US10824801B2 (en) Interactively predicting fields in a form
JP4676225B2 (ja) スキャン・ドキュメントから電子フォームに取り込むための方法および装置
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
US9098765B2 (en) Systems and methods for capturing and storing image data from a negotiable instrument
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
US20070098263A1 (en) Data entry apparatus and program therefor
JP2008276766A (ja) フォーム自動埋込方法及び装置
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
EP2884425B1 (en) Method and system of extracting structured data from a document
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
US9798711B2 (en) Method and system for generating a graphical organization of a page
WO2014068770A1 (ja) データ抽出方法、データ抽出装置及びそのプログラム
CN113806472A (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JP3435374B2 (ja) 文字読取装置および文字認識方法
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP4853313B2 (ja) 文字認識装置
JP4466241B2 (ja) 文書処理手法及び文書処理装置
WO2011027113A1 (en) Method and apparatus for segmenting images
KR102561878B1 (ko) 머신러닝 기반의 ai 블루 ocr 판독 시스템 및 판독 방법
JP2024068871A (ja) 図面管理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121023

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees