JP2004227130A - イメージ処理システム - Google Patents

イメージ処理システム Download PDF

Info

Publication number
JP2004227130A
JP2004227130A JP2003011977A JP2003011977A JP2004227130A JP 2004227130 A JP2004227130 A JP 2004227130A JP 2003011977 A JP2003011977 A JP 2003011977A JP 2003011977 A JP2003011977 A JP 2003011977A JP 2004227130 A JP2004227130 A JP 2004227130A
Authority
JP
Japan
Prior art keywords
recognition
unit
image data
information
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003011977A
Other languages
English (en)
Inventor
Kazuhiro Asami
和浩 浅見
Susumu Tanabe
晋 田辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003011977A priority Critical patent/JP2004227130A/ja
Publication of JP2004227130A publication Critical patent/JP2004227130A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】自動文字認識において、作業者が誤認識文字の検出及び修正を正確かつ容易に行うことができるイメージ処理システムを提供する。
【解決手段】作業者は認識結果を確認するために、入力部17から任意の文字を入力する(ステップ201)。データ制御部14は入力された文字と確認用データテーブルの認識文字結果とを比較し同じであれば、認識文字結果と、切り出し文字格納先アドレスによりファイリングデータベース18から読み出した切り出し画像(イメージデータ)とを表示部16に表示する(ステップ202)。その時の画面例を図5、図6に示す。21は確認文字表示部、22はイメージ文字表示部、23は認識結果表示部である。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、イメージ処理システムに係り、特に文字等の情報の自動認識による誤認識の修正に適したイメージ処理システムに関するものである。
【0002】
【従来の技術】
帳票等の紙に印字あるいは記載された文字等の情報をイメージデータ化し、保存、検索可能とする技術は、例えば特許文献1に帳票処理システムおよび帳票ファイリングシステムとして開示されている。そのなかで、自動認識した文字の確認方法は、帳票を読取ったイメージデータから、文字認識のために切り出したイメージデータと認識結果を画面に表示し、作業者は認識結果とイメージデータ内の該当の箇所とを目視による比較をし、認識結果が誤認識と判断した場合は打鍵による修正を行っている。
【0003】
【特許文献1】
特開2001−184453号公報(第4−6頁、第9−10頁、図3、図4、図5)
【0004】
【発明が解決しようとする課題】
自動文字認識による文字の誤認識は、特に手書き文字など認識対象の文字が一定の形状になっていない場合には必ず発生するため、文字認識結果に正確性を求める場合には、誤認識文字の正確かつ容易な検出方法が求められる。前記特許文献1記載の技術では、目視確認を行う作業者への負担が大きく、特に数字や英字は漢字と比べて負担の度合が大きい。例えば「社員番号」という文字を文字認識対象とした場合、その文字に意味があるため、誤認識の結果として「社員番呉」と認識した場合、イメージデータとの比較による検出のほかに「番呉」など文字の意味が不明となるため検出しやすい。
【0005】
しかし、英字や特に数字は、無意味な羅列の場合が多いため、例えば「3117115」を「3111715」と誤認識した場合、作業者は切り出し文字との比較のみで検出しなくてはならず、さらに同じ数字が並んでいる場合、誤認識した文字が何桁目かを数えなくてはならないため余分な負担がかかることになる。また、認識対象文字が個人情報のような機密性が必要な場合、目視確認作業には信頼できる作業者が必要となる。
【0006】
本発明の目的は、文字認識において、誤認識文字の検出及び修正を正確かつ容易に行うことができるイメージ処理システムを提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために本発明のイメージ処理システムは、帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識結果に対応する前記イメージデータとを前記表示部に表示するものである。
【0008】
上記目的を達成するために本発明のイメージ処理システムは、帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識結果に対応する前記イメージデータと該イメージデータの認識結果とを前記表示部に表示するものである。
【0009】
前記表示部は前記表示を前記帳票類毎に表示する。
【0010】
前記入力部から入力された情報と一致する前記認識結果に対応する前記イメージデータと、該イメージデータの認識結果は上下もしくは左右に対応させて表示する。
【0011】
上記目的を達成するために本発明のイメージ処理システムは、帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識部が認識した複数の前記帳票類の認識結果に対応するイメージデータと該イメージデータの認識結果とを前記表示部に表示するものである。
【0012】
前記入力部から入力された情報と一致する前記認識部が認識した複数の前記帳票類の前記認識結果に対応する前記イメージデータと、該イメージデータの認識結果は並列に表示する。
【0013】
上記目的を達成するために本発明のイメージ処理システムは、帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果と該認識結果に対応するイメージデータを格納する第1のメモリと、前記認識部の認識結果から得た帳票類の種類に関する情報と当該認識結果に対応するイメージデータの帳票類上の位置情報とフラグ領域とを有するテーブルを認識結果毎に格納する第2のメモリと、前記第1のメモリに格納されている認識結果やイメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、認識結果に誤認識があり、その他のイメージデータの認識にも同様の誤認識が発生し得る場合は、誤認識となった認識結果を有する前記テーブルのフラグ領域にフラグを立てるものである。
【0014】
前記誤認識となった認識結果を有するテーブルの帳票類の種類に関する情報と、認識結果に対応するイメージデータの帳票類上の位置情報を参照し、同一の情報を有する前記他のテーブルのフラグ領域にもフラグを立てる。
【0015】
前記フラグが立てられているテーブルに対応するイメージデータの前記表示部での表示は中止する。
【0016】
【発明の実施の形態】
以下、本発明の一実施例を図面を参照しながら説明する。図1は、本発明の一実施例によるイメージ処理システムの構成をブロック図にて示したものである。本システムは、帳票等に印字もしくは記載された文字等の情報を光学的に読取り、イメージデータ化する読取部11と、イメージデータから文字認識の対象となる部位を切り出す切り出し部12と、切り出された個々のイメージデータの認識を行い認識結果を出力する文字認識部13と、各種データを制御するデータ制御部14と、目視確認時に使用するテーブル(以下目視確認用データテーブル)を保存する確認用データベース15と、イメージデータや認識結果を表示する表示部16と、認識結果の手修正など作業者からの手入力を可能にする打鍵部(入力部)17と、イメージデータ他、実業務に必要な各種情報を保存するファイリングデータベース18とから構成されている。
【0017】
以下、図2、図4のフローチャートにより各処理の説明をする。図2は、イメージデータの入力処理を示すフローチャートである。読取部11で帳票を光学的に読取りイメージデータ化し(ステップ101)、イメージデータから切り出し部12にて認識対象部分の切り出しを行い(ステップ102)、その切り出したイメージデータからさらに文字認識を行うための1文字単位の切り出しを行う(ステップ103)。なお、以降「切り出し」と表現されている箇所については特に言及がない限り、1文字単位の切り出しが行われたものとする。切り出された文字は文字認識部13にて文字認識が行われる(ステップ104)。文字認識はマッチング法などにより1文字単位で行われる。認識結果とイメージデータ他、付加情報はファイリングデータベース18に一時格納保存される(ステップ105)。
【0018】
また、作業者の目視確認時に必要な、1文字単位の認識結果と、切り出しイメージデータの格納先アドレスと、切り出しイメージデータがどの帳票かをシステムが選定可能となるようなユニークな値(以下帳票通番)と、切り出しイメージデータが帳票のどの部分かシステムが選定可能となるようなユニークな値(以下認識箇所通番)と、切り出しイメージデータが認識対象部分の何桁目かシステムが選定可能となるような値(以下桁番号)は、確認用データベース15に格納保存される(ステップ106)。以上がイメージデータの入力処理である。
【0019】
確認用データベース15に格納保存されている確認用データテーブルの構成を図3に示す。確認用データテーブルは、データ制御部14において認識対象文字1文字に対して1テーブル作成され、認識文字結果と、切り出し文字の格納先アドレスと、帳票通番と、認識箇所通番と、桁番号と、後述する戻しフラグと確認フラグとで構成されている。なお、ここで挙げた内容は、本実施例で最低必要なもので、本実施例に直接使用しないシステム上必要な情報、フラグについては言及しない。
【0020】
図4は、本発明の一実施例による誤認識文字の確認を行うための表示及び修正処理を示すフローチャートである。図5、図6はそのときの画面例である。作業者は認識結果を確認するために、入力部17から認識確認のための任意の文字を入力する(ステップ201)。データ制御部14は入力された確認文字を表示部16に表示し(図5の21)、さらに入力された文字と確認用データベース15に格納されている確認用データテーブルの認識文字結果とを比較し一致するものがあれば、認識文字結果と、切り出し文字格納先アドレスによりファイリングデータベース18から読み出した切り出し画像(イメージデータ)とを表示部16に表示する(図5の23と22)(ステップ202)。
【0021】
作業者は表示部16に表示されている切り出し画像(イメージデータ)(図5の22)を目視確認し、認識結果(図5の23)が正しいかどうかを判断する(ステップ203)。認識結果が誤っている場合、その誤認識の原因がイメージの傾きなどに起因するもので、かつ認識対象文字が複数の文字で構成されており、その他の文字にも同様の誤認識が発生しうるかどうかを判断する(ステップ204)。
【0022】
誤認識が他の文字にも影響していると判断した場合、その切り出し文字の認識結果をもつ確認用データテーブルの戻しフラグをオンにする。またその切り出し文字の認識結果を保持する確認用テーブルの帳票通番、認識箇所通番から、同一の帳票通番、認識箇所通番をもつ確認用データテーブルについても戻しフラグをオンにする(ステップ205)。戻しフラグがオンになった認識文字結果については目視確認が未処理であってもステップ202での表示対象から外される。
【0023】
ステップ204にて認識対象文字のみの誤認識と判断した場合、入力部17より打鍵による修正を行う。修正データは確認用データテーブルの認識文字結果に反映される(ステップ206)。ステップ203にて認識結果を確認の上、正しいと判断した場合、また、ステップ206にて誤認識を修正した場合、確認用データテーブルの確認フラグをオンにする(ステップ207)。ステップ203からステップ207までの処理を任意選択入力文字の目視確認待ちデータが無くなるまで繰り返す(ステップ208)。
【0024】
他の文字についても目視確認を行う場合はステップ209においてステップ201まで戻る。目視確認業務終了後、確認済みデータについてはファイリングデータベース18の認識結果に反映する(ステップ210)。尚、確認用データテーブルの戻しフラグがオンになっているものについては、作業者の指示によりデータ制御部14はファイリングデータベース18から、順次、認識結果とイメージデータを読出して表示部16に表示する。作業者は目視確認を行い、入力部17から修正データを入力する。
【0025】
図5、図6は上記本発明の一実施例による誤認識文字の確認を行うための表示及び修正処理を行うのに使用する表示部16の画面例である。図5は目視確認作業を1件づつ行う場合の画面例である。画面には作業者が入力した確認すべき文字を表示する確認文字表示部21と、切り出し画像を表示するイメージ文字表示部22と、その切り出し画像を文字認識した結果を表示する認識結果表示部23と、ステップ205にて戻しフラグをオンにするための戻しフラグチェックボックス24と、前ページへの戻りボタンと、次ページへの前進ボタンとで構成されている。イメージ文字表示部22と、その切り出し画像を文字認識した結果を表示する認識結果表示部23とは上下に対応して表示されている。この表示は作業者に見やすいように表示されていれば良く、左右に対応して表示されても良い。なお、本実施例では、イメージ文字表示部22に文字が表示された時点で戻しフラグチェックボックス24をチェックしない限り、確認フラグがオンになるように構成されている。
【0026】
図6は目視確認作業を帳票複数枚同時に行う場合の画面例である。画面には作業者が入力した確認すべき文字を表示する確認文字表示部31と、切り出し画像を表示する部分を列挙したイメージ文字表示部32と、その切り出し画像を文字認識した結果をイメージ文字表示部32と並列に列挙した認識結果表示部33と、ステップ205にて戻しフラグをオンにするためのボタンをイメージ文字表示部32と並列に列挙した戻しフラグチェックボックス34と、ステップ207にて確認フラグをオンにするためのボタンをイメージ文字表示部32と並列に列挙した確認フラグチェックボックス35と、一括確認ボタン36とで構成されている。
【0027】
以上詳述した通り、本発明の一実施例によれば、従来の目視確認と異なり切り出しイメージデータと認識結果を「見比べる」作業が無くなるため、作業者はイメージデータのみによる確認作業が可能となり、かつ作業の単純化が可能となる。したがって、作業者の作業の効率化および作業者の負担の軽減が実現できる。また、認識対象文字が個人情報であっても表示される文字が個々に分解されているため、本作業を作業者に委託する際の情報機密も可能となる。
【0028】
【発明の効果】
本発明によれば、自動文字認識における誤認識の検出を、正確かつ容易に行うことができるイメージ処理システムを提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例によるイメージ処理システムの構成を示すブロック図である。
【図2】本発明の一実施例によるイメージ処理システムにおけるイメージデータの入力処理を示すフローチャートである。
【図3】本発明の一実施例によるイメージ処理システムにおける確認用データテーブルの構成を示す図である。
【図4】本発明の一実施例によるイメージ処理システムにおける誤認識確認処理及び修正処理を示すフローチャートである。
【図5】本発明の一実施例によるイメージ処理システムにおける表示部の画面例(1枚表示)を示す図である。
【図6】本発明の一実施例によるイメージ処理システムにおける表示部の画面例(複数枚表示)を示す図である。
【符号の説明】
11 読取部 12 切り出し部
13 文字認識部 14 データ制御部
15 確認用データベース 16 表示部
17 入力部 18 ファイリングデータベース
21 確認文字表示部 22 イメージ文字表示部
23 認識結果表示部 24 戻しフラグチェックボックス
31 確認文字表示部 32 イメージ文字表示部
33 認識結果表示部 34 戻しフラグチェックボックス
35 確認フラグチェックボックス 36 一括確認ボタン

Claims (10)

  1. 帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識結果に対応する前記イメージデータとを前記表示部に表示することを特徴とするイメージ処理システム。
  2. 帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識結果に対応する前記イメージデータと該イメージデータの認識結果とを前記表示部に表示することを特徴とするイメージ処理システム。
  3. 前記表示部は前記表示を前記帳票類毎に表示することを特徴とする請求項1または2記載のイメージ処理システム。
  4. 前記入力部から入力された情報と一致する前記認識結果に対応する前記イメージデータと、該イメージデータの認識結果とを上下に対応させて表示することを特徴とする請求項2記載のイメージ処理システム。
  5. 前記入力部から入力された情報と一致する前記認識結果に対応する前記イメージデータと、該イメージデータの認識結果とを左右に対応させて表示することを特徴とする請求項2記載のイメージ処理システム。
  6. 帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果や前記イメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、前記入力部から入力された情報と該情報と一致する前記認識部が認識した複数の前記帳票類の認識結果に対応するイメージデータと該イメージデータの認識結果とを前記表示部に表示することを特徴とするイメージ処理システム。
  7. 前記入力部から入力された情報と一致する前記認識部が認識した複数の前記帳票類の前記認識結果に対応する前記イメージデータと、該イメージデータの認識結果とを並列に表示することを特徴とする請求項6記載のイメージ処理システム。
  8. 帳票類に印字もしくは記載された文字等の情報を光学的に読取る読取部と、該読取部で読取ったイメージデータを認識する認識部と、該認識部の認識結果と該認識結果に対応するイメージデータを格納する第1のメモリと、前記認識部の認識結果から得た帳票類の種類に関する情報と当該認識結果に対応するイメージデータの帳票類上の位置情報とフラグ領域とを有するテーブルを認識結果毎に格納する第2のメモリと、前記第1のメモリに格納されている認識結果やイメージデータを表示する表示部と、文字等の情報を入力する入力部とを有し、前記認識部での認識終了後、認識結果に誤認識があり、その他のイメージデータの認識にも同様の誤認識が発生し得る場合は、誤認識となった認識結果を有する前記テーブルのフラグ領域にフラグを立てることを特徴とするイメージ処理システム。
  9. 前記誤認識となった認識結果を有するテーブルの帳票類の種類に関する情報と、認識結果に対応するイメージデータの帳票類上の位置情報とを参照し、同一の情報を有する前記他のテーブルのフラグ領域にもフラグを立てることを特徴とする請求項8記載のイメージ処理システム。
  10. 前記フラグが立てられているテーブルに対応するイメージデータの前記表示部での表示を止めることを特徴とする請求項8または請求項9記載のイメージ処理システム。
JP2003011977A 2003-01-21 2003-01-21 イメージ処理システム Pending JP2004227130A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003011977A JP2004227130A (ja) 2003-01-21 2003-01-21 イメージ処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003011977A JP2004227130A (ja) 2003-01-21 2003-01-21 イメージ処理システム

Publications (1)

Publication Number Publication Date
JP2004227130A true JP2004227130A (ja) 2004-08-12

Family

ID=32900723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003011977A Pending JP2004227130A (ja) 2003-01-21 2003-01-21 イメージ処理システム

Country Status (1)

Country Link
JP (1) JP2004227130A (ja)

Similar Documents

Publication Publication Date Title
JP2007004584A (ja) 情報処理装置
JPH1139428A (ja) 文書映像の方向修正方法
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP2004227130A (ja) イメージ処理システム
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JPH11213087A (ja) 文字認識装置
JP2005242786A (ja) 帳票識別装置および帳票識別方法
JPH096865A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP3114446B2 (ja) 文字認識装置
JPS61272882A (ja) 情報認識装置
JP4224914B2 (ja) 文字読取システム及び文字読取方法
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH0475185A (ja) 入力装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2007272615A (ja) 文字読み取り装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JPH03240183A (ja) 認識文字自動修正方式
JP4092768B2 (ja) 文字認識装置および文字認識方法
JP4633246B2 (ja) 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH01292586A (ja) 文字認識支援装置
JP2002133367A (ja) 文字認識装置
JPH0475184A (ja) 入力装置
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050114