JP2001325561A - 文字認識装置及び認識方法 - Google Patents

文字認識装置及び認識方法

Info

Publication number
JP2001325561A
JP2001325561A JP2000145945A JP2000145945A JP2001325561A JP 2001325561 A JP2001325561 A JP 2001325561A JP 2000145945 A JP2000145945 A JP 2000145945A JP 2000145945 A JP2000145945 A JP 2000145945A JP 2001325561 A JP2001325561 A JP 2001325561A
Authority
JP
Japan
Prior art keywords
batch
image
character recognition
image data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000145945A
Other languages
English (en)
Inventor
Takahiko Kuramoto
貴彦 倉本
Yoshihiko Ouchi
良彦 大内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP2000145945A priority Critical patent/JP2001325561A/ja
Publication of JP2001325561A publication Critical patent/JP2001325561A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】少量の原稿のみならず、定型フォーマットの原
稿を大量に文字修正する場合にも、迅速にかつ効率的に
修正作業が行える文字認識装置を提供する。 【解決手段】入力する原稿を数十枚程度のバッチという
概念で仕分けしてイメージスキャナ1にセットし、入力
画像記憶部11に画像データとして記憶する。記憶した
画像データをバッチ分割部12でバッチ単位に分割し、
入力画像文字認識部13で文字認識する。文字認識した
画像データは部分画像切り出し部14で部分画像として
切り出され、部分画像記憶部15に記憶される。一括修
正部19は、切り出した部分画像と文字認識した認識結
果とを対比表示させ、部分画像を基に認識結果を項目毎
に連続して一括修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、イメージスキャナ
から読み込んだ画像データを文字認識し、その認識結果
を修正する文字認識装置及び文字認識方法に関するもの
である。
【0002】
【従来の技術】従来の文字認識装置は、文字認識された
認識結果を修正する方法として、特開昭59−5398
1号公報記載のように、指示した文字の入力画像と第二
候補文字以降の候補文字を同時に表示し、修正したい文
字を選択して修正する方法がある。また、特開昭61−
21582号公報記載のように、文字の入力画像と認識
結果の文字とを上段と下段、左と右にいうように対応付
けて表示し文字修正する方法がある。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の装置は、いずれも、データが入力された原稿を一枚
ずつ修正を行う方法であり、少量のデータ処理の場合で
は有効であるが、定型フォーマットの原稿を連続で大量
に修正処理を行なう場合には、修正に時間がかかり、不
向きである。
【0004】本発明の目的は、少量の原稿のみならず、
定型フォーマットの原稿を大量に文字修正する場合に
も、迅速にかつ効率的に修正作業が行える文字認識装置
を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明における文字認識装置の特徴とするところ
は、イメージスキャナから読み込んだ画像データを処理
単位にバッチ分割し、バッチ分割した画像データを文字
認識し、該文字認識した画像データを項目毎に部分画像
として切り出し、切り出した部分画像と文字認識した認
識結果とを対比表示させ、部分画像を基に認識結果を項
目毎に連続して一括修正することにある。
【0006】具体的には本発明は次に掲げる装置及び方
法を提供する。
【0007】本発明は、イメージスキャナから読み込ん
だ画像データを文字認識し、該文字認識した結果を修正
する文字認識装置において、前記読み込んだ画像データ
を記憶する入力画像記憶部と、前記記憶した画像データ
を処理単位にバッチ分割するバッチ分割部と、前記バッ
チ分割した画像データを文字認識する入力画像文字認識
部と、前記文字認識した画像データを項目毎に部分画像
として切り出す部分画像切り出し部と、前記切り出した
部分画像と前記文字認識した認識結果とを対比表示さ
せ、前記部分画像を基に前記認識結果を前記項目毎に連
続して一括修正する一括修正部を有することを特徴とす
る文字認識装置を提供する。
【0008】また、本発明は、イメージスキャナから読
み込んだ画像データを文字認識し、該文字認識した結果
を修正する文字認識方法において、前記読み込んだ画像
データを記憶し、該記憶した画像データを処理単位にバ
ッチ分割し、該バッチ分割した画像データを文字認識
し、該文字認識した画像データを項目毎に部分画像とし
て切り出し、該切り出した部分画像と前記文字認識した
認識結果とを対比表示させ、前記部分画像を基に前記認
識結果を前記項目毎に連続して一括修正することを特徴
とする文字認識方法を提供する。
【0009】
【発明の実施の形態】以下、本発明の一実施の形態例に
係る文字認識装置及び文字認識方法を、図を用いて説明
する。
【0010】図1は、本発明の一実施の形態例に係る文
字認識装置の機能構成を示す。
【0011】図1に示すように、本文字認識装置は、イ
メージスキャナ1と、演算部2と、表示装置3と、マウ
スなどの指示デバイス4と、キーボード5とで構成され
る。演算部2は、イメージスキャナ1で読み込んだ原稿
を画像データとして記憶する入力画像記憶部11と、記
憶された画像データを後述するバッチという単位で分割
するバッチ分割部12と、バッチ分割した画像データを
文字認識する入力画像文字認識部13と、文字認識した
画像データを項目毎に部分画像として切り出し処理する
部分画像切り出し部14と、切り出した部分画像データ
を記憶する部分画像記憶部15と、マウスなどの指示デ
バイス4からの認識結果の修正要求を受け、修正指示す
る指示デバイス入力管理部16と、修正指示に基づき、
一括修正或いは逐次修正、どちらにするかを選択する選
択方法を表示する修正手段表示部17と、一括修正ある
いは逐次修正を選択して処理を分岐させる修正手段選択
部18と、修正手段選択部18で一括修正を選択した場
合に、切り出した部分画像と文字認識した認識結果とを
対比表示させ、部分画像を基に認識結果を項目毎に連続
して一括修正する一括修正部19と、修正手段選択部1
8で逐次修正を選択した場合に、逐次修正を行う逐次修
正部20と、画像データや認識結果を表示装置3に表示
する表示管理部21とから構成される。
【0012】図2は、図1の文字認識装置の動作処理の
フローチャートを示す。原稿が、イメージスキャナ1よ
り演算部2内部に読み込まれ、入力画像記憶部11に画
像データとして記憶される(ステップ101)。原稿を
イメージスキャナ1にセットする場合、バッチという概
念で原稿を数十枚程度の利用者が一括して修正できる単
位に分割して、バッチの先頭用紙として読み込み対象の
原稿とは異なるフォーマットのセパレータ用紙を挿入す
る。
【0013】このセパレータ用紙にバッチナンバーを記
入しておき、このセパレータ用紙を挿入することによ
り、イメージスキャナ1は、複数のバッチを一括して読
み取ることが可能となる。
【0014】ここで、バッチ分割について、図3〜図5
を用いて説明する。図3に示すように、原稿を数十枚毎
に利用者が一括して修正できる単位に分割した単位をバ
ッチと呼び、図4に示すように、バッチを複数まとめた
ものをロットと呼ぶ。バッチの先頭にはバッチ分割のた
めにセパレータ用紙7を挿入する。また、図5に示すよ
うに、セパレータ用紙7にはバッチナンバーを記入し
て、バッチ識別を行うと共に、以降の一括修正処理の入
力単位とする。イメージスキャナ1は、バッチ単位で
も、ロット単位でも取り込みが可能である。
【0015】入力画像記憶部11に記憶された画像デー
タは、バッチ分割部12でセパレータ用紙7のバッチナ
ンバーの記述に基づいてバッチ分割処理される(ステッ
プ102)。バッチ分割処理された画像データは、入力
画像文字認識部13に送られ、文字認識される(ステッ
プ103)。
【0016】画像データの文字認識が終了すると、次
に、文字認識された画像データは、部分画像切出し部1
4で項目毎に部分画像として切り出し処理され、(ステ
ップ104)、部分切出された部分画像データは部分画
像記憶部15に記憶される(ステップ105)。
【0017】イメージスキャナ1から原稿を読み込み画
像データとして記憶(ステップ101)、バッチ分割
(ステップ102)、文字認識(ステップ103)、部
分画像切出し(ステップ104)、部分画像記憶(ステ
ップ105)は、以降の処理(ステップ106〜ステッ
プ112)と非同期に実行することが可能である。
【0018】次に、取り込んだ画像データの修正を行う
場合には、指示デバイス入力管理部16は、マウスなど
の指示デバイス4からの認識結果の修正要求を受け取
り、修正指示を行なう(ステップ106)。次に、修正
指示に基づき、修正手段表示部17は、逐次修正処理あ
るいは一括修正処理、どちらで行なうかを選択させる選
択方法を表示装置3に表示させる(ステップ107)。
【0019】修正手段選択部18は、表示された選択方
法に基づき、選択された修正処理が逐次修正処理である
か、あるいは一括修正処理であるかによって、一括修正
部19あるいは逐次修正部20に処理を分岐させる(ス
テップ108)。
【0020】一方修正指示がなく、終了指示があるとき
は(ステップ113)、修正手段選択部18は処理を終
了させる。
【0021】修正手段に一括修正を選択した場合は、一
括修正部19に処理が送られる。一括修正部19では、
部分画像データの編集を行い(ステップ109)、同一
項目を一括して修正を行うために同一項目の部分画像デ
ータを一括修正画面で修正可能なように編集し、一括デ
ータ編集の出力を行い(ステップ110)、部分画像デ
ータと文字認識結果とを合成して表示する準備を行なっ
て一括修正の処理を行なう(ステップ111)。
【0022】一方、修正手段に逐次修正を選択した場合
は、逐次修正部20に処理が送られ(ステップ11
2)、逐次修正される。
【0023】一括修正処理(ステップ111)、逐次修
正処理(ステップ112)いずれのの場合も、修正処理
が終了すると、修正指示(ステップ106)へ処理を返
し、引き続き次の修正処理を繰り返し実行する。
【0024】図6は、本実施の形態例による認識結果一
括修正画面の一例を示す。従来の文字認識装置では、い
ずれも、入力データを入力された原稿一枚ずつ修正を行
う方法((氏名→年令)×50といった修正方式)であ
り、少量のデータ処理の場合では有効であるが、定型フ
ォーマットの原稿を連続で大量に修正処理を行わなけれ
ばならない場合には、修正に時間がかかり、不向きであ
る。
【0025】図6において、各行は、一括して読み込ん
だバッチ単位の画像データであり、各行の左側の項目か
ら、項目別に切出した部分画像データ60、文字認識し
た認識結果データ61、修正入力を行う欄62を示して
いる。連続で大量に修正する場合には、同一項目を連続
して入力する修正方法(氏名×50→年令×50といっ
た修正方式)が適している。
【0026】以上説明したように、本実施の形態例で
は、入力された画像データの部分画像データ、認識結果
データ、修正入力欄を、項目別に表示し、同一項目デー
タを連続して一括修正処理することができるので、修正
にかかる処理時間を短縮できる。
【0027】
【発明の効果】本発明によれば、文字認識された認識結
果データを項目別に表示し、同一項目毎にデータを連続
して一括修正することにより、修正にかかる処理時間を
大幅に短縮することができ、迅速にかつ効率的に修正作
業を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態例に係る文字認識装置の
機能構成ブロック図である。
【図2】図1の文字認識装置の動作処理のフローチャー
ト図である。
【図3】原稿を数十枚毎単位に分割したバッチの概念図
である。
【図4】図3のバッチを複数まとめたロットの概念図で
ある。
【図5】セパレータ用紙の記入例を示す図である。
【図6】文字認識結果一括修正画面の一例を示す図であ
る。
【符号の説明】
1…イメージスキャナ、2…演算装置、3…表示装置、
4…指示デバイス、5…キーボード、11…入力画像記
憶部、12…バッチ分割部、13…入力画像文字認識
部、14…部分画像切り出し部、15…部分画像記憶
部、16…指示デバイス入力管理部、17…修正手段表
示部、18…修正手段選択部、19…一括修正部、20
…逐次修正部、21…表示管理部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】イメージスキャナから読み込んだ画像デー
    タを文字認識し、該文字認識した結果を修正する文字認
    識装置において、 前記読み込んだ画像データを記憶する入力画像記憶部
    と、前記記憶した画像データを処理単位にバッチ分割す
    るバッチ分割部と、前記バッチ分割した画像データを文
    字認識する入力画像文字認識部と、前記文字認識した画
    像データを項目毎に部分画像として切り出す部分画像切
    り出し部と、前記切り出した部分画像と前記文字認識し
    た認識結果とを対比表示させ、前記部分画像を基に前記
    認識結果を前記項目毎に連続して一括修正する一括修正
    部を有することを特徴とする文字認識装置。
  2. 【請求項2】イメージスキャナから読み込んだ画像デー
    タを文字認識し、該文字認識した結果を修正する文字認
    識方法において、 前記読み込んだ画像データを記憶し、該記憶した画像デ
    ータを処理単位にバッチ分割し、該バッチ分割した画像
    データを文字認識し、該文字認識した画像データを項目
    毎に部分画像として切り出し、該切り出した部分画像と
    前記文字認識した認識結果とを対比表示させ、前記部分
    画像を基に前記認識結果を前記項目毎に連続して一括修
    正することを特徴とする文字認識方法。
JP2000145945A 2000-05-18 2000-05-18 文字認識装置及び認識方法 Pending JP2001325561A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000145945A JP2001325561A (ja) 2000-05-18 2000-05-18 文字認識装置及び認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000145945A JP2001325561A (ja) 2000-05-18 2000-05-18 文字認識装置及び認識方法

Publications (1)

Publication Number Publication Date
JP2001325561A true JP2001325561A (ja) 2001-11-22

Family

ID=18652380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000145945A Pending JP2001325561A (ja) 2000-05-18 2000-05-18 文字認識装置及び認識方法

Country Status (1)

Country Link
JP (1) JP2001325561A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046734A (ja) * 2018-09-14 2020-03-26 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046734A (ja) * 2018-09-14 2020-03-26 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7247496B2 (ja) 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
JP2007004584A (ja) 情報処理装置
JP3814320B2 (ja) 画像処理方法及び装置
JP2001325561A (ja) 文字認識装置及び認識方法
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP4501731B2 (ja) 画像処理装置
US20020031270A1 (en) Image processing apparatus, image processing method, and computer readable storage medium
JPH0388086A (ja) 文書読取装置
JPH0981672A (ja) 文書読取装置
JPH096918A (ja) 文書認識処理方法
JPH0581261A (ja) 文書入力装置
JP2007174079A (ja) 履歴出力装置、履歴出力方法およびプログラム
JP2021114211A (ja) 情報処理装置及びプログラム
JPH07182344A (ja) 機械翻訳装置
JPH02220186A (ja) 文字読取装置
JP2001307016A (ja) 文字認識装置
JPH10154205A (ja) 文字認識方法およびその文字認識方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPH0520492A (ja) 文書認識修正装置
JPH08185470A (ja) 文書読取装置
JP2006011746A (ja) 文書画像処理装置、文書画像処理プログラム、文書画像処理方法
JPH05217018A (ja) 文字自動認識装置
JPH09114916A (ja) 光学式文字読取装置
JPH05135150A (ja) 画像処理装置
JPH06180768A (ja) 補正処理におけるコード/イメージ表示方式