JPH07210623A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH07210623A
JPH07210623A JP6007423A JP742394A JPH07210623A JP H07210623 A JPH07210623 A JP H07210623A JP 6007423 A JP6007423 A JP 6007423A JP 742394 A JP742394 A JP 742394A JP H07210623 A JPH07210623 A JP H07210623A
Authority
JP
Japan
Prior art keywords
recognition
character data
image
character
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6007423A
Other languages
English (en)
Inventor
Atsushi Tanaka
淳志 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6007423A priority Critical patent/JPH07210623A/ja
Publication of JPH07210623A publication Critical patent/JPH07210623A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文書画像から文字データを高速に読み取り、
認識文書の有用な部分には高い精度を実現する装置を提
供する。 【構成】 文書画像をスキャナ101から入力、ディスク
装置105に記憶し、中央処理装置102が認識手段103によ
って文字認識を行う。認識結果の文字データと、文字デ
ータと文書画像との対応情報をディスク装置105に記憶
する。この時点で全文の文字データが使用可能となる。
さらに、記憶した文書画像106をディスプレイ109に表示
し、必要な領域をマウス110で範囲指定する。対応情報1
08を参照し、文書画像の指定領域に対応する認識結果の
を文字データ107から読み出し、ディスプレイ109に表示
する。誤認識の判定を行い、誤認識がある場合は修正手
段104で修正を行う。修正には、キーボード111からの正
しい文字の入力か、先のものとは異なる認識技術を用い
た再認識を行う。修正の結果はディスク装置105に保存
し、部分的に精度の高い文字データとして使用する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字情報を含む画像か
ら文字を認識し、認識した文字を記憶し、その文字情報
を使用する文書画像装置に関する。
【0002】
【従来の技術】コンピュータの発達とともに、従来から
蓄積されてきた文書情報の電子化の必要性が高まってい
る。また、情報機器のパーソナル化に伴い、個人が文書
情報を取り込むような場面が発生しつつある。文字を含
んだ画像(以後、「文書画像」と呼ぶ)を認識し、文字
コード列データ(以後、「文字データ」と呼ぶ)に変換
して、変換された文字データを様々な処理に使用する文
書画像処理装置において、認識の正確さが問題となる。
光学式文字認識装置(OCR:Optical Character Read
er)などにおける自動認識は、正確さの面で人間による
認識より精度が劣っており、認識結果の操作者による確
認作業が必要である。
【0003】以下に従来の文書画像処理装置について説
明する。
【0004】図6は文書画像処理装置の従来例の構成図
を示すものである。図6において、601は画像入力手
段であるスキャナであり、認識の対象となる文書画像を
入力する。602は制御手段である中央処理装置を示
し、プログラムを実行して各機器の制御を行う。また、
この中央処理装置は文書画像を認識し、文字データを読
み取る認識手段603、文書画像を用いて読み取った文
字データを修正する修正手段604を有する。605は
記憶手段であるディスク装置を示し、このディスク装置
は認識結果の文字データ606を記憶する。607は表
示手段であるディスプレイ、608は指示手段であるマ
ウス、609は操作者が修正を入力するキーボードを示
す。
【0005】以上のように構成された文書画像処理装置
について、以下にその動作を説明する。図7は従来例の
データの記憶からデータを使用できるまでの処理フロー
を示す。
【0006】動作を開始するとステップ701でスキャ
ナ601から文書画像を入力し、ディスプレイ607に
表示する。表示された文書画像に対し、ステップ702
で中央処理装置602の認識手段603によって文字認
識を行う。ここで用いる文字認識技術には一般的な手法
が利用される。文字認識技術の概要については文献「文
字認識概論」(橋本新一郎著、オーム社、1982)に
詳しく述べられている。認識結果は、ステップ703に
おいてディスプレイ607に前記文書画像と並べて表示
される。認識結果に誤認識があるか否かの判定が、ステ
ップ704においてマウス608から入力される。誤認
識がある場合は、ステップ705において認識結果の誤
認識部分をマウス608で指示し、ステップ706でキ
ーボード609から正しい文字を対話的に入力すること
で修正を行う(修正手段604)。修正の結果、ステッ
プ704で再び判定を行い、誤認識がなければ、ステッ
プ707においてディスク装置605の文字データ60
6として記憶され、文字データとして使用可能な状態に
なり、ステップ708で文字データの使用が行われ、一
連の処理が終了する。
【0007】帳票など決まった形式の文書に対しては、
特開平03−105669号公報で示されているように
文書のある範囲のみを部分的に認識し、認識結果を確認
する方法がある。また、確認作業の時間や手間を減らす
ためにより精度の高い認識法が用いられる場合がある。
【0008】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の文書画像処理装置では、画像全体に対して部
分的な認識、検証、修正を繰り返す必要があるため、大
量な文書画像を取り込み、様々な処理を行えるようにす
る場合に多くの時間と手間を必要とする。また、精度の
高い認識は処理に長い時間を必要とする。取込画像全体
に対して等しくレベルの高い認識精度を求めることが、
取り込んだ画像が使用できるまでに多くの時間を必要と
する要因となっている。
【0009】しかし、実際には取込画像内の情報は部分
的にしか必要とされないことが多い。したがって、まず
全体的に高速性を犠牲にしないレベルの精度で画像を認
識し、文字データとして全文検索など全文的な使用が可
能な状態とし、使用者が指定した部分についてのみ画像
を再度用いて高度な認識や使用者との応答による修正を
行う必要がある。
【0010】本発明は、このような要望に応えた文書画
像処理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書画像処理装置は、文書画像を入力する画
像入力手段と、入力した文書画像中の文字を認識する認
識手段と、文書画像とその認識結果の文字データと、前
記文書画像と前記文字データの対応情報とを記憶する記
憶手段と、文書画像とその対応情報を用いて対応する文
字データを修正する修正手段と、前記入力手段と前記記
憶手段と前記認識手段と前記修正手段を制御する制御手
段を具備する。
【0012】
【作用】本発明では、前記画像入力手段によって文書画
像を入力し、入力した文書画像から前記認識手段によっ
て文字データを認識し、文書画像と認識文字データと、
文書画像とその認識文字データの間の対応情報の全てを
前記記憶手段に記憶し、記憶した文書画像と対応情報を
用いて対応する認識文字データを修正し、修正した文字
データを前記記憶手段に記憶することで、画像入力手段
から入力された文書画像を文字データとして高速に読み
込み、さらに、使用者にとって有用な部分は高い精度の
文字データを取り出す文書画像処理装置を実現できる。
【0013】
【実施例】以下、本発明の実施例について図面を参照し
ながら詳細に説明する。
【0014】(実施例1)図1は第1の実施例における
文書画像処理装置の構成図、図2は同実施例におけるデ
ータ記憶及び全文的な文字データ使用時の処理フロー、
図3は同実施例における部分的な文字データ使用時の処
理フローを示す。
【0015】図1に示すように、101は画像入力手段
であるスキャナであり、認識の対象となる文書画像を入
力する。102は制御手段である中央処理装置を示し、
プログラムを実行して各機器の制御を行う。また、この
中央処理装置は、文書画像を認識し、文字データを読み
取る認識手段103、読み取った文字データを文書画像
を用いて修正する修正手段104を備える。105は記
憶手段であるディスク装置を示し、このディスク装置は
ビットマップの文書画像106や、認識結果の文字デー
タ107、文書画像と文字データの対応関係を表す対応
情報108を記憶する。109は表示手段であるディス
プレイ、110は指示手段であるマウス、111は操作
者が文字を入力するキーボードである。
【0016】次に、図2を用いて図1のシステム構成例
における第1の実施例のデータ記憶及び全文的な文字デ
ータの使用時の動作を説明する。
【0017】まず、動作を開始するとステップ201で
スキャナ101から文書画像を入力し、文書画像106
としてディスク装置105に記憶する。ステップ202
では、記憶した文書画像106に対して中央処理装置1
02の認識手段103によって文字認識を行う。認識結
果は、ステップ203においてディスク装置105に文
字データ107として記憶される。この際に、認識結果
の文字データと文書画像の領域との対応関係を示す情報
を対応情報108としてディスク装置105に記憶する
(ステップ204)。この対応情報108は文書画像の
領域と文字データの間のリンク形式、または表形式をと
る。文書画像の文字認識が終了し、文字データ及び対応
情報がディスク装置105に記憶されると、文字データ
は全文検索などの全文的な使用の対象となり、ステップ
205で全文的な文字データの使用が行われ、一連のデ
ータ記憶及び全文的な文字データの使用動作が終了す
る。
【0018】続いて、図3を用いて図1のシステム構成
例における第1の実施例の部分的な文字データ使用時の
動作を説明する。まず、ステップ301でディスク装置
105に記憶されている文書画像106をディスプレイ
109に表示する。なお、この際複数の文書画像を連結
して表示することも構わない。次にステップ302で、
表示された文書画像の中から必要な領域をマウス110
によって範囲指定する。ステップ303において対応情
報108を参照し、範囲指定された文書画像の領域に対
応する認識結果の文字データを文字データ107から読
み出し、先に指定した文書画像の領域と並べてディスプ
レイ109に表示する。なお、容易に指定領域と対応す
る文字データを参照できるのであれば、並べる表示でな
くても構わない。対応する文字データに指定領域の文書
画像に対する誤認識があるか否かの判定が、ステップ3
04においてマウス110から入力され、誤認識がある
場合はステップ305で中央処理装置102の修正手段
104によって修正を行う。ここで行う修正は、操作者
との対話によるキーボード111からの正しい文字の入
力、もしくはステップ202で行ったものとは異なる認
識技術を用いた再認識を意味する。修正の結果は、ステ
ップ306においてディスク装置105の文字データ1
07の対応する部分に上書きされ、変更が必要であれば
対応情報108に対する修正も行われる。最後に、指定
領域の文字データに対して、ステップ307で部分的な
文字データの使用が行われ、一連の部分的な文字データ
使用動作は終了する。
【0019】(実施例2)図4は第2の実施例のデータ
記憶及び全文的な文字データ使用時の処理フロー、図5
は第2の実施例の部分的な文字データ使用時の処理フロ
ーである。システム構成は実施例1と同じである。
【0020】図4を用いて図1のシステム構成例におけ
る第2の実施例のデータ記憶及び全文的な文字データ使
用時の動作を説明する。まず、動作を開始するとステッ
プ401でスキャナ101から文書画像を入力し、それ
を文書画像106としてディスク装置105に記憶す
る。ステップ402では、記憶した文書画像106に対
して中央処理装置102の認識手段103によって文字
認識を行う。ただし、認識に際しては複数の認識結果の
文字データ候補(以後、「認識候補」と呼ぶ)から結果
を一つに決定する事をせず、全ての認識候補をステップ
403でディスク装置105に文字データ107として
記憶する。この際に、認識候補の文字データと文書画像
の領域との対応関係を示す情報を対応情報108として
ディスク装置105に記憶する(ステップ404)。文
書画像の文字認識が終了し、文字データ及び対応情報が
ディスク装置105に記憶されると、文字データは全文
検索などの全文的な使用の対象となり、ステップ405
で全文的な文字データの使用が行われ、一連のデータ記
憶及び全文的な文字データ使用動作が終了する。
【0021】続いて、図5を用いて図1のシステム構成
例における第2の実施例の部分的な文字データ使用時の
動作を説明する。まず、ステップ501でディスク装置
105に記憶されている文書画像106をディスプレイ
109に表示する。なお、この際複数の文書画像を連結
して表示することも構わない。次にステップ502で、
表示された文書画像の中から必要な領域をマウス110
によって範囲指定する。ステップ503において対応情
報108を参照し、範囲指定された文書画像の領域に対
応する認識候補中から最も確実性の高い認識候補を文字
データ107から読み出し、指定した文書画像の領域と
並べてディスプレイ109に表示する。なお、容易に指
定領域と対応する文字データを参照できるのであれば、
並べる表示でなくても構わない。対応する文字データに
指定領域データに対する誤認識があるか否かの判定が、
ステップ504においてマウス110から入力される。
誤認識がある場合は、ステップ505において誤認識が
ある文字データ部分に対応する複数の認識候補を文字デ
ータ107から読み出してディスプレイ109に表示す
る。認識候補の中に正しい認識結果があるか否かの判定
が、ステップ506においてマウス110から入力さ
れ、正しい候補がある場合はステップ507においてマ
ウス110で選択される。正しい認識候補がない場合
は、ステップ508で中央処理装置102の修正手段1
04によって修正を行う。ここで行う修正は、操作者と
の対話によるキーボード111からの正しい文字の入
力、もしくはステップ402で行ったものとは異なる認
識技術を用いた再認識を意味する。選択と修正の結果
は、ステップ509においてディスク装置105の文字
データ107の対応する部分に上書きされ、変更が必要
であれば対応情報108に対する修正も行われる。最後
に、指定領域の文字データに対して、ステップ510で
部分的な文字データの使用が行われ、一連の部分的な文
字データ使用動作は終了する。 なお、本発明の各手段
は、上記実施例では、コンピュータを用いてソフトウェ
ア的に実現したが、それら各機能を有する専用のハード
回路を用いて実現する事も出来る。
【0022】
【発明の効果】以上述べたところから明らかなように、
本発明は、画像入力手段から入力された文書画像に対し
て一次的に認識を行い、その誤認識を含む可能性のある
認識結果のうち使用者の注目する部分に対してのみ二次
的に修正を行うことが出来、大量にデータを取り込む際
に全文的データの使用が可能になるまでの所要時間を短
縮し、データの特に操作者が必要とする部分は高い精度
な情報として使用できる文書画像処理装置を実現できる
ものである。
【図面の簡単な説明】
【図1】本発明の第1の実施例における文書画像処理装
置の構成図
【図2】第1の実施例における文書画像処理装置のデー
タ記憶及び全文的な文字データ使用時の処理フロー図
【図3】第1の実施例における文書画像処理装置の部分
的な文字データ使用時の処理フロー図
【図4】第2の実施例における文書画像処理装置のデー
タ記憶及び全文的な文字データ使用時の処理フロー図
【図5】第2の実施例における文書画像処理装置の部分
的な文字データ使用時の処理フロー図
【図6】従来の文書画像処理装置の一実施例の構成図
【図7】従来の文書画像処理装置の一実施例の処理フロ
ー図
【符号の説明】
101 スキャナ 102 中央処理装置 103 認識手段 104 修正手段 105 ディスク装置 106 文書画像 107 文字データ 108 文書画像・文字データ対応情報 109 ディスプレイ 110 マウス 111 キーボード

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 データを記憶する記憶手段と、文字を含
    む画像を入力する画像入力手段と、その画像に含まれる
    文字を認識する認識手段と、前記画像及び前記認識結果
    の文字との対応情報と前記画像を用いて認識結果の文字
    を修正する修正手段と、前記記憶手段と前記画像入力手
    段と前記認識手段と前記修正手段とを制御する制御手段
    を備え、 前記画像入力手段によって文字を含む画像を入力し、入
    力した画像から前記認識手段によって文字を認識し、 前記画像と、前記認識した文字と、前記画像及び前記文
    字の対応情報と、を前記記憶手段に記憶し、 前記画像と前記対応情報とを用いて認識結果の文字を前
    記修正手段によって修正し、 修正した文字を前記記憶手段に記憶することを特徴とす
    る文書画像処理装置。
  2. 【請求項2】 データを表示する表示手段と、前記表示
    手段によって表示されるデータの領域を指定する指示手
    段とを備え、 前記画像を前記表示手段によって表示し、表示した画像
    の領域を前記指示手段によって指示し、指示した画像領
    域に対応する前記文字を前記対応情報を用いて検索して
    前記表示手段に表示し、前記画像を用いて前記文字に対
    して前記修正手段によって修正を行うことを特徴とする
    請求項1に記載の文書画像処理装置。
  3. 【請求項3】 認識手段の認識結果の候補をすべて前記
    記憶手段に記憶し、前記修正手段において、前記表示手
    段に候補を表示し、候補からの選択を行うことを特徴と
    する請求項2に記載の文書画像処理装置。
JP6007423A 1994-01-27 1994-01-27 文書画像処理装置 Pending JPH07210623A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6007423A JPH07210623A (ja) 1994-01-27 1994-01-27 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6007423A JPH07210623A (ja) 1994-01-27 1994-01-27 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH07210623A true JPH07210623A (ja) 1995-08-11

Family

ID=11665467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6007423A Pending JPH07210623A (ja) 1994-01-27 1994-01-27 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH07210623A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023054937A (ja) * 2021-10-05 2023-04-17 ウイングアーク1st株式会社 情報処理装置、情報処理方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023054937A (ja) * 2021-10-05 2023-04-17 ウイングアーク1st株式会社 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US5022081A (en) Information recognition system
JPH07210623A (ja) 文書画像処理装置
JPH11213087A (ja) 文字認識装置
JPS61272882A (ja) 情報認識装置
JP2829002B2 (ja) 文字認識装置
JP2829186B2 (ja) 光学的文字読取装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH06149465A (ja) 手書き入力装置
JPH06301524A (ja) プログラム自動生成装置
JPH07334611A (ja) 非認識文字の表示方法
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPS6398788A (ja) 認識装置
JPH05120472A (ja) 文字認識装置
JPH11143993A (ja) 認識文字修正装置およびその方法
JPH03268089A (ja) 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法
JPH0475185A (ja) 入力装置
JP2950286B2 (ja) 画面イメージ読み取り装置
JP3077580B2 (ja) 文字読取装置
JPH0434655A (ja) 図面読取装置
JPH06251186A (ja) 文字認識誤り修正方法及び装置
JPH08137998A (ja) 認識辞書変更方法
JPH11224306A (ja) 文字認識装置及びその方法
JPH04293185A (ja) ファイリング装置
JPH0520490A (ja) 光学的文字読取修正システム