JPH06290297A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06290297A
JPH06290297A JP5100337A JP10033793A JPH06290297A JP H06290297 A JPH06290297 A JP H06290297A JP 5100337 A JP5100337 A JP 5100337A JP 10033793 A JP10033793 A JP 10033793A JP H06290297 A JPH06290297 A JP H06290297A
Authority
JP
Japan
Prior art keywords
character
correction
recognition
feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5100337A
Other languages
English (en)
Inventor
Minako Kuwata
みな子 桑田
Yoshihiro Kitamura
義弘 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5100337A priority Critical patent/JPH06290297A/ja
Publication of JPH06290297A publication Critical patent/JPH06290297A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 同じ修正を複数回行わなければならないとい
う煩雑さを解消し、自動化することで修正にかかるエネ
ルギーを低減させる。 【構成】 画像特徴蓄積部11は、認識部4で用いる特
徴情報を位置情報とともに蓄積する。特徴抽出部3は、
操作者が修正した修正履歴情報から画像特徴蓄積部11
の情報を抽出する。認識部4は、抽出された参照特徴と
以降の特徴とのマッチングを行い、その結果に基づいて
認識結果修正部8により自動修正を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に関し、
より詳細には、修正エディタでの文字認識結果の修正作
業を学習し、自動的に一括処理することを可能とする文
字認識装置に関する。例えば、認識結果の修正が必要で
ある文字認識装置や音声認識装置に適用されるものであ
る。
【0002】
【従来の技術】本発明に係る従来技術を記載した公知文
献としては、例えば、特開平3−222080号公報に
「文字パターン認識回路」が提案されている。この公報
のものは、該認識の結果に対するオペレータの修正操作
回数を低減することを可能とするためのもので、文字抽
出に誤りを起こした画像パターンが修正情報と共に記憶
され、次に同様な画像パターンの文字認識を行なうとき
に、認識対象の画像パターンが記憶手段の画像パターン
と一致すると判定手段により判定されたときには、修正
情報に基づき認識対象の画像パターンの修正が画像処理
手段により行なわれるものである。このため、1度修正
情報の入力を行なった画像パターンについては誤認識を
生じることがない。その結果、ユーザの修正操作回数が
減少するものである。
【0003】
【発明が解決しようとする課題】前述のように、従来の
文字認識装置は、認識後、認識結果を修正エディタなど
の修正装置に表示し、誤認識の修正を行なわなければな
らない。ところが、例えば、文字認識装置であれば、認
識の対象紙面のある特定の活字に特徴がある場合など
に、ある文字を何度も同じように誤認識することがあ
る。このとき、修正部で同じ修正を複数回行なわなけれ
ばならなかった。このように、誤認識が恒常的に出現す
る場合、修正する労力が膨大となり、不都合であった。
【0004】本発明は、このような実情に鑑みてなされ
たもので、同じ修正を複数回行わなければならないとい
う煩雑さを解消し、自動化することで修正にかかる労力
を低減するようにした文字認識装置を提供することを目
的としている。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、修正作業を自動的に一括処理する機能を
有する文字認識装置において、認識部で用いる特徴情報
を位置情報とともに蓄積する特徴蓄積手段と、操作者が
修正した履歴情報を記憶する記憶手段と、修正履歴情報
から前記特徴蓄積手段の情報を取り出す挿出手段と、前
記特徴蓄積手段の情報を逐次参照する参照手段と、参照
した特徴と以降の特徴とをマッチングする照合手段と、
マッチングの結果を判定する判定手段と、該判定手段の
判定により認識結果を自動修正する修正手段とから成る
ことを特徴としたものである。
【0006】
【作用】本発明は、文字や音声などの認識装置におい
て、認識処理中に用いた各(文字や音声)パターンの特
徴をメモリしておき、修正用エディタ等により、操作者
が誤認識部分の修正を行なった時、その対応するパター
ンの特徴データをもとに、以降(まだ未修正である認識
結果部分)の特徴データを逐次評価し、同一パターンと
判定されたものに対して、同一の修正を行なうことによ
り、修正を自動的に一括処理するものである。
【0007】
【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による文字認識装置の一実施例を
説明するための構成図で、図中、1はスキャナ、2は文
字切出部、3は特徴抽出部、4は認識部、5は標準パタ
ーン部、6は認識後処理部、7は後処理辞書、8は認識
結果修正部(修正エディタ)、9は自動修正処理部、1
0は出力部、11は画像特徴蓄積部である。
【0008】スキャナ1により画像入力を行い、文字切
出部2により前記スキャナ1からOCR(Optical Char
acter Reader:光学文字読取装置)に取り込まれた画像
を1文字毎に切り出す。特徴抽出部3は、前記文字切出
部2により切り出された1文字画像を情報量の小さい画
像特徴に加工される。画像特徴蓄積部11は、各文字の
画像特徴を文字位置情報とともに蓄積する。認識部4
は、各文字特徴を標準パターン部5に記憶されている標
準パターンとパターン照合する。認識後、処理部6に
は、前記認識部4により認識された認識結果コードが送
られ、言語処理等の後処理を行う。認識結果修正部8に
は、認識結果コードが文字位置情報とともに送られ、出
力部10により文字修正画面に表示される。自動修正処
理部9は、操作者により認識結果の自動修正が行われ
る。
【0009】図2は、本発明による文字認識装置の動作
を説明するためのフローチャートである。以下、各ステ
ップに従って順に説明する。なお、以下の実施例は、O
CRで実現した例を用いて説明する。step1画像入力 まず、スキャナにより画像入力を行う。step2文字切り出し スキャナからOCRに取り込まれた画像は文字切出部に
おいて、1文字毎の画像に切り出される。step3画像特徴抽出 次に、前記ステップで切り出された1文字画像は、特徴
抽出部に送られ、情報量の小さい画像特徴に加工され
る。step4画像特徴蓄積 ここにおいて、各文字の画像特徴は文字位置情報ととも
に画像特徴蓄積部に蓄積される。
【0010】step5パターンマッチング 各文字特徴は認識部に送られ、標準パターンとパターン
照合される。step6認識結果候補コードソート 次に、認識結果候補コードが決められる。step7認識結果候補コード出力 認識結果コードは後処理部に送られる。step8認識後処理 言語処理等の後処理を行う。step9認識後処理出力 認識結果コードは、前記step8を経て、修正部へ文字位
置情報とともに送られる。
【0011】step10認識結果出力 修正部では、認識部より送られた認識結果を文字修正画
面に表示する。step11認識結果修正入力 操作者は、この文字修正画面で、誤認識文字を正解コー
ドに修正する。step12自動修正スイッチ選択 操作者が修正を行なった時、操作者は、以後の認識結果
の自動修正を行なうか行なわないかのスイッチを選択す
る。step13特徴参照 選択されない場合は、自動修正を行なわない。自動修正
を行なうスイッチが選択された場合は、現在カーソルの
ある修正された文字X1(修正以前はX0)とそれ以後
の文字の画像特徴すべてが、特徴蓄積部から参照され
る。step14修正文字特徴マッチング 修正された誤認識文字の画像特徴とマッチングが行われ
る。step15認識結果自動修正 画像特徴のマッチングが、ある閾値以上の値で成立した
文字は、誤認識文字X0と同じ文字とみなされ、その認
識結果は自動的に文字X1に修正される。step16OCR認識結果出力 修正を終えた1連の文字コード列は、出力部に送られて
出力される。
【0012】次に、画像特徴蓄積部及び認識結果修正部
の処理について説明する。すなわち、画像特徴蓄積部に
おける文字を切り出し後の画像特徴蓄積方法及び認識結
果修正部の各ステップの処理の具体的なデータの流れに
ついて説明する。OCRに入力される画像は、一般的
に、ある程度の文字分量のある文書画像である。文字切
出部では、全体画像を入力とし、文字切り出しされた画
像とその座標を出力とする。今、図3に示すような画像
が入力されたとすると、文字切出部は、これより、各文
字について以下の〜の情報を出力する。なお、図4
は図3中のA部の切り出し例である。 最初から何番目の文字であるかの情報n(位置情報) n文字目の矩形の始点X座標SXn、Y座標SYn n文字目の矩形の終点EXn座標、Y座標EYn 特徴抽出部では、この情報を入力として画像の特徴を抽
出し、各文字について以下の,情報を出力する。 最初から何番目の文字であるかの情報n(位置情報) n文字目の特徴 これらの情報は文字特徴蓄積部に送られ、図5の形で保
管される。以上が、画像特徴蓄積部の蓄積方法の実施例
である。
【0013】図6は、認識結果修正部と自動修正処理部
の動作を説明するためのフローチャートである。以下、
各ステップに従って順に説明する。step1認識結果出力 認識部から以下の〜の認識結果を受け取って画面に
出力する。出力例を図7に示す。 各文字の認識結果第1位候補群 n文字目の矩形の始点X座標SXn、Y座標SYn n文字目の矩形の終点EXn座標、Y座標EYn 各文字の第1位から第5位認識候補群 step1は、認識結果(第1位の集合であり、これによっ
て各文字間をカーソル移動し、現在の修正箇所を操作者
が選ぶことができる)、および座標から割り出される1
文字画像、および現在カーソルのある文字の候補文字群
(第1位から第5位)を、操作者にわかり易く表示する
ものである。
【0014】step2認識結果修正入力 操作者は、前記認識結果出力ステップによって、出力さ
れた認識結果から、誤認識された文字があるかどうかを
チェックする。チェックは、前記認識結果出力ステップ
で出力された画面を見ながら行なわれる。誤認識された
文字がなければ、操作者は、認識結果修正入力ステップ
を終了させ、1連の各文字の認識結果第1候補文字コー
ド列を出力部のOCR認識結果出力ステップに送る。誤
認識があった場合、操作者は、誤認識された文字Afを
正解文字Atに修正する。この時、本ステップは、内部
で以下の,の情報を修正履歴バッファに書き込む
(図8)。 修正された文字が最初から何番目の文字であるかの情
報n(位置情報) 修正した文字コードAt
【0015】step3自動修正スイッチ選択 次に、操作者は、現在カーソルのある文字について、認
識結果修正入力ステップで行なった修正を以下の認識結
果についても行なうかどうかを判断し、行なうのであれ
ば、自動修正スイッチを選択する。自動修正スイッチを
選択しない場合は、認識結果修正入力ステップに戻る。step4特徴参照 自動修正スイッチ選択ステップで、自動修正スイッチが
選択された場合、現在カーソルのある文字について、認
識結果修正入力ステップで修正履歴バッファに書き込ま
れた情報が参照される。本ステップは、この情報の位置
情報から、特徴蓄積部に蓄積された特徴を取り出し、バ
ッファT[ ][ ]にコピーする(図9)。 step5修正文字特徴マッチング,認識結果自動修正 特徴参照ステップで取り出された特徴T[ ][ ]を、特徴
蓄積部に蓄積された該当文字以降の各特徴と、マッチン
グを行なう(図10)。マッチングの結果が、ある閾値
を越えた場合、その特徴の文字番号を元に認識結果コー
ド群をサーチし、認識結果コードを自動的に、修正履歴
バッファの修正文字コードAtに修正する。当然、画面
に表示された認識結果コード群は、正しい認識結果に修
正される。この処理を各文字認識結果すべてについて行
ない、認識結果修正入力ステップに戻る。
【0016】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。すなわち、認識部
で認識を行なう時に利用したデータの特徴を蓄積する画
像特徴蓄積部を有しており、修正部で修正を行なう場
合、修正した箇所の特徴を先に蓄積した蓄積部から参照
し、以後の特徴とマッチングを行ない、マッチする箇所
について同じものとみなして自動的に修正を行なうよう
にしたので、修正作業の煩雑さが解決される。
【図面の簡単な説明】
【図1】本発明による文字認識装置の一実施例を説明す
るための構成図である。
【図2】本発明による文字認識装置の動作を説明するた
めのフローチャートである。
【図3】本発明による入力画像例を示す図である。
【図4】本発明による文字切出部の出力例を示す図であ
る。
【図5】本発明による文字特徴蓄積部のデータ保管状態
を示す図である。
【図6】本発明による認識結果修正部と自動修正処理部
のフローチャートである。
【図7】本発明による認識結果修正部の認識結果出力の
表示例を示す図である。
【図8】本発明による認識結果修正入力の表示例を示す
図である。
【図9】本発明による自動修正スイッチが選択された後
の特徴参照の実施例を示す図である。
【図10】本発明による修正文字特徴マッチングの実施
例を示す図である。
【符号の説明】
1…スキャナ、2…文字切出部、3…特徴抽出部、4…
認識部、5…標準パターン部、6…認識後処理部、7…
後処理辞書、8…認識結果修正部(修正エディタ)、9
…自動修正処理部、10…出力部、11…画像特徴蓄積
部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 修正作業を自動的に一括処理する機能を
    有する文字認識装置において、認識部で用いる特徴情報
    を位置情報とともに蓄積する特徴蓄積手段と、操作者が
    修正した履歴情報を記憶する記憶手段と、修正履歴情報
    から前記特徴蓄積手段の情報を取り出す抽出手段と、前
    記特徴蓄積手段の情報を逐次参照する参照手段と、参照
    した特徴と以降の特徴とをマッチングする照合手段と、
    マッチングの結果を判定する判定手段と、該判定手段の
    判定により認識結果を自動修正する修正手段とから成る
    ことを特徴とする文字認識装置。
JP5100337A 1993-04-02 1993-04-02 文字認識装置 Pending JPH06290297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5100337A JPH06290297A (ja) 1993-04-02 1993-04-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5100337A JPH06290297A (ja) 1993-04-02 1993-04-02 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06290297A true JPH06290297A (ja) 1994-10-18

Family

ID=14271325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5100337A Pending JPH06290297A (ja) 1993-04-02 1993-04-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06290297A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230658A (ja) * 2008-03-25 2009-10-08 Mitsubishi Electric Corp 文字検索システム
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
WO2015178066A1 (ja) * 2014-05-22 2015-11-26 ソニー株式会社 情報処理装置および情報処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230658A (ja) * 2008-03-25 2009-10-08 Mitsubishi Electric Corp 文字検索システム
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
US8971670B2 (en) 2011-09-30 2015-03-03 International Business Machines Corporation Proof reading of text data generated through optical character recognition
WO2015178066A1 (ja) * 2014-05-22 2015-11-26 ソニー株式会社 情報処理装置および情報処理方法

Similar Documents

Publication Publication Date Title
CN115565179A (zh) 一种字符识别后纠错方法、系统及装置
JPH06290297A (ja) 文字認識装置
JP3230641B2 (ja) 文字列検索装置
KR950001061B1 (ko) 문서인식 수정장치
EP0622752A2 (en) Apparatus and method for a lexical post-processor for a neural network-based character processor
JPH06215184A (ja) 抽出領域のラベリング装置
JP3037727B2 (ja) Ocrシステム
JP3268084B2 (ja) 帳票読取システム
JP2899377B2 (ja) 文字認識装置
JP2732527B2 (ja) 文字切出し方式
JPH04372086A (ja) 文字認識装置
JP2812392B2 (ja) 文字処理装置及び方法
JPH0520492A (ja) 文書認識修正装置
JP3077580B2 (ja) 文字読取装置
JPH05120472A (ja) 文字認識装置
JPS59123082A (ja) 文字認識装置における修正方式
JPH0212391A (ja) 文字認識方式
JPH0758497B2 (ja) 文字認識装置
JPH10134139A (ja) 画像認識修正方法およびその装置
JPH076203A (ja) 文字認識装置
JPH04268684A (ja) 認識文字の修正方法
JPH1069518A (ja) 文字認識方法およびその装置
JPH05298488A (ja) 光学的文字読取装置
JPH09305712A (ja) 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JPH076201A (ja) 文字認識パラメータ制御方法