JPH0484383A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0484383A
JPH0484383A JP2199602A JP19960290A JPH0484383A JP H0484383 A JPH0484383 A JP H0484383A JP 2199602 A JP2199602 A JP 2199602A JP 19960290 A JP19960290 A JP 19960290A JP H0484383 A JPH0484383 A JP H0484383A
Authority
JP
Japan
Prior art keywords
character
association
degree
character code
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2199602A
Other languages
English (en)
Other versions
JP2899377B2 (ja
Inventor
Masayuki Ishigami
正之 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2199602A priority Critical patent/JP2899377B2/ja
Publication of JPH0484383A publication Critical patent/JPH0484383A/ja
Application granted granted Critical
Publication of JP2899377B2 publication Critical patent/JP2899377B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、誤読文字の訂正結果を関連度テーブルに反映
させることによって誤読文字の訂正能率を向上させた文
字認識装置に関する。
〔従来技術〕
従来の文字認識装置においては、入力文字画像から特徴
を抽出し、その特徴パターンと予め比較基準として登録
されている標準特徴パターンとマツチングした後に、言
語処理に基づく後処理として、マツチング結果である候
補文字と単語辞書とを比較することにより、類似文字等
を識別する認識手法が採られている。
この従来の手法では、候補文字集合に正解が含まれてい
ない場合は、誤読文字が正しく訂正できないという欠点
があった。
そこで、候補文字集合に正解が含まれていない場合でも
、漢字読み取り装置の認識部から出力された候補文字集
合に類似文字テーブルで求めた正解の可能性のある類似
文字を追加することによって、誤読文字の訂正を可能に
した文字認識装置が提案されている(特開昭62−25
1986号公報)。
〔発明が解決しようとする課題〕
しかしながら、上記装置ではパターンマツチングによる
候補文字に、単に類似文字を加えるのみであるので、訂
正結果が類似文字テーブルに反映されないという問題が
あった。
本発明の目的は、誤読文字の訂正結果を関連度テーブル
に反映させることによって、単語処理による訂正能率の
向上を図った文字認識装置を提供することにある。
[課題を解決するための手段] 前記目的を達成するために、入力文字イメージの特徴を
抽出し、該抽出された特徴パターンと標準特徴パターン
をマツチングすることによって複数の候補文字コードと
その距離値を選出した後、言語情報を用いた後処理によ
って認識結果である文字コードを出力する文字認識装置
において、各文字コード間の関連の程度を表現した関連
度テブルと、該関連度テーブルの関連度を変更制御する
関連度更新手段と、パターンマツチングの処理によって
生成される複数の候補文字コードの内、第1位の候補文
字コードをキーにして前記関連度テーブルを検索し、該
キー文字と関連度が強くかつ前記複数の候補文字コード
と同じでない文字コードを追加文字コードとして、前記
複数の候補文字コードに追加し、該追加文字コードの関
連度を距離値に変換するマツチング処理部と、該追加文
字コードを含む複数の候補文字コードから単語辞書を参
照することによって、認識文字を決定する後処理部とを
設けている。
〔作 用〕
パターンマツチングの処理によって生成される複数の候
補文字コードの内、第1位の候補文字コードをキーにし
て関連度テーブルを検索し、該キー文字と関連度が強く
かつ前記複数の候補文字コードと同じでない文字コード
を追加文字コードとして追加し、前記追加文字コードが
後処理部の処理によって最終的な認識結果文字であるこ
とが確定したとき、関連度更新手段は前記追加文字コー
ドの関連度を強めるように制御する。また、最終的な認
識結果文字が誤っていた場合、修正文字が入力されると
関連度更新手段は該修正文字の関連度を強めるように制
御する。更に、複数の候補文字コードの内、第2位以下
の候補文字コードであって、該候補文字コードが後処理
によって最終的な認識結果となり、その認識文字が誤っ
ていた場合は、関連度更新手段が前記認識文字の関連度
を弱くするように制御する。
[実施例] 以下、本発明の一実施例を図面を用いて具体的に説明す
る。
第1[ilは、本発明の一実施例に係る文字認識装置の
ブロック構成図である。1は、図示しない半導体イメー
ジセンサ等によって文書が読み取られ、図示しない光電
変換・量子化部で文字像の濃淡を白黒の2値あるいは多
値に量子化され、量子化信号中から認識の単位となる1
文字分のパターンを切り出して、この切り出された文字
パターンに対して各種の正規化処理(位置、大きさ、傾
き等を正規化する)を行い、その正規化されたパターン
から特徴を抽出する特徴抽出部である2 2は、標準の
特徴パターンとその文字コードが記憶されている標準パ
ターン辞書、3は、抽出された特徴パターンと標準パタ
ーン辞書3内に記憶されている標準の特徴パターンとの
マツチングを行うとともに、後述する関連度テーブルを
参照することによって、候補文字コードを出力するマツ
チング処理部である。4は、各文字コード間の関連度を
保持している関連度テーブル、5は、後処理のための単
語等の言語情報を記憶している単語辞書であり、6は、
マツチング処理部3からの認識結果文字に対して、単語
辞書5を用いて言語知識に基づく後処理を行い、最終的
な認識結果を決定して出力する後処理部である。7は、
認識結果表示部及び訂正入力部、8は、外部(例えばオ
ペレータ)からの訂正入力あるいは後処理部6の入力に
よって関連度テーブル4の関連度を更新する関連度テー
ブル更新処理部である。9は上記処理部を制御する制御
部である。
第2図は、本発明の関連度テ〜プル4の構成を示す図で
ある。関連度テーブル4は文字コード間の関連度の強さ
を、つまり類似の度合いを表すもので、例えばキー文字
が「文」であるとき、「交」が最も関連が強く、次いで
「丈」 「支」 「六」の順となる。そして、認識結果
を類似文字について統計的に処理することによって、そ
の関連度の強さを数値化する。
以下、本発明の動作を図を用いて詳細に説明する。
制御部9は図示しないイメージセンサを動作させ、文書
を読み取る。読み取られた文書のイメージは前述したよ
うに量子化され、図示しない文字切り出し/正規化処理
部で1文字分の文字が切り出され、正規化される。正規
化処理された文字パタンは特徴抽出部】で特徴が抽出さ
れ、抽出された特徴パターンがマツチング処理部3に入
力される。
マツチング処理部3では、入力特徴パターンと標準パタ
ーン辞書2内の標準特徴パターンをマツチングし、候補
文字コードと距離値を求める。但し。
その距離は所定の閾値以下のもので、上位n個の候補文
字コードが求められる。
次に、制御部9は、各候補文字コードを用いて関連度テ
ーブル4を検索するようマツチング処理部3に対して指
令する。マツチング処理部3は第1位の候補文字コード
をキーにして関連度テーブル4を検索し、キー文字に対
応した類似文字を参照する。そして、参照したときに、
マツチング処理部3において候補文字コードとはならな
かった文字コードであって、キー文字と関連度の強い文
字コードがあれば、この文字コードの関連度を距離値に
変換して(例えば、関連度を定数倍したものを距離値と
するが、採用される認識アルゴリズムに応じて変換関数
が決まる)、この文字コードを先の候補文字コードに追
加して後処理の対象となる候補文字コードとする。
この追加処理によってマツチング処理部3の図示しない
ソーティング回路には、距離値の小さい順に、上位n個
の文字コードが保持される。
次いで、制御部9はマツチング処理m3に対して、マツ
チング処理の終了を指示し、マツチング処理部3内のソ
ーティング回路に保持されている上位n個の候補(文字
コード、距離値の組)を後処理部6に出力する。後処理
部6では、マツチング処理部4からの候補文字に対して
、単語辞書5を参照することによって最終的な認識結果
を決定して出力する。
最終的な認識の結果、追加された候補文字コードが選択
されると、制御部9は該追加候補文字をライン10を介
して後処理部6がら関速度更新部8に送る。関速度更新
部8は、制御部9がらの指令信号に従って該追加候補文
字の関連度を強くするように変更し、該当する関連度テ
ーブル4の関連度を書き換える。
他方、マツチング処理部3内のソーティング回路に保持
されている上位n個の候補文字の内、位とならなかった
候補文字が後処理部6の処理によって1位となり、その
1位の文字が誤っていた場合は、以下のように処理され
る。すなわち1位の文字(最終認識結果)を認識結果表
示部7に表示し、オペレータの確認によってその文字が
誤っていた場合は、訂正入力gl+7を用いて修正を指
示する。該指示に応答して、後処理部6に保持されてい
る1位の文字がライン10を介して関連度更新部8に送
られ、関連度更新部8は、制御部9からの指令信号に従
って該1位の文字の関連度を弱くするように変更し、該
当する関連度テーブル4の関連度を書き換える。またオ
ペレータによって修正された文字はライン11を介して
関連度更新部8に入力され、関連度更新部8は、制#部
9からの指令信号に従って該修正文字の関連度を強くす
るように変更し、該当する関連度テーブル4の関連度を
書き換える。
[発明の効果] 以上、説明したように、本発明によれば、後処理による
認識結果が関連度テーブルに反映されるので、訂正能率
が向上し、またオペレータによる訂正結果が関連度テー
ブルにも反映されるので、更に訂正能率が向上する。
【図面の簡単な説明】
第1図は、本発明の一実施例に係る文字認識装置のブロ
ック構成図、第2図は、本発明の関連度テーブルの構成
を示す図である。 】・・・特徴抽出部、  2・・・標準パターン辞書、
3・・・マツチング処理部、 4・・・関連度テーブル
5・単語辞書、 6・・後処理部、 7・・・認識結果表示部及び訂正入力部、8 =−関連
度テーブル更新処理部、  9・制御部。

Claims (4)

    【特許請求の範囲】
  1. (1)入力文字イメージの特徴を抽出し、該抽出された
    特徴パターンと標準特徴パターンをマッチングすること
    によって複数の候補文字コードとその距離値を選出した
    後、言語情報を用いた後処理によって認識結果である文
    字コードを出力する文字認識装置において、各文字コー
    ド間の関連の程度を表現した関連度テーブルと、該関連
    度テーブルの関連度を変更制御する関連度更新手段と、
    パターンマッチングの処理によって生成される複数の候
    補文字コードの内、第1位の候補文字コードをキーにし
    て前記関連度テーブルを検索し、該キー文字と関連度が
    強くかつ前記複数の候補文字コードと同じでない文字コ
    ードを追加文字コードとして、前記複数の候補文字コー
    ドに追加し、該追加文字コードの関連度を距離値に変換
    するマッチング処理部と、該追加文字コードを含む複数
    の候補文字コードから単語辞書を参照することによって
    、認識文字を決定する後処理部とを備えたことを特徴と
    する文字認識装置。
  2. (2)前記追加文字コードが後処理部の処理によって最
    終的な認識結果文字であることが確定したとき、前記関
    連度更新手段は前記追加文字コードの関連度を強めるよ
    うに制御することを特徴とする請求項(1)記載の文字
    認識装置。
  3. (3)最終的な認識結果文字を表示する表示手段と、表
    示された認識結果が誤っていた場合それを修正する修正
    手段とを備え、該修正手段によって修正文字が入力され
    ると前記関連度更新手段は該修正文字の関連度を強める
    ように制御することを特徴とする請求項(1)記載の文
    字認識装置。
  4. (4)前記複数の候補文字コードの内、第2位以下の候
    補文字コードであって、該候補文字コードが後処理によ
    って最終的な認識結果となり、その認識文字が誤ってい
    た場合は、前記関連度更新手段は、該認識文字の関連度
    を弱くするように制御することを特徴とする請求項(1
    )記載の文字認識装置。
JP2199602A 1990-07-27 1990-07-27 文字認識装置 Expired - Lifetime JP2899377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2199602A JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2199602A JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0484383A true JPH0484383A (ja) 1992-03-17
JP2899377B2 JP2899377B2 (ja) 1999-06-02

Family

ID=16410589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2199602A Expired - Lifetime JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Country Status (1)

Country Link
JP (1) JP2899377B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251204A (ja) * 1993-02-26 1994-09-09 Nec Corp 文字認識装置
CN110472701A (zh) * 2019-08-14 2019-11-19 广东小天才科技有限公司 文字纠错方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251204A (ja) * 1993-02-26 1994-09-09 Nec Corp 文字認識装置
CN110472701A (zh) * 2019-08-14 2019-11-19 广东小天才科技有限公司 文字纠错方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP2899377B2 (ja) 1999-06-02

Similar Documents

Publication Publication Date Title
JPH05108883A (ja) 文字認識方法及び装置
JPH087033A (ja) 情報処理方法及び装置
JPH0484383A (ja) 文字認識装置
JPS59229683A (ja) 認識処理装置
JPH076201A (ja) 文字認識パラメータ制御方法
JP2677271B2 (ja) 文字認識装置
JPH05120472A (ja) 文字認識装置
JP3442548B2 (ja) 文字認識方法および装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH0721303A (ja) 文字認識装置
JPH06274701A (ja) 単語照合装置
JPH03218567A (ja) 電子辞書
JPH03265080A (ja) 電子辞書
JP2851865B2 (ja) 文字認識装置
JPH0713999A (ja) 表認識装置
JPH09237322A (ja) 認識装置の候補修正方式
JPH02300972A (ja) 電子辞書
KR19980045246A (ko) 문서 인식 검증 장치
JPH04142690A (ja) パターン認識装置
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置
JPH11306289A (ja) 文字認識装置
JPH05298489A (ja) 文字認識方式
JPH10254997A (ja) 文字認識装置
JPH04148290A (ja) 文字認識装置
JP2001005910A (ja) 読取文字修正装置、読取文字修正方法、及び記憶媒体