JP2899377B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2899377B2
JP2899377B2 JP2199602A JP19960290A JP2899377B2 JP 2899377 B2 JP2899377 B2 JP 2899377B2 JP 2199602 A JP2199602 A JP 2199602A JP 19960290 A JP19960290 A JP 19960290A JP 2899377 B2 JP2899377 B2 JP 2899377B2
Authority
JP
Japan
Prior art keywords
character
relevancy
candidate
code
character code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2199602A
Other languages
English (en)
Other versions
JPH0484383A (ja
Inventor
正之 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2199602A priority Critical patent/JP2899377B2/ja
Publication of JPH0484383A publication Critical patent/JPH0484383A/ja
Application granted granted Critical
Publication of JP2899377B2 publication Critical patent/JP2899377B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、誤読文字の訂正結果を関連度テーブルに反
映させることによって誤読文字の訂正能率を向上させた
文字認識装置に関する。
〔従来技術〕
従来の文字認識装置においては、入力文字画像から特
徴を抽出し、その特徴パターンと予め比較基準として登
録されている標準特徴パターンとマッチングした後に、
言語処理に基づく後処理として、マッチング結果である
候補文字と単語辞書とを比較することにより、類似文字
等を識別する認識手法が採られている。
この従来の手法では、候補文字集合に正解が含まれて
いない場合は、誤読文字が正しく訂正できないという欠
点があった。
そこで、候補文字集合に正解が含まれていない場合で
も、漢字読み取り装置の認識部から出力された候補文字
集合に類似文字テーブルで求めた正解の可能性のある類
似文字を追加することによって、誤読文字の訂正を可能
にした文字認識装置が提案されている(特開昭62−2519
86号公報)。
〔発明が解決しようとする課題〕
しかしながら、上記装置ではパターンマッチングによ
る候補文字に、単に類似文字を加えるのみであるので、
訂正結果が類似文字テーブルに反映されないという問題
があった。
本発明の目的は、誤読文字の訂正結果を関連度テーブ
ルに反映させることによって、単語処理による訂正能率
の向上を図った文字認識装置を提供することにある。
〔課題を解決するための手段〕
前記目的を達成するために、入力文字イメージの特徴
を抽出し、該抽出された特徴パターンと標準特徴パター
ンをマッチングすることによって複数の候補文字コード
とその距離値を選出した後、言語情報を用いた後処理に
よって認識結果である文字コードを出力する文字認識装
置において、各文字コード間の関連の程度を表現した関
連度テーブルと、該関連度テーブルの関連度を変更制御
する関連度更新手段と、パターンマッチングの処理によ
って生成される複数の候補文字コードの内、第1位の候
補文字コードをキーにして前記関連度テーブルを検索
し、該キー文字と関連度が強くかつ前記複数の候補文字
コードと同じでない文字コードを追加文字コードとし
て、前記複数の候補文字コードに追加し、該追加文字コ
ードの関連度を距離値に変換するマッチング処理部と、
該追加文字コードを含む複数の候補文字コードから単語
辞書を参照することによって、認識文字を決定する後処
理部とを設けている。
〔作用〕
パターンマッチングの処理によって生成される複数の
候補文字コードの内、第1位の候補文字コードをキーに
して関連度テーブルを検索し、該キー文字と関連度が強
くかつ前記複数の候補文字コードと同じでない文字コー
ドを追加文字コードとして追加し、前記追加文字コード
が後処理部の処理によって最終的な認識結果文字である
ことが確定したとき、関連度更新手段は前記追加文字コ
ードの関連度を強めるように制御する。また、最終的な
認識結果文字が誤っていた場合、修正文字が入力される
と関連度更新手段は該修正文字の関連度を強めるように
制御する。更に、複数の候補文字コードの内、第2位以
下の候補文字コードであって、該候補文字コードが後処
理によって最終的な認識結果となり、その認識文字が誤
っていた場合は、関連度更新手段が前記認識文字の関連
度を弱くするように制御する。
〔実施例〕
以下、本発明の一実施例を図面を用いて具体的に説明
する。
第1図は、本発明の一実施例に係る文字認識装置のブ
ロック構成図である。1は、図示しない半導体イメージ
センサ等によって文書が読み取られ、図示しない光電変
換・量子化部で文字像の濃淡を白黒の2値あるいは多値
に量子化され、量子化信号中から認識の単位となる1文
字分のパターンを切り出して、この切り出された文字パ
ターンに対して各種の正規化処理(位置、大きさ、傾き
等を正規化する)を行い、その正規化されたパターンか
ら特徴を抽出する特徴抽出部である。2は、標準の特徴
パターンとその文字コードが記憶されている標準パター
ン辞書、3は、抽出された特徴パターンと標準パターン
辞書3内に記憶されている標準の特徴パターンとのマッ
チングを行うとともに、後述する関連度テーブルを参照
することによって、候補文字コードを出力するマッチン
グ処理部である。4は、各文字コード間の関連度を保持
している関連度テーブル、5は、後処理のための単語等
の言語情報を記憶している単語辞書であり、6は、マッ
チング処理部3からの認識結果文字に対して、単語辞書
5を用いて言語知識に基づく後処理を行い、最終的な認
識結果を決定して出力する後処理部である。7は、認識
結果表示部及び訂正入力部、8は、外部(例えばオペレ
ータ)からの訂正入力あるいは後処理部6の入力によっ
て関連度テーブル4の関連度を更新する関連度テーブル
更新処理部である。9は上記処理部を制御する制御部で
ある。
第2図は、本発明の関連度テーブル4の構成を示す図
である。関連度テーブル4は文字コード間の関連度の強
さを、つまり類似の度合いを表すもので、例えばキー文
字が「文」であるとき、「交」が最も関連が強く、次い
で「丈」「支」「六」の順となる。そして、認識結果を
類似文字について統計的に処理することによって、その
関連度の強さを数値化する。
以下、本発明の動作を図を用いて詳細に説明する。
制御部9は図示しないイメージセンサを動作させ、文
書を読み取る。読み取られた文書のイメージは前述した
ように量子化され、図示しない文字切り出し/正規化処
理部で1文字分の文字が切り出され、正規化される。正
規化処理された文字パターンは特徴抽出部1で特徴が抽
出され、抽出された特徴パターンがマッチング処理部3
に入力される。マッチング処理部3では、入力特徴パタ
ーンと標準パターン辞書2内の標準特徴パターンをマッ
チングし、候補文字コードと距離値を求める。但し、そ
の距離は所定の閾値以下のもので、上位n個の候補文字
コードが求められる。
次に、制御部9は、各候補文字コードを用いて関連度
テーブル4を検索するようマッチング処理部3に対して
指令する。マッチング処理部3は第1位の候補文字コー
ドをキーにして関連度テーブル4を検索し、キー文字に
対応した類似文字を参照する。そして、参照したとき
に、マッチング処理部3において候補文字コードとはな
らなかった文字コードであって、キー文字と関連度の強
い文字コードがあれば、この文字コードの関連度を距離
値に変換して(例えば、関連度を定数倍したものを距離
値とするが、採用される認識アルゴリズムに応じて変換
関数が決まる)、この文字コードを先の候補文字コード
に追加して後処理の対象となる候補文字コードとする。
この追加処理によってマッチング処理部3の図示しな
いソーティング回路には、距離値の小さい順に、上位n
個の文字コードが保持される。
次いで、制御部9はマッチング処理部3に対して、マ
ッチング処理の終了を指示し、マッチング処理部3内の
ソーティング回路に保持されている上位n個の候補(文
字コード、距離値の組)を後処理部6に出力する。後処
理部6では、マッチング処理部4からの候補文字に対し
て、単語辞書5を参照することによって最終的な認識結
果を決定して出力する。
最終的な認識の結果、追加された候補文字コードが選
択されると、制御部9は該追加候補文字をライン10を介
して後処理部6から関連度更新部8に送る。関連度更新
部8は、制御部9からの指令信号に従って該追加候補文
字の関連度を強くするように変更し、該当する関連度テ
ーブル4の関連度を書き換える。
他方、マッチング処理部3内のソーティング回路に保
持されている上位n個の候補文字の内、1位とならなか
った候補文字が後処理部6の処理によって1位となり、
その1位の文字が誤っていた場合は、以下のように処理
される。すなわち1位の文字(最終認識結果)を認識結
果表示部7に表示し、オペレータの確認によってその文
字が誤っていた場合は、訂正入力部7を用いて修正を指
示する。該指示に応答して、後処理部6に保持されてい
る1位の文字がライン10を介して関連度更新部8に送ら
れ、関連度更新部8は、制御部9からの指令信号に従っ
て該1位の文字の関連度を弱くするように変更し、該当
する関連度テーブル4の関連度を書き換ええる。またオ
ペレータによって修正された文字はライン11を介して関
連度更新部8に入力され、関連度更新部8は、制御部9
からの指令信号に従って該修正文字の関連度を強くする
ように変更し、該当する関連度テーブル4の関連度を書
き換える。
〔発明の効果〕
以上、説明したように、本発明によれば、後処理によ
る認識結果が関連度テーブルに反映されるので、訂正能
率が向上し、またオペレータによる訂正結果が関連度テ
ーブルにも反映されるので、更に訂正能率が向上する。
【図面の簡単な説明】
第1図は、本発明の一実施例に係る文字認識装置のブロ
ック構成図、第2図は、本発明の関連度テーブルの構成
を示す図である。 1…特徴抽出部、2…標準パターン辞書、3…マッチン
グ処理部、4…関連度テーブル、5…単語辞書、6…後
処理部、7…認識結果表示部及び訂正入力部、8…関連
度テーブル更新処理部、9…制御部。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字イメージの特徴を抽出し、該抽出
    された特徴パターンと標準特徴パターンをマッチングす
    ることによって複数の候補文字コードとその距離値を選
    出した後、言語情報を用いた後処理によって認識結果で
    ある文字コードを出力する文字認識装置において、各文
    字コード間の関連の程度を表現した関連度テーブルと、
    該関連度テーブルの関連度を変更制御する関連度更新手
    段と、パターンマッチングの処理によって生成される複
    数の候補文字コードの内、第1位の候補文字コードをキ
    ーにして前記関連度テーブルを検索し、該キー文字と関
    連度が強くかつ前記複数の候補文字コードと同じでない
    文字コードを追加文字コードとして、前記複数の候補文
    字コードに追加し、該追加文字コードの関連度を距離値
    に変換するマッチング処理部と、該追加文字コードを含
    む複数の候補文字コードから単語辞書を参照することに
    よって、認識文字を決定する後処理部とを備えたことを
    特徴とする文字認識装置。
  2. 【請求項2】前記追加文字コードが後処理部の処理によ
    って最終的な認識結果文字であることが確定したとき、
    前記関連度更新手段は前記追加文字コードの関連度を強
    めるように制御することを特徴とする請求項(1)記載
    の文字認識装置。
  3. 【請求項3】最終的な認識結果文字を表示する表示手段
    と、表示された認識結果が誤っていた場合それを修正す
    る修正手段とを備え、該修正手段によって修正文字が入
    力されると前記関連度更新手段は該修正文字の関連度を
    強めるように制御することを特徴とする請求項(1)記
    載の文字認識装置。
  4. 【請求項4】前記複数の候補文字コードの内、第2位以
    下の候補文字コードであって、該候補文字コードが後処
    理によって最終的な認識結果となり、その認識文字が誤
    っていた場合は、前記関連度更新手段は、該認識文字の
    関連度を弱くするように制御することを特徴とする請求
    項(1)記載の文字認識装置。
JP2199602A 1990-07-27 1990-07-27 文字認識装置 Expired - Lifetime JP2899377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2199602A JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2199602A JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0484383A JPH0484383A (ja) 1992-03-17
JP2899377B2 true JP2899377B2 (ja) 1999-06-02

Family

ID=16410589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2199602A Expired - Lifetime JP2899377B2 (ja) 1990-07-27 1990-07-27 文字認識装置

Country Status (1)

Country Link
JP (1) JP2899377B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251204A (ja) * 1993-02-26 1994-09-09 Nec Corp 文字認識装置
CN110472701B (zh) * 2019-08-14 2023-07-07 广东小天才科技有限公司 文字纠错方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JPH0484383A (ja) 1992-03-17

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
JPH05108883A (ja) 文字認識方法及び装置
JPH087033A (ja) 情報処理方法及び装置
JP2899377B2 (ja) 文字認識装置
JP2954968B2 (ja) 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法
JP2671985B2 (ja) 情報認識方法
JPS59229683A (ja) 認識処理装置
JPH06274701A (ja) 単語照合装置
JPH051512B2 (ja)
JP2851865B2 (ja) 文字認識装置
JP2677271B2 (ja) 文字認識装置
JPH0484380A (ja) 文字認識装置
JPH0562020A (ja) 文字認識装置
JPH076201A (ja) 文字認識パラメータ制御方法
JPH0713999A (ja) 表認識装置
JPH06176206A (ja) 文字認識装置
JP2746899B2 (ja) 文字認識装置
JP2001005910A (ja) 読取文字修正装置、読取文字修正方法、及び記憶媒体
JPH05120472A (ja) 文字認識装置
JPS63268083A (ja) 単語認識装置
JPS60138689A (ja) 文字認識方法
JPH11306289A (ja) 文字認識装置
JPH05298489A (ja) 文字認識方式
JPH04148290A (ja) 文字認識装置
JPH02126367A (ja) 文字認識機能付き電子辞書装置