JP2790842B2 - 文字認識後処理方式 - Google Patents

文字認識後処理方式

Info

Publication number
JP2790842B2
JP2790842B2 JP1092894A JP9289489A JP2790842B2 JP 2790842 B2 JP2790842 B2 JP 2790842B2 JP 1092894 A JP1092894 A JP 1092894A JP 9289489 A JP9289489 A JP 9289489A JP 2790842 B2 JP2790842 B2 JP 2790842B2
Authority
JP
Japan
Prior art keywords
character
word
word dictionary
characters
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1092894A
Other languages
English (en)
Other versions
JPH0373086A (ja
Inventor
章 鈴木
末治 宮原
義政 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1092894A priority Critical patent/JP2790842B2/ja
Publication of JPH0373086A publication Critical patent/JPH0373086A/ja
Application granted granted Critical
Publication of JP2790842B2 publication Critical patent/JP2790842B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字認識装置等において、文字認識結果の
候補文字の画数を情報として利用し、正確に認識できな
かった文字を含んでいる場合においても、画数が近い正
確な候補文字を選択して訂正し、認識精度を向上させる
文字認識後処理方式に関する。
[従来の技術] 一般に文字認識装置は、認識結果として1入力文字に
対して複数個の候補文字とその距離値または類似度を出
力する。従来の文字認識後処理は、この認識結果と単語
辞書を照合し、単語辞書の各文字がそれと対応する位置
の候補文字集合中に存在すればその単語を正解としてい
た。しかしこの方法では、認識結果の候補文字の中に正
解文字が含まれていない場合には、正確に文字認識出力
が得られない欠点があった。
[発明が解決しようとする課題] 本発明は、文字認識後処理方式において、文字認識装
置の入力文字の画数と認識結果の候補文字の画数は誤っ
て認識した場合でもそれほど変化しないことが多い性質
を利用して、正確に認識できなかった文字を含んでいる
場合にも、近似した画数の文字の選択し、訂正精度を向
上させることを目的とする。
[課題を解決するための手段] 上記の課題を解決するために、本発明は、単語辞書、
単語辞書と文字認識結果を照合する単語辞書照合部、全
文字カテゴリの画数を記録した画数テーブル、単語辞書
照合部から出力された単語を受けて、所定の条件で動作
する画数照合部を備えている。
[作用] 単語辞書照合部において、認識した文字を単語辞書と
照合し、各単語に優先度を付加して最も優先度の高い単
語を単数もしくは複数出力し、全文字カテゴリの画数を
記録した画数テーブルと、単語辞書照合手段から出力さ
れた単語が複数存在しかつ該複数単語が同一の箇所で認
識結果の候補文字集合中に該当文字が存在しない場合、
画数照合部において画数テーブルを用いて単語集合の文
字の画数と認識結果の該箇所の上位の単数もしくは複数
の候補文字の画数の平均値とを比較し、もっとも近い該
平均値を該箇所に持つ単語を正解として出力する。
[実施例] 以下、本発明の一実施例について図面を用いて説明す
る。
第1図は本発明で対象とする文字認識後処理方式を構
成する装置の一実施例である。
第1図において、1は認識結果、2は単語辞書、3は
単語辞書照合部、4は画数テーブル、5は画数照合部、
6は訂正結果である。
文字認識による認識結果1は、最初に単語辞書照合部
3に入力される。第2図は、この単語辞書照合部3にお
ける処理のフローチャートである。また、第3図は、こ
のフローに従って、単語辞書照合部において単語を処理
する実施例を説明する図である。
第2図において、ステップS1は、文字パターン認識装
置において文字列を認識し、ステップS2において単語に
切り分け、S3において認識候補を順位をつけて各文字の
距離を算出し認識結果として所定の記憶場所に格納す
る。S4は、認識結果1と単語辞書2に格納されている単
語とを照合する段階、S5は照合した各単語について一致
した文字数と合計距離を計算して単語辞書照合部の中間
結果格納部に記憶する段階、S6はS5において処理された
データを一致文字数の大きい順にソートする処理を実行
する段階、S7で一致文字数の最大のグループを抽出した
後、S8でそのグループの中で合計距離値が小さい順にソ
ートし記憶場所に格納する。このようにして処理された
データは、S9において最小合計距離値を持つ単語数を判
断して単数であればの出力にその単語のみを次段の画
数照合部に送る判断出力を発生し、判断出力がであれ
ば、すなわち単語が複数存在すれば、それらの単語のほ
かに、認識結果の第1位候補文字のみを抽出した文字列
を画数照合部に送るよう動作する。
処理の実施例を説明する第3図において、11は文字認
識装置から送られてきた認識結果の例で、正解は「川口
市幸町」である。11の例では「口」を認識した結果の候
補文字集合中に正解が入っていない。
21は単語辞書2の内部表現を例である。単語辞書照合
部3では認識結果1と単語辞書2の中の各単語を照合
し、中間結果格納部31にいったん処理結果を保持し、次
に一致文字数の大きい順にソートし、一致文字数のもっ
とも大きいグループを抽出した後、そのグループの中で
合計距離値の小さい順にソートし単語辞書照合結果部32
に格納する。そして最も小さい合計距離値を持った単語
が単数存在する場合はその単語だけを次段の処理である
画数照合部5に送る。単語が複数存在する場合は、複数
個の単語全部と、文字認識結果の所定順位の候補文字か
ら作られる文字列を画数照合部5に渡す。この例では、
単語候補として「川崎市幸町」、「川口市幸町」、「川
越市幸町」、そして認識結果の候補文字が画数照合部5
に送られる。
第4図は画数照合部5における処理のフローチャート
であって、各レジスタに格納されるべき単語等のデータ
と、各段階毎の処理の内容を示している。
第5図は、第4図の処理フローに従った処理の実施例
であって、画数照合部5は、単語辞書照合部3から送ら
れた3つの単語候補を、二次元配列のレジスタa−1の
第1行から第3行に、また認識結果の候補文字をおなじ
く二次元配列のレジスタb−1の第1行から第3行に格
納する。次にレジスタa−1の内容を、第1行の第1文
字から第2行の第1文字というように、先頭から順に縦
方向に比較し、各列の文字の全部等しければ○、そうで
なければ×の記号をその列に記録する。第5図の例で
は、先頭から2番目の列に存在する文字が異なっている
ので×印の記号が記録される。
その後、レジスタa−1において、×印の記号が記録
されている列の文字をレジスタa−2に書き込み、また
レジスタb−1の文字の中でレジスタa−1の×印が記
録されている列と同じ列番号に属する候補文字を上位か
ら順番に、すなわち第1行、第2行・・・の順にレジス
タb−2に書き込む。
レジスタb−2に書き込む文字の数は自由に設定でき
るが、この実施例では上位3個の候補文字を書き込むよ
うに設定されている。第5図の例では、レジスタa−2
には「口」、「越」、「崎」が、レジスタb−2には
「ほ」、「は」、「に」、が書き込まれる。
次にレジスタa−2の各文字の画数をテーブル41を参
照して調べる。そしてレジスタb−2の各文字の画数を
画数テーブル41を参照して調べ、各画数を除算器55に送
り、画数の和を文字数の和で除してその平均値を求め
る。次にその平均画数とレジスタa−2の各文字の画数
と比較し、レジスタb−2の文字の平均画数ともっとも
近い画数を持ったレジスタa−2の文字を採用し、それ
を含む単語候補を正解として出力する。第5図の例で
は、「口」(画数3)が、レジスタb−2の平均画数の
画数(=3.3)に最も近いことから、それを含む「川口
市幸町」が訂正結果6として出力される。
なお、実施例では距離値を用いて候補文字の適否を判
定したが、類似度を用いても同様の処理を行うことがで
きる。
本発明を実施するための装置は、専用の回路を組み込
んで文字認識結果を入力とし、正解単語を出力とするこ
とが出来る集積回路として実現することもできるし、ま
た、汎用の情報処理回路に本発明の目的を達成できる機
能の制御回路を付加し、必要な文字情報などを記憶回路
に格納して実現することもできる。
[発明の効果] 以上のように、本発明は、文字認識後処理を行うに際
して、正確に認識されなかった文字を含む場合であって
も、画数の近い文字の中から所定の処理によって最適な
単語候補の選択を行うことが可能であり、これにより文
字認識をした後、正確に認識出来なかった文字の訂正処
理の高精度化が図れる。
【図面の簡単な説明】
第1図は本発明で対象とする文字認識後処理方式の一実
施例を示すブロック図、第2図は第1図の単語辞書照合
部3における処理例を説明するための図、第3図は第1
図の画数照合部5のにおける処理例を説明するためその
内部の各レジスタ及び画数テーブルの内容と、処理を示
す図、第4図は画数照合部における処理のフローチャー
ト、第5図は第4図の処理フローに従った処理の実施例
を示す図である。 1:認識結果 2:単語辞書 3:単語辞書照合部 4:画数テーブル 5:画数照合部 6:訂正結果 11:文字認識装置から送られてきた認識結果の例 21:単語辞書2の内部表現の例 31:中間結果格納部 32:単語辞書照合結果部 41:画数テーブル 51:レジスタa−1 52:レジスタb−1 53:レジスタa−2 54:レジスタb−2 55:除算器
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−316284(JP,A) 特開 昭63−268083(JP,A) 特開 昭61−49283(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/72 特許ファイル(PATOLIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字パターンを認識して単数ま
    たは複数の候補文字および標準パターンとの距離値また
    は類似度を生成する文字認識装置において、単語辞書
    と、該単語辞書と認識結果を照合し、優先度を各単語に
    付加して最も優先度の高い単語を単数もしくは複数出力
    する単語辞書照合部と、全文字カテゴリの画数を記録し
    た画数テーブルと、単語辞書照合部から出力された単語
    が複数存在し、かつ、該複数単語が同一の箇所で認識結
    果の候補文字集合中に該当文字が存在しない場合、該単
    語集合の文字の画数と認識結果の該箇所の上位の単数も
    しくは複数の候補文字の画数の平均値とを比較し、もっ
    とも近い該平均値を該箇所に持つ単語を正解として出力
    する画数照合部とからなることを特徴とする文字認識後
    処理方式。
JP1092894A 1989-04-14 1989-04-14 文字認識後処理方式 Expired - Lifetime JP2790842B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1092894A JP2790842B2 (ja) 1989-04-14 1989-04-14 文字認識後処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1092894A JP2790842B2 (ja) 1989-04-14 1989-04-14 文字認識後処理方式

Publications (2)

Publication Number Publication Date
JPH0373086A JPH0373086A (ja) 1991-03-28
JP2790842B2 true JP2790842B2 (ja) 1998-08-27

Family

ID=14067168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1092894A Expired - Lifetime JP2790842B2 (ja) 1989-04-14 1989-04-14 文字認識後処理方式

Country Status (1)

Country Link
JP (1) JP2790842B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540854A (ja) * 1991-08-06 1993-02-19 Oki Electric Ind Co Ltd 文字認識結果の後処理方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JP4660504B2 (ja) * 2007-05-22 2011-03-30 株式会社東芝 テキスト処理装置及びプログラム

Also Published As

Publication number Publication date
JPH0373086A (ja) 1991-03-28

Similar Documents

Publication Publication Date Title
US5982929A (en) Pattern recognition method and system
US4685142A (en) Method and device for handwritten letter recognition
KR100297482B1 (ko) 수기입력의문자인식방법및장치
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
JPH05108883A (ja) 文字認識方法及び装置
JP2673871B2 (ja) ニューラル・ネットワークによるパターン認識方法及び装置
US20100014757A1 (en) Method and System for Recognizing Characters and Character Groups in Electronically Represented Text
JP2790842B2 (ja) 文字認識後処理方式
CN113128504A (zh) 一种基于校验规则的ocr识别结果纠错方法、设备
CN115565182A (zh) 一种基于复杂度分组的手写汉字识别方法
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JP2671984B2 (ja) 情報認識装置
JPH08287188A (ja) 文字列認識装置
JP3374762B2 (ja) 文字認識方法及びその装置
JPH06215197A (ja) 文字認識方法および装置
JP2002312398A (ja) 文書検索装置
JPH0766423B2 (ja) 文字認識装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP2746345B2 (ja) 文字認識の後処理方法
EP0564826A2 (en) Resolution of case confusions by majority voting rule in on-line handwriting recognition
JP5986051B2 (ja) アラビア語テキストを自動的に認識するための方法
JPS6330991A (ja) 文字認識装置
CN116958995A (zh) 一种基于字符在平面位置信息的分段方法
JPS60138689A (ja) 文字認識方法
JPH10334187A (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090612

Year of fee payment: 11

EXPY Cancellation because of completion of term