JPH0420229B2 - - Google Patents

Info

Publication number
JPH0420229B2
JPH0420229B2 JP58063501A JP6350183A JPH0420229B2 JP H0420229 B2 JPH0420229 B2 JP H0420229B2 JP 58063501 A JP58063501 A JP 58063501A JP 6350183 A JP6350183 A JP 6350183A JP H0420229 B2 JPH0420229 B2 JP H0420229B2
Authority
JP
Japan
Prior art keywords
character
word
candidate
character code
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58063501A
Other languages
English (en)
Other versions
JPS59188783A (ja
Inventor
Yukyasu Iida
Toshiaki Sugimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58063501A priority Critical patent/JPS59188783A/ja
Publication of JPS59188783A publication Critical patent/JPS59188783A/ja
Publication of JPH0420229B2 publication Critical patent/JPH0420229B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は、手書き漢字のように字形が複雑で変
形が多様な文字を光学的に読み取る文字読取装置
において、入力文字列の候補文字コード列と予め
用意された単語辞書の文字コード列とを比較し、
エラー、リジエクト文字を修正する文字列判定処
理方式に関するものである。
(2) 従来技術 手書き漢字読取りでは、膨大な字種と筆記者に
よつて様々に変形する文字を認識対象とするた
め、精度よく文字を読取ることが難しい。文字の
高精度認識を達成する方法として、入力される単
語を予め用意しておき、読取結果と辞書とを照合
し、エラー、リジエクト文字を修正するよう手法
が提案されている。従来の単語照合処理では、入
力文字列の候補文字列と単語辞書内のすべての単
語とを比較し、候補文字列と一致する単語を入力
の答えとすることで、エラー、リジエクトを修正
していた。しかし、手書き漢字の認識では、誤読
率を抑え、一意に候補文字を絞ることは難しいた
め、1つの文字に対し複数の候補文字を考えなけ
ればならず、対象の単語数が多くなれば単語の照
合処理に要する時間が増大し、読取り速度の低下
を招くという欠点をもつていた。
(3) 発明の目的および要点 本発明は、文字認識装置から入力文字の字形に
類似した文字のコードを類似度の高い順に出力さ
せ、該候補文字コードを組合せて得られる候補文
字コード列の中から入力文字列の正解である確率
が高いものから順に単語辞書のインデツクスとリ
ンク情報を用いて高速に単語照合を行なうことを
特徴とし、その目的は読取り速度を低下させるこ
となく手書き漢字等の複雑な文字を高精度に読取
ることにある。
(4) 発明の実施例 第1図は、本発明の実施例であり、10は共通
制御部、11は共通制御部と各部との結線、20
は走査部、30は認識部、40は照合順序テーブ
ル記憶部、50は単語辞書記憶部、60は単語照
合部、61は単語照合部60と認識部30との結
線、62は単語照合部60と照合順序テーブル記
憶部40との結線、63は単語照合部60と単語
辞書記憶部50との結線、64は出力線である。
これを動作するには、共通制御部10の指令に
より、走査部20は帳票上の文字を走査し、光電
変換して得られる画信号を認識部30に転送す
る。認識部30は、共通制御部10の指令によ
り、入力文字の字形と各文字の標準字形との類似
度を計算し、類似度の高い順に複数の候補文字の
コードを単語照合部60に出力する。単語照合部
60は照合順序テーブル記憶部40に記憶されて
いる照合順序テーブルの先頭に書かれた候補の組
合せを取りその組合せに対応する候補文字コード
列が単語辞書記憶部50に存在するか否かを調
べ、存在すれば、その文字コード列を出力線64
に出力する。もし、当該文字コード列がなけれ
ば、照合順序テーブルの次の候補の組合せの文字
コード列が辞書に存在するか否かを調べ、存在し
ていれば、当該文字コード列を出力線64に出力
する。辞書内に当該文字コード列が記憶されてな
ければ、照合順序テーブルの順序に従つて同様の
処理を繰り返す。
第2図は、照合順序テーブルの説明図であり、
同図aの文字列の長さ(文字列の文字数)が2の
場合の入力文字の候補を示し、fj iはi番目の入力
文字に対するj位の候補を表わす。同図bは照合
順序テーブルの例を示したもので、テーブル内の
数字は対応する文字位置の候補の順位を意味する
ものであり、このテーブルの候補の組合せは、該
組合せで得られる候補文字コード列が正解となる
確率の高い順に並べられている。例えば、第2図
bの照合順序テーブルの先頭は、1,1となつて
おりこれは、同図bの2文字からの入力文字列の
候補の中で、各入力文字の候補の1位をとつたも
の(即ち、C1 1,C1 2)が最も正解となる確率が高
いことを示しており、2,2の組合せ(即ち、
C1 2,C2 2)は、6番目に入力の正解となる確率の
高い組合せということを示している。このような
テーブルを考えこの順序で辞書を検索すれば、高
速に正解単語を捜すことができる。(即ち、高速
に単語照合が行なえる。) 照合順序テーブルは文字列の長さlごとに用意
されるもので、具体的には、候補のn位に正解が
ある確率P(n)を求め各組合わ(j1,j2,…,jl
に対して確率の積li=1 P(ji)(li=1 P(ji)は組合せ
(j1,j2,……,jl)に対応する候補文字列が正解
となる確率を意味する)の大きい順に組合せを並
べたものである。
第3図は単語辞書の構造を示したものであり、
51および52はインデツクス、53は単語テー
ブルである。辞書は、入力文字列Cj1 1,Cj2 2,Cj3 3
予め定めた複数文字位置の文字(図では、先頭の
文字Cj1 1と最後の文字Cj3 3)のいずれかをキーとし
て検索を行なう(以後、特定文字位置をキー位置
と呼ぶ。図ではキー位置の先頭文字位置をF、最
後の文字位置をLで表わしている。また、キー位
置にある文字をキー文字と呼ぶことにし、同じキ
ー文字を持つとは、キー位置に同じ文字を持つこ
とを意味するものとする。)インデツクスはキー
位置に対応して複数であり、各文字コードに対
し、該キー文字を持つ単語の辞書内に存在する
数、および該文字コードをキー文字とする単語が
格納されている単語テーブルの先頭のアドレスを
格納している。単語テーブルのリンク部もキー位
置に対応して複数あり、各アドレスには、該アド
レスに格納されている単語のキー文字と同じキー
文字を持つ単語が格納されている単語テーブルの
アドレス情報(リンク情報)を記憶しており、こ
れを次々に辿ることにより、同じキー文字を持つ
単語を捜すことができる。入力文字列に対する1
つの候補文字コード列が辞書に存在するか否かを
調べるときは、まず複数のキー文字の中でそのキ
ー文字を持つ単語の数の最も少いものを基準に単
語辞書の検索を行なう。たとえば、第3図におい
て、候補文字列Cj1 1,Cj2 2,Cj3 3のCj1 1をキー文字に
持つ単語は、24であり、Cj3 3をキー文字に持つ単
語は5であるとすれば、Cj3 3を基準に単語辞書を
検索すればよい。このような方法により、少い照
合回数で当該候補文字列が辞書に存在するか否か
を調べることができる。
第4図は単語照合部の構成を示したもので、1
1は共通制御部10との結線、62は照合順序テ
ーブル記憶部40との結線、63は単語辞書記憶
部50との結線、600は文字コードレジスタ、
610は単語照合部制御回路、620は比較回
路、64は出力線である。
単語照合部の動作について説明する。入力文字
に対する候補文字コードは認識部30から文字コ
ードレジスタ600に送られてくる。1つの入力
文字列のすべての文字の候補文字コードが文字コ
ードレジスタ600に格納された時点で、単語照
合部制御回路610は共通制御部10からの指令
により、照合順序テーブル記憶部40に指定され
ている順序で、文字コードレジスタから候補の組
合せを取り出し、キー位置の文字コードに対応す
るインデツクスの内容を調べ、最も単語数の少い
キー文字のインデツクスから当該キー文字を持つ
単語を単語辞書記憶部50から取り出し、その単
語を比較回路620に送る。比較回路620は、
候補文字コード列と単語辞書の文字コード列を比
較し、すべての文字コードが一致した場合、該文
字コードを出力線64上に出力する。もし、一致
しなければ、単語照合部制御回路610は、リン
ク情報を単語辞書記憶部50から取り出し、同じ
キー文字を持つ単語を単語辞書記憶部50から取
り出し、比較回路620に送る。以上の動作を繰
り返して、当該候補文字コード列と一致するもの
がなければ、単語照合部制御回路610は、照合
順序テーブルの次の候補文字の組合せの文字コー
ド列に対し、同様の処理を行なう。
(5) 発明の効果 以上説明したように、本発明によれば、前述し
た構造を持つ単語辞書を用いて、入力文字列に対
し正解となる確率の高い順に候補文字コード列と
単語辞書とを照合することで高速な単語照合処理
が可能となり読取り速度を低下させることなく手
書き漢字等の複雑な文字を高精度に読み取ること
ができる。
【図面の簡単な説明】
第1図は本発明の1実施例、第2図は照合順序
テーブルの例、第3図は単語辞書の構造を示した
図、第4図は、単語照合部の1実施例のブロツク
図である。図中、10は共通制御部、11は共通
制御部と他部との結線、20は走査部、30は認
識部、40は照合順序テーブル記憶部、50は単
語辞書記憶部、51,52はインデツクス、53
は単語テーブル、61は認識部30と単語照合部
60との結線、62は照合順序テーブル記憶部4
0と単語照合部60との結線、63は単語辞書記
憶部50と単語照合部60との結線、64は出力
線である。

Claims (1)

  1. 【特許請求の範囲】 1 帳票上の文字を光学的に読取る文字読取方式
    において、帳票上に記載される単語の文字コード
    列を予め記憶しておく記憶手段と、1入力文字に
    対して、該入力文字の字形と類似した文字の順に
    複数の候補文字コードを出力できる認識手段と、
    入力文字列が正解となる確率の高い順に候補の組
    合せを並べたテーブルを記憶する手段と、上記認
    識手段から出力される候補文字から上記テーブル
    の順序に従つて候補の組合せを取り出し、各組合
    せから得られる候補文字コード列と上記単語辞書
    にある単語の文字コード列とを比較し、辞書内の
    単語と一致する候補文字コード列を検索、照合す
    る手段とを有することを特徴とする文字判定処理
    方式。 2 特許請求の範囲第1項記載の文字判定処理方
    式において、単語の文字コード列を記憶する記憶
    手段に該単語の予め定められた複数の特定文字位
    置にある文字コードと同一文字コードを持つ単語
    が記憶されている記憶手段のアドレスを格納して
    いる単語テーブルと各文字コード毎にその文字コ
    ードを持つ単語が格納されている単語テーブルの
    先頭アドレスと該単語テーブルに格納されている
    単語数とを記憶しているインデツクスを上記複数
    の特定文字装置に対応して複数持つように単語辞
    書を構成し、候補文字列内の特定文字位置の文字
    コードに対し、該文字コードを該特定文字位置に
    持つ単語数をインデツクスで調べ、最も単語数の
    少ない特定文字位置に対応するインデツクスと単
    語テーブルのアドレスを辿つて単語の検索、照合
    を行なうことを特徴とする文字判定処理方式。
JP58063501A 1983-04-11 1983-04-11 文字判定処理方式 Granted JPS59188783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58063501A JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58063501A JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Publications (2)

Publication Number Publication Date
JPS59188783A JPS59188783A (ja) 1984-10-26
JPH0420229B2 true JPH0420229B2 (ja) 1992-04-02

Family

ID=13231038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58063501A Granted JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Country Status (1)

Country Link
JP (1) JPS59188783A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147416A (ja) * 1994-11-21 1996-06-07 Canon Inc 情報処理方法

Also Published As

Publication number Publication date
JPS59188783A (ja) 1984-10-26

Similar Documents

Publication Publication Date Title
US4771385A (en) Word recognition processing time reduction system using word length and hash technique involving head letters
US4903206A (en) Spelling error correcting system
US6978044B2 (en) Pattern string matching apparatus and pattern string matching method
JPH0420229B2 (ja)
JPS6262388B2 (ja)
JPS63268082A (ja) パタ−ン認識装置
JPH0441388B2 (ja)
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPH0634253B2 (ja) 誤読文字訂正処理装置
JPS6095689A (ja) 光学的文字読取装置
JPS61114388A (ja) 文字入力装置
JPH0438026B2 (ja)
JP2529421B2 (ja) 文字認識装置
JPH07271920A (ja) 文字認識装置
JPH03189890A (ja) 複合語照合方法
JPH02278393A (ja) 単語認識装置
JPS6133584A (ja) 照合装置
JPH02148277A (ja) パターン認識装置
JPH0546806A (ja) 文字認識方法
JPH076212A (ja) 光学文字読取装置の知識処理装置
JPH04335488A (ja) 単語照合方法
JPS62285189A (ja) 文字認識後処理方式
JPS60225987A (ja) パタ−ン認識装置
JPS63131288A (ja) 単語照合装置
JPS594071B2 (ja) 文字認識装置