JPS59188783A - 文字判定処理方式 - Google Patents

文字判定処理方式

Info

Publication number
JPS59188783A
JPS59188783A JP58063501A JP6350183A JPS59188783A JP S59188783 A JPS59188783 A JP S59188783A JP 58063501 A JP58063501 A JP 58063501A JP 6350183 A JP6350183 A JP 6350183A JP S59188783 A JPS59188783 A JP S59188783A
Authority
JP
Japan
Prior art keywords
character
word
section
words
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58063501A
Other languages
English (en)
Other versions
JPH0420229B2 (ja
Inventor
Yukitaka Iida
飯田 行恭
Toshiaki Sugimura
利明 杉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58063501A priority Critical patent/JPS59188783A/ja
Publication of JPS59188783A publication Critical patent/JPS59188783A/ja
Publication of JPH0420229B2 publication Critical patent/JPH0420229B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明は9手書き漢字のように字形が複雑で変形が多様
な文字を光学的に読み取る文字読取装置において、入力
文字列の候補文字コード列と予め用意された単語辞書の
文字コード列とを比較し。
エラー、リジェクト文字を修正する文字判定処理方式に
関するものである。
(2)従来技術 手書き漢字読取りでは、膨大な字程と筆記者によって様
々に変形する文字を認識対象とするため。
精度よく文字を読取ることが難しい。文字の高精度認識
を達成する方法として、入力される単語を予め用意して
おき、読取結果と辞書とを照合し。
エラー、リジェクト文字を修正する手法が提案されてい
る。従来の単語照合処理では、入力文字列の候補文字列
と単語辞書内のすべての単語とを比較し、候補文字列と
一致する単語を入力の答えとスルコトで、エラー、リジ
ェクトを修正していた。
しかし2手書き漢字の認識では、誤読率を抑え。
−意に候補文字を絞ることは難しいため、1つの文字に
対し体数の候補文字を考えなげればならず。
対象の単語数が多くなれば単語の照合処理に要する時間
が増大し、読取り速度の低下を招くという欠点をもって
いた。
(3)発明の目的および要点 本発明は1文字認識装置から入力文字の字形に類似した
文字のコードを類似度の高N・順に出力させ、該候補文
字コードを組合せて得られる候補文字コード列の中から
入力文字列の正解である確率が高いものから順に単語辞
書のインデックスとリンク情報を用いて高速に単語照合
を行なうことを特徴とし、その目的は読取り速度を低下
させることなく手書き漢字等の複雑な文字を高精度に読
取ることにある。
(4)発明の実施例 第1図は1本発明の実施例であり、10は共通制御部、
11は共通制御部と各部との結線、20は走査部、30
は認識部、40は照合順序テーブル記憶部、50は単語
辞書記憶部、60は単語照合部、61は単語照合部60
と認識部30との結線、62は単語照合部60と照合順
序テーブル記憶部40との結線、63は単語照合部60
と単語辞書記憶部50との結線、64は出力線である。
これを動作するには、共通制御部100指令により、走
査部20は帳票上の文字を走査し、光電変換して得られ
る画信号を認識部30に転送する。
認識部30は、共通制御部100指令により、入力文字
の字形と各文字の標準字形との類似度を計算し、類似度
の高い順に複数の候補文字のコードを単語照合部60に
出力する。単語照合部60は照合順序テーブル記憶部4
0に記憶されている照合順序テーブルの先頭に書かれた
候補の組合せを取りその組合せに対応する候補文字コー
ド列が単語辞書記憶部50に存在するか否かを調べ、存
在すれば、その文字コード列を出力線64に出力する。
もし、当該文字コード列がなければ、照合順序テーブル
の次の候補の組合せの文字コード列が辞書に存在するか
否かを調べ、存在していれば。
当該文字コード列を出力線64に出力する。辞書内に当
該文字コード列が記憶されてなければ、照合順序テーブ
ルの順序に従って同様の処理を繰り返す。
第2図は、照合順序テーブルの説明図であり。
同図<a>は文字列の長さく文字列の文字数)が2の場
合の入力文字の候補を示し、C7はi番目の入力文字に
対するj位の候補を表わす。同図(1))は照合順序テ
ーブルの例を示したもので、テーブル内の数字は対応す
る文字位置の候補の順位を意味するものであり、このテ
ーブルの候補の組合せは、該組合せで得られる候補文字
コード列が正解となる確率の高い順に並べられている。
例えば、第2図(b)の照合順序テーブルの先頭は、1
,1となっておりこれは、同図(b)の2文字からなる
入力文字列の候補の中で、各入力文字の候補の1位をと
ったもの(即ち C: 、 (21,)が最も正解とな
る確率が高いことを示しており、2,20組合せ(即ち
、C〒。
C2)は、6番目に入力の正解となる確率の高い組合せ
というどとを示している。このようなテーブルを考えこ
の順序で辞書を検索すれば、高速に正解単語を捜すこと
ができる。(即ち、高速に単語照合が行なえる。) 照合順序テーブルは文字列の長さノごとに用意されるも
ので、具体的には、候補のn位に正解が(111j24
・・・、j、)に対応する候補文字列が正解となる確率
を意味する)の大きい順に組合せを並べたものである。
第3図は単語辞書の構造を示したものであり。
51および52はインデックス、53は単語テーブルで
ある。辞書は、入力文字列Cix、 Cj2. CjX
の予め定めた複数文字位置の文字(図では、先頭の文字
Cj・と最後の文字身)のいずれかをキーとして検索を
行なう(以後2%定文字位置をキー位置と呼ぶ。図では
キー位置の先頭文字位置をF、最後の文字位置をLで表
わしている。また、キー位置にある文字をキー文字と呼
ぶこととし、同じキー文字を持つとは、キー位置に同じ
文字を持つことを意味するものとする。)インデックス
はキー位置に対応して複数あり、各文字コードに対し、
該キー文字を持つ単語の辞書内に存在する数、および該
文字コードをキー文字とする単語が格納されている単語
テーブルの先頭のアドレスを格納している。単語テーブ
ルのリンク部もキー位置に対応して複数あり、各アドレ
スには、該アドレスに格納されている単語のキー文字と
同じキー文字を持つ単語が格納されている単語テーブル
のアドレス情報(リンク情報)を記憶しており、これを
次々に辿ることにより、同じキー文字を持つ単語を捜す
ことができる。入力文字列に対する1つの候補文字コー
ド列が辞書に存在するか否かを調べるときは、まず複数
のキー文字の中でそのキー文字を持つ単語の数の最も少
いものを基準に単語辞書の検索を行なう。たとえば、第
3図において、候補文字列C仏→、CjsのC(1をキ
ー文字に持つ単語は。
24であり、Cj、zをキー文字に持つ単語は5である
とすれば、Cisを基準に単語辞書を検索すればよい。
このような方法により、少い照合回数で当該候補文字列
が辞書に存在するか否かを調べることができる。
第4図は単語照合部の構成を示したもので、11は共通
制御部10との結線、62は照合順序テーブル記憶部4
0との結線、63は単語辞書記憶部50との結線、60
0は文字コードレジスタ、610は単語照合部制御回路
、620は比較回路、64は出力線である。
単語照合部の動作について説明する。入力文字に対する
候補文字コードは認識部30から文字コードレジスタ6
00に送られて(る。1つの入力文字列のすべての文字
の候補文字コードが文字コードレジスタ600に格納さ
れた時点で、単語照合部制御回路610は共通制御部1
0からの指令により、照合順序テーブル記憶部40に指
定されている順序で9文字コードレジスタから候補の組
合せを取り出し、キー位置の文字コードに対応するイン
デックスの内容を調べ、最も単語数の少いキー文字のイ
ンデックスから当該キー文字を持つ単語を単語辞書記憶
部50から取り出し、その単語を比較回路620に送る
。比較回路620に−1゜候補文字コード列と単語辞書
の文字コード列を比較し、すべての文字コードが一致し
た場合、該文字コードを出力線64上に出力する。もし
、一致しなげれば、単語照合部制御回路610は、リン
ク情報を単語辞書記憶部50から取り出し、同じキー文
字を持つ単語を単語辞書記憶部50から取り出し、比較
回路620に送る。以上の動作を繰り返して、当該候補
文字コード列と一致するものがなければ、単語照合部制
御回路610は、照合順序テーブルの次の候補文字の組
合せの文字コード列に対し、同様の処理を行なう。
(5)発明の詳細 な説明したように1本発明によれば、前述した構造を持
つ単語辞書を用いて、入力文字列に対し正解となる確率
の高い順に候補文字コード列と単語辞書とを照合するこ
とで高速な単語照合処理が可能となり読取り速度を低下
させることなく手書き漢字等の複雑な文字を高精度に読
み取ることができる。
【図面の簡単な説明】
第1図は本発明の1実施例、第2図は照合順序テーブル
の例、第3図は単語辞書の構造を示した図、第4図は、
単語照合部の1実施例のブロック図である。図中、10
は共通制御部、11は共通制御部と他部との結線、20
は走査部、30は認識部、40は照合順序テーブル記憶
部、50は単語辞書記憶部、51.52はインデックス
、53は単語テーブル、61は認識部30と単語照合部
60との結線、62は照合順序テーブル記憶部40と単
語照合部60との結線、63は単語辞書記憶部50と単
語照合部60との結線、64は出力線である。 特許出願人 日本電信電話公社 代理人弁理士 森  1)    寛 f 3 図 −555−

Claims (1)

  1. 【特許請求の範囲】 (1)帳票上の文字を光学的に読取る文字読取方式にお
    いて、帳票上に記入される単語を予め記憶しておく記憶
    手段と、1人力文字に対して、該入力文字の字形と類似
    した文字の順に複数の候補文字コードを出力できる認識
    手段と、入力文字列が正解となる確率の高い順に候補の
    組合せを並べたテーブルを記憶する手段と、上記認識手
    段から出力される候補文字から上記テーブルの順序に従
    って候補の組合せを取り出し、各組合せから得られる候
    補文字コード列と上記単語辞書にある単語の文字コード
    列とを比較し、辞書内の単語と一致する候補文字コード
    列を出力する手段とを有することを特徴とする文字判定
    処理方式 (2、特許請求の範囲第1項記載の文字判定処理方式に
    おいて、単語の特定位置にある文字コードを該文字位置
    に持つ他の単語が格納されているアドレス情報を文字位
    置に応じて複数記憶している単語テーブルと、各文字コ
    ードごとに、上記特定文字位置に該文字コードを持つ単
    語の数および該単語が格納されている単語テーブルの先
    頭アドレスを記憶しているインデックスを特定文字位置
    に対応して複数持った単語辞書を用いて単語照合処理を
    行なう単語照合部を有することを特徴とする文字判定処
    理方式 (3)特許請求の範囲第2項記載の文字判定処理方式に
    おいて、候補文字コード列の特定文字位置の文字コード
    に対し、単語辞書を用いて、該文字コードを該文字位置
    に持つ単語の数を調べ、最も数の少ない文字コードの文
    字位置に対応するインデックスとリンク部の情報を使っ
    て単語辞書を検索する単語照合部を有することを特徴と
    する文字判定処理方式
JP58063501A 1983-04-11 1983-04-11 文字判定処理方式 Granted JPS59188783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58063501A JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58063501A JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Publications (2)

Publication Number Publication Date
JPS59188783A true JPS59188783A (ja) 1984-10-26
JPH0420229B2 JPH0420229B2 (ja) 1992-04-02

Family

ID=13231038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58063501A Granted JPS59188783A (ja) 1983-04-11 1983-04-11 文字判定処理方式

Country Status (1)

Country Link
JP (1) JPS59188783A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147416A (ja) * 1994-11-21 1996-06-07 Canon Inc 情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147416A (ja) * 1994-11-21 1996-06-07 Canon Inc 情報処理方法

Also Published As

Publication number Publication date
JPH0420229B2 (ja) 1992-04-02

Similar Documents

Publication Publication Date Title
US4771385A (en) Word recognition processing time reduction system using word length and hash technique involving head letters
JPH0664631B2 (ja) 文字認識装置
US3651459A (en) Character distance coding
JPS59188783A (ja) 文字判定処理方式
JPS6095689A (ja) 光学的文字読取装置
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JP2903779B2 (ja) 文字列認識方法及びその装置
JPH0634253B2 (ja) 誤読文字訂正処理装置
JPS61114388A (ja) 文字入力装置
JPS6336389A (ja) 文字読取装置
JP3025382B2 (ja) 文書処理装置
JPS63268082A (ja) パタ−ン認識装置
JPS6115288A (ja) 光学的文字読取装置
JP2784004B2 (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JPH02278393A (ja) 単語認識装置
JPS6133584A (ja) 照合装置
JPH02148277A (ja) パターン認識装置
JPH09171539A (ja) 文字認識装置
JPH0546806A (ja) 文字認識方法
JPS60254388A (ja) 光学的文字読取装置
JPH0340079A (ja) 文字読取装置における文字認識後処理方法
JPS60144886A (ja) 文字認識装置における後処理方式
JPH0264884A (ja) 文字認識装置の辞書検索回路
JPH06309507A (ja) 文字認識装置