JPS5854433B2

JPS5854433B2 - 相違度検出装置

Info

Publication number: JPS5854433B2
Application number: JP55126244A
Authority: JP
Inventors: 一成江上; 宣彦森; 善丈辻
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1980-09-11
Filing date: 1980-09-11
Publication date: 1983-12-05
Also published as: JPS5757382A; US4418423A

Description

【発明の詳細な説明】本発明は、複数個の単語と文字読取装置（以下ＯＣＲと
称す）より出力された出力文字列とを照合し、ＯＣＲの
人力となる文字フィールドに対応した単語を認識単語と
する単語認識装置、特に、ＯＣＲ出力文字列と単語とを
照合し、相違度を検出する相違度検出装置に関するもの
である。

ＯＣＲの人力対象となる郵便物や文書等において、片仮
名やアルファベット等は人名・地名や品名等の固有名詞
や普通名詞で用いられることが多い。

これらのものは、数字の場合と異なり単語内における文
字間の従属性がかなり強く、また十分な冗長性を有する
場合が多い。

従って単語を単位として認識を行えば、その従属性や冗
長性を利用することにより、誤読文字の訂正や読取不能
文字の回復が可能となり、認識率をかなり改善すること
ができる。

このような単語単位の認識を以下単語認識と呼ぶことに
する。

一般に、郵便物や文書に記載された英大文字や英小文字
をＯＣＲを用いて認識する場合、ＯＣＲの認識精度を向
上させるために、郵便物や文書の個々の文字を英大文字
あるいは英小文字と見なして、それぞれ独立に出力させ
る。

このように独立に出力された文字列を例えば特開昭５２
−８０７４３号公報等で示されているように、１つの文
字フィールドを英大文字フィールドであるかあるいは英
小文字フィールドであるかを識別し、しかる後単語認識
装置により誤り訂正を行うといった手法が採用されてい
る。

しかし、１つの文字フィールド内に英大文字及び英小文
字の混在や文字品質の劣化等は、１つの文字フィールド
における英大文字・英小文字の識別を困難とする場合が
生じるためＯＣＲ出力文字列と単語との相違度が正しく
得られず、その結果単語認識の認識精度を下げることに
もなる。

そこで本発明の目的は、単語辞書に記憶された単語とＯ
ＣＲ出力文字列との文字間距離の検出にあたり、英大文
字あるいは英小文字のうち、どちらか可能性の高い文字
間距離を有する英字を選択し、ＯＣＲ出力文字列と単語
との照合に適用することにより前記従来の欠点を解決し
た相違度検出装置を提供することにある。

本発明の他の目的は、本発明を用いることにより前述し
たような英大文字・英小文字フィールドの識別装置が簡
単な構成からなる装置であっても、単語認識精度を下げ
ることなく、処理できる相違度検出装置を提供すること
にある。

本発明によれば、ＯＣＲより出力される出力文字列と予
め用意された単語辞書に記憶された複数個の単語とを照
合し、複数個の単語とＯＣＲ出力文字列との相違度を検
出する相違度検出装置において、１つの文字フィールド
に対応するＯＣＲの出力文字列として、第１文字種と見
なして出力された文字列α１α２・・・・・・ａｎをＯ
ＣＲから受取った順序で記憶するための第ルジスタ及び
第２文字種と見なして出力された文字列β１β２・・・
・・・β。

をＯＣＲから受取った順序で記憶するための第２レジス
タと、第１文字種におけるｉ番目の文字カテゴリＵ（ｉ
）と第１文字種と見なしてＯＣＲより出力される文字α
との第１文字種文字間距離ｄ〔α。

Ｕ（ｉ））及び第２文字種におけるｉ番目の文字カテゴ
’ＪＬ（ｉ）と第２文字種と見なしてＯＣＲより出力さ
れる文字βとの第２文字種文字間距離ｄ〔β。

Ｌ（ｉ））を記憶する記憶装置と、単語を構成するｊ番
目の文字ａ・と比較される第ルジスタ及び第２レジスタ
のに番目（但しｊ＝ −ｓ＜ｋ（：、ｊ＋
ｓであり、Ｓは予め設定された定数０，１，２・・・
・・・とする。

）の内容αに、βにとにより決定される第１文字種文字
間距離ｄ〔α、Ｕ（ｉ）、ｌ（但しααに、Ｕ（ｉ）＝
ａｊ）及び第２文字種文字間距離ｄ〔β、Ｌ（ｉ）
）（但し、β−βに、Ｌ（ｉ）−ａ、）のうち、小さ
い文字間距離を単語ａｊ（！１−ＯＣＲのに番目の出力
文字αに、βにとの文字間距離として検出する文字間距
離検出手段と、単語とＯＣＲの出力文字列とを照合し、
文字間距離検出手段により得られる文字間距離に基づい
て単語とＯＣＲの出力文字列との相違度を検出する照合
手段とで構成されたことを特徴とする相違度検出装置が
得られる。

以下本発明について具体的実施例を示す図を参照して説
明する。

第１図は英大文字の文字間距離の一例を説明するために
示した概念図である。

図において、行方向に示されたアルファベット（但し△
はブランク文字を示す）は単語を構成する文字カテゴリ
（以下辞書文字と呼ぶ）を示し、列方向に示されたアル
ファベット（但し△はブランク文字、？は読取不能文字
を示す）はＯＣＲ出力文字を示す。

図の各要素はＯＣＲ出力文字と辞書文字との文字間距離
を表わす数値である。

例えばＯＣＲ出力文字Ｏと辞書文字りとの文字間距離ｄ
１５，４（０＋Ｄ）（但し添字で示した数字は、それ
ぞれ列方向、行方向に示されたアルファベットの位置を
示す）は値８であり、ＯＣＲ出力文字Ｏと辞書文字Ｅと
の文字間距離ｄ１５，５（０、Ｂ）は値１５を示して
いる。

即ち、第１図で示した文字間距離表において、英大文字
０は英大文字Ｅより英大文字りに似ているため、文字間
距離ｄ１５，４（ＯｔＤ）は文字間距離ｄｓｓ、
ｓ（０，Ｅ）より小さな値をとることになる。

また、ＯＣＲ出力文字Ｏと辞書文字Ｏとの文字間距離ｄ
１５，１５（０、０）はＯであり、完全にマツチングが
とれていることを示している。

次に、前述した英大文字の文字間距離表の算出方法の一
例を示す。

図の各要素であるＯＣＲ出力文字と辞書文字との文字間
距離ｄｉ、ｊは、ＯＣＲの読取り結果により得られるｊ
番目の辞書文字Ｕ（ｊ）（ｊ＝０．・・・・・・２６）
がｉ番目のＯＣＲ出力文字α（ｉ）（ｉ＝ｏ・・・・・
・２７）として認識する混同確率Ｐ（Ｕ（ｊ）１ｃ
（ｉ））に対して、−Ｃ−ｌｏｇＰ（Ｕ（ｊ）Ｉ
α（ｉ））（但し、Ｃは一１ｏｇＰ（Ｕ（ｊ）
ｌ α（ｉ））を一定範囲の数値、（例えば図において
、値Ｏから１５までの数値）で表現するための予め設定
される定数である）に対数変換することにより算出でき
る。

尚ＯＣＲ出力文字と辞書文字との文字間距離ｄｉ、ｊの
算出方法は、前述した算出方法に規定されるものではな
い。

また英小文字の文字間距離衣も同様にして求められる。

第２図は本発明の一実施例をフロチャートを用いて示し
たものである。

第２図において記号りは、ＯＣＲ出力文字列（英大文字
と見なして出力された出力文字列及び英小文字と見なし
て出力された出力文字列を総称して、ＯＣＲ出力文字列
と呼ぶことにする）の文字数を示し、記号Ｗは照合すべ
き単語の文字数を示し、記号■はＯＣＲ出力文字列の第
１番目の文字位置（以下記号■を入力比較位置と呼ぶこ
とにする）を示し、記号Ｊは単語の第５番目の文字位置
（以下記号Ｊを単語比較位置と呼ぶことにする）を示し
ている。

また記号ｄｕ（ＬＪ）及びｄｌ（ＬＪ）は、ＯＯＲ英大
文字出力文字列及びＯＣＲ英小文字出力文字列の第１番
目の文字と単語の第５番目の文字とを比較した場合の文
字間距離を示す。

記号Ｓは予め予め設定される照合幅を示す。

照合幅Ｓは、ＯＣＲにおける一文字単位の切り出しの際
に生じる文字切り出しミスによって、ＯＣＲ出力文字列
の文字数の変化が生じた場合を考慮して設定されるパラ
メータであり、ｏｃ矧呂力文字列の入力比較位置Ｉに対
して、照合すべき単語の第１−８番目の文字から第■＋
Ｓ番目の文字までを単語比較位置Ｊに関連させる。

即ち、ＯＣＲ出力文字列の人力比較位ＩＩに対して、単
語比較位置Ｊの取り得る範囲は、Ｉ−８くＪ≦Ｉ＋８と
なる。

記号Ｄ（Ｉ、Ｊ）はＯＣＲ出力文字列の第１番目の文字
と単語の第５番目の文字までの比較の結果として得られ
た相違度を示し、図中ブロック１０６で示す計算式Ｄ（
Ｉ、Ｊ）＝ｄ（Ｉ、Ｊ）＋ＭＩＮ（Ｄ（Ｉ、Ｊ−１）。

Ｄ（Ｉ−１、Ｊ−１）、Ｄ（Ｉ−１、Ｊ））を
用いて得られる。

但し、ｄ（■、Ｊ）は、前述した文字間距離ｄＵ（Ｉ、
Ｊ）とｄＩ、（Ｉ、Ｊ）の最小値を示し、ＭＩＮ（Ｄ
（Ｉ、Ｊ−１）、Ｄ（Ｉ−１。

Ｊ−１）、Ｄ（Ｉ−１、Ｊ））は相違度Ｄ（Ｉ。

Ｊ−１）、Ｄ（Ｉ−１、Ｊ−１）、Ｄ（Ｉ−１。

Ｊ）の最小値を示す。

即ち、相違度Ｄ（Ｉ、Ｊ）は、人力比較位置■と単語比
較位置Ｊとの前述した文字間距離ｄ（Ｉ、Ｊ）及び入力
比較位置■と単語比較位置Ｊ−１に到るまでの相違度Ｄ
（Ｉ。

Ｊ−１）及び入力比較位置Ｉ−１と単語比較位置Ｊ−１
に敗るまでの相違度Ｄ（Ｉ−１、Ｊ−１）及び入力比較
位置Ｉ−１と単語比較位置Ｊに到るまでの相違度Ｄ（Ｉ
−１，Ｊ）を用いて、逐次的に算出され、入力比較位置
■と単語比較位置Ｊに到るまでのＯＣＲ出力文字列と単
語の最適な各文字間の対応付けにより得られる文字間距
離の加算料を示すものである。

尚入力比較位置■がＯＣＲ出力文字列の文字数りに、単
語比較位置Ｊが単語の文字数Ｗにそれぞれ等しくなった
場合、ブロック１０６で示す計算式により得られた相違
度Ｄ（Ｉ、Ｊ）を前述したようにＯＣＲ出力文字列と単
語との相違度と呼ぶことにする。

またブロック１０６で示すような計算式を用いてＯＣＲ
出力文字列と単語との相違度を得る手法は、例えば昭和
５４年情報処理学会第２０回全国大会講演論文集第４８
７〜４８８頁、６Ｆ−３「ＯＣＲのための単語認識」で
示されているようなダイナミックプログラミング手法と
同等な手法である。

次に、第２図における処理を説明すると、ブロック１０
１は初期値として、入力比較位置Ｉ及び単語比較位置Ｊ
を■にセットする。

ブロック１０２は記号βに入力比較位置■と照合幅Ｓと
の差（■−Ｓ）及び１との最大値ＭＡＸ（Ｉ −８、１
）をセットし、記号Ｒに入力比較位置■と照合幅Ｓとの
和及び単、語の文字数Ｗとの最小値ＭＩＮ（Ｉ＋Ｓ、
Ｗ）をセットする。

これによりＯＣＲ出力文字列の第１番目の文字に対して
、比較すべき単語の文字はβ二ＭＡＸ（Ｉ −８、１）
からＲ＝ＭＩＮ（１，＋Ｓ、Ｗ、）までに位置する文
字になる。

ブロック１０３において単語比較位置Ｊに記号βの値、
ＭＡＸ（Ｉ −８、１）をセットする。

ブロック１０４は前述したように、人力比較位置■のＯ
ＣＲ出力英大文字及びＯＣＲ出力英小文字と単語比較位
置Ｊの単語の文字との文字間距離ｄＵ（Ｉ、Ｊ）及びｄ
ｌ（Ｉ、Ｊ）を求める。

ブロック１０５は前述したようにＯＣＲ英大文字出力文
字と単語の文字との文字間距離ｄＵ（Ｉ、Ｊ）とＯ
ＣＲ英小文字出力文字と単語の文字との文字間距離ｄＬ
（Ｉ、Ｊ）との最小値を選択し、文字間距離ｄ（ＬＪ）
とする。

ブロック１０６において、前述したように相違度Ｄ（Ｉ
、Ｊ）を求める。

ブロック１０７は単語比較位置Ｊと記号Ｒの値ＭＩＮ（
Ｉ＋Ｓ、Ｗ）において、Ｊ＜Ｒを満足するか否かを判
定する。

その判定結果が「ＹＥＳ」であれば、ブロック１０８に
より単語比較位置Ｊの値を１増加させ、ブロック１０４
の処理へ戻る。

その判定結果がｒＮＯＪ即ちＪ＝Ｒとなれば、ブロック
１０９の処理へ移る。

例えば照合幅Ｓが２の場合には、β＝ＭＡＸ（Ｉ−２，
１）、Ｒ＝ＭＩＮ（Ｉ＋２、Ｗ）となり、人力比較位
置■の人力文字に対して単語の第１番目の文字を基準に
して前後２文字も比較すべさ文字となる。

また、照合幅ＳがＯの場合には、β＝Ｉ、Ｒ＝ＭＩＮ（
■、ｗ）となり人力比較位置■の入力文字に対して、単
調の第１番目の文字のみが比較すべき文字となる。

尚、照合幅Ｓの値は、予め設定されるが、ＯＣＲにおい
て、文字の切り出しの際に生じるセグメンテーションエ
ラーによるＯＣＲ出力文字列の文字数の変化が生じやす
い場合には、Ｓ＝１．２・・・・・・といった値が設定
され、文字数の変化が生じにくい場合には、Ｓ＝０が設
定されることになる。

ブロック１０９において、人力比較位置■と単語の文字
数りに対してＩ＜Ｌを満足するか否かを判定する。

その判定結果が「ＹＥＳ」であればブロック１１０によ
り入力比較位置■を１増加させ、ブロック１０２の処理
へ戻る。

その判定結果がｒＮＯＪ即ちＩ＝Ｌとなれば相違度Ｄ（
Ｉ、Ｊ）（但し、Ｉ＝Ｌ、Ｊ＝Ｗ）をＯＣＲ出力文字列
と単語との相違度として検出される。

このようにしてＯＣＲ出力文字列と複数個の単語との相
違度が得られ、判定回路へ転送される。

判定回路の一例としては、例えば、転送された相違度の
うち、最小相違度Ｄ１と２番目に小さい相違度Ｄ２に対
して、ＯＣＲ出力文字列の文字数りにより定まる閾値Ｔ
Ｉ、Ｔ２との間にり、＜Ｔ、且つＤ２−ｂ、〉Ｔ２を
満足すれば、最小相違度ＤＩを有する単語を認識単語と
して出力する。

第４図は、第２図で示した相違度計算方法を具体例を用
いて説明するために示した図である。

尚第４図は、第２図で示した随合幅Ｓを１に設定した場
合を示している。

第４図ａの左端列には、紙面上に記入された英文字列”
Ｉｒｎｅｉｎ”のＯＣＲによる読み取り結果として、英
大文字としてのＯＣＲ出力文字列”Ｉ？？？？”英小
文字としてのＯＣＲ出力文字列″７？ｅｉｎ”が記載さ
れている。

即ち、読み取られた最初の文字は、英大文字”■″、英
小文字”ｌ”であり、２番目の文字は両方とも読み取り
不能”？″であり、３番目及び４番目及び５番は英小文
字のみがそれぞれ” Ｄｒｉｌｌ ′ｎ”と読み取ら
れたことを示している。

そこで、このようなＯＣＲ出力文字列が、第４図ａの上
端行で示した単語”ＩＲＮＥＩＮ”との照合を行う場合
を取り上げて説明する。

尚、単語辞書は、英大文字列かあるいは英小文字列で示
される単語群を記憶する。

そのために、ＯＣＲ出力文字が英大文字あれば、辞書文
字は、英大文字と見なして、文字間距離ｄＵが計算され
、ＯＣＲ出力文字が小英字であれば、辞書文字は、英小
文字と見なして、文字間距離ｄＬが計算される。

第４図ａにおける第■行目（但し、Ｉ＝１．２・・・・
・・５）と第１行目（但し、Ｊ＝１．２・・・・・・６
）に記載された２つの数値のうち、左側の値はＯＣＲ出
力文字列の第１番目のＯＣＲ出力文字と単語の第１番目
の辞書文字との距離、即ち、第１図に示される如くの文
字間距離ｄ（Ｉ、Ｊ）を示し、第２図におけるブロック
１０５によって計算される。

右側の値はＯＣＲ出力文字列の人力比較位置■と単語の
単語比較位置Ｊに到るまでの相違度Ｄ（Ｉ、Ｊ）を示
し、第２図におけるブロック１０６によって示した式を
用いて、逐次計算される。

尚、第４図ａの各文字間距離ｄ（Ｉ、Ｊ）（但し、Ｉ＝
１，２・・・・・・５、Ｊ＝１、２・・・・・・
６）は、第１図に示される如くの英大文字文字間距離ｄ
Ｕ（１，１）及びｄＵ（１，２）即ち、ＯＣＲ出力文字
゛１”と辞書文字゛Ｉ”及びＯＣＲ出力文字”Ｉ”と辞
書文字”Ｒ”の各英大文字間距離を、それぞれＯ”及び
”１５”とし、同様に、英小文字間距離ｄｌ（１、１）
ｄｒ、（１、２）。

ｄＬ（３，２）、ｄＬ（３，３）ｄｌ（３，４）。

ｄＬ（４，３）、ｄＬ（４，４）、ｄＬ（５，４）。

ｄＬ（５、５）、ｄｒ、（５、６）即ち、ＯＣＲ出
力文字”ｌ”と辞書文字゛ｉ”（但し、前述したように
ＯＣＲ出力文字が英小文字であると、辞書文字は英小文
字と見なされる）、ＯＣＲ出力文字Ｎ、５ｎと辞書
文字Ｎｒｌｌ、ＯＣＲ出力文字ｅ ”と辞書文字”
ｒ”、ＯＣＲ出力文字″ｅ”と辞書文字”ｒ”、ＯＣＲ
出力文字” １１と辞書文字″ｅ”、ＯＣＲ出力文字″
′ｉ″と辞書文字”ｎ”、ＯＣＲ出力文字″ｉ”と辞書
文字゛ｅ”、ＯＣＲ出力文字“ｉ”と辞書文字”ｉ”、
ＯＣＲ出力文字″ｎ”と辞書文字“ｅ”、ＯＣＲ出力文
字”ｎ”と辞書文字”ｉ”、ＯＣＲ出力文字″、ｔｊ
と辞書文字”ｎ”の各英小文字間距離をそれぞれ”１５
”１５′″、″１５”、１５ ” 、ｆＱ９９．１
５”、”１５”。

”Ｏ″、”１５′”、”１５”、”Ｏ”とし、更に読取
り不能”？”と辞書文字との文字間距離を”１５パとし
て、第２図のブロック１ｊｓの計算式を用いて、計算さ
れたものである。

例えば、文字間距離ｄ（１，１）はＭＩＮ（ｄＵ（１，
１）、ｄＬ（１，１））となりＯ”が得られる。

第４図ａにおいて、相違度Ｄ（Ｉ、Ｊ）の計算過程をＯ
ＣＲ出力文字列の第３番目のＯＣＲ出力文字“？”及び
”ｅ”と単語の第４番目の辞書文字″Ｅ”に到るまでの
相違度Ｄ（３，４）を用いて説明すると、相違度Ｄ（３
，４）は、第２図のブロック１０６における計算式即ち
、ｄ（３，４）＋ＭＩＮ（Ｄ（３，３）、Ｄ（２，３）
、Ｄ（２゜４））を用いることによって、値″３０”を
得る。

尚、相違度Ｄ（２，４）は、照合幅Ｓが”１”の場合に
は、相違度Ｄ（Ｉ、Ｊ）における入力比較位置■と単語
比較位置Ｊの間に、前述したようにＩ−８＜ＪくＩ＋８
（但し、５＝１）の関係を取立しないことから、非常に
大きな値（但し、図中省略）がセットされること１こな
る。

以上の計算過程を第２図で示したブロック１０５及びブ
ロック１０６を用いて、第４図ａの点線で示すように、
順次行われ、ＯＣＲ出力文字列単語との相違度即ち１．
’）（５、６）が値”３０”として求められる。

このようにして得られたＯＣＲ出力文字列と単語との相
違度即ちＤ（５，６）は、第４図すの矢印で示した対応
関係を持つＯＣＲ出力文字と単語の各文字の文字間距離
、即ち、ｄＵ（１，１）とｄＬ（２，２）あるいはｄｕ
（２、２’）とｄＬ（２゜３）、あるいはｄｕ（２、３
）とｄＬ（３、４）とｄＬ（４、５）とｄｔ、（５、６
）との加算料となっており、文字数りが５となるＯＣＲ
出力文字列と文字数Ｗが６となる単語との相違性を示す
尺度となる。

上述した相違度Ｄ（５，６）はＯＣＲ出力文字列の読み
取り不能”？″と単語の文字”Ｒ９１及び”Ｎ”間との
相違性即ち文字間距離ｄｒ、（２、２）あるいはｄｔｙ
（’２，２）とｄＬ（２，３）あるいはｄＵ（２、，３
）との値の和を表わし、他のＯＣＲ出力文字と単語の各
文字は完全に一致していることを表わしている。

そこで、例えば、相違度Ｄ（５，６）をＯＣＲ出力文字
例の文字数５で除算すると、上述した相違度Ｄ（５，６
）の１文字単位として見た時の平均的な文字間距離即ち
値″６”が得られ、上述したＯＣＲ出力文字列と単語と
は相違度が小さい、即ち、かなり類似性があることがわ
かる。

このような操作を単語辞書に記憶された単語について、
すべて行い、前述した相違度を用いて類似性を持つ単語
を検出することによって、英大文字と英小文字の識別が
つかないために含まれる誤読文字（図中”ｌ″）や読み
増り不能文字”？”等の訂正あるいは回復処理が、文字
単位での判定（例えば、一文字間での文字間距離による
場合で、困難であっても、容易に可能となる。

第３図は本発明の一実施例を示す論理ブロックであり、
前述した照合幅ＳをＯとした照合装置を採用する場合を
一例として説明したものである。

尚、第３図において、前述した照合幅Ｓ−０となるため
、第２図における人力比較位置Ｉと単語比較位置Ｊは常
に等しい値Ｉ＝Ｊとなるため、第２図におけるブロック
１０８は不要となり、更に、ブロック１０４で示した第
一種文字間距離ｄＬ（Ｉ。

Ｊ）第二種文字間距離ｄＬ（Ｉ、Ｊ）はそれぞれｄＵ（
Ｉ、Ｉ）、ｄＬ（Ｉ、Ｉ）のみを求め
れば良く、ブロック１０６で示した計算式はＤ（Ｉ、Ｉ
）＝ｄ（Ｉ、Ｉ）＋Ｄ（Ｉ−１、Ｉ−１）と簡略
化される。

また、任意の照合幅Ｓを持たせた照合装置についても、
本発明の適用は、可能である。

更に、第３図において、信号線の末尾にＳを付加するこ
とによりその信号を表わすとする。

１はＯＣＲである。

２は単語を記憶する辞書メモリである。

３は０ＣＲ１の出力文字を英大文字と見なして、出力さ
れた順序で記憶した第ルジスタである。

４は０ＣＲ１の出力文字を英小文字と見なして、出力さ
れた順序で記憶した第２レジスタである。

５は、ＯＣＲ出力文字列に対して、照合すべき単語を記
憶した単語記憶レジスタである。

６及び７はアドレスレジスタである。８及び９はそれぞ
れ前述したような英大文字文字間距離、英小文字文字間
距離を記憶したメモリである。

１１．１２はラッチ回路である。

１３は選択回路であり、１４は比較回路である。

１５は加算回路である。

１６は相違度レジスタである。２０は判定回路である。

次に第２図におけるフローチャート図と第３図における
一実施例の論理ブロックの対応を示すと、第２図におけ
るブロック１０４の処理は、第３図のアドレスレジスタ
６．７及び英大文字文字間距離及び英小文字文字間距離
を記憶したメモリ８゜９及びラッチ回路１１．１２に対
応し、ブロック１０５の処理は、第３図の選択回路１３
及び比較回路１４に対応し、ブロック１０６の処理は、
第３図の加算回路１５及び相違度レジスタ１６に対応す
る。

次に第３図における動作を説明する。

１つの文字フィールドに対して、０ＣＲ１は英大文字と
見なして出力された出力文字列を第ルジスタ３へ、英小
文字と見なして出力された出力文字列を第２レジスタ４
へそれぞれ転送する。

一方、辞書メモリ２より照合されるべき単語が順次、単
語記憶レジスタ５へ転送されているとする。

アドレスレジスタ６は第ルジスタ３の内容であるＯＣＲ
出力文字とそのＯＣＲ出力文字に対応した単語記憶レジ
スタ５の内容である辞書文字とにより決定される英大文
字文字間距離メモリ８の要素を順次アドレスして、ラッ
チ回路１１へ転送する。

例えば第ルジスタ３の内容であるＯＣＲ出力文字が第１
図における英大文字Ｏ（第１図における列方向１５番目
の文字）であり、単語記憶レジスタ５の内容である辞書
文字が第１図における英大文字Ｄ（第１図における行方
向４番目の文字）であるとすると、アドレスレジスタ６
は行方向４番目と列方向１５番目の英大文字文字間距離
メモリ８の要素ｄ１５，４（０、Ｄ）＝８の値をラッチ
回路１１へ転送する。

アドレスレジスタ７は第２レジスタ４の内容であるＯＣ
Ｒ出力文字に対応した単語記憶レジスタ５の内容である
辞書文字とにより決定される英小文字間距離メモリ９の
要素を、アドレスレジスタ６と同様な操作により順次ア
ドレスしてラッチ回路１２へ転送する。

ラッチ回路１１及びラッチ回路１２は、アドレスレジス
タ６及びアドレスレジスタ７より転送された英大文字文
字間距離及び英小文字文字間距離をラッチし、それぞれ
、比較回路１４及び選択回路１３へ転送する。

比較回路１４において、ラッチ回路１１より転送された
英大文字文字間距離がラッチ回路１２より転送された英
小文字間距離より小さいか否かを調べ、英大文字文字間
距離が英小文字文字間距離より小さければ、その出力信
号１４１Ｓを１”にセットし、そうでなければ、その出
力信号１４１Ｓを０”にリセットする。

選択回路１３は比較回路１４の出力信号１４１Ｓが”１
″にセットされると、ラッチ回路１１の内容である英大
文字文字間距離を加算回路１５に転送する。

一方比較回路１４の出力信号１４１Ｓが０″にリセット
されると、選択回路１３は、ラッチ回路１２の内容であ
る英小文字文字間距離を加算回路１５へ転送する。

加算回路１５は選択回路１３より選択された文字間距離
と相違度レジスタ１６の内容とを加算し、その結果を相
違度レジスタ１６へ転送する。

尚、相違度レジスタ１６の内容は、最初Ｏにリセットさ
れており、ＯＣＲ出力文字列の１番目の文字と単語の１
番目の文字とにより決定された文字間距離が加算回路１
５へ転送される時に、ＯＣＲ出力文字列と単語との（■
−１）番目までの比較の結果として得られた相違度が記
憶されている。

このようにして、第ルジスタ及び第２レジスタの内容と
単語レジスタの内容との照合が終了すると、相違度レジ
スタ１６の内容であるＯＣＲ出力文字列と単語との相違
度が判定回路２０へ転送される。

判定回路１０は前述したような処理（より得られる複数
個の単語とＯＣＲ出力文字列との相違度のうち、最小相
違度Ｄ１と２番目に小さい相違度Ｄ２に対してＯＣＲ出
力文字列の文字数により定まる閾値Ｔ１．Ｔ２との間
にＤ１≦Ｔ１且つＤ２−Ｄｌ〉Ｔ２を満足すれば、最小
相違度Ｄ１を得る単語をＯＣＲの入力となる文字フィー
ルドに対応する単語として認識する。

尚、以上の説明では、本発明の適用を英大文字・英小文
字として説明を行ったが、入力文字をＯＣＲにおいて、
複数個の異なる文字種として出力し、単語認識装置にお
いて相違度を検出する場合には、本発明を適用すること
は以上の説明から容易に可能である。

以上述べたように、本発明を用いることにより、英大文
字と英小文字との識別が困難な場合にも、簡単に且つ精
度良く、ＯＣＲ出力文字列と単語との相違度が検出でき
、高精度な単語認識装置を実現することができる。

【図面の簡単な説明】

第１図は、英大文字の文字間距離の一例を説明するため
に示した概念図、第２図は、本発明の一実施例をフロチ
ャートを用いて示した図、第３図は本発明の一実施例を
示した論理ブロック図である。第４図ａ、ｂは第２図で示した相違度計算方法を具体例
を用いて説明するために示した図である。図において、１はＯＣＲ，２は辞書メモリ、３は第２レ
ジスタ、４は第２レジスタ、５は単語記憶レジスタ、６
，７はアドレスレジスタ、８は英大文字文字間距離メモ
リ、−９は英小文字文字間距離メモリ、１１及び１２は
ラッチ回路、１３は選択回路、１４は比較回路、１５は
加算回路、１６は相違度レジスタ、２０は判定回路であ
る。

Claims

【特許請求の範囲】１文字読取装置より出力される出力文字列と予め用意
された単語辞書に記憶された複数個の単語とを照合し、
前記複数個の単語と出力文字列との相違度を検出する相
違度検出装置において、１つの文字フィールドに対応す
る前記文字読取装置の出力文字列として、第１文字種と
見なして出力された文字列α１α２・・・・・・α。を前記文字読取装置から受取った順序で記憶するための
第ルジスタと、前記文字読取装置の出力文字列として第
２文字種と見なして出力された文字列β１β２・・・・
・・β。を前記文字読取装置から受取った順序で記憶するための
第２レジスタと、第１文字種におけるｉ番目の文字カテ
ゴ’ＪＵ（ｉ）と第１文字種と見なして前記文字読取装
置より出力される文字αとの第２文字種文字間距離ｄ〔
α、Ｕ（ｉ）、ｌ及び第２文字種におけるｉ番目の文字
カテゴ’ＪＬ（ｉ）と第２文字種と見なして前記文字読
取装置より出力される文字βとの第１文字種文字間距離
ｄ〔β、Ｌ（ｉ）、ｌを記憶する記憶装置と、単語を
構成するｊ番目の文字ａｊと比較される第ルジスタ及び
第２レジスタのに番目（但し、ｊ −ｓ≦に≦ｊ＋
ｓであり、Ｓは予め設定された定数０，１，２・・・・
・・とする。）の内容αに、βにとにより決定される前記第１文字種
文字間距離ｄ（ａ、Ｕ（ｉ）、ｌ（但しα＝ｃ
ｔＬＵ（ｉ）＝ａｊ）及び前記第２文字種文字間距離ｄ
〔β、Ｌ（ｉ））（但しβ＝βｋ、Ｌ（ｉ）＝ａ
ｊ）のうち、どちらか小さい値を持つ文字間距離を
前記単語の文字ａｊと前記読取装置のに番目の出力文字
αに、βにとの文字間距離として検出する文字間距離検
出手段と、前記単語と前記文字読取装置の出力文字列と
を照合し、前記文字間距離検出手段により得られる前記
文字間距離に基づいて前記単語と前記文字読取装置の出
力文字列との相違度を検出する照合手段とで構成された
ことを特徴とする相違度検出装置。