JPH0258187A

JPH0258187A - 文字認識装置

Info

Publication number: JPH0258187A
Application number: JP63208443A
Authority: JP
Inventors: Yukiko Yamaguchi; 由紀子山口
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1988-08-24
Filing date: 1988-08-24
Publication date: 1990-02-27
Anticipated expiration: 2012-11-17
Also published as: JP2677271B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概　要〕複数の字種の文字パターンを記憶する辞書を備えて、認
識対象の文字列を構成する各文字の形状に関するデータ
を抽出して前記複数の字種の文字パターンと比較し、該
各文字に対する該文字パターンの類似度によって文字を
認識する文字認識装置に関し、同一字種の文字の間に異なる字種の文字が存在する場合
に、該異なる字種の文字を該異なる字４重の文字の前後
の文字と同一字種の文字候補の中で最も類似度の高い文
字パターンの文字に置き換えるべきか否かを判定し得る
ようにすることを目的とし、各文字に対して最も類似度の高い認識文字候補の類似度
と、各文字に対する認識文字候補のうち該各文字の前後
の文字に対して最も類似度の高い認、識文字候補に等し
い字種であるものの中で類似度が最も高いものの類似度
との差を置換可能度として求め、前記前後の文字に対す
る前記最も類似度の高い認識文字候補の類似度と、該前
後の文字に対する認識文字候補のうち前記各文字に対し
て最も類似度の高い認識文字候補と等しい字種であるも
のの中で類似度が最も高いものの類似度との差を置換可
能度として求める置換可能度演算手段と、前記各文字お
よび該各文字の前後の文字の置換可能度を、それぞれに
対応して予め定められたしきい値と比較し、該それぞれ
に対応するしきい値を基準として、該各文字の置換可能
度が小さく、且つ、該前後の文字の置換可能度が大きい
という置換可能条件を満たすとき、該各文字は、前記前
後の文字に対して最も類似度の高い認識文字候補の字種
であるものの中で該各文字に対する類似度が最も高い認
識文字候補に等しいと認識し、該置換可能条件を満たさ
ないとき、該各文字は該各文字に対して最も類似度の高
い認識文字候補に等しいと認識する認識文字処理手段と
を有してなるように構成する。

［産業上の利用分野］本発明は、複数の字種の文字パターンを記憶する辞書を
備えて、認識対象の文字列を構成する各文字の形状に関
するデータを抽出して前記複数の字種の文字パターンと
比較し、該各文字に対する該文字パターンの類似度によ
って文字を認識する文字認識装置に関する。

通常、文字認識装置においては、紙面上、あるいは製品
上等に印刷された文字や手書きの文字を光学的に走査し
て画像データとして人力し、あるいは、タブレット等の
ポインティングデバイス上にペンで記入して座標データ
として入力し、その特徴を抽出して予め記憶している所
定の（辞書の）文字のパターンと比較し、入力された文
字は、最も類似する文字パターンの文字に等しいものと
することにより文字の認識を行なっている。

上記のような文字認識装置における文字の認識方式には
、種々の方式が公知となっている（例えば、特開昭６１
−８６８８３にまとめられている）が、何れの方式によ
っても、文字の誤認識の発生は避けることが出来ない。

そのため、上記の文字認識の後の段階で誤認識文字の修
正の処理が必要となる。

本発明は、このような文字認識装置における誤認識文字
の修正処理に係わるものである。

〔従来の技術、および発明が解決しようとする課題〕

従来、複数の字種の文字の認識を行なう文字認識装置に
おいて行なわれている誤認識の修正方式の１つとして、
前述のように、文字列の各文字の画像データを入力しで
、それぞれを複数字種の辞書の文字のパターンと比較し
、最も類似する文字パターンの文字に等しいと認識する
ことにより得られた認識結果が、例えば、「○△Ｏ△○
△・・・」　（ここで○および△は、それぞれ同一字種
の文字とする）のようになった場合、１つの単語が異な
る字種の文字によって構成されることは少なく、同一の
字種の文字の連続によって構成されることが多いことを
考慮して、例えば、上記の○の字種の文字であると認識
された入力文字データの間に挟まれたへの字種の文字で
あると認識された人力文字データを、核間に挟まれた文
字は、その前後の文字と同一の字種○である可能性が大
きいと考えて、核間に挟まれた文字に対して類似する文
字パターンのうち、字種○であって最も類似度の高いも
のを求めて、これを核間に挟まれた文字に等しいものと
認識するように修正する方式がある。

ところが、従来の上記のようなげ修正方式においては、
異なる字種の文字が連続して交互に並ぶような認識結果
が得られた場合には、例えば、上記の説明に用いた例に
おいて、Ｏの字種の文字の側を修正すればよいのか、△
の字種の文字の側を修正すればよいのかを正しく判断す
ることができなかった。

例えば、第６図は、片仮名で「ハーモニカ」と記された
文字画像を読み取って、漢字の辞書と片仮名の辞書とを
含む複数の辞書に記憶される文字パターンと比較するこ
とによって、類似度の高い認識文字の候補を求めた結果
を示すものである。

第６図において、各認識結果の文字の下に示される数字
は、入力画像と認識結果の文字の文字パターンとの類似
度を示す指標となる数字であって、第６図の指標が小さ
い程、類似度は大きい。

第６図に示されるように、複数の字種の辞書部てを用い
て最も類似度が高い文字パターンの文字を求めた結果は
、人力画像「ハＪ、「モ」およびｒ力」に対しては、そ
れぞれ片仮名「ハ」、「モ」および「力」となったが、
人力画像「−」「二」に対しては、それぞれ漢字の「−
」および「二」となっている。

ところが、従来の文字認識装置においては、上記のよう
な、「漢字−片仮名一漢字一片仮名一漢字」という結果
が得られた際に、漢字と認識された文字の間に挟まれた
、片仮名と認識された文字を漢字の中で最も類似度の高
い文字パターンの文字と置き換えればよいのか、あるい
は、片仮名と認識された文字の間に挟まれた、漢字と認
識された文字を片仮名の中で最も類似度の高い文字パタ
ーンの文字と置き換えればよいのかが判断出来なかった
。そのため、第６図の例で、漢字の「−」および「二」
と認識された文字画像を、それぞれ片仮名の中で最も類
似度の高い「−」および「二」と置き換えれば良いとこ
ろを、逆に、片仮名「ハ」、「モ」および「力」と認識
した方を、それぞれ、漢字の中で最も類似度の高い「八
」、「壬」および「力」と置き換えてしまい、修正処理
の結果が却って懇化するという問題があった。

本発明は上記の問題点に鑑み、なされたもので、複数の
字種の文字パターンを記憶する辞書を用いて、文字列を
構成する各文字の画像に対して、それぞれ最も類似度の
高い文字パターンの文字を選出した結果、同一字種の文
字の間に異なる字種の文字が存在する場合に、該異なる
字種の文字を前後の文字と同一の字種の文字候補の中で
最も類似度の高い文字パターンの文字に置き換えるべき
か否かを判定し得る文字認識装置を提供することを目的
とするものである。

〔課題を解決するための手段〕

第１図は本発明の第１の形態の基本構成図である。本図
において、１は辞書部、２は認識文字候補選出手段、３
は置換可能度演算手段、そして、４は認識文字処理手段
である。

辞書部１は、複数の字種の文字パターンを記憶する。

認識文字候補選出手段２は、認識対象の文字列を構成す
る各文字の形状に関するデータを人力して特徴を抽出し
、前記複数の字種の文字パターンと比較して、該各文字
に対して類似度の高い文字パターンの文字を認識文字候
補として選出する。

置換可能度演算手段３は、前記文字列における該各文字
について、該各文字の前後の文字に対して最も類似度の
高い認識文字候補の字種が互いに同一の第１の字種（任
意の１字種）であり、且つ、該各文字に対して最も類似
度の高い認識文字候補の字種が、上記前後の文字に対す
る最も類似度の高い認識文字候補の字種と異なる第２の
字種（前記第１の字種と異なる任意の１字種）である場
合に、該各文字に対する前記最も類似度の高い認識文字
候補の類似度と、該各文字に対する認識文字候補のうち
前記第１の字種であって類似度が最も高いものの類似度
との差を置換可能度として求め、前記前後の文字に対す
る前記最も類似度の高い認識文字候補の類似度と、該前
後の文字に対する前記認識文字候補のうち前記第２の字
種であるものの中で類似度が最も高いものの類似度との
差を置換可能度として求める。

認識文字処理手段４は、前記各文字および該各文字の前
後の文字の置換可能度を、それぞれに対応して予め定め
られたしきい値と比較し、該それぞれに対応するしきい
値を７ＪＱとして、該各文字の置換可能度が小さく、且
つ、該前後の文字の置換可能度が大きいという条件を満
たすとき、該各文字は、前記第１の字種であるものの中
でｒｆｆ（Ｕ度が最も高い認識文字候補に等しいと認識
し、該条件を満たさないとき、該各文字は前記最も類似
度の高い認識文字候補に等しいと認識する。

第２図は本発明の第２の形態の基本構成図である。本図
においては、前記第１図の構成に加えて、認識修正手段
５が設けられている。

認識修正手段５は、前後の文字に対する最も類似度の高
い認識文字候補の字種が互いに同一であり、且つ、自文
字に対する最も類似度の高い認識文字候補の字種が、該
前後の文字に対する最も類似度の高い認識文字候補の字
種と異なり、さらに、前記置換可能度が前記しきい値以
下であるものが２文字以上連続するとき、該連続する文
字の中で置換可能度の最も小さい文字は、該最も小さい
文字の前後の文字に対する。最も類似度の高い認識文字
候補と同一の字種であるものの中で該最も小さい文字に
対する類似度が最も高い認識文字候補に等しいと認識す
るものである。

〔作　用〕

本発明の第１の形態によれば、文字列を構成する各文字
に対して最も類似する（辞書の）文字パターンの字種が
、該各文字の前後の文字に最も類似する文字パターンの
字種と異なり、且つ、該前後の文字に最も類似する文字
パターンの字種が互いに等しいときに、上記各文字、す
なわち、中心の文字を、上記前後の文字に等しい字種の
ものの中で該中心の文字に最も類似する文字パターンの
文字に等しいと認識するか否かを判定する手段として、
辞書の文字パターン全てと比較したときに該中心の文字
に対して最も類似する文字パターンの類似度と、上記前
後の文字に等しい字種のものの中で該中心の文字に最も
類似する文字パターンの類似度との差を求めることによ
り、上記辞書の文字パターン全てと比較したときに該中
心の文字に対して最も類似する文字パターンの文字が、
該中心の文字に対する文字ｔ’２　ｒｈとして、どれだ
け確からしいか（文字認識の確実度）の指標が得られる
。

同時に、上記前後の文字についても同様に、文字認識の
確実度の指標を求める。

こうして、該中心の文字に対する文字認識の確実度の指
標（置換可能度）が予め定めたしきい値より小さく、且
つ、上記前後の文字に対する文字認識の確実度の指標（
置換可能度）が予め定めたしきい値より大きいとき（置
換可能条件）には、前述のように、文字列においては同
一の字種の文字が連続する可能性が大きいという点を考
慮して、前記辞書の文字パターン全てと比較したときに
該中心の文字に対して最もｍ（以する文字パターンの文
字が該中心の文字に対する文字認識としては誤認識であ
る可能性が高いと判断して、上記前後の文字に最も類似
する文字パターンに等しい字種であって該中心の文字に
対して最も少頁似する文字パターンの文字を該中心の文
字に対する文字認識として採用する。

こうして、複数の字種の文字パターンを記憶する辞書を
用いて、文字列を構成する各文字の画像データあるいは
、座標データに対して、それぞれ最も類似度の高い文字
パターンの文字を選出した結果、同一字種の文字の間に
異なる字種の文字か存在する場合に、該異なる字種の文
字を前後の文字の字種と同一字種の文字パターンの中で
最も類似度の高い文字パターンの文字に置き換えるべき
か否かを判定することができ、修正処理の結果が却って
悪化するということを、かなり防止できる。

また、本発明の第２の形態によれば、上述の本発明の第
１の形態における置換可能度が前記所定のしきい値以下
であるにも拘わらず、前記辞書の文字パターン全てと比
較したときに該中心の文字に対して最も類似する文字パ
ターンの字種が、前後の文字に対して最も類似する文字
パターンの字種と異なるものが２つ以上連続して存在す
るときには、この連続して存在する文字の中で、前記文
字認識の確実度の指標（置換可能度）が最も小さいもの
が誤認識である可能性が高いと判断して、該前後の文字
に最も類似する文字パターンに等しい字種であって上記
の確実度の指標（置換可能度）が最も小さい文字に対し
て最も類似する文字パターンの文字を該最も小さい文字
に対する文字認識として採用する。

こうして、本発明の第２の形態によれば、より精度のよ
い修正処理が可能となる。

〔実施例〕

本発明の実施例の文字認識装置のハードウェア構成は、
概略、従来のＯＣＲ（ｏｐｔｉｃａｌ　ｃｏｄｅｒｅａ
ｄｅｒ）やオンライン手書き文字認識等の文字認識装置
と同様であって、第３図に示されるように、認識辞書３
０、入力部３１、特徴抽出部３２、照合部３３、後処理
部３４、そして、表示部３５からなる。

人力部３１は文字の画像データを光学的に読み取る。あ
るいは、タブレット上に片で記入された文字の座標を読
み取る。

特徴抽出部３２は、前述のような種々の認識方式に従う
文字パターンを特徴づけるパラメータの抽出を行なう。

認識辞書３０は、上記の認識方式に従う標準文字パター
ンを記４．？する。前述のように、本発明の実施例の文
字認識装置においては、片仮名、平仮名、漢字等、複数
の字種の標準文字パターンを記憶する。

照合部３３は、前記特徴抽出部３２において抽出した文
字パターンの特徴パラメータを、上記認識辞書３０に記
憶する全ての字種の標準文字パターンと比較して、各入
力文字に対して、類似度の高いものから順に、その類似
度と共にリストアツブして認識文字候補列を生成する。

そして、後処理部３４においては、前記照合部３３にお
いて類似度が第１位と判定された認識文字候補を最終的
な文字認識結果として採用してよいかどうかを判定し、
その判定に従って必要ならば、前記認識文字候補列のよ
り下位の認識文字候補を最終的な文字認識結果として採
用する。すなわち、前述の本発明の特徴的な構成は、主
にこの後処理部３４に存在する。

そして、表示部−３５は、上記の後処理部３４より出力
された最終的な文字認識結果を表示する。

なお、上記の認識辞書３０は、主としてメモリ回路から
なり、入力部３１が、例えば、通常のＯＣＲにおけるよ
うな光学的な走査機ＦＩ（例えば、ＣＯＤスキャナ等）
、あるいは、タブレット等の座標入力機構を備え、表示
部３５がＣＲＴ等の表示機構を備える他は、上記各部は
、それぞれ、ＣＰＵ、ＲＡＭ、ＲＯＭ等から構成される
マイクロコンピュータによって実現される。

第３図の構成中、本発明に係わる後処理部３４の構成の
概略は、第６図に示されている。すなわち、後処理部は
、制御部４０、字種判定部４１、候補検索部４２、類似
度差算出部４３、置換可能値保存部４４、そして、置換
処理部４５からなる。

制御部４０は、第３図の照合部３３において、入力され
た文字画像の各々について前述の認識文字候補列が生成
されると、字種判定部４１を制御して、該認識文字候補
列の第１位の候補の字種の判定が行なわれるように指示
する。字種判定部４１は該認識文字候補列の第１位の候
補の字種が、前後の文字同士は互いに同じであって、該
前後の文字の間に位置する中心の文字のみ該前後の文字
の字種と異なるとき、該中心の文字を置換検討文字と判
定する。候補検索部４２は、上記字種判定部４１におい
て置換検討文字と判定された文字については、該置換検
討文字と判定された文字の前後の文字に対する認識文字
候補列の第１位の候補と等しい字種の認、識文字候補の
うち最も類似度の高いものを検索し、また、該前後の文
字については、上記置換検討文字と判定された文字に対
する認識文字候補列の第１位の候補と等しい字種の認識
文字候補のうち最も類似度の高いものを検索する。ここ
で入力された先頭の文字の前の文字に対する認識文字候
補としては、２文字目の文字に対する認識文字候補の字
種を、また、末尾の文字の後の文字に対する認識文字候
補としては、末尾から２番目の文字に対する認識文字候
補の字種を用いる。

そして、類似度差算出部４３は、前記候補検索部４２に
おいて検出された、置換検討文字および該置換検討文字
の前後の文字に対する認識文字候補列の第１位の候補と
その類似度、および、上記置換検討文字と判定された文
字の認識文字候補のうち、該置換検討文字の前後の文字
に対する認１識文字候補列の第１位の候補と等しい字種
であって該置換検討文字と判定された文字に対する類似
度が最も高いものとその類似度、そして、上記置換検討
文字と判定された文字の前後の文字の８＝’２　ＡＭ文
字候補のうち、該置換検討文字と判定された文字に対す
る認識文字候補列の第１位の候補と等しい字種であって
該前後の文字に対する類似度が最も高いものとそのＩＱ
（以度をもとに、（置換検討文字の置換可能度）−１（置換検討文字と判
定された文字に対する認識文字候補列の第１位の候補の
類似度）−（該置換検討文字と判定された文字の認識文
字候補のうち該置換検討文字と判定された文字の前後の
文字に対する認識文字候補列の第１位の候補と等しい字
種であって該置換検討文字と判定された文字に対する類
似度が最も高いものの類似度）（前後の文字の匝換可能度）−１（置換検討文字と判定
された文字の０；１後の文字に対する認識文字候補列の
第１位の候補の類似度）＝（置換検討文字と判定された
文字の前後の文字に対する認識文字候補列のうち該置換
検討文字と判定された文字に対する認識文字候補列の第
１位の候補と等しい字種であって該前後の文字に対する
類似度が最も高いものの類似度）を演算して求める。

例えば、上記置換検討文字およびその前後の文字に対す
る認識文字候補列の第１位の候補の字種が「○△○」と
なったときには、上記置換検討文字の前の文字に対する
認識文字候補列の第１位の候補の類似度と、核部の文字
に対する認識文字候補列内の、字種へてあって核部の文
字に対する類似度が最も高い候補の類似度との差（の絶
対値）を求め、これをｄｌとする。

同様に、上記置換検討文字に対する認識文字候補列の第
１位の候補の類似度と、該置換検討文字に対する認識文
字候補列内の、字種○であって該置換検討文字に対する
類似度が最も高い候′＋：ｔｉの類似度との差（の絶対
値）を求め、これをｄ２とする。

さらに、上記置換検討文字の後の文字に対する認識文字
候補列の第１位の候補の類似度と、核後の文字に対する
認識文字候補列内の、字種へであって該後の文字に対す
る類似度が最も高い候補の１（ｐ度との差（の絶対値）
を求め、これをｄ：ｌとする。

なお、上記置換検討文字あるいは前後の文字の何れかに
ついて、上記のように、認２識文字候補列内の、より下
位に異なる字種の認識文字候補が存在しないときには、
対応する類似度の差（の絶対値）の代わりに、後述する
対応するしきい値を超える所定の値に設定する。

上記の演算結果は、第４図の置換検討文字データ保持部
４４に保持される。

第４図の置換処理部４５は、上記置換検討文字データ保
持部４４に保持されたデータをもとに以下の処理を行な
う。

まず、上記置換可能度を、置換検討文字および該置換検
討文字の前後の文字それぞれに対応して予め設定された
しきい値と比較して、前述の本発明による置換可能条件
を満たすか否かを判定する。

すなわち、前述の例において、前記前の文字、置ｔ’Ａ
　＋’Ａ討文字、および後の文字に対して予め定められ
たしきい値を、それぞれ、ＴＨｌ、ＴＩ（２゜およびＴ
Ｈ３とするとき、置換可能条件ｄ１　〉ＴＨｌ　　ｄｚ
　＜ＴＨ２，およびｄ３＞ＴＨ３を同時に満たすかどう
かを判定する。

もし、上記置換可能条件を満たずならば、該置換検討文
字を、上記の置換検討文字に対する認識文字候補列内の
、字種○であって該置換検討文字に対する類似度が最も
高い候補、つまり、該置換検討文字の認識文字候補のう
ち置換検討文字の前後の文字に対する認識文字候補列の
第１位の候補と等しい字種であって該置換検討文字に対
する類似度が最も高い候補に等しいと認識する。すなわ
ち、置換が行なわれる。

上記の置換可能条件を満たさないときには、該置換検討
文字は、元の該置換検討文字に対する認識文字候補列内
の第１位の候補と等しいと認識する。すなわち、置換は
行なわれない。

ところで、例えば、前述のように、字種が「○△○△」
のように連続したときに、さらに、これらの２番目およ
び３番目の文字の上記置換可能度が前記のしきい値以下
である場合を考える。さらに、このような場合に、互換
可能度が前記のしきい値以下であるために置換が行なわ
れなかった置換検討文字が２つ以上連続したとき、前述
の本発明の第２の形態によって設けられた、認識修正手
段５　（第２図）に対応する機能が働く。

すなわち、連続する３文字の中に置換が行なわれなかっ
た置換検討文字が２つ以上連続して存在するときには、
該連続する置換検討文字のうち、前記置換可能度が最小
となる文字は、該置換可能度が最小となる文字の認識文
字候補列内の、該置換可能度が最小となる文字の前後の
文字に対する認識文字候補列内の第１位の候補と等しい
字腫のものの中で該最小となる文字に対する類似度が最
も高い候補に等しいと認識する。つまり、上記連続する
置換検討文字のうち、前記置換可能度が最小となる文字
に対して置換を実行する。

上述の置換処理部４５による処理を、第３図の照合部３
３において前記第６図の認識結果が得られた場合を例に
とって以下に具体的に説明する。

第６図には、また、第６図の認識結果から演算される置
換可能度を、入力「ハ」に対応する文字、入力「−」に
対応する文字、そして、入力「モ」に対応する文字につ
いて、それぞれ示している。

前述のように、第６図の認識結果（認識文字候補列）の
第１位の字種は、「○△○△△ｊとなっており、例えば
、第１〜３番目まで全て前記置換検討文字である。ここ
で、さらに、前記のしきい値Ｔ＋（１，ＴＨ２およびＴ
Ｈ３を全て５０であるとすると、第６図に示されるよう
に、全ての文字に対する置換可能度が該しきい値５０以
下である。

したがって、何れの場合にも、本発明の第１の形態によ
る置換可能条件を満たさず、該置換可能条件による置換
は行なわれない。

そこで、次に、本発明の第２の形態による認識修正手段
の機能が働（。

今、置換検討文字として抽出され、置換条件を満たして
いると判定された「ハ」、「−」、「モｊの置換可能度
を比較すると、ｒ、の置換可能度３が最小である。した
がって、「−」について、本発明の第２の形態による認
識修正手段の機能によって、置換が行なわれる。

上述の入力ｒ、に対応する文字の置換とは、すなわち、
該入力「−」に対応する文字に対する認識文字候補列の
第１位にある漢字「−」という認識を、該入力「−」に
対応する文字に対する認識文字候補列において、核入力
「−」に対応する文字の前後の文字に対する認識文字候
補列の第１位の字種と同一の字種、つまり、片仮名であ
るものの中で最も該入力「−」に対応する文字に類似す
るところの、第３位の片仮名「−」に置き換えるもので
ある。こうして、元の片仮名の入力「ハーモｊの部分が
正しく認識された。

このようにして、本発明の実施例の第３図および第４図
の１が成によれば、片仮名の入力「ハーモニカ」に対し
て認識結果「ハーモニカ」（「二」および「力」は漢字
）が表示される。

第５図は、以上述べた本発明の実施例の処理の手順をフ
ローチャー１−により示すものである。

第５図のステップ５００の開始後、ステップ５０１にて
、先ず先頭文字を中心文字として、ステップ５０２にて
、該中心文字および該中心文字の前後の文字に対する認
識文字候補列（例えば、第６図）の第１位の候補の字種
を検出し、ステップ５０３にて、該前後の文字に対する
認識文字候補列の第１位の候補の字種が同一の字種であ
って該中心文字に対する認識文字候補列の第１位の候補
の字種と異なる（すなわち、該中心文字が置換検討文字
である）ならばステ・ツブ５０４に進む。

ステップ５０３において上記以外の場合にはステップ５
０８に進んで入力文字列の次の文字を中心文字とし、ス
テップ５０２に進む。

前記ステップ５０４にては、前記中心文字に対する認識
文字候補列において、該中心文字の前後の文字に対する
認識文字候補列の第１位の候補と等しい字種の候補の中
で該中心文字に最も類似する候補、および、前記中心文
字の前後の文字に対する認、識文字候補列において、該
中心文字に対する認識文字候補列の第１位の候補と等し
い字種の候補の中で該前後の文字に最も類似する候補を
検索する。

ステップ５０５においては、前記中心文字に対して、該
中心文字に対する認識文字候補列の第１位の候補の類似
度と、該中心文字に対する認識文字候補列において該中
心文字の前後の文字に対する認識文字候補列の第１位の
候補と等しい字種の候補であって該中心文字に最も類似
する候補の類似度との差を置換可能塵として求め、また
、前記中心文字の前後の文字に対して、該中心文字の前
後の文字に対する認識文字候補列の第１位の候補の類似
度と、該中心文字の前後の文字に対する認識文字候補列
において該中心文字に対する認識文字候補列の第１位の
候補と等しい字種の候補であって該中心文字の前後の文
字に最も類似する候補の類似度との差を置換可能塵とし
て求める。

ステップ５０６においては、上記の置換可能塵のデータ
を（第４図の置換検討文字データ保持部４４に）記１α
する。

以上の処理が入力文字列の全ての文字を中心文字として
実施されたか否かをステップ５０７にて判断し、全ての
文字について処理が終了していなければ再び前記ステッ
プ５０８に進み、終了していればステップ５０９に進む
。

ステップ５０９〜５１４は、前記入力文字列の全ての文
字を中心文字とした場合について、それぞれ、前記置換
可能条件Ｃ＞ＴＨｌ、ｄ２＜ＴＨ２，およびｄ３＞ＴＨ
３を同時に満たすかどうかを判定し、該置換可能条件を
満たせばステップ５１２において、そのときの中心文字
を、該中心文字に対する認識文字候補列の第１位の候補
の代わりに、該中心文字に対する認識文字候補列におい
て該中心文字の前後の文字に対する認識文字候補列の第
１位の候補と等しい字種の候補であって該中心文字に最
も類似する候補に等しいと認識する。

ステップ５１３にては、以上の処理が入力文字列の全て
の文字を中心文字として実施されたか否かを判断し、全
ての文字について処理が終了していればステップ５１５
に進む。

ステップ５１５〜５２５は、前記入力文字列の全ての文
字について、置換可能塵がしきい値以下である置換検討
文字が２文字以上連続して存在するか否かを判定し、さ
らに、該中心文字が、上記２文字以上連続して存在する
、置換可能塵がしきい値以下である置換検討文字のうち
、置換可能塵（前記類似度の差）が最小の文字について
は、その文字に対する認識文字候補列の第１位の候補の
代わりに、該文字に対する認識文字候補列において該文
字の前後の文字に対する認識文字候補列の第１位の候補
と等しい字種の候補であって該文字に最も類似する候補
に等しいと認識する手順を示すものである。

すなわち、ステップ５１５〜５１７において先頭文字か
ら順に、置換可能度がしきい値以下である置換検討文字
をサーチして、もし、置換可能度がしきい値以下である
置換検討文字が存在すれば、ステップ５１８および５１
９にて、次の文字も置換可能度がしきい値以下である置
換検討文字かどうかを判定する。そして、ステップ５１
９において、置換可能度がしきい値以下である置換検討
文字が２文字続いたと判断されたときは、ステップ５２
０および５２１に進んで、置換可能度がしきい値以下で
ある置換検討文字がどこまで連続するかを検出し、ステ
ップ５２２において、これら連続する置換可能度がしき
い値以下である置換検討文字のうち置換可能度（前記類
似度の差）が最小の文字を求め、さらに、ステップ５２
３において、該置換可能度が最小の文字については、そ
の文字に対する認識文字候補列の第１位の候補の代わり
に、該文字に対する認識文字候補列において該文字の前
後の文字に対する認識文字候補列の第１位の候補と等し
い字種の候補であって該文字に最も類似する候補に等し
いと認識する。すなわち、置換を行なう。

そして、ステップ５２４にては、以上の処理が入力文字
列の全ての文字について実施されたか否かを判断し、全
ての文字について処理が終了していればステップ５２１
゛に進んで処理を終了する。

〔発明の効果〕

本発明によれば、同一字種の文字の間に異なる字種の文
字が存在する場合に、該異なる字種の文字を、該異なる
字種の文字の前後の文字と同一字種の文字候補の中で最
も類似度の高い文字パターンの文字に置き換えるべきか
否かを判定し得るようにし、文字認識装置における修正
処理の性能を改善することができる。

【図面の簡単な説明】

第１図は本発明の第１の形態の基本構成図、第２図は本
発明の第２の形態の基本構成図、第３図は文字認識装置
のハードウェア構成の概略を示す図、第４図は第３図の構成における後処理部の構成の概略を
示す図、第５図は本発明の実施例における処理の手順を示す図、
そして第６図は第３図の文字認識装置の照合部による認識結果
の１例を示す図である。〔符号の説明〕１・・・辞書部、２・・・認識文字候補選出手段、３・・・置換可能度演算手段、そして、４・・・認識文
字処理手段、５・・・認識修正手段、３０・・・認識辞
書、　　　　３１・・・入力部、３２・・・特徴抽出部
、　　３３・・・照合部、３４・・・後処理部、　　　
３５・・・表示部、４０・・・制御部、　　　　　４１
・・・字種判定部、４２・・・候補検索部、　　　４３
・・・類似度差算出部、４４・・・置換可能値保存部、４５・・・置換処理部。

Claims

【特許請求の範囲】１、複数の字種の文字パターンを記憶する辞書部（１）
と、認識対象の文字列を構成する各文字の形状に関するデー
タを入力して特徴を抽出し、前記複数の字種の文字パタ
ーンと比較して、該各文字に対して類似度の高い文字パ
ターンの文字を認識文字候補として選出する認識文字候
補選出手段（２）と、前記文字列における該各文字につ
いて、該各文字の前後の文字に対して最も類似度の高い認識文
字候補の字種が互いに同一の第１の字種であり、且つ、
該各文字に対して最も類似度の高い認識文字候補の字種
が、前記前後の文字に対して最も類似度の高い認識文字
候補の字種と異なる第２の字種である場合に、該各文字
に対する前記最も類似度の高い認識文字候補の類似度と
、該各文字に対する前記認識文字候補のうち前記第１の
字種のものの中で類似度が最も高いものの類似度との差
を置換可能度として求め、前記前後の文字に対する前記
最も類似度の高い認識文字候補の類似度と、該前後の文
字に対する前記認識文字候補のうち前記第２の字種であ
るものの中で類似度が最も高いものの類似度との差を置
換可能度として求める置換可能度演算手段（３）と、前記各文字および該各文字の前後の文字の置換可能度を
、それぞれに対応して予め定められたしきい値と比較し
、該それぞれに対応するしきい値を基準として、該各文
字の置換可能度が小さく、且つ、該前後の文字の置換可
能度が大きいという置換可能条件を満たすとき、該各文
字は、該各文字に対する前記認識文字候補のうち前記第
１の字種であるものの中で類似度が最も高い認識文字候
補に等しいと認識し、該置換可能条件を満たさないとき
、該各文字は前記最も類似度の高い認識文字候補に等し
いと認識する認識文字処理手段（４）とを有してなるこ
とを特徴とする文字認識装置。２、前後の文字に対して最も類似度の高い認識文字候補
の字種が同一の字種であり、且つ、自文字に対して最も
類似度の高い認識文字候補の字種が、該前後の文字に対
して最も類似度の高い認識文字候補の字種と異なる字種
であり、さらに、該自文字の前記置換可能度が前記しき
い値以下である文字が２文字以上連続して存在するとき
、該連続する文字の中で置換可能度の最も小さい文字は
、該最も小さい文字に対する認識文字候補の中で、該最
も小さい文字の前後の文字に対する認識文字候補のうち
最も類似度の高いものに等しい字種であって該最も小さ
い文字に最も類似するものに等しいと認識する認識修正
手段（５）を有する請求項１記載の文字認識装置。