JPH0258187A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0258187A
JPH0258187A JP63208443A JP20844388A JPH0258187A JP H0258187 A JPH0258187 A JP H0258187A JP 63208443 A JP63208443 A JP 63208443A JP 20844388 A JP20844388 A JP 20844388A JP H0258187 A JPH0258187 A JP H0258187A
Authority
JP
Japan
Prior art keywords
character
similarity
candidate
recognized
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63208443A
Other languages
English (en)
Other versions
JP2677271B2 (ja
Inventor
Yukiko Yamaguchi
由紀子 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63208443A priority Critical patent/JP2677271B2/ja
Publication of JPH0258187A publication Critical patent/JPH0258187A/ja
Application granted granted Critical
Publication of JP2677271B2 publication Critical patent/JP2677271B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 複数の字種の文字パターンを記憶する辞書を備えて、認
識対象の文字列を構成する各文字の形状に関するデータ
を抽出して前記複数の字種の文字パターンと比較し、該
各文字に対する該文字パターンの類似度によって文字を
認識する文字認識装置に関し、 同一字種の文字の間に異なる字種の文字が存在する場合
に、該異なる字種の文字を該異なる字4重の文字の前後
の文字と同一字種の文字候補の中で最も類似度の高い文
字パターンの文字に置き換えるべきか否かを判定し得る
ようにすることを目的とし、 各文字に対して最も類似度の高い認識文字候補の類似度
と、各文字に対する認識文字候補のうち該各文字の前後
の文字に対して最も類似度の高い認、識文字候補に等し
い字種であるものの中で類似度が最も高いものの類似度
との差を置換可能度として求め、前記前後の文字に対す
る前記最も類似度の高い認識文字候補の類似度と、該前
後の文字に対する認識文字候補のうち前記各文字に対し
て最も類似度の高い認識文字候補と等しい字種であるも
のの中で類似度が最も高いものの類似度との差を置換可
能度として求める置換可能度演算手段と、前記各文字お
よび該各文字の前後の文字の置換可能度を、それぞれに
対応して予め定められたしきい値と比較し、該それぞれ
に対応するしきい値を基準として、該各文字の置換可能
度が小さく、且つ、該前後の文字の置換可能度が大きい
という置換可能条件を満たすとき、該各文字は、前記前
後の文字に対して最も類似度の高い認識文字候補の字種
であるものの中で該各文字に対する類似度が最も高い認
識文字候補に等しいと認識し、該置換可能条件を満たさ
ないとき、該各文字は該各文字に対して最も類似度の高
い認識文字候補に等しいと認識する認識文字処理手段と
を有してなるように構成する。
[産業上の利用分野] 本発明は、複数の字種の文字パターンを記憶する辞書を
備えて、認識対象の文字列を構成する各文字の形状に関
するデータを抽出して前記複数の字種の文字パターンと
比較し、該各文字に対する該文字パターンの類似度によ
って文字を認識する文字認識装置に関する。
通常、文字認識装置においては、紙面上、あるいは製品
上等に印刷された文字や手書きの文字を光学的に走査し
て画像データとして人力し、あるいは、タブレット等の
ポインティングデバイス上にペンで記入して座標データ
として入力し、その特徴を抽出して予め記憶している所
定の(辞書の)文字のパターンと比較し、入力された文
字は、最も類似する文字パターンの文字に等しいものと
することにより文字の認識を行なっている。
上記のような文字認識装置における文字の認識方式には
、種々の方式が公知となっている(例えば、特開昭61
−86883にまとめられている)が、何れの方式によ
っても、文字の誤認識の発生は避けることが出来ない。
そのため、上記の文字認識の後の段階で誤認識文字の修
正の処理が必要となる。
本発明は、このような文字認識装置における誤認識文字
の修正処理に係わるものである。
〔従来の技術、および発明が解決しようとする課題〕
従来、複数の字種の文字の認識を行なう文字認識装置に
おいて行なわれている誤認識の修正方式の1つとして、
前述のように、文字列の各文字の画像データを入力しで
、それぞれを複数字種の辞書の文字のパターンと比較し
、最も類似する文字パターンの文字に等しいと認識する
ことにより得られた認識結果が、例えば、「○△O△○
△・・・」 (ここで○および△は、それぞれ同一字種
の文字とする)のようになった場合、1つの単語が異な
る字種の文字によって構成されることは少なく、同一の
字種の文字の連続によって構成されることが多いことを
考慮して、例えば、上記の○の字種の文字であると認識
された入力文字データの間に挟まれたへの字種の文字で
あると認識された人力文字データを、核間に挟まれた文
字は、その前後の文字と同一の字種○である可能性が大
きいと考えて、核間に挟まれた文字に対して類似する文
字パターンのうち、字種○であって最も類似度の高いも
のを求めて、これを核間に挟まれた文字に等しいものと
認識するように修正する方式がある。
ところが、従来の上記のようなげ修正方式においては、
異なる字種の文字が連続して交互に並ぶような認識結果
が得られた場合には、例えば、上記の説明に用いた例に
おいて、Oの字種の文字の側を修正すればよいのか、△
の字種の文字の側を修正すればよいのかを正しく判断す
ることができなかった。
例えば、第6図は、片仮名で「ハーモニカ」と記された
文字画像を読み取って、漢字の辞書と片仮名の辞書とを
含む複数の辞書に記憶される文字パターンと比較するこ
とによって、類似度の高い認識文字の候補を求めた結果
を示すものである。
第6図において、各認識結果の文字の下に示される数字
は、入力画像と認識結果の文字の文字パターンとの類似
度を示す指標となる数字であって、第6図の指標が小さ
い程、類似度は大きい。
第6図に示されるように、複数の字種の辞書部てを用い
て最も類似度が高い文字パターンの文字を求めた結果は
、人力画像「ハJ、「モ」およびr力」に対しては、そ
れぞれ片仮名「ハ」、「モ」および「力」となったが、
人力画像「−」「二」に対しては、それぞれ漢字の「−
」および「二」となっている。
ところが、従来の文字認識装置においては、上記のよう
な、「漢字−片仮名一漢字一片仮名一漢字」という結果
が得られた際に、漢字と認識された文字の間に挟まれた
、片仮名と認識された文字を漢字の中で最も類似度の高
い文字パターンの文字と置き換えればよいのか、あるい
は、片仮名と認識された文字の間に挟まれた、漢字と認
識された文字を片仮名の中で最も類似度の高い文字パタ
ーンの文字と置き換えればよいのかが判断出来なかった
。そのため、第6図の例で、漢字の「−」および「二」
と認識された文字画像を、それぞれ片仮名の中で最も類
似度の高い「−」および「二」と置き換えれば良いとこ
ろを、逆に、片仮名「ハ」、「モ」および「力」と認識
した方を、それぞれ、漢字の中で最も類似度の高い「八
」、「壬」および「力」と置き換えてしまい、修正処理
の結果が却って懇化するという問題があった。
本発明は上記の問題点に鑑み、なされたもので、複数の
字種の文字パターンを記憶する辞書を用いて、文字列を
構成する各文字の画像に対して、それぞれ最も類似度の
高い文字パターンの文字を選出した結果、同一字種の文
字の間に異なる字種の文字が存在する場合に、該異なる
字種の文字を前後の文字と同一の字種の文字候補の中で
最も類似度の高い文字パターンの文字に置き換えるべき
か否かを判定し得る文字認識装置を提供することを目的
とするものである。
〔課題を解決するための手段〕
第1図は本発明の第1の形態の基本構成図である。本図
において、1は辞書部、2は認識文字候補選出手段、3
は置換可能度演算手段、そして、4は認識文字処理手段
である。
辞書部1は、複数の字種の文字パターンを記憶する。
認識文字候補選出手段2は、認識対象の文字列を構成す
る各文字の形状に関するデータを人力して特徴を抽出し
、前記複数の字種の文字パターンと比較して、該各文字
に対して類似度の高い文字パターンの文字を認識文字候
補として選出する。
置換可能度演算手段3は、前記文字列における該各文字
について、該各文字の前後の文字に対して最も類似度の
高い認識文字候補の字種が互いに同一の第1の字種(任
意の1字種)であり、且つ、該各文字に対して最も類似
度の高い認識文字候補の字種が、上記前後の文字に対す
る最も類似度の高い認識文字候補の字種と異なる第2の
字種(前記第1の字種と異なる任意の1字種)である場
合に、該各文字に対する前記最も類似度の高い認識文字
候補の類似度と、該各文字に対する認識文字候補のうち
前記第1の字種であって類似度が最も高いものの類似度
との差を置換可能度として求め、前記前後の文字に対す
る前記最も類似度の高い認識文字候補の類似度と、該前
後の文字に対する前記認識文字候補のうち前記第2の字
種であるものの中で類似度が最も高いものの類似度との
差を置換可能度として求める。
認識文字処理手段4は、前記各文字および該各文字の前
後の文字の置換可能度を、それぞれに対応して予め定め
られたしきい値と比較し、該それぞれに対応するしきい
値を7JQとして、該各文字の置換可能度が小さく、且
つ、該前後の文字の置換可能度が大きいという条件を満
たすとき、該各文字は、前記第1の字種であるものの中
でrff(U度が最も高い認識文字候補に等しいと認識
し、該条件を満たさないとき、該各文字は前記最も類似
度の高い認識文字候補に等しいと認識する。
第2図は本発明の第2の形態の基本構成図である。本図
においては、前記第1図の構成に加えて、認識修正手段
5が設けられている。
認識修正手段5は、前後の文字に対する最も類似度の高
い認識文字候補の字種が互いに同一であり、且つ、自文
字に対する最も類似度の高い認識文字候補の字種が、該
前後の文字に対する最も類似度の高い認識文字候補の字
種と異なり、さらに、前記置換可能度が前記しきい値以
下であるものが2文字以上連続するとき、該連続する文
字の中で置換可能度の最も小さい文字は、該最も小さい
文字の前後の文字に対する。最も類似度の高い認識文字
候補と同一の字種であるものの中で該最も小さい文字に
対する類似度が最も高い認識文字候補に等しいと認識す
るものである。
〔作 用〕
本発明の第1の形態によれば、文字列を構成する各文字
に対して最も類似する(辞書の)文字パターンの字種が
、該各文字の前後の文字に最も類似する文字パターンの
字種と異なり、且つ、該前後の文字に最も類似する文字
パターンの字種が互いに等しいときに、上記各文字、す
なわち、中心の文字を、上記前後の文字に等しい字種の
ものの中で該中心の文字に最も類似する文字パターンの
文字に等しいと認識するか否かを判定する手段として、
辞書の文字パターン全てと比較したときに該中心の文字
に対して最も類似する文字パターンの類似度と、上記前
後の文字に等しい字種のものの中で該中心の文字に最も
類似する文字パターンの類似度との差を求めることによ
り、上記辞書の文字パターン全てと比較したときに該中
心の文字に対して最も類似する文字パターンの文字が、
該中心の文字に対する文字t’2 rhとして、どれだ
け確からしいか(文字認識の確実度)の指標が得られる
同時に、上記前後の文字についても同様に、文字認識の
確実度の指標を求める。
こうして、該中心の文字に対する文字認識の確実度の指
標(置換可能度)が予め定めたしきい値より小さく、且
つ、上記前後の文字に対する文字認識の確実度の指標(
置換可能度)が予め定めたしきい値より大きいとき(置
換可能条件)には、前述のように、文字列においては同
一の字種の文字が連続する可能性が大きいという点を考
慮して、前記辞書の文字パターン全てと比較したときに
該中心の文字に対して最もm(以する文字パターンの文
字が該中心の文字に対する文字認識としては誤認識であ
る可能性が高いと判断して、上記前後の文字に最も類似
する文字パターンに等しい字種であって該中心の文字に
対して最も少頁似する文字パターンの文字を該中心の文
字に対する文字認識として採用する。
こうして、複数の字種の文字パターンを記憶する辞書を
用いて、文字列を構成する各文字の画像データあるいは
、座標データに対して、それぞれ最も類似度の高い文字
パターンの文字を選出した結果、同一字種の文字の間に
異なる字種の文字か存在する場合に、該異なる字種の文
字を前後の文字の字種と同一字種の文字パターンの中で
最も類似度の高い文字パターンの文字に置き換えるべき
か否かを判定することができ、修正処理の結果が却って
悪化するということを、かなり防止できる。
また、本発明の第2の形態によれば、上述の本発明の第
1の形態における置換可能度が前記所定のしきい値以下
であるにも拘わらず、前記辞書の文字パターン全てと比
較したときに該中心の文字に対して最も類似する文字パ
ターンの字種が、前後の文字に対して最も類似する文字
パターンの字種と異なるものが2つ以上連続して存在す
るときには、この連続して存在する文字の中で、前記文
字認識の確実度の指標(置換可能度)が最も小さいもの
が誤認識である可能性が高いと判断して、該前後の文字
に最も類似する文字パターンに等しい字種であって上記
の確実度の指標(置換可能度)が最も小さい文字に対し
て最も類似する文字パターンの文字を該最も小さい文字
に対する文字認識として採用する。
こうして、本発明の第2の形態によれば、より精度のよ
い修正処理が可能となる。
〔実施例〕
本発明の実施例の文字認識装置のハードウェア構成は、
概略、従来のOCR(optical coderea
der)やオンライン手書き文字認識等の文字認識装置
と同様であって、第3図に示されるように、認識辞書3
0、入力部31、特徴抽出部32、照合部33、後処理
部34、そして、表示部35からなる。
人力部31は文字の画像データを光学的に読み取る。あ
るいは、タブレット上に片で記入された文字の座標を読
み取る。
特徴抽出部32は、前述のような種々の認識方式に従う
文字パターンを特徴づけるパラメータの抽出を行なう。
認識辞書30は、上記の認識方式に従う標準文字パター
ンを記4.?する。前述のように、本発明の実施例の文
字認識装置においては、片仮名、平仮名、漢字等、複数
の字種の標準文字パターンを記憶する。
照合部33は、前記特徴抽出部32において抽出した文
字パターンの特徴パラメータを、上記認識辞書30に記
憶する全ての字種の標準文字パターンと比較して、各入
力文字に対して、類似度の高いものから順に、その類似
度と共にリストアツブして認識文字候補列を生成する。
そして、後処理部34においては、前記照合部33にお
いて類似度が第1位と判定された認識文字候補を最終的
な文字認識結果として採用してよいかどうかを判定し、
その判定に従って必要ならば、前記認識文字候補列のよ
り下位の認識文字候補を最終的な文字認識結果として採
用する。すなわち、前述の本発明の特徴的な構成は、主
にこの後処理部34に存在する。
そして、表示部−35は、上記の後処理部34より出力
された最終的な文字認識結果を表示する。
なお、上記の認識辞書30は、主としてメモリ回路から
なり、入力部31が、例えば、通常のOCRにおけるよ
うな光学的な走査機FI(例えば、CODスキャナ等)
、あるいは、タブレット等の座標入力機構を備え、表示
部35がCRT等の表示機構を備える他は、上記各部は
、それぞれ、CPU、RAM、ROM等から構成される
マイクロコンピュータによって実現される。
第3図の構成中、本発明に係わる後処理部34の構成の
概略は、第6図に示されている。すなわち、後処理部は
、制御部40、字種判定部41、候補検索部42、類似
度差算出部43、置換可能値保存部44、そして、置換
処理部45からなる。
制御部40は、第3図の照合部33において、入力され
た文字画像の各々について前述の認識文字候補列が生成
されると、字種判定部41を制御して、該認識文字候補
列の第1位の候補の字種の判定が行なわれるように指示
する。字種判定部41は該認識文字候補列の第1位の候
補の字種が、前後の文字同士は互いに同じであって、該
前後の文字の間に位置する中心の文字のみ該前後の文字
の字種と異なるとき、該中心の文字を置換検討文字と判
定する。候補検索部42は、上記字種判定部41におい
て置換検討文字と判定された文字については、該置換検
討文字と判定された文字の前後の文字に対する認識文字
候補列の第1位の候補と等しい字種の認、識文字候補の
うち最も類似度の高いものを検索し、また、該前後の文
字については、上記置換検討文字と判定された文字に対
する認識文字候補列の第1位の候補と等しい字種の認識
文字候補のうち最も類似度の高いものを検索する。ここ
で入力された先頭の文字の前の文字に対する認識文字候
補としては、2文字目の文字に対する認識文字候補の字
種を、また、末尾の文字の後の文字に対する認識文字候
補としては、末尾から2番目の文字に対する認識文字候
補の字種を用いる。
そして、類似度差算出部43は、前記候補検索部42に
おいて検出された、置換検討文字および該置換検討文字
の前後の文字に対する認識文字候補列の第1位の候補と
その類似度、および、上記置換検討文字と判定された文
字の認識文字候補のうち、該置換検討文字の前後の文字
に対する認1識文字候補列の第1位の候補と等しい字種
であって該置換検討文字と判定された文字に対する類似
度が最も高いものとその類似度、そして、上記置換検討
文字と判定された文字の前後の文字の8=’2 AM文
字候補のうち、該置換検討文字と判定された文字に対す
る認識文字候補列の第1位の候補と等しい字種であって
該前後の文字に対する類似度が最も高いものとそのIQ
(以度をもとに、 (置換検討文字の置換可能度)−1(置換検討文字と判
定された文字に対する認識文字候補列の第1位の候補の
類似度)−(該置換検討文字と判定された文字の認識文
字候補のうち該置換検討文字と判定された文字の前後の
文字に対する認識文字候補列の第1位の候補と等しい字
種であって該置換検討文字と判定された文字に対する類
似度が最も高いものの類似度) (前後の文字の匝換可能度)−1(置換検討文字と判定
された文字の0;1後の文字に対する認識文字候補列の
第1位の候補の類似度)=(置換検討文字と判定された
文字の前後の文字に対する認識文字候補列のうち該置換
検討文字と判定された文字に対する認識文字候補列の第
1位の候補と等しい字種であって該前後の文字に対する
類似度が最も高いものの類似度) を演算して求める。
例えば、上記置換検討文字およびその前後の文字に対す
る認識文字候補列の第1位の候補の字種が「○△○」と
なったときには、上記置換検討文字の前の文字に対する
認識文字候補列の第1位の候補の類似度と、核部の文字
に対する認識文字候補列内の、字種へてあって核部の文
字に対する類似度が最も高い候補の類似度との差(の絶
対値)を求め、これをdlとする。
同様に、上記置換検討文字に対する認識文字候補列の第
1位の候補の類似度と、該置換検討文字に対する認識文
字候補列内の、字種○であって該置換検討文字に対する
類似度が最も高い候′+:tiの類似度との差(の絶対
値)を求め、これをd2とする。
さらに、上記置換検討文字の後の文字に対する認識文字
候補列の第1位の候補の類似度と、核後の文字に対する
認識文字候補列内の、字種へであって該後の文字に対す
る類似度が最も高い候補の1(p度との差(の絶対値)
を求め、これをd:lとする。
なお、上記置換検討文字あるいは前後の文字の何れかに
ついて、上記のように、認2識文字候補列内の、より下
位に異なる字種の認識文字候補が存在しないときには、
対応する類似度の差(の絶対値)の代わりに、後述する
対応するしきい値を超える所定の値に設定する。
上記の演算結果は、第4図の置換検討文字データ保持部
44に保持される。
第4図の置換処理部45は、上記置換検討文字データ保
持部44に保持されたデータをもとに以下の処理を行な
う。
まず、上記置換可能度を、置換検討文字および該置換検
討文字の前後の文字それぞれに対応して予め設定された
しきい値と比較して、前述の本発明による置換可能条件
を満たすか否かを判定する。
すなわち、前述の例において、前記前の文字、置t’A
 +’A討文字、および後の文字に対して予め定められ
たしきい値を、それぞれ、THl、TI(2゜およびT
H3とするとき、置換可能条件d1 〉THl  dz
 <TH2,およびd3>TH3を同時に満たすかどう
かを判定する。
もし、上記置換可能条件を満たずならば、該置換検討文
字を、上記の置換検討文字に対する認識文字候補列内の
、字種○であって該置換検討文字に対する類似度が最も
高い候補、つまり、該置換検討文字の認識文字候補のう
ち置換検討文字の前後の文字に対する認識文字候補列の
第1位の候補と等しい字種であって該置換検討文字に対
する類似度が最も高い候補に等しいと認識する。すなわ
ち、置換が行なわれる。
上記の置換可能条件を満たさないときには、該置換検討
文字は、元の該置換検討文字に対する認識文字候補列内
の第1位の候補と等しいと認識する。すなわち、置換は
行なわれない。
ところで、例えば、前述のように、字種が「○△○△」
のように連続したときに、さらに、これらの2番目およ
び3番目の文字の上記置換可能度が前記のしきい値以下
である場合を考える。さらに、このような場合に、互換
可能度が前記のしきい値以下であるために置換が行なわ
れなかった置換検討文字が2つ以上連続したとき、前述
の本発明の第2の形態によって設けられた、認識修正手
段5 (第2図)に対応する機能が働く。
すなわち、連続する3文字の中に置換が行なわれなかっ
た置換検討文字が2つ以上連続して存在するときには、
該連続する置換検討文字のうち、前記置換可能度が最小
となる文字は、該置換可能度が最小となる文字の認識文
字候補列内の、該置換可能度が最小となる文字の前後の
文字に対する認識文字候補列内の第1位の候補と等しい
字腫のものの中で該最小となる文字に対する類似度が最
も高い候補に等しいと認識する。つまり、上記連続する
置換検討文字のうち、前記置換可能度が最小となる文字
に対して置換を実行する。
上述の置換処理部45による処理を、第3図の照合部3
3において前記第6図の認識結果が得られた場合を例に
とって以下に具体的に説明する。
第6図には、また、第6図の認識結果から演算される置
換可能度を、入力「ハ」に対応する文字、入力「−」に
対応する文字、そして、入力「モ」に対応する文字につ
いて、それぞれ示している。
前述のように、第6図の認識結果(認識文字候補列)の
第1位の字種は、「○△○△△jとなっており、例えば
、第1〜3番目まで全て前記置換検討文字である。ここ
で、さらに、前記のしきい値T+(1,TH2およびT
H3を全て50であるとすると、第6図に示されるよう
に、全ての文字に対する置換可能度が該しきい値50以
下である。
したがって、何れの場合にも、本発明の第1の形態によ
る置換可能条件を満たさず、該置換可能条件による置換
は行なわれない。
そこで、次に、本発明の第2の形態による認識修正手段
の機能が働(。
今、置換検討文字として抽出され、置換条件を満たして
いると判定された「ハ」、「−」、「モjの置換可能度
を比較すると、r、の置換可能度3が最小である。した
がって、「−」について、本発明の第2の形態による認
識修正手段の機能によって、置換が行なわれる。
上述の入力r、に対応する文字の置換とは、すなわち、
該入力「−」に対応する文字に対する認識文字候補列の
第1位にある漢字「−」という認識を、該入力「−」に
対応する文字に対する認識文字候補列において、核入力
「−」に対応する文字の前後の文字に対する認識文字候
補列の第1位の字種と同一の字種、つまり、片仮名であ
るものの中で最も該入力「−」に対応する文字に類似す
るところの、第3位の片仮名「−」に置き換えるもので
ある。こうして、元の片仮名の入力「ハーモjの部分が
正しく認識された。
このようにして、本発明の実施例の第3図および第4図
の1が成によれば、片仮名の入力「ハーモニカ」に対し
て認識結果「ハーモニカ」(「二」および「力」は漢字
)が表示される。
第5図は、以上述べた本発明の実施例の処理の手順をフ
ローチャー1−により示すものである。
第5図のステップ500の開始後、ステップ501にて
、先ず先頭文字を中心文字として、ステップ502にて
、該中心文字および該中心文字の前後の文字に対する認
識文字候補列(例えば、第6図)の第1位の候補の字種
を検出し、ステップ503にて、該前後の文字に対する
認識文字候補列の第1位の候補の字種が同一の字種であ
って該中心文字に対する認識文字候補列の第1位の候補
の字種と異なる(すなわち、該中心文字が置換検討文字
である)ならばステ・ツブ504に進む。
ステップ503において上記以外の場合にはステップ5
08に進んで入力文字列の次の文字を中心文字とし、ス
テップ502に進む。
前記ステップ504にては、前記中心文字に対する認識
文字候補列において、該中心文字の前後の文字に対する
認識文字候補列の第1位の候補と等しい字種の候補の中
で該中心文字に最も類似する候補、および、前記中心文
字の前後の文字に対する認、識文字候補列において、該
中心文字に対する認識文字候補列の第1位の候補と等し
い字種の候補の中で該前後の文字に最も類似する候補を
検索する。
ステップ505においては、前記中心文字に対して、該
中心文字に対する認識文字候補列の第1位の候補の類似
度と、該中心文字に対する認識文字候補列において該中
心文字の前後の文字に対する認識文字候補列の第1位の
候補と等しい字種の候補であって該中心文字に最も類似
する候補の類似度との差を置換可能塵として求め、また
、前記中心文字の前後の文字に対して、該中心文字の前
後の文字に対する認識文字候補列の第1位の候補の類似
度と、該中心文字の前後の文字に対する認識文字候補列
において該中心文字に対する認識文字候補列の第1位の
候補と等しい字種の候補であって該中心文字の前後の文
字に最も類似する候補の類似度との差を置換可能塵とし
て求める。
ステップ506においては、上記の置換可能塵のデータ
を(第4図の置換検討文字データ保持部44に)記1α
する。
以上の処理が入力文字列の全ての文字を中心文字として
実施されたか否かをステップ507にて判断し、全ての
文字について処理が終了していなければ再び前記ステッ
プ508に進み、終了していればステップ509に進む
ステップ509〜514は、前記入力文字列の全ての文
字を中心文字とした場合について、それぞれ、前記置換
可能条件C>THl、d2<TH2,およびd3>TH
3を同時に満たすかどうかを判定し、該置換可能条件を
満たせばステップ512において、そのときの中心文字
を、該中心文字に対する認識文字候補列の第1位の候補
の代わりに、該中心文字に対する認識文字候補列におい
て該中心文字の前後の文字に対する認識文字候補列の第
1位の候補と等しい字種の候補であって該中心文字に最
も類似する候補に等しいと認識する。
ステップ513にては、以上の処理が入力文字列の全て
の文字を中心文字として実施されたか否かを判断し、全
ての文字について処理が終了していればステップ515
に進む。
ステップ515〜525は、前記入力文字列の全ての文
字について、置換可能塵がしきい値以下である置換検討
文字が2文字以上連続して存在するか否かを判定し、さ
らに、該中心文字が、上記2文字以上連続して存在する
、置換可能塵がしきい値以下である置換検討文字のうち
、置換可能塵(前記類似度の差)が最小の文字について
は、その文字に対する認識文字候補列の第1位の候補の
代わりに、該文字に対する認識文字候補列において該文
字の前後の文字に対する認識文字候補列の第1位の候補
と等しい字種の候補であって該文字に最も類似する候補
に等しいと認識する手順を示すものである。
すなわち、ステップ515〜517において先頭文字か
ら順に、置換可能度がしきい値以下である置換検討文字
をサーチして、もし、置換可能度がしきい値以下である
置換検討文字が存在すれば、ステップ518および51
9にて、次の文字も置換可能度がしきい値以下である置
換検討文字かどうかを判定する。そして、ステップ51
9において、置換可能度がしきい値以下である置換検討
文字が2文字続いたと判断されたときは、ステップ52
0および521に進んで、置換可能度がしきい値以下で
ある置換検討文字がどこまで連続するかを検出し、ステ
ップ522において、これら連続する置換可能度がしき
い値以下である置換検討文字のうち置換可能度(前記類
似度の差)が最小の文字を求め、さらに、ステップ52
3において、該置換可能度が最小の文字については、そ
の文字に対する認識文字候補列の第1位の候補の代わり
に、該文字に対する認識文字候補列において該文字の前
後の文字に対する認識文字候補列の第1位の候補と等し
い字種の候補であって該文字に最も類似する候補に等し
いと認識する。すなわち、置換を行なう。
そして、ステップ524にては、以上の処理が入力文字
列の全ての文字について実施されたか否かを判断し、全
ての文字について処理が終了していればステップ521
゛に進んで処理を終了する。
〔発明の効果〕
本発明によれば、同一字種の文字の間に異なる字種の文
字が存在する場合に、該異なる字種の文字を、該異なる
字種の文字の前後の文字と同一字種の文字候補の中で最
も類似度の高い文字パターンの文字に置き換えるべきか
否かを判定し得るようにし、文字認識装置における修正
処理の性能を改善することができる。
【図面の簡単な説明】
第1図は本発明の第1の形態の基本構成図、第2図は本
発明の第2の形態の基本構成図、第3図は文字認識装置
のハードウェア構成の概略を示す図、 第4図は第3図の構成における後処理部の構成の概略を
示す図、 第5図は本発明の実施例における処理の手順を示す図、
そして 第6図は第3図の文字認識装置の照合部による認識結果
の1例を示す図である。 〔符号の説明〕 1・・・辞書部、 2・・・認識文字候補選出手段、 3・・・置換可能度演算手段、そして、4・・・認識文
字処理手段、5・・・認識修正手段、30・・・認識辞
書、    31・・・入力部、32・・・特徴抽出部
、  33・・・照合部、34・・・後処理部、   
35・・・表示部、40・・・制御部、     41
・・・字種判定部、42・・・候補検索部、   43
・・・類似度差算出部、44・・・置換可能値保存部、 45・・・置換処理部。

Claims (1)

  1. 【特許請求の範囲】 1、複数の字種の文字パターンを記憶する辞書部(1)
    と、 認識対象の文字列を構成する各文字の形状に関するデー
    タを入力して特徴を抽出し、前記複数の字種の文字パタ
    ーンと比較して、該各文字に対して類似度の高い文字パ
    ターンの文字を認識文字候補として選出する認識文字候
    補選出手段(2)と、前記文字列における該各文字につ
    いて、 該各文字の前後の文字に対して最も類似度の高い認識文
    字候補の字種が互いに同一の第1の字種であり、且つ、
    該各文字に対して最も類似度の高い認識文字候補の字種
    が、前記前後の文字に対して最も類似度の高い認識文字
    候補の字種と異なる第2の字種である場合に、該各文字
    に対する前記最も類似度の高い認識文字候補の類似度と
    、該各文字に対する前記認識文字候補のうち前記第1の
    字種のものの中で類似度が最も高いものの類似度との差
    を置換可能度として求め、前記前後の文字に対する前記
    最も類似度の高い認識文字候補の類似度と、該前後の文
    字に対する前記認識文字候補のうち前記第2の字種であ
    るものの中で類似度が最も高いものの類似度との差を置
    換可能度として求める置換可能度演算手段(3)と、 前記各文字および該各文字の前後の文字の置換可能度を
    、それぞれに対応して予め定められたしきい値と比較し
    、該それぞれに対応するしきい値を基準として、該各文
    字の置換可能度が小さく、且つ、該前後の文字の置換可
    能度が大きいという置換可能条件を満たすとき、該各文
    字は、該各文字に対する前記認識文字候補のうち前記第
    1の字種であるものの中で類似度が最も高い認識文字候
    補に等しいと認識し、該置換可能条件を満たさないとき
    、該各文字は前記最も類似度の高い認識文字候補に等し
    いと認識する認識文字処理手段(4)とを有してなるこ
    とを特徴とする文字認識装置。 2、前後の文字に対して最も類似度の高い認識文字候補
    の字種が同一の字種であり、且つ、自文字に対して最も
    類似度の高い認識文字候補の字種が、該前後の文字に対
    して最も類似度の高い認識文字候補の字種と異なる字種
    であり、さらに、該自文字の前記置換可能度が前記しき
    い値以下である文字が2文字以上連続して存在するとき
    、該連続する文字の中で置換可能度の最も小さい文字は
    、該最も小さい文字に対する認識文字候補の中で、該最
    も小さい文字の前後の文字に対する認識文字候補のうち
    最も類似度の高いものに等しい字種であって該最も小さ
    い文字に最も類似するものに等しいと認識する認識修正
    手段(5)を有する請求項1記載の文字認識装置。
JP63208443A 1988-08-24 1988-08-24 文字認識装置 Expired - Lifetime JP2677271B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63208443A JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63208443A JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0258187A true JPH0258187A (ja) 1990-02-27
JP2677271B2 JP2677271B2 (ja) 1997-11-17

Family

ID=16556296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63208443A Expired - Lifetime JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Country Status (1)

Country Link
JP (1) JP2677271B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes

Also Published As

Publication number Publication date
JP2677271B2 (ja) 1997-11-17

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
US10963717B1 (en) Auto-correction of pattern defined strings
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
CN114494679A (zh) 一种双层pdf生成及校对方法和装置
CN114677689B (zh) 一种文字图像识别纠错方法和电子设备
JPH0258187A (ja) 文字認識装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP2903779B2 (ja) 文字列認識方法及びその装置
JP5252487B2 (ja) 情報処理装置、その制御方法、制御プログラム、および記録媒体
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JPH11120294A (ja) 文字認識装置および媒体
JP2939945B2 (ja) ローマ字住所認識装置
JP2918380B2 (ja) 文字認識結果の後処理方法
JPS61133487A (ja) 文字認識装置
JP3481850B2 (ja) 文字認識装置
Touj et al. Segmentation stage of a PHMM-based model for off-line recognition of Arabic handwritten city names
JPH02103690A (ja) 文字読取り装置
JPH0540854A (ja) 文字認識結果の後処理方法
JP2875678B2 (ja) 文字認識結果の後処理方法
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH0527157B2 (ja)
JPH05298495A (ja) 文字認識装置と誤認識文字修正方法並びに欧文文書処理装置