JP2677271B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2677271B2
JP2677271B2 JP63208443A JP20844388A JP2677271B2 JP 2677271 B2 JP2677271 B2 JP 2677271B2 JP 63208443 A JP63208443 A JP 63208443A JP 20844388 A JP20844388 A JP 20844388A JP 2677271 B2 JP2677271 B2 JP 2677271B2
Authority
JP
Japan
Prior art keywords
character
candidate
recognized
characters
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63208443A
Other languages
English (en)
Other versions
JPH0258187A (ja
Inventor
由紀子 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63208443A priority Critical patent/JP2677271B2/ja
Publication of JPH0258187A publication Critical patent/JPH0258187A/ja
Application granted granted Critical
Publication of JP2677271B2 publication Critical patent/JP2677271B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概 要〕 複数の字種の文字パターンを記憶する辞書を備えて、
認識対象の文字列を構成する各文字の形状に関するデー
タを抽出して前記複数の字種の文字パターンと比較し、
該各文字に対する該文字パターンの類似度によって文字
を認識する文字認識装置に関し、 同一字種の文字の間に異なる字種の文字が存在する場
合に、該異なる字種の文字を該異なる字種での文字の前
後の文字と同一字種の文字候補の中で最も類似度の高い
文字パターンの文字に置き換えるべきか否かを判定し得
るようにすることを目的とし、 各文字に対して最も類似度の高い認識文字候補の類似
度と、各文字に対する認識文字候補のうち該各文字の前
後の文字に対して最も類似度の高い認識文字候補に等し
い字種であるものの中で類似度が最も高いものの類似度
との差を置換可能度として求め、前記前後の文字に対す
る前記最も類似度の高い認識文字候補の類似度と、該前
後の文字に対する認識文字候補のうち前記各文字に対し
て最も類似度の高い認識文字候補と等しい字種であるも
のの中で類似度が最も高いものの類似度との差を置換可
能度として求める置換可能度演算手段と、前記各文字お
よび該各文字の前後の文字の置換可能度を、それぞれに
対応して予め定められたしきい値と比較し、該それぞれ
に対応するしきい値を基準として、該各文字の置換可能
度が小さく、且つ、該前後の文字の置換可能度が大きい
という置換可能条件を満たすとき、該各文字は、前記前
後の文字に対して最も類似度の高い認識文字候補の字種
であるものの中で該各文字に対する類似度が最も高い認
識文字候補に等しいと認識し、該置換可能条件を満たさ
ないとき、該各文字は該各文字に対して最も類似度の高
い認識文字候補に等しいと認識する認識文字処理手段と
を有してなるように構成する。
〔産業上の利用分野〕 本発明は、複数の字種の文字パターンを記憶する辞書
を備えて、認識対象の文字列を構成する各文字の形状に
関するデータを抽出して前記複数の字種の文字パターン
と比較し、該各文字に対する該文字パターンの類似度に
よって文字を認識する文字認識装置に関する。
通常、文字認識装置においては、紙面上、あるいは製
品上等に印刷された文字や手書きの文字を光学に走査し
て画像データとして入力し、あるいはタブレット等のポ
インティングデバイス上にペンで記入して座標データと
して入力し、その特徴を抽出して予め記憶している所定
の(辞書の)文字のパターンと比較し、入力された文字
は、最も類似する文字パターンの文字に等しいものとす
ることにより文字の認識を行なっている。
上記のような文字認識装置における文字の認識方式に
は、種々の方式が公知となっている(例えば、特開昭61
−86883にまとめられている)が、何れの方式によって
も、文字の誤認識の発生は避けることが出来ない。その
ため、上記の文字認識の後の段階で誤認識文字の修正処
理が必要となる。
本発明は、このような文字認識装置における誤認識文
字の修正処理に係るものである。
〔従来の技術、および発明が解決しようとする課題〕
従来、複数の字種の文字の認識を行なう文字認識装置
において行なわれている誤認識の修正方式の1つとし
て、前述のように、文字列の各文字の画像データを入力
して、それぞれを複数字種の辞書の文字のパターンと比
較し、最も類似する文字パターンの文字に等しいと認識
することにより得られた認識結果が例えば、「○△○△
○△・・・」(ここで○および△は、それぞれ同一字種
の文字とする)このようになった場合、1つの単語が異
なる字種の文字によって構成されることは少なく、同一
の字種の文字の連続によって構成されることが多いこと
を考慮して、例えば、上記の○の字種の文字であると認
識された入力文字のデータの間に挟まれたΔの字種の文
字であると認識された入力文字データを、該間に挟まれ
た文字は、その前後の文字と同一の字種○である可能性
が大きいと考えて、該間に挟まれた文字に対して類似す
る文字パターンのうち、字種○であって最も類似度の高
いものを求めて、これを該間に挟まれた文字に等しいも
のと認識するように修正する方式がある。
ところが、従来の上記のようなけ修正方式において
は、異なる字種の文字が連続して交互に並ぶような認識
結果が得られた場合には、例えば、上記の説明に用いた
例において、○の字種の文字の側を修正すればよいの
か、△の字種の文字側のを修正すればよいのかを正しく
判断することができなかった。
例えば、第6図は、片仮名で『ハーモニカ』と記され
た文字画像を読み取って、漢字の辞書と片仮名の辞書と
を含む複数の辞書に記憶される文字パターンと比較する
ことによって、類似度の高い認識文字の候補を求めた結
果を示すものである。
第6図において、各認識結果の文字の下に示される数
字は、入力画像と認識結果の文字の文字パターンとの類
似度を示す指標となる数字であって、第6図の指標が小
さい程、類似度は大きい。
第6図に示されるように、複数の字種の辞書全てを用
いて最も類似度が高い文字パターンの文字を求めた結果
は、入力画像『ハ』、『モ』および『カ』に対しては、
それぞれ片仮名「ハ」、「モ」および「カ」となった
が、入力画像『ー』、『ニ』に対しては、それぞれ漢字
の「一」および「二」となっている。
ところが、従来の文字認識装置においては、上記のよ
うな、「漢字−片仮名−漢字−片仮名−漢字」という結
果が得られた際に、漢字と認識された文字の間に挟まれ
た、片仮名と認識された文字を漢字の中で最も類似度の
高い文字パターンの文字と置き換えればよいのか、ある
いは、片仮名と認識された文字の間に挟まれた、漢字と
認識された文字を片仮名の中で最も類似度の高い文字パ
ターンの文字と置き換えればよいのかが判断出来なかっ
た。そのため、第6図の例で、漢字の「一」および
「二」と認識された文字画像を、それぞれ片仮名の中で
最も類似度の高い「ー」および「ニ」と置き換えれば良
いところを、逆に、片仮名「ハ」、「モ」および「カ」
と認識した方を、それぞれ、漢字の中で最も類似度の高
い「八」、「壬」および「力」と置き換えてしまい、修
正処理の結果が却って悪化するという問題があった。
本発明は上記の問題点に鑑み、なされたもので、複数
の字種の文字パターンを記憶する辞書を用いて、文字列
を構成する各文字の画像に対して、それぞれ最も類似度
の高い文字パターンの文字を選出した結果、同一字種の
文字の間に異なる字種の文字が存在する場合に、特異な
る字種の文字を前後の文字と同一の字種の文字候補の中
で最も類似度の高い文字パターンの文字に置き換えるべ
きか否かを判定し得る文字認識装置を提供することを目
的とするものである。
〔課題を解決するための手段〕
第1図は本発明の第1の形態の基本構成図である。本
図において、1は辞書部、2は認識文字候補選出手段、
3は置換可能度演算手段、そして、4は認識文字処理手
段である。
辞書部1は、複数の字種の文字パターンを記憶する。
認識文字候補選出手段2は、認識対象の文字列を構成
する各文字の形状に関するデータを入力して特徴を抽出
し、前記複数の字種の文字パターンと比較して、該各文
字に対して類似度の高い文字パターンの文字を認識文字
候補として選出する。
置換可能度演算手段3は、前記文字列における該各文
字について、該各文字の前後の文字に対して最も類似度
の高い認識文字候補の字種が互いに同一の第1の字種
(任意の1字種)であり、且つ、該各文字に対して最も
類似度の高い認識文字候補の字種が、上記前後の文字に
対する最も類似度の高い認識文字候補の字種と異なる第
2の字種(前記第1の字種と異なる任意の1字種)であ
る場合に、該各文字に対する前記最も類似度の高い認識
文字候補の類似度と、該各文字に対する認識文字候補の
うち前記第1の字種であって類似度が最も高いものの類
似度との差を置換可能度として求め、前記前後の文字に
対する前記最も類似度の高い認識文字候補の類似度と、
該前後の文字に対する前記認識文字候補のうち前記第2
の字種であるものの中で類似度が最も高いものの類似度
との差を置換可能度として求める。
認識文字処理手段4は、前記各文字および該各文字の
前後の文字の置換可能度を、それぞれに対応して予め定
められたしきい値と比較し、該それぞれに対応するしき
い値を基準として、該各文字の置換可能度が小さく、且
つ、該前後の文字の置換可能度が大きいという条件を満
たすとき、該各文字は、前記第1の字種であるものの中
で類似度が最も高い認識文字候補に等しいと認識し、該
条件を満たさないとき、該各文字は前記最も類似度の高
い認識文字候補に等しいと認識する。
第2図は本発明の第2の形態の基本構成図である。本
図においては、前記第1の構成に加えて、認識修正手段
5が設けられている。
認識修正手段5は、前後の文字に対する最も類似度の
高い認識文字候補の字種が互いに同一であり、且つ、自
文字に対する最も類似度の高い認識文字候補の字種が、
該前後の文字に対する最も類似度の高い認識文字候補の
字種と異なり、さらに、前記置換可能度が前記しきい値
以下であるものが2文字以上連続するとき、該連続する
文字の中で置換可能度の最も小さい文字は、該最も小さ
い文字の前後の文字に対する最も類似度の高い認識文字
候補と同一の字種であるものの中で該最も小さい文字に
対する類似度が最も高い認識文字候補に等しいと認識す
るものである。
〔作 用〕
本発明の第1の形態によれば、文字列を構成する各文
字に対して最も類似する(辞書の)文字パターンの字種
が、該各文字の前後の文字に最も類似する文字パターン
の字種と異なり、且つ、該前後の文字に最も類似する文
字パターンの字種が互いに等しいとき、上記各文字、す
なわち、中心の文字を、上記前後の文字に等しい字種の
ものの中で該中心の文字に最も類似する文字パターンの
中に等しいと認識するか否かを判定する手段として、辞
書の文字パターン全てと比較したときに該中心の文字に
対して最も類似する文字パターンの類似度と、上記前後
の文字に等しい字種のものの中で該中心の文字に最も類
似する文字パターンの類似度との差を求めることによ
り、上記辞書の文字パターン全てと比較したときに該中
心の文字に対して最も類似する文字パターンの文字が、
該中心の文字に対する文字認識として、どれだけ確から
しいか(文字認識の確実度)の指標が得られる。
同時に、上記前後の文字についても同様に、文字認識
の確実度の指標を求める。
こうして、該中心の文字に対する文字認識の確実度の
指標(置換可能度)が予め定めたしきい値より小さく、
且つ、上記前後の文字に対する文字認識の確実度の指標
(置換可能度)が予め定めたしきい値より大きいとき
(置換可能条件)には、前述のように、文字列において
は同一の字種の文字が連続する可能性が大きいという点
を考慮して、前記辞書の文字パターン全てと比較したと
きに該中心の文字に対して最も類似する文字パターンの
文字が該中心の文字に対する文字認識としては誤認識で
ある可能性が高い判断として、上記前後の文字に最も類
似する文字パターンに等しい字種であって該中心の文字
に対して最も類似する文字パターンの文字を該中心の文
字に対する文字認識として採用する。
こうして、複数の字種の文字パターンを記憶する辞書
を用いて、文字列を構成する各文字の画像データあるい
は、座標データに対して、それぞれ最も類似度の高い文
字パターンの文字を選出した結果、同一字種の文字の間
に異なる字種の文字が存在する場合に、該異なる字種の
文字を前後の文字の字種と同一字種の文字パターンの中
で最も類似度の高い文字パターンの文字に置き換えるべ
きか否かを判定することができ、修正処理の結果が却っ
て悪化するということを、かなり防止できる。
また、本発明の第2の形態によれば、上述の本発明の
第1の形態における置換可能度が前記所定のしきい値以
下であるにも拘わらず、前記辞書の文字パターン全てと
比較したときに該中心の文字に対して最も類似する文字
パターンの字種が、前後の文字に対して最も類似する文
字パターンの字種と異なるものが2つ以上連続して存在
するときには、この連続して存在する文字の中で、前記
文字認識の確実度の指標(置換可能度)が最も小さいも
のが誤認識である可能性が高いと判断して、該前後の文
字に最も類似する文字パターンに等しい字種であって上
記の確実度の指標(置換可能度)が最も小さい文字に対
して最も類似する文字パターンの文字を該最も小さい文
字に対する文字認識として採用する。
こうして、本発明の第2の形態によれば、より精度の
よい修正処理が可能となる。
〔実施例〕
本発明の実施例の文字認識装置のハードウェア構成
は、概略、従来のOCR(optical code reader)やオンラ
イン手書き文字認識等の文字認識装置と同様であって、
第3図に示されるように、認識辞書30、入力部31、特徴
抽出部32、照合部33、後処理部34、そして、表示部35か
らなる。
入力部31は文字の画像データを光学的に読み取る。あ
るいは、タブレット上に片で記入された文字の座標を読
み取る。
特徴抽出部32は、前述のような種々の認識方式に従う
文字パターンを特徴づけるパラメータの抽出を行なう。
認識辞書30は、上記の認識方式に従う標準文字パター
ンを記憶する。前述のように、本発明の実施例の文字認
識装置においては、片仮名、平仮名、漢字等、複数の字
種の標準文字パターンを記憶する。
照合部33は、前記特徴抽出部32において抽出した文字
パターンの特徴パラメータを、上記認識辞書30に記憶す
る全ての字種の標準文字パターンと比較して、各入力文
字に対して、類似度の高いものから順に、その類似度と
共にリストアップして認識文字候補列を生成する。
そして、後処理部34においては、前記照合部33におい
て類似度が第1位と判定された認識文字候補を最終的な
文字認識結果として採用してよいかどうかを判定し、そ
の判定に従って必要ならば、前記認識文字候補列のより
下位の認識文字候補を最終的な文字認識結果として採用
する。すなわち、前述の本発明の特徴的な構成は、主に
この後処理部34に存在する。
そして、表示部35は、上記の後処理部34より出力され
た最終的な文字認識結果を表示する。
なお、上記の認識辞書30は、主としてメモリ回路から
なり、入力部31が、例えば、通常のOCRにおけるような
光学的な操作機構(例えば、CCDスキャナ等)、あるい
は、タブレット等の座標入力機構を備え、表示部35がCR
T等の表示機構を備える他は、上記各部は、それぞれ、C
PU、RAM、ROM等から構成されるマイクロコンピュータに
よって実現される。
第3図の構成中、本発明に係わる後処理部34の構成の
概略は、第6図に示されている。すなわち、後処理部
は、制御部40、字種判定部41、候補検索部42、類似度差
算出部43、置換可能値保存部44、そして、置換処理部45
からなる。
制御部40は、第3図の照合部33において、入力された
文字画像の各々について前述の認識文字候補列が生成さ
れると、字種判定部41を制御して、該認識文字候補列の
第1位の候補の字種の判定が行なわれるように指示す
る。字種判定部41は該認識文字候補列の第1位の候補の
字種が、前後の文字同士は互いに同じであって、該前後
の文字の間に位置する中心の文字のみ該前後の文字の字
種と異なるとき、該中心の文字を置換検討文字と判定す
る。候補検索部42は、上記字種判定部41において置換検
討文字と判定された文字については、該置換検討文字と
判定された文字の前後の文字に対する認識文字候補列の
第1位の候補と等しい字種の認識文字候補のうち最も類
似度の高いものを検索し、また、該前後の文字について
は、上記置換検討文字と判定された文字に対する認識文
字候補列の第1位の候補と等しい字種の認識文字候補の
うち最も類似度の高いものを検索する。ここで入力され
た先頭の文字の前の文字に対する認識文字候補として
は、2文字目の文字に対する認識文字候補の字種を、ま
た、末尾の文字の後の文字に対する認識文字候補として
は、末尾から2番目の文字に対する認識文字候補の字種
を用いる。
そして、類似度差算出部43は、前記候補検索部42にお
いて検出された、置換検討文字および該置換検討文字の
前後の文字に対する認識文字候補列の第1位の候補とそ
の類似度、および、上記置換検討文字と判定された文字
の認識文字候補のうち、該置換検討文字の前後の文字に
対する認識文字候補列の第1位の候補と等しい字種であ
って該置換検討文字と判定された文字に対する類似度が
最も高いものとその類似度、そして、上記置換検討文字
と判定された文字の前後の文字の認識文字候補のうち、
該置換検討文字と判定された文字に対する認識文字候補
列の第1位の候補と等しい字種であって該前後の文字に
対する類似度が最も高いものとその類似度をもとに、 (置換検討文字の置換可能度)=|(置換検討文字と判
定された文字に対する認識文字候補列の第1位の候補の
類似度)−(該置換検討文字と判定された文字の認識文
字候補のうち該置換検討文字と判定された文字の前後の
文字に対する認識文字候補列の第1位の候補と等しい字
種であって該置換検討文字と判定された文字に対する類
似度が最も高いものの類似度)| (前後の文字の置換可能度)=|(置換検討文字と判定
された文字の前後の文字に対する認識文字候補列の第1
位の候補の類似度)−(置換検討文字と判定された文字
の前後の文字に対する認識文字候補列のうち該置換検討
文字と判定された文字に対する認識文字候補列の第1位
の候補と等しい字種であって該前後の文字に対する類似
度が最も高いものの類似度)| を演算して求める。
例えば、上記置換検討文字およびその前後の文字に対
する認識文字候補列の第1位の候補の字種が「○△○」
となったときには、上記置換検討文字の前の文字に対す
る認識文字候補列の第1位の候補の類似度と、該前の文
字に対する認識文字候補列内の、字種△であって該前の
文字に対する類似度が最も高い候補の類似度との差(の
絶対値)を求め、これをd1とする。
同様に、上記置換検討文字に対する認識文字候補列の
第1位の候補の類似度と、該置換検討文字に対する認識
文字候補列内の、字種○であって該置換検討文字に対す
る類似度が最も高い候補の類似度との差(の絶対値)を
求め、これをd2とする。
さらに、上記置換検討文字の後の文字に対する認識文
字候補列の第1位の候補の類似度と、該後の文字に対す
る認識文字候補列内の、字種△であって該後の文字に対
する類似度が最も高い候補の類似度との差(の絶対値)
を求め、これをd3とする。
なお、上記置換検討文字あるいは前後の文字の何れか
について、上記のように、認識文字候補列内の、より下
位に異なる字種の認識文字候補が存在しないときには、
対応する類似度の差(の絶対値)の代わりに、後述する
対応するしきい値を超える所定の値に設定する。
上記の演算結果は、第4図の置換検討文字データ保持
部44に保持される。
第4図の置換処理部45は、上記置換検討文字データ保
持部44に保持されたデータをもとに以下の処理を行な
う。
まず、上記置換可能度を、置換検討文字および該置換
検討文字の前後の文字それぞれに対応して予め設定され
たしきい値と比較して、前述の本発明による置換可能条
件を満たすか否かを判定する。
すなわち、前述の例において、前記前の文字、置換検
討文字、および後の文字に対して予め定められたしきい
値を、それぞれ、TH1,TH2,およびTH3とするとき、置換
可能条件d1>TH1,d2<TH2,およびd3>TH3を同時に満た
すかどうかを判定する。
もし、上記置換可能条件を満たすならば、該置換検討
文字を、上記の置換検討文字に対する認識文字候補列内
の、字種○であって該置換検討文字に対する類似度が最
も高い候補、つまり、該置換検討文字の認識文字候補の
うち置換検討文字の前後の文字に対する認識文字候補列
の第1位の候補と等しい字種であって該置換検討文字に
対する類似度が最も高い候補に等しいと認識する。すな
わち、置換が行なわれる。
上記の置換可能条件を満たさないときには、該置換検
討文字は、元の該置換検討文字に対する認識文字候補列
内の第1位の候補と等しいと認識する。すなわち、置換
は行なわれない。
ところで、例えば、前述のように、字種が「○△○
△」のように連続したときに、さらに、これらの2番目
および3番目の文字の上記置換可能度が前記のしきい値
以下である場合を考える。さらに、このような場合に、
置換可能度が前記のしきい値以下であるために置換が行
なわれなかった置換検討文字が2つ以上連続したとき、
前述の本発明の第2の形態によって設けられた、認識修
正手段5(第2図)に対応する機能が働く。
すなわち、連続する3文字の中の置換が行なわれなか
った置換検討文字が2つ以上連続して存在するときに
は、該連続する置換検討文字のうち、前記置換可能度が
最小となる文字は、該置換可能度が最小となる文字の認
識文字候補列内の、該置換可能度が最小となる文字の前
後の文字に対する認識文字候補列内の第1位の候補と等
しい字種のものの中で該最小となる文字に対する類似度
が最も高い候補に等しいと認識する。つまり、上記連続
する置換検討文字のうち、前記置換可能度が最小となる
文字に対して置換を実行する。
上述の置換処理部45による処理を、第3図の照合部33
において前記第6図の認識結果が得られた場合を例にと
って以下に具体的に説明する。
第6図には、また、第6図の認識結果から演算される
置換可能度を、入力『ハ』に対する文字、入力『ー』に
対応する文字、そして、入力『モ』に対応する文字につ
いて、それぞれ示している。
前述のように、第6図の認識結果(認識文字候補列)
の第1位の字種は、「○△○△△」となっており、例え
ば、第1〜3番目まで全て前記置換検討文字である。こ
こで、さらに、前記のしきい値TH1,TH2およびTH3を全て
50であるとすると、第6図に示されるように、全ての文
字に対する置換可能度が該しきい値50以下である。した
がって、何れの場合にも、本発明の第1の形態による置
換可能条件を満たさず、該置換可能条件による置換は行
なわれない。
そこで、次に、本発明の第2の形態による認識修正手
段の機能が働く。
今、置換検討文字として抽出され、置換条件を見たし
ていると判定された『ハ』、『ー』、『モ』の置換可能
度を比較すると、『ー』の置換可能度3が最小である。
したがって、『ー』について、本発明の第2の形態によ
る認識修正手段の機能によって、置換が行なわれる。
上述の入力『ー』に対応する文字の置換とは、すなわ
ち、該入力『ー』に対応する文字に対する認識文字候補
列の第1位にある漢字「一」という認識を、該入力
『ー』に対応する文字に対する認識文字候補列におい
て、該入力『ー』に対応する文字の前後の文字に対する
認識文字候補列の第1位の字種と同一の字種、つまり、
片仮名であるものの中で最も該入力『ー』に対応する文
字に類似するところの、第3位の片仮名「ー」に置き換
えるものである。こうして、元の片仮名の入力『ハー
モ』の部分が正しく認識された。
このようにして、本発明の実施例の第3図および第4
図の構成によれば、片仮名の入力『ハーモニカ』に対し
て認識結果「ハーモ二力」(「二」および「力」は漢
字)が表示される。
第5図は、以上述べた本発明の実施例の処理の手順を
フローチャートにより示すものである。
第5図のステップ500の開始後、ステップ501にて、先
ず先頭文字を中心文字として、ステップ502にて、該中
心文字および該中心文字の前後の文字に対する認識文字
候補列(例えば、第6図)の第1位の候補の字種を検出
し、ステップ503にて、該前後の文字に対する認識文字
候補列の第1位の候補の字種が同一の字種であって該中
心文字に対する認識候補列の第1位の候補の字種と異な
る(すなわち、該中心文字が置換検討文字である)なら
ばステップ504に進む。ステップ503において上記以外の
場合にはステップ508に進んで入力文字列の次の文字を
中心文字とし、ステップ502に進む。
前記ステップ504にては、前記中心文字に対する認識
文字候補列において、該中心文字の前後の文字に対する
認識文字候補列の第1位の候補と等しい字種の候補の中
で該中心文字に最も類似する候補、および、前記中心文
字の前後の文字に対する認識文字候補列において、該中
心文字に対する認識文字候補列の第1位の候補と等しい
字種の候補の中で該前後の文字に最も類似する候補を検
索する。
ステップ505においては、前記中心文字に対して、該
中心文字に対する認識文字候補列の第1位の候補の類似
度と、該中心文字に対する認識文字候補列において該中
心文字の前後の文字に対する認識文字候補列の第1位の
候補と等しい字種の候補であって該中心文字に最も類似
する候補の類似度との差を置換可能度として求め、ま
た、前記中心文字の前後の文字に対して、該中心文字の
前後の文字に対する認識文字候補列の第1位の候補の類
似度と、該中心文字の前後の文字に対する認識文字候補
列において該中心文字に対する認識文字候補列の第1位
の候補と等しい字種の候補であって該中心文字の前後の
文字に最も類似する候補の類似度との差を置換可能度と
して求める。
ステップ506においては、上記の置換可能度のデータ
を(第4図の置換検討文字データ保持部44に)記憶す
る。
以上の処理が入力文字列の全ての文字を中心文字とし
て実施されたか否かをステップ507にて判断し、全ての
文字について処理が終了していなければ再び前記ステッ
プ508に進み、終了していればステップ509に進む。
ステップ509〜514は、前記入力文字列の全ての文字を
中心文字とした場合について、それぞれ、前記置換可能
条件d1>TH1,d2<TH2,およびd3、TH3を同時に満たすか
どうかを判定し、該置換可能条件を満たせばステップ51
2において、そのときの中心文字を、該中心文字に対す
る認識文字候補列の第1位の候補の代わりに、該中心文
字に対する認識文字候補列において該中心文字の前後の
文字に対する認識文字候補列の第1位の候補と等しい字
種の候補であって該中心文字に最も類似する候補に等し
いと認識する。
ステップ513にては、以上の処理が入力文字列の全て
の文字を中心文字として実施されたか否かを判定し、全
ての文字について処理が終了していればステップ515に
進む。
ステップ515〜525は、前記入力文字列の全ての文字に
ついて、置換可能度がしきい値以下である置換検討文字
が2文字以上連続して存在するか否かを判定し、さら
に、該中心文字が、上記2文字以上連続して存在する。
置換可能度がしきい値以下である置換検討文字のうち、
置換可能度(前記類似度の差)が最小の文字について
は、その文字に対する認識文字候補列の第1位の候補の
代わりに、該文字に対する認識文字候補列において該文
字の前後の文字に対する認識文字候補列の第1位の候補
と等しい字種の候補であって該文字に最も類似する候補
に等しいと認識する手順を示すものである。
すなわち、ステップ515〜517において先頭文字から順
に、置換可能度がしきい値以下である置換検討文字をサ
ーチして、もし、置換可能度がしきい値以下である置換
検討文字が存在すれば、ステップ518および519にて、次
の文字も置換可能度がしきい値以下である置換検討文字
かどうかを判定する。そして、ステップ519において、
置換可能度がしきい値以下である置換検討文字が2文字
続いたと判断されたときは、ステップ520および521に進
んで、置換可能度がしきい値以下である置換検討文字が
どこまで連続するかを検討し、ステップ522において、
これら連続する置換可能度がしきい値以下である置換検
討文字のうち置換可能度(前記類似度の差)が最小の文
字を求め、さらに、ステップ523において、該置換可能
度が最小の文字については、その文字に対する認識文字
候補列の第1位の候補の代わりに、該文字に対する認識
文字候補列において該文字の前後の文字に対する認識文
字候補列の第1位の候補と等しい字種の候補であって該
文字に最も類似する候補に等しいと認識する。すなわ
ち、置換を行なう。
そして、ステップ524にては、以上の処理が入力文字
列の全ての文字について実施されたか否かを判断し、全
ての文字について処理が終了していればステップ521に
進んで処理を終了する。
〔発明の効果〕
本発明によれば、同一字種の文字の間に異なる字種の
文字が存在する場合に、該異なる字種の文字を、該異な
る字種の文字の前後の文字と同一字種の文字候補の中で
最も類似度の高い文字パターンの文字に置き換えるべき
か否かを判定し得るようにし、文字認識装置における修
正処理の性能を改善することができる。
【図面の簡単な説明】
第1図は本発明の第1の形態の基本構成図、 第2図は本発明の第2の形態の基本構成図、 第3図は文字認識装置のハードウェア構成の概略を示す
図、 第4図は第3図の構成における後処理部の構成の概略を
示す図、 第5図は本発明の実施例における処理の手順を示す図、
そして 第6図は第3図の文字認識装置の照合部による認識結果
の1例を示す図である。 〔符号の説明〕 1……辞書部、 2……認識文字候補選出手段、 3……置換可能度演算手段、そして、 4……認識文字処理手段、5……認識修正手段、 30……認識辞書、31……入力部、 32……特徴抽出部、33……照合部、 34……後処理部、35……表示部、 40……制御部、41……字種判定部、 42……候補検索部、43……類似度差算出部、 44……置換可能値保存部、 45……置換処理部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の字種の文字パターンを記憶する辞書
    部(1)と、 認識対象の文字列を構成する各文字の形状に関するデー
    タを入力して特徴を抽出し、前記複数の字種の文字パタ
    ーンと比較して、該各文字に対して類似度の高い文字パ
    ターンの文字を認識文字候補として選出する認識文字候
    補選出手段(2)と、 前記文字列における該各文字について、該各文字の前後
    の文字に対して最も類似度の高い認識文字候補の字種が
    互いに同一の第1の字種であり、且つ、該各文字に対し
    て最も類似度の高い認識文字候補の字種が、前記前後の
    文字に対して最も類似度の高い認識文字候補の字種と異
    なる第2の字種である場合に、該各文字に対する前記最
    も類似度の高い認識文字候補の類似度と、該各文字に対
    する前記認識文字候補のうち前記第1の字種のものの中
    で類似度が最も高いものの類似度との差を置換可能度と
    して求め、前記前後の文字に対する前記最も類似度の高
    い認識文字候補の類似度と、該前後の文字に対する前記
    認識文字候補のうち前記第2の字種であるものの中で類
    似度が最も高いものの類似度との差を置換可能度として
    求める置換可能度演算手段(3)と、 前記各文字および該各文字の前後の文字の置換可能度
    を、それぞれに対応して予め定められたしきい値と比較
    し、該それぞれに対応するしきい値を基準として、該各
    文字の置換可能度が小さく、且つ、該前後の文字の置換
    可能度が大きいという置換可能条件を満たすとき、該各
    文字は、該各文字に対する前記認識文字候補のうち前記
    第1の字種であるものの中で類似度が最も高い認識文字
    候補に等しいと認識し、該置換可能条件を満たさないと
    き、該各文字は前記最も類似度の高い認識文字候補に等
    しいと認識する認識文字処理手段(4)とを有してなる
    ことを特徴とする文字認識装置。
  2. 【請求項2】前後の文字に対して最も類似度の高い認識
    文字候補の字種が同一の字種であり、且つ、自文字に対
    して最も類似度の高い認識文字候補の字種が、該前後の
    文字に対して最も類似度の高い認識文字候補の字種と異
    なる字種であり、さらに、該白文字の前記置換可能度が
    前記しきい値以下である文字が2文字以上連続して存在
    するとき、該連続する文字の中で置換可能度の最も小さ
    い文字は、該最も小さい文字に対する認識文字候補の中
    で、該最も小さい文字の前後の文字に対する認識文字候
    補のうち最も類似度の高いものに等しい字種であって該
    最も小さい文字に最も類似するものに等しいと認識する
    認識修正手段(5)を有する請求項1記載の文字認識装
    置。
JP63208443A 1988-08-24 1988-08-24 文字認識装置 Expired - Lifetime JP2677271B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63208443A JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63208443A JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0258187A JPH0258187A (ja) 1990-02-27
JP2677271B2 true JP2677271B2 (ja) 1997-11-17

Family

ID=16556296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63208443A Expired - Lifetime JP2677271B2 (ja) 1988-08-24 1988-08-24 文字認識装置

Country Status (1)

Country Link
JP (1) JP2677271B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes

Also Published As

Publication number Publication date
JPH0258187A (ja) 1990-02-27

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
KR100412317B1 (ko) 문자인식/수정방법및장치
JPH087033A (ja) 情報処理方法及び装置
JP2677271B2 (ja) 文字認識装置
CN115147847A (zh) 文本识别结果的确定方法、装置、存储介质及计算机设备
JP3274014B2 (ja) 文字認識装置および文字認識方法
JPH07114619A (ja) 文書認識装置
JP2903779B2 (ja) 文字列認識方法及びその装置
JPH11120294A (ja) 文字認識装置および媒体
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPS60217483A (ja) 文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH07117995B2 (ja) 文字認識装置
JP3481850B2 (ja) 文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH07107700B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP2874815B2 (ja) 日本語文字読取装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP2962911B2 (ja) 文字認識装置
KR20000061110A (ko) 자소 조합형 한글 필기인식 방법
JPH05298495A (ja) 文字認識装置と誤認識文字修正方法並びに欧文文書処理装置
JPH0340186A (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JPH0830717A (ja) 文字認識方法とその装置