JPH06187506A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH06187506A JPH06187506A JP4340022A JP34002292A JPH06187506A JP H06187506 A JPH06187506 A JP H06187506A JP 4340022 A JP4340022 A JP 4340022A JP 34002292 A JP34002292 A JP 34002292A JP H06187506 A JPH06187506 A JP H06187506A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- recognition accuracy
- characters
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 印刷文字・手書き文字の文字画像から文字を
正確に認識させることができる文字認識装置を提供す
る。 【構成】 入力2値画像より黒8連結図形を求め、外接
矩形を求める文字領域抽出部1と、外接矩形より文字行
を求める文字行抽出部2と、行幅と外接矩形の大きさに
より、文字切り出しを行う文字切り出し部3と、切り出
した文字パターンの特徴を抽出する文字特徴抽出部4
と、類似度等の認識確度により、認識文字の候補を求め
る認識確度計算部5と、候補文字の類似文字の認識確度
も併せて使用し、認識文字を決定する認識文字決定部7
とを有する。 【効果】 類似文字である他の候補文字の認識確度を利
用することにより、認識精度を向上させることが可能と
なる。
正確に認識させることができる文字認識装置を提供す
る。 【構成】 入力2値画像より黒8連結図形を求め、外接
矩形を求める文字領域抽出部1と、外接矩形より文字行
を求める文字行抽出部2と、行幅と外接矩形の大きさに
より、文字切り出しを行う文字切り出し部3と、切り出
した文字パターンの特徴を抽出する文字特徴抽出部4
と、類似度等の認識確度により、認識文字の候補を求め
る認識確度計算部5と、候補文字の類似文字の認識確度
も併せて使用し、認識文字を決定する認識文字決定部7
とを有する。 【効果】 類似文字である他の候補文字の認識確度を利
用することにより、認識精度を向上させることが可能と
なる。
Description
【0001】
【産業上の利用分野】本発明は、印刷文字・手書き文字
を画像入力し、画像データから文字を認識する文字認識
装置に関するものである。
を画像入力し、画像データから文字を認識する文字認識
装置に関するものである。
【0002】
【従来の技術】従来の文字認識方法では、文字パターン
と辞書を比較し、認識候補、文字認識確度を求め、認識
確度の最も良い候補文字を認識結果としていた。
と辞書を比較し、認識候補、文字認識確度を求め、認識
確度の最も良い候補文字を認識結果としていた。
【0003】しかし、認識すべき対象を予め知ることの
できない、手書き文字認識やマルチフォント印刷文字認
識に対して、認識候補の中に類似した文字を含んでいて
も、誤認識する場合が多かった。
できない、手書き文字認識やマルチフォント印刷文字認
識に対して、認識候補の中に類似した文字を含んでいて
も、誤認識する場合が多かった。
【0004】
【発明が解決しようとする課題】本発明は、上記の問題
を鑑みて発明されたもので、より高い精度で文字認識が
行える文字認識装置を提供することを目的とする。
を鑑みて発明されたもので、より高い精度で文字認識が
行える文字認識装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明はかかる課題を解
決するため、認識文字決定部において、認識確度計算部
で求めた文字候補の類似文字を予め類似文字辞書から求
め、その類似文字が前記の文字候補に含まれている場合
には、文字候補の認識確度を高める補正を行い、その補
正後の認識確度をもって文字を決定するようにした。
決するため、認識文字決定部において、認識確度計算部
で求めた文字候補の類似文字を予め類似文字辞書から求
め、その類似文字が前記の文字候補に含まれている場合
には、文字候補の認識確度を高める補正を行い、その補
正後の認識確度をもって文字を決定するようにした。
【0006】
【作用】本発明では、入力された画像データは文字特徴
検出部において、文字パターンとその特徴が抽出され、
認識確度計算部でその文字パターンと特徴に基づいて文
字特徴辞書から対応の複数又は1個の文字候補とその認
識確度が求められる。次に、認識文字決定部において、
文字候補の類似文字が類似文字辞書から求められ、この
類似文字が文字候補に含まれているかを判断し、含まれ
ていれば文字候補の認識確度を高める補正を行う。
検出部において、文字パターンとその特徴が抽出され、
認識確度計算部でその文字パターンと特徴に基づいて文
字特徴辞書から対応の複数又は1個の文字候補とその認
識確度が求められる。次に、認識文字決定部において、
文字候補の類似文字が類似文字辞書から求められ、この
類似文字が文字候補に含まれているかを判断し、含まれ
ていれば文字候補の認識確度を高める補正を行う。
【0007】このように、類似文字が文字候補にある場
合は、正しい認識文字である確率が高く判断され、より
誤りが少ない文字決定を行うことができる。
合は、正しい認識文字である確率が高く判断され、より
誤りが少ない文字決定を行うことができる。
【0008】特に、類似度が高い類似文字が文字候補に
あれば、その確率は高く、より正確な文字認識となる。
あれば、その確率は高く、より正確な文字認識となる。
【0009】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は、本発明の一実施例における
文字認識装置の構成図である。
しながら説明する。図1は、本発明の一実施例における
文字認識装置の構成図である。
【0010】文字領域抽出部1は、入力2値画像より、
連結図形の大きさ等により、文字領域を抽出する。文字
行抽出部2は、文字領域中の外接矩形の縦方向、横方向
の射影をとり、文字行を抽出する。文字切り出し部3
は、文字行幅と外接矩形の大きさにより、文字の大きさ
を推定する。文字の大きさの推定値に対して、文字候補
図形として、外接矩形を距離と大きさから文字線と判断
したものだけをマージして、文字候補パターンを切り出
す。文字特徴抽出部4は、切り出した文字候補パターン
より、文字特徴を抽出する。認識確度計算部5は、文字
特徴と文字特徴辞書6を比較し、文字候補及び認識確度
を出力し、認識文字決定部7は、候補文字の中に、類似
文字辞書8に示す類似文字を含んでいる場合、認識確度
を補正し、補正した認識確度により、認識文字を決定す
る。文字特徴検出部9は、文字領域抽出部1,文字行抽
出部2,文字切り出し部3,文字特徴抽出部4からな
る。
連結図形の大きさ等により、文字領域を抽出する。文字
行抽出部2は、文字領域中の外接矩形の縦方向、横方向
の射影をとり、文字行を抽出する。文字切り出し部3
は、文字行幅と外接矩形の大きさにより、文字の大きさ
を推定する。文字の大きさの推定値に対して、文字候補
図形として、外接矩形を距離と大きさから文字線と判断
したものだけをマージして、文字候補パターンを切り出
す。文字特徴抽出部4は、切り出した文字候補パターン
より、文字特徴を抽出する。認識確度計算部5は、文字
特徴と文字特徴辞書6を比較し、文字候補及び認識確度
を出力し、認識文字決定部7は、候補文字の中に、類似
文字辞書8に示す類似文字を含んでいる場合、認識確度
を補正し、補正した認識確度により、認識文字を決定す
る。文字特徴検出部9は、文字領域抽出部1,文字行抽
出部2,文字切り出し部3,文字特徴抽出部4からな
る。
【0011】処理全体の流れを、図2の本発明の一実施
例における文字認識装置の処理手順を示すフローチャー
トを使って説明する。初めに、文字領域抽出部1によ
り、2値画像データから8連結図形を抽出し、外接矩形
を求める(ステップ1)。同文字領域抽出部1により、
外接矩形の大きさ・位置の分布により文字領域を抽出す
る(ステップ2)。文字行抽出部2により、文字領域中
の外接矩形の縦方向・横方向のヒストグラムを取り、文
字行の抽出を行う(ステップ3)。文字切り出し部3に
より、抽出した文字行幅・外接矩形の大きさの分布より
文字の大きさを推定する(ステップ4)。文字特徴抽出
部4により、推定した文字の大きさを基準にして、外接
矩形を大きさ、距離によりノイズ成分を除いてマージ
し、文字候補図形を求め(ステップ5)、文字候補図形
の特徴を抽出する(ステップ6)。認識確度計算部5に
より、抽出した文字特徴と文字特徴辞書6の比較によ
り、文字候補、認識確度を求め(ステップ7)、認識文
字決定部7により、文字候補間に類似文字がある場合、
認識確度を補正し、その補正した認識確度の最も良いも
のを認識結果とする(ステップ8)。
例における文字認識装置の処理手順を示すフローチャー
トを使って説明する。初めに、文字領域抽出部1によ
り、2値画像データから8連結図形を抽出し、外接矩形
を求める(ステップ1)。同文字領域抽出部1により、
外接矩形の大きさ・位置の分布により文字領域を抽出す
る(ステップ2)。文字行抽出部2により、文字領域中
の外接矩形の縦方向・横方向のヒストグラムを取り、文
字行の抽出を行う(ステップ3)。文字切り出し部3に
より、抽出した文字行幅・外接矩形の大きさの分布より
文字の大きさを推定する(ステップ4)。文字特徴抽出
部4により、推定した文字の大きさを基準にして、外接
矩形を大きさ、距離によりノイズ成分を除いてマージ
し、文字候補図形を求め(ステップ5)、文字候補図形
の特徴を抽出する(ステップ6)。認識確度計算部5に
より、抽出した文字特徴と文字特徴辞書6の比較によ
り、文字候補、認識確度を求め(ステップ7)、認識文
字決定部7により、文字候補間に類似文字がある場合、
認識確度を補正し、その補正した認識確度の最も良いも
のを認識結果とする(ステップ8)。
【0012】ステップ8の認識確度補正処理では、認識
確度計算部5で求めたパターンPと辞書中の文字Siの
認識確度d(P,Si)をSiの類似文字辞書8中の文
字Sikとの認識確度d(P,Sik)を使い、補正し
た認識確度Dを下式より求める。
確度計算部5で求めたパターンPと辞書中の文字Siの
認識確度d(P,Si)をSiの類似文字辞書8中の文
字Sikとの認識確度d(P,Sik)を使い、補正し
た認識確度Dを下式より求める。
【0013】補正した認識確度D(P,Si)=d
(P,Si)+Σaikd(P,Sik)但し、aik
は、値が1以下の文字Sikの補正係数(ウエイト)で
ある。
(P,Si)+Σaikd(P,Sik)但し、aik
は、値が1以下の文字Sikの補正係数(ウエイト)で
ある。
【0014】この補正した認識確度Dの最も高い文字候
補を認識文字と決定する。文字認識を具体例により説明
する。図3に示す入力文字パターン“使”に対し、ステ
ップ7での文字候補、認識確度が、各々順に、“佼”、
“使”、“便”、“債”、“偵”、980、974、9
69、953、940の場合(図4参照)、従来例で
は、最も認識確度の高い“佼”が認識結果となり、誤認
識していた。本発明では、ステップ8において候補文字
に類似文字が含まれる場合、認識確度の補正を行う。本
例では、候補文字“佼”には、補正係数0.05の類似
文字“偵”が含まれており、候補文字“使”には、補正
係数0.1の類似文字“便”、補正係数0.05の類似
文字“債”が含まれているため(図5参照)、これらに
より認識確度を補正することにより、候補文字“使”の
認識確度D(P,使)=d(P,使)+0.1*d
(P,便)+0.05*d(P,偵)=1118.55
と最も大きく、認識文字となり、正しい認識結果が得ら
れる(図6参照)。
補を認識文字と決定する。文字認識を具体例により説明
する。図3に示す入力文字パターン“使”に対し、ステ
ップ7での文字候補、認識確度が、各々順に、“佼”、
“使”、“便”、“債”、“偵”、980、974、9
69、953、940の場合(図4参照)、従来例で
は、最も認識確度の高い“佼”が認識結果となり、誤認
識していた。本発明では、ステップ8において候補文字
に類似文字が含まれる場合、認識確度の補正を行う。本
例では、候補文字“佼”には、補正係数0.05の類似
文字“偵”が含まれており、候補文字“使”には、補正
係数0.1の類似文字“便”、補正係数0.05の類似
文字“債”が含まれているため(図5参照)、これらに
より認識確度を補正することにより、候補文字“使”の
認識確度D(P,使)=d(P,使)+0.1*d
(P,便)+0.05*d(P,偵)=1118.55
と最も大きく、認識文字となり、正しい認識結果が得ら
れる(図6参照)。
【0015】
【発明の効果】以上のように、本発明は、従来求められ
ていながら、認識文字の決定に利用されていなかった2
位以下の候補文字及び候補文字の認識確度を利用し、認
識精度を向上させる。
ていながら、認識文字の決定に利用されていなかった2
位以下の候補文字及び候補文字の認識確度を利用し、認
識精度を向上させる。
【図1】本発明の一実施例における文字認識装置の構成
図
図
【図2】本発明の一実施例における文字認識装置の処理
手順を示すフローチャート
手順を示すフローチャート
【図3】本発明の一実施例において扱う入力文字パター
ン例を示す説明図
ン例を示す説明図
【図4】本発明の一実施例における文字候補とその認識
確度を示す説明図
確度を示す説明図
【図5】本発明の一実施例における文字候補の類似文字
を示す説明図
を示す説明図
【図6】本発明の一実施例における文字候補の認識確度
の補正計算を示す説明図
の補正計算を示す説明図
1 文字領域抽出部 2 文字行抽出部 3 文字切り出し部 4 文字特徴抽出部 5 認識確度計算部 6 文字特徴辞書 7 認識文字決定部 8 類似文字辞書 9 文字特徴検出部
Claims (2)
- 【請求項1】入力された画像データから文字パターンを
切り出し、その文字特徴を抽出する文字特徴検出部と、
前記文字特徴検出部で切り出された文字パターンとその
文字特徴とを予め用意した文字特徴辞書と比較照合して
文字候補とその認識確度を求める認識確度計算部と、各
文字候補の類似文字を予め用意された類似文字辞書から
求め、その類似文字が前記の文字候補に含まれている場
合には、文字候補の認識確度を高める補正を行って認識
確度の最も高い文字候補を認識文字と決定する認識文字
決定部とを有することを特徴とする文字認識装置。 - 【請求項2】認識文字決定部の認識確度の補正が各類似
文字の類似度をウエイトとして類似文字の文字候補とし
て有する認識確度を加算するものである請求項1記載の
文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4340022A JPH06187506A (ja) | 1992-12-21 | 1992-12-21 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4340022A JPH06187506A (ja) | 1992-12-21 | 1992-12-21 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06187506A true JPH06187506A (ja) | 1994-07-08 |
Family
ID=18332999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4340022A Pending JPH06187506A (ja) | 1992-12-21 | 1992-12-21 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06187506A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081454A (ja) * | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
-
1992
- 1992-12-21 JP JP4340022A patent/JPH06187506A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081454A (ja) * | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
CN106326887A (zh) | 一种光学字符识别结果的校验方法及装置 | |
Allam | Segmentation versus segmentation-free for recognizing Arabic text | |
JPH11272800A (ja) | 文字認識装置 | |
JPH06187506A (ja) | 文字認識装置 | |
Li et al. | A segmentation method for touching italic characters | |
JPH11328315A (ja) | 文字認識装置 | |
Fadeel | An efficient segmentation algorithm for arabic handwritten characters recognition system | |
JP2856409B2 (ja) | 文字認識装置および方法 | |
JP3115139B2 (ja) | 文字切り出し方法 | |
CN116311264A (zh) | 一种基于字符轮廓的字符识别方法 | |
JP2974396B2 (ja) | 画像処理方法及び装置 | |
EP0815532A2 (en) | Method and apparatus for removing superimposed lines and restoring pixel values in images containing recurring patterns | |
JP4209511B2 (ja) | 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3420853B2 (ja) | 文字切り出し方法 | |
JP2930996B2 (ja) | 画像認識方法および画像認識装置 | |
JP3006823B2 (ja) | 文字および単語の認識方式 | |
KR940009749B1 (ko) | 글자 분할 방법 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JP3428504B2 (ja) | 文字認識装置 | |
Ali | An efficient segmentation algorithm for Arabic handwritten characters recognition system | |
JPH06131492A (ja) | ナンバープレート認識方法 | |
JP2974167B2 (ja) | 文字の大分類認識方法 | |
Sattar et al. | Segmentation of Nastaliq script for OCR |