JPH07220028A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07220028A
JPH07220028A JP6031823A JP3182394A JPH07220028A JP H07220028 A JPH07220028 A JP H07220028A JP 6031823 A JP6031823 A JP 6031823A JP 3182394 A JP3182394 A JP 3182394A JP H07220028 A JPH07220028 A JP H07220028A
Authority
JP
Japan
Prior art keywords
character
processing unit
recognition
pixels
processing part
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6031823A
Other languages
English (en)
Inventor
Tsutomu Kuramochi
勉 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6031823A priority Critical patent/JPH07220028A/ja
Publication of JPH07220028A publication Critical patent/JPH07220028A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字を精度良くかつ高速に認識することを可
能にした文字認識装置を提供する。 【構成】 文字画像入力部1で入力され、前処理部2で
1文字ごとに切り出されて正規化された文字画像が大分
類処理部3に入力される。大分類処理部3では、ラベル
付け処理部7で文字画像の背景部の連結成分ごとにラベ
ルが付けられる。次に、画素計数処理部8において、ラ
ベル付けされた各背景部の連結成分ごとに、その画素数
が計数される。そして、背景部の連結成分ごとの画素数
のうち、上位n番目まで画素数をn次元の特徴量として
抽出する。識別処理部9では、大分類用辞書4を用い、
抽出したn次元の特徴量から大分類候補文字を決定す
る。詳細認識処理部5では、詳細認識辞書6を用い、大
分類候補文字の中から1文字を特定し、認識結果として
出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字画像から文字を正
確にかつ高速に認識する文字認識装置に関するものであ
る。
【0002】
【従来の技術】文字認識装置においては、認識処理時間
の短縮を目的として、まず、文字画像から比較的高速に
抽出可能な特徴量に基づいて、1文字以上の大分類候補
文字を求め、次に該候補文字だけを認識対象として詳細
な認識処理を実行して認識結果を出力する手法が多く提
案されている。
【0003】このような手法の従来技術としては、例え
ば、特開平3−180989号公報に記載されている手
法では、まず文字画像から文字線の対称性を表わす特徴
量に基づいて大分類候補文字を求め、次に、該大分類候
補文字を認識対象として詳細な認識処理を実行して認識
結果を出力する文字認識装置が提案されている。
【0004】しかし、このような従来の手法で大分類候
補文字を求める場合には、文字線の対称性を表わす特徴
量に基づいて判定するために、文字画像がわずかに傾い
ていたり、文字画像にノイズが入っていると、大分類候
補文字に正解の文字が含まれないことがあり、このよう
な場合は誤認が発生する可能性がある。
【0005】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、文字を精度良くかつ高速に
認識することを可能にした文字認識装置を提供すること
を目的とするものである。
【0006】
【課題を解決するための手段】本発明は、入力文字画像
から文字を認識する文字認識装置において、前記入力文
字画像の背景部の連結成分ごとにラベルを付けるラベル
付け処理部と、ラベル付けされた背景部ごとに画素数を
計数して該画素数の多い方から上位n番目までの画素数
を抽出する画素計数処理部と、抽出した上位n番目まで
の画素数に基づき前記入力文字画像と類似した文字を大
分類候補文字とする識別処理部を備えていることを特徴
とするものである。
【0007】また、入力文字画像の文字線を太くする文
字線膨張処理部をさらに備え、入力文字画像の文字線を
太くした後に前記ラベル付け処理部に入力するように構
成することができる。
【0008】
【作用】本発明によれば、ラベル付け処理部と、画素計
数処理部により、入力文字画像から背景部の連結成分を
抽出してラベル付けを行ない、ラベル付けされた背景部
のうちから画素数が比較的大きい背景部を抽出する。抽
出した背景部の連結成分の画素数は文字の形状の複雑さ
を反映していると考えられる。この考えを用い、識別処
理部は、抽出した背景部の連結成分の大きさにより大分
類候補文字を決定する。その後、大分類候補文字の中か
ら文字を特定する。
【0009】このように、本発明では、文字画像の背景
部の連結成分の大きさに基づく特徴により大分類候補文
字を決定するので、大分類候補文字を決定するための特
徴抽出と識別処理を精度良くかつ高速に行なうことがで
きる。したがって、文字を精度良くかつ高速に認識する
ことができる。
【0010】また、ラベル付けを行なう前に文字線膨張
処理部により文字線を太くすることにより、かすれなど
によって文字線が切れた部分を修復することができる。
これにより、文字線の切れによって背景部の連結成分同
士がつながり、そのために起こる誤認識を防止し、さら
に精度よく文字を認識することができる。
【0011】
【実施例】図1は本発明の文字認識装置の一実施例を示
すブロック構成図である。図中、1は文字画像入力部、
2は前処理部、3は大分類処理部、4は大分類辞書、5
は詳細認識処理部、6は詳細認識辞書、7はラベル付け
処理部、8は画素計数処理部、9は識別処理部である。
文字画像入力部1は、認識対象である文書を2値画像デ
ータとして読み込む。前処理部2は、入力画像データか
ら文字画像データを1文字ずつ切り出し、文字画像デー
タの幅と高さがあらかじめ定めた大きさとなるように拡
大または縮小して正規化する。
【0012】大分類処理部3は、大分類辞書4を用い、
1つ以上の大分類候補文字を抽出する。大分類処理部3
は、ラベル付け処理部7、画素計数処理部8、識別処理
部9を含む。ラベル付け処理部7は、前処理部2で1文
字ずつに切り出され、正規化された文字画像データの背
景部に着目し、背景部の連結成分ごとにラベル付けを行
なう。ラベル付けの方法としては、例えば、「パターン
認識」(森健一監修,電子情報通信学会,171〜17
2ページ)に記載されている方法など、公知の種々の方
法を用いることができる。画素計数処理部8は、ラベル
付け処理部7でラベル付けされた背景部の各連結成分の
画素数を計数する。そして、画素数の多い方からn番目
までの背景部の連結成分を抽出する。識別処理部9は、
抽出されたn番目までの背景部の連結成分をn次元の特
徴量として、大分類辞書4から大分類候補文字を認識対
象として抽出する。
【0013】詳細認識処理部5は、詳細認識辞書6を用
い、更に詳細な特徴の抽出及び識別を行なって、大分類
処理部3で抽出された大分類候補文字の中から文字を特
定し、最終的な認識結果を出力する。詳細認識処理部7
における認識処理方法は、従来より用いられている種々
の方法を用いることができる。
【0014】図2は、本発明の文字認識装置の一実施例
を実現する具体的な装置構成例を示すブロック図であ
る。図中、11は画像入力装置、12は画像用メモリ、
13は処理装置、14は辞書用メモリ、15は作業用メ
モリである。画像入力装置11は文字画像入力部1に対
応し、文書を2値画像データとして読み込み、画像用メ
モリ12に格納する。処理装置13は、前処理部2、大
分類処理部3及び詳細認識処理部5に相当する処理を、
画像用メモリ12、辞書用メモリ14、作業用メモリ1
5を用いて実行する。辞書用メモリ14には、大分類辞
書6、詳細認識辞書6に対応する情報が格納されてい
る。
【0015】画像入力装置11により入力され、画像用
メモリ12に格納された2値画像データは、処理装置1
3によって、1文字ずつ切り出され、正規化された後、
作業用メモリ15に格納される。その後、ラベリング、
画素数の計数を行なって特徴量を抽出した後、まず、辞
書メモリ14内の大分類辞書を用いて大分類候補文字を
決定し、次に、辞書メモリ14内の詳細認識辞書を用い
て詳細認識処理を行ない、大分類候補文字の内から文字
を特定し、最終的な認識結果として出力する。
【0016】以下、大分類処理について、具体例を用い
て説明する。図3は、大分類処理の一例を説明するフロ
ーチャート、図4は、文字画像データの一例の説明図で
ある。いま、前処理部2から図4に示すような文字画像
データが与えられたものとする。前処理部2において、
1文字ごとに切り出され、正規化されている。図4で
は、一例として文字画像データを16×16画素で示し
ている。もちろん、文字画像データのサイズは設計時に
任意に決めればよい。
【0017】まず、S21において、文字画像の背景部
の連結成分ごとにラベルを付ける。図4には、「A」の
文字画像の背景部にラベル付けした結果の例を、「ラベ
ル1」ないし「ラベル4」として示している。図4にお
いて、「A」の文字画像の背景部の連結成分は4個ある
ので、4種類のラベルが付けられる。
【0018】次に、S22において、ラベル付けされた
各背景部の連結成分ごとに、その画素数を計数する。図
4の例では、ラベル1の付けられた背景部の画素数は5
6、ラベル2の付けられた背景部の画素数は56、ラベ
ル3の付けられた背景部の画素数は32、ラベル4の付
けられた背景部の画素数は72である。
【0019】S23において、背景部の連結成分ごとの
画素数のうち、上位n番目まで画素数をn次元の特徴量
として抽出する。次元数nはあらかじめ定めておく。背
景部の連結成分の数mが次元数nよりも小さい場合、
(m+1)次元からn次元までの特徴量の値には0を設
定する。例えば、次元数nを3とすれば、図4の例で
は、3次元の特徴量(72,56,56)が得られる。
【0020】S24において、大分類候補文字を決定す
る。S23で入力文字画像から抽出したn次元の特徴量
と、あらかじめ大分類辞書4に登録しておいた各文字の
n次元の特徴との距離または類似度を計算する。その計
算式は、例えば、「パターン認識」(森健一監修,電子
情報通信学会)に記載されているものなど、従来より用
いられている方法を用いることができる。計算された距
離または類似度のうち、あらかじめ定めた条件を満たす
文字を大分類候補文字として決定する。決定条件の1例
としては、距離があらかじめ定めた閾値以下となった文
字を大分類候補文字とすればよい。
【0021】このようにして決定された大分類候補文字
は、1文字とは限らず、類似した複数の文字が大分類候
補文字となる場合がある。1文字以上の大分類候補文字
の中から、詳細認識処理部5により、1文字を特定し認
識結果とする。
【0022】大分類辞書4に予め登録しておく各文字の
n次元の特徴は、例えば、認識対象とするすべての文字
種の文字画像を対象として、各文字ごとに上述のS21
ないしS23によりn次元の特徴量を抽出し、登録する
ことにより作成することができる。このとき、標準的な
字形のほか、いくつかのパターンを登録することができ
る。
【0023】図5は、本発明の文字認識装置の別の実施
例を示すブロック図である。図中、図1と同様の部分に
は同じ符号を付して説明を省略する。10は文字線膨張
処理部である。この実施例では、大分類処理部3に文字
線膨張処理部10を有する構成を示している。文字線膨
張処理部10は、前処理部2において切り出され、正規
化された文字画像パターンに対して、文字線を太くする
処理を行なう。
【0024】文書に記載された文字にかすれなどがある
と、読み取った画像に切れが発生し、本来別のラベルが
付けられる背景部が連続してしまい、背景部の連結成分
の数が相違する場合がある。この違いが大分類候補文字
に正解の文字が含まれない原因の1つになる。このよう
な不具合を解消するため、文字線膨張処理部10による
膨張処理により、1ないし2ドット程度の線間の隙間を
埋める。この処理により、例えばかすれなどによって線
が切れている場合でも、線を連続化し、正しい背景部の
連結成分を抽出することができる。
【0025】膨張処理の方法としては、例えば、「パタ
ーン認識」(森健一監修,電子情報通信学会,169ペ
ージ)に記載されている方法など、種々の方法を用いる
ことができる。文字線の連続方向などを考慮することに
より、線の先端での接続のみを行ない、線の混み合って
いる部分での線の膨張を抑止するように構成することも
可能である。単純に膨張処理を行なった場合、小さな線
間の背景部はつぶれるが、n個の背景部しか参照しない
ので、小さいあるいは細い背景部分はつぶれても、大分
類処理は支障なく行なうことが可能である。膨張処理の
施された文字画像データは、ラベル付け処理部7に送ら
れ、さきの実施例と同様に処理が行なわれる。
【0026】この実施例においても、さきの実施例と同
様、図2に示した構成により実現することができる。こ
のとき、処理装置13により文字線の膨張処理を行なう
ように構成すればよい。
【0027】図6は、文字線膨張処理の一例の説明図で
ある。図6(A)に「A」の文字画像にかすれが発生し
た場合のラベル付けした結果の例を示している。「A」
の文字画像の背景部の連結成分の数は、図4に示したよ
うに、本来4個である。しかし、図6(A)の場合で
は、かすれが発生して線分が切れてしまったために、図
4におけるラベル3とラベル4が1つの背景部の連結領
域となってしまう。そのため、文字画像の背景部の連結
成分の数は3個となる。この違いは、大分類候補文字に
正解の文字が含まれない原因の1つになる。
【0028】図6(B)に図6(A)の文字画像の文字
線を膨張させた結果の例を示す。このように、文字線を
膨張させることで、かすれ等により切断された文字線を
つなぐことが可能である。図6(B)に示した文字線の
膨張処理後の文字画像では、背景部の連結成分の数は4
個となり、正規の値となる。このように、文字線膨張処
理部10によって文字線の膨張処理を行ない、かすれな
どの影響を排除した後、ラベリングなど、上述の処理手
順により大分類候補文字を決定し、文字を認識する。こ
れにより、さらに精度よく認識することができる。
【0029】
【発明の効果】以上の説明から明らかなように、本発明
によれば、文字画像の背景部の連結成分の大きさに基づ
く特徴により大分類候補文字を求めるので、大分類候補
文字を求めるための特徴抽出と識別処理を、精度よくか
つ高速に行なうことができる。したがって、文字を精度
よくかつ高速に認識することができるという効果があ
る。
【図面の簡単な説明】
【図1】 本発明の文字認識装置の一実施例を示すブロ
ック構成図である。
【図2】 本発明の文字認識装置の一実施例を実現する
具体的な装置構成例を示すブロック図である。
【図3】 大分類処理の一例を説明するフローチャート
である。
【図4】 文字画像データの一例の説明図である。
【図5】 本発明の文字認識装置の別の実施例を示すブ
ロック図である。
【図6】 文字線膨張処理の一例の説明図である。
【符号の説明】
1…文字画像入力部、2…前処理部、3…大分類処理
部、4…大分類辞書、5…詳細認識処理部、6…詳細認
識辞書、7…ラベル付け処理部、8…画素計数処理部、
9…識別処理部、10…文字線膨張処理部、11…画像
入力装置、12…画像用メモリ、13…処理装置、14
…辞書用メモリ、15…作業用メモリ。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力文字画像から文字を認識する文字認
    識装置において、前記入力文字画像の背景部の連結成分
    ごとにラベルを付けるラベル付け処理部と、ラベル付け
    された背景部ごとに画素数を計数して該画素数の多い方
    から上位n番目までの画素数を抽出する画素計数処理部
    と、抽出した上位n番目までの画素数に基づき前記入力
    文字画像と類似した文字を大分類候補文字とする識別処
    理部を備えていることを特徴とする文字認識装置。
  2. 【請求項2】 入力文字画像の文字線を太くする文字線
    膨張処理部をさらに備え、入力文字画像の文字線を太く
    した後に前記ラベル付け処理部に入力することを特徴と
    する請求項1に記載の文字認識装置。
JP6031823A 1994-02-02 1994-02-02 文字認識装置 Pending JPH07220028A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6031823A JPH07220028A (ja) 1994-02-02 1994-02-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6031823A JPH07220028A (ja) 1994-02-02 1994-02-02 文字認識装置

Publications (1)

Publication Number Publication Date
JPH07220028A true JPH07220028A (ja) 1995-08-18

Family

ID=12341814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6031823A Pending JPH07220028A (ja) 1994-02-02 1994-02-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07220028A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011004302A (ja) * 2009-06-22 2011-01-06 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011004302A (ja) * 2009-06-22 2011-01-06 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
US6738519B1 (en) Character recognition apparatus
EP0381773B1 (en) Character recognition apparatus
US20020154815A1 (en) Character recognition device and a method therefore
JPH01253077A (ja) 文字列検出方法
Verma et al. Removal of obstacles in Devanagari script for efficient optical character recognition
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JPH11272800A (ja) 文字認識装置
JPH07220028A (ja) 文字認識装置
JP7234719B2 (ja) 画像処理装置及びプログラム
JP2917427B2 (ja) 図面読取装置
CN112183538B (zh) 一种满文识别方法及系统
JP2020119291A (ja) 情報処理装置及びプログラム
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
JP3197441B2 (ja) 文字認識装置
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Ashir et al. Adaptive clustering algorithm for optical character recognition
JP3077929B2 (ja) 文字切出し方式
JP2571236B2 (ja) 文字切出し識別判定方法
JP2974167B2 (ja) 文字の大分類認識方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP3220226B2 (ja) 文字列方向判別方法
JPH07104940B2 (ja) 図形認識装置
JP3428504B2 (ja) 文字認識装置
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템