JPH04219883A - 活字文字認識装置 - Google Patents

活字文字認識装置

Info

Publication number
JPH04219883A
JPH04219883A JP2412283A JP41228390A JPH04219883A JP H04219883 A JPH04219883 A JP H04219883A JP 2412283 A JP2412283 A JP 2412283A JP 41228390 A JP41228390 A JP 41228390A JP H04219883 A JPH04219883 A JP H04219883A
Authority
JP
Japan
Prior art keywords
character image
character
size
width
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2412283A
Other languages
English (en)
Inventor
Hiroyuki Kami
上 博行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2412283A priority Critical patent/JPH04219883A/ja
Publication of JPH04219883A publication Critical patent/JPH04219883A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は階層構造ニューラルネッ
トを識別に用いた活字文字認識装置に関し、特に文字サ
イズの正規化と文字線幅の正規化とを階層構造ニューラ
ルネットによる文字識別に組み合わせた活字文字認識装
置に関するものである。
【0002】
【従来の技術】活字文字の認識に階層構造ニューラルネ
ットを用いた事例を記載した文献として、「ニューラル
ネットによる文字認識」(電子情報通信学会研究会資料
PRU88−58,pp.79−86)がある。
【0003】この文献による文字認識では、入力された
文字画像に対し、画像上の予め定めたリサンプリング点
位置を中心としたガウス型フィルタ(図6にフィルタの
加重値の例を示す。)によるフィルタリングを行い、そ
の出力である濃淡値を階層構造ニューラルネット(図7
に構成の例を示す。)に入力し、予め識別対象カテゴリ
数分だけ学習してある記憶に基づいて識別を行わせる。
【0004】すなわち、階層構造ニューラルネットは、
非線形識別関数の一つと考えられると同時に、学習パタ
ーンをマルチテンプレートで記憶するネットワークと考
えられ、図7に示すような階層構造ニューラルネットに
対し、学習文字画像の濃淡値を入力層に与えると共に、
正解カテゴリを表現する教師信号を出力層に与え、バッ
クプロパゲーション(期待される出力と実際の出力との
誤差を求め、出力層から入力層へ逆方向に誤差を伝播さ
せて重みを調整する。)で学習を行うと、学習後の階層
構造ニューラルネットは濃淡値を入力にした識別論理あ
るいは記憶しているマルチテンプレートとの照合論理と
して利用できる。
【0005】このように、上記の文献の文字認識では、
ニューラルネットの非線形識別を利用することで、以前
の他のマッチング法より高い認識性能を得ている。
【0006】
【発明が解決しようとする課題】上述したように、従来
のニューラルネットを用いた活字文字認識装置にあって
は、理論的に高い認識性能を得ることができるが、文字
サイズおよび文字線幅の正規化について特に考慮されて
いなかったため、実際には次のような欠点があった。
【0007】■  文字サイズの正規化を行わないため
、学習パターンと同じサイズの入力文字画像は識別でき
るが、学習パターンとサイズが違う場合には誤認識して
しまうことがある。また、このようなマッチング法によ
る活字文字認識では、文字画像のサイズを予め揃える正
規化を行うことが多く、文字画像の正規化法としては、
文字画像の外接枠を求め、外接枠内の画像を一定サイズ
の画像領域に圧縮または拡大するアフィン変換法が知ら
れている。従って、このような文字サイズの正規化をニ
ューラルネットの文字認識に適用することも考えられる
が、通常、認識対象の文字には幅の狭い文字や高さの低
い文字があるため、入力された文字画像に対して高さと
幅とで別々にサイズの正規化を行うと、正規化後の文字
画像が歪み、これに起因して更に誤認識が生じてしまう
ことがある。
【0008】■  認識対象のフォント数が増えると、
文字画像の線幅が大きく異なるパターンでも同一カテゴ
リとして認識する必要が生じるが、線幅が変わるとマッ
チングに使う濃淡特徴値が変化するため、一つのカテゴ
リとして判定するための特徴値の範囲を広くする必要が
あり、その結果、異なるカテゴリでも特徴値の範囲が一
部で重なることとなって誤認識しやすくなる。
【0009】本発明は上記の点に鑑み提案されたもので
あり、その目的とするところは、 ・入力された文字画像のサイズのバラツキ・高さや幅の
アンバランスな文字 ・フォントの種類 によって誤認識を生じない活字文字認識装置を提供する
ことにある。
【0010】
【課題を解決するための手段】本発明は上記の目的を達
成するため、1文字単位に文字画像を記憶する文字画像
記憶手段と、記憶された文字画像に対し芯線化処理を行
って芯線パターンを得ると共に、芯線パターンに対して
膨張処理を行って一定線幅の文字画像を生成する線幅正
規化手段と、線幅の正規化された文字画像に対し文字部
分の高さと幅とをもとにした正規化率で一定サイズの文
字画像に変換するサイズ正規化手段と、サイズの正規化
された文字画像から文字画像の特徴として複数個の濃淡
値を求める特徴抽出手段と、求められた複数個の濃淡値
を入力として階層構造ニューラルネットでの変換により
識別対象カテゴリ数分の評価値を求める識別手段と、求
められた評価値から最大値に対応する文字カテゴリ名を
出力する識別結果決定手段とを備えるようにしている。
【0011】
【作用】本発明の活字文字認識装置にあっては、1文字
単位に文字画像を記憶する文字画像記憶手段に記憶され
た文字画像に対し線幅正規化手段が芯線化処理を行って
芯線パターンを得ると共に芯線パターンに対して膨張処
理を行って一定線幅の文字画像を生成し、線幅の正規化
された文字画像に対しサイズ正規化手段が文字部分の高
さと幅とをもとにした正規化率で一定サイズの文字画像
に変換し、サイズの正規化された文字画像から特徴抽出
手段が文字画像の特徴として複数個の濃淡値を求め、求
められた複数個の濃淡値を入力として識別手段が階層構
造ニューラルネットでの変換により識別対象カテゴリ数
分の評価値を求め、求められた評価値から識別結果決定
手段が最大値に対応する文字カテゴリ名を出力する。
【0012】
【実施例】以下、本発明の実施例につき図面を参照して
説明する。図1は本発明の活字文字認識装置の一実施例
を示す構成図である。
【0013】図1において、本実施例の活字文字認識装
置は、文字画像記憶手段11と線幅正規化手段12とサ
イズ正規化手段13と特徴抽出手段14と識別手段15
と識別結果決定手段16とから構成されている。なお、
各部の機能等については、重複を避けるため、以下の動
作を通して説明することとする。
【0014】先ず、光学的文字読取装置(OCR)等に
より読み取られた文字画像は1文字単位に文字画像記憶
手段11に記憶される。例えば、図2に示すような文字
画像が記憶される。なお、この段階では読み取られた生
の画像であり、有効な文字部分は図示のように偏ってい
ることが多い。
【0015】次いで、線幅正規化手段12は、文字画像
記憶手段11に記憶された文字画像に対し芯線化処理を
行って芯線パターンを得ると共に、芯線パターンに対し
て膨張処理を所定回数行って一定線幅の文字画像を生成
する。例えば、図2の文字画像に対して芯線化処理を行
った状態が図3であり、この芯線パターンに対して膨張
処理を行った状態が図4である。
【0016】次いで、サイズ正規化手段13は、線幅の
正規化された文字画像に対し文字部分の高さと幅とをも
とにした正規化率で一定サイズの文字画像に変換する。 サイズの正規化は、次の手順で行われる。
【0017】先ず、文字画像から有効な文字部分の高さ
hと幅wとを求め、以下の分類1〜分類5までの5種類
のいずれかに判定する。なお、t1〜t4は定数である
。 h>w  かつ        w/h<t1  → 
 分類1h>w  かつ  t1<w/h<t2  →
  分類2h>w  かつ  t2<w/h     
   →  分類3w>h  かつ        h
/w<t3  →  分類4w>h  かつ  t3<
h/w<t4  →  分類5w>h  かつ  t4
<h/w        →  分類3
【0018】次
いで、分類に応じて異なるパラメータでサイズの正規化
を行う。すなわち、アフィン変換Xd−Xc’=Px・
(Xs−Xc) Yd−Yc’=Py・(Ys−Yc) のパラメータPx,Pyを以下のように設定する。なお
、上式において、Xs,Ysは元の文字画像上のX,Y
座標、Xd,Ydは変換後の文字画像上のX,Y座標、
Xc,Ycは元の文字画面上の変換の基準となる中心の
X,Y座標、Xc’,Yc’は変換後の文字画面上の中
心のX,Y座標であり、X軸は幅方向、Y軸は高さ方向
にとってある。 分類1  →  Px=Py=H/h 分類4  →  Px=Py=W/w その他  →  Px=W/w,Py=H/hここで、
Hは正規化した後の高さ、Wは正規化した後の幅である
【0019】このように、パラメータの値を変えたのは
、分類1と判定された文字は幅の狭い(高さの高い)文
字であり、分類4と判定された文字は高さの低い(幅の
広い)文字であり、両者とも高さ方向と幅方向とで別々
に正規化して所定のサイズH,Wまで膨張,縮小すると
大きく歪んでしまって誤認識の原因となってしまうため
、幅の狭い文字(分類1)は高さを基準に正規化を行い
、高さの低い文字(分類4)は幅を基準に正規化を行い
、その他の文字は原則通り高さ,幅をそれぞれ基準に正
規化を行うものである。
【0020】図4の文字画像に対してサイズの正規化を
行った状態を図5に示す。この場合は分類1,分類4に
は該当しないため、高さ,幅をそれぞれ基準に正規化が
行われている。
【0021】次いで、特徴抽出手段14は、サイズの正
規化された文字画像から文字画像の特徴として複数個の
濃淡値を求める。例えば、図6のような加重値のガウス
型フィルタを用いてフィルタリングを行い、各メッシュ
における文字画像とフィルタの加重値との積和処理の結
果の濃淡値を特徴値として出力する。
【0022】次いで、識別手段15は、求められた複数
個の濃淡値を入力として階層構造ニューラルネットでの
変換により識別対象カテゴリ数分の評価値を求める。例
えば、図7に示すような中間層1層の階層構造ニューラ
ルネットを用い、入力層に特徴抽出手段14からの複数
個の濃淡値を与え、出力層から識別対象カテゴリ毎の評
価値を得る。
【0023】なお、事前の学習においては、学習文字画
像をサイズ正規化手段13のところで説明したのと同じ
分類に区分し、分類に応じて異なるパラメータでアフィ
ン変換によりサイズの正規化を行い、正規化後の文字画
像によりバックプロパゲーションで学習を行っておく。
【0024】ここで、分類2,分類5について2通りの
パラメータを設けたのは、分類2,分類5は幅の狭い文
字(分類1)あるいは高さの低い文字(分類4)には分
類されてはいないが、これらと隣接するため、判定を誤
った場合に対処すべく、2通りの画像で学習を行ってお
き、誤認識を防止するものである。
【0025】次いで、識別結果決定手段16は、求めら
れた識別対象カテゴリ数分の評価値から最大値に対応す
る文字カテゴリ名を出力する。例えば、図2〜図5の文
字画像に対してはアルファベットの「A」である旨を出
力する。
【0026】
【発明の効果】以上説明したように、本発明の活字文字
認識装置にあっては、以下のような効果がある。
【0027】■  入力された文字画像のサイズを正規
化し、その際に文字の高さと幅に応じて適切な値で正規
化を行うため、学習時と異なるサイズの文字が入力され
ても誤認識することが少なくなる。
【0028】■  文字の線幅の正規化を行うため、フ
ォントが増えても他のカテゴリと誤認識することなく、
同一カテゴリの文字を同様に認識できる。
【図面の簡単な説明】
【図1】本発明の活字文字認識装置の一実施例を示す構
成図である。
【図2】文字画像記憶手段にセットされた文字画像の例
を示す図である。
【図3】線幅正規化手段において芯線化処理を行った状
態の例を示す図である。
【図4】線幅正規化手段において膨張処理を行って線幅
正規化が完了した状態の例を示す図である。
【図5】サイズ正規化手段においてサイズ正規化が完了
した状態の例を示す図である。
【図6】特徴抽出手段におけるフィルタの加重値の例を
示す図である。
【図7】識別手段の階層構造ニューラルネットの構成の
例を示す図である。
【符号の説明】
11…文字画像記憶手段 12…線幅正規化手段 13…サイズ正規化手段 14…特徴抽出手段 15…識別手段 16…識別結果決定手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  1文字単位に文字画像を記憶する文字
    画像記憶手段と、記憶された文字画像に対し芯線化処理
    を行って芯線パターンを得ると共に、芯線パターンに対
    して膨張処理を行って一定線幅の文字画像を生成する線
    幅正規化手段と、線幅の正規化された文字画像に対し文
    字部分の高さと幅とをもとにした正規化率で一定サイズ
    の文字画像に変換するサイズ正規化手段と、サイズの正
    規化された文字画像から文字画像の特徴として複数個の
    濃淡値を求める特徴抽出手段と、求められた複数個の濃
    淡値を入力として階層構造ニューラルネットでの変換に
    より識別対象カテゴリ数分の評価値を求める識別手段と
    、求められた評価値から最大値に対応する文字カテゴリ
    名を出力する識別結果決定手段とを備えたことを特徴と
    する活字文字認識装置。
  2. 【請求項2】  サイズ正規化手段は、文字部分の高さ
    と幅との比から得られる値に応じ、高さと幅の各方向に
    それぞれ高さと幅とを基準にした正規化率、高さと幅の
    両方向に高さを基準にした正規化率、もしくは、高さと
    幅の両方向に幅を基準にした正規化率でサイズを正規化
    することを特徴とする請求項1記載の活字文字認識装置
  3. 【請求項3】  識別手段は、幅が充分に狭いか高さが
    充分に低いと判定できない学習文字につき、2種類のサ
    イズ正規化により得られる文字画像の濃淡値で予め階層
    構造ニューラルネットをそれぞれ学習させることを特徴
    とする請求項1または請求項2記載の活字文字認識装置
JP2412283A 1990-12-20 1990-12-20 活字文字認識装置 Pending JPH04219883A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2412283A JPH04219883A (ja) 1990-12-20 1990-12-20 活字文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2412283A JPH04219883A (ja) 1990-12-20 1990-12-20 活字文字認識装置

Publications (1)

Publication Number Publication Date
JPH04219883A true JPH04219883A (ja) 1992-08-10

Family

ID=18521139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2412283A Pending JPH04219883A (ja) 1990-12-20 1990-12-20 活字文字認識装置

Country Status (1)

Country Link
JP (1) JPH04219883A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251202A (ja) * 1993-03-01 1994-09-09 Nec Corp 文字認識装置
JP2012048711A (ja) * 2010-08-02 2012-03-08 Celartem Inc フォントマッチング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251202A (ja) * 1993-03-01 1994-09-09 Nec Corp 文字認識装置
JP2012048711A (ja) * 2010-08-02 2012-03-08 Celartem Inc フォントマッチング

Similar Documents

Publication Publication Date Title
US6081620A (en) System and method for pattern recognition
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
JP2007058882A (ja) パターン認識装置
EP0446632A2 (en) Method and system for recognizing characters
JP3013618B2 (ja) サイン認識装置
CN111767909A (zh) 一种字符识别方法、设备及计算机可读存储介质
Chhabra et al. High-order statistically derived combinations of geometric features for handprinted character recognition
JPH04219883A (ja) 活字文字認識装置
CN115376149A (zh) 一种报销发票识别方法
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
JP4834693B2 (ja) パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法
JPH08115387A (ja) パターン認識装置
JP2009259190A (ja) 文字認識プログラムおよび文字認識装置
JP3113769B2 (ja) 文字認識装置
JP2843167B2 (ja) パターン読取装置
JP3463255B2 (ja) 多値画像パターンの認識処理方法
Parker et al. Vector templates for symbol recognition
JP2682203B2 (ja) 文字認識方法
JPH041870A (ja) パターン認識方法および装置
JP3277977B2 (ja) 文字認識方法
JPS63269267A (ja) 文字認識方法
JP2005182369A (ja) ベクトル化図形の作成方法および装置
JPH04260987A (ja) 文字認識装置
Henge et al. Optical Character Recognition (OCR)-Decision Making State and Identification of Telugu Hand Written Touching Conjuct Consonants and Mixed Consonants by Using Advanced Fuzzy Logic Controller with Layered Approach
JP2851865B2 (ja) 文字認識装置