JPH09134409A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH09134409A
JPH09134409A JP7289481A JP28948195A JPH09134409A JP H09134409 A JPH09134409 A JP H09134409A JP 7289481 A JP7289481 A JP 7289481A JP 28948195 A JP28948195 A JP 28948195A JP H09134409 A JPH09134409 A JP H09134409A
Authority
JP
Japan
Prior art keywords
unit
feature amount
character
classification
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7289481A
Other languages
English (en)
Inventor
Kenji Kondo
堅司 近藤
Taro Imagawa
太郎 今川
Susumu Maruno
進 丸野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7289481A priority Critical patent/JPH09134409A/ja
Publication of JPH09134409A publication Critical patent/JPH09134409A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 入力画像を各領域に分割して領域毎に特徴量
を抽出する文字認識装置において、高速かつ高精度な文
字認識が困難であった。 【解決手段】 入力文字がどの方向で分けることができ
るかできないかという大まかな情報で大分類を行う大分
類手段1と、文字を複数領域に分割し領域毎に特徴量を
抽出する特徴量抽出手段と、大分類手段1で求めた情報
より、中分類を行うために必要な領域の特徴量を選択
し、中分類を行うための特徴量の総次元数を削減し、ど
の細分類部にどのくらい属しているかを表す帰属度を求
める中分類手段3と、細分類を行うために必要な領域の
特徴量を選択し、より精密な細分類を行う細分類手段4
と、前記帰属度と、細分類手段での結果を統合し、入力
文字がどのカテゴリに属しているかを判断する統合手段
5とを備えた構成である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、学習・認識を行う
ネットワークを用いた光学式の文字認識装置に関する。
【0002】
【従来の技術】漢字などの非常に多くのカテゴリを持つ
文字の識別を1つのネットワークで行おうとすると、多
くの困難を伴う。例えば、JIS第一水準の漢字の識別
を単純なバックプロパゲーションのネットワークで行お
うとすると、学習時には、ローカルミニマムに陥る可能
性も高く、たとえ収束したとしても膨大な計算量を費す
ことになる。大規模なネットワークを実用的な計算時間
で構築するには、1つにはシミュレーションを高速に実
行することの出来るプロセッサを用いることであるが、
ネットワークを学習を行いやすい小規模なネットワーク
に分割し、それらを統合し大規模な構造化ネットワーク
を構築することも必要となる。
【0003】そのような構造化ネットワークの一つとし
てComb NETがある(大規模4層ニューラルネット "Co
mb NET", 電子情報通信学会誌 D-II Vol.J73-D-II No.8
pp.1261-1267 1990年8月)。Comb NETは、前段に入力デ
ータを大分類するためのベクトル量子化ニューラルネッ
トを配置し、後段にはグループ内のデータを細分類する
階層型ニューラルネットを多数並列に配置したものであ
る。これにより前段でおおまかなグループ分けを行い、
後段でグループ内での識別を行うネットワークを構築す
る。
【0004】このComb NETに与える特徴量は、JIS第
一水準漢字を印刷した原稿をスキャナーで2値画像とし
て読み込み、一文字単位で切り出しを行い、この切り出
した1文字のイメージデータを16×16の小領域にまと
め、これを16×16の特徴量ベクトルとすることにより作
製する。
【0005】まず、大分類部の学習であるが、まず前記
の特徴量をベクトル量子化ニューラルネットワークに入
力する。また各ニューロンは2次元格子状に配置され、
自己組織化過程においてシナプス結合の適応変化はHe
bbの学習則に基づいて行われる。学習により、類似し
た入力特徴量ベクトルについて同じニューロンが発火
し、そのニューロンの参照ベクトルがそのカテゴリを代
表するテンプレートとなる。よって、認識時には、類似
した入力特徴量ベクトルについて、ある1つのニューロ
ンが最適整合ニューロンとなり、多数のカテゴリを持つ
集合を類似性のある有限数のグループに分割することが
出来る。次に細分類部の学習であるが、大分類部の学習
後、入力特徴量ベクトルの各カテゴリが、大分類部のど
の出力ニューロンと対応するか調べ、その対応関係をも
とに全カテゴリを大分類部の出力ニューロン数と同数の
グループに分割する。次にその分割したグループ毎にそ
の中にあるカテゴリを識別するための階層型ニューラル
ネットの学習をバックプロパゲーション法を用いて行
う。
【0006】認識は、認識させる文字の特徴量ベクトル
を前記の方法で作成し、まず大分類部に入力する。予
め、ベクトルとベクトルの適合度というものを定義して
おき、入力特徴量と出力ニューロンの参照ベクトルの適
合度が高いものから3番目までのグループを選ぶ。次に
選ばれたグループの階層型ネットワークに入力特徴量を
入力し、最も強く発火したニューロン出力値を調べる。
そして、(適合度)α(出力値)βの値が最も高くなっ
たカテゴリを、入力特徴量の表す文字カテゴリと認識す
る。
【0007】このネットワークの利点は学習の容易さに
ある、バックプロパゲーション法による学習は、大規模
なネットワークになるとローカルミニマムに陥る可能性
も高く、たとえ収束しても膨大な計算量を費すことにな
るが、このような小規模なネットワークの集合になれば
各々のネットワークは収束も容易である。また、大分類
部において、適合度が高いものを3つ選ぶので大分類に
おける間違いをおさえることができる。
【0008】
【発明が解決しようとする課題】Comb NETの大分類部に
おいて、大分類した結果を見ると、部首が同一の文字が
同じグループに分類されていることが多い。また、漢字
は偏が同じ種類のものと、冠が同じ種類のものが多く存
在する。Comb NETの場合は、16×16の小領域から抽出し
た256次元の特徴量を全て用いており、また自己組織
化というアルゴリズムのせいもあり、学習時間に膨大な
時間がかかっている(SUN4/260で約24時間)。また、認識
時においても、大分類部で256次元のベクトルを、16
×16個の参照ベクトル全てと距離演算を行うので、多く
の計算量と計算時間を要してしまう。
【0009】本発明では、上記問題点に臨み、漢字は同
一の偏や冠をもつものが多いという所に着目し、少ない
次元の特徴量で大まかに分類し、後の処理でより正確な
分類をすることができる文字認識装置を提供することを
目的とする。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、本発明の文字認識装置は、大分類手段と、特徴量抽
出手段と、中分類手段と、細分類手段と、統合手段とを
具備し、大分類手段は、一文字単位に切り出した文字画
像を入力する文字画像入力部と、前記文字画像入力部で
入力した文字画像自身の情報から、文字画像が複数の部
分から構成されていると判断した場合は構成情報を示す
信号を出力し、1つの部分から構成されていると判断し
た場合は1つの部分から構成されていることを示す信号
を出力する大分類信号出力部とで構成し、特徴量抽出手
段は、前記文字画像入力部で入力した文字画像を分割す
る画像分割部と、前記画像分割部で分割した領域毎に特
徴量を抽出する特徴量抽出部とで構成し、中分類手段
は、前記特徴量抽出部で領域毎に抽出した特徴量群のう
ちで少なくとも1領域以上の特徴量を前記大分類信号出
力部で出力した信号により選択する中分類用特徴量選択
部と、前記中分類用特徴量選択部で選択した少なくとも
1領域以上の特徴量により、少なくとも1個以上の前記
細分類手段を選択する中分類部と、前記中分類部で選択
した各細分類手段に入力画像が属する度合を表す帰属度
を計算する帰属度計算部とで構成し、細分類手段は、前
記特徴量抽出部で領域毎に抽出した特徴量群のうちで少
なくとも1領域以上の特徴量を選択する細分類用特徴量
選択部と、前記細分類用特徴量選択部で選択した少なく
とも1領域以上の特徴量のうちの各特徴量を用いて、前
記画像分割部で分割した各画像が認識対象の各文字カテ
ゴリに属する度合を表す値を出力する分割画像認識部
と、前記分割画像認識部で出力した値を統合して前記入
力画像が認識対象の各文字カテゴリに属する度合を表す
値を出力する細分類部とで構成し、統合手段は、前記帰
属度計算部で計算した帰属度と前記細分類部で出力した
値を統合し前記入力画像が認識対象の各文字カテゴリに
属する度合を求める統合部と、前記統合部で求めた度合
から前記入力画像が認識対象のどの文字カテゴリに属し
ているかを判断する判断部とから構成する。
【0011】本発明の文字認識装置は、大分類手段にお
いて、入力文字がどの方向で分けることができるか、ま
たは分けることができないかという大まかな情報で大分
類を行い、以後の過程において比較する必要のある文字
の数を減少させる。次に特徴量抽出手段において、文字
をいくつかの領域に分割し、その領域毎に特徴量を抽出
する。次に中分類手段において、大分類手段で求めた、
文字を分けることのできる軸の情報や分けることができ
ないという情報より、中分類を行うために必要な領域の
特徴量を選択することにより、中分類を行うための特徴
量の総次元数を削減する。また、中分類手段では、どの
細分類部にどのくらい属しているかを表す帰属度を求め
る。細分類手段においては、細分類を行うために必要な
領域の特徴量を選択し、より精密な細分類を行う。最後
に統合手段において、中分類手段で求めた帰属度と、細
分類手段で求めた結果を統合し、入力文字がどのカテゴ
リに属しているかを判断する。
【0012】以下、図面を参照して本発明の実施の形態
を説明する。 (実施の形態1)図1、図2は本発明の第1の実施の形
態における文字認識装置の構成図である。図1におい
て、文字画像入力部1a、大分類信号出力部1bとで大
分類手段1を構成し、画像分割部2a、特徴量抽出部2
bで特徴量抽出手段2を構成し、中分類用特徴量選択部
3a、中分類部3b、帰属度計算部3cとで中分類手段
3を構成し、細分類用特徴量選択部4a、分割画像認識
部4b、細分類部4cとで細分類手段4を構成し、統合
部5a、判断部5bとで統合手段5を構成する。また、
図2において、ヒストグラム作成部1c、大分類部1d
で図1の大分類信号出力部1bを構成する。
【0013】次にこのような構成の文字認識装置の学習
時の動作について詳細に説明する。学習させる活字漢字
を字数分、スキャナ等の入力装置により取り込み、2値
化、ノイズ除去、1文字単位での切り出しなどの処理を
行った後、文字画像入力部1aに入力する。今は、
「距」という活字漢字文字画像を文字画像入力部1aに
入力した場合について考える。ヒストグラム作成部1c
において、文字の外接矩形でさらに文字を切り出したあ
と、画像の縦方向と横方向の2軸に2値画像を射影し、
図3のようにヒストグラムを作成する。そして、大分類
部1dにおいて、適当に閾値を定め(この場合は0とす
る)、ヒストグラム作成部1cで作成したヒストグラム
に閾値以下の点が存在するかどうか調べる。今は図3の
ように横方向のヒストグラムに閾値以下の点が存在する
ので、大分類部1dは対応する中分類用特徴量選択部3
aに横方向のヒストグラムに閾値以下の信号が存在する
ことを示す信号を出力する。この動作を学習させる字数
分だけ繰り返す。
【0014】また、画像分割部2aでは、ヒストグラム
作成部1cで求めた2つのヒストグラムより、画像の縦
方向、横方向それぞれの重心点を求め、図4のように、
その点を通る縦線、横線で画像を4分割する。その4分
割したそれぞれの画像において、同様の処理を行い、さ
らに画像を4分割する。そうすると入力文字画像は、図
5のように16分割されることになる。そして特徴量抽
出部2bで、その16分割した各領域毎に特徴量を抽出
する。この動作をこの動作を学習させる字数分だけ繰り
返す。
【0015】中分類手段3は、大分類手段1で分類され
る数分だけ存在しており、入力文字「距」の場合のよう
にヒストグラム作成部1cで求めたヒストグラムのうち
横方向のものに閾値以下の点が存在することを示す信号
を受信する中分類用特徴量選択部3aの場合は、図6の
斜線で表されるような8領域の特徴量を選択する。ま
た、入力文字画像が、縦方向に分けられることを表す信
号を受信する中分類用特徴量選択部3aの場合には、図
7の斜線で表されるような8領域の特徴量を、縦方向と
横方向両方に分けられることを表す信号を受信する中分
類用特徴量選択部3aの場合には、図8の斜線で表され
るような12領域の特徴量を、1つの部分から構成され
ていることを表す信号を受信する中分類用特徴量選択部
3aの場合には、すべての領域の特徴量を選択する。こ
の動作を学習させる字数分だけ繰り返す。
【0016】中分類部3bでは、大分類部1dからの4
種類の信号を受信する各中分類手段ごとに入力文字画像
の特徴量を集め、ベクトル量子化のLBGアルゴリズム
により、複数の代表特徴ベクトルをつくる。すなわち、
各入力文字画像の特徴ベクトルを最も近い代表ベクトル
の小グループに分類することにより、特徴量が類似して
いるもの同士を小グループ化する。すると、図9のよう
に大分類手段で全入力文字を4種類のグループに分類
し、中分類手段でさらに、大分類手段で分類された各グ
ループ毎に特徴量の類似したもの同士を何個かの小グル
ープに分類することになる。また、帰属度計算部3cで
は、入力文字画像の特徴ベクトルと、中分類部3bで求
めたある複数個分の代表特徴ベクトルとの距離に応じ
て、帰属度msを計算する。ここで、帰属度は、
【0017】
【数1】
【0018】で与えられ、入力特徴ベクトルと小グルー
プの代表特徴ベクトルとの距離が小さいほど大きくな
る。ここで、msは、入力特徴ベクトルが注目するグル
ープsに属する度合をあらわす帰属度で、Diは入力特
徴ベクトルと小グループiの代表ベクトルとのユークリ
ッド距離で、f( >1)はファジイ性を調節するパラメータ
で、f=1の時はハードクラスタリングになり、fが大きく
なるほど帰属度の曖昧性が大きくなる。
【0019】細分類手段4は、対応する中分類手段3に
より中分類されるグループ数分だけ存在している。ま
た、大分類手段1で分類されるすべての中分類手段3に
対して同様に、対応する中分類手段で中分類されるグル
ープ数分だけ細分類手段4が存在する。細分類用特徴量
選択部4aは、図10のように、対応する中分類用特徴
量選択部3aで選択されなかった特徴量を選択する。1
つの細分類手段には、中分類用特徴量選択部で選択した
領域数分の分割画像認識部4b(階層型ニューラルネッ
トワーク)が存在しており、対応する領域の特徴量を入
力とし、各カテゴリへ属している度合を表す値を出力す
る。なお、この階層ニューラルネットワークの入力ニュ
ーロンの数は特徴量の次元数と同じで、出力ニューロン
の数は中分類手段で分類したうちの対応するグループ内
に含まれているカテゴリ数と同じである。細分類部4c
では、細分類用特徴量選択部4aで選択した領域分の、
分割画像認識部4bの出力のうち、同一カテゴリの出力
について加算し、最終的に細分類用特徴量選択部4aで
選択した領域全体が各文字カテゴリに属する度合を出力
する。
【0020】最後に、統合手段5での動作であるが、統
合部5aにおいて、中分類部3bで選択したある細分類
手段4内の細分類部4cの各カテゴリの出力に、帰属度
計算部3cで求めた、その細分類手段4に対応する帰属
度を掛け合わせ、掛け合わせた後の各カテゴリの出力
を、すべての細分類手段の同一カテゴリの出力について
加算する。判断部5bにおいて、統合部5aで加算した
出力のうち最も大きいもののカテゴリを判断結果として
出力する。そして、この判断部5bで出力されるカテゴ
リが、正しいカテゴリとなるように、バックプロバゲー
ション学習法で学習する。
【0021】また認識時の動作であるが、学習時に出力
を求める方法と同様である。尚、大分類部1dで使用す
る閾値は0でなくとも適当な値であればよい。また、画
像分割部2aで文字画像を16分割しているが、他の適
当な数で分割してもよい。また、中分類用特徴量選択部
は、大分類部1dからの信号により、図6、図7、図8
のように8、12、16領域の特徴量を選択している
が、それぞれ他の適当な数の領域を選択してもよい。ま
た、中分類部では、ベクトル量子化のLBGアルゴリズ
ムを、細分類部では、階層型ネットワークを用いたが、
それぞれ他のネットワークでもよい。また、帰属度計算
部3cでは(数1)のような式を用いたが、他の適当な
式でもよい。
【0022】本実施の形態では、大分類手段1のヒスト
グラム作成部1cで入力画像の縦方向と横方向に射影し
てヒストグラムを作成し、ヒストグラムに予め定めた閾
値以下の点が存在するかどうか、存在するならばどちら
の方向のヒストグラムかという簡単な情報で大分類を行
い、以後の処理におけるデータ数を削減する。活字漢字
は、手書き漢字に比べ同一文字に関しては変動が少ない
ので、このような簡単な処理でも精度の高い分類を行う
ことができる。また、中分類手段2の中分類用特徴量選
択部3aで、中分類に用いる特徴量として全領域の特徴
量のうちの数部分を選択するので、計算量を削減するこ
とができる。そして、中分類手段3において、偏や冠が
同一種類の漢字が同一グループに分類されているので、
細分類手段4の細分類用特徴量選択部4aでは、中分類
のときに用いた特徴量の残りの領域のものを選択し、以
降の細分類を行うことで効率の良い分類を行うことがで
きる。漢字においては、偏や冠が同一の文字が多数存在
するので、まず偏が同じ種類の文字や冠が同じ種類の文
字に分類し、以後の処理で、偏や冠以外の部分を分類す
ることは有効である。
【0023】(実施の形態2)図1、図2、図11は本
発明の第2の実施の形態における文字認識装置の構成図
である。図1、図2においては、帰属度計算部3cから
統合部5aだけでなく細分類部4cに対しても帰属度が
伝達されることを除いては、実施の形態1と同様に構成
される。図11においては、細分類部4cは係数計算部
4d、乗算部4eとで構成する。
【0024】次にこのような構成の文字認識装置の学習
時の動作について詳細に説明する。大分類手段1、特徴
量抽出手段2、中分類手段3での動作は、帰属度計算部
3cから細分類部4cにも帰属度が伝達されることを除
いて実施の形態1と同様である。
【0025】細分類手段4は、注目する中分類手段3に
よって中分類されるグループ数分だけ存在している。ま
た、大分類手段1で分類されるすべての中分類手段3に
対して、対応する中分類手段で中分類されるグループ数
分だけ細分類手段4が存在する。そして、細分類用特徴
量選択部4aは、図12のように画像分割部2aで分割
した領域のすべてを選択する。分割画像認識部4bは、
細分類用特徴量選択部4aで選択した領域の数すなわち
16個存在しており、実施の形態1と同様の階層型ニュー
ラルネットワークである。また、この階層型ニューラル
ネットワークの入力ニューロンの数は、特徴量の次元数
と同じで、出力ニューロンの数は、中分類手段で分類し
たグループ内に含まれているカテゴリ数と同じある。こ
の16個の分割画像認識部4bにそれぞれ対応する領域
の特徴量を入力し、各カテゴリに属する度合を出力させ
る。
【0026】係数計算部4dでは、帰属度計算部3cで
計算した帰属度をもとに、分割画像認識部4bの出力に
掛け合わせる係数を計算する。この係数は、対応する中
分類用特徴量選択部3aで選択された特徴量を入力する
分割画像認識部4bに掛け合わせる場合は、帰属度の逆
数に比例した数とし、その他は1とする。つまり、帰属
度が大きい、すなわち中分類手段3で選択された細分類
手段4に属している可能性が高い場合には、中分類時に
用いた特徴量を入力した分割画像認識部の出力は、重視
しないことになる。乗算部4eでは、分割画像認識部4
bの結果に係数計算部4dで求めた係数を乗算部4eに
おいて掛け合わせ、掛け合わせた後の各カテゴリに属す
る度合を、全領域について足し合わせ、この各カテゴリ
に属する度合を細分類部4cの出力とする。
【0027】統合手段5での動作は実施の形態1と同様
である。判断部5bで出力されるカテゴリが、正しいカ
テゴリとなるように、バックプロバゲーション学習法で
学習する。
【0028】また認識時の動作は、学習時に出力を求め
る方法と同様である。本実施の形態では、細分類部4c
の係数計算部4dにおいて、帰属度計算部3cで計算し
た帰属度をもとに、係数計算部4dで分割画像認識部4
bの出力に掛け合わせる係数を計算する。この係数は、
対応する中分類用特徴量選択部3aで選択された特徴量
を入力する分割画像認識部4bに掛け合わせる場合は、
帰属度の逆数に比例した数とし、その他は1とする。つ
まり、帰属度が大きい、すなわち中分類手段3で選択さ
れた細分類手段4に属している可能性が高い場合には、
中分類時に用いた特徴量を入力した分割画像認識部の出
力は、重視しないことになる。
【0029】この動作の説明として、次の場合を考え
る。文字の左側の特徴量を使って中分類した場合、特徴
量空間に、図13のような”木偏”と”禾偏”のグルー
プが存在しているとする。そこに、”材”という文字が
入力され、帰属度計算部3cで各グループの代表ベクト
ルとの距離から帰属度が求められる。図では”木偏”の
グループへの帰属度が大きいので、”木偏”のグループ
に相当する細分類手段4では、文字の左側の領域の特徴
量に対応する出力への係数は小さくなり、”木偏”は重
視されず、右側の”才”という部分を重視して出力を出
す。よって、類似文字の多いグループ内で、独自の情報
を持っている部分に着目するので誤認識を防ぐことがで
きる。また、”禾偏”のグループへの帰属度は小さいの
で、”禾偏”のグループに相当する際分類手段では、文
字の左側の領域の特徴量に対応する出力への係数が大き
くなり、”木偏”が重視され、”禾偏”と類似していて
も、区別しやすくなる。よって、帰属度をもとに係数を
計算し、分割画像認識部4bでの出力を統合することは
有効である。
【0030】
【発明の効果】以上のように、本発明の文字認識装置
は、特徴量抽出手段においては、分割した領域毎の特徴
量を求め、中分類用特徴量選択部においては、大分類用
信号出力部で出力した大分類信号によりそれらの特徴量
のうちの一部を選択し、以降の中分類部で中分類を行う
ことで、使用する特徴量の次元を削減することができる
ので、高速なグループ分けが可能となる。また、係数計
算部において、帰属度をもとに適当な係数を計算し、そ
の係数と分割画像認識部での出力を掛け合わせることに
より、類似または同一の偏や冠をもつグループ内での識
別の精度を向上することができる。
【図面の簡単な説明】
【図1】本発明の第1実施の形態の構成図
【図2】第1実施の形態の大分類手段1のより詳細な構
成図
【図3】第1実施の形態のヒストグラム作成部1cで作
成したヒストグラムを示す図
【図4】第1実施の形態の画像分割部2aで、入力文字
画像を4分割したことを示す図
【図5】第1実施の形態の画像分割部2aで、入力文字
画像を最終的に16分割したことを示す図
【図6】第1実施の形態において、大分類信号出力部1
dからの信号が横方向のヒストグラム仁閾値以下の点が
存在することを示す場合に、中分類用特徴量選択部3a
が選択する領域を示す図
【図7】第1実施の形態において、大分類信号出力部1
dからの信号が縦方向のヒストグラム仁閾値以下の点が
存在することを示す場合に、中分類用特徴量選択部3a
が選択する領域を示す図
【図8】第1実施の形態において、大分類信号出力部1
dからの信号が縦、横両方向のヒストグラム仁閾値以下
の点が存在することを示す場合に、中分類用特徴量選択
部3aが選択する領域を示す図
【図9】第1実施の形態における大分類手段と中分類手
段の分類方法を示す図
【図10】第1実施の形態における細分類手段の分類方
法を示す図
【図11】第2実施の形態の細分類部4cのより詳細な
構成図
【図12】第2実施の形態における細分類手段の分類方
法を示す図
【図13】第2実施の形態における動作を補助的に示す
【符号の説明】
1 大分類手段 1a 文字画像入力部 1b 大分類信号出力部 1c ヒストグラム作成部 1d 大分類部 2 特徴量抽出手段 2a 画像分割部 2b 特徴量抽出部 3 中分類手段 3a 中分類用特徴量選択部 3b 中分類部 3c 帰属度計算部 4 細分類手段 4a 細分類用特徴量選択部 4b 分割画像認識部 4c 細分類部 4d 係数計算部 4e 乗算部 5 統合手段 5a 統合部 5b 判断部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】大分類手段と、特徴量抽出手段と、中分類
    手段と、細分類手段と、統合手段とを具備し、前記大分
    類手段は、一文字単位に切り出した文字画像を入力する
    文字画像入力部と、前記文字画像入力部で入力した文字
    画像自身の情報から、文字画像が複数の部分から構成さ
    れていると判断した場合は構成情報を示す信号を出力
    し、1つの部分から構成されていると判断した場合は1
    つの部分から構成されていることを示す信号を出力する
    大分類信号出力部を有し、 前記特徴量抽出手段は、前記文字画像入力部で入力した
    文字画像を分割する画像分割部と、前記画像分割部で分
    割した領域毎に特徴量を抽出する特徴量抽出部とから構
    成され、前記中分類手段は、前記特徴量抽出部で領域毎
    に抽出した特徴量群のうちで少なくとも1領域以上の特
    徴量を前記大分類信号出力部で出力した信号により選択
    する中分類用特徴量選択部と、前記中分類用特徴量選択
    部で選択した少なくとも1領域以上の特徴量により、少
    なくとも1個以上の前記細分類手段を選択する中分類部
    と、前記中分類部で選択した各細分類手段に前記文字画
    像入力部で入力した文字画像が属する度合を表す帰属度
    を計算する帰属度計算部とから構成され、前記細分類手
    段は、前記特徴量抽出部で領域毎に抽出した特徴量群の
    うちで少なくとも1領域以上の特徴量を選択する細分類
    用特徴量選択部と、前記細分類用特徴量選択部で選択し
    た少なくとも1領域以上の特徴量のうちの各特徴量を用
    いて、前記画像分割部で分割した各領域の画像が認識対
    象の各文字カテゴリに属する度合を表す値を出力する分
    割画像認識部と、前記分割画像認識部で出力した値を統
    合して前記文字画像入力部で入力した文字画像が認識対
    象の各文字カテゴリに属する度合を表す値を出力する細
    分類部とから構成され、前記統合手段は、前記帰属度計
    算部で計算した帰属度と前記細分類部で出力した値を統
    合し前記文字画像入力部で入力した文字画像が認識対象
    の各文字カテゴリに属する度合を求める統合部と、前記
    統合部で求めた度合から前記文字画像入力部で入力した
    文字画像が認識対象のどの文字カテゴリに属しているか
    を判断する判断部とから構成されたことを特徴とする文
    字認識装置。
  2. 【請求項2】大分類信号出力部は、文字画像入力部で入
    力した文字画像を互いに異なる2軸に射影してヒストグ
    ラムをとるヒストグラム作成部と、前記ヒストグラム作
    成部で作成した、各軸に対応するヒストグラムにおいて
    予め定めた閾値以下の値があれば、前記文字画像は、前
    記閾値以下の値を持つ座標を境界として複数の部分から
    構成されていることを示す信号を、予め定めた閾値以下
    の値がなければ、前記文字画像は1つの部分から構成さ
    れていることを示す信号を出力する大分類部とから構成
    されたことを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】ヒストグラム作成部は、切り出し後の一文
    字の画像を射影する軸として、画像に対して縦方向と横
    方向の2軸を用いることを特徴とする請求項2記載の文
    字認識装置。
  4. 【請求項4】中分類用特徴量選択部は、大分類信号出力
    部で出力した信号が、文字画像入力部で入力した文字画
    像が左右に分けることができる複数の部分から構成され
    ていることを示す場合には、特徴量抽出部で抽出した特
    徴量群のうち前記文字画像の左方に位置する領域から抽
    出した特徴量を選択し、前記文字画像が上下に分けるこ
    とができる複数の部分から構成されていることを示す場
    合には、特徴量抽出部で抽出した特徴量群のうち文字画
    像の上方に位置する領域から抽出した特徴量を選択し、
    前記文字画像が左右と上下の両方に対して分けることが
    できる複数の部分から構成されていることを示す場合に
    は、特徴量抽出部で抽出した特徴量群のうち文字画像の
    上方または左方に位置する領域から抽出した特徴量を選
    択し、前記文字画像が1つの部分から構成されているこ
    とを示す場合には、特徴量抽出部で抽出した特徴量群の
    うち全部の特徴量を選択することを特徴とする請求項1
    記載の文字認識装置。
  5. 【請求項5】細分類用特徴量選択部は、大分類信号出力
    部で出力した信号が、文字画像入力部で入力した文字画
    像が左右または上下または左右と上下の両方に分けるこ
    とができる複数の部分から構成されていることを示す場
    合には中分類用特徴量選択部で選択されなかった特徴量
    を選択し、前記文字画像が1つの部分から構成されてい
    ることを示す場合には全ての特徴量を選択することを特
    徴とする請求項1記載の文字認識装置。
  6. 【請求項6】細分類用特徴量選択部は特徴量抽出部で領
    域毎に抽出した特徴量群のうちの全部を選択し、細分類
    部は、帰属度計算部で計算した帰属度をもとに分割画像
    認識部で出力した値に重み付けをして文字画像入力部で
    入力した文字画像が認識対象の各文字カテゴリに属する
    度合を表す値を出力することを特徴とする請求項1記載
    の文字認識装置。
  7. 【請求項7】入力文字がどの方向で分けることができる
    か、分けることができないかという大まかな情報で大分
    類を行う大分類手段と、文字をいくつかの領域に分割
    し、その領域毎に特徴量を抽出する特徴量抽出手段と、
    中分類を行うために必要な領域の特徴量を選択すること
    により、どの細分類部にどのくらい属しているかを表す
    帰属度を求める中分類手段と、細分類を行うために必要
    な領域の特徴量を選択し、より精密な細分類を行う細分
    類手段と、前記帰属度と前記細分類手段で求めた結果を
    統合し、入力文字がどのカテゴリに属しているかを判断
    する統合手段とを備えた文字認識装置。
JP7289481A 1995-11-08 1995-11-08 文字認識装置 Pending JPH09134409A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7289481A JPH09134409A (ja) 1995-11-08 1995-11-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7289481A JPH09134409A (ja) 1995-11-08 1995-11-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPH09134409A true JPH09134409A (ja) 1997-05-20

Family

ID=17743841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7289481A Pending JPH09134409A (ja) 1995-11-08 1995-11-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPH09134409A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089714A (ja) * 2019-12-05 2021-06-10 エスアーペー エスエー 文字の視覚認識符号化

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089714A (ja) * 2019-12-05 2021-06-10 エスアーペー エスエー 文字の視覚認識符号化

Similar Documents

Publication Publication Date Title
US7362892B2 (en) Self-optimizing classifier
US20070065003A1 (en) Real-time recognition of mixed source text
EP1912161A2 (en) Method and apparatus for automatic image categorization
He et al. Real-time human face detection in color image
Chiang et al. Hybrid fuzzy-neural systems in handwritten word recognition
CN111242046B (zh) 一种基于图像检索的地面交通标志识别方法
CN112733936A (zh) 一种基于图像识别的可回收垃圾分类方法
Lerner et al. A classification-driven partially occluded object segmentation (CPOOS) method with application to chromosome analysis
Singhal et al. Script-based classification of hand-written text documents in a multilingual environment
JPH05225378A (ja) 文書画像の領域分割システム
CN114882599A (zh) 基于双分支神经网络的离线手写签名分割系统和方法
CN111815582A (zh) 改进背景先验和前景先验的二维码区域检测方法
CN112949634B (zh) 一种铁路接触网鸟窝检测方法
Gorokhovatskiy et al. Vector Quantization, Learning and Recognition in the Space of Descriptors of Structural Features of Images
CN110956177A (zh) 一种混合型验证码的识别方法及系统
Houtinezhad et al. Off-line signature verification system using features linear mapping in the candidate points
Curran et al. The use of neural networks in real-time face detection
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
Aghdam et al. A unified framework for coarse-to-fine recognition of traffic signs using bayesian network and visual attributes
JPH09134409A (ja) 文字認識装置
CN113344102A (zh) 基于图像hog特征与elm模型的目标图像识别方法
Dehkordi et al. Handwriting style classification
Dhawale et al. Recognition of degraded printed Marathi characters using zone and texture-based features
Mohamed et al. Detecting text in license plates using a novel MSER-based method
Castiello et al. Fuzzy classification of image pixels