JPS6379192A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6379192A JPS6379192A JP61224450A JP22445086A JPS6379192A JP S6379192 A JPS6379192 A JP S6379192A JP 61224450 A JP61224450 A JP 61224450A JP 22445086 A JP22445086 A JP 22445086A JP S6379192 A JPS6379192 A JP S6379192A
- Authority
- JP
- Japan
- Prior art keywords
- character
- value
- feature
- dictionary
- separation rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims description 7
- 230000001186 cumulative effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は特徴抽出によって得られた複数の特徴値を照合
して文字を読み取る文字認識装置に関するものである。
して文字を読み取る文字認識装置に関するものである。
従来の技術
文字認識装置では人力文字から特徴抽出した特徴値と予
め装置に記憶した各文字の特徴値の平均と照合し、合致
度の大きい文字を読み取り結果として出力している。さ
らに文字認識装置の文字の読み取り速度を高めるために
認識に有効な特徴を選択して使用する手法がある。この
ような手法としてKL展開による特徴選択がある(例え
ば電子通信学会パターンと学習研究会資料P RL 8
5−36等)。
め装置に記憶した各文字の特徴値の平均と照合し、合致
度の大きい文字を読み取り結果として出力している。さ
らに文字認識装置の文字の読み取り速度を高めるために
認識に有効な特徴を選択して使用する手法がある。この
ような手法としてKL展開による特徴選択がある(例え
ば電子通信学会パターンと学習研究会資料P RL 8
5−36等)。
発明が解決しようとする問題点
しかし、上記のような方式では特徴の選択が、文字を読
み取る認識率と直接結びつかない判定基準で行われると
ともに、認識対象文字ごとに認識に有効な特徴が異なる
ことが生かされていないという問題があった。これはつ
ぎの理由による。
み取る認識率と直接結びつかない判定基準で行われると
ともに、認識対象文字ごとに認識に有効な特徴が異なる
ことが生かされていないという問題があった。これはつ
ぎの理由による。
文字認識における各特徴抽出の特徴値は入力文字によっ
て値が変動するが、前記KL展開による特徴選択は特徴
の変動が特徴間で関係があるかどうか、具体的には変動
の独立性の高いものから順に選択するという方式であり
、各特徴が認識において有効であるかどうかとは直接結
びつかない特徴選択であるからである。また認識対象文
字はいずれも同じ特徴で認識するので、認識対象文字ご
とに認識に有効な特徴が異なることにもかかわらず、こ
のことを認識に生かすことができなかった。
て値が変動するが、前記KL展開による特徴選択は特徴
の変動が特徴間で関係があるかどうか、具体的には変動
の独立性の高いものから順に選択するという方式であり
、各特徴が認識において有効であるかどうかとは直接結
びつかない特徴選択であるからである。また認識対象文
字はいずれも同じ特徴で認識するので、認識対象文字ご
とに認識に有効な特徴が異なることにもかかわらず、こ
のことを認識に生かすことができなかった。
そこで、本発明は特徴を認識性能に直接むすびつく選択
基準を使用して、認識対象文字ごとにそれぞれの文字の
認識に有効な特徴を選択して文字の認識に使用する文字
認識装置を提供するものである。
基準を使用して、認識対象文字ごとにそれぞれの文字の
認識に有効な特徴を選択して文字の認識に使用する文字
認識装置を提供するものである。
問題点を解決するための手段
上記問題点を解決するために本発明の文字認識装置は、
認識対象文字ごとに各特徴値の平均値を格納した平均値
辞書と、認識対象文字ごとに各特徴値の分散値を格納し
た分散値辞書と、前記平均辞書に格納された平均値と前
記分散値辞書に格納された前記分散値を参照し認識対象
文字対ごとに各特徴によって識別される確率に対応する
分離率を出力する分離率算出手段と、前記分離率を入力
として認識対象文字ごとに文字の認識に有効な特徴であ
る選択特徴を順次出力する特徴選択手段を具備する構成
を備えたものである。
認識対象文字ごとに各特徴値の平均値を格納した平均値
辞書と、認識対象文字ごとに各特徴値の分散値を格納し
た分散値辞書と、前記平均辞書に格納された平均値と前
記分散値辞書に格納された前記分散値を参照し認識対象
文字対ごとに各特徴によって識別される確率に対応する
分離率を出力する分離率算出手段と、前記分離率を入力
として認識対象文字ごとに文字の認識に有効な特徴であ
る選択特徴を順次出力する特徴選択手段を具備する構成
を備えたものである。
作用
本発明は上記した構成によって、まず認識対象文字ごと
に各特徴の平均値と分散値よりそれぞれの認識対象文字
の認識性能に直接むすびつく前記分離率を前記分離率算
出手段で算出する。そして、前記特徴選択手段で前記分
離率より認識対象文字ごとに各特徴が文字の認識にどれ
だけを効であるかを算出し、認識に有効な特徴を順次選
択して文字の認識に使用するものである。
に各特徴の平均値と分散値よりそれぞれの認識対象文字
の認識性能に直接むすびつく前記分離率を前記分離率算
出手段で算出する。そして、前記特徴選択手段で前記分
離率より認識対象文字ごとに各特徴が文字の認識にどれ
だけを効であるかを算出し、認識に有効な特徴を順次選
択して文字の認識に使用するものである。
実施例
以下本発明の一実施例の文字認識装置について、図面を
参照しながら説明する。
参照しながら説明する。
第1図は本発明の実施例における装置のブロック図を示
すものである。1は観測手段、2は特徴抽出手段、3は
平均値辞書記憶手段、4は分散値辞書記憶手段、5は分
離率算出手段、6は特徴選択手段、7は特徴辞書記憶手
段、8は照合手段、9は人力文字の画像信号、10は入
力文字の特徴値、11は平均値、12は分散値、13は
分離率、14は選択特徴、15は文字コードである。
すものである。1は観測手段、2は特徴抽出手段、3は
平均値辞書記憶手段、4は分散値辞書記憶手段、5は分
離率算出手段、6は特徴選択手段、7は特徴辞書記憶手
段、8は照合手段、9は人力文字の画像信号、10は入
力文字の特徴値、11は平均値、12は分散値、13は
分離率、14は選択特徴、15は文字コードである。
以上のように構成された文字認識装置について、以下第
1図及び第2図を用いてその動作を説明する。
1図及び第2図を用いてその動作を説明する。
まず観測手段1で紙に記録された文字を光学的に読み取
り光電変換回路で電気的な信号に変換した入力文字の画
像信号9を得る。特徴抽出手段2は入力文字の画像信号
9を入力として特徴抽出を行い入力文字の特徴値10を
出力する。また平均値辞書3は認識対象文字ごとに各特
徴の平均値を格納し、分散値辞書4は認識対象文字ごと
に各特徴の分散値を格納している。分離率算出手段5は
、平均値辞書3と分散値辞書4を参照して認識対象文字
対ごとにの分離率を算出する。分離率は実質的に次の式
で与えられるものである。ある文字のある特徴の平均値
をmA、分散値をσ、とじ、もう一方の文字の特徴の平
均値をmI+、分散値をσ8とすると、Nを定数として
、 である。さらに分解率について第2図を用いて説明する
。第2図は特徴値の出現頻度の分布図で横軸はある特徴
抽出が入力文字に対して出力する特徴値で縦軸はその出
現頻度を示している。正規分布を仮定し文字Aの特徴値
が平均mA分散値σ。
り光電変換回路で電気的な信号に変換した入力文字の画
像信号9を得る。特徴抽出手段2は入力文字の画像信号
9を入力として特徴抽出を行い入力文字の特徴値10を
出力する。また平均値辞書3は認識対象文字ごとに各特
徴の平均値を格納し、分散値辞書4は認識対象文字ごと
に各特徴の分散値を格納している。分離率算出手段5は
、平均値辞書3と分散値辞書4を参照して認識対象文字
対ごとにの分離率を算出する。分離率は実質的に次の式
で与えられるものである。ある文字のある特徴の平均値
をmA、分散値をσ、とじ、もう一方の文字の特徴の平
均値をmI+、分散値をσ8とすると、Nを定数として
、 である。さらに分解率について第2図を用いて説明する
。第2図は特徴値の出現頻度の分布図で横軸はある特徴
抽出が入力文字に対して出力する特徴値で縦軸はその出
現頻度を示している。正規分布を仮定し文字Aの特徴値
が平均mA分散値σ。
で分布したとすれば文字Aの出現頻度の分布図は第2図
の山の形をした曲線になる。つぎに文字Bが平均mB分
散値σ、で分布したとして、分散値σ8に比例した範囲
外の特徴値を文字Bでない特徴値とする。比例定数をN
として第2図の横軸のmB−N・σ、とmB+N・σ8
の外側の範囲が文字Bでない特徴値の範囲である。第2
図において文字Aの出現頻度の分布図のうち文字Bでな
い特徴値をとる部分をハンチングで示す。この部分の面
積が分離率に相当するものである。つぎに、第1図の特
徴選択手段6の動作について説明するために特徴選択手
段6が、ある認識対象文字Cについて有効な特徴を選択
する場合について説明する。まず、前記分離率より文字
Cと文字C以外のすべて文字の対について各特徴の前記
分離率の加算値を求めて、これがもっとも大きい値をと
る特徴をひとつ選択し出力する。つぎに特徴選択手段6
は選択しなかった特徴について文字Cと文字C以外の文
字の対について、分離率算出手段5から出力された前記
分離率と特徴選択手段6からすでに選択し出力された特
徴の分離率とから累積分離率を求める。これは特徴選択
手段6がすでに選択した特徴とこれから選択する特徴の
文字認識における識別力が重複することを避けるためで
ある。
の山の形をした曲線になる。つぎに文字Bが平均mB分
散値σ、で分布したとして、分散値σ8に比例した範囲
外の特徴値を文字Bでない特徴値とする。比例定数をN
として第2図の横軸のmB−N・σ、とmB+N・σ8
の外側の範囲が文字Bでない特徴値の範囲である。第2
図において文字Aの出現頻度の分布図のうち文字Bでな
い特徴値をとる部分をハンチングで示す。この部分の面
積が分離率に相当するものである。つぎに、第1図の特
徴選択手段6の動作について説明するために特徴選択手
段6が、ある認識対象文字Cについて有効な特徴を選択
する場合について説明する。まず、前記分離率より文字
Cと文字C以外のすべて文字の対について各特徴の前記
分離率の加算値を求めて、これがもっとも大きい値をと
る特徴をひとつ選択し出力する。つぎに特徴選択手段6
は選択しなかった特徴について文字Cと文字C以外の文
字の対について、分離率算出手段5から出力された前記
分離率と特徴選択手段6からすでに選択し出力された特
徴の分離率とから累積分離率を求める。これは特徴選択
手段6がすでに選択した特徴とこれから選択する特徴の
文字認識における識別力が重複することを避けるためで
ある。
累積分離率は、特徴選択手段6からすでにに個の特徴が
選択し出力され前記に個の特徴の分離率が分離率+
(+は1からkの整数)とするとつぎのように求められ
る。
選択し出力され前記に個の特徴の分離率が分離率+
(+は1からkの整数)とするとつぎのように求められ
る。
累積分離率−1−(1−分離率)X■(1−分離率、)
さらに、特徴選択手段6は文字Cと文字C以外のすべて
の文字の対について各特徴の前記累積分離率の加算値を
求めて、これがもっとも大きい値をとる特徴をひとつ選
択し出力する。特徴選択手段6は前記の累積分離率を求
めることと累積分離率の加算値が最も大きい値となる特
徴をひとつ選択して出力することを繰り返し順次特徴を
選択し出力する。特徴辞書7は特1’ri選択手段6の
出力する特徴を格納する。そして、照合手段8は入力さ
れた文字の特徴値とあらかじめ平均値辞書3に格納され
た各認識対象文字の平均値との距離を求めて、最も距離
の小さい文字を認識の結果として出力する。さらに距離
の求め方をある認識対象文字である文字Cと入力された
文字の特徴値10の距離を求める場合を例にとって説明
すると照合手段8は特徴辞書7に格納された選択特徴1
4を参照して文字Cの識別について有効として選択され
た特徴を知りこれらの特徴について入力文字の特徴値1
0と平均値辞書3に格納された各認識対象文字の平均値
11との差の絶対値を求めこれを分散辞の4に格納され
た分散値12で割り算した値をそれぞれの特徴について
求め、この割り算した値の和を文字Cと入力文字距離と
して算出する。照合手段8は読み取りの結果として最も
距離の小さい文字の文字コード15を出力する。
さらに、特徴選択手段6は文字Cと文字C以外のすべて
の文字の対について各特徴の前記累積分離率の加算値を
求めて、これがもっとも大きい値をとる特徴をひとつ選
択し出力する。特徴選択手段6は前記の累積分離率を求
めることと累積分離率の加算値が最も大きい値となる特
徴をひとつ選択して出力することを繰り返し順次特徴を
選択し出力する。特徴辞書7は特1’ri選択手段6の
出力する特徴を格納する。そして、照合手段8は入力さ
れた文字の特徴値とあらかじめ平均値辞書3に格納され
た各認識対象文字の平均値との距離を求めて、最も距離
の小さい文字を認識の結果として出力する。さらに距離
の求め方をある認識対象文字である文字Cと入力された
文字の特徴値10の距離を求める場合を例にとって説明
すると照合手段8は特徴辞書7に格納された選択特徴1
4を参照して文字Cの識別について有効として選択され
た特徴を知りこれらの特徴について入力文字の特徴値1
0と平均値辞書3に格納された各認識対象文字の平均値
11との差の絶対値を求めこれを分散辞の4に格納され
た分散値12で割り算した値をそれぞれの特徴について
求め、この割り算した値の和を文字Cと入力文字距離と
して算出する。照合手段8は読み取りの結果として最も
距離の小さい文字の文字コード15を出力する。
以上のように本実施例によれば、分離率算出手段5で認
識対象文字ごとに各特徴の平均値11と分散値12より
それぞれの認識対象文字の認識性能に直接むすびつく分
離率13を算出し、特徴選択手段6で分離率13より認
識対象文字ごとに各特徴が文字の認識にどれだけ有効で
あるかを算出し認識に有効な特徴を順次選択して文字の
認識に使用する文字認識装置を構成している。
識対象文字ごとに各特徴の平均値11と分散値12より
それぞれの認識対象文字の認識性能に直接むすびつく分
離率13を算出し、特徴選択手段6で分離率13より認
識対象文字ごとに各特徴が文字の認識にどれだけ有効で
あるかを算出し認識に有効な特徴を順次選択して文字の
認識に使用する文字認識装置を構成している。
発明の効果
以上のように本発明は特徴を認識性能に直接むすびつく
選択基準を使用して、認識対象文字ごとにそれぞれの文
字の認識に有効な特徴を選択して文字の認識に使用する
文字認識装置を提供するものである。
選択基準を使用して、認識対象文字ごとにそれぞれの文
字の認識に有効な特徴を選択して文字の認識に使用する
文字認識装置を提供するものである。
第1図は本発明の実施例における文字認識装置のプロ・
シフ図、第2図は特徴値の出現頻度の分布図である。 1・・・・・・観測手段、2・・・・・・特徴抽出手段
、3・・・・・・平均値辞書記憶手段、4・・・・・・
分散値辞書記憶手段、5・・・・・・分離率算出手段、
6・・・・・・特徴選択手段、7・・・・・・特徴辞書
記憶手段、8・・・・・・照合手段、9・・・・・・人
力文字の画像信号、10・・・・・・入力文字の特徴値
、11・・・・・・平均値、12・・・・・・分散値、
13・・・・・・分離率、14・・・・・・選択特徴、
15・・・・・・文字コード。 代理人の氏名 弁理士 中尾敏男 はか1名第1図
シフ図、第2図は特徴値の出現頻度の分布図である。 1・・・・・・観測手段、2・・・・・・特徴抽出手段
、3・・・・・・平均値辞書記憶手段、4・・・・・・
分散値辞書記憶手段、5・・・・・・分離率算出手段、
6・・・・・・特徴選択手段、7・・・・・・特徴辞書
記憶手段、8・・・・・・照合手段、9・・・・・・人
力文字の画像信号、10・・・・・・入力文字の特徴値
、11・・・・・・平均値、12・・・・・・分散値、
13・・・・・・分離率、14・・・・・・選択特徴、
15・・・・・・文字コード。 代理人の氏名 弁理士 中尾敏男 はか1名第1図
Claims (1)
- 紙面上の入力文字を観測し入力文字の画像信号を出力す
る観測手段と、前記観測手段より出力される前記入力文
字の画像信号に応答した入力文字の特徴値を出力する特
徴抽出手段と、認識対象文字ごとに各特徴値の平均値を
格納した平均値辞書と、認識対象文字ごとに各特徴値の
分散値を格納した分散値辞書と、前記平均辞書に格納さ
れた平均値と前記分散値辞書に格納された前記分散値を
参照し認識対象文字対ごとに各特徴によって識別される
確率に対応する分離率を出力する分離率算出手段と、前
記分離率を入力として認識対象文字ごとに文字の認識に
有効な特徴を順次選択し選択特徴として順次出力する特
徴選択手段と、前記特徴選択手段より出力される前記選
択特徴を格納する特徴辞書と、前記特徴辞書に格納され
た前記選択特徴を参照し認識対象文字ごとに選択された
特徴について前記入力文字の特徴値と前記平均値辞書に
格納された前記平均値および前記分散値辞書に格納され
た分散値と照合処理をなし候補文字を選択して候補文字
に対応した文字コードを出力する照合手段とを具備して
なることを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61224450A JPS6379192A (ja) | 1986-09-22 | 1986-09-22 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61224450A JPS6379192A (ja) | 1986-09-22 | 1986-09-22 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6379192A true JPS6379192A (ja) | 1988-04-09 |
Family
ID=16813962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61224450A Pending JPS6379192A (ja) | 1986-09-22 | 1986-09-22 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6379192A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7634140B2 (en) | 2002-02-27 | 2009-12-15 | Nec Corporation | Pattern feature selection method, classification method, judgment method, program, and device |
-
1986
- 1986-09-22 JP JP61224450A patent/JPS6379192A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7634140B2 (en) | 2002-02-27 | 2009-12-15 | Nec Corporation | Pattern feature selection method, classification method, judgment method, program, and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0085545B1 (en) | Pattern recognition apparatus and method for making same | |
EP0109190B1 (en) | Monosyllable recognition apparatus | |
EP0355748A2 (en) | A pattern recognition apparatus and method for doing the same | |
EP0283266A2 (en) | Pattern recognition system | |
JPH0634185B2 (ja) | 入力語認識装置 | |
JPH0981730A (ja) | パターン認識方法及び装置及びコンピュータ制御装置 | |
EP0686933A1 (en) | Method and apparatus for pattern recognition, and method of compiling dictionary for pattern recognition | |
JPS6379192A (ja) | 文字認識装置 | |
JPS60153574A (ja) | 文字読取方法 | |
JPH01321591A (ja) | 文字認識装置 | |
JP2000306045A (ja) | 単語認識装置 | |
JPH0566597B2 (ja) | ||
JPH05314320A (ja) | 認識距離の差と候補順を利用した認識結果の評価方式 | |
JPH024033B2 (ja) | ||
JPS60153575A (ja) | 文字読取方法 | |
JP2755738B2 (ja) | 文字認識装置 | |
JPS6355105B2 (ja) | ||
JPS6379191A (ja) | 文字認識装置 | |
JPS62280985A (ja) | 光学文字読み取り装置 | |
JPH0365586B2 (ja) | ||
JP2851865B2 (ja) | 文字認識装置 | |
JPS62290986A (ja) | 文字認識装置 | |
Chang et al. | OFF-LINE RECOGNITION OF UNCONSTRAINED HANDWRITTEN CHARACTER USING DECISION TREE CLASSIFIER | |
JPH0464077B2 (ja) | ||
JPH07104911B2 (ja) | パタ−ン認識装置 |