JPH0821060B2

JPH0821060B2 - 特徴抽出方法及び特徴抽出装置

Info

Publication number: JPH0821060B2
Application number: JP63014222A
Authority: JP
Inventors: 浩一樋口; 義征山下; 晃治伊東
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1988-01-25
Filing date: 1988-01-25
Publication date: 1996-03-04
Anticipated expiration: 2011-03-04
Also published as: JPH01189785A

Description

【発明の詳細な説明】（産業上の利用分野）この発明は、文字図形の特徴抽出を簡単な手順でしか
も高速に行なうための方法及び装置に関する。

（従来の技術）従来、文字図形認識装置において一般に行なわれる特
徴抽出では、文字図形パタンからストロークを抽出し、
それら抽出されたストロークの位置、長さ、ストローク
間の相互関係等を用いて認識する方法が広く採用されて
いる。その手法は、（１）文字図形の輪郭を追跡するこ
とにより検出された輪郭点系列について曲率を計算し、
その曲率の大きな値の点を分割点として輪郭系列を分割
し、分割された系列を組合せることによりストローク
（パタンの線素）を抽出するか、（２）文字図形パタン
に細線化処理を行なって骨格化し、その骨格化パタンの
連結性及び骨格パタンを追跡して急激な角度の変化点等
を検出してストロークについて幾何学的な特徴等を抽出
して識別を行なっていた。

また、認識対象となる文字の数が少ない場合例えば数
字の認識を行なう場合の方法として、例えば文献Ｉ「電
子計算機入力のための文字・図形の自動認識（電気学会
編）」に開示されるマトリクスマッチング法、スト
ローク・アナリシス法及び幾何学的特徴抽出法があ
る。

（発明が解決しようとする課題）しかしながら、上述した従来の一般的手法である
（１）の方法は文字パタンが大きくなり、又、文字図形
パタンが複雑化すると、その処理量が増大し処理速度の
低下を招いていた。又、（２）の方法は文字図形パタン
細線化する必要があり、細線化によるパタンの歪、ヒゲ
の発生等の問題があり、歪の修正、ヒゲの除去等その後
の処理を複雑なものとしていた。処理が複雑となる結
果、装置構成の規模が大きくなり、また高速な処理が行
なえないという問題点があった。

また、文献Ｉに掲げられるの方法は数字のように10
種程度の文字を認識する場合には処理手順が簡単となる
という利点があるが、印字のしみや欠けなどの雑音に弱
く従って印字品質に影響され易く、さらに印字ずれ、読
取り時の位置決め精度が悪いために生じる文字パタンの
傾き（傾斜）や位置ずれに影響され易いという問題点が
あった。

さらに及びの方法は、文字図形パタンからストロ
ークを抽出する必要があるので、上述した（１）及び
（２）の方法と同様の問題が生じ、従って装置規模が大
きく、また高速な処理が行なえないという問題点があっ
た。

この出願の目的は、上述した従来の問題点を解決する
ため、入力文字図形パタンからストロークを抽出する等
の複雑な処理手順を省略し簡単な処理手順で従って高速
に特徴抽出が行なえ、しかも安定した特徴抽出が行なえ
る方法及び装置を提供することにある。

（課題を解決するための手段）この目的の達成を図るため、この出願の特徴抽出方法
は、特徴抽出対象となる被抽出パタンを含む量子化画像デ
ータの画素にＸ座標及びＹ座標を付与し、Ｘ、Ｙ座標と少なくとも２組の特定のα値及びβ値と
を用いて所定の画素値を有する被抽出パタンの画素に関
する最大及び最小の計算値αＸ＋βＹを検出し、これら
最大及び最小計算値を与える前記被抽出パタンの画素の
Ｘ、Ｙ座標を特徴点座標とし、この特徴点座標に基づき幾何学的特徴量を算出するこ
とによって被抽出パタンの特徴抽出を行なうことを特徴
とする。

さらに、この出願の装置発明は、特徴抽出対象となる被抽出パタンを含む量子化画像デ
ータの画素にＸ座標を付与するためのＸ座標発生手段
と、前記量子化画像データの画素にＹ座標を付与するため
のＹ座標発生手段と、Ｘ、Ｙ座標と少なくとも２組の特定のα値及びβ値と
を用いて所定の画素値を有する被抽出パタンの画素に関
する最大及び最小の計算値αＸ＋βＹを検出し、これら
最大及び最小計算値を与える被抽出パタンの画素のＸ、
Ｙ座標をそれぞれ特徴点座標として出力するための座標
検出手段と、被抽出パタンの特徴抽出を行なうための幾何学的特徴
量を特徴点座標に基づき算出する特徴量算出手段とを備
える。

この装置発明の実施に当り、座標検出手段は、前記計
算値αＸ＋βＹを算出する計算手段と、最大計算値を検
出するための最大値検出手段と、最大計算値を与える画
素のＸ、Ｙ座標を保存するための最大値座標保存手段
と、最小計算値を検出するための最小値検出手段と、最
小計算値を与える画素のＸ、Ｙ座標を保存するための最
小値座標保存手段とを備えた構成とするのが好適であ
る。

（作用）上述した方法及び装置発明によれば、量子化画像デー
タの画素にＸ、Ｙ座標を付与して画像データをＸ−Ｙ座
標系で表現し、所定の画素値を有する被抽出パタンの画
素に関する最大及び最小の計算値αＸ＋βＹを検出し、
検出した最大及び最小計算値を与える画素の座標をそれ
ぞれ特徴点座標とする。そして、特徴点座標に基づき被
抽出パタンの幾何学的特徴量を算出する。

このようにして特徴量を算出する上述の処理手順にお
いては、最大及び最小計算値を検出する手順が非常に簡
単な手順であるので、装置構成の簡素化を図れる。

また上述の処理手順は簡単であるので特徴量の算出を
高速に行なえる。

（実施例）以下、図面を参照して、この出願の方法発明及び装置
発明の実施例につき説明する。尚、図面はこれら発明が
理解出来る程度に概略的に示してあるにすぎず、従って
各構成成分の構成、データ、データの流れ及び数値的条
件は必ずしも図示例に限定されるものではない。

実施例＜装置発明の実施例の構成＞第１図は装置発明の実施例の構成の説明に供する機能
ブロック図である。

同図において、Ｍは特徴抽出対象となる被抽出パタン
を含む量子化画像データを示す。この実施例の特徴抽出
装置は、特徴抽出に適した一単位の画像データＭを出力
する読取処理部８と、画像データＭの画素にＸ座標を付
与するためのＸ座標発生手段10と、画像データＭの画素
にＹ座標を付与するためのＹ座標発生手段12と、前記
Ｘ、Ｙ座標と少なくとも２組の特定のα値及びβ値とを
用いて被抽出パタンの画素に関する最大及び最小の計算
値αＸ＋βＹを検出し、これら最大及び最小計算値を与
える被抽出パタンの画素のＸ、Ｙ座標をそれぞれ特徴点
座標として出力するための座標検出手段14、16と、被抽
出パタンの特徴抽出を行なうための幾何学的特徴量を特
徴点座標に基づき算出する特徴量算出手段18とを備えて
いる。

読取処理部８の構成は、特徴抽出に適した一単位の被
抽出パタンを含む画像データＭを出力するのであれば、
どのような構成としても良い。この実施例では読取処理
部８を、図示せずも、光電変換部及び走査機構（スキャ
ナ）を備える読取部と、原画像データを格納する画像メ
モリと、帳票、原稿等に記載された文字図形パタンの記
載位置情報に基づき通常行なわれる如く原画像データか
ら画像データＭを切出す切出部とを以って構成してい
る。

また、座標検出手段14は、計算値αＸ＋βＹを算出す
る計算手段141と、最大計算値を検出するための最大値
検出手段142と、最大計算値を与える画素のＸ、Ｙ座標
を保存するための最大値座標保存手段143と、最小計算
値を検出するための最小値検出手段144と、最小計算値
を与える画素のＸ、Ｙ座標を保存するための最小値座標
保存手段145とを備えている。座標検出手段16もまたこ
の座標検出手段14と同様、計算手段161と最大値検出手
段162と最大値座標保存手段163と最小値検出手段164と
最小値座標保存手段165とを備えている。

この実施例では、特徴点座標検出のために例えば（α
＝β＝１）及び（α＝１、β＝−１）の二組のα及びβ
値を用いるので２個の座標検出手段14、16を備える構成
となっている。座標検出手段14にあっては計算値Ｘ＋Ｙ
に関する、及び座標検出手段16にあっては計算値Ｘ−Ｙ
に関する、最大及び最小計算値を与える画素の座標を検
出する。

座標検出手段14、16の構成については、例えば、計算
手段141を加算回路を以って、計算手段161は減算回路を
以って、検出手段142、144、162、164をそれぞれ比較器
及びレジスタを以って、さらに座標保存手段143、145、
163、165をそれぞれレジスタを以って構成することが出
来る。このような構成によれば装置構成を非常に簡単化
することが出来、従ってハードウエア規模を小さく出来
る。

また、座標発生手段10、12は座標検出手段14、16に関
し共通に用いるように成してあり、従って各座標検出手
段14、16は座標発生手段10、12から出力されるＸ、Ｙ座
標をそれぞれ入力して特徴点座標の検出を行なう。

尚、座標検出手段の配設個数は特徴量算出のために何
組のα及びβ値を用いるかによって任意好適に変更する
ことが出来、例えばｎ組のα及びβ値を用いる場合、ｎ
個の座標検出手段を備えた構成としα及び又はβ値を座
標検出手段毎に異なる任意好適な値に設定すれば良い。
また、Ｘ座標発生手段及びＹ座標発生手段は、各座標検
出手段に関して共通して用いても良いし、或は各座標検
出手段毎に個別に設けるようにしても良い。装置構成を
簡素化するため、Ｘ及びＹ座標発生手段を共通に用いる
のが良い。

また、読取処理部の構成は、上述の実施例のものに限
定されない。例えば、帳票等に特徴抽出一単位分の文字
図形しか記載されない場合（例えば文字が１文字しか書
かれない場合）に、上述した実施例において画像メモリ
及び切出部を省略した構成としても良い。この場合、帳
票等の読取領域を全面走査して読取処理部から出力され
る画像データを、特徴抽出一単位の被抽出パタンを含む
画像データとして用いれば良い。或は読取処理部を、帳
票等に記載された文字図形の記載位置情報に基づき特徴
抽出一単位分の領域のみを走査するように動作する走査
機構と、光電変換部とからのみ構成するようにしても良
い。この場合、読取領域を部分的に走査して読取処理部
から出力される原画像データを、特徴抽出一単位の被抽
出パタンを含む画像データとして用いれば良い。

また、図中の符号24は後述する文字認識装置の特徴抽
出部に相当する部分である。

＜画像データ＞第２図は被抽出パタンを含む量子化画像データの一例
を示す図である。

同図において、M1は被抽出パタン及びM2は被抽出パタ
ンの背景となる背景パタンを示し、これらパタンM1及び
M2から成る量子化画像データＭが読取処理部８から出力
される。この実施例のパタンM1、M2は、２値のディジタ
ル信号で表現されており、被抽出パタンM1を画素値
「１」の黒ビット及び背景パタンM2を画素値「０」の白
ビットとしている。

画像データＭの画素は、主走査方向（水平右向き方
向）にＸ軸及び副走査方向（垂直下向き方向）にＹ軸を
取り、左上角の画像を原点とするＸ−Ｙ座標系で表現さ
れ、後述するように、画像データＭの画素に対しＸ、Ｙ
座標が付与される。

座標検出手段14、16に入力される画像データＭは、特
徴抽出対象である文字一単位或は図形一単位の被抽出パ
タンM2を含んだデータとなっている。

尚、第２図に示す被抽出パタンM1は、数字の「４」を
示す文字パタン（文字線）であり、この実施例では、特
徴抽出対象の一例としてE13Bフォントの数文字を用い
る。参考のため第３図にE13Bフォントの「１」〜
「９」、「０」の字形を示した。

＜方法発明の実施例の説明、及び装置発明の実施例の動
作の説明＞第４図（Ａ）〜（Ｂ）は方法発明の実施例及び装置発
明の実施例の動作の説明に供する図である。

被抽出パタンに関する最大計算値及び最小計算値を検
出する方法としては、例えば次の或はの方法が考え
られる。計算手段141及び161において画像データＭの
全画素につき計算値を算出し、検出手段142、144及び16
2、164において計算手段141、161から入力された計算値
が被抽出パタンの画素値を有する画素のものであるか否
かを判断し被抽出パタンの画素の計算値についてのみ比
較判定を行なうことによって、被抽出パタンの画素に関
する最小及び最大計算値を検出する、計算手段141及
び161において入力された画素のＸ、Ｙ座標が被抽出パ
タンの画素値を有する画素のものであるか否かを判断し
被抽出パタンの画素についてのみＸ、Ｙ座標から計算値
を算出し、検出手段142、144及び162、164において手段
141、161から入力された全ての計算値の比較判定を行な
うことによって被抽出パタンの画素に関する最小及び最
大計算値を検出する。方法としては前記及びのいず
れでも良いが、以下に述べる実施例では前記の方法に
よって検出を行なう。

I:座標検出手段14に着目した説明＊ステップ（１）〜（３）読取処理部８の読取部が文字図形の記されている帳票
の読取り領域の走査を開始すると（ステップ（１））、
帳票上の文字図形パタンの光信号Ｇが読取処理部８の光
電変換部に入力される。光電変換部は入力された光信号
Ｇを２値の量子化されたディジタル信号に変換し、この
ディジタル信号から成る原画像データを出力する。そし
て、読取処理部８の切出部によって、特徴抽出一単位の
画像データＭが原画像データから切出され出力される。
この画像データＭは画素毎に最大値検出手段142及び最
小値検出手段144に入力される。

これと共に、Ｘ座標発生手段10及びＹ座標発生手段12
は、画像データＭの出力と同期させてこのデータＭのそ
れぞれの画素毎に対応付けたＸ、Ｙ座標を発生する。そ
の結果、これら発生手段10、12によって画像データＭに
Ｘ、Ｙ座標の付与が行なわれる。そして出力されたＸ、
Ｙ座標は計算手段141、最大値座標保存手段143及び最小
値座標保存手段145に入力される。（ステップ（２））計算手段141はＸ、Ｙ座標を入力するとこれらＸ、Ｙ
座標から計算値Ｘ＋Ｙを算出し、算出した計算値を最大
値検出手段142及び最小値検出手段144に対し出力する。
（ステップ（３））ステップ（２）〜（３）によって、最大値検出手段14
2は画像データＭ及び計算値を、最小値検出手段144は画
像データＭ及び計算値を、最大値座標保存手段143は
Ｘ、Ｙ座標を、最小値座標保存手段145はＸ、Ｙ座標
を、それぞれ１画素毎に入力する。そして、座標検出手
段14は後述のステップ（４）、（5a）、（5b）或は
（７）の判断を１画素毎に繰り返し行ない、その判断結
果に応じた動作を行なう。

＊ステップ（４）最大値検出手段142及び最小値検出手段144は入力され
た画像データＭの画素が被抽出パタンM2の画素であるか
否かを判断する。この判断は、入力された画素の画素値
が被抽出パタンM2を意味する所定の画素値（この実施例
では画素値「１」）であるか否かを判断することによっ
て、行なう。

所定の画素値を有さないとき最大値検出手段142及び最小値検出手段144は格納して
いる比較値を書換えず、これと共に最大値座標保存手段
143及び最小値座標保存手段145は格納されているＸ、Ｙ
座標を書換えない。

検出手段142、144はステップ（４）の次にステップ
（７）の判断を行なう。

所定の画素値を有するとき最大値検出手段142はステップ（４）の次に比較値及
び計算値の比較（ステップ（５））を及び、最小値検出
手段144はステップ（４）の次に比較値及び計算値の比
較（ステップ（5b））を行なう。

＊ステップ（5a）計算値が比較値よりも大きいとき最大値検出手段142は先に格納されている比較値に換
えて、比較値よりも大きい計算値を新たな比較値として
格納し（比較値の書換え）、これと共にセットパルスを
最大値座標保存手段143に対し出力する。セットパルス
を入力した最大値座標保存手段143は格納されている
Ｘ、Ｙ座標に換えて、比較値よりも大きな計算値を与え
る画素のＸ、Ｙ座標を新たに格納する（Ｘ、Ｙ座標の書
換え）。（ステップ（６））計算値が比較値よりも小さいか或は比較値と等しいと
き最大値検出手段142は先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
122は格納されているＸ、Ｙ座標を書換えない。

最大値検出手段142は及びのいずれの場合もステ
ップ（5a）の次にステップ（７）の判断を行なう。

尚、最大値検出手段142に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えばα＝β＝１であり画像デー
タＭをｌ行ｍ列の画素に分割した（従って０≦Ｘ≦ｍ−
１、及び０≦Ｙ≦ｌ−１となる）場合には、例えば−１
を比較値の初期値とすることが出来る。或は比較値の初
期値として最大値検出手段142に一番最初に入力された
計算値αＸ＋βＹを用いるようにしても良い。

また最大値検出手段142が比較値及びＸ、Ｙ座標の書
換えを計算値αＸ＋βＹが比較値よりも大きいとき及び
計算値が比較値と等しいときに行なうようにし、これと
共に計算値が比較値よりも小さいとき比較値及びＸ、Ｙ
座標の書換えを行なわないようにしても良い。

また最大値座標保存手段143のＸ、Ｙ座標としては任
意好適な数値を用いて良い。

＊ステップ（5b）計算値が比較値よりも小さいとき最小値検出手段144は先に格納されている比較値に換
えて比較値よりも小さい計算値を比較値として新たに格
納する（比較値の書換え）と共に、最小値座標保存手段
145に対しセットパルスを出力する。最小値座標保存手
段145はセットパルスを入力すると、格納されている
Ｘ、Ｙ座標を比較値よりも小さな計算値を与える画素の
Ｘ、Ｙ座標に書換える（Ｘ、Ｙ座標の書換え）。（ステ
ップ（６））最小値検出手段144は及びのいずれの場合にもス
テップ（5b）の次にステップ（７）の判断を行なう。

尚、最小値検出手段144に格納される比較値の初期値
としては、例えば計算値αＸ＋βＹとして取り得る値よ
りも大きな値を用いれば良い。例えばα＝β＝１であり
画像データＭをｌ行ｍ列の画素に分割した（従って０≦
Ｘ≦ｍ−１、及び０≦Ｙ≦ｌ−１となる）場合には、例
えばｍ＋ｎ−１を比較値の初期値とすることが出来る。
或は比較値の初期値として最小値検出手段144に一番最
初に入力された計算値αＸ＋βＹを用いるようにしても
良い。

また最小値検出手段144は計算値が比較値よりも小さ
いとき及び計算値が比較値と等しいとき比較値及びＸ、
Ｙ座標の書換えを行ない、これと共に計算値が比較値よ
りも大きいとき比較値及びＸ、Ｙ座標の書換えを行なわ
ないようにしても良い。

また最小値座標保存手段145のＸ、Ｙ座標としては任
意好適な数値を用いて良い。

＊ステップ（７）画像データＭの走査を終了したとき最大値検出終了142及び最小値座標保存手段144は画像
データＭの走査が終了しデータＭの全ての画素につき処
理が終了すると、Ｘ、Ｙ座標の出力信号を最大値座標保
存手段143及び最小値座標保存手段145に対して出力す
る。この出力信号を入力した座標保存手段143、145は、
格納しているＸ、Ｙ座標を特徴点座標として出力する。
これと共に検出手段142、144は比較値の初期化を行な
う。（ステップ（８））全ての画素につき処理を終了した時点で、最大値座標
保存手段143及び最小値座標保存手段145に格納されてい
るＸ、Ｙ座標が最大及び最小計算値を与える画素のＸ、
Ｙ座標すなわち特徴点座標となる。

座標検出手段14にあってはα＝β＝１としたので、全
処理終了時点で例えば第２図に示す被抽出パタンM2の特
徴点BRの座標が最大値座標保存手段143に格納されてお
り、また特徴点TLの座標が最小座標保存手段145に格納
されている。

画像データＭの走査が終了しないとき座標検出手段14は、画像データＭの走査が終了せず従
ってデータＭの全ての画素につき処理が終了していなけ
れば、画像データＭの残りの画素につきステップ
（４）、（5a）、（5b）或は（７）の判断を行ない、そ
の判断結果に応じて動作する。

II:座標検出手段16に着目した説明座標検出手段16は、上述した座標検出手段14の動作と
並行して座標検出手段14と同様の動作を行なうので、こ
の検出手段16の動作説明を省略する。

座標検出手段16にあっては、α＝１及びβ＝−１とし
たので、全ての画素につき処理を終了した時点で、例え
ば第２図に示す被抽出パタンM2の特徴点TRの座標が最大
値座標保存手段163に格納されており、また特徴点BLの
座標が最小値座標保存手段165に格納されている。

III:特徴量算出手段18に着目した説明特徴量算出手段18は、特徴点BR、TL、TR、BLの座標を
読出し、これら特徴点座標に基づき幾何学的特徴量DT、
DB、DR、DLを算出する。これら特徴量はそれぞれ特徴点
間の距離を表すものであり、式（１）〜（４）に従って
算出することが出来る。尚、式（１）〜（４）において
特徴点BR、TL、TR、BLのＸ座標をBRX、TLX、TRX、BLXと
して及びＹ座標をBRY、TLY、TRY、BLYとしてそれぞれ表
す。

特徴量算出手段18は上式（１）〜（４）に従って特徴
量を算出すると、算出した特徴量DT、DB、DR、DLを出力
する。

IV:特徴点座標検出の原理的説明第５図は特徴点座標検出の原理的説明に供する図であ
る。以下、第５図を参照して説明するが、この説明で
は、特徴抽出対象となる被抽出パタンM2を矩形パタンと
する。この場合、特徴点は被抽出パタンM2の角点TL、T
R、BL、BRとなる。

特徴点座標検出のため、まず、画像データＭ上におい
て被抽出パタンM2を通過する直線αＸ＋βＹを想定し、
傾きが一定値に固定されＣの値が種々の値となる直線群
αＸ＋βＹ＝Ｃを考える。すると、被抽出パタンM2を通
過する直線を見出すことが出来、このとき特徴点となる
角点を通過する直線のＣの値は直線群中、最小の値或は
最大の値となる。

従って、被抽出パタンM2の各画素につきＣの値すなわ
ち計算値αＸ＋βＹを算出し、計算値αＸ＋βＹが最大
或は最小となる画素のＸ、Ｙ座標を特徴点の座標とすれ
ば良いことが理解出来る。矩形パタンの場合であれば、
一組の特定のα及びβ値を用いることによって２つの角
点（特徴点）を検出することが出来る。

例えばα＝β＝１として被抽出パタンM2の領域を通過
する直線群L:X＋Ｙ＝C₁を考え、C₁の値をより小さくし
てゆくと特徴点TLを通過する直線L₁が得られることが理
解出来る。またC₁の値が最小となるとき特徴点TLを通過
する直線L₁が得られる。またC₁の値をより大きくしてゆ
くと特徴点BRにより近い直線が得られC₁の値が最大とな
るとき特徴点BRを通過する直線L_nが得られる。従って、
被抽出パタンM2の画素のなかで計算値Ｘ＋Ｙの最小値を
与える画素の座標が特徴点TLの及び最大値を与える画素
の座標が特徴点BRの座標となることが理解出来る。

同様にして、例えばα＝１及びβ＝−１として被抽出
パタンM2の領域を通過する直線群K:X−Ｙ＝C₂を考える
と、C₂の値が最小となるとき特徴点BLを通過する直線K_m
が及びC₂の値が最大となるとき特徴点TRを通過する直線
K₁が得られる。従って、被抽出パタンM2の画素のなかで
計算値Ｘ−Ｙの最小値を与える画素の座標が特徴点BLの
及び最大値を与える画素の座標が特徴点TRの座標とな
る。

＜文字認識装置＞次に、この出願の方法発明及び装置発明の理解を深め
るため、上述した方法及び装置発明の実施例を文字認識
装置に適用した例につき説明する。

第６図は文字認識装置の一構成例を示す機能ブロック
図である。同図に示す文字認識装置は、読取部20と、画
像メモリ21と、切出部22と、被抽出パタンに関する幾何
学的特徴量を出力する特徴抽出部24と（第１図参照）、
標準パタンに関する幾何学的特徴量を収める辞書26と、
標準パタン及び被抽出パタンに関する幾何学的特徴量に
基づき認識結果を出力する識別部28とを備えた構成を有
する。この文字認識装置の読取部20は光電変換部20a及
び走査機構（図示せず）を備えている。

このような構成の文字認識装置にあっては、読取部20
が、帳票等を走査して得られる光信号Ｇを量子化された
ディジタル信号に変換し、このディジタル信号から成る
原画像データを出力する。

出力された原画像データは画像メモリ21に格納され、
切出部22は帳票上の文字の記載位置の情報に基づき画像
メモリ21の原画像データから画像データＭを切り出し、
この切出した画像データＭを１画素毎に特徴抽出部24に
対し出力する。特徴抽出部24は画像データＭを入力する
と、既に説明したようにして、被抽出パタンの幾何学的
特徴量DT、DB、DR、DLを算出しこれら特徴量を識別部28
に対し出力する。

ところで、辞書26は予め用意された標準パタンの標準
特徴量JT、JB、JR及びJRを格納している。これら幾何学
的特徴量JT、JB、JR、JLは、被抽出パタンの特徴量と同
様、検出された特徴点の間の距離を表すものであり、JT
はDTに、JBはDBに、JRはDRに及びJLはDLに対応する特徴
量である。

識別部28は、特徴抽出部28からの特徴量DT、DB、DR、
DLと辞書26の特徴量JT、JB、JR、JLとを照合する。この
照合のため、認識部28は次式（５）に基づき距離Ｄを算
出し、距離Ｄが最も小さくなる標準特徴量を検出する。
そして、最も小さな距離Ｄを与える標準特徴量を有する
標準パタンの文字名を、文字名出力（認識結果）として
出力する。

尚、上述の装置において、文字の標準パタンに関する
標準特徴量に換えて或は加えて図形の標準パタンに関す
る標準特徴量を辞書26に格納すれば、図形認識装置或は
文字図形認識装置を構成することが出来る。文字及び図
形の標準パタンのための辞書はそれぞれ個別の辞書とし
ても良いし或は共通の１個の辞書としても良い。この出
願の方法及び装置発明は従来提案されている種々の文字
及び又は図形認識装置に適用及び応用することが出来
る。

この出願の方法発明及び装置発明は上述した実施例に
のみ限定されるものではなく、任意好適に変更或は変形
することが出来る。

例えば、特徴抽出のための画像データＭとして２値に
処理されたデータのみならず、多値処理されたデータを
用いても良い。多値処理された画像データから特定色の
文字図形パタンの特徴抽出や特定範囲の濃度を有する文
字図形パタンの特徴抽出を行なうことが出来る。特定色
の文字図形パタンの場合には、特定の色を有する画素で
あることを意味する画素値の画素に着目し、この画素に
関する最大及び最小計算値を求めることによって、特徴
点座標を検出出来る。また特定範囲の濃度を有する文字
図形パタンの場合には、特定濃度範囲の画素値を有する
画素に着目して、この画素に関する最大及び最小値を求
めることによって、特徴点座標を検出することが出来
る。

また上述した実施例では、２組のα及びβを用い従っ
て傾きが異なる２つの直線群Ｌ、Ｋを用いて特徴点座標
を検出した場合につき説明したが、例えばほぼ多角形形
状（ほぼｎ角形形状）の図形パタンに関する特徴点座標
を検出する場合など、３組以上のα及びβを用い従って
傾きが異なる３つ以上の直線群を用いて特徴点座標の検
出を行なうようにしても良い。この場合、それぞれの組
のα及びβ値に関し上述と同様の原理に従って最大及び
最小計算値を求め、これら最大及び最小計算値を与える
画素の座標から文字図形パタンの幾何学的特徴量を求め
ることが出来る。この場合の装置構成は、座標検出手段
の配設個数を、特徴点座標検出のために用いるα及びβ
値の組の個数と同数とする他は、上述した実施例と同様
の構成とすれば良い。

また幾何学的特徴量として、検出された特徴点の座標
をもとにして得られる種々の幾何学的特徴量を用いるこ
とが出来る。上述した特徴点間の距離以外の幾何学的特
徴量を例示すれば、例えば、特徴点を結ぶ直線の傾き
や、特徴点を結んで得られる三角形、四角形等の多角形
領域の面積その他を挙げることが出来る。そして、これ
ら種々の幾何学的特徴量を単独で或は種々に組み合せて
文字パタンや図形パタンの認識のために用いることが出
来る。

また所定の画素値を有する画素に関する最大及び最小
計算値を算出するための手順（アルゴリズム）は上述し
た実施例にのみ限定されず、最大及び最小値を求めるた
めに従来より用いられている任意好適な手順を用いても
良い。

またこの出願の方法及び装置発明は、特に字形の簡単
な文字例えばE13Bフォントの数字を認識対象とする文字
認識装置に適用して好適であり、この場合に小型で処理
速度の速い文字認識装置を実現することが出来る。ま
た、これら方法及び装置発明は文字認識装置、図形認識
装置その他の画像処理装置に広く適用して良い。

（発明の効果）上述した説明からも明らかなように、この出願の特徴
抽出方法及び特徴抽出装置によれば、量子化画像データ
の画素にＸ、Ｙ座標を付与して画像データをＸ−Ｙ座標
系で表現し、所定の画素値を有する被抽出パタンの画素
に関する最大及び最小の計算値αＸ＋βＹを検出し、こ
れら最大及び最小計算値を与える画素の座標をそれぞれ
特徴点座標とする。そして、特徴点座標に基づき被抽出
パタンの幾何学的特徴量を算出する。

このようにして特徴量を算出する上述の処理手順にあ
っては、最大及び最小計算値を検出する手順が非常に簡
単な手順であるので、装置構成の簡素化を図れ、ハード
ウェアの規模縮小化を実現出来るという利点がある。

また最大及び最小計算値を検出する処理手順は簡単で
あるので特徴量の算出を高速に行なえるという利点があ
る。特に読取処理部が画像メモリを有する場合には、特
徴点座標を画像メモリの一回の走査で検出することが出
来るので、高速化を効果的に図れる。

また最大及び最小計算値を与える画素の座標を特徴点
座標とするので、従来のマトリクス・マッチング法と比
較して帳票、原稿等の傾きや、被抽出パタンの欠けに影
響されにくい安定した特徴量を得られるという利点があ
る。

【図面の簡単な説明】

第１図は装置発明の実施例の説明に供する機能ブロック
図、第２図は特徴抽出のために用いる量子化画像データの一
例を示す図、第３図は特徴抽出対象となる文字パタンの一例を示す
図、第４図（Ａ）〜（Ｂ）は方法発明及び装置発明の実施例
の説明に供する動作流れ図、第５図は特徴点座標検出の原理的説明に供する図、第６図は方法発明及び装置発明の実施例を適用例として
示す文字認識装置の機能ブロック図である。８…読取処理部、10…Ｘ座標発生手段 12…Ｙ座標発生手段、14、16…座標検出手段 141、161…計算手段 142、162…最大値検出手段 143、163…最大値座標保存手段 144、164…最小値検出手段 145、165…最小値座標保存手段 18…特徴量算出手段。

Claims

【特許請求の範囲】

【請求項１】特徴抽出対象となる被抽出パタンを含む量
子化画像データの画素にＸ座標及びＹ座標を付与し、前記Ｘ、Ｙ座標と少なくとも２組の特定のα値及びβ値
とを用いて所定の画素値を有する前記被抽出パタンの画
素に関する最大及び最小の計算値αＸ＋βＹを検出し、
これら最大及び最小計算値を与える前記被抽出パタンの
画素のＸ、Ｙ座標を特徴点座標とし、該特徴点座標に基づき幾何学的特徴量を算出することに
よって前記被抽出パタンの特徴抽出を行なうことを特徴
とする特徴抽出方法。
【請求項２】特徴抽出対象となる被抽出パタンを含む量
子化画像データの画素にＸ座標を付与するためのＸ座標
発生手段と、前記量子化画像データの画素にＹ座標を付与するための
Ｙ座標発生手段と、前記Ｘ、Ｙ座標と少なくとも２組の特定のα値及びβ値
とを用いて所定の画素値を有する前記被抽出パタンの画
素に関する最大及び最小の計算値αＸ＋βＹを検出し、
これら最大及び最小計算値を与える前記被抽出パタンの
画素のＸ、Ｙ座標をそれぞれ特徴点座標として出力する
ための座標検出手段と、前記被抽出パタンの特徴抽出を行なうための幾何学的特
徴量を前記特徴点座標に基づき算出する特徴量算出手段
とを備えて成ることを特徴とする特徴抽出装置。
【請求項３】前記座標検出手段は、前記計算値αＸ＋β
Ｙを算出する計算手段と、前記最大計算値を検出するた
めの最大値検出手段と、前記最大計算値を与える画素の
Ｘ、Ｙ座標を保存するための最大値座標保存手段と、前
記最小計算値を検出するための最小値検出手段と、前記
最小計算値を与える画素のＸ、Ｙ座標を保存するための
最小値座標保存手段とを備えて成ることを特徴とする請
求項２に記載の特徴抽出装置。