JPH0821060B2 - 特徴抽出方法及び特徴抽出装置 - Google Patents

特徴抽出方法及び特徴抽出装置

Info

Publication number
JPH0821060B2
JPH0821060B2 JP63014222A JP1422288A JPH0821060B2 JP H0821060 B2 JPH0821060 B2 JP H0821060B2 JP 63014222 A JP63014222 A JP 63014222A JP 1422288 A JP1422288 A JP 1422288A JP H0821060 B2 JPH0821060 B2 JP H0821060B2
Authority
JP
Japan
Prior art keywords
value
coordinates
coordinate
maximum
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63014222A
Other languages
English (en)
Other versions
JPH01189785A (ja
Inventor
浩一 樋口
義征 山下
晃治 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63014222A priority Critical patent/JPH0821060B2/ja
Publication of JPH01189785A publication Critical patent/JPH01189785A/ja
Publication of JPH0821060B2 publication Critical patent/JPH0821060B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字図形の特徴抽出を簡単な手順でしか
も高速に行なうための方法及び装置に関する。
(従来の技術) 従来、文字図形認識装置において一般に行なわれる特
徴抽出では、文字図形パタンからストロークを抽出し、
それら抽出されたストロークの位置、長さ、ストローク
間の相互関係等を用いて認識する方法が広く採用されて
いる。その手法は、(1)文字図形の輪郭を追跡するこ
とにより検出された輪郭点系列について曲率を計算し、
その曲率の大きな値の点を分割点として輪郭系列を分割
し、分割された系列を組合せることによりストローク
(パタンの線素)を抽出するか、(2)文字図形パタン
に細線化処理を行なって骨格化し、その骨格化パタンの
連結性及び骨格パタンを追跡して急激な角度の変化点等
を検出してストロークについて幾何学的な特徴等を抽出
して識別を行なっていた。
また、認識対象となる文字の数が少ない場合例えば数
字の認識を行なう場合の方法として、例えば文献I「電
子計算機入力のための文字・図形の自動認識(電気学会
編)」に開示されるマトリクスマッチング法、スト
ローク・アナリシス法及び幾何学的特徴抽出法があ
る。
(発明が解決しようとする課題) しかしながら、上述した従来の一般的手法である
(1)の方法は文字パタンが大きくなり、又、文字図形
パタンが複雑化すると、その処理量が増大し処理速度の
低下を招いていた。又、(2)の方法は文字図形パタン
細線化する必要があり、細線化によるパタンの歪、ヒゲ
の発生等の問題があり、歪の修正、ヒゲの除去等その後
の処理を複雑なものとしていた。処理が複雑となる結
果、装置構成の規模が大きくなり、また高速な処理が行
なえないという問題点があった。
また、文献Iに掲げられるの方法は数字のように10
種程度の文字を認識する場合には処理手順が簡単となる
という利点があるが、印字のしみや欠けなどの雑音に弱
く従って印字品質に影響され易く、さらに印字ずれ、読
取り時の位置決め精度が悪いために生じる文字パタンの
傾き(傾斜)や位置ずれに影響され易いという問題点が
あった。
さらに及びの方法は、文字図形パタンからストロ
ークを抽出する必要があるので、上述した(1)及び
(2)の方法と同様の問題が生じ、従って装置規模が大
きく、また高速な処理が行なえないという問題点があっ
た。
この出願の目的は、上述した従来の問題点を解決する
ため、入力文字図形パタンからストロークを抽出する等
の複雑な処理手順を省略し簡単な処理手順で従って高速
に特徴抽出が行なえ、しかも安定した特徴抽出が行なえ
る方法及び装置を提供することにある。
(課題を解決するための手段) この目的の達成を図るため、この出願の特徴抽出方法
は、 特徴抽出対象となる被抽出パタンを含む量子化画像デ
ータの画素にX座標及びY座標を付与し、 X、Y座標と少なくとも2組の特定のα値及びβ値と
を用いて所定の画素値を有する被抽出パタンの画素に関
する最大及び最小の計算値αX+βYを検出し、これら
最大及び最小計算値を与える前記被抽出パタンの画素の
X、Y座標を特徴点座標とし、 この特徴点座標に基づき幾何学的特徴量を算出するこ
とによって被抽出パタンの特徴抽出を行なうことを特徴
とする。
さらに、この出願の装置発明は、 特徴抽出対象となる被抽出パタンを含む量子化画像デ
ータの画素にX座標を付与するためのX座標発生手段
と、 前記量子化画像データの画素にY座標を付与するため
のY座標発生手段と、 X、Y座標と少なくとも2組の特定のα値及びβ値と
を用いて所定の画素値を有する被抽出パタンの画素に関
する最大及び最小の計算値αX+βYを検出し、これら
最大及び最小計算値を与える被抽出パタンの画素のX、
Y座標をそれぞれ特徴点座標として出力するための座標
検出手段と、 被抽出パタンの特徴抽出を行なうための幾何学的特徴
量を特徴点座標に基づき算出する特徴量算出手段とを備
える。
この装置発明の実施に当り、座標検出手段は、前記計
算値αX+βYを算出する計算手段と、最大計算値を検
出するための最大値検出手段と、最大計算値を与える画
素のX、Y座標を保存するための最大値座標保存手段
と、最小計算値を検出するための最小値検出手段と、最
小計算値を与える画素のX、Y座標を保存するための最
小値座標保存手段とを備えた構成とするのが好適であ
る。
(作用) 上述した方法及び装置発明によれば、量子化画像デー
タの画素にX、Y座標を付与して画像データをX−Y座
標系で表現し、所定の画素値を有する被抽出パタンの画
素に関する最大及び最小の計算値αX+βYを検出し、
検出した最大及び最小計算値を与える画素の座標をそれ
ぞれ特徴点座標とする。そして、特徴点座標に基づき被
抽出パタンの幾何学的特徴量を算出する。
このようにして特徴量を算出する上述の処理手順にお
いては、最大及び最小計算値を検出する手順が非常に簡
単な手順であるので、装置構成の簡素化を図れる。
また上述の処理手順は簡単であるので特徴量の算出を
高速に行なえる。
(実施例) 以下、図面を参照して、この出願の方法発明及び装置
発明の実施例につき説明する。尚、図面はこれら発明が
理解出来る程度に概略的に示してあるにすぎず、従って
各構成成分の構成、データ、データの流れ及び数値的条
件は必ずしも図示例に限定されるものではない。
実施例 <装置発明の実施例の構成> 第1図は装置発明の実施例の構成の説明に供する機能
ブロック図である。
同図において、Mは特徴抽出対象となる被抽出パタン
を含む量子化画像データを示す。この実施例の特徴抽出
装置は、特徴抽出に適した一単位の画像データMを出力
する読取処理部8と、画像データMの画素にX座標を付
与するためのX座標発生手段10と、画像データMの画素
にY座標を付与するためのY座標発生手段12と、前記
X、Y座標と少なくとも2組の特定のα値及びβ値とを
用いて被抽出パタンの画素に関する最大及び最小の計算
値αX+βYを検出し、これら最大及び最小計算値を与
える被抽出パタンの画素のX、Y座標をそれぞれ特徴点
座標として出力するための座標検出手段14、16と、被抽
出パタンの特徴抽出を行なうための幾何学的特徴量を特
徴点座標に基づき算出する特徴量算出手段18とを備えて
いる。
読取処理部8の構成は、特徴抽出に適した一単位の被
抽出パタンを含む画像データMを出力するのであれば、
どのような構成としても良い。この実施例では読取処理
部8を、図示せずも、光電変換部及び走査機構(スキャ
ナ)を備える読取部と、原画像データを格納する画像メ
モリと、帳票、原稿等に記載された文字図形パタンの記
載位置情報に基づき通常行なわれる如く原画像データか
ら画像データMを切出す切出部とを以って構成してい
る。
また、座標検出手段14は、計算値αX+βYを算出す
る計算手段141と、最大計算値を検出するための最大値
検出手段142と、最大計算値を与える画素のX、Y座標
を保存するための最大値座標保存手段143と、最小計算
値を検出するための最小値検出手段144と、最小計算値
を与える画素のX、Y座標を保存するための最小値座標
保存手段145とを備えている。座標検出手段16もまたこ
の座標検出手段14と同様、計算手段161と最大値検出手
段162と最大値座標保存手段163と最小値検出手段164と
最小値座標保存手段165とを備えている。
この実施例では、特徴点座標検出のために例えば(α
=β=1)及び(α=1、β=−1)の二組のα及びβ
値を用いるので2個の座標検出手段14、16を備える構成
となっている。座標検出手段14にあっては計算値X+Y
に関する、及び座標検出手段16にあっては計算値X−Y
に関する、最大及び最小計算値を与える画素の座標を検
出する。
座標検出手段14、16の構成については、例えば、計算
手段141を加算回路を以って、計算手段161は減算回路を
以って、検出手段142、144、162、164をそれぞれ比較器
及びレジスタを以って、さらに座標保存手段143、145、
163、165をそれぞれレジスタを以って構成することが出
来る。このような構成によれば装置構成を非常に簡単化
することが出来、従ってハードウエア規模を小さく出来
る。
また、座標発生手段10、12は座標検出手段14、16に関
し共通に用いるように成してあり、従って各座標検出手
段14、16は座標発生手段10、12から出力されるX、Y座
標をそれぞれ入力して特徴点座標の検出を行なう。
尚、座標検出手段の配設個数は特徴量算出のために何
組のα及びβ値を用いるかによって任意好適に変更する
ことが出来、例えばn組のα及びβ値を用いる場合、n
個の座標検出手段を備えた構成としα及び又はβ値を座
標検出手段毎に異なる任意好適な値に設定すれば良い。
また、X座標発生手段及びY座標発生手段は、各座標検
出手段に関して共通して用いても良いし、或は各座標検
出手段毎に個別に設けるようにしても良い。装置構成を
簡素化するため、X及びY座標発生手段を共通に用いる
のが良い。
また、読取処理部の構成は、上述の実施例のものに限
定されない。例えば、帳票等に特徴抽出一単位分の文字
図形しか記載されない場合(例えば文字が1文字しか書
かれない場合)に、上述した実施例において画像メモリ
及び切出部を省略した構成としても良い。この場合、帳
票等の読取領域を全面走査して読取処理部から出力され
る画像データを、特徴抽出一単位の被抽出パタンを含む
画像データとして用いれば良い。或は読取処理部を、帳
票等に記載された文字図形の記載位置情報に基づき特徴
抽出一単位分の領域のみを走査するように動作する走査
機構と、光電変換部とからのみ構成するようにしても良
い。この場合、読取領域を部分的に走査して読取処理部
から出力される原画像データを、特徴抽出一単位の被抽
出パタンを含む画像データとして用いれば良い。
また、図中の符号24は後述する文字認識装置の特徴抽
出部に相当する部分である。
<画像データ> 第2図は被抽出パタンを含む量子化画像データの一例
を示す図である。
同図において、M1は被抽出パタン及びM2は被抽出パタ
ンの背景となる背景パタンを示し、これらパタンM1及び
M2から成る量子化画像データMが読取処理部8から出力
される。この実施例のパタンM1、M2は、2値のディジタ
ル信号で表現されており、被抽出パタンM1を画素値
「1」の黒ビット及び背景パタンM2を画素値「0」の白
ビットとしている。
画像データMの画素は、主走査方向(水平右向き方
向)にX軸及び副走査方向(垂直下向き方向)にY軸を
取り、左上角の画像を原点とするX−Y座標系で表現さ
れ、後述するように、画像データMの画素に対しX、Y
座標が付与される。
座標検出手段14、16に入力される画像データMは、特
徴抽出対象である文字一単位或は図形一単位の被抽出パ
タンM2を含んだデータとなっている。
尚、第2図に示す被抽出パタンM1は、数字の「4」を
示す文字パタン(文字線)であり、この実施例では、特
徴抽出対象の一例としてE13Bフォントの数文字を用い
る。参考のため第3図にE13Bフォントの「1」〜
「9」、「0」の字形を示した。
<方法発明の実施例の説明、及び装置発明の実施例の動
作の説明> 第4図(A)〜(B)は方法発明の実施例及び装置発
明の実施例の動作の説明に供する図である。
被抽出パタンに関する最大計算値及び最小計算値を検
出する方法としては、例えば次の或はの方法が考え
られる。計算手段141及び161において画像データMの
全画素につき計算値を算出し、検出手段142、144及び16
2、164において計算手段141、161から入力された計算値
が被抽出パタンの画素値を有する画素のものであるか否
かを判断し被抽出パタンの画素の計算値についてのみ比
較判定を行なうことによって、被抽出パタンの画素に関
する最小及び最大計算値を検出する、計算手段141及
び161において入力された画素のX、Y座標が被抽出パ
タンの画素値を有する画素のものであるか否かを判断し
被抽出パタンの画素についてのみX、Y座標から計算値
を算出し、検出手段142、144及び162、164において手段
141、161から入力された全ての計算値の比較判定を行な
うことによって被抽出パタンの画素に関する最小及び最
大計算値を検出する。方法としては前記及びのいず
れでも良いが、以下に述べる実施例では前記の方法に
よって検出を行なう。
I:座標検出手段14に着目した説明 *ステップ(1)〜(3) 読取処理部8の読取部が文字図形の記されている帳票
の読取り領域の走査を開始すると(ステップ(1))、
帳票上の文字図形パタンの光信号Gが読取処理部8の光
電変換部に入力される。光電変換部は入力された光信号
Gを2値の量子化されたディジタル信号に変換し、この
ディジタル信号から成る原画像データを出力する。そし
て、読取処理部8の切出部によって、特徴抽出一単位の
画像データMが原画像データから切出され出力される。
この画像データMは画素毎に最大値検出手段142及び最
小値検出手段144に入力される。
これと共に、X座標発生手段10及びY座標発生手段12
は、画像データMの出力と同期させてこのデータMのそ
れぞれの画素毎に対応付けたX、Y座標を発生する。そ
の結果、これら発生手段10、12によって画像データMに
X、Y座標の付与が行なわれる。そして出力されたX、
Y座標は計算手段141、最大値座標保存手段143及び最小
値座標保存手段145に入力される。(ステップ(2)) 計算手段141はX、Y座標を入力するとこれらX、Y
座標から計算値X+Yを算出し、算出した計算値を最大
値検出手段142及び最小値検出手段144に対し出力する。
(ステップ(3)) ステップ(2)〜(3)によって、最大値検出手段14
2は画像データM及び計算値を、最小値検出手段144は画
像データM及び計算値を、最大値座標保存手段143は
X、Y座標を、最小値座標保存手段145はX、Y座標
を、それぞれ1画素毎に入力する。そして、座標検出手
段14は後述のステップ(4)、(5a)、(5b)或は
(7)の判断を1画素毎に繰り返し行ない、その判断結
果に応じた動作を行なう。
*ステップ(4) 最大値検出手段142及び最小値検出手段144は入力され
た画像データMの画素が被抽出パタンM2の画素であるか
否かを判断する。この判断は、入力された画素の画素値
が被抽出パタンM2を意味する所定の画素値(この実施例
では画素値「1」)であるか否かを判断することによっ
て、行なう。
所定の画素値を有さないとき 最大値検出手段142及び最小値検出手段144は格納して
いる比較値を書換えず、これと共に最大値座標保存手段
143及び最小値座標保存手段145は格納されているX、Y
座標を書換えない。
検出手段142、144はステップ(4)の次にステップ
(7)の判断を行なう。
所定の画素値を有するとき 最大値検出手段142はステップ(4)の次に比較値及
び計算値の比較(ステップ(5))を及び、最小値検出
手段144はステップ(4)の次に比較値及び計算値の比
較(ステップ(5b))を行なう。
*ステップ(5a) 計算値が比較値よりも大きいとき 最大値検出手段142は先に格納されている比較値に換
えて、比較値よりも大きい計算値を新たな比較値として
格納し(比較値の書換え)、これと共にセットパルスを
最大値座標保存手段143に対し出力する。セットパルス
を入力した最大値座標保存手段143は格納されている
X、Y座標に換えて、比較値よりも大きな計算値を与え
る画素のX、Y座標を新たに格納する(X、Y座標の書
換え)。(ステップ(6)) 計算値が比較値よりも小さいか或は比較値と等しいと
き 最大値検出手段142は先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
122は格納されているX、Y座標を書換えない。
最大値検出手段142は及びのいずれの場合もステ
ップ(5a)の次にステップ(7)の判断を行なう。
尚、最大値検出手段142に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えばα=β=1であり画像デー
タMをl行m列の画素に分割した(従って0≦X≦m−
1、及び0≦Y≦l−1となる)場合には、例えば−1
を比較値の初期値とすることが出来る。或は比較値の初
期値として最大値検出手段142に一番最初に入力された
計算値αX+βYを用いるようにしても良い。
また最大値検出手段142が比較値及びX、Y座標の書
換えを計算値αX+βYが比較値よりも大きいとき及び
計算値が比較値と等しいときに行なうようにし、これと
共に計算値が比較値よりも小さいとき比較値及びX、Y
座標の書換えを行なわないようにしても良い。
また最大値座標保存手段143のX、Y座標としては任
意好適な数値を用いて良い。
*ステップ(5b) 計算値が比較値よりも小さいとき 最小値検出手段144は先に格納されている比較値に換
えて比較値よりも小さい計算値を比較値として新たに格
納する(比較値の書換え)と共に、最小値座標保存手段
145に対しセットパルスを出力する。最小値座標保存手
段145はセットパルスを入力すると、格納されている
X、Y座標を比較値よりも小さな計算値を与える画素の
X、Y座標に書換える(X、Y座標の書換え)。(ステ
ップ(6)) 最小値検出手段144は及びのいずれの場合にもス
テップ(5b)の次にステップ(7)の判断を行なう。
尚、最小値検出手段144に格納される比較値の初期値
としては、例えば計算値αX+βYとして取り得る値よ
りも大きな値を用いれば良い。例えばα=β=1であり
画像データMをl行m列の画素に分割した(従って0≦
X≦m−1、及び0≦Y≦l−1となる)場合には、例
えばm+n−1を比較値の初期値とすることが出来る。
或は比較値の初期値として最小値検出手段144に一番最
初に入力された計算値αX+βYを用いるようにしても
良い。
また最小値検出手段144は計算値が比較値よりも小さ
いとき及び計算値が比較値と等しいとき比較値及びX、
Y座標の書換えを行ない、これと共に計算値が比較値よ
りも大きいとき比較値及びX、Y座標の書換えを行なわ
ないようにしても良い。
また最小値座標保存手段145のX、Y座標としては任
意好適な数値を用いて良い。
*ステップ(7) 画像データMの走査を終了したとき 最大値検出終了142及び最小値座標保存手段144は画像
データMの走査が終了しデータMの全ての画素につき処
理が終了すると、X、Y座標の出力信号を最大値座標保
存手段143及び最小値座標保存手段145に対して出力す
る。この出力信号を入力した座標保存手段143、145は、
格納しているX、Y座標を特徴点座標として出力する。
これと共に検出手段142、144は比較値の初期化を行な
う。(ステップ(8)) 全ての画素につき処理を終了した時点で、最大値座標
保存手段143及び最小値座標保存手段145に格納されてい
るX、Y座標が最大及び最小計算値を与える画素のX、
Y座標すなわち特徴点座標となる。
座標検出手段14にあってはα=β=1としたので、全
処理終了時点で例えば第2図に示す被抽出パタンM2の特
徴点BRの座標が最大値座標保存手段143に格納されてお
り、また特徴点TLの座標が最小座標保存手段145に格納
されている。
画像データMの走査が終了しないとき 座標検出手段14は、画像データMの走査が終了せず従
ってデータMの全ての画素につき処理が終了していなけ
れば、画像データMの残りの画素につきステップ
(4)、(5a)、(5b)或は(7)の判断を行ない、そ
の判断結果に応じて動作する。
II:座標検出手段16に着目した説明 座標検出手段16は、上述した座標検出手段14の動作と
並行して座標検出手段14と同様の動作を行なうので、こ
の検出手段16の動作説明を省略する。
座標検出手段16にあっては、α=1及びβ=−1とし
たので、全ての画素につき処理を終了した時点で、例え
ば第2図に示す被抽出パタンM2の特徴点TRの座標が最大
値座標保存手段163に格納されており、また特徴点BLの
座標が最小値座標保存手段165に格納されている。
III:特徴量算出手段18に着目した説明 特徴量算出手段18は、特徴点BR、TL、TR、BLの座標を
読出し、これら特徴点座標に基づき幾何学的特徴量DT、
DB、DR、DLを算出する。これら特徴量はそれぞれ特徴点
間の距離を表すものであり、式(1)〜(4)に従って
算出することが出来る。尚、式(1)〜(4)において
特徴点BR、TL、TR、BLのX座標をBRX、TLX、TRX、BLXと
して及びY座標をBRY、TLY、TRY、BLYとしてそれぞれ表
す。
特徴量算出手段18は上式(1)〜(4)に従って特徴
量を算出すると、算出した特徴量DT、DB、DR、DLを出力
する。
IV:特徴点座標検出の原理的説明 第5図は特徴点座標検出の原理的説明に供する図であ
る。以下、第5図を参照して説明するが、この説明で
は、特徴抽出対象となる被抽出パタンM2を矩形パタンと
する。この場合、特徴点は被抽出パタンM2の角点TL、T
R、BL、BRとなる。
特徴点座標検出のため、まず、画像データM上におい
て被抽出パタンM2を通過する直線αX+βYを想定し、
傾きが一定値に固定されCの値が種々の値となる直線群
αX+βY=Cを考える。すると、被抽出パタンM2を通
過する直線を見出すことが出来、このとき特徴点となる
角点を通過する直線のCの値は直線群中、最小の値或は
最大の値となる。
従って、被抽出パタンM2の各画素につきCの値すなわ
ち計算値αX+βYを算出し、計算値αX+βYが最大
或は最小となる画素のX、Y座標を特徴点の座標とすれ
ば良いことが理解出来る。矩形パタンの場合であれば、
一組の特定のα及びβ値を用いることによって2つの角
点(特徴点)を検出することが出来る。
例えばα=β=1として被抽出パタンM2の領域を通過
する直線群L:X+Y=C1を考え、C1の値をより小さくし
てゆくと特徴点TLを通過する直線L1が得られることが理
解出来る。またC1の値が最小となるとき特徴点TLを通過
する直線L1が得られる。またC1の値をより大きくしてゆ
くと特徴点BRにより近い直線が得られC1の値が最大とな
るとき特徴点BRを通過する直線Lnが得られる。従って、
被抽出パタンM2の画素のなかで計算値X+Yの最小値を
与える画素の座標が特徴点TLの及び最大値を与える画素
の座標が特徴点BRの座標となることが理解出来る。
同様にして、例えばα=1及びβ=−1として被抽出
パタンM2の領域を通過する直線群K:X−Y=C2を考える
と、C2の値が最小となるとき特徴点BLを通過する直線Km
が及びC2の値が最大となるとき特徴点TRを通過する直線
K1が得られる。従って、被抽出パタンM2の画素のなかで
計算値X−Yの最小値を与える画素の座標が特徴点BLの
及び最大値を与える画素の座標が特徴点TRの座標とな
る。
<文字認識装置> 次に、この出願の方法発明及び装置発明の理解を深め
るため、上述した方法及び装置発明の実施例を文字認識
装置に適用した例につき説明する。
第6図は文字認識装置の一構成例を示す機能ブロック
図である。同図に示す文字認識装置は、読取部20と、画
像メモリ21と、切出部22と、被抽出パタンに関する幾何
学的特徴量を出力する特徴抽出部24と(第1図参照)、
標準パタンに関する幾何学的特徴量を収める辞書26と、
標準パタン及び被抽出パタンに関する幾何学的特徴量に
基づき認識結果を出力する識別部28とを備えた構成を有
する。この文字認識装置の読取部20は光電変換部20a及
び走査機構(図示せず)を備えている。
このような構成の文字認識装置にあっては、読取部20
が、帳票等を走査して得られる光信号Gを量子化された
ディジタル信号に変換し、このディジタル信号から成る
原画像データを出力する。
出力された原画像データは画像メモリ21に格納され、
切出部22は帳票上の文字の記載位置の情報に基づき画像
メモリ21の原画像データから画像データMを切り出し、
この切出した画像データMを1画素毎に特徴抽出部24に
対し出力する。特徴抽出部24は画像データMを入力する
と、既に説明したようにして、被抽出パタンの幾何学的
特徴量DT、DB、DR、DLを算出しこれら特徴量を識別部28
に対し出力する。
ところで、辞書26は予め用意された標準パタンの標準
特徴量JT、JB、JR及びJRを格納している。これら幾何学
的特徴量JT、JB、JR、JLは、被抽出パタンの特徴量と同
様、検出された特徴点の間の距離を表すものであり、JT
はDTに、JBはDBに、JRはDRに及びJLはDLに対応する特徴
量である。
識別部28は、特徴抽出部28からの特徴量DT、DB、DR、
DLと辞書26の特徴量JT、JB、JR、JLとを照合する。この
照合のため、認識部28は次式(5)に基づき距離Dを算
出し、距離Dが最も小さくなる標準特徴量を検出する。
そして、最も小さな距離Dを与える標準特徴量を有する
標準パタンの文字名を、文字名出力(認識結果)として
出力する。
尚、上述の装置において、文字の標準パタンに関する
標準特徴量に換えて或は加えて図形の標準パタンに関す
る標準特徴量を辞書26に格納すれば、図形認識装置或は
文字図形認識装置を構成することが出来る。文字及び図
形の標準パタンのための辞書はそれぞれ個別の辞書とし
ても良いし或は共通の1個の辞書としても良い。この出
願の方法及び装置発明は従来提案されている種々の文字
及び又は図形認識装置に適用及び応用することが出来
る。
この出願の方法発明及び装置発明は上述した実施例に
のみ限定されるものではなく、任意好適に変更或は変形
することが出来る。
例えば、特徴抽出のための画像データMとして2値に
処理されたデータのみならず、多値処理されたデータを
用いても良い。多値処理された画像データから特定色の
文字図形パタンの特徴抽出や特定範囲の濃度を有する文
字図形パタンの特徴抽出を行なうことが出来る。特定色
の文字図形パタンの場合には、特定の色を有する画素で
あることを意味する画素値の画素に着目し、この画素に
関する最大及び最小計算値を求めることによって、特徴
点座標を検出出来る。また特定範囲の濃度を有する文字
図形パタンの場合には、特定濃度範囲の画素値を有する
画素に着目して、この画素に関する最大及び最小値を求
めることによって、特徴点座標を検出することが出来
る。
また上述した実施例では、2組のα及びβを用い従っ
て傾きが異なる2つの直線群L、Kを用いて特徴点座標
を検出した場合につき説明したが、例えばほぼ多角形形
状(ほぼn角形形状)の図形パタンに関する特徴点座標
を検出する場合など、3組以上のα及びβを用い従って
傾きが異なる3つ以上の直線群を用いて特徴点座標の検
出を行なうようにしても良い。この場合、それぞれの組
のα及びβ値に関し上述と同様の原理に従って最大及び
最小計算値を求め、これら最大及び最小計算値を与える
画素の座標から文字図形パタンの幾何学的特徴量を求め
ることが出来る。この場合の装置構成は、座標検出手段
の配設個数を、特徴点座標検出のために用いるα及びβ
値の組の個数と同数とする他は、上述した実施例と同様
の構成とすれば良い。
また幾何学的特徴量として、検出された特徴点の座標
をもとにして得られる種々の幾何学的特徴量を用いるこ
とが出来る。上述した特徴点間の距離以外の幾何学的特
徴量を例示すれば、例えば、特徴点を結ぶ直線の傾き
や、特徴点を結んで得られる三角形、四角形等の多角形
領域の面積その他を挙げることが出来る。そして、これ
ら種々の幾何学的特徴量を単独で或は種々に組み合せて
文字パタンや図形パタンの認識のために用いることが出
来る。
また所定の画素値を有する画素に関する最大及び最小
計算値を算出するための手順(アルゴリズム)は上述し
た実施例にのみ限定されず、最大及び最小値を求めるた
めに従来より用いられている任意好適な手順を用いても
良い。
またこの出願の方法及び装置発明は、特に字形の簡単
な文字例えばE13Bフォントの数字を認識対象とする文字
認識装置に適用して好適であり、この場合に小型で処理
速度の速い文字認識装置を実現することが出来る。ま
た、これら方法及び装置発明は文字認識装置、図形認識
装置その他の画像処理装置に広く適用して良い。
(発明の効果) 上述した説明からも明らかなように、この出願の特徴
抽出方法及び特徴抽出装置によれば、量子化画像データ
の画素にX、Y座標を付与して画像データをX−Y座標
系で表現し、所定の画素値を有する被抽出パタンの画素
に関する最大及び最小の計算値αX+βYを検出し、こ
れら最大及び最小計算値を与える画素の座標をそれぞれ
特徴点座標とする。そして、特徴点座標に基づき被抽出
パタンの幾何学的特徴量を算出する。
このようにして特徴量を算出する上述の処理手順にあ
っては、最大及び最小計算値を検出する手順が非常に簡
単な手順であるので、装置構成の簡素化を図れ、ハード
ウェアの規模縮小化を実現出来るという利点がある。
また最大及び最小計算値を検出する処理手順は簡単で
あるので特徴量の算出を高速に行なえるという利点があ
る。特に読取処理部が画像メモリを有する場合には、特
徴点座標を画像メモリの一回の走査で検出することが出
来るので、高速化を効果的に図れる。
また最大及び最小計算値を与える画素の座標を特徴点
座標とするので、従来のマトリクス・マッチング法と比
較して帳票、原稿等の傾きや、被抽出パタンの欠けに影
響されにくい安定した特徴量を得られるという利点があ
る。
【図面の簡単な説明】
第1図は装置発明の実施例の説明に供する機能ブロック
図、 第2図は特徴抽出のために用いる量子化画像データの一
例を示す図、 第3図は特徴抽出対象となる文字パタンの一例を示す
図、 第4図(A)〜(B)は方法発明及び装置発明の実施例
の説明に供する動作流れ図、 第5図は特徴点座標検出の原理的説明に供する図、 第6図は方法発明及び装置発明の実施例を適用例として
示す文字認識装置の機能ブロック図である。 8…読取処理部、10…X座標発生手段 12…Y座標発生手段、14、16…座標検出手段 141、161…計算手段 142、162…最大値検出手段 143、163…最大値座標保存手段 144、164…最小値検出手段 145、165…最小値座標保存手段 18…特徴量算出手段。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】特徴抽出対象となる被抽出パタンを含む量
    子化画像データの画素にX座標及びY座標を付与し、 前記X、Y座標と少なくとも2組の特定のα値及びβ値
    とを用いて所定の画素値を有する前記被抽出パタンの画
    素に関する最大及び最小の計算値αX+βYを検出し、
    これら最大及び最小計算値を与える前記被抽出パタンの
    画素のX、Y座標を特徴点座標とし、 該特徴点座標に基づき幾何学的特徴量を算出することに
    よって前記被抽出パタンの特徴抽出を行なうことを特徴
    とする特徴抽出方法。
  2. 【請求項2】特徴抽出対象となる被抽出パタンを含む量
    子化画像データの画素にX座標を付与するためのX座標
    発生手段と、 前記量子化画像データの画素にY座標を付与するための
    Y座標発生手段と、 前記X、Y座標と少なくとも2組の特定のα値及びβ値
    とを用いて所定の画素値を有する前記被抽出パタンの画
    素に関する最大及び最小の計算値αX+βYを検出し、
    これら最大及び最小計算値を与える前記被抽出パタンの
    画素のX、Y座標をそれぞれ特徴点座標として出力する
    ための座標検出手段と、 前記被抽出パタンの特徴抽出を行なうための幾何学的特
    徴量を前記特徴点座標に基づき算出する特徴量算出手段
    とを備えて成ることを特徴とする特徴抽出装置。
  3. 【請求項3】前記座標検出手段は、前記計算値αX+β
    Yを算出する計算手段と、前記最大計算値を検出するた
    めの最大値検出手段と、前記最大計算値を与える画素の
    X、Y座標を保存するための最大値座標保存手段と、前
    記最小計算値を検出するための最小値検出手段と、前記
    最小計算値を与える画素のX、Y座標を保存するための
    最小値座標保存手段とを備えて成ることを特徴とする請
    求項2に記載の特徴抽出装置。
JP63014222A 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置 Expired - Lifetime JPH0821060B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63014222A JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63014222A JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Publications (2)

Publication Number Publication Date
JPH01189785A JPH01189785A (ja) 1989-07-28
JPH0821060B2 true JPH0821060B2 (ja) 1996-03-04

Family

ID=11855044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63014222A Expired - Lifetime JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Country Status (1)

Country Link
JP (1) JPH0821060B2 (ja)

Also Published As

Publication number Publication date
JPH01189785A (ja) 1989-07-28

Similar Documents

Publication Publication Date Title
US4153897A (en) Method and device for detecting the similarity between standard and unknown patterns
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US3930231A (en) Method and system for optical character recognition
US4897880A (en) Data acquisition control method and system for a hand held reader
US5164996A (en) Optical character recognition by detecting geo features
CN111126266A (zh) 文本处理方法、文本处理系统、设备及介质
JP2001043313A (ja) 文字切出し方法
EP0915428B1 (en) Apparatus and method for image recognition
US5307424A (en) Character recognition system
JPH0821060B2 (ja) 特徴抽出方法及び特徴抽出装置
JPH0821061B2 (ja) 特徴抽出方法及び特徴抽出装置
JPS62121589A (ja) 文字切出し方法
JP2616994B2 (ja) 特徴抽出装置
JPH0821062B2 (ja) 特徴抽出方法及び特徴抽出装置
JP2749946B2 (ja) 文字認識方法
JP2626084B2 (ja) 文字認識装置
JP2827288B2 (ja) 文字認識装置
JPS61196381A (ja) 文字切出し方式
JPH0656625B2 (ja) 特徴抽出方式
JP2708604B2 (ja) 文字認識方法
JP2954218B2 (ja) 画像処理方法及び装置
JP2962525B2 (ja) テキストブロック認識方法
JP2878327B2 (ja) 文字切り出し装置
JP2867382B2 (ja) 文字認識装置におけるフォント決定方法