JPS63234372A - 特徴抽出方式 - Google Patents
特徴抽出方式Info
- Publication number
- JPS63234372A JPS63234372A JP62067969A JP6796987A JPS63234372A JP S63234372 A JPS63234372 A JP S63234372A JP 62067969 A JP62067969 A JP 62067969A JP 6796987 A JP6796987 A JP 6796987A JP S63234372 A JPS63234372 A JP S63234372A
- Authority
- JP
- Japan
- Prior art keywords
- character
- divided
- dividing
- pattern
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 230000005484 gravity Effects 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は文字図形認識装置等において使用され、文字図
形の特徴を抽出する特徴抽出方式に関するものである。
形の特徴を抽出する特徴抽出方式に関するものである。
(従来の技術)
従来、文字図形認識装置では、文字図形パターンよりス
トロークを抽出し、それら抽出されたストロークの位置
、長さ、ストローク間の相互関係等を用いて認識する方
式が多く採用されている。
トロークを抽出し、それら抽出されたストロークの位置
、長さ、ストローク間の相互関係等を用いて認識する方
式が多く採用されている。
その手法は(1)文字図形の輪郭を追跡することにより
検出された輪郭点系列について曲率を計算し、その曲率
の大きな値の点を分割点として輪郭系列を分割し、分割
され次系列を組合わせることによ9ストロークを抽出す
るか、(2)文字図形パターンに細線化処理を行なって
骨格化し、その骨格パターンの連結性及び骨格パターン
を追跡し急激な角度の変化点等を検出してストロークを
抽出し、前記(1戸2)よ、り抽出され次ストロークに
ついて幾何学的な特徴等を抽出して識別を行なっていた
。
検出された輪郭点系列について曲率を計算し、その曲率
の大きな値の点を分割点として輪郭系列を分割し、分割
され次系列を組合わせることによ9ストロークを抽出す
るか、(2)文字図形パターンに細線化処理を行なって
骨格化し、その骨格パターンの連結性及び骨格パターン
を追跡し急激な角度の変化点等を検出してストロークを
抽出し、前記(1戸2)よ、り抽出され次ストロークに
ついて幾何学的な特徴等を抽出して識別を行なっていた
。
また、処理が簡単な手法として、(3)入力文学図形パ
ターンを走査して得られる所定の2つの軸(X、Y軸)
上における黒ビット数分布に対し、文字枠で定められる
範囲で重心座標を決定する。次いで、それまでに検出し
た夫々の重心座標で、上記文字枠で定められる範囲を分
割した夫々の範囲を対象として夫々の前記黒ビット数分
布の重心座標を決定する過程を複数回繰返して求める。
ターンを走査して得られる所定の2つの軸(X、Y軸)
上における黒ビット数分布に対し、文字枠で定められる
範囲で重心座標を決定する。次いで、それまでに検出し
た夫々の重心座標で、上記文字枠で定められる範囲を分
割した夫々の範囲を対象として夫々の前記黒ビット数分
布の重心座標を決定する過程を複数回繰返して求める。
求めた夫々の重心座標系列とほぼ均等に対応させた分割
座標系列によって、上記入力文字図形パターンを夫々の
軸方向に分割し、夫々の軸上の夫々の各分割領域を夫々
の文字枠で正規化して得た正規化分割領域長系列を上記
入力文字図形パターンの特徴として抽出して識別を行な
っていた。
座標系列によって、上記入力文字図形パターンを夫々の
軸方向に分割し、夫々の軸上の夫々の各分割領域を夫々
の文字枠で正規化して得た正規化分割領域長系列を上記
入力文字図形パターンの特徴として抽出して識別を行な
っていた。
(発明が解決しようとする問題点)
しかしながら、前記従来の文字認識装置における特徴抽
出方式では次のような問題点がめった。
出方式では次のような問題点がめった。
(1)の方式では文字図形パターンが大きくなり、又文
字図形パターンが複雑化すると、その処理量が増大し処
理速度の低下を招いていた。(2)の方式では文字図形
パターンを細線化する必要があり、又その細線化による
パターンのひずみ、ヒゲ等の問題がアリ、その後の処理
を複雑なものとしていた。また、(3)の方式では処理
が簡単ではめるが、本来二次元の性質をもつ文字図形パ
ターンを分割領域長という一次元の性質を表わす特徴で
表現しているために、入力文字図形パターンによっては
特徴が正確に抽出できない場合があった。
字図形パターンが複雑化すると、その処理量が増大し処
理速度の低下を招いていた。(2)の方式では文字図形
パターンを細線化する必要があり、又その細線化による
パターンのひずみ、ヒゲ等の問題がアリ、その後の処理
を複雑なものとしていた。また、(3)の方式では処理
が簡単ではめるが、本来二次元の性質をもつ文字図形パ
ターンを分割領域長という一次元の性質を表わす特徴で
表現しているために、入力文字図形パターンによっては
特徴が正確に抽出できない場合があった。
本発明は以上述べた問題点を解決し、簡単な処理で高速
かつ正確に文字図形の特徴を抽出することが可能な特徴
抽出方式を提供することを目的とする。
かつ正確に文字図形の特徴を抽出することが可能な特徴
抽出方式を提供することを目的とする。
(問題点を解決するための手段)
本発明は前記問題点を解決するために、媒体上の文字図
形を読取って2値化して得られるパターンを記憶する記
憶手段を備え、前記パターン忙基づいて文字図形の特徴
を抽出する特徴抽出方式において、(a)前記パターン
を走査して文字図形の外接枠を検出する第1の検出手段
、(b)前記パターンを走査して所定の2つの軸に投影
した各軸方向の黒ピット数分布を作成する作成手段、(
e)前記2つの軸方向の前記外接枠内の範囲で各黒ピッ
ト数分布の重心座標を決定し、決定した各重心座標で外
接枠内の範囲を分割した各分割範囲に対し各黒ビット数
分布の重心座標を決定する過程を繰シ返して各軸方向の
重心座標系列を検出する第2の検出手段、(d)設定さ
れる分割数に基づいて、前記重心座標系列に対応した各
軸方向の分割座標系列を決定する決定手段、及び(e>
前記分割座標系列で分割される前記外接枠内の分割領域
の面積を要素とする分割領域面積マトリクスを計算する
計算手段を具備するものである。
形を読取って2値化して得られるパターンを記憶する記
憶手段を備え、前記パターン忙基づいて文字図形の特徴
を抽出する特徴抽出方式において、(a)前記パターン
を走査して文字図形の外接枠を検出する第1の検出手段
、(b)前記パターンを走査して所定の2つの軸に投影
した各軸方向の黒ピット数分布を作成する作成手段、(
e)前記2つの軸方向の前記外接枠内の範囲で各黒ピッ
ト数分布の重心座標を決定し、決定した各重心座標で外
接枠内の範囲を分割した各分割範囲に対し各黒ビット数
分布の重心座標を決定する過程を繰シ返して各軸方向の
重心座標系列を検出する第2の検出手段、(d)設定さ
れる分割数に基づいて、前記重心座標系列に対応した各
軸方向の分割座標系列を決定する決定手段、及び(e>
前記分割座標系列で分割される前記外接枠内の分割領域
の面積を要素とする分割領域面積マトリクスを計算する
計算手段を具備するものである。
(作用)
本発明によれば、以上のように特徴抽出方式を構成した
ので、技術的手段は次のように作用する。
ので、技術的手段は次のように作用する。
記憶手段に格納されたパターンを走査することによって
、第1の検出手段では文字図形の外接枠(文字枠)が検
出され、作成手段では各軸方向(例えばX軸、Y軸方向
)の黒ビット数分布が作成される。このように得られた
外接枠及び各黒ビット数分布に基づいて、第2の検出手
段で各軸方向の重心座標系列が検出される。次に、設定
される分割数に基づいて、第2の検出手段で検出された
重心座標系列に対応した各軸方向の分割座標系列が決定
手段により決定される。分割数は、例えば文字図形の複
雑度に応じて設定される。決定手段で得られ念分割座標
系列で分割される外接枠内の分割領域の面積を要素とす
る分割領域面積マトリクスが計算手段によフ計算される
。このように、パターンの走査と所定の演算処理により
特徴情報としての分割領域面積マトリクスを抽出してい
るので、従来と比較して簡単で高速な処理となる。また
抽出された分割領域面積マトリクスは二次元の性質を表
わすので、2次元である文字図形の特徴全正確に抽出し
たことになる。従って、この特徴情報を文字図形望識に
用いることによシ、簡単な処理で高速かつ正確に文字図
形を認識することが可能となる。
、第1の検出手段では文字図形の外接枠(文字枠)が検
出され、作成手段では各軸方向(例えばX軸、Y軸方向
)の黒ビット数分布が作成される。このように得られた
外接枠及び各黒ビット数分布に基づいて、第2の検出手
段で各軸方向の重心座標系列が検出される。次に、設定
される分割数に基づいて、第2の検出手段で検出された
重心座標系列に対応した各軸方向の分割座標系列が決定
手段により決定される。分割数は、例えば文字図形の複
雑度に応じて設定される。決定手段で得られ念分割座標
系列で分割される外接枠内の分割領域の面積を要素とす
る分割領域面積マトリクスが計算手段によフ計算される
。このように、パターンの走査と所定の演算処理により
特徴情報としての分割領域面積マトリクスを抽出してい
るので、従来と比較して簡単で高速な処理となる。また
抽出された分割領域面積マトリクスは二次元の性質を表
わすので、2次元である文字図形の特徴全正確に抽出し
たことになる。従って、この特徴情報を文字図形望識に
用いることによシ、簡単な処理で高速かつ正確に文字図
形を認識することが可能となる。
(実施例)
以下、第1図乃至第5図を参照して本発明の詳細な説明
する。
する。
第1図は本発明の特徴抽出方式を採用した文字図形認識
装置を示す機能ブロック図である。本実施例の文字認識
装置は、光入力1を光電変換する光電変換部2、パター
ンレジスタ3、文字枠検出部4、文字投影作成部5、重
心検出部6、文字枠分割点決定部7、分割領域面積計算
部8、識別部9、辞書メモリ10及び出力端子から構成
される。
装置を示す機能ブロック図である。本実施例の文字認識
装置は、光入力1を光電変換する光電変換部2、パター
ンレジスタ3、文字枠検出部4、文字投影作成部5、重
心検出部6、文字枠分割点決定部7、分割領域面積計算
部8、識別部9、辞書メモリ10及び出力端子から構成
される。
以上の構成要素のうち、本発明の方式に直接関係するも
のは参照符号2〜8の構成要素でろる。
のは参照符号2〜8の構成要素でろる。
文字、図形、記号等(以下文字という)が記載された帳
票等の媒体からの光入力1は光電変換部2に入力される
。光電変換部2は光入力1を光電変換して、1つの文字
予定領域’に128x128の画素へ分解し、各画素を
2値のディジタル信号(以下これを入力文字パターンと
呼ぶ)へ変換するものであり、平均的大きさの1文字は
60X60ビット程度の入力文字パターンで表現される
。パターンレジスタ3は文字予定領域における各画素の
X、Y座標を再現できる形式で入力文字パターンを記憶
するものであり、文字予定領域に対応して128X12
8ビットの容量を有するものである。
票等の媒体からの光入力1は光電変換部2に入力される
。光電変換部2は光入力1を光電変換して、1つの文字
予定領域’に128x128の画素へ分解し、各画素を
2値のディジタル信号(以下これを入力文字パターンと
呼ぶ)へ変換するものであり、平均的大きさの1文字は
60X60ビット程度の入力文字パターンで表現される
。パターンレジスタ3は文字予定領域における各画素の
X、Y座標を再現できる形式で入力文字パターンを記憶
するものであり、文字予定領域に対応して128X12
8ビットの容量を有するものである。
文字枠検出部4は、例えば文字の外接枠(文字枠)ヲソ
のパターンレジスタにおける左端座標Xl、右端座標X
r、上端座標Yt、下端座標Ybで表現して検出する。
のパターンレジスタにおける左端座標Xl、右端座標X
r、上端座標Yt、下端座標Ybで表現して検出する。
文字投影作成部5はパターンレジスタ30入力文字パタ
ーンを所定の軸、例えばX軸、Y軸(夫夫パターンレジ
スタ302次元座標における水平方向、垂直方向)へ投
影して黒ビット数の分布を求め、黒ビット数分布5X(
x ) 、 5Y(y ) ’r:作成する0 但し、X、yはパターンレジスタ3における夫夫0〜1
27 なる2次元座標でメジ、Yt、Ybは文字枠のY
軸方向の上端座標、下端座標、Xl、XrはX軸方向の
左端座標、右端座標であり、P (x v y )は黒
ビット又は白ビットを意味し、黒ビット(有意色)の場
合P(x、y)=1、白ビット(背景色)の場合P(x
、y)=Oをとる。
ーンを所定の軸、例えばX軸、Y軸(夫夫パターンレジ
スタ302次元座標における水平方向、垂直方向)へ投
影して黒ビット数の分布を求め、黒ビット数分布5X(
x ) 、 5Y(y ) ’r:作成する0 但し、X、yはパターンレジスタ3における夫夫0〜1
27 なる2次元座標でメジ、Yt、Ybは文字枠のY
軸方向の上端座標、下端座標、Xl、XrはX軸方向の
左端座標、右端座標であり、P (x v y )は黒
ビット又は白ビットを意味し、黒ビット(有意色)の場
合P(x、y)=1、白ビット(背景色)の場合P(x
、y)=Oをとる。
第2図[a)に入力文字パターン例として漢字「田」と
「口」のパターンの場合を示し、第2図(b) 、 (
c)に第2図fa)の各パターンに対する黒ビット数分
布5X(x)、5Y(Y)を示す。
「口」のパターンの場合を示し、第2図(b) 、 (
c)に第2図fa)の各パターンに対する黒ビット数分
布5X(x)、5Y(Y)を示す。
重心検出部6は、文字枠のX、Y各軸方向の全範囲X1
〜Xr、Yt−Yb及び前の過程で検出した重心座標で
その範囲X1〜X、、Yt−Yb2分割し念各範囲を対
象として、入力文字パターンの夫々の黒ビット数分布5
X(x)、5Y(y)の重心座標系列X(Mp)、Y(
Mq)’に求めるものであり、各範囲の1次モーメント
の和をその範囲の黒ビット和で除算することによって求
めるものである。但し、Mp、M9は座標値の大きさの
順に付した重心座標番号でアシ、Mp=1〜MX(MX
はX軸方向の重心の個数であって奇数)M、=1〜MY
(MYはY軸方向の重心の個数でろって奇数)である。
〜Xr、Yt−Yb及び前の過程で検出した重心座標で
その範囲X1〜X、、Yt−Yb2分割し念各範囲を対
象として、入力文字パターンの夫々の黒ビット数分布5
X(x)、5Y(y)の重心座標系列X(Mp)、Y(
Mq)’に求めるものであり、各範囲の1次モーメント
の和をその範囲の黒ビット和で除算することによって求
めるものである。但し、Mp、M9は座標値の大きさの
順に付した重心座標番号でアシ、Mp=1〜MX(MX
はX軸方向の重心の個数であって奇数)M、=1〜MY
(MYはY軸方向の重心の個数でろって奇数)である。
X軸方向の重心座標の個数MXとしては、15個程度の
比較的多い数(分割数に比べて)を採用することが望ま
しいが、説明の簡略化のために7個の重心座標X(Mp
i検出する場合について述べる。
比較的多い数(分割数に比べて)を採用することが望ま
しいが、説明の簡略化のために7個の重心座標X(Mp
i検出する場合について述べる。
まず、文字枠のX軸方向の範囲xi−xr’l:対象と
して、次式に示すように入力文字パターンの黒ビット数
分布5X(x)の1次モーメント和をその範囲の黒ビッ
ト和で除算することによって、中央の重心座標番号M、
の重心座標X(M+)e求め次めで、その重心座標X(
MOで分割され几夫々の範囲、Xl=X(NL)−X(
M<)〜Xrを対象として2つの重心座標X(Mt)
、X(Ma)を求める。
して、次式に示すように入力文字パターンの黒ビット数
分布5X(x)の1次モーメント和をその範囲の黒ビッ
ト和で除算することによって、中央の重心座標番号M、
の重心座標X(M+)e求め次めで、その重心座標X(
MOで分割され几夫々の範囲、Xl=X(NL)−X(
M<)〜Xrを対象として2つの重心座標X(Mt)
、X(Ma)を求める。
次いで、これまで検出された重心座標X(L)−X(M
l) 、X(Ma)で分割された範囲X l−X (M
t) 。
l) 、X(Ma)で分割された範囲X l−X (M
t) 。
X (Mt)〜X (Ml) 、X (Ml)〜X (
Me) 、 X (Ms)〜Xr を対象として4個の
重心座標X(Ml) 、X(Mり 、X(M5)。
Me) 、 X (Ms)〜Xr を対象として4個の
重心座標X(Ml) 、X(Mり 、X(M5)。
X(Mp)を求める。
Y軸方向の重心座標Y(Mq)の検出も検出する重心座
標個数MYt−7個とした場合、まず、文字枠の範囲Y
t−Ybe対象として入力文字パターンの黒ビット数分
布5Y(y)の重心座標Y(Ml) を検出し、次い
で文字枠を重心座標で2分した範囲Yt−Y(M<)、
Y(Ml)〜Ybそれぞれを対象として黒ビット数分布
5Y(y)の重心座標rcMt)−Y(Ma)t″検出
、更にこれまでに検出され念重心座標Y (Mt) 、
Y (Ml) 、 Y (Ma)でY軸方向の文字枠
を分割した夫々の範囲yt −y’(Mx) 、Y(M
t)〜Y(Ml) 、Y(Ml)〜Y (Ms) 、
Y (Ma)〜Ybを対象として黒ビット数分布5Y(
y)の重心座標を検出することによって、計7個の重心
座標Y(Ml)〜Y(M7)を検出する。
標個数MYt−7個とした場合、まず、文字枠の範囲Y
t−Ybe対象として入力文字パターンの黒ビット数分
布5Y(y)の重心座標Y(Ml) を検出し、次い
で文字枠を重心座標で2分した範囲Yt−Y(M<)、
Y(Ml)〜Ybそれぞれを対象として黒ビット数分布
5Y(y)の重心座標rcMt)−Y(Ma)t″検出
、更にこれまでに検出され念重心座標Y (Mt) 、
Y (Ml) 、 Y (Ma)でY軸方向の文字枠
を分割した夫々の範囲yt −y’(Mx) 、Y(M
t)〜Y(Ml) 、Y(Ml)〜Y (Ms) 、
Y (Ma)〜Ybを対象として黒ビット数分布5Y(
y)の重心座標を検出することによって、計7個の重心
座標Y(Ml)〜Y(M7)を検出する。
漢字「田」と「口」の入力文字パターン(第2図(a)
)の場合については、第2図(b) 、 (c)の黒ビ
ット数分布(SX(x)、5Y(y))図中に重心座標
X(MI)〜X(My)、Y(MI)〜Y(Mp)を示
す。
)の場合については、第2図(b) 、 (c)の黒ビ
ット数分布(SX(x)、5Y(y))図中に重心座標
X(MI)〜X(My)、Y(MI)〜Y(Mp)を示
す。
文字枠分割点決定部7は、各サブパターン対応のX、Y
軸方向の分割数fNXk、NYkとし、各サブパターン
対応のX、Y軸各方向の分割座標系列をDX(ki)、
DY(kj)として、x、y軸各方向の重心座標系列X
(Mp)、Y(Mq)″fr:分割座標候補として、重
心座標番号Mp、Mqt−分割座標番号ki、kjにほ
ぼ均等に対応づけて分割座標DX(ki )。
軸方向の分割数fNXk、NYkとし、各サブパターン
対応のX、Y軸各方向の分割座標系列をDX(ki)、
DY(kj)として、x、y軸各方向の重心座標系列X
(Mp)、Y(Mq)″fr:分割座標候補として、重
心座標番号Mp、Mqt−分割座標番号ki、kjにほ
ぼ均等に対応づけて分割座標DX(ki )。
DY(kj) t−決定するものである。
この実施例における分割単位領域の分割形式は、X軸方
向に関する分割数としてNX=4.5,6゜8なる4形
式を取ることができ、同様KY軸方向に関する分割数N
YとしてNY=4.5.6.8なる4形式を取ることが
でき、X軸方向の分割座標番号f、ki (ki=1〜
NX−1、NX=4 、5 、6 、8)とし且つY軸
方向の分割座標番号’tkj (kj =1〜NY−1
、NY=4 、5 、6 、8)として、文字枠をNX
−NYなる個数の分割単位領域に分割する分割座標系列
DX(ki)、DY(kj)を決定する。x、y軸各方
向の重心座標番号Mp、M9とX、Y軸方向の分割座標
番号ki、kjt−はぼ均等に対応づけて分割座標系列
DX(ki)=DY(k j)’に決定するために用い
るテーブルを第1表に示す。
向に関する分割数としてNX=4.5,6゜8なる4形
式を取ることができ、同様KY軸方向に関する分割数N
YとしてNY=4.5.6.8なる4形式を取ることが
でき、X軸方向の分割座標番号f、ki (ki=1〜
NX−1、NX=4 、5 、6 、8)とし且つY軸
方向の分割座標番号’tkj (kj =1〜NY−1
、NY=4 、5 、6 、8)として、文字枠をNX
−NYなる個数の分割単位領域に分割する分割座標系列
DX(ki)、DY(kj)を決定する。x、y軸各方
向の重心座標番号Mp、M9とX、Y軸方向の分割座標
番号ki、kjt−はぼ均等に対応づけて分割座標系列
DX(ki)=DY(k j)’に決定するために用い
るテーブルを第1表に示す。
第1表
このテーブルを参照して、X、Y軸各方向の分割数NX
、NYに対応してこのテーブルから重心座標番号Mp、
Mq’i読み出し、その重心座標番号Mp、Mqに対応
した重心座標X(Mp)、Y(M9)を分割座標DX(
ki )、DY(kj) として決定する。
、NYに対応してこのテーブルから重心座標番号Mp、
Mq’i読み出し、その重心座標番号Mp、Mqに対応
した重心座標X(Mp)、Y(M9)を分割座標DX(
ki )、DY(kj) として決定する。
第1表のテーブルは、重心検出部6で検出する重心座標
の個数MX、MYが7個の場合であるが、一般的な場合
においても、X、Y各方向の分割数の重心座標が含まれ
るように対応させ、且つその際余分の7重心座標が残っ
た場合は両端の領域から順に1個多い重心座標が含まれ
るように対応させることによって作ることができる。
の個数MX、MYが7個の場合であるが、一般的な場合
においても、X、Y各方向の分割数の重心座標が含まれ
るように対応させ、且つその際余分の7重心座標が残っ
た場合は両端の領域から順に1個多い重心座標が含まれ
るように対応させることによって作ることができる。
第3図には、X、Y軸各方向の分割数NX、NYとして
NX=NY=5なる分割数が指定された場合について、
分割座標系列DX(k i ) 、DY(k j )
と重心座標系列X(M、)、Y(M、)との対応関係
を示すと共に、それらの分割座標系列DX(ki)。
NX=NY=5なる分割数が指定された場合について、
分割座標系列DX(k i ) 、DY(k j )
と重心座標系列X(M、)、Y(M、)との対応関係
を示すと共に、それらの分割座標系列DX(ki)。
DY(kj)で設定される分割単位領域(ki 、kj
)を示す。
)を示す。
なお、分割数NX、NYは入力文字の複雑度に応じて分
割数NX、NYを決定し、或いはいったんリジェクトさ
れた場合に分割数NX、NY’(r変更して再度文字認
識を行なわせるものである。
割数NX、NYを決定し、或いはいったんリジェクトさ
れた場合に分割数NX、NY’(r変更して再度文字認
識を行なわせるものである。
以上の様に文字枠分割点決定部7では、分割単位領域の
分割形式は、X軸方向に関する分割数としてNX=4.
5.6.8なる4型式、Y軸方向に関する分割数として
NY=4.5.6.8 なる4形式をとることができる
。本実施列では分割数をNX=NY=8として以下説明
する。この場合、X軸方向については、重心座標X(M
、)〜X(Mt)に対応する分割座標D X(11、D
Xf21 、 D X(3)、Y軸方向については、
重心座標Y(Mり〜Y(M、)に対応する分割座標D
Y(11〜D YI31を決定する。
分割形式は、X軸方向に関する分割数としてNX=4.
5.6.8なる4型式、Y軸方向に関する分割数として
NY=4.5.6.8 なる4形式をとることができる
。本実施列では分割数をNX=NY=8として以下説明
する。この場合、X軸方向については、重心座標X(M
、)〜X(Mt)に対応する分割座標D X(11、D
Xf21 、 D X(3)、Y軸方向については、
重心座標Y(Mり〜Y(M、)に対応する分割座標D
Y(11〜D YI31を決定する。
分割領域面積計算部8は、入力文字パターンの分割数に
対応したX軸方向の文字枠座標及び分割座標xl 、
DXtll〜DX+71、Xr とY軸方向の文字枠座
標及び分割座標Yt%DYfll〜D Y(71、Yb
を受けて、各軸上において各分割座標で分割される各
分割領域の面積を要素とする分割領域面積マトリクスを
次の(6)式によって計算スる。
対応したX軸方向の文字枠座標及び分割座標xl 、
DXtll〜DX+71、Xr とY軸方向の文字枠座
標及び分割座標Yt%DYfll〜D Y(71、Yb
を受けて、各軸上において各分割座標で分割される各
分割領域の面積を要素とする分割領域面積マトリクスを
次の(6)式によって計算スる。
分割領域面積マトリクス;
B膠(I 、J) = (DX(I)−DX(I −1
’) ) (DY(J)−DY(J−1’) ) 。
’) ) (DY(J)−DY(J−1’) ) 。
I=1〜8.J=1〜8 ・・・・・・・・・・・
・・・(6)ただし、DX(0)=X1 、 DX(8
)=Xr、 DY(0)=Yt、DY(81=Ybであ
る。
・・・(6)ただし、DX(0)=X1 、 DX(8
)=Xr、 DY(0)=Yt、DY(81=Ybであ
る。
第4図に、分割座標系列DX(01〜DX(81、D
Y(0)〜DY18)と分割領域面積マトリクス(BE
S(I、J)1工=1〜8、J=1〜8)の対応関係を
示す。また、前述の第2図(a)に、漢字「田」と「口
」夫々の入力文字パターンにおける分割座標D X(0
)〜D X(81、DY(01〜DYt81と、これら
の分割座標によって入力文字パターン(文字枠内)が各
領域に分割される様子を示す。
Y(0)〜DY18)と分割領域面積マトリクス(BE
S(I、J)1工=1〜8、J=1〜8)の対応関係を
示す。また、前述の第2図(a)に、漢字「田」と「口
」夫々の入力文字パターンにおける分割座標D X(0
)〜D X(81、DY(01〜DYt81と、これら
の分割座標によって入力文字パターン(文字枠内)が各
領域に分割される様子を示す。
分割領域面積計算部8で得られた入力文字パターンの特
徴情報としての分割領域系列 f i = (BES(I 、J) l I’=1〜8
.J=1〜8) は識別部9に与えられる。
徴情報としての分割領域系列 f i = (BES(I 、J) l I’=1〜8
.J=1〜8) は識別部9に与えられる。
辞書メモリ10には、入力文字パターンの場合と同様に
して計算され標準パターンに対する特徴情報としての分
割領域面積マトリクスfmが予め登録されている。
して計算され標準パターンに対する特徴情報としての分
割領域面積マトリクスfmが予め登録されている。
識別部9は、以上のようにして得られた入力文字パター
ン及び標準パターンの特徴情報の類似度を測定し、最も
類似する標準パターンの文字コードを入力文字図形パタ
ーン名として認識し、その文字コードを出力端11に出
力する。本実施例では、辞書メモリ10内の標準パター
ンの分割領域面積でトリクスfmと入力文字パターンの
分割領域面積マトリクスfi との間における(9)式
の重み付きユークリッド距離(D)の最小値を与える標
準パターンを最も類似する標準パターンとする。
ン及び標準パターンの特徴情報の類似度を測定し、最も
類似する標準パターンの文字コードを入力文字図形パタ
ーン名として認識し、その文字コードを出力端11に出
力する。本実施例では、辞書メモリ10内の標準パター
ンの分割領域面積でトリクスfmと入力文字パターンの
分割領域面積マトリクスfi との間における(9)式
の重み付きユークリッド距離(D)の最小値を与える標
準パターンを最も類似する標準パターンとする。
D=f遍Tコπ−rt)” ・・・・・・・・・
(7)ここで、ユークリッド距離(D)の重みは各分割
領域に重み係数Wi l与えたものであり、本実施例で
は重み係数Wiは全て1とする。
(7)ここで、ユークリッド距離(D)の重みは各分割
領域に重み係数Wi l与えたものであり、本実施例で
は重み係数Wiは全て1とする。
なおまた、前記実施例においてはテーブルを採用するこ
とによって重心座標と分割座標とを対応づけたが、所定
の手順のフローチャートの演算処理を実行させることに
よっても対応づけることができる。この場合のフローチ
ャートラ第5図に示す。なお、第5図における除算の結
果はすべて小数点以下切シ捨てである。
とによって重心座標と分割座標とを対応づけたが、所定
の手順のフローチャートの演算処理を実行させることに
よっても対応づけることができる。この場合のフローチ
ャートラ第5図に示す。なお、第5図における除算の結
果はすべて小数点以下切シ捨てである。
第5図において、ステップS1で重心個数■を分割数N
Xで割った数RILL を求め、ステップS2゜S3で
Mx/′NXノ剰余R1とそ(7)R,(D剰余Rx
k求める。又、ステップS4で分割数の中央値4′f。
Xで割った数RILL を求め、ステップS2゜S3で
Mx/′NXノ剰余R1とそ(7)R,(D剰余Rx
k求める。又、ステップS4で分割数の中央値4′f。
求め、ステップS5.S6で分割番号ki と重心番号
MptOにセットする。又、ステップS7゜S8.S9
で、分割番号ki’i1つ増加する毎に、前に設定され
ているR、ilつAじ、重心番号M。
MptOにセットする。又、ステップS7゜S8.S9
で、分割番号ki’i1つ増加する毎に、前に設定され
ているR、ilつAじ、重心番号M。
f、Mtずつ増加させる。ステップSIOで剰余Rsz
負でないことを調べ、剰余R7が負でない限クステツブ
811で重心番号の数を1つ増し、ステップステップ8
13で現在の分割番号kiが中央値k。
負でないことを調べ、剰余R7が負でない限クステツブ
811で重心番号の数を1つ増し、ステップステップ8
13で現在の分割番号kiが中央値k。
より大きいか否かを判定し、大きい場合は重心番号を1
つ増し、小さい場合はステップS9で設定された重心番
号を、分割座標DX(Mp)t−決定し、ステップS1
4で分割番号kiが(NX−1)に一致したことを検出
して終了する。
つ増し、小さい場合はステップS9で設定された重心番
号を、分割座標DX(Mp)t−決定し、ステップS1
4で分割番号kiが(NX−1)に一致したことを検出
して終了する。
以上述べた本実施例の特徴抽出方式における入力文字パ
ターンの特徴情報である分割領域面積フトリクスの有効
性を以下に説明する。
ターンの特徴情報である分割領域面積フトリクスの有効
性を以下に説明する。
例えば第2図(a)に夫々示される「田」と「口」の入
力文字パターンにおいて、パターン中心部における垂直
ストロークと水平ストロークの交差の有無という両パタ
ーンの相異性が分割領域面積マトリクスの[特徴要素B
ES(5,4)において顕著な差となってるられれ、分
割領域面積マトリクスが文字図形パターンの差異を有効
に反映していることが明らかである。
力文字パターンにおいて、パターン中心部における垂直
ストロークと水平ストロークの交差の有無という両パタ
ーンの相異性が分割領域面積マトリクスの[特徴要素B
ES(5,4)において顕著な差となってるられれ、分
割領域面積マトリクスが文字図形パターンの差異を有効
に反映していることが明らかである。
この例において、BES(4,4)、BES(4,5)
、BES (5、5)においても同様である。
、BES (5、5)においても同様である。
また、分割領域面積マトリクスなる特徴は、重−心座標
系列を利用して分割された各分割領域における文字線の
密度を表わすもので原文字図形パターンの二次元の性質
を表わす。したがって前記従来技術の(3)の方式で示
した正規化分割領域長系列なる特徴のような、本来二次
元の性質を持つ原文字図形パターンを一次元の性質で表
わすものに比べ、本実施例の分割領域面積、ff )
IJクスなる特徴は、安定な特徴であり、本実施例では
より安定に、即ちより正確に文字図形の特徴を抽出する
ことができる。
系列を利用して分割された各分割領域における文字線の
密度を表わすもので原文字図形パターンの二次元の性質
を表わす。したがって前記従来技術の(3)の方式で示
した正規化分割領域長系列なる特徴のような、本来二次
元の性質を持つ原文字図形パターンを一次元の性質で表
わすものに比べ、本実施例の分割領域面積、ff )
IJクスなる特徴は、安定な特徴であり、本実施例では
より安定に、即ちより正確に文字図形の特徴を抽出する
ことができる。
以上のように本実施例によれば入力文字パターンの走査
と所定の演算により得られ、二次元の性質を表わす分割
領域面積マトリクス全文字の特徴情報としたので、簡単
な処理で高速かつ正確に文字(図形、記号等を含む)の
特徴を抽出することができる。
と所定の演算により得られ、二次元の性質を表わす分割
領域面積マトリクス全文字の特徴情報としたので、簡単
な処理で高速かつ正確に文字(図形、記号等を含む)の
特徴を抽出することができる。
(発明の効果)
以上詳細に説明したように本発明によれば、従来の特徴
情報抽出方式における、輪郭追跡や細線化等の複雑なパ
ターン処理を行なうことなく、入力文字図形パターンを
走査するだけで得られる所定の2つの軸上における黒ビ
ット数分布から、重心を利用して二次元の性質を表わす
分割領域面積マトリクスを特徴情報としているので、簡
単な処理で高速かつ正確に文字図形の特徴を抽出すこと
ができる。従って、本発明の特徴抽出方式を文字図形認
識装置に採用すれば、簡単な処理で高速かつ正確な文字
図形認識が期待できる。
情報抽出方式における、輪郭追跡や細線化等の複雑なパ
ターン処理を行なうことなく、入力文字図形パターンを
走査するだけで得られる所定の2つの軸上における黒ビ
ット数分布から、重心を利用して二次元の性質を表わす
分割領域面積マトリクスを特徴情報としているので、簡
単な処理で高速かつ正確に文字図形の特徴を抽出すこと
ができる。従って、本発明の特徴抽出方式を文字図形認
識装置に採用すれば、簡単な処理で高速かつ正確な文字
図形認識が期待できる。
第1図は本発明の特徴抽出方式を採用した文字図形認識
装置示す機能ブロック図、第2図は入力文字パターン例
と、重心座標系列1分割座標系列及び分割領域長系列と
の関係を示す図、第3図は重心座標系列と分割座標系列
との対応関係を示す図、第4図は分割座標系列と分割領
域面積マドIJクスとの対応関係を示す図、第5図は分
割座標系列の他の決定方法を示すフローチャートでろる
。 1・・・光入力、2・・・光電変換部、3・・・パター
ンレジスタ、4・・・文字枠検出部、5・・・文字投影
作成部、6・・・重心検出部、7・・・文字枠分割点決
定部、8・・・分割領域面積計算部、9・・・識別部、
1o・・・辞書メモリ、11・・・出力端子
装置示す機能ブロック図、第2図は入力文字パターン例
と、重心座標系列1分割座標系列及び分割領域長系列と
の関係を示す図、第3図は重心座標系列と分割座標系列
との対応関係を示す図、第4図は分割座標系列と分割領
域面積マドIJクスとの対応関係を示す図、第5図は分
割座標系列の他の決定方法を示すフローチャートでろる
。 1・・・光入力、2・・・光電変換部、3・・・パター
ンレジスタ、4・・・文字枠検出部、5・・・文字投影
作成部、6・・・重心検出部、7・・・文字枠分割点決
定部、8・・・分割領域面積計算部、9・・・識別部、
1o・・・辞書メモリ、11・・・出力端子
Claims (1)
- 【特許請求の範囲】 媒体上の文字図形を読取つて2値化して得られるパター
ンを記憶する記憶手段を備え、前記パターンに基づいて
文字図形の特徴を抽出する特徴抽出方式において、 (a)前記パターンを走査して文字図形の外接枠を検出
する第1の検出手段、 (b)前記パターンを走査して所定の2つの軸に投影し
た各軸方向の黒ビット数分布を作成する作成手段、 (c)前記2つの軸方向の前記外接枠内の範囲で各黒ビ
ット数分布の重心座標を決定し、決定した各重心座標で
外接枠内の範囲を分割した各分割範囲に対し各黒ビット
数分布の重心座標を決定する過程を繰り返して各軸方向
の重心座標系列を検出する第2の検出手段、 (d)設定される分割数に基づいて、前記重心座標系列
に対応した各軸方向の分割座標系列を決定する決定手段
、 (e)前記分割座標系列で分割される前記外接枠内の分
割領域の面積を要素とする分割領域面積マトリクスを計
算する計算手段とを具備することを特徴とする特徴抽出
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62067969A JPH0656624B2 (ja) | 1987-03-24 | 1987-03-24 | 特徴抽出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62067969A JPH0656624B2 (ja) | 1987-03-24 | 1987-03-24 | 特徴抽出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63234372A true JPS63234372A (ja) | 1988-09-29 |
JPH0656624B2 JPH0656624B2 (ja) | 1994-07-27 |
Family
ID=13360314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62067969A Expired - Fee Related JPH0656624B2 (ja) | 1987-03-24 | 1987-03-24 | 特徴抽出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0656624B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995017734A1 (fr) * | 1993-12-21 | 1995-06-29 | Birds Systems Research Institute, Inc. | Procede et appareil destines a la reconnaissance de structures et procede de compilation d'un dictionnaire en vue de la reconnaissance de structures |
-
1987
- 1987-03-24 JP JP62067969A patent/JPH0656624B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995017734A1 (fr) * | 1993-12-21 | 1995-06-29 | Birds Systems Research Institute, Inc. | Procede et appareil destines a la reconnaissance de structures et procede de compilation d'un dictionnaire en vue de la reconnaissance de structures |
US5689584A (en) * | 1993-12-21 | 1997-11-18 | Bird Systems Research Institute, Inc. | Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary |
Also Published As
Publication number | Publication date |
---|---|
JPH0656624B2 (ja) | 1994-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160352B (zh) | 一种基于图像分割的工件金属表面文字识别方法及系统 | |
CN109740606B (zh) | 一种图像识别方法及装置 | |
JPH0420226B2 (ja) | ||
KR19990062829A (ko) | 문자열 추출 장치 및 패턴 추출 장치 | |
JP6856956B2 (ja) | 長距離高密度視覚マーカの検出および認識方法 | |
CN111275049A (zh) | 一种文字图像骨架特征描述符获取的方法及装置 | |
JPS63234372A (ja) | 特徴抽出方式 | |
JPS63238686A (ja) | 特徴抽出方式 | |
CN113435331B (zh) | 图像文字识别方法、系统、电子设备及存储介质 | |
JPS63234374A (ja) | 文字図形認識方式 | |
CN118115926B (zh) | 基于改进的沙漏网络的羽毛球场地区域分割与识别方法 | |
JPH0147829B2 (ja) | ||
JP2965165B2 (ja) | パターン認識方法及び認識用辞書作成方法 | |
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
JPS63228390A (ja) | 文字図形認識方式 | |
JPS63238685A (ja) | 文字図形認識方式 | |
JP2616994B2 (ja) | 特徴抽出装置 | |
JPH0147835B2 (ja) | ||
JPH02206894A (ja) | 文字認識方法 | |
JP2974167B2 (ja) | 文字の大分類認識方法 | |
JPH0580711B2 (ja) | ||
CN112001311A (zh) | 一种基于图形边缘检测实现手写数字识别的方法及装置 | |
CN115830607A (zh) | 基于人工智能的文本识别方法、装置、计算机设备及介质 | |
KR20240138730A (ko) | 문자 인식 방법 및 이를 수행하기 위한 장치 | |
JPS6019287A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |