JPH0250284A - 特徴抽出回路 - Google Patents
特徴抽出回路Info
- Publication number
- JPH0250284A JPH0250284A JP63180283A JP18028388A JPH0250284A JP H0250284 A JPH0250284 A JP H0250284A JP 63180283 A JP63180283 A JP 63180283A JP 18028388 A JP18028388 A JP 18028388A JP H0250284 A JPH0250284 A JP H0250284A
- Authority
- JP
- Japan
- Prior art keywords
- character
- information
- distance
- interest
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、文字識別装置において必要となる、文字の
特徴抽出回路に関する。
特徴抽出回路に関する。
第5図は特徴量抽出方法の従来例を説明するための説明
図である。すなわち、識別しようとする文字パターンP
について文字枠Wとサブ文字枠W1〜W8を設定し、各
サブ文字枠内に存在する文字パターンPの面積大1〜A
8を求め、これらを総合して文字パターンPの特徴量と
するものである。なお、この様に抽出された特徴量は、
各文字毎に予め定義され九サブ文字枠毎の標準面積とそ
の蔦差からなる辞書と比較され、着目入力文字の識別が
行なわれる。
図である。すなわち、識別しようとする文字パターンP
について文字枠Wとサブ文字枠W1〜W8を設定し、各
サブ文字枠内に存在する文字パターンPの面積大1〜A
8を求め、これらを総合して文字パターンPの特徴量と
するものである。なお、この様に抽出された特徴量は、
各文字毎に予め定義され九サブ文字枠毎の標準面積とそ
の蔦差からなる辞書と比較され、着目入力文字の識別が
行なわれる。
しかし、上記の如き特徴量抽出方法では、管理された紙
上に活字で記録された文字パターン等に対しては有効で
あるが、文字線幅が大きく変化する捺印文字などでは、
各サブ文字枠で面積のバラツキが大きくなシ、適用でき
なくなるという問題がある。
上に活字で記録された文字パターン等に対しては有効で
あるが、文字線幅が大きく変化する捺印文字などでは、
各サブ文字枠で面積のバラツキが大きくなシ、適用でき
なくなるという問題がある。
したがって、この発明は文字線幅が変化しても安定に文
字特徴量を抽出し得る、特徴抽出回路を提供することを
目的とする。
字特徴量を抽出し得る、特徴抽出回路を提供することを
目的とする。
文字パターン列を撮像し、画素毎に2wX化して得られ
る画像データから着目する1文字領域を決定してその特
徴量を抽出すべく、まず1文字領域を複数領域に均等分
割する領域分割手段と、該領域分割手段からの分割領域
情報によシ分割領域毎に着目パターンの輪郭を追跡して
各輪郭点の座標位置を求める輪郭追跡手段と、該輪郭追
跡手段からの位置情報によυ分割領域毎の着目パターン
の外接長方形を求める外接長方形抽出手段と、該外接長
方形抽出手段からの矩形位置情報によシ矩形の中心位置
座標を求める中心座標抽出手段と、該中心座標抽出手段
からの中心位置情報によ〕中心位置間の距離を求める距
離抽出手段と、該距離抽出手段からの距離情報を相対圧
′離情報に正規化する正規化手段とを設け、該相対距離
情報を着目文字の特徴量として出力する。
る画像データから着目する1文字領域を決定してその特
徴量を抽出すべく、まず1文字領域を複数領域に均等分
割する領域分割手段と、該領域分割手段からの分割領域
情報によシ分割領域毎に着目パターンの輪郭を追跡して
各輪郭点の座標位置を求める輪郭追跡手段と、該輪郭追
跡手段からの位置情報によυ分割領域毎の着目パターン
の外接長方形を求める外接長方形抽出手段と、該外接長
方形抽出手段からの矩形位置情報によシ矩形の中心位置
座標を求める中心座標抽出手段と、該中心座標抽出手段
からの中心位置情報によ〕中心位置間の距離を求める距
離抽出手段と、該距離抽出手段からの距離情報を相対圧
′離情報に正規化する正規化手段とを設け、該相対距離
情報を着目文字の特徴量として出力する。
または、上記輪郭追跡手段と外接長方形抽出手段のかわ
りに、上記領域分割手段からの分割領域情報によシ各分
割領域内着目パターンの投影処理を行う投影処理手段を
設け、上記中心座標抽出手段によシ投影情報から各分割
領域毎に着目パターンの中心位置を求めるようにしても
良い。
りに、上記領域分割手段からの分割領域情報によシ各分
割領域内着目パターンの投影処理を行う投影処理手段を
設け、上記中心座標抽出手段によシ投影情報から各分割
領域毎に着目パターンの中心位置を求めるようにしても
良い。
上記相対距離情報を特徴量とすることによシ、文字線幅
の影響を殆んど受けないようにじ、安定な文字窮識がで
きるようにする。
の影響を殆んど受けないようにじ、安定な文字窮識がで
きるようにする。
第1図はこの発明の1実施例を示すブリック図、第2図
はこの発明が適用される文字読取装置を示す全体構成図
である。
はこの発明が適用される文字読取装置を示す全体構成図
である。
先ず、第2図から説明する。同図において、1は入力で
′ちυ、例えば紙に記録された文字パターン列である。
′ちυ、例えば紙に記録された文字パターン列である。
2は入力1を光電変換によシミ気信号に変換するテレビ
カメラ等のスキャナであυ、3はスキャナ2からの出力
に対して種々の操作を施し、背景と文字パターンをディ
ジタル的に10−画素”と11一画素”に変換する2m
化回路である。4は2匝化回路3からの出力を、入力イ
メージ1にしたがって記憶するメモリであシ、ここでは
1ペ一ジ分を記憶するので、ページメモリと呼ぶことに
する。5はページメモリ4に記憶されている文字パター
ン列から、着目文字1文字分のパターン領域を読み出す
1文字切出し回路でちる。
カメラ等のスキャナであυ、3はスキャナ2からの出力
に対して種々の操作を施し、背景と文字パターンをディ
ジタル的に10−画素”と11一画素”に変換する2m
化回路である。4は2匝化回路3からの出力を、入力イ
メージ1にしたがって記憶するメモリであシ、ここでは
1ペ一ジ分を記憶するので、ページメモリと呼ぶことに
する。5はページメモリ4に記憶されている文字パター
ン列から、着目文字1文字分のパターン領域を読み出す
1文字切出し回路でちる。
なお、1文字領域の決定の仕方については、ここでは%
に関係がないので説明は省略する。6は1文字切出し回
路5により切り出される1文字パターンについて、サブ
文字枠(サブウィンドウ)毎に輪郭追跡をして輪郭点情
報を得、サブ文字枠毎に外接長方形の中心位置座標を求
め、これからさらに各中心座標間の距離を抽出し、文字
パターンの特徴量を得る特徴抽出回路である。この回路
6については後述する。7は特徴抽出回路6からの着目
文字バタ了ンの特徴屋について、予め設定登録しである
標準文字に対する各@微量を示す辞書との照合を行ない
、文字を識別する識別回路である。8は識別回路7から
の1文字ごとの識別結果を蓄積1編集する編集回路であ
り、必要に応じて外部への出力を行なう。
に関係がないので説明は省略する。6は1文字切出し回
路5により切り出される1文字パターンについて、サブ
文字枠(サブウィンドウ)毎に輪郭追跡をして輪郭点情
報を得、サブ文字枠毎に外接長方形の中心位置座標を求
め、これからさらに各中心座標間の距離を抽出し、文字
パターンの特徴量を得る特徴抽出回路である。この回路
6については後述する。7は特徴抽出回路6からの着目
文字バタ了ンの特徴屋について、予め設定登録しである
標準文字に対する各@微量を示す辞書との照合を行ない
、文字を識別する識別回路である。8は識別回路7から
の1文字ごとの識別結果を蓄積1編集する編集回路であ
り、必要に応じて外部への出力を行なう。
次に、第1図の特徴抽出回路につき説明する。
同図において、61杜着目1文字分のイメージを記憶し
、輪郭追跡等のためにランダムアクセスが可能な1文字
メモリである。62はメモリ61の文字枠を9領域に分
割する所である(A参照;各領域をサブウィンドウと呼
ぶ)。63はサブウィンドウに従ってメモリ61から着
目輪郭画素とその隣接画素情報を取り出し、所定方向(
例えば反時計方向)に次の輪郭点を順次決定し、着目パ
ターンの輪郭点情報を得る輪郭追跡部である(B参照)
。この輪郭追跡動作は、サブクイ/ドウ毎(SW1〜S
W9 )に行なわれる。64は輪郭追跡部63からの情
報によシ、着目パターンの外接長方形を抽出するところ
である。この場合、最大で9つの外接長方形ができる(
C参照ン。65は外接長方形抽出部64からの情報によ
シ、サブウィンドウ毎に中心座標を求める中心座標抽出
部である(Dβ照)。66は中心座標抽出部65からの
情報によシ、各サブウィンドウ毎の中心座標間距離を求
めるところである(Eひ照)。
、輪郭追跡等のためにランダムアクセスが可能な1文字
メモリである。62はメモリ61の文字枠を9領域に分
割する所である(A参照;各領域をサブウィンドウと呼
ぶ)。63はサブウィンドウに従ってメモリ61から着
目輪郭画素とその隣接画素情報を取り出し、所定方向(
例えば反時計方向)に次の輪郭点を順次決定し、着目パ
ターンの輪郭点情報を得る輪郭追跡部である(B参照)
。この輪郭追跡動作は、サブクイ/ドウ毎(SW1〜S
W9 )に行なわれる。64は輪郭追跡部63からの情
報によシ、着目パターンの外接長方形を抽出するところ
である。この場合、最大で9つの外接長方形ができる(
C参照ン。65は外接長方形抽出部64からの情報によ
シ、サブウィンドウ毎に中心座標を求める中心座標抽出
部である(Dβ照)。66は中心座標抽出部65からの
情報によシ、各サブウィンドウ毎の中心座標間距離を求
めるところである(Eひ照)。
第3図にサブウィンドウと中心座標、距離との関係を示
す。これは、サブウィンドウがLW1〜LW9と9つち
る場合の例で、その各々の中心座標が01〜C9、中心
座標間距離がt1〜t12でそれぞれ示されている。な
お、こ〜ではサブウィンドウを9つにしたが、この数に
限定されないことは云う迄もない。また、こ〜で求めら
れた距離t、〜t、2は、中心座標間距離変換部67で
正規化処理され、これが特徴値LC1〜LC12として
出力される(F参照)。
す。これは、サブウィンドウがLW1〜LW9と9つち
る場合の例で、その各々の中心座標が01〜C9、中心
座標間距離がt1〜t12でそれぞれ示されている。な
お、こ〜ではサブウィンドウを9つにしたが、この数に
限定されないことは云う迄もない。また、こ〜で求めら
れた距離t、〜t、2は、中心座標間距離変換部67で
正規化処理され、これが特徴値LC1〜LC12として
出力される(F参照)。
第4図はこの発明の他の実施例を示すブロック図である
。これは、第1図の輪郭追跡部63および外接長方形抽
出部64のかわりに投影処理部68を設け、サブウィン
ドウ毎に着目文字パターンのX方向、Y方向の投影パタ
ーンをとり、これを利用して中心座標抽出部65Aにょ
)中心位置座標を求めるもので、その他は第1図と全く
同様でるる。なお、距離の正規化を行うに当たり、こ〜
ではその正規化係数の例として、文字高さが考えられる
。つまり、文字の大きさにより文字の高さに違いがある
ことを利用するものである。いずれにしても、特徴デー
タ量の削減はメモリ容量の増大化を防止する上で望まし
い。
。これは、第1図の輪郭追跡部63および外接長方形抽
出部64のかわりに投影処理部68を設け、サブウィン
ドウ毎に着目文字パターンのX方向、Y方向の投影パタ
ーンをとり、これを利用して中心座標抽出部65Aにょ
)中心位置座標を求めるもので、その他は第1図と全く
同様でるる。なお、距離の正規化を行うに当たり、こ〜
ではその正規化係数の例として、文字高さが考えられる
。つまり、文字の大きさにより文字の高さに違いがある
ことを利用するものである。いずれにしても、特徴デー
タ量の削減はメモリ容量の増大化を防止する上で望まし
い。
以上の如き特徴値を抽出することによバ文字線幅の変動
、文字の切れや文字の傾き変動に対し安定な特@艦を得
ることができ、その結果、精度の高い文字識別が可能と
なる。
、文字の切れや文字の傾き変動に対し安定な特@艦を得
ることができ、その結果、精度の高い文字識別が可能と
なる。
この発明によれは、2次元的な文字パターンに対しサブ
ウィンドウ毎に輪郭追跡処理または投影処理をして中心
座標間距離を抽出し、これを正規化して着目文字パター
ンの特徴値とするようにしたので、文字線幅の変動等に
影響されることなく、安定な特徴ffiを得ることがで
き、その結果、高精度の文字識別が可能となる利点がも
たらされる。
ウィンドウ毎に輪郭追跡処理または投影処理をして中心
座標間距離を抽出し、これを正規化して着目文字パター
ンの特徴値とするようにしたので、文字線幅の変動等に
影響されることなく、安定な特徴ffiを得ることがで
き、その結果、高精度の文字識別が可能となる利点がも
たらされる。
第1図はこの発明の1実施例を示すブロック図、第2図
はこの発明が適用される文字読取装置を示す全体構成図
、第3図はサブウィンドウと゛中心座標、中心座標間距
離の関係を説明するための説明図、第4図はこの発明の
他の実施例を示すブロック図、第5図は特徴量抽出方法
の従来例を説明するための説明図である。 符号説明 1・・・・・・入力、2・・・・・・スキャナ、3・・
・・・・2値化回路、4・・・・・・ページメモリ、5
・・・・・・1文字切り出し回路、6・・・・・・特徴
抽出回路、7・・・・・・識別回路、8・・・・・・編
集回路、61・・・・・・1文字メモリ、62・曲・9
領域分割部、63・・・・・・輪郭追跡部、64・・・
・・・外接長方形抽出部、65.65A・・・・・・中
心座標抽出部、66・・・・・・距離抽出部、67・・
・・・・距離変換部(正規化部)、68・・・・・・投
影処理部、C4〜C4゜・・・・・・中心座標、t、〜
”12・・曲中心座標間距離、LW1〜LW?・・・・
・・サブウィンドウ。 π 1 図 生計打量出カ化C1〜LC12,1 第 3 図 冨2 図 I4 図 特fW量tn(LCI−LCI2) 圧力
はこの発明が適用される文字読取装置を示す全体構成図
、第3図はサブウィンドウと゛中心座標、中心座標間距
離の関係を説明するための説明図、第4図はこの発明の
他の実施例を示すブロック図、第5図は特徴量抽出方法
の従来例を説明するための説明図である。 符号説明 1・・・・・・入力、2・・・・・・スキャナ、3・・
・・・・2値化回路、4・・・・・・ページメモリ、5
・・・・・・1文字切り出し回路、6・・・・・・特徴
抽出回路、7・・・・・・識別回路、8・・・・・・編
集回路、61・・・・・・1文字メモリ、62・曲・9
領域分割部、63・・・・・・輪郭追跡部、64・・・
・・・外接長方形抽出部、65.65A・・・・・・中
心座標抽出部、66・・・・・・距離抽出部、67・・
・・・・距離変換部(正規化部)、68・・・・・・投
影処理部、C4〜C4゜・・・・・・中心座標、t、〜
”12・・曲中心座標間距離、LW1〜LW?・・・・
・・サブウィンドウ。 π 1 図 生計打量出カ化C1〜LC12,1 第 3 図 冨2 図 I4 図 特fW量tn(LCI−LCI2) 圧力
Claims (1)
- 【特許請求の範囲】 1)文字パターン列を撮像し画素毎に2値化して得られ
る画像データから着目する1文字領域を決定してその特
徴量を抽出する特徴抽出回路において、 1文字領域を複数の領域に均等分割する領域分割手段と
、 該分割領域毎に着目文字パターンの輪郭を追跡して各輪
郭点の座標位置を求める輪郭追跡手段と、該各輪郭点の
座標位置情報から分割領域毎に着目文字パターンの外接
長方形をそれぞれ求める外接長方形抽出手段と、 該各外接長方形の位置情報から各々の中心位置をそれぞ
れ求める中心位置抽出手段と、 該各中心位置情報から中心位置間の距離をそれぞれ求め
る距離抽出手段と、 該距離情報を相対距離情報に正規化する正規化手段とを
設け、 該相対距離情報を着目文字パターンの特徴量として出力
することを特徴とする特徴抽出回路。 2)文字パターン列を撮像し画素毎に2値化して得られ
る画像データから着目する1文字領域を決定してその特
徴量を抽出する特徴抽出回路において、 1文字領域を複数の領域に均等分割する領域分割手段と
、 該領域分割手段からの分割領域情報により各分割領域毎
に着目パターンの投影処理を行う投影処理手段と、 該投影処理手段からの投影情報により各分割領域内着目
パターンの中心位置座標をそれぞれ求める中心位置抽出
手段と、 該各中心位置情報から中心位置間の距離をそれぞれ求め
る距離抽出手段と、 該距離情報を相対距離情報に正規化する正規化手段と、 を設け、該相対距離情報を着目文字パターンの特徴量と
して出力することを特徴とする特徴抽出回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63180283A JPH0250284A (ja) | 1988-05-18 | 1988-07-21 | 特徴抽出回路 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63-119088 | 1988-05-18 | ||
JP11908888 | 1988-05-18 | ||
JP63180283A JPH0250284A (ja) | 1988-05-18 | 1988-07-21 | 特徴抽出回路 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0250284A true JPH0250284A (ja) | 1990-02-20 |
Family
ID=26456887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63180283A Pending JPH0250284A (ja) | 1988-05-18 | 1988-07-21 | 特徴抽出回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0250284A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537963A (en) * | 1994-09-02 | 1996-07-23 | Honda Giken Kogyo Kabushiki Kaisha | Valve operating system for multi-cylinder internal combustion engine |
US5592907A (en) * | 1994-08-25 | 1997-01-14 | Honda Giken Kogyo Kabushiki Kaisha | Valve operating system for multi-cylinder internal combustion engine |
JP2014228801A (ja) * | 2013-05-24 | 2014-12-08 | 富士通セミコンダクター株式会社 | 検出装置及びプログラム |
-
1988
- 1988-07-21 JP JP63180283A patent/JPH0250284A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592907A (en) * | 1994-08-25 | 1997-01-14 | Honda Giken Kogyo Kabushiki Kaisha | Valve operating system for multi-cylinder internal combustion engine |
US5537963A (en) * | 1994-09-02 | 1996-07-23 | Honda Giken Kogyo Kabushiki Kaisha | Valve operating system for multi-cylinder internal combustion engine |
JP2014228801A (ja) * | 2013-05-24 | 2014-12-08 | 富士通セミコンダクター株式会社 | 検出装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW202024997A (zh) | 二維碼識別方法、裝置及設備 | |
US7277584B2 (en) | Form recognition system, form recognition method, program and storage medium | |
JP3006466B2 (ja) | 文字入力装置 | |
JPH0250284A (ja) | 特徴抽出回路 | |
US11151342B2 (en) | Code information reading apparatus and method for calculating a detection frequency of a code in a plurality of images | |
KR102102394B1 (ko) | 문자 인식을 위한 영상 전처리 장치 및 방법 | |
JP2001167225A (ja) | Ccdカメラを用いたバーコード認識装置 | |
JPS622382A (ja) | 画像処理方法 | |
JP2858560B2 (ja) | 文書読み取り装置 | |
JPH07120392B2 (ja) | 文字パターン切り出し装置 | |
JPS63293691A (ja) | 特徴抽出回路 | |
JP2605807B2 (ja) | 特徴抽出方式 | |
JPH11184965A (ja) | 帳票識別登録装置 | |
JPH07141465A (ja) | 文書画像の傾き検出方法 | |
JP3142950B2 (ja) | 線分認識方式 | |
JP3009237B2 (ja) | 特徴抽出方法 | |
JP2929710B2 (ja) | 文字読み取り方法 | |
JP2887803B2 (ja) | 文書画像処理装置 | |
JP3084833B2 (ja) | 特徴抽出装置 | |
JPH04260980A (ja) | 図形認識装置 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP2917365B2 (ja) | 文字画像の特徴抽出方法及び装置 | |
JP2504373B2 (ja) | 文字認識装置 | |
JPH07168911A (ja) | 文書認識装置 | |
JP2864815B2 (ja) | 画像特徴情報統合装置 |