JP3009237B2 - 特徴抽出方法 - Google Patents

特徴抽出方法

Info

Publication number
JP3009237B2
JP3009237B2 JP3087824A JP8782491A JP3009237B2 JP 3009237 B2 JP3009237 B2 JP 3009237B2 JP 3087824 A JP3087824 A JP 3087824A JP 8782491 A JP8782491 A JP 8782491A JP 3009237 B2 JP3009237 B2 JP 3009237B2
Authority
JP
Japan
Prior art keywords
sub
pattern
total number
small
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3087824A
Other languages
English (en)
Other versions
JPH04299484A (ja
Inventor
石井  博
Original Assignee
日本電気ホームエレクトロニクス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気ホームエレクトロニクス株式会社 filed Critical 日本電気ホームエレクトロニクス株式会社
Priority to JP3087824A priority Critical patent/JP3009237B2/ja
Publication of JPH04299484A publication Critical patent/JPH04299484A/ja
Application granted granted Critical
Publication of JP3009237B2 publication Critical patent/JP3009237B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学式文字読取り装置
などに利用される特徴抽出方法に関するものである。
【0002】
【従来の技術】光学式文字読取り装置(OCR)などに
利用される文字認識方法のうち方向特徴を用いるもの
は、照合対象のパターン群のそれぞれから予め方向特徴
パターンを抽出して登録しておき、これらと認識対象の
パターンから抽出した方向特徴パターンとを照合するこ
とにより文字認識を行うものである。この方向特徴パタ
ーンを用いる文字認識方法の一つとして、電子通信学会
論文誌 Vol.J 65 ーD No.5('82/5)に掲載された「手書
漢字の方向パターン・マッチング法による解析」と題す
る斎藤らの論文に記載されたものがある。上記論文によ
れば、方向特徴パターンの抽出は、文字パターンの輪郭
を追跡し着目する輪郭点の前後に近接する2個の輪郭点
を結ぶ微小輪郭線の方向を縦、横、斜めの4方向に量子
化したものをこの着目する輪郭点の方向特徴パターンと
して与えるものである。
【0003】また、他の方向特徴の抽出方法として、パ
ターンを1画素の線幅に細線化した後、この細線化パタ
ーンの各画素と周囲の画素との連結方向に基き方向特徴
を抽出するものが知られている。
【0004】
【発明が解決しようとする課題】上記従来の方向特徴パ
ターンの抽出手法によれば、パターン領域を小領域群に
分割するか否かにかかわらず、微小輪郭線上の輪郭画素
について方向特徴パターンの算定が行われる。このた
め、微小輪郭線の抽出と、方向特徴パターンの算定に多
大の処理ステップが必要になり、処理時間が長引くとい
う問題がある。
【0005】
【課題を解決するための手段】本発明の特徴抽出方法
は、特徴抽出対象のパターンを含む二次元空間を横長、
縦長及び斜め方向に長い小領域に分割し、各小領域内に
存在する黒又は白の画素数を方向特徴パターンとして抽
出すると共に、前記各小領域をその長手方向に沿う複数
のサブ小領域に等分割し、各サブ小領域内に含まれる黒
又は白の画素数を計数し、この計数値のうち所定の閾値
を越えたものだけを各サブ小領域にわたって加算するこ
とにより、前記各小領域内に存在する白又は黒の画素数
を算定するように構成されている。
【0006】特徴抽出に基く認識対象のパターンは、マ
トリクス状に配列された画素群から構成されている。一
例として、認識対象のパターンがマトリクス状に配列さ
れた32×32個の“1”又は“0”の画素群から構成
されるものとする。
【0007】この認識対象のパターンを含む二次元空間
が、図1(A)、(B)、(C)及び(D)に例示する
ように、横長の64個の小領域A0 〜A63、縦長の64
個の小領域B0 〜B63、右上がりの斜めに長い小領域C
0 〜C63及び左上がりの斜めに長い64個の小領域D0
〜D63に分割される。そして、各小領域についてその内
部に含まれる黒画素(“1”)の総数が計数される。
【0008】図2(A)に例示するように、認識対象の
パターンを構成する横方向の線分が存在する領域では、
横長の小領域Ai内に含まれる黒画素の総数が縦長の小
領域Bj、斜めに長い小領域Ck、D 内に含まれる黒
画素の総数よりも多くなる。また、図2(B)に例示す
るように、認識対象のパターンを構成する縦方向の線分
が存在する領域では、縦長の小領域Bj内に含まれる黒
画素の総数が横長の小領域や斜めに長い他の三つ小領域
内に含まれる黒画素の総数に比べて多くなる。同様に、
図2(C)と(D)に例示するように、認識対象のパタ
ーンを構成する右上がりや左上がりの斜めの線分が存在
する領域では、斜めに長い小領域CkとD に含まれる
黒画素の総数が他の三つの小領域内に含まれる画素デ−
タの総数よりも多くなる。
【0009】このように、横長、縦長及び斜めに長い小
領域のそれぞれについて内部に含まれる黒画素の総数を
算定することにより、パターンを構成する線分の方向
性、すなわち方向特徴パターンを容易に検出することが
できる。
【0010】横長の小領域A0 〜A63について算定され
た黒画素の総数LA0 〜LA63は、図3(A)に示すよ
うな方向特徴パターンとして保存される。同様に、縦長
の小領域B0 〜B63について算定された黒画素の総数L
0 〜LB63、右上がりの斜め方向の小領域C0 〜C63
について算定された黒画素の総数LC0 〜LC63、左下
がりの斜め方向小領域D0 〜D63について算定された黒
画素の総数LD0 〜LD63も、それぞれ図3(B)、
(C)及び(D)に示すように、方向特徴パターンとし
て保存される。
【0011】本発明によれば、上記各小領域内の黒画素
の総数の算定に際し、雑音の影響を防ぐ目的などで次の
ような工夫が凝らされる。
【0012】すなわち、図4に示すように、横長の小領
域Aiについては、その長手方向に沿う2個のサブ小領
域Ai1 とAi2 への等分割が行われる。また、縦長の
小領域Bjについては、その長手方向に沿う2個のサブ
小領域Bj1 とBj2 への等分割が行われる。煩雑化を
避けるため図示は省略するが、斜め方向の小領域につい
ても同様にその長手方向に沿う2個のサブ小領域への等
分割が行われる。そして、各小領域内で等分割された2
個のサブ小領域内のそれぞれにおいて独立に画素の総数
が計数される。さらに、各サブ小領域で独立に計数され
た画素の総数が所定の閾値と比較され、この画素の総数
が閾値以下のサブ小領域についてはこの画素の総数がゼ
ロと算定される。また、計数された画素の総数が所定の
閾値を越えるサブ小領域についてはこの総数が画素の総
数と算定される。最後に、2個のサブ小領域で算定され
た画素の総数が加算され、この加算値が着目する小領域
に含まれる画素の総数と算定される。
【0013】すなわち、図4に例示するように、正方形
の最小ブロックが1画素のサイズに対応すると共にこの
最小ブロックの面積の過半を黒画素が占めるか否かに応
じて各最小ブロック内の黒画素の存否が検出されるもの
とする。この場合、横長の小領域Aiの一方のサブ小領
域Ai1 内に含まれる黒画素の総数は9個となり、他方
のサブ小領域Ai2 内に含まれる黒画素の総数は0個と
なる。各サブ領域内の画素数の閾値を4個とすれば、サ
ブ領域Ai1 とAi2 内の黒画素の総数はそれぞれ9個
と0個であり、これらの加算値9個が小領域Ai内の黒
画素の総数として算定される。また、横長の小領域Bj
のサブ小領域Bj1 とBj2 内に含まれる黒画素の総数
はいずれも閾値に満たない1個であるため0個と見做さ
れ、これらの加算値0個が小領域Bj内の黒画素の総数
として算定される。
【0014】また、図5の例では、横長の小領域Aiの
サブ小領域Ai1 とAi2 に含まれる黒画素の総数はい
ずれも閾値4個に満たないため0個と見做され、小領域
Aiに含まれる画素総数は0個と算定される。縦長の小
領域Bjについても、同様に、画素総数は0個と算定さ
れる。このようにして、用紙の汚れやキズなどによって
生じた雑音が軽減される。
【0015】一方、認識対象のパターンと照合される複
数の登録パターンについても、図3(A)〜(D)と同
様な各小領域内の黒画素の総数に基づく方向特徴パター
ンが予め作成されている。この登録用の方向特徴パター
ンの作成に際しては、認識対象におけると同様にサブ小
領域への分割が行われる。
【0016】方向特徴パターンに基づくパターン照合に
際しては、例えば、各小領域内の黒画素の総数の差分の
総和 ΣδLAi +ΣδLBi +ΣδLCi +ΣδLD
i が算定され、この値が小さいほど高い優先順位の認識
候補となる。
【0017】あるいはまた、各小領域内の黒画素の総数
についてのユークリッド距離として Σ(δLAi 2 +Σ(δLBi 2 +Σ(δLCi 2 +Σ(δLDi 2 の平方根が算定され、この値が小さいほど高い優先順位
の認識候補となる。
【0018】さらには、横長、縦長、斜め方向に長い4
種類の64個の小領域(合計256個の小領域)に対応
した256次元の空間が想定され、各小領域内の画素数
の総和を長さとする256次元の方向特徴ベクトルが想
定される。そして、認識対象の文字パターンから作成さ
れた方向特徴ベクトルと照合対象の文字パターンから予
め作成されている方向特徴ベクトルとの内積が算定さ
れ、この内積を距離が除算した値が大きいほど高い優先
順位の認識候補が選択される。
【0019】
【実施例】図6は、本発明の一実施例の特徴抽出方法を
適用する文字認識装置の構成を示すブロック図であり、
1はCPU、2は文字パターンメモリ、3は方向特徴パ
ターンメモリ、4は登録方向特徴パターンメモリであ
る。
【0020】文字パターンメモリ2には、認識対象の文
字パターンがサイズの規格化を受けた状態で保持され
る。CPU1は、文字パターンメモリ2内の文字パター
ンの保持領域を横長、縦長などの各小領域に分割し、さ
らに各小領域内をサブ小領域に分割した走査することに
より画素デ−タを読出し、各小領域内に含まれる“1”
(黒画素)の総数を算定する。CPU1は、この算定結
果を、図3に例示するような方向特徴パターンとして方
向特徴パターンメモリ3に書込む。CPU1は、この方
向特徴パターンの抽出が終了すると、登録方向特徴パタ
ーンメモリ4に登録中の照合対象の方向特徴パターンを
一つずつ読出してメモリ3に保持中の抽出済みの方向特
徴パターンと照合する。この照合は、前述したように、
ユークリッド距離などに基づいて行われ、最小距離の登
録方向特徴パターンに該当する文字パターンが認識結果
として選択される。
【0021】以上、抽出された方向特徴パターンを直ち
に登録中の方向特徴パターンと照合する構成を例示し
た。しかしながら、本発明の主旨を逸脱しない範囲内
で、他の構成とすることもできる。
【0022】また、方向特徴パターンの抽出に際し各処
理領域内の黒画素の総数を計数する構成を例示した。し
かしながら、黒画素の代わりに白画素の総数を計数し、
同じく白画素について作成済みの登録パターンと照合す
る構成とすることもできる。
【0023】さらに、各小領域を2個のサブ小領域に等
分割する構成を例示したが、この小領域を3個以上の適
宜なサブ小領域に分割することもできる。
【0024】
【発明の効果】以上詳細に説明したように、本発明の特
徴抽出方法は、認識対象の文字パターンを含む二次元空
間を横長、縦長及び斜め方向に長い小領域に分割し各小
領域内に存在する画素デ−タの総数を方向特徴パターン
として抽出する構成であるから、従来装置と異なり微小
輪郭線の抽出とそれぞれについての方向特徴パターンの
算定が不要となり、処理ステップと処理時間が大幅に短
縮されるという効果が奏される。
【0025】また、本発明の特徴抽出方法は、各小領域
をその長手方向に沿う複数のサブ小領域に分割し、画素
数が所定の閾値を越えたサブ小領域のみについて画素数
の加算を行う構成であるから、雑音の影響を軽減しつつ
高精度の抽出を実現できるという効果も奏される。
【図面の簡単な説明】
【図1】本発明の構成と作用を説明するための概念図で
ある。
【図2】本発明の構成と作用を説明するための概念図で
ある。
【図3】本発明の構成と作用を説明するための概念図で
ある。
【図4】本発明の構成と作用を説明するための概念図で
ある。
【図5】本発明の構成と作用を説明するための概念図で
ある。
【図6】本発明の一実施例の文字認識装置の構成を示す
ブロック図である。
【符号の説明】
0 〜A63 分割された横長の小領域、 B0 〜B63 分割された縦長の小領域、 C0 〜C63 分割された斜め方向の小領域、 D0 〜D63 分割された斜め方向の小領域、 LA0 〜LA63 横長の小領域内の黒画素の総数 LB0 〜LB63 縦長の小領域内の黒画素の総数 LC0 〜LC63 斜め方向の小領域内の黒画素の総数 LD0 〜LD63 斜め方向の小領域内の黒画素の総数 Ai1 〜Ai2 横長の小領域Ai内で等分割されたサ
ブ小領域 Bj1 〜Bj2 縦長の小領域Bj内で等分割された縦
長の小領域
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/62

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 特徴抽出対象のパターンを含む二次元空
    間を横長、縦長及び斜め方向に長い小領域に分割し、
    記各小領域をその長手方向に沿う複数のサブ小領域に分
    割し、各サブ小領域内に含まれる黒又は白の画素数を計
    数し、この計数値のうち所定の閾値を越えたものだけを
    各サブ小領域にわたって加算することにより、前記各小
    領域内に存在する白又は黒の画素数を算定して、方向特
    徴パターンを抽出することを特徴とする特徴抽出方法。
  2. 【請求項2】 前記各小領域の分割は、前記各小領域を
    その長手方向に沿う複数のサブ小領域に等分割するもの
    であることを特徴とする請求項1記載の特徴抽出方法。
JP3087824A 1991-03-27 1991-03-27 特徴抽出方法 Expired - Lifetime JP3009237B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3087824A JP3009237B2 (ja) 1991-03-27 1991-03-27 特徴抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3087824A JP3009237B2 (ja) 1991-03-27 1991-03-27 特徴抽出方法

Publications (2)

Publication Number Publication Date
JPH04299484A JPH04299484A (ja) 1992-10-22
JP3009237B2 true JP3009237B2 (ja) 2000-02-14

Family

ID=13925705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3087824A Expired - Lifetime JP3009237B2 (ja) 1991-03-27 1991-03-27 特徴抽出方法

Country Status (1)

Country Link
JP (1) JP3009237B2 (ja)

Also Published As

Publication number Publication date
JPH04299484A (ja) 1992-10-22

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
EP0905643A2 (en) Method and system for recognizing handwritten words
JPH05242292A (ja) 分離方法
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
JP2926066B2 (ja) 表認識装置
JP3009237B2 (ja) 特徴抽出方法
CN112287769B (zh) 一种人脸检测方法、装置、设备和存储介质
JP3904397B2 (ja) 表認識方法
JP3095470B2 (ja) 文字認識装置
JP3077929B2 (ja) 文字切出し方式
JPS5951033B2 (ja) 図形基本要素抽出装置
JP2832928B2 (ja) 文字認識方法
JP2605807B2 (ja) 特徴抽出方式
JP2832035B2 (ja) 文字認識装置
JP3104355B2 (ja) 特徴抽出装置
JPH04299483A (ja) 特徴抽出装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS63131287A (ja) 文字認識方式
JP3080097B2 (ja) 平行線図形抽出方法
JPS622382A (ja) 画像処理方法
JPH0145669B2 (ja)
JP2954218B2 (ja) 画像処理方法及び装置
JPH03219384A (ja) 文字認識装置
JP2576494B2 (ja) 特徴抽出方式
JP2917396B2 (ja) 文字認識方式