JP2605807B2 - 特徴抽出方式 - Google Patents
特徴抽出方式Info
- Publication number
- JP2605807B2 JP2605807B2 JP63155608A JP15560888A JP2605807B2 JP 2605807 B2 JP2605807 B2 JP 2605807B2 JP 63155608 A JP63155608 A JP 63155608A JP 15560888 A JP15560888 A JP 15560888A JP 2605807 B2 JP2605807 B2 JP 2605807B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- component
- feature
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識、特に手書文字認識における特徴抽
出方式に関する。
出方式に関する。
(従来技術とその課題) 情報処理システムの多様化に伴ない様々なデータ入力
方法が要求されており、文字認識技術も有力なデータ入
力方法として実用化が進められている。しかし現在の文
字認識技術は、文字の読取り性能の点で人間に比べては
るかに劣っており、より高い文字認識性能を有する文字
読取り装置が望まれている。
方法が要求されており、文字認識技術も有力なデータ入
力方法として実用化が進められている。しかし現在の文
字認識技術は、文字の読取り性能の点で人間に比べては
るかに劣っており、より高い文字認識性能を有する文字
読取り装置が望まれている。
文字認識性能を高めるために、文字認識を構成する、
前処理,特徴抽出処理,分類・識別処理,後処理のそれ
ぞれにおいて改良が努められている。この中で、特徴抽
出処理については、方向性の特徴の有効性が例えば文献
電子情報通信学会論文誌(D),Vol.J65−D,No.5,pp.55
0〜557,斉藤,山田,山本「手書き漢字の方向パターン
・マッチング法による解析」等で示されている。従来か
ら知られている方向性の特徴の一般的な抽出方法では、
まず、文字パタン平面上で方向成分の分布を求め、次に
文字パタンを複数の部分領域に分割し、各部分領域内で
方向成分を統合する。文字パタンをこのように処理する
ことによって、方向成分の分布が圧縮された形成の方向
特徴パタンを抽出することができる。しかし、この処理
の中で領域分割の定め方が難しく、分割が細かいと、デ
ータ量が多く、かつ文字パタンの変形等を含む雑音に対
して過敏になるという問題点が生じ、分割が粗いと、文
字を分類・識別するための情報が失なわれて、類似した
文字の識別が困難になるという問題点が生じる。
前処理,特徴抽出処理,分類・識別処理,後処理のそれ
ぞれにおいて改良が努められている。この中で、特徴抽
出処理については、方向性の特徴の有効性が例えば文献
電子情報通信学会論文誌(D),Vol.J65−D,No.5,pp.55
0〜557,斉藤,山田,山本「手書き漢字の方向パターン
・マッチング法による解析」等で示されている。従来か
ら知られている方向性の特徴の一般的な抽出方法では、
まず、文字パタン平面上で方向成分の分布を求め、次に
文字パタンを複数の部分領域に分割し、各部分領域内で
方向成分を統合する。文字パタンをこのように処理する
ことによって、方向成分の分布が圧縮された形成の方向
特徴パタンを抽出することができる。しかし、この処理
の中で領域分割の定め方が難しく、分割が細かいと、デ
ータ量が多く、かつ文字パタンの変形等を含む雑音に対
して過敏になるという問題点が生じ、分割が粗いと、文
字を分類・識別するための情報が失なわれて、類似した
文字の識別が困難になるという問題点が生じる。
(課題を解決するための手段) 本発明によると、M×Nの格子状の配列として与えら
れる文字パタンを自動的に読取る光学的文字認識におい
て、該文字パタンの特徴を抽出する方式であって、M×
Nの文字パタンを格納する文字パタン記憶部と、前記文
字パタンを読取り、文字パタンの各画素に方向成分を割
当て、文字パタン上の方向成分の分布を示す方向パタン
を作成す方向抽出部と、前記方向抽出部の作成した方向
パタンを格納する方向パタン記憶部と、前記方向パタン
記憶部から方向パタンを読み込み、垂直方向成分は、垂
直方向成分抽出用に分割された縦長の部分領域内で統合
を行ない、水平方向成分は、水平方向成分抽出用に分割
された横長の部分領域内で統合を行ない、斜め方向の成
分は縦横等分割にした部分領域内で統合を行なうことに
よって文字認識のための方向特徴パタンを求める方向特
徴抽出部と、前記方向特徴抽出部から出力される方向特
徴パタンを格納する方向特徴記憶部とを具備する特徴抽
出方式を実現し、文字認識性能を高めることができる。
れる文字パタンを自動的に読取る光学的文字認識におい
て、該文字パタンの特徴を抽出する方式であって、M×
Nの文字パタンを格納する文字パタン記憶部と、前記文
字パタンを読取り、文字パタンの各画素に方向成分を割
当て、文字パタン上の方向成分の分布を示す方向パタン
を作成す方向抽出部と、前記方向抽出部の作成した方向
パタンを格納する方向パタン記憶部と、前記方向パタン
記憶部から方向パタンを読み込み、垂直方向成分は、垂
直方向成分抽出用に分割された縦長の部分領域内で統合
を行ない、水平方向成分は、水平方向成分抽出用に分割
された横長の部分領域内で統合を行ない、斜め方向の成
分は縦横等分割にした部分領域内で統合を行なうことに
よって文字認識のための方向特徴パタンを求める方向特
徴抽出部と、前記方向特徴抽出部から出力される方向特
徴パタンを格納する方向特徴記憶部とを具備する特徴抽
出方式を実現し、文字認識性能を高めることができる。
(作 用) 以下に本発明の原理について説明する。第2図(a)
は漢字の「墨」を表わす文字パタンと文字パタン領域、
第2図(b)と(c)はそれぞれ、文字パタン領域内の
「墨」の水平方向成分と垂直方向成分の分布パタンであ
る。従来は、この分布パタンから方向特徴パタンを求め
るために、文字パタン領域をm×nの部分領域に分割す
るが、各部分領域は、それぞれ正方形であった。しかし
「墨」のように水平成分が多い場合には、パタンの情報
を保存するために垂直方向の解像度が高いことが望まし
い。一方、垂直成分の多い文字の場合には、パタンの情
報を保存するために水平方向の解像度が高いことが望ま
しい。従って、水平方向成分の統合を行なうときには、
第3図(a)のように、各部分領域が横長の長方形にな
るように分割を行なって、各部分領域内で統合を行な
い、垂直方向成分の統合を行なうときには、第3図
(b)のように、各部分領域が縦長の長方形になるよう
に分割を行なって定まる各部分領域内で統合を行なうこ
とによって、パタンの情報を保存した方向特徴パタンが
得られる。この場合、斜め方向の成分の統合には従来通
り第3図(c)のように、各部分領域が正方形になるよ
うに分割を行なって、各部分領域内で統合を行なえばよ
い。例えば文字パタンが64×64の画素から成るとき、垂
直方向成分の方向特徴パタンの抽出には、縦4分割,横
16分割で部分領域を定め、水平方向成分の方向特徴パタ
ンの抽出には、縦16分割,横4分割で部分領域を定め、
斜め方向成分の方向特徴パタンの抽出には、縦8分割,
横8分割で部分領域を定め、それぞれの部分領域内で統
合を行なうことによって、文字認識のためにパタンの情
報が保存された方向特徴パタンを求めることができ、認
識性能の向上に役立つ。
は漢字の「墨」を表わす文字パタンと文字パタン領域、
第2図(b)と(c)はそれぞれ、文字パタン領域内の
「墨」の水平方向成分と垂直方向成分の分布パタンであ
る。従来は、この分布パタンから方向特徴パタンを求め
るために、文字パタン領域をm×nの部分領域に分割す
るが、各部分領域は、それぞれ正方形であった。しかし
「墨」のように水平成分が多い場合には、パタンの情報
を保存するために垂直方向の解像度が高いことが望まし
い。一方、垂直成分の多い文字の場合には、パタンの情
報を保存するために水平方向の解像度が高いことが望ま
しい。従って、水平方向成分の統合を行なうときには、
第3図(a)のように、各部分領域が横長の長方形にな
るように分割を行なって、各部分領域内で統合を行な
い、垂直方向成分の統合を行なうときには、第3図
(b)のように、各部分領域が縦長の長方形になるよう
に分割を行なって定まる各部分領域内で統合を行なうこ
とによって、パタンの情報を保存した方向特徴パタンが
得られる。この場合、斜め方向の成分の統合には従来通
り第3図(c)のように、各部分領域が正方形になるよ
うに分割を行なって、各部分領域内で統合を行なえばよ
い。例えば文字パタンが64×64の画素から成るとき、垂
直方向成分の方向特徴パタンの抽出には、縦4分割,横
16分割で部分領域を定め、水平方向成分の方向特徴パタ
ンの抽出には、縦16分割,横4分割で部分領域を定め、
斜め方向成分の方向特徴パタンの抽出には、縦8分割,
横8分割で部分領域を定め、それぞれの部分領域内で統
合を行なうことによって、文字認識のためにパタンの情
報が保存された方向特徴パタンを求めることができ、認
識性能の向上に役立つ。
(実施例) 第1図は本発明の構成の一実施例を示すブロック図で
ある。文字パタン記憶部1は、入力文字パタンを格納す
るもので、通常の記憶手段でよい。方向抽出部2は、入
力文字パタンを信号11として読込み、各方向ごとの方向
成分の分布パタンを抽出し信号12として各方向成分を出
力するもので、前出の文献等に抽出アルゴリズムが示さ
れており、通常の論理素子と記憶手段等を用いる従来技
術で容易に実現できる。方向パタン記憶部3は信号12と
して送られる各方向成分ごとの分布パタンを格納するも
ので、通常の記憶手段でよい。方向特徴抽出部4は各方
向成分ごとの分布パタンを信号13として入力し、作用の
項で説明した通り、水平方向成分については横長の長方
形の各部分領域内で水平方向分布パタンの画素の値の総
和を求めることによって統合を行ない、垂直方向成分に
ついては縦長の長方形の各部分領域内で垂直方向分布パ
タンの画素の値の総和を求めることによって統合を行な
い、斜め方向成分については正方形の各部分領域内で各
斜め方向の分布パタンの画素の値の総和を求めることに
よって統合を行ない、方向特徴パタンを抽出し、信号14
として出力するもので、通常の論理素子と記憶手段等を
用いる従来技術で容易に実現できる。方向特徴記憶部5
は前記方向特徴抽出部から信号15として出力された方向
特徴パタンを格納するもので通常の記憶手段でよい。
ある。文字パタン記憶部1は、入力文字パタンを格納す
るもので、通常の記憶手段でよい。方向抽出部2は、入
力文字パタンを信号11として読込み、各方向ごとの方向
成分の分布パタンを抽出し信号12として各方向成分を出
力するもので、前出の文献等に抽出アルゴリズムが示さ
れており、通常の論理素子と記憶手段等を用いる従来技
術で容易に実現できる。方向パタン記憶部3は信号12と
して送られる各方向成分ごとの分布パタンを格納するも
ので、通常の記憶手段でよい。方向特徴抽出部4は各方
向成分ごとの分布パタンを信号13として入力し、作用の
項で説明した通り、水平方向成分については横長の長方
形の各部分領域内で水平方向分布パタンの画素の値の総
和を求めることによって統合を行ない、垂直方向成分に
ついては縦長の長方形の各部分領域内で垂直方向分布パ
タンの画素の値の総和を求めることによって統合を行な
い、斜め方向成分については正方形の各部分領域内で各
斜め方向の分布パタンの画素の値の総和を求めることに
よって統合を行ない、方向特徴パタンを抽出し、信号14
として出力するもので、通常の論理素子と記憶手段等を
用いる従来技術で容易に実現できる。方向特徴記憶部5
は前記方向特徴抽出部から信号15として出力された方向
特徴パタンを格納するもので通常の記憶手段でよい。
本実施例では、各部分領域内での分布パタンの画素の
値の総和を求めることで、方向特徴パタンの抽出を説明
したが、方向特徴パタンの各成分の値の総和等で、各成
分の値を正規化して方向特徴パタンとすることもでき
る。この場合も、加算器,除算器等の追加が必要である
が、従来技術で容易に実現できる。
値の総和を求めることで、方向特徴パタンの抽出を説明
したが、方向特徴パタンの各成分の値の総和等で、各成
分の値を正規化して方向特徴パタンとすることもでき
る。この場合も、加算器,除算器等の追加が必要である
が、従来技術で容易に実現できる。
(発明の効果) 以上に詳しく説明したように本発明によれば、方向成
分ごとに部分領域を定めることで、文字パタンの情報を
保存して、雑音に過敏とならない方向特徴抽出が実現で
きる。そこで、本発明の特徴抽出方式を文字認識装置に
適用することにより、文字認識の性能を大幅に向上でき
る。
分ごとに部分領域を定めることで、文字パタンの情報を
保存して、雑音に過敏とならない方向特徴抽出が実現で
きる。そこで、本発明の特徴抽出方式を文字認識装置に
適用することにより、文字認識の性能を大幅に向上でき
る。
第1図は本発明の一実施例の構成を示すブロック図であ
る。第2図は文字パタンの水平方向成分の分布パタンと
垂直方向成分の分布パタンを例示する図、第3図は本発
明において方向特徴抽出のために行う領域分割の例を示
す図である。 図中、1は文字パタン記憶部、2は方向抽出部、3は方
向パタン記憶部、4は方向特徴抽出部、5は方向特徴記
憶部である。
る。第2図は文字パタンの水平方向成分の分布パタンと
垂直方向成分の分布パタンを例示する図、第3図は本発
明において方向特徴抽出のために行う領域分割の例を示
す図である。 図中、1は文字パタン記憶部、2は方向抽出部、3は方
向パタン記憶部、4は方向特徴抽出部、5は方向特徴記
憶部である。
Claims (1)
- 【請求項1】M×Nの格子状の配列として与えられる文
字パタンを自動的に読取る光学的文字認識において、該
文字パタンの特徴を抽出する方式であって、 M×Nの文字パタンを格納する文字パタン記憶部と、前
記文字パタン記憶部から文字パタンを読取り、文字パタ
ンの各画素に方向成分を割当て、文字パタン上の方向成
分の分布を示す方向パタンを作成する方向抽出部と、前
記方向抽出部の作成した方向パタンを格納する方向パタ
ン記憶部と、前記方向パタン記憶部から方向パタンを読
み込み、垂直方向成分は、垂直方向成分抽出用に分割さ
れた縦長の部分領域内で統合を行ない、水平方向成分
は、水平方向成分抽出用に分割された横長の部分領域内
で統合を行ない、斜め方向の成分は縦横等分割にした部
分領域内で統合を行なうことによって文字認識のための
方向特徴パタンを求める方向特徴抽出部と、前記方向特
徴抽出部から出力される方向特徴パタンを格納する方向
特徴記憶部とを具備する特徴抽出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63155608A JP2605807B2 (ja) | 1988-06-23 | 1988-06-23 | 特徴抽出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63155608A JP2605807B2 (ja) | 1988-06-23 | 1988-06-23 | 特徴抽出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01321589A JPH01321589A (ja) | 1989-12-27 |
JP2605807B2 true JP2605807B2 (ja) | 1997-04-30 |
Family
ID=15609744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63155608A Expired - Lifetime JP2605807B2 (ja) | 1988-06-23 | 1988-06-23 | 特徴抽出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2605807B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011083749A1 (ja) | 2010-01-06 | 2011-07-14 | 日本電気株式会社 | 学習装置、識別装置、学習識別システム及び学習識別装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4697670B2 (ja) * | 2005-01-05 | 2011-06-08 | 日本電気株式会社 | 識別用データ学習システム、学習装置、識別装置及び学習方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6327991A (ja) * | 1986-07-22 | 1988-02-05 | Ricoh Co Ltd | 入力情報認識装置用ヒストグラム作成方法 |
-
1988
- 1988-06-23 JP JP63155608A patent/JP2605807B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011083749A1 (ja) | 2010-01-06 | 2011-07-14 | 日本電気株式会社 | 学習装置、識別装置、学習識別システム及び学習識別装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH01321589A (ja) | 1989-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | A detailed review of feature extraction in image processing systems | |
US7295694B2 (en) | MICR-based optical character recognition system and method | |
GB2190778A (en) | Character recognition with variable subdivision of a character region | |
CN101751568A (zh) | 证件号码定位和识别方法 | |
JPH06215293A (ja) | 車番認識装置 | |
US5105470A (en) | Method and system for recognizing characters | |
den Hartog et al. | Knowledge-based segmentation for automatic map interpretation | |
US6035064A (en) | Apparatus and method for detecting and recognizing character line using simplified projection information | |
JP2605807B2 (ja) | 特徴抽出方式 | |
JP2859681B2 (ja) | 指紋データの2値化方法 | |
JP3009237B2 (ja) | 特徴抽出方法 | |
JPS62192886A (ja) | 文字認識装置における特徴量生成方法 | |
JP2663550B2 (ja) | 特徴抽出方式 | |
Elrajubi et al. | Angle features extraction of handwritten signatures | |
JP2917396B2 (ja) | 文字認識方式 | |
JP2674286B2 (ja) | 特徴抽出方式 | |
JP2695238B2 (ja) | 個人照合装置 | |
JP2564276B2 (ja) | パタ−ン認識方法および装置 | |
JP3329528B2 (ja) | ドキュメント読取り装置 | |
Rakshitha et al. | Latent Fingerprint Enhancement for Investigation | |
JPH06131496A (ja) | パターン正規化処理方法 | |
JPS6037649Y2 (ja) | 文字読取装置 | |
JPS6222186A (ja) | 図面読取り装置 | |
JP2792063B2 (ja) | 文字認識辞書作成方式 | |
JPH04299483A (ja) | 特徴抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080213 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090213 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090213 Year of fee payment: 12 |