JPH11120291A - パタン認識システム - Google Patents

パタン認識システム

Info

Publication number
JPH11120291A
JPH11120291A JP9284918A JP28491897A JPH11120291A JP H11120291 A JPH11120291 A JP H11120291A JP 9284918 A JP9284918 A JP 9284918A JP 28491897 A JP28491897 A JP 28491897A JP H11120291 A JPH11120291 A JP H11120291A
Authority
JP
Japan
Prior art keywords
pattern
threshold value
feature
character
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9284918A
Other languages
English (en)
Inventor
Masako Usui
雅子 碓井
Kazumi Suzuki
和美 鈴木
Akizo Kadota
彰三 門田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9284918A priority Critical patent/JPH11120291A/ja
Publication of JPH11120291A publication Critical patent/JPH11120291A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】認識時間短縮のための類似度演算打ち切りのし
きい値を自動で設定でき、また入力パタン毎に適したし
きい値を設定できるパタン認識システムを提供する。 【解決手段】入力されたパタンから複数の特徴を抽出
し、特徴毎に入力パタンの特徴とすべての標準パタンの
特徴との間で照合をとり、類似度を求める。そこで得ら
れた類似度の分布からしきい値を自動に設定し、各類似
度としきい値とを比較して候補パタンの絞り込みを行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学文字読み取り
装置において対象となるカテゴリ数が多い漢字等のパタ
ン認識方式に関するものである。
【0002】
【従来の技術】認識方式に関する従来技術としては、特
公平5−57633公報に記載された技術がある。この
技術では、入力パタンと辞書中の標準パタンの特徴を比
較して入力パタンに最も近い標準パタンを見つける、い
わゆる整合処理を特徴毎に独立して行っており(階層整
合)、各階層の整合処理においてどの特徴を用いるか
は、妨害パタンとの類似度の差が顕著となる分類能力の
高い特徴順で標準パタン毎に定めている。またしきい値
も標準パタン毎に定めており、入力パタンに対する各標
準パタンとの類似度を計算した際、得られた類似度がし
きい値以下であった標準パタンに対しては、次階層以降
における整合処理を行わないものとすることで、高速な
整合処理を行っている。
【0003】ユーザー字形読み取りについては、一般に
ユーザーによる辞書の追加という手法が広く使用されて
いる。これは、ユーザーの筆記した字形パタンから特徴
を抽出し、この特徴を標準の辞書またはユーザー専用の
辞書に登録するものである。
【0004】
【発明が解決しようとする課題】上記特公平5−576
33号公報に記載の認識システムの場合、各標準パタン
毎にしきい値を設定する必要がある。漢字のような対象
パタンが多い場合、各々の変形パタンを考慮すると膨大
な数のしきい値が必要となるが、このしきい値設定作業
は自動的に実行することが困難であり、光学文字読取り
装置の開発に多大のコストがかかる。また入力パタンと
標準パタンの類似度は、手書き文字のように入力パタン
の形が一様でない場合は大きく変動し、各標準パタンに
対して一意なしきい値では必ずしも適当な値にはならな
い。
【0005】ユーザー字形読み取りの問題としては、辞
書はあらかじめ特徴の類似したカテゴリごとにクラスタ
リングされているが、ユーザー字形の学習のため新たな
マスクを追加すると、特徴空間に新たな因子が加わるこ
とによって元の辞書のバランスが崩れるという問題点が
ある。また辞書を追加することによるメモリ、処理時間
の増加も問題として挙げられる。
【0006】そこで本発明の第1の目的は、従来の問題
点を解決するため、しきい値設定の手間が少なく、かつ
任意の入力パタンに対しても次層に送る候補数を最小に
する適当なしきい値を取るパタン認識システムを提供す
ることにある。
【0007】また第2の目的は、メモリ、処理時間に影
響が少なく、標準の辞書のバランスを崩すことなく、ユ
ーザー字形パタンの学習を行えるシステムを提供するこ
とである。
【0008】
【課題を解決するための手段】上記第1の目的を達成す
るため、入力パタンと標準パタンの特徴を照合し、類似
度を求める。比較照合して得られたすべての類似度の分
布と、推定される特徴ごとの正解パタンの存在領域か
ら、入力パタンごとにしきい値を設定する。
【0009】また第2の目的を達成するには、正解候補
を絞り込む過程において指定パタンが候補から落とされ
る特徴のしきい値設定を任意に設定し直せるようユーザ
ーインターフェイスを設ける。
【0010】
【発明の実施の形態】以下、本発明の実施例を詳細に説
明する。
【0011】図1は、本発明の一実施例を示すパタン認
識装置のシステム構成図である。このパタン認識装置
は、イメージスキャナや通信回線を介して画像を入力す
る画像入力部101、文字部分の切り出しやノイズ除去
を行う前処理部102、入力パタンの形状特徴を抽出す
る特徴抽出部103、入力パタンと標準パタンを比較す
る整合部104、入力パタン毎にしきい値を設定するし
きい値設定部105、あらかじめ抽出されている標準パ
タン特徴や各カテゴリに対する特徴の分類能力順を記憶
する認識辞書部106、ユーザー指定時には手動でしき
い値が設定できるユーザーインターフェイス部108、
および整合部によって選択されたパタンを認識結果とし
て出力する結果出力部107を装備している。
【0012】図1において、光電変換によって電気信号
に変換された文字パターンが画像入力部101より入力
され、多値のパタンとして前処理部102に供給され
る。
【0013】前処理部102は多値パタンとして表示さ
れた帳票イメージを2値化し、1文字毎に文字パタンを
切り出す。この際に大きさ、傾きの正規化、ノイズを除
去するための平滑化等の処理が行われる。前処理部によ
り必要な前処理を施された文字パタンは特徴抽出部10
3に送られる。特徴抽出部103では、送られた文字パ
タンから文字の形状を表す特徴が抽出される。使用する
特徴の例としては、文字のストロークの長さや角度、位
置、ストロークの分布、背景部の状態などがある。認識
の基準となる文字(標準パタン)についても、あらかじ
め同じような処理を行って特徴を取り出し、その特徴を
辞書106に記憶しておく。
【0014】前記特徴抽出後、整合部104にて入力パ
タンと辞書106中に記憶された標準パタンを複数の特
徴を用いて比較する。整合部の各階層では、一つの特徴
での照合比較が終了すると、しきい値設定部106にて
しきい値を設定し、このしきい値から候補の絞り込みを
行い、適した標準パタンのみを次階層に送る。整合部で
はこの階層整合処理を順次行ってゆき、最終的に入力パ
タンに最も近い標準パタンを選び出す。結果出力部10
7では前記整合部で選ばれたパタンを正解パタンとして
出力する。
【0015】ユーザーインターフェイス部108では、
通常自動で設定されるしきい値を、任意の値に設定す
る。ユーザー指定により、特定の字形パタンの各層にお
ける照合結果を類似度分布表として表示する。ユーザー
はその結果から対象パタンが含まれる領域を限定し、適
当なしきい値を設定する。
【0016】図2は入力パタンによるしきい値の差の説
明図である。201、202のような手書き文字の場
合、203に示すように同じ標準パタン群に対してでも
類似度の分布が大きく異なる。このため一意なしきい値
ではなく、204、205のように入力パタン毎で類似
度の分布に合ったしきい値を設定する。ここではしきい
値設定の指標として候補数に占める割合SHjを用いてお
り、この値はあらかじめ各特徴毎に求めて辞書106に
記憶しておくものとする。
【0017】図3、図4に文字パタン形状特徴の例を示
す。図3(a)は上下または左右方向のストロークの交
差する回数を基準とした特徴(ストローク密度特徴)を
示しており、図3(b)は文字パタン周辺の白の面積を
基準とする特徴(ペリフェラル特徴)、図3(c)は漢
字パタン画像を分割し(ここでは16分割)、分割され
た各メッシュ中の黒画素数を基準とする特徴(概形特
徴)を示している。図4は図3(c)と同様に分割され
たメッシュ中で4つの方向、すなわち上下および左右方
向、斜め(ここでは右45°、左45°)方向に対する
ストロークの方向の度合いを基準とした特徴(4方向特
徴)を示している。
【0018】図5は整合部における階層整合処理と各階
層で用いられる特徴の関係を示している。階層整合処理
は501のように一つの特徴ごとに層として独立に行わ
れるため、各層がいずれの特徴を用いて比較照合を行う
かは標準パタン毎で異なって良い。このため502に示
すように、あらかじめカテゴリ毎で分類能力の高い特徴
順を登録しておき、その順序で特徴比較を行うことによ
って、候補数を大幅に絞り込むことができる。ここでi
を標準パタン順、jを層順を表し、i=1,2,...k、j=1,
2,...,nである。またSPi標準パタン、SPijはSPiの特
徴群を表す。
【0019】図6は各層整合処理の流れを示している。
各層では入力パタンIPの特徴Ipjと標準パタンSPiの特
徴SPijとの間で照合をとり、類似度Sijを得る。この
動作を標準パタンが尽きるまで続ける(ステップ601
〜ステップ603)。この後ステップ604にて、標準
パタン群を得られた類似度順に並べる。ステップ605
では、あらかじめ特徴毎にさだめた正解パタンが存在す
る割合SHjを辞書106から読込み、ステップ606に
て類似度の高い方から全体のSHjの標準パタンを適合パ
タンとして決定した後、ステップ607にてその適合パ
タンを次階層へ送る。以下、第n層に至るまで前記手順
で整合処理を行い、候補パタンを絞り込んでいく。
【0020】なお、実施例では対象を文字に限定した
が、対象が音声や画像であっても、同じ扱いが可能であ
ることは勿論である。
【0021】
【発明の効果】以上説明したように、本発明によれば、
漢字のように対象カテゴリの多いパタン認識において
も、個々の標準パタンに対し手間をかけることなくしき
い値を設定することができ、任意の入力パタンに対して
も候補パタン数を最小にする適当なしきい値を設定する
ことで高速に整合処理を行うことが可能である。
【0022】また従来の辞書のバランスを崩すことな
く、ユーザー指定の文字パタンの読み取り学習を行うこ
とが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すパタン認識方式の機能
ブロック図
【図2】入力パタンによるしきい値差説明図
【図3】本発明に用いられる特徴例説明図(1)
【図4】本発明に用いられる特徴例説明図(2)
【図5】整合部における階層整合処理説明図
【図6】階層整合部の動作フローチャート
【符号の説明】
204 入力パタン1のしきい値 205 入力パタン2のしきい値 501 整合部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力されたパタンから複数の形状特徴を抽
    出する手段と、前記入力パタン形状特徴と比較する各標
    準パタン形状特徴を記憶する手段、前記標準パタン形状
    特徴と同じ数だけ直列に接続された階層整合手段、およ
    び前記階層整合手段の各層で入力パタンと標準パタンの
    特徴を照合し、これより得られた類似度に対ししきい値
    以上の標準パタンのみを次の層に候補として送ることを
    特徴とするパタン認識システムにおいて、入力パタン毎
    に正解候補が含まれる分布領域を推定し、それにより分
    布範囲のしきい値を設定することで次層の整合処理に送
    る候補パタン数を最小にしたことを特徴とするパタン認
    識システム。
  2. 【請求項2】特許請求項1記載のパタン認識システムに
    おいて、ユーザーが指定した入力文字の字形パタンと正
    解カテゴリから、正解候補の分布を表示し、ユーザーに
    よって任意のしきい値設定が可能なことを特徴とするユ
    ーザー字形学習システム。
JP9284918A 1997-10-17 1997-10-17 パタン認識システム Pending JPH11120291A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9284918A JPH11120291A (ja) 1997-10-17 1997-10-17 パタン認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9284918A JPH11120291A (ja) 1997-10-17 1997-10-17 パタン認識システム

Publications (1)

Publication Number Publication Date
JPH11120291A true JPH11120291A (ja) 1999-04-30

Family

ID=17684752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9284918A Pending JPH11120291A (ja) 1997-10-17 1997-10-17 パタン認識システム

Country Status (1)

Country Link
JP (1) JPH11120291A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006288532A (ja) * 2005-04-07 2006-10-26 Nintendo Co Ltd ゲームプログラム
JP2010092119A (ja) * 2008-10-03 2010-04-22 Fujitsu Ltd パラメタ制御装置、パラメタ制御プログラム及び多段照合装置
JP2010224481A (ja) * 2009-03-25 2010-10-07 Toshiba Corp 類似区間検出装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006288532A (ja) * 2005-04-07 2006-10-26 Nintendo Co Ltd ゲームプログラム
US8558792B2 (en) 2005-04-07 2013-10-15 Nintendo Co., Ltd. Storage medium storing game program and game apparatus therefor
JP2010092119A (ja) * 2008-10-03 2010-04-22 Fujitsu Ltd パラメタ制御装置、パラメタ制御プログラム及び多段照合装置
JP2010224481A (ja) * 2009-03-25 2010-10-07 Toshiba Corp 類似区間検出装置

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US4757551A (en) Character recognition method and system capable of recognizing slant characters
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
US4524454A (en) Method of assigning direction code to boundary picture element in character recognition system
EP0933719A2 (en) Image processing method and apparatus
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
KR0186025B1 (ko) 후보 문자 분류 방법
JPH11120291A (ja) パタン認識システム
JPS60153574A (ja) 文字読取方法
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
Chiou et al. Recognition of Chinese business cards
JP2004094644A (ja) 画像処理装置、画像処理方法、記憶媒体及びプログラム
JPS60153575A (ja) 文字読取方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
KR950011065B1 (ko) 문자 인식방법
JPH03126188A (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JPH0557633B2 (ja)
JPH02166583A (ja) 文字認識装置
Ahmed et al. A novel intelligent system for defining similar symbols
Chhabra Neural network based text recognition for engineering drawing conversion
JPH06231310A (ja) 文字認識装置における文字認識方法
JPH0816725A (ja) 文字認識装置及び方法
JPS61188679A (ja) ストローク近似直線抽出による文字認識装置及び方法
JPH0327488A (ja) 文字認識装置