JP2812391B2 - パターン処理方法 - Google Patents

パターン処理方法

Info

Publication number
JP2812391B2
JP2812391B2 JP63242212A JP24221288A JP2812391B2 JP 2812391 B2 JP2812391 B2 JP 2812391B2 JP 63242212 A JP63242212 A JP 63242212A JP 24221288 A JP24221288 A JP 24221288A JP 2812391 B2 JP2812391 B2 JP 2812391B2
Authority
JP
Japan
Prior art keywords
pattern
input
unit
minimum value
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63242212A
Other languages
English (en)
Other versions
JPH0291779A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63242212A priority Critical patent/JP2812391B2/ja
Publication of JPH0291779A publication Critical patent/JPH0291779A/ja
Application granted granted Critical
Publication of JP2812391B2 publication Critical patent/JP2812391B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明はパターン処理方法、例えば入力したパターン
情報に対応する候補文字を抽出するパターン処理方法に
関するものである。
[従来の技術] 従来、パターン認識装置は第5図に示す様な構成をし
ていた。
図中、51は音声信号・文字画像・図形画像等の入力パ
ターンを電気信号に変換する入力部、52は入力信号から
入力パターンに固有の特徴を抽出し特徴ベクトルを生成
する特徴抽出部である。尚、入力部51及び特徴抽出部52
の構成は公知の技術なので、その詳細は省略する。53は
認識対象となるパターンのテンプレートとなる標準的な
値(標準ベクトル)を登録しておく辞書部である。標準
ベクトルは予め複数の学習データから特徴抽出部52と同
じアルゴリズムに従つて特徴抽出を行い、統計的処理に
よつて得られた平均値・標準偏差等の値から構成されて
いる。54は入力パターンの特徴ベクトルと辞書の標準ベ
クトルを比較し、各標準パターンとの距離を計算する照
合部、55は入力パターンに類似した標準ベクトルを選び
出すために、照合部54で得られた距離の値を小さい順に
並べ換え、距離の小さい方から複数個の標準ベクトルを
選び出すソーテイング部、56はソーテイング55部からの
出力をデイスプレイに表示したり、さらに他のデバイス
への転送を行う出力部である。
[発明が解決しようとしている課題] さて、上述した構成における従来例では、入力パター
ンに最も類似したパターンを選び出すためにソーテイン
グを行つているが、完全な順序付けを行うソーテイング
の場合、認識対象となるパターンの数をNとしたとき、
どんなアルゴリズムを用いてもO(NlogN)の計算量が
必要になる。また、距離が最も小さいパターン1個だけ
選び出すだけならばO(N)の計算量で済むが、実際に
は候補として複数個のパターンが必要なので、O(N〜
NlogN)の計算量を必要とし、Nが大きくなると非常に
処理時間がかかり、全体のスループツトを大きく低下さ
せるという欠点があつた。
本発明はかかる従来技術に鑑みなされたものであり、
入力したパターン情報に対応する確からしい標準パター
ンを高い確率で得ることを可能ならしめるパターン処理
方法を提供しようとするものである。
[課題を解決するための手段] この課題を解決するために本発明は以下に示す構成を
備える。
すなわち、 パターン情報を入力し、 前記入力したパターン情報を辞書に記憶されている標
準パターン情報と比較して類似度を算出し、 前記算出された類似度の最小値に基づいて認識候補文
字を選択する際の閾値を決定し、 前記算出した類似度のうち、前記決定された閾値の基
準を満たす類似度が得られた標準パターンを選択するこ
とを特徴とする。
[作用] かかる本発明の構成において、入力されたパターン情
報を、辞書に記憶されている標準パターンと比較して類
似度を算出し、その算出された類似度の最小値に基づい
て認識候補の文字を選択する際の閾値を決定する。そし
て、決定された閾値の基準を満たす類似度が得られた標
準パターンを選択する。
[実施例] 以下、添付図面に従つて本発明に係る実施例を詳細に
説明する。
<第1の実施例の説明(第1図〜第4図)> 第1図に本実施例のパターン認識装置のブロツク構成
図を示す。
図中の入力部1、特徴抽出部2、標準パターンを登録
しておく辞書部3、出力部9は第5図の従来例のそれぞ
れ51,52,53,56に同じである。
以下、照合部4よりその具体的な処理内容を説明す
る。
照合部4は、特徴抽出部2によつて入力パターンから
得られた特徴ベクトルfj(j=1,2,‥,N:Nは次元数)
と、標準パターンとして予め辞書に登録してある候補文
字kの標準ベクトルmk j(j=1,2,…,N;k=1,2,…,M:M
は認識対象カテゴリー数)との距離d(k)を次式で定
義されるシテイブロツク距離で算出する。
この距離計算は、すべての認識パターンの平均ベクト
ルに対して行われ、最小値検出部5では得られたd
(k)(k=1,2,…,M)の中で最小の値dminを選び出
す。具体的には、最小値検出部5は第1回目の式の計
算結果(=d(1))を最小値記憶部6に、無条件に最
小値dminとして記憶しておき、全てのkに対する式に
よるd(k)と比較していつて、小さい値を最小値記憶
部6に記憶更新する。すなわち、全ての標準ベクトルと
の照合が終えた時点での最小値記憶部6に記憶された値
が目的最小値dminとなるわけである。
こうして、標準ベクトルのとの最小値dminが決定する
と、閾値決定部8は、その最小値dminに基づいて候補選
択のための閾値dtを決定する。
この、閾値dtを求めるための関数γ(dmin)の決定方
法について以下で説明する。
第2図は縦軸にd(k)を、そして横軸にdminをプロ
ツトして示したグラフである。ただし、正解(入力パタ
ーンが表している本当のパターン)に対する距離を
“○”印で、それ以外を“△”印で表わしている。尚、
以下の説明において、“○”印の正解に対する距離をdc
と言うことにする。
さて、ひとつの入力パターンに対してM個の標準パタ
ーンとの距離を求めるので、202或いは203の破線で囲ま
れた部分のようにひとつのdminに対してM個の点がプロ
ツトされる。ただし同図においては枠外に出る点はプロ
ツトしていない。
dminはd(k)(k=1,2,…,M)の中での最小値なの
で、すべての点(“○”印や“△”印)は直線201より
下にくることはない。特徴抽出及び距離計算が理想的に
行われていれば、領域202のように正解に対する距離dc
とdminは一致するが、実際の認識処理においては、両者
が必ず一致するとは限らず、領域203のように正解でな
い誤つたパターンに対するd(i)がdminとなるともあ
る(距離dcとdminが一致しない)。しかしながら、この
様な場合でも、正解に対する距離dcはdminに対してあま
り大きくはならないのが普通である。
ここで、多くの入力パターンに対する実験的解析の結
果得られたdcとdminの関係を第3図に示す。尚、同図に
おいても、正解(入力パターンが表している本当のパタ
ーン)に対するd(i)を“○”印で、それ以外を
“△”印で示した。
そこで、入力情報(パターン)に対する認識結果を出
力部9を介して出力するときには、いかにして出力する
候補数を少なくするかを決定するときには、これら多く
のケースに対する“○”印を含ませる曲線を閾値とすれ
ば良いことがわかる。
本実施例では距離dcを表す点(“○”印)をほぼすべ
て含み、それ以外の距離を表す点がなるべく含まれない
ようにするため、次の形の関数を選んだ。
この式で示したのが図示の曲線206であり、閾値決
定部8は、まさにこの関数に基づく閾値dt(=γ
(dmin))を発生する。
そして、候補選択部7は閾値決定部8よりの出力され
た閾値dtに従つて、d(k)<dtを満足するd(k)を
選び出し、候補として出力部9より出力する。
尚、式における定数a,bの値を変え、第4図の曲線2
07のようにグラフ全体を持ち上げると、候補に含まれな
い、すなわち誤つた候補の選択を行う確率は小さくなる
が、平均候補数は増加し候補絞り込みの確率が落ちるこ
とは第3図の分布より明らかである。一方、曲線208の
ようにグラフを下げると、逆の傾向になることがわか
る。このようにして装置の適用対象に応じてパラメータ
a,bを調節し、最適な候補選択率及び平均候補数を与え
ることが可能である。
例えば、パラメータa,bは入力する情報の種類(音
声、文字、図形画像等)或いは入力環境(手書き文字入
力である場合には、記入者の区別等)により、適宜変更
すれば良い。
尚、出力部9を介して出力された候補群はデイスプレ
イをはじめ、他のデバイスに出力される。
<第2の実施例の説明> 上述した実施例では候補を絞り込む関数としてdminの
みを用いたが、殆どのd(k)(k=1…N)がその閾
値dt内に納まる可能性がなくもない。そこで、本第2の
実施例では、この様な事態が発生した場合でも、より効
率的に絞り込む例を説明する。
第6図は第2の実施例の構成を表すブロツク図で、入
力部61、特徴抽出部62、辞書部63、照合部64、候補選択
部67及び出力部69は第1の実施例の該当部分と同じ構成
である。
最大値・最小値検出部65では、各標準ベクトルとの距
離d(k)(k=1,2,…,M)の中で最大値dmaxと最小値
dminを検出(最小値検出は先の第1の実施例と同様、最
大値検出はその原理を逆にすれば良いので説明は割愛す
る)し、最大値・最小値記憶部66に記憶する。閾値値決
定部68ではdmin及びdmaxの値を用いて次の式に従つて候
補選択のための閾値dtを決定する。
dt=dmin+(dmax−dmin)×θ ただし、θは0<θ<1を満たす実数で、本実施例で
はθ=0.1としている。
以上、説明した様に本実施例によれば、認識対象とな
る情報の認識し、その候補を出力するとき、正しい認識
結果を高い確立で含み、且つ出力される候補数を絞り込
むことが可能となる。
しかも二重ループとなるロジツクがないので高速の処
理が可能である。
また、絞り込み関数に入力したパターンと標準パター
ンとの距離の最大値dmax及び最小値dminによる閾値を発
生することにより、正しい認識結果を含み、しかも候補
数の絞り込みをより効率的にすることが可能となる。
尚、上述した第1及び第2の実施例における認識対象
となる入力情報は特に限定しなかつたが、これは本発明
の原理を用いれば、音声、文字、図形等の認識創始に適
応可能なためである。
また、閾値決定に係る算術式であるが、要は正しい認
識結果を含む様な関数であれば良いわけであるから、上
述した第1及び第2の実施例の及び式に限定される
ものではない。
また、本発明は特許請求の範囲に記載された範囲内で
適宜変更可能であつて、本実施例によつて、その構成が
限定されるものではない。
[実施例の効果] 以上説明したように本実施例によれば、認識対象とな
る情報の認識し、その候補を出力するとき、少ない出力
候補数中に正しい認識結果を高い確率で含ませることが
可能となる。
特に、絞り込み関数に入力したパターンと標準パター
ンとの距離の最大値及び最小値によつて、候補を絞り込
む閾値を発生することにより、正しい認識結果を含み、
しかも候補数の絞り込みをより効率的にすることが可能
になる。
[発明の効果] 以上説明したように本発明によれば、入力したパター
ン情報に対応する確からしい標準パターンを高い確率で
得ることが可能になる。
また、入力パターンと辞書の標準パターンとの類似度
から最も類似している標準パターンとの類似度と最も類
似していない標準パターン類似度との2つのデータに基
づいて認識候補の文字を選択する際の閾値を決定するの
で、類似殿ばらつきを考慮して、その時々で適切な閾値
を決定することができ、より適切な候補文字を選択する
ことが可能になる。
【図面の簡単な説明】
第1図は第1の実施例におけるブロツク構成図、 第2図は入力パターンと標準パターンとの距離の分布例
を示す図、 第3図は距離の分布と閾値決定のための関数曲線を示す
図、 第4図は閾値関数のパラメータ変化によるの変化を示す
図、 第5図は従来例の情報認識装置のブロツク構成図、そし
て、 第6図は第2の実施例のブロツク構成図である。 図中、1及び61……入力部、2及び62……特徴抽出部、
3及び63……辞書部、4及び64……照合部、5……最小
値検出部、6……最小値記憶部、7及び67……候補選択
部、8及び68……閾値決定部、9及び69……出力部、65
……最小値・最大値検出部、66……最小値・最大値記憶
部である。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】パターン情報を入力し、 前記入力したパターン情報を辞書に記憶されている標準
    パターン情報と比較して類似度を算出し、 前記算出された類似度の最小値に基づいて認識候補文字
    を選択する際の閾値を決定し、 前記算出した類似度のうち、前記決定された閾値の基準
    を満たす類似度が得られた標準パターンを選択すること
    を特徴とするパターン処理方法。
  2. 【請求項2】前記最小値に加えて、最大値にも基づいて
    閾値を決定することを特徴とする請求項1に記載のパタ
    ーン処理方法。
  3. 【請求項3】前記選択された標準パターンを候補文字と
    して前記入力パターンの認識を行うことを特徴とする請
    求項1に記載のパターン処理方法。
JP63242212A 1988-09-29 1988-09-29 パターン処理方法 Expired - Lifetime JP2812391B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63242212A JP2812391B2 (ja) 1988-09-29 1988-09-29 パターン処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63242212A JP2812391B2 (ja) 1988-09-29 1988-09-29 パターン処理方法

Publications (2)

Publication Number Publication Date
JPH0291779A JPH0291779A (ja) 1990-03-30
JP2812391B2 true JP2812391B2 (ja) 1998-10-22

Family

ID=17085915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63242212A Expired - Lifetime JP2812391B2 (ja) 1988-09-29 1988-09-29 パターン処理方法

Country Status (1)

Country Link
JP (1) JP2812391B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5318529A (en) * 1989-09-06 1994-06-07 Boston Scientific Corporation Angioplasty balloon catheter and adaptor
JP2011186780A (ja) * 2010-03-09 2011-09-22 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JPH0291779A (ja) 1990-03-30

Similar Documents

Publication Publication Date Title
JP3099797B2 (ja) 文字認識装置
JP2812391B2 (ja) パターン処理方法
JP2000105836A (ja) 論理構造抽出装置
JP2675303B2 (ja) 文字認識方法
JP3009078B2 (ja) 文字認識装置
JP2925303B2 (ja) 画像処理方法及び装置
US20240054769A1 (en) Model generation apparatus, model generation method, and recording medium
JP2974396B2 (ja) 画像処理方法及び装置
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JP2740506B2 (ja) 画像認識方法
JP3320083B2 (ja) 文字認識装置及び方法
JPH03217993A (ja) 文字サイズ認識装置
JPH0318987A (ja) 辞書登録方法
JP2851865B2 (ja) 文字認識装置
JP2976954B2 (ja) 文字切り出し候補生成装置
JPH03219384A (ja) 文字認識装置
JPH10254994A (ja) サイズ識別方法および記憶媒体
JPH06131503A (ja) 文字認識処理装置
JPH0436885A (ja) 光学式文字読取装置
JP2001283155A (ja) 文字認識装置および文字認識方法
JP2000082115A (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JPH06290304A (ja) 手書き英数字文字列画像分割方法
JP2017146841A (ja) 文字認識装置、文字認識方法、およびプログラム
JPH05298494A (ja) 文字認識方法及び装置
JPH07160820A (ja) 文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070807

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080807

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080807

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090807

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090807

Year of fee payment: 11