JPH0740288B2 - パターン認識方法 - Google Patents

パターン認識方法

Info

Publication number
JPH0740288B2
JPH0740288B2 JP61144488A JP14448886A JPH0740288B2 JP H0740288 B2 JPH0740288 B2 JP H0740288B2 JP 61144488 A JP61144488 A JP 61144488A JP 14448886 A JP14448886 A JP 14448886A JP H0740288 B2 JPH0740288 B2 JP H0740288B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
feature vector
matching
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61144488A
Other languages
English (en)
Other versions
JPS63780A (ja
Inventor
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61144488A priority Critical patent/JPH0740288B2/ja
Priority to KR1019870006252A priority patent/KR910000786B1/ko
Priority to CN87104862A priority patent/CN1010513B/zh
Publication of JPS63780A publication Critical patent/JPS63780A/ja
Publication of JPH0740288B2 publication Critical patent/JPH0740288B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔技術分野〕 本発明は文字などのパターンの認識方法に関し、さらに
詳細には、多層方向ヒストグラム法によるパターン認識
方法に関する。
〔従来技術〕
本出願人は、特願昭第59−202822号、特願昭第58−2028
25号などによって、多層方向ヒストグラム法によるパタ
ーン認識方法を既に提案している。本発明は、このよう
なパターン認識方法の改良に関するものである。
この多層方向ヒストグラム法によるパターン認識方法に
おいては、文字などのパターンの輪郭画素に方向コード
を付け、そのパターンの枠の各辺から対向する辺に向か
ってパターンを走査して白画素(背景)の次に出現する
方向コードを検出し、その方向コードをそれが走査線上
で何番目に検出されたかによって複数の層に層別する。
そして、パターンの枠内の分割領域毎に、ある層までの
層の方向コードのヒストグラムを求め、それぞれのヒス
トグラムを成分(特徴量)としてベクトルを、パターン
の特徴ベクトルとして用いる。
例えば、方向コードとして8種類のコードを付け、パタ
ーン枠内4×4のメッシュ領域に分割し、第1層および
第2層の方向コードまでを対象とすると、特徴ベクトル
の次元数は256(=4×4×2×8)となる。
辞書に関しては、同一パターンとしての複数のパターン
から同様の特徴ベクトルを抽出し、その平均を辞書パタ
ーン(標準パターン)の特徴ベクトルとして登録する。
また、本出願人は、層別のための走査方向も加味してさ
らに詳細に方向コードを層別する同様のパターン認識方
法に既に提案している。本発明は、このパターン認識方
法にも同様に適用できるものである。
さらに、パターン枠内の領域分割の方法は、前記先願の
明細書および図面に開示した方法に限らない。例えば、
前記先願のパターン認識方法と同様に、方向コードが均
等に分配されるようにパターン枠内をメッシュ分割し、
そのメッシュ領域を予め設定されたパラメータに従って
部分的に重ね合わせて、少ない領域に統合するような方
法を採用してもよい。このような領域分割方法を採用し
た多層方向ヒストグラム法によるパターン認識方法は、
本出願人により提案済みであるが、このようなパターン
認識方法にも、本発明は同様に適用し得るものである。
さて、このような多層方向ヒストグラム法によるパター
ン認識方法においては、未知パターンから抽出された特
徴ベクトルと、辞書パターンの特徴ベクトルとの対応次
元成分の距離または類似度の演算によって未知パターン
と辞書パターンとのマッチングを行い、距離の総和が最
小の辞書パターンまたは類似度の総和が最大の辞書パタ
ーンを認識結果とする。
しかし、前記のように特徴ベクトルの次元数が大きくな
ると、距離または類似度の演算量が多く、マッチング時
間が長くなるという問題があった。
〔目 的〕
したがって本発明の目的は、多層方向ヒストグラム法に
よるパターン認識方法において、マッチングの効率化を
図ることにある。
〔構 成〕
多層方向ヒストグラム法による特徴ベクトルは、パター
ン識別効果の大きい次元の成分と、その効果がそれほど
顕著でない次元の成分とがある。これに関し、説明を簡
単にするために、2次元の特徴ベクトルを考える。
次元数を2として多層方向ヒストグラム法による辞書を
作成した場合、“文",“字",“認",“識”のそれぞれの
辞書パターンの特徴ベクトルは、それぞれ第4図のg1,g
2,g3,g4のようになる。この例では、図から明らかなよ
うに、各特徴ベクトルは成分(特徴量)Aのほうが、成
分(特徴量)Bよりも分散(または標準偏差)が大き
い。換言すれば、成分Aのほうが、未知パターンに対す
る識別能力が高い。
さて、未知パターンと辞書パターンとのマッチングは、
基本的には、未知パターンと辞書パターンの特徴ベクト
ルの対応次元成分の距離または類似度を求め、その距離
の総和が最小または類似度の総和が最大の辞書パターン
を認識結果とするものである。こゝで、前記のような特
徴ベクトルの性質に着目すれば、パターン識別能力の高
い部分から優先的に距離または類似度を演算することに
より、パターン識別能力の高い一部の成分について距離
または類似度を演算した段階で、候補となり得ない辞書
パターンを排除し、候補となり得る辞書パターンを早い
段階で絞り込むことができるであろう。
また、多層方向ヒストグラム方による特徴ベクトルは、
その各次元成分の順番を入れ替えてもパターンの特徴は
保持されるという性質がある。
以上のような点に着目し、本発明にあっては、辞書作成
に際し、辞書パターンの特徴ベクトルの各次元毎の標準
偏差または分散を求め、各辞書パターンの特徴ベクトル
の成分を標準偏差または分散の大きい順に並べ替え、そ
のような並べ替え後の特徴ベクトルを辞書に登録してお
く。
例えば、多層方向ヒストグラム法により作成されたある
辞書パターンの特徴ベクトルが第5図の(a)に示すよ
うであったとする。そして、全辞書パターンについて計
算された標準偏差または分散の大きい順がX4,X1,X3,X7,
X5,X2,X8,X6,…であるとする。そうすると、この特徴ベ
クトルは、その各次元X1,X2,X3,…の成分が第6図の
(b)に示すように並べ替えられて辞書に登録される。
つまり、元の特徴ベクトルの次元X4の成分が並べ替え後
の特徴ベクトルの最上位の次元Y1の成分、次元X1の成分
が次位の次元Y2の成分、というように並べ替えられる。
そして、未知パターンから抽出された特徴ベクトルを、
辞書パターンの特徴ベクトルの成分の並べ替え順に従っ
て成分の並べ替えをおこなったのち、上位次元の成分か
ら優先的に辞書パターンの特徴ベクトルの対応次元成分
との距離または類似度の演算を行うことにより、未知パ
ターンと辞書パターンとのマッチングを行う。
このように、本発明によれば、特徴ベクトルのパターン
識別能力の高い成分を優先的に用いて、辞書パターンと
未知パターンとのマッチングが効率的に行われ、未知パ
ターンが認識される。
〔実施例〕
以下、本発明の実施例について図面を参照し説明する。
第1図は、本発明の一実施例の機能的構成を簡略化して
示す概要ブロック図である。この実施例においては、文
字パターンの認識が行われる。
図において、10は辞書である。この辞書10には、多層方
向ヒストグラム法により作成された辞書パターン(文
字)の特徴ベクトルを、前記のように、その各次元成分
を標準偏差の大きな順に並べ替えたものが登録されてい
る。
こゝで、K個の辞書パターンの中の辞書パターンkの次
元nの成分gknの標準偏差σは式 によって計算される。
なお、標準偏差の代わりに、その平行である分散の大き
い順に特徴ベクトルの成分を並べ替えてもよいことは明
らかである。
12は辞書作成時に作成される並べ替えテーブルである。
この並べ替えテーブル12には、前記のような辞書パター
ンの特徴ベクトルの成分の並べ替え前後の次元の対応表
が登録されている。
14は原稿から文字パターンを読み取り、文字パターン情
報を前処理部16に入力するパターン読み取り部である。
前処理部16は、入力文字パターンの文字切り出し、正規
化などの前処理を行い、処理後の文字パターンを1時毎
に特徴抽出部18に入力する部分である。
特徴抽出部18は、入力文字パターン(以下、未知パター
ンと称する)から前記多層方向ヒストグラム法により特
徴ベクトルを抽出する部分である。抽出された特徴ベク
トルは並べ替え部20に入力される。
この並べ替え部20は、並べ替えテーブル12を参照し、未
知パターンから抽出された特徴ベクトルの各成分を、辞
書パターンの特徴ベクトルの成分の並べ替え順と同じ順
で並べ替え、並べ替え後の特徴ベクトルをマッチング部
22に入力する。
このマッチング部22は、辞書パターンの特徴ベクトル
と、成分並べ替え後の未知パターンの特徴ベクトルとの
距離を上位次元から優先的に演算することにより、未知
パターンのマッチングを行って知パターン、つまり文字
を認識する部分である。
26はマッチング部22の認識結果を出力する出力部であ
る。
こゝで、マッチング部22の処理を、第2図に示すフロー
チャートを参照して説明する。
成分の並べ替え後の未知パターンの特徴ベクトルがマッ
チングに入力されると、辞書パターンの番号kが1にセ
ットされ(ステップ100)、その辞書パターンと未知パ
ターンとのマッチングが行われる。
まず、上位N次元までについて、その辞書パターンの特
徴ベクトルの各成分fkn(nは次元)と未知パターンの
特徴ベクトルYnとの距離の総和dkが計算される(ステッ
プ102)。そして、その距離が総和dkと閾値Thとの比較
判定が行われる(ステップ104)。
dk>Thであれば、その辞書パターンは候補パターン(候
補文字)とはなり得ないから、そのマッチングをこの段
階で打切り、辞書パターン番号kをインクリメントし
(ステップ106)、ステップ102に戻る。
ステップ104において、dk≧Thであれば、その辞書パタ
ーンは候補文字となり得るので、更に詳細なマッチング
を行う。すなわち、上位N次元の次の次元から最終次元
(こゝでは256次元としている)まで含めて、辞書パタ
ーンと未知パターンとの距離Dkが計算される(ステップ
108)。そして、それまでに得られている候補パターン
と未知パターンとの距離と、今度求められた距離とを比
較し、距離の小さい順に一定個数までの候補パターンを
残す(ステップ110)。そして、ステップ106を経由して
ステップ102に戻る。
最後の辞書パターンまでマッチングが終了すると、ステ
ップ107においてk≧MAXとなるから、候補パターン(文
字)のコードを出力し(ステップ112)、一つの未知パ
ターンに対するマッチング処理を完了する。
このように、この実施例では、パターン識別能力の高い
上記N次元に関して距離演算を行い、その距離を閾値と
比較することにより、未知パターンの候補パターンとな
り得ない辞書パターンを排除し、候補パターンとなり得
る辞書パターンについてだけ全次元を対象とした距離演
算を行う。つまり、上位N次元だけのマッチングにより
未知パターンの大分類(候補パターンの絞り込み)を行
い、無駄な距離演算を排除している。このような絞り込
みにより、無駄な距離演算が大幅に減少し、マッチング
効率の大幅な向上が達成される。
次に、本発明の他の実施例について説明する。この実施
例の全体的な機能的構成は前記実施例と同様であり、マ
ッチング部22におけるマッチング処理が一部相違するだ
けである。そこで、そのマッチング部22の処理について
だけ第3図のフローチャートを参照し、説明する。
成分の並べ替え後の未知パターンの特徴ベクトルがマッ
チング部に入力されると、辞書パターンの番号kが1に
セットされ(ステップ200)、その辞書パターンと未知
パターンとのマッチングが行われる。
まず、上位N1次元までについて、その辞書パターンの特
徴ベクトルの各成分fkn(nは次元)と未知パターンの
特徴ベクトルYnとの距離の総和dk1が計算される(ステ
ップ202)。そして、その距離の総和dk1と閾値Th1との
比較判定が行われる(ステップ204)。
dk1>Th1であれば、その辞書パターンは候補パターン
(候補文字)とはなり得ないから、そのマッチングをこ
の段階で打切り、辞書パターン番号kをインクリメント
し(ステップ206)、ステップ102に戻る。
つまり、上位N1次元までの距離演算によって、未知パタ
ーンの大分類(候補パターンの絞り込み)が行われ、こ
ゝで排除された辞書パターンのマッチングは、この段階
で終了する。
ステップ204においてdk1≦Th1であれば、上位の次元N2
(たゞしN2>N1である)までの距離の総和dk2が求めら
れる(ステップ208)。そして、dk2と閾値Th2との比較
判定が行われ(ステップ210)、dk2>Th2ならば、その
辞書パターンは候補パターンから排除され、ステップ20
6を介してステップ202に戻る。
つまり、上位N2次元までの距離演算により未知パターン
の中分類がなされ、そこで候補パターンから排除された
辞書パターンについては、この段階で終了する。
中分類で排除されない辞書パターンについて、さらに上
位の次元N3(たゞしN3>N2)についての距離の総和dk3
が計算され(ステップ212)、閾値Th3と比較判定される
(ステップ214)。dk3Th3であれば、この辞書パターン
は候補パターンから排除され、ステップ206を介してス
テップ202に戻る。
このようにして、未知パターンの小分類が行われる。こ
の小分類でも排除されない辞書パターンには、候補パタ
ーンの可能性が高いので、全次元についての距離の総和
Dkが求められ(ステップ216)、ステップ218に進む。こ
のステップは第2図のステップ110と同じ内容である。
最終の辞書パターンまでマッチングが終了すると、ステ
ップ207にて終了と判定され、候補パターン(文字)の
コードが出力され(ステップ220)、未知パターンのマ
ッチングが完了する。
このように、この実施例においては、距離演算に用いる
次元数を段階的に増やしながら未知パターンの候補パタ
ーンを3段階(大分類、中分類、小分類)で順次絞り、
各段階で候補パターンとなり得ない辞書パターンを順次
排除し、小分類でも排除されずに残った辞書パターンに
ついてだけ詳細マッチングを行う。したがって、前記実
施例におけるよりも無駄な距離演算が減少し、マッチン
グ効率がさらに向上する。
なお、前記各実施例においては、未知パターンと辞書パ
ターンとのマッチングに距離を用いたが、類似度を求め
て同様のマッチング処理を行ってもよいことは当然であ
る。
また、本発明は文字パターンに限らず、音声などパター
ン全般の認識に同様に適用できるものである。
〔効 果〕
以上の説明から明らかなように、本発明によれば、多層
方向ヒストグラム法によるマッチング効率を大幅に向上
し、パターン認識時間を短縮できるなどの効果が得られ
る。
【図面の簡単な説明】
第1図は本発明の一実施例の機能的構成を簡略化して示
す簡略ブロック図、第2図は同実施例におけるマッチン
グ処理の概略フローチャート、第3図は本発明の他の実
施例におけるマッチング処理の概略フローチャート、第
4図は多層方向ヒストグラム法における特徴ベクトルの
性質を説明するためのベクトル図、第5図は特徴ベクト
ルの成分並べ替えの説明図である。 10……辞書、12……並べ替えテーブル、 18……特徴抽出部、20……並べ替え部、 22……マッチング部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】多層方向ヒストグラム法によるパターン認
    識方法において、辞書パターンの特徴ベクトルはその成
    分を標準偏差または分散の大きい順に予め並べ替えた形
    で辞書に登録されており、未知パターンから抽出された
    特徴ベクトルは、辞書パターンの特徴ベクトルの成分の
    並べ替え順に従って成分が並べ替えられたのち、上位次
    元の成分から優先的に辞書パターンの特徴ベクトルの対
    応次元成分との距離または類似度が演算されることを特
    徴とするパターン認識方法。
  2. 【請求項2】上位のある次元までの距離または類似度の
    演算の結果によって、下位次元も含めた距離または類似
    度の演算を行うか否かが判定されることを特徴とする特
    許請求の範囲第1項に記載のパターン認識方法。
JP61144488A 1986-06-20 1986-06-20 パターン認識方法 Expired - Lifetime JPH0740288B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61144488A JPH0740288B2 (ja) 1986-06-20 1986-06-20 パターン認識方法
KR1019870006252A KR910000786B1 (ko) 1986-06-20 1987-06-19 패턴인식방식
CN87104862A CN1010513B (zh) 1986-06-20 1987-06-20 模式识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61144488A JPH0740288B2 (ja) 1986-06-20 1986-06-20 パターン認識方法

Publications (2)

Publication Number Publication Date
JPS63780A JPS63780A (ja) 1988-01-05
JPH0740288B2 true JPH0740288B2 (ja) 1995-05-01

Family

ID=15363492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61144488A Expired - Lifetime JPH0740288B2 (ja) 1986-06-20 1986-06-20 パターン認識方法

Country Status (1)

Country Link
JP (1) JPH0740288B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0348785Y2 (ja) * 1985-10-18 1991-10-17
JP5020513B2 (ja) * 2006-01-11 2012-09-05 シャープ株式会社 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
JP5498111B2 (ja) * 2008-10-10 2014-05-21 株式会社日立ソリューションズ 1対n認証装置及び1対n認証方法
JP6713681B1 (ja) * 2019-07-01 2020-06-24 アケハナ株式会社 社会人基礎力評価システム

Also Published As

Publication number Publication date
JPS63780A (ja) 1988-01-05

Similar Documents

Publication Publication Date Title
Konidaris et al. Keyword-guided word spotting in historical printed documents using synthetic data and user feedback
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
CN109583438A (zh) 电子图像的文字的识别方法及图像处理装置
JPH05225378A (ja) 文書画像の領域分割システム
Chi et al. Separation of single-and double-touching handwritten numeral strings
Keaton et al. Keyword spotting for cursive document retrieval
JPH0740288B2 (ja) パターン認識方法
JPH0740287B2 (ja) パターン認識方法
FRANKE Isolated handprinted digit recognition
KR910000786B1 (ko) 패턴인식방식
JPH0795336B2 (ja) 文字認識方式
JP2832928B2 (ja) 文字認識方法
JPH0711819B2 (ja) パターン認識方法
JP2766205B2 (ja) 文字認識装置
KR970002424B1 (ko) 후보문자분류방법
JP2984315B2 (ja) 認識装置
JPS61271586A (ja) 文字認識方式
CN114580569A (zh) 一种基于特征编码融合的建筑垃圾物料视觉识别方法
JPH10143612A (ja) 文字認識装置
JPH0546812A (ja) 文字の大分類認識方法
JPH0557633B2 (ja)
Lu et al. A background-thinning based algorithm for separating connected handwritten digit strings
JPH05258102A (ja) 文字/図形分離装置
JPS63292384A (ja) 文字認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term