JP4127730B2 - パターン認識装置及び方法 - Google Patents
パターン認識装置及び方法 Download PDFInfo
- Publication number
- JP4127730B2 JP4127730B2 JP18174698A JP18174698A JP4127730B2 JP 4127730 B2 JP4127730 B2 JP 4127730B2 JP 18174698 A JP18174698 A JP 18174698A JP 18174698 A JP18174698 A JP 18174698A JP 4127730 B2 JP4127730 B2 JP 4127730B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- pattern
- feature
- stroke
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、文字認識や図面読みとりなどのパターン認識処理を行なうパターン認識装置および方法に関する。
【0002】
【従来の技術】
近年、文字認識技術や図面読みとり技術の技術水準が向上し、計算機への情報入力手段として一般に用いられるようになってきた。これらの技術を用いることにより、従来は人手に頼っていた作業が大幅に省力化され、様々な文書情報の電子化が急速に進んでいる。
【0003】
【発明が解決しようとする課題】
技術水準が向上したとはいえ、未だに認識誤りが生じることは避けられず、最終的には人手による修正を行なう必要がある。この修正に要する人手をなるべく削減するためには、より高精度なパターン認識を行なうことが求められる。パターン認識の精度を上げるためには、認識の基礎となる特徴抽出処理において、認識に有用な情報を安定かつ高精度に抽出する必要があるが、近年、オンライン文字認識の研究の成果などから、ストロークの方向といった文字や図形の局所的な構造を表す特徴が認識に有効であることが確認されている。そこで、オフライン文字認識においても、画像パターンからストロークの部分を抽出し、かつその方向などのパラメータを安定に精度良く推定することができれば、認識精度の向上が期待できる。
【0004】
実際の文書画像や図面において、ストロークの形状は、様々な変形が加わるとともに、様々な方向に回転された形で現れる。このため、上記の特徴抽出処理を行なうためには回転不変な基本形状認識と、認識された基本形状の方向等といったパラメータの推定を行なう必要がある。
【0005】
【課題を解決するための手段】
本発明は、入力された画像パターンの各点の近傍においてその画像形状の種別を判別するための形状判別手段と、この形状判別手段により判別された形状の種別に応じて形状パラメータを推定するためのパラメータ推定手段と、前記形状判別手段で得られた形状の種別と、前記パラメータ推定手段で得られたパラメータとを基に特徴を抽出するための特徴抽出手段と、この特徴抽出手段において得られた特徴から入力パターンが属すべきカテゴリを決定するための認識手段とを有することを特徴とする。
【0006】
つまり、入力となる画像パターンの各点で、その近傍の画像パターンを複数のフィルタにより展開し、その展開係数をもとに近傍の画像パターンの形状を判別するとともにその方向の推定を行なう。こうして得られる方向パラメータを用いてパターン認識用の特徴を抽出し、オフラインパターン認識に適用することができる。
【0007】
【発明の実施の形態】
(発明の概要)
図1は本発明の実施例の構成を示すものである。本実施例で示されるパターン認識装置は、画像パターンの入力や認識結果の出力を行なう入出力部1と、入力パターンに対してフィルタ演算を施すフィルタ演算部2と、フィルタ演算により得られる展開係数により局所パターンがストローク形状か否かの判別を行なう形状判別部3と、ストローク形状の方向を規定するパラメータをフィルタの展開係数から推定するパラメータ推定部4と、形状判別部3で得られる形状情報とパラメータ推定部4で得られるパラメータから特徴を抽出する特徴抽出部5と、認識辞書7を用いて特徴抽出部5から得られる特徴を基に入力パターンの属すべきカテゴリを決定する認識部6とからなる。
【0008】
以下各処理部における処理の詳細を説明する。
(実施例)
フィルタ演算部2において行なわれる処理について述べる。本実施例におけるフィルタ演算部ではフィルタとして、
【0009】
【数1】
で表される3つの関数を2次元の正方格子上でサンプリングしたものを用いる。フィルタ2とフィルタ3は、互いに位相が1/4波長異なる同一形状のフィルタ対である。
【0010】
但し、フィルタは、フィルタ半径R以内でのみ値を持つ円形のパターンとし、(r,θ)は中心からの距離をr、角度をθとする曲座標系、mはフィルタ1の値の総和が0になるように定めた実数である。
【0011】
図示すると、フィルタ1,2,3は、それぞれ図2(a),図2(b),図2(c)のようになり、フィルタ1は凹凸の有無、フィルタ2,3は方向性の有無を検出することができる。
【0012】
まず、画像パターンを構成する各要素の近傍パターンをベクトルxとし、まずxのノルム|x|を求める。
次にフィルタの積和演算を行ない、フィルタ1からフィルタ3までのそれぞれについてxとフィルタの内積である展開係数を求める。以下ではこの展開係数をf1,f2,f3とおく。
【0013】
まとめると、フィルタ演算部2は画像パターンを構成する各要素の近傍パターンx毎に上記|x|,f1,f2,f3の4つの値を算出する。
次に、形状判別部3で行なわれる処理について述べる。
フィルタ1 は回転対称であり、また、フィルタ2( または3) を任意の角度に回転した形状はフィルタ2とフィルタ3の線形和の形に展開できる、このときフィルタ2とフィルタ3の出力の2乗和は回転角によらず一定である。このため、
【0014】
【数2】
は近傍パターンに関する回転不変な特徴量として用いることが出来る。そこで、特徴量を
【0015】
【数3】
とし、
【0016】
【数4】
のベイズ法により得られる相違度dにより近傍パターンがストロークか否かの判定を行う。
【0017】
ここで、mは2次元ベクトル、Aは2×2の対称行列である。Aはストロークと判定するための重みをつける行列であって、具体的には学習用のストローク画像を多数集め、各ストローク画像から得られるベクトルyの分散共分散行列の逆行列を用いる。
そして、具体的には
【0018】
【数5】
(Tdは閾値)を満たす場合ストロークと判定する。
【0019】
つまり、図3のごとく簡略化して図示すると、特徴量yが得られた場合、平均的なストローク形状の特徴量mとの相違度dはストロークと判定するための重みをつける行列Aにより規定される図3の等高線で示される距離尺度により測定され、この相違度の大小によりストロークか否かの判定がなされる。
【0020】
形状判別部3で近傍パターンがストロークであると判定された場合、パラメータ推定部4においてストロークの方向(角度)の推定を行う。
以下、パラメータ推定部4で行われる処理について述べる。ストロークの方向(角度)φはフィルタ出力f2,f3とから
【0021】
【数6】
により求める。その結果、ストローク部分について推定された方向を図4に示すように求められる。
【0022】
次に特徴抽出部5で行われる処理について述べる。特徴抽出部5では、図5のように入力パターンを5×5個のブロックに分割し、各ブロック毎にそのブロック内に含まれるストロークの方向の頻度ヒストグラムを求める。ヒストグラムを求める際の角度の分割数を8とすると、この処理で5×5×8の計200次元の特徴ベクトルが得られることになる。
【0023】
但し、文字パターンの大きさによる変動を吸収するため、特徴ベクトルはノルムが1になるように正規化するものとする。
次に認識部6で行われる処理について述べる。認識部6では、入力パターンに対して特徴抽出部5で得られた特徴ベクトルを用いて、入力パターンが属すべきカテゴリ(文字の種類)の決定を行う。
あらかじめ、各カテゴリ毎に多数の学習用パターンを用いて認識用の認識辞書7を作成しておき、認識に際しては
【0024】
【数7】
により各カテゴリ毎に入力パターンの特徴ベクトルの相違度を求める。相違度の下位k候補を候補文字として相違度とともに出力する。
【0025】
miは第カテゴリの平均ベクトル、Aiは対称行列である。Aiは具体的には学習用のパターンを多数集め、各パターンから得られるベクトルの分散共分散行列の逆行列を用いる。
【0026】
以上で本実施例で用いる各処理の説明が終わったので、次に本実施例における処理の流れを説明する。
まず全体の処理の流れを図6に従って説明する。画像が入出力部を介して入力されると(S1)、まずフィルタ演算部2、形状判別部3、パラメータ推定部4によりストローク部分の抽出とその方向パラメータの推定がなされる(S2)。
【0027】
この結果を受けて特徴抽出部5で特徴ベクトルの算出が行われ(S3)、最後に、得られた特徴ベクトルをもとに認識部6で一つまたは複数の認識候補カテゴリが決定され(S4)、必要に応じて相違度情報を付加して出力される(S5)。
【0028】
次に、ストローク部分の抽出とその方向パラメータの推定処理に関する部分の処理の流れを図7に従って説明する。
まず、入力画像に対して処理の開始点を指定したのち(S11)、近傍パターンを読み込み(S12)、入力画像の各画素毎に、フィルタ演算部2でフィルタ演算を施す(S13)。
【0029】
次に、形状判別部3で、入力画像の各画素毎に局所パターンがストローク形状か否かの判別を行なう(S14,S15)。形状判別部3でストローク形状と判定された画素については、パラメータ推定部4で方向の推定を行う(S16)。以上の処理を入力画像の全ての画素について行うことにより(S17,S18)、入力画像からストロークとその方向の抽出が行われる。
【0030】
なお、本発明は図6、図7で示した手順をコンピュータで実施可能なプログラムとしてFDDやCD−ROMなどの記録媒体に記憶されていてもよい。この場合、記録媒体に記憶されたプログラムをコンピュータに読み込ませ実行することが可能である。
【0031】
【発明の効果】
本発明によれば、画像パターンからストロークの部分を抽出し、かつその方向などのパラメータを安定に精度良く推定することが可能になる。これにより、オフライン文字認識の認識性能の大幅な向上が見込める。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図。
【図2】本発明のフィルタの例を示す図。
【図3】本発明のストロークであるか否かを判定する手順を説明するための図。
【図4】本発明のストロークと判定された部分についてストロークの方向を示す図。
【図5】本発明の特徴ベクトルの算出方法を説明する図。
【図6】本発明の全体の動作の流れを説明する流れ図。
【図7】本発明のストローク部分の抽出と方向パラメータ推定を行う処理の流れを説明する流れ図。
【符号の説明】
1…入出力部
2…フィルタ演算部
3…形状判別部
4…パラメータ推定部
5…特徴抽出部
6…認識部
Claims (5)
- 入力された画像パターンの各点の近傍パターンのベクトルと、前記近傍パターンについて、前記各点からの距離が所定の距離よりも短い前記近傍パターンには距離に応じた正の重みを、前記各点からの距離が所定の距離よりも長い前記近傍パターンには距離に応じた負の重みをつけるフィルタとの第1の内積に基づく凹凸の程度を示す第1の特徴量、および、前記近傍パターンのベクトルと各点の近傍での方向性の有無を検出するための複数のフィルタのそれぞれとの第2の内積の線形和である第2の特徴量とを要素として有する第1の特徴量ベクトルである第1の入力特徴ベクトルを算出する第1の特徴量算出手段と、複数のストローク画像のそれぞれについての前記第1の特徴量ベクトルから予め求められた分散共分散行列の逆行列である第1の重み行列、および、予め学習された平均的なストローク形状のパターンが有するべき前記第1の特徴量ベクトルである第1の学習特徴ベクトルとを記憶する第1の記憶手段と、
前記第1の入力特徴ベクトルと前記第1の学習特徴ベクトルとの差分ベクトルの各要素の前記第1の重み行列に従った重み付き和である相違度に基づいて、前記近傍パターンがストロークであるか否かを判定する形状判別手段と、
前記近傍パターンがストロークであると判定された場合に、前記第2の内積から各点のストロークの方向を推定する方向推定手段と、
前記入力された画像パターンを複数のブロックに分割した各ブロック毎に、当該ブロック内の各点について推定されたストロークの方向毎の度数を要素とする第2の特徴量ベクトルである第2の入力特徴ベクトルを算出する第2の特徴量算出手段と、
複数の学習用パターンのそれぞれに関する前記第2の特徴量ベクトルから予め学習した認識用辞書データを記憶する第2の記憶手段と、
前記第2の入力特徴ベクトルと前記認識用辞書データとを用いて、前記入力された画像パターンが属するカテゴリを決定する認識手段と、
を有するパターン認識装置。 - 前記第2の記憶手段が記憶する前記認識用辞書データは、
(A)前記複数の学習用パターンのそれぞれについての前記第2の特徴量ベクトルから求められた分散共分散行列の逆行列である各カテゴリ毎の第2の重み行列、および、
(B)カテゴリ毎の平均的な前記第2の特徴量ベクトルである第2の学習特徴ベクトル、
を有し、
前記認識手段は、前記第2の入力特徴ベクトルと前記第2の学習特徴ベクトルとの差分ベクトルの各要素の前記第2の重み行列に従った重み付き和である相違度を前記カテゴリ毎に求めて、得られた前記相違度に基づいて前記入力された画像パターンが属するカテゴリを決定する、
ことを特徴とする請求項1に記載のパターン認識装置。 - 入力された画像パターンの各点の近傍パターンのベクトルと前記近傍パターンについて、前記各点からの距離が所定の距離よりも短い前記近傍パターンには距離に応じた正の重みを、前記各点からの距離が所定の距離よりも長い前記近傍パターンには距離に応じた負の重みをつけるフィルタとの第1の内積に基づく凹凸の程度を示す第1の特徴量、および、前記近傍パターンのベクトルと各点の近傍での方向性の有無を検出するための複数のフィルタのそれぞれとの第2の内積の線形和である第2の特徴量とを要素として有する第1の特徴量ベクトルである第1の入力特徴ベクトルを算出する第1の特徴量算出ステップと、
第1の記憶手段に記憶された、
(A)複数のストローク画像のそれぞれについての前記第1の特徴量ベクトルから予め求められた分散共分散行列の逆行列である第1の重み行列、および、
(B)予め学習された平均的なストローク形状のパターンが有するべき前記第1の特 徴量ベクトルである第1の学習特徴ベクトル、を用いて、前記第1の入力特徴ベクトルと前記第1の学習特徴ベクトルとの差分ベクトルの各要素の前記第1の重み行列に従った重み付き和である相違度を求め、前記近傍パターンがストロークであるか否かを判定する形状判別ステップと、
前記近傍パターンがストロークであると判定された場合に、前記第2の内積から各点のストロークの方向を推定する方向推定ステップと、 前記入力された画像パターンを複数のブロックに分割した各ブロック毎に、当該ブロック内の各点について推定されたストロークの方向毎の度数を要素とする第2の特徴量ベクトルである第2の入力特徴ベクトルを算出する第2の特徴量算出ステップと、
第2の記憶手段に記憶された、
(C)第2の記憶手段に記憶された、複数の学習用パターンのそれぞれに関する前記第2の特徴量ベクトルから予め学習した認識用辞書データ、および、
(D)前記第2の入力特徴ベクトル、
を用いて、前記入力された画像パターンが属するカテゴリを決定する認識ステップと、を有するパターン認識方法。 - 前記第2の記憶手段に記憶された前記認識用辞書データは、
(A)前記複数の学習用パターンのそれぞれについての前記第2の特徴量ベクトルから求められた分散共分散行列の逆行列である各カテゴリ毎の第2の重み行列、および、
(B)カテゴリ毎の平均的な前記第2の特徴量ベクトルである第2の学習特徴ベクトル、
を有し、
前記認識ステップでは、前記第2の入力特徴ベクトルと前記第2の学習特徴ベクトルとの差分ベクトルの各要素の前記第2の重み行列に従った重み付き和である相違度を前記カテゴリ毎に求めて、得られた前記相違度に基づいて前記入力パターンが属するカテゴリを決定する、
ことを特徴とする請求項3に記載のパターン認識方法。 - コンピュータを、
(1)入力された画像パターンの各点の近傍パターンのベクトルと前記近傍パターンについて、前記各点からの距離が所定の距離よりも短い前記近傍パターンには距離に応じた正の重みを、前記各点からの距離が所定の距離よりも長い前記近傍パターンには距離に応じた負の重みをつけるフィルタとの第1の内積に基づく凹凸の程度を示す第1の特徴量、および、前記近傍パターンのベクトルと各点の近傍での方向性の有無を検出するための複数のフィルタのそれぞれとの第2の内積の線形和である第2の特徴量とを要素として有する第1の特徴量ベクトルである第1の入力特徴ベクトルを算出する第1の特徴量算出手段、
(2)複数のストローク画像のそれぞれについての前記第1の特徴量ベクトルから予め求められた分散共分散行列の逆行列である第1の重み行列、および、予め学習された平均的なストローク形状のパターンが有するべき前記第1の特徴量ベクトルである第1の学習特徴ベクトルとを記憶する第1の記憶手段、
(3)前記第1の入力特徴ベクトルと前記第1の学習特徴ベクトルとの差分ベクトルの各要素の前記第1の重み行列に従った重み付き和である相違度に基づいて、前記近傍パターンがストロークであるか否かを判定する形状判別手段と、
(4)前記近傍パターンがストロークであると判定された場合に、前記第2の内積から各点のストロークの方向を推定する方向推定手段、
(5)前記入力された画像パターンを複数のブロックに分割した各ブロック毎に、当該ブロック内の各点について推定されたストロークの方向毎の度数を要素とする第2の特徴量ベクトルである第2の入力特徴ベクトルを算出する第2の特徴量算出手段、
(6)複数の学習用パターンのそれぞれに関する前記第2の特徴量ベクトルから予め学習した認識用辞書データを記憶する第2の記憶手段、および、
(7)前記第2の入力特徴ベクトルと前記認識用辞書データとを用いて、前記入力された画像パターンが属するカテゴリを決定する認識手段、として機能させるための命令を有するプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18174698A JP4127730B2 (ja) | 1998-06-29 | 1998-06-29 | パターン認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18174698A JP4127730B2 (ja) | 1998-06-29 | 1998-06-29 | パターン認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000020643A JP2000020643A (ja) | 2000-01-21 |
JP4127730B2 true JP4127730B2 (ja) | 2008-07-30 |
Family
ID=16106168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18174698A Expired - Lifetime JP4127730B2 (ja) | 1998-06-29 | 1998-06-29 | パターン認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4127730B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488129B (zh) * | 2008-01-14 | 2011-04-13 | 夏普株式会社 | 图像检索装置及图像检索方法 |
-
1998
- 1998-06-29 JP JP18174698A patent/JP4127730B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2000020643A (ja) | 2000-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334762B (zh) | 一种基于四叉树结合orb和sift的特征匹配方法 | |
JP5406705B2 (ja) | データ補正装置及び方法 | |
US4618989A (en) | Method and system for detecting elliptical objects | |
CN108345827B (zh) | 识别文档方向的方法、系统和神经网络 | |
CN110472479B (zh) | 一种基于surf特征点提取和局部lbp编码的指静脉识别方法 | |
EP2407933A1 (en) | Feature point generation system, feature point generation method, and feature point generation program | |
CN106934795A (zh) | 一种混凝土桥梁裂缝的自动检测方法和预测方法 | |
CN111797829A (zh) | 一种车牌检测方法、装置、电子设备和存储介质 | |
CN113392856B (zh) | 图像伪造检测装置和方法 | |
CN104574401A (zh) | 一种基于平行线匹配的图像配准方法 | |
CN111222507A (zh) | 数字式仪表读数的自动识别方法、计算机可读存储介质 | |
CN107808165B (zh) | 一种基于susan角点检测的红外图像匹配方法 | |
Song et al. | Boundary-to-marker evidence-controlled segmentation and MDL-based contour inference for overlapping nuclei | |
CN117227247A (zh) | 纸箱加工的智能定位控制方法 | |
CN115457044A (zh) | 基于类激活映射的路面裂缝分割方法 | |
CN111709426A (zh) | 一种基于轮廓和纹理的硅藻识别方法 | |
CN104268550A (zh) | 特征提取方法及装置 | |
JP4704310B2 (ja) | 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体 | |
CN112819009A (zh) | 一种基于Harris角点检测与NCC匹配的目标识别定位方法 | |
JP4127730B2 (ja) | パターン認識装置及び方法 | |
US7386172B2 (en) | Image recognition method | |
CN112348767A (zh) | 基于物体边缘检测和特征匹配的木材计数模型 | |
CN103064857A (zh) | 图像查询方法及图像查询设备 | |
CN115471755A (zh) | 基于分割的图像目标快速检测方法 | |
JP4894747B2 (ja) | 部分領域検出装置、対象物識別装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050228 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050414 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080509 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080512 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140523 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |