JP4393720B2 - パターン認識装置および方法 - Google Patents

パターン認識装置および方法 Download PDF

Info

Publication number
JP4393720B2
JP4393720B2 JP2001022666A JP2001022666A JP4393720B2 JP 4393720 B2 JP4393720 B2 JP 4393720B2 JP 2001022666 A JP2001022666 A JP 2001022666A JP 2001022666 A JP2001022666 A JP 2001022666A JP 4393720 B2 JP4393720 B2 JP 4393720B2
Authority
JP
Japan
Prior art keywords
pattern
feature vector
recognition
value
covariance matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001022666A
Other languages
English (en)
Other versions
JP2002230551A (ja
Inventor
浩明 武部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001022666A priority Critical patent/JP4393720B2/ja
Priority to US09/928,361 priority patent/US7003164B2/en
Priority to CNB011370327A priority patent/CN100416589C/zh
Publication of JP2002230551A publication Critical patent/JP2002230551A/ja
Application granted granted Critical
Publication of JP4393720B2 publication Critical patent/JP4393720B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Description

【0001】
【発明の属する技術分野】
本発明は、認識対象の情報に含まれる文字等のパターンを認識する装置およびその方法に関する。
【0002】
【従来の技術】
従来の文字認識における代表的な識別方法は、以下のようなものである。まず、入力された文字パターンから、ある定められた方法によって、数値の組、すなわちベクトルとして特徴を抽出する。つまり、特徴抽出によって、入力パターンは、特徴ベクトル空間内の点に写像される。そして、この入力パターンの特徴ベクトルと、ベクトル空間における各カテゴリの代表点との距離を計算し、最も近いカテゴリを認識結果とする。
【0003】
ここで、ベクトル空間における各カテゴリの代表点は、カテゴリ毎に用意された標本パターン特徴ベクトルのベクトル空間における平均である。距離尺度としては、シティブロック距離、ユークリッド距離等が用いられる。
【0004】
また、鶴岡らによる“加重方向指数ヒストグラム法による手書き漢字・ひらがな認識”(電子情報通信学会論文誌D,Vol.J70-D, No.7, pp.1390-1397, July 1987)において、単なる距離ではなく、特徴ベクトル空間における各カテゴリの分布を識別に反映させた、疑似ベイズ識別関数(Modified Bayes Discriminant Function)を用いる方法が提案されている。
【0005】
これは、標本パターンが正規分布に従い、平均と共分散行列が既知の場合、最適識別関数となるベイズ識別関数を、理論および実装上の問題点を解決するように変形させたものである。これらの問題点とは、共分散行列の固有ベクトルが高次になるほど推定誤差が大きくなること、計算量や記憶容量が膨大に必要なこと等である。入力パターンの特徴ベクトル(n次元)をxとすると、カテゴリCに対するベイズ識別関数fc (x)と疑似ベイズ識別関数gc (x)は、以下のように定義される。
(1)ベイズ識別関数
c :カテゴリCの平均ベクトル
Σc :カテゴリCの共分散行列
【0006】
【数1】
Figure 0004393720
【0007】
(2)疑似ベイズ識別関数
αc i:Σc のi番目の固有値
c i:Σc のi番目の固有値に対応する固有ベクトル
k:1以上n以下の整数
【0008】
【数2】
Figure 0004393720
【0009】
【発明が解決しようとする課題】
しかしながら、上述した従来のパターン認識には、次のような問題がある。
疑似ベイズ識別関数を用いた場合でも、最も標準的なフォントである明朝体に比べて変形の強いフォントや、入出力状況に応じて劣化の激しい文書における文字の認識精度は良くない。また、当然のことながら、変形の強いフォントに対して劣化が加わると、認識精度はさらに低下する。
【0010】
本発明の課題は、変形の強いフォントや劣化の激しい文書における文字のように、特定の特徴を持つパターンに対して、高精度な認識処理を行うパターン認識装置およびその方法を提供することである。
【0011】
【課題を解決するための手段】
図1は、本発明のパターン認識装置の原理図である。図1のパターン認識装置は、計算手段11と認識手段12を備え、パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、認識を行う。
【0012】
計算手段11は、あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、その差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、その期待値に基づいてそのカテゴリの識別関数が定義されたとき、上記未知パターンの特徴ベクトルに対するその識別関数の値を計算する。
【0013】
認識手段12は、その識別関数の値に基づいて上記未知パターンの認識を行い、認識結果を出力する。
差分ベクトルの集合は、パターン集合特有の誤差分布を表していると考えられ、その自己相関行列は誤差分布の情報を含んでいる。この自己相関行列を共分散行列とする正規分布を確率密度関数として用いることにより、誤差分布の情報を反映した期待値が生成される。したがって、この期待値に基づいて定義された識別関数は、パターン集合特有の特徴を反映している。
【0014】
計算手段11は、未知パターンの特徴ベクトルに対するこの識別関数の値を計算し、計算結果を認識手段12に出力する。認識手段12は、受け取った識別関数の値に基づいて、未知パターンのカテゴリを判定し、判定結果を出力する。
【0015】
このようなパターン認識装置によれば、パターン集合と同様の特徴を持つ未知パターンに対して、より高精度な認識処理を行うことができる。例えば、変形の強いフォントの文字パターンの集合から差分ベクトルの集合を生成すれば、そのフォントの未知パターンの認識精度が向上し、劣化の激しい文書における文字パターンの集合から差分ベクトルの集合を生成すれば、同じような劣化が見られる未知パターンの認識精度が向上する。
【0016】
図1の計算手段11と認識手段12は、例えば、後述する図6のCPU(中央処理装置)31とメモリ32の組合せに対応する。
【0017】
【発明の実施の形態】
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
本実施形態では、従来の疑似ベイズ識別関数に、フォント特有あるいは劣化による変形特有の情報を付加する方法を採用する。まず、ある入力パターンの集合が与えられたとき、そのパターン集合の各パターンの特徴ベクトルと、対応する正解カテゴリの平均特徴ベクトルとの差分をとり、得られた差分ベクトルの集合を、そのパターン集合特有の誤差分布と考える。
【0018】
次に、未知パターンの特徴ベクトルxが与えられたとき、図2に示すように、特徴ベクトル空間内の点xに関して、上述のパターン集合特有の誤差分布を確率密度関数Fe (x)とする。そして、あるカテゴリCの識別関数の確率密度関数をFc (x)として、Fc (x)の期待値(類似度)をFe (x)を用いて求め、得られた期待値に基づいて、そのカテゴリCに対する識別関数値を定義する。このとき、Fc (x)の期待値は、図2の領域20の面積に対応し、次式で与えられる。
【0019】
【数3】
Figure 0004393720
【0020】
図3は、このような識別関数値を用いた場合のカテゴリの分布の変化を示している。元の識別関数に基づくカテゴリCの特徴ベクトルの分布21と、あるパターン集合特有の誤差分布22から、新しい分布23が生成される。
【0021】
このとき、元の分布21が未知パターンの特徴ベクトルを含んでいなかったとしても、新しい分布23はその特徴ベクトルを含むようになり、カテゴリCを未知パターンの認識結果として採用することが可能になる。したがって、未知パターンが、誤差分布22に対応するパターン集合と同様の特徴を持っている場合、未知パターンの認識精度が向上する。
【0022】
次に、新たな識別関数の求め方をより詳細に説明する。まず、平均m1 、共分散行列Σ1 の正規分布を、平均m2 、共分散行列Σ2 の正規分布の重みをつけて総和した関数q(m1 ,m2 ,Σ1 ,Σ2 )は、次式により与えられる。
【0023】
【数4】
Figure 0004393720
【0024】
ただし、
【0025】
【数5】
Figure 0004393720
【0026】
である。
このq(m1 ,m2 ,Σ1 ,Σ2 )を用いて、新たな識別関数φc (x)は以下のように定義できる。
x:入力パターンの特徴ベクトル(n次元)
c :カテゴリCの平均ベクトル
Σc :カテゴリCの共分散行列
Σ:パターン集合の誤差分布に関する共分散行列
φc (x)=−2logq(mc ,x,Σc ,Σ) (6)
ここで、q(mc ,x,Σc ,Σ)は、(3)式の期待値に対応する。このφc (x)から定数項を除くと、次のような識別関数Φc (x)が得られる。
【0027】
【数6】
Figure 0004393720
【0028】
このΦc (x)は、(1)式のベイズ識別関数fc (x)において、Σc をΣ+Σc に置き換えたものに等しい。そして、ベイズ識別から疑似ベイズ識別への移行と同様にして、次のような識別関数Ψc (x)を新たに定義する。
γc i:Σ+Σc のi番目の固有値
c i:Σ+Σc のi番目の固有値に対応する固有ベクトル
l:1以上n以下の整数
【0029】
【数7】
Figure 0004393720
【0030】
ここで、γc iとzc iを求めるべきであるが、カテゴリ毎にすべての固有値と固有ベクトルを求めていては、処理時間が膨大になる。そこで、ΣとΣc のそれぞれの固有値と固有ベクトルのうち、固有値の大きい順に上位のものを求め、それらの固有値と固有ベクトルだけを用いて、Σ+Σc の固有値と固有ベクトルの近似値を高速に求めることにする。
【0031】
以下では、簡単のためにカテゴリの添え字Cを省略して、γc iとzc iをそれぞれγi とzi と記すことにする。このとき、γi とn次元ベクトルzi (i=1,2,...,l)は、次のようにして求められる。
<固有値・固有ベクトルの計算アルゴリズム>
まず、共分散行列Σc の上位s個の固有値をα1 ≧α2 ≧・・・≧αs (s≦l)とし、それらに対応する固有ベクトルをv1 ,v2 ,...,vs とする。また、共分散行列Σの上位t個の固有値をβ1 ≧β2 ≧・・・≧βt (t≦l,l≦s+t)とし、それらに対応する固有ベクトルをw1 ,w2 ,...,wt とする。そして、以下に示すように、v1 ,v2 ,...,vs で張られる部分ベクトル空間をVとし、w1 ,w2 ,...,wt で張られる部分ベクトル空間をWとして、VとWの和空間をUとする。
V={v1 ,v2 ,...,vs } (9)
W={w1 ,w2 ,...,wt } (10)
U=V+W (11)
ここで、グラム・シュミットの直交化によって、次式を満たすようなn次元ベクトルベクトルw′1 ,w′2 ,...,w′u (s+u=l)およびv′1 ,v′2 ,...,v′v (t+v=l)を求める。
U={v1 ,v2 ,...,vs ,w′1 ,w′2 ,...,w′u
={v′1 ,v′2 ,...,v′v ,w1 ,w2 ,...,wt }(12)
そして、行列VW 、WV 、A、およびBを、次のように定義する。
W =(v1 2 ...vs w′1 w′2 ...w′u ) (13)
V =(w1 2 ...wt v′1 v′2 ...v′v ) (14)
【0032】
【数8】
Figure 0004393720
【0033】
ただし、α(=αs+1 )とβ(=βt+1 )は既知であるものとする。ここで、WV は、ある直交行列Pを用いて、WV =VW Pと表される。そこで、U内でΣ+Σc の固有値を求めるために行列A+PBPt を考え、以下に示すように、この行列を対角化して、対角成分をγ1 ,γ2 ,...,γs+u (γs+u =γl )とする。
A+PBPt =XΓXt (17)
X=(x1 2 ...xs+u ) (18)
【0034】
【数9】
Figure 0004393720
【0035】
そして、次式によりz1 ,z2 ,...,zs+u (zs+u =zl )を求める。
(z1 2 ...zs+u )=VW X (20)
次に、図4および図5を参照しながら、(8)式の識別関数を用いたパターン認識処理の具体例を説明する。
【0036】
例えば、入力機器により入力された文書画像の文字を認識する場合、入力文書のフォントの種類をFとし、入力機器の種類をIとし、文書画像の解像度をRとして、次の3つの文字パターン集合をあらかじめ用意しておく。
F :フォントFの文字パターンの集合
I :入力機器Iにより入力された文字パターンの集合
R :解像度Rで入力された文字パターンの集合
次に、文字パターン集合毎に、各特徴ベクトルと各正解文字のカテゴリ(正解カテゴリ)の平均特徴ベクトルとの差分をとり、得られた差分ベクトルの集合を、それぞれDSF、DSI、DSRとする。
【0037】
ここで、フォントFの未知パターンの文字認識を行う場合、その未知パターンの特徴ベクトルxを平均とし、差分ベクトルの集合DSFの自己相関行列を共分散行列とするような正規分布を、確率密度関数として用いて、カテゴリCの確率密度関数の期待値を求める。そして、その期待値に基づいて(8)式の識別関数を求め、未知パターンの特徴ベクトルに対する識別関数の値を計算して、文字認識を行う。
【0038】
また、入力機器Iにより入力された未知パターンの文字認識を行う場合、その未知パターンの特徴ベクトルxを平均とし、差分ベクトルの集合DSIの自己相関行列を共分散行列とするような正規分布を、確率密度関数として用いて、カテゴリCの確率密度関数の期待値を求める。
【0039】
また、解像度Rで入力された未知パターンの文字認識を行う場合、その未知パターンの特徴ベクトルxを平均とし、差分ベクトルの集合DSRの自己相関行列を共分散行列とするような正規分布を、確率密度関数として用いて、カテゴリCの確率密度関数の期待値を求める。
【0040】
また、これらの3つの差分ベクトルの集合を組み合わせて用いる場合、まず、特徴ベクトル空間の各点xにおいて、DSFの自己相関行列を共分散行列とするような正規分布を確率密度関数として、カテゴリCの確率密度関数f0 (x)の期待値f1 (x)を求める。
【0041】
次に、各点xにおいて、DSIの自己相関行列を共分散行列とするような正規分布を確率密度関数として、f1 (x)の期待値f2 (x)を求める。さらに、各点xにおいて、DSRの自己相関行列を共分散行列とするような正規分布を確率密度関数として、f2 (x)の期待値f3 (x)を求め、このf3 (x)をカテゴリCの新たな確率密度関数とする。
【0042】
この場合、(6)式のq(mc ,x,Σc ,Σ)をf3 (x)に置き換えることで、対応する識別関数Ψc (x)が得られる。
ここでは、3つの文字パターン集合SF 、SI 、SR を用いているが、一般には、1つ以上の任意の個数の文字パターン集合を用いて、それらの誤差分布を識別関数に反映することができる。また、期待値の計算において、必ずしも誤差分布の情報をDSF、DSI、DSRの順に用いる必要はなく、これらは任意の順序で用いることができる。
【0043】
図4は、このような3つの文字パターン集合を用いた文字認識処理のフローチャートである。パターン認識装置は、まず、認識対象文書の入力に用いられた機器の情報を取得する(ステップS1)。想定される機器としては、スキャナ、デジタルカメラ、ファクシミリ装置等がある。パターン認識装置は、例えば、画像を解析して自動的に機器の種類を判断したり、ユーザに機器の種類を入力させることにより、この情報を取得する。
【0044】
次に、取得した情報に基づき、あらかじめ記憶された誤差分布の情報の中から、入力機器に対応する誤差分布の情報を取得する(ステップS2)。具体的には、DSIに対応する共分散行列の上位m1 個の固有値・固有ベクトルが、誤差分布の情報として取り出される。
【0045】
次に、認識対象文書の画像の解像度に関する情報を取得する(ステップS3)。解像度としては、例えば、157ドット/cm、118ドット/cm、79ドット/cm等が用いられる。パターン認識装置は、例えば、画像を解析して自動的に解像度を判断したり、ユーザに解像度を入力させることにより、この情報を取得する。
【0046】
次に、取得した情報に基づき、記憶された誤差分布の情報の中から、解像度に対応する誤差分布の情報を取得する(ステップS4)。具体的には、DSRに対応する共分散行列の上位m2 個の固有値・固有ベクトルが取り出される。
【0047】
次に、認識対象文書のフォントの種類に関する情報を取得する(ステップS5)。フォントとしては、例えば、細明朝、中明朝、太明朝、細ゴシック、中ゴシック、太ゴシック、楷書書体等が用いられる。パターン認識装置は、例えば、画像を解析して自動的にフォントの種類を判断したり、ユーザにフォントの種類を入力させることにより、この情報を取得する。
【0048】
次に、取得した情報に基づき、記憶された誤差分布の情報の中から、フォントの種類に対応する誤差分布の情報を取得する(ステップS6)。具体的には、DSFに対応する共分散行列の上位m3 個の固有値・固有ベクトルが取り出される。
【0049】
次に、各カテゴリの変動分布に関する共分散行列の上位m0 個の固有値・固有ベクトルと、ステップS2、S4、およびS6で取得した固有値・固有ベクトルに対して、上述の固有値・固有ベクトルの計算アルゴリズムを繰り返し適用することにより、各カテゴリの新たな固有値・固有ベクトルを算出する(ステップS7)。
【0050】
次に、得られた固有値・固有ベクトルを用いて(8)式の識別関数値を計算し、疑似ベイズ識別を行う(ステップS8)。そして、識別により得られた認識結果を出力する。
【0051】
図4の文字認識処理では、あらかじめ用意された文字パターン集合を用いて誤差分布を生成しているが、入力された認識対象文書に基づいて文字パターン集合を動的に生成することも可能である。
【0052】
この場合、ある入力文書Dに含まれる文字パターンの集合SD の各文字パターンについて、すべてのカテゴリに対する確率密度関数値を求め、それらの確率密度関数値のうちの最大値があるしきい値よりも大きいような文字パターンを、正解文字が存在する文字パターンとして抽出する。次に、抽出された文字パターンの集合に対して、各特徴ベクトルと各正解カテゴリの平均との差分をとり、得られた差分ベクトルの集合をDSDとする。
【0053】
そして、文字パターン集合SD のある文字パターンを対象として、その特徴ベクトルxを平均とし、DSDの自己相関行列を共分散行列とするような正規分布を確率密度関数として、カテゴリCの確率密度関数の期待値を求め、得られた期待値に基づいてxに対するカテゴリCの識別関数値を求める。
【0054】
図5は、このような文字認識処理のフローチャートである。パターン認識装置は、まず、任意の方法により認識対象文書を文字認識する(ステップS11)。この文字認識では、シティブロック距離やユークリッド距離を用いてもよく、疑似ベイズ識別関数を用いてもよい。
【0055】
次に、認識結果に基づき、正解文字のカテゴリを推定する(ステップS12)。推定方法としては、認識距離値があるしきい値以下の文字を正解としてもよく、認識確信度を求め、それがあるしきい値以上の文字を正解としてもよい。
【0056】
次に、推定された正解文字に関する誤差分布の共分散行列を計算し(ステップS13)、その共分散行列の固有値・固有ベクトルを計算して、上位m個を選択する(ステップS14)。
【0057】
次に、各カテゴリの変動分布に関する共分散行列の上位m0 個の固有値・固有ベクトルと、ステップS14で取得した固有値・固有ベクトルに対して、上述の固有値・固有ベクトルの計算アルゴリズムを適用することにより、各カテゴリの新たな固有値・固有ベクトルを算出する(ステップS15)。
【0058】
次に、得られた固有値・固有ベクトルを用いて(8)式の識別関数値を計算し、疑似ベイズ識別を行う(ステップS16)。そして、識別により得られた認識結果を出力する。このとき、もう一度、すべての文字パターンについて識別関数値を計算し直してもよく、正解ではないと推定した文字だけについて識別関数値を計算し直してもよい。正解ではない文字とは、例えば、距離値がしきい値より大きな文字や、確信度がしきい値より小さな文字に対応する。
【0059】
図1のパターン認識装置は、例えば、図6に示すような情報処理装置(コンピュータ)を用いて構成される。図6の情報処理装置は、CPU(中央処理装置)31、メモリ32、入力装置33、出力装置34、外部記憶装置35、媒体駆動装置36、ネットワーク接続装置37、および入力機器38を備え、それらはバス39により互いに接続されている。
【0060】
メモリ32は、例えば、ROM、RAM等を含み、処理に用いられるプログラムとデータを格納する。CPU31は、メモリ32を利用してプログラムを実行することにより、必要な処理を行う。
【0061】
入力装置33は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、ユーザからの指示や情報の入力に用いられる。出力装置34は、例えば、ディスプレイ装置、スピーカ、プリンタ等であり、ユーザへの問い合わせや処理結果を出力する。
【0062】
外部記憶装置35は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。情報処理装置は、この外部記憶装置35に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ32にロードして使用する。例えば、各カテゴリの変動分布に関する共分散行列の固有値・固有ベクトルと、差分ベクトルの集合に対応する共分散行列の固有値・固有ベクトルが、データとして外部記憶装置35に格納される。
【0063】
媒体駆動装置36は、可搬記録媒体40を駆動し、その記録内容にアクセスする。可搬記録媒体40としては、メモリカード、フロッピーディスク、CD−ROM(Compact Disk Read Only Memory )、光ディスク、光磁気ディスク等、任意のコンピュータ読み取り可能な記録媒体が用いられる。ユーザは、この可搬記録媒体40に上述のプログラムとデータを格納しておき、必要に応じて、それらをメモリ32にロードして使用する。
【0064】
ネットワーク接続装置37は、LAN(Local Area Network)等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。また、情報処理装置は、上述のプログラムとデータをネットワーク接続装置37を介して、サーバ等の他の装置から受け取り、必要に応じて、それらをメモリ32にロードして使用する。
【0065】
入力機器38は、例えば、スキャナ、デジタルカメラ、ファクシミリ装置等であり、認識対象画像等の情報を入力する。
図7は、図6の情報処理装置にプログラムとデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体40やサーバ41のデータベース42に保存されたプログラムとデータは、メモリ32にロードされる。このとき、サーバ41は、プログラムとデータを搬送する搬送信号を生成し、ネットワーク上の任意の伝送媒体を介して、情報処理装置に送信する。そして、CPU31は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
【0066】
以上説明した実施形態では、主として文字認識を行う例について説明したが、本発明は、特徴ベクトル空間においてカテゴリ毎に確率密度関数が定義できる任意のパターン認識に適用することができる。例えば、文書画像に含まれる罫線、図・写真の画像に含まれる物体の形状や色等のパターンを認識する処理にも適用可能である。さらに、認識対象の情報は、画像のみに限られず、音声のように、時系列に入力される情報であってもよい。
【0067】
(付記1) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、認識を行うパターン認識装置であって、
あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記未知パターンの認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記2) 前記カテゴリの変動分布に関する共分散行列の固有値および固有ベクトルの情報と、前記正規分布の共分散行列の固有値および固有ベクトルの情報を格納する格納手段をさらに備え、前記計算手段は、該格納手段に格納された情報を用いて、前記識別関数の値を計算することを特徴とする付記1記載のパターン認識装置。
(付記3) 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
あるフォントの文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、該フォントの未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記4) 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
ある入力機器により入力された文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、該入力機器により入力された未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記5) 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
ある解像度で入力された文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、該解像度で入力された未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記6) 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
あるフォントFの文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合DSFが生成され、ある入力機器Iにより入力された文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合DSIが生成され、ある解像度Rで入力された文字パターン集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合DSRが生成され、前記特徴ベクトル空間の各点において、該差分ベクトルの集合DSFの自己相関行列を共分散行列とするような正規分布を確率密度関数として用いて、あるカテゴリの確率密度関数f0 の期待値f1 が定義され、各点において、該差分ベクトルの集合DSIの自己相関行列を共分散行列とするような正規分布を確率密度関数として用いて、該期待値f1 の期待値f2 が定義され、各点において、該差分ベクトルの集合DSRの自己相関行列を共分散行列とするような正規分布を確率密度関数として用いて、該期待値f2 の期待値f3 が定義され、該期待値f3 に基づいて該カテゴリの識別関数が定義されたとき、未知パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記7) 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
入力文書に含まれる文字パターンの集合であって、カテゴリの確率密度関数の最大値がしきい値よりも大きいような文字パターンの集合について、各文字パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、前記入力文書に含まれる対象文字パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該対象文字パターンの特徴ベクトルに対する該識別関数の値を計算する計算手段と、
前記識別関数の値に基づいて前記対象文字パターンの認識を行い、認識結果を出力する認識手段と
を備えることを特徴とするパターン認識装置。
(付記8) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、パターン認識を行うコンピュータのためのプログラムを記録した記録媒体であって、該プログラムは、
あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算し、
前記識別関数の値に基づいて前記未知パターンの認識を行い、
認識結果を出力する
処理を前記コンピュータに実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
(付記9) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、パターン認識を行うコンピュータのためのプログラムであって、
あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算し、
前記識別関数の値に基づいて前記未知パターンの認識を行い、
認識結果を出力する
処理を前記コンピュータに実行させるためのプログラム。
(付記10) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、パターン認識を行うコンピュータに、プログラムを搬送する搬送信号であって、該プログラムは、
あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合が生成され、該差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値が定義され、該期待値に基づいて該カテゴリの識別関数が定義されたとき、該未知パターンの特徴ベクトルに対する該識別関数の値を計算し、
前記識別関数の値に基づいて前記未知パターンの認識を行い、
認識結果を出力する
処理を前記コンピュータに実行させることを特徴とする搬送信号。
(付記11) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、認識を行うパターン認識方法であって、
あるパターン集合について、各パターンの特徴ベクトルと各正解カテゴリの平均特徴ベクトルの差分をとることで、差分ベクトルの集合を生成し、
前記差分ベクトルの集合の自己相関行列を共分散行列とし、未知パターンの特徴ベクトルを平均とするような正規分布を、確率密度関数として用いて、あるカテゴリの確率密度関数の期待値を求め、
前記期待値に基づいて前記カテゴリの識別関数を求め、
前記未知パターンの特徴ベクトルに対する前記識別関数の値を計算し、
前記識別関数の値に基づいて前記未知パターンの認識を行う
ことを特徴とするパターン認識方法。
【0068】
【発明の効果】
本発明によれば、従来の方法では認識精度が著しく低かった認識対象に対しても、高精度なパターン認識を行うことができるようになる。例えば、文字認識の場合、最も標準的なフォントである明朝体に比べて変形の強いフォント、入出力状況に応じて劣化の激しい文書における文字、変形の強いフォントに対して劣化が加わった文字等の認識精度が向上する。
【図面の簡単な説明】
【図1】本発明のパターン認識装置の原理図である。
【図2】識別関数値の生成を示す図である。
【図3】カテゴリの分布の変化を示す図である。
【図4】第1の文字認識処理のフローチャートである。
【図5】第2の文字認識処理のフローチャートである。
【図6】情報処理装置の構成図である。
【図7】記録媒体を示す図である。
【符号の説明】
11 計算手段
12 認識手段
20 領域
21、22、23 分布
31 CPU
32 メモリ
33 入力装置
34 出力装置
35 外部記憶装置
36 媒体駆動装置
37 ネットワーク接続装置
38 入力機器
39 バス
40 可搬記録媒体
41 サーバ
42 データベース

Claims (8)

  1. 未知パターンの認識を行うパターン認識装置であって、
    ターン集合に属する各パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算する計算手段と、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの認識を行い、認識結果を出力する認識手段と
    を備えることを特徴とするパターン認識装置。
  2. 未知パターンの文字認識を行うパターン認識装置であって、
    ォントの文字パターン集合に属する各文字パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算する計算手段と、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
    を備えることを特徴とするパターン認識装置。
  3. 未知パターンの文字認識を行うパターン認識装置であって、
    力機器により入力された文字パターン集合に属する各文字パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算する計算手段と、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
    を備えることを特徴とするパターン認識装置。
  4. 未知パターンの文字認識を行うパターン認識装置であって、
    ある解像度で入力された文字パターン集合に属する各文字パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算する計算手段と、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの文字認識を行い、認識結果を出力する認識手段と
    を備えることを特徴とするパターン認識装置。
  5. 文字パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて、文字認識を行うパターン認識装置であって、
    入力文書に含まれる文字パターンの複数のカテゴリに対する複数の確率密度関数値を求め、該複数の確率密度関数値の最大値がしきい値よりも大きいような文字パターンを抽出し、抽出された文字パターンの集合に属する各文字パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記入力文書に含まれる対象文字パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算する計算手段と、
    前記識別関数Ψ c (x)の値に基づいて前記対象文字パターンの認識を行い、認識結果を出力する認識手段と
    を備えることを特徴とするパターン認識装置。
  6. 未知パターンの認識を行うコンピュータのためのプログラムを記録した記録媒体であって、該プログラムは、
    ターン集合に属する各パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算し、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの認識を行い、
    認識結果を出力する
    処理を前記コンピュータに実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
  7. 未知パターンの認識を行うコンピュータのためのプログラムであって、
    ターン集合に属する各パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算し、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの認識を行い、
    認識結果を出力する
    処理を前記コンピュータに実行させるためのプログラム。
  8. 未知パターンの認識を行うパターン認識方法であって、
    ターン集合に属する各パターンのn次元の特徴ベクトルと各正解カテゴリの平均特徴ベクトル c の差分である差分ベクトルの集合の自己相関行列を共分散行列Σとし、共分散行列Σと各正解カテゴリCの共分散行列Σ c の和である行列Σ+Σ c のi番目の固有値γ c i と、固有値γ c i に対応する固有ベクトルz c i と、1以上n以下の整数lとを用いて、
    Figure 0004393720
    なる計算式により、前記未知パターンのn次元の特徴ベクトルに対する識別関数Ψ c (x)の値を計算し、
    前記識別関数Ψ c (x)の値に基づいて前記未知パターンの認識を行う
    ことを特徴とするパターン認識方法。
JP2001022666A 2001-01-31 2001-01-31 パターン認識装置および方法 Expired - Fee Related JP4393720B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001022666A JP4393720B2 (ja) 2001-01-31 2001-01-31 パターン認識装置および方法
US09/928,361 US7003164B2 (en) 2001-01-31 2001-08-14 Pattern recognition apparatus and method using probability density function
CNB011370327A CN100416589C (zh) 2001-01-31 2001-10-19 采用概率密度函数的模式识别装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001022666A JP4393720B2 (ja) 2001-01-31 2001-01-31 パターン認識装置および方法

Publications (2)

Publication Number Publication Date
JP2002230551A JP2002230551A (ja) 2002-08-16
JP4393720B2 true JP4393720B2 (ja) 2010-01-06

Family

ID=18888047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001022666A Expired - Fee Related JP4393720B2 (ja) 2001-01-31 2001-01-31 パターン認識装置および方法

Country Status (3)

Country Link
US (1) US7003164B2 (ja)
JP (1) JP4393720B2 (ja)
CN (1) CN100416589C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098191A (ja) * 2010-11-03 2012-05-24 Waseda Univ 画像識別装置及びプログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050288863A1 (en) * 2002-07-12 2005-12-29 Chroma Energy, Inc. Method and system for utilizing string-length ratio in seismic analysis
US7184991B1 (en) * 2002-07-12 2007-02-27 Chroma Energy, Inc. Pattern recognition applied to oil exploration and production
JP3733094B2 (ja) * 2002-08-22 2006-01-11 トヨタ自動車株式会社 良否判定装置、良否判定プログラムおよび良否判定方法
US7870504B1 (en) * 2003-10-01 2011-01-11 TestPlant Inc. Method for monitoring a graphical user interface on a second computer display from a first computer
JP4665764B2 (ja) 2004-01-15 2011-04-06 日本電気株式会社 パターン識別システム、パターン識別方法、及びパターン識別プログラム
JP2006098151A (ja) * 2004-09-29 2006-04-13 Dainippon Screen Mfg Co Ltd パターン検査装置およびパターン検査方法
US7860286B2 (en) * 2007-04-24 2010-12-28 Microsoft Corporation Medical image acquisition error detection
US7873215B2 (en) * 2007-06-27 2011-01-18 Seiko Epson Corporation Precise identification of text pixels from scanned document images
KR20090065977A (ko) * 2007-12-18 2009-06-23 삼성에스디에스 주식회사 파일의 바이러스 감염여부 판정방법
US8271219B2 (en) * 2008-10-24 2012-09-18 Advantest Corporation Deterministic component model identifying apparatus, identifying method, program, recording medium, test system and electronic device
JP2015177474A (ja) * 2014-03-17 2015-10-05 株式会社リコー 端末、方法、及びプログラム
JP6170860B2 (ja) * 2014-03-25 2017-07-26 株式会社日立情報通信エンジニアリング 文字認識装置及び識別関数生成方法
CN109992126A (zh) * 2014-06-24 2019-07-09 苹果公司 计算设备上的字符识别
JP6545740B2 (ja) * 2017-03-08 2019-07-17 株式会社東芝 生成装置、プログラム、認識システムおよび生成方法
WO2020131004A1 (en) * 2017-12-29 2020-06-25 Nokia Technologies Oy Domain-independent automated processing of free-form text

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
GB9622055D0 (en) * 1996-10-23 1996-12-18 Univ Strathclyde Vector quantisation
JPH10228543A (ja) 1996-12-11 1998-08-25 Matsushita Electric Ind Co Ltd パターン照合装置
JPH1139432A (ja) 1997-07-16 1999-02-12 Toshiba Corp 文字認識方法及び装置
JP4332649B2 (ja) * 1999-06-08 2009-09-16 独立行政法人情報通信研究機構 手の形状と姿勢の認識装置および手の形状と姿勢の認識方法並びに当該方法を実施するプログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098191A (ja) * 2010-11-03 2012-05-24 Waseda Univ 画像識別装置及びプログラム

Also Published As

Publication number Publication date
US20020131644A1 (en) 2002-09-19
CN100416589C (zh) 2008-09-03
US7003164B2 (en) 2006-02-21
CN1368705A (zh) 2002-09-11
JP2002230551A (ja) 2002-08-16

Similar Documents

Publication Publication Date Title
JP4393720B2 (ja) パターン認識装置および方法
US8165410B2 (en) Bags of visual context-dependent words for generic visual categorization
EP0539749B1 (en) Handwriting recognition system and method
WO2021143396A1 (zh) 利用文本分类模型进行分类预测的方法及装置
US8755604B1 (en) Using shape similarity methods to improve OCR speed and accuracy
JP5565190B2 (ja) 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置
US8233726B1 (en) Image-domain script and language identification
JPH1173406A (ja) サポートベクトル機械を使用する方法
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
CN111401099B (zh) 文本识别方法、装置以及存储介质
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
Kae et al. Improving state-of-the-art OCR through high-precision document-specific modeling
JP4066507B2 (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
US20040131235A1 (en) Image processing method, apparatus and storage medium
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
Lin et al. Chinese text distinction and font identification by recognizing most frequently used characters
JP3903613B2 (ja) 検索装置及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN112651392A (zh) 证件信息的获取方法及装置、存储介质、计算机设备
JP2004178569A (ja) データ分類装置、物体認識装置、データ分類方法及び物体認識方法
Kumar et al. Bayesian background models for keyword spotting in handwritten documents
JP3264242B2 (ja) 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
Breuel Character recognition by adaptive statistical similarity
JPH10289320A (ja) 候補テーブルを用いて分類を行うパターン認識装置および方法
Shao et al. A character image restoration method for unconstrained handwritten Chinese character recognition
JP2002073076A (ja) パターン認識方法、パターン認識装置及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091013

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091014

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees