JP4336516B2 - 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体 - Google Patents

特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体 Download PDF

Info

Publication number
JP4336516B2
JP4336516B2 JP2003106174A JP2003106174A JP4336516B2 JP 4336516 B2 JP4336516 B2 JP 4336516B2 JP 2003106174 A JP2003106174 A JP 2003106174A JP 2003106174 A JP2003106174 A JP 2003106174A JP 4336516 B2 JP4336516 B2 JP 4336516B2
Authority
JP
Japan
Prior art keywords
quality set
low
variance matrix
calculating
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003106174A
Other languages
English (en)
Other versions
JP2004310639A (ja
Inventor
秀明 山形
成征 大羽
信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003106174A priority Critical patent/JP4336516B2/ja
Publication of JP2004310639A publication Critical patent/JP2004310639A/ja
Application granted granted Critical
Publication of JP4336516B2 publication Critical patent/JP4336516B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体に関する。
【0002】
【従来の技術】
文字認識技術については、特許文献1,2に開示されている。また、正準判別分析の技術については、特許文献3に開示されている。
【0003】
【特許文献1】
特開2001−52113公報
【特許文献2】
特開平6−231309号公報
【特許文献3】
特開2001−52115公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の文字認識技術においては、低品質文字に対する認識性能が向上させようとすると、高品質文字に対する認識性能が低下し、あるいは、高品質文字に対する認識性能に悪影響を与えるという不具合があった。
【0005】
また、文字認識技術などにおいては、画像を読み込むスキャナの特性などを考慮して、低品質な文字画像を認識するためには多くの学習データを収集する必要があった。フォントデータを展開して作成された高品質な文字画像では、データの収集は容易であるが、実際に原稿をスキャンして得られた文字画像にはノイズなどが乗っており、そのような低品質なデータの認識に不具合を生じることがあった。このように、一般的に高品質な(典型的な)データセットは収集することが容易であるが、低品質なデータセットは種類も多く、データを収集することが困難、あるいは作業量が多い。そこで、高品質なデータセットのみを用いて、低品質なデータにも絶えうる文字認識技術が望まれている。
【0006】
さらに、統計的手法においてはしばしば学習時間が問題となり、正準判別分析も例外ではなく、少しでも学習時間を減らすことが望ましい。
【0007】
本発明は、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができるようにすることである。
【0008】
【課題を解決するための手段】
発明は、クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行う特徴量次元圧縮装置において、学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、を備えていることを特徴とする特徴量次元圧縮装置である。
【0009】
したがって、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0010】
発明は、クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行なってパターンマッチングを実行するマッチング装置において、学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、を備えていることを特徴とするマッチング装置である。
【0011】
したがって、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0012】
発明は、前記マッチング装置において、クラス内分散行列算出手段は、前記クラス内分散行列の算出の際に、前記低品質セットの中から一部のカテゴリのデータを選択し、選択されたデータについてクラス内分散を算出すること、を特徴とする。
【0013】
したがって、低品質セットの中から一部のカテゴリのデータを選択し、選択されたデータについてクラス内分散を算出することで、品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0014】
請求項4に記載の発明は、請求項2又は3に記載のマッチング装置において、前記特徴量の次元圧縮を多段階に行い、この多段階の各段で分割するクラス数が圧縮次元数よりも多い場合には前記正準判別分析による次元圧縮を用い、それ以外の場合には他の種類の次元圧縮を用いること、を特徴とする。
【0015】
したがって、正準判別分析による次元圧縮を含めて次元圧縮を多段階に行なうことができる。
【0016】
請求項5に記載の発明は、前請求項4に記載のマッチング装置において、記他の種類の次元圧縮として主成分分析を用いる次元圧縮を行うこと、を特徴とする。
【0017】
したがって、正準判別分析による次元圧縮、主成分分析を用いる次元圧縮により、次元圧縮を多段階に行なうことができる。
【0018】
請求項6に記載の発明は、正準判別分析を用いた特徴量の次元圧縮をコンピュータに実行させるコンピュータに読み取り可能なプログラムにおいて、学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶処理と、前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出処理と、前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出処理と、をコンピュータに実行させることを特徴とするプログラムである。
【0019】
したがって、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0020】
請求項7に記載の発明は、クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行なってパターンマッチングをコンピュータに実行させるコンピュータに読み取り可能なプログラムにおいて、学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、をコンピュータに実行させるプログラムである。
【0021】
したがって、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0022】
請求項8に記載の発明は、プログラムを記憶している記憶媒体において、請求項6又は7に記載のプログラムを記憶していること、を特徴とする記憶媒体である。
【0023】
したがって、記憶しているプログラムにより請求項6又は7に記載の発明と同様の作用、効果を奏することができる。
【0024】
【発明の実施の形態】
本発明の一実施の形態について説明する。
【0025】
図1は、本実施の形態の文字認識装置1のハードウエア構成を示す電気的な接続のブロック図である。図1に示すように、文字認識装置1は、本発明の特徴量次元圧縮装置、マッチング装置を実施するものであり、各種演算を行ない、文字認識装置1の各部を集中的に制御するCPU11と、各種のROM、RAMからなるメモリ12とが、バス13で接続されている。
【0026】
バス13には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置14と、マウス、キーボード等により構成される入力装置15と、表示装置16と、光ディスクなどの記憶媒体17を読み取る記憶媒体読取装置18とが接続され、また、ネットワーク2と通信を行なう所定の通信インターフェイス19が接続されている。なお、記憶媒体17としては、CD,DVDなどの光ディスク、光磁気ディスク、フレキシブルディスクなどの各種メディアを用いることができる。また、記憶媒体読取装置18は、具体的には記憶媒体17の種類に応じて光ディスク装置、光磁気ディスク装置、フレキシブルディスク装置などが用いられる。
【0027】
文字認識装置1では、この発明の記憶媒体を実施する記憶媒体17から、この発明のプログラムを実施するプログラム20を読み取って、磁気記憶装置14にインストールする。これらのプログラム20はネットワーク2や、インターネットを介してダウンロードしてインストールするようにしてもよい。このインストールにより、文字認識装置1は、後述の所定の処理の実行が可能な状態となる。なお、プログラム20は、所定のOS上で動作するものであってもよい。
【0028】
[射影ベクトルの算出について]
図2は、プログラム20に基づいて動作する文字認識装置1の射影ベクトルの算出までの処理の機能ブロック図である。また、図3は、文字認識装置1が実行する射影ベクトルの算出までの処理のフローチャートである。図2に示す各部は、図1に例示するハードウエア上でプログラム20が動作することにより実現する。
【0029】
ここでは、文字認識装置1により、文字画像から得られた特徴ベクトルの次元圧縮を行う場合について説明する。ユーザはフォント展開文字画像及び図示しないスキャナから読み込んだ文字画像を用意し、適当な手段で「転写紙通過領域でジャムが発生した場合でも転写紙を容易に除去することができ、これにより転写紙の取出し性を一段と向上させることができる」という有利な効果特徴ベクトルに変換する。文字画像からの特徴抽出方法については数多くの方法が提案されており、いかなる手法を用いた場合でも本実施の形態では成立するので、ここでの説明は省略する。
【0030】
ユーザは収集した学習データを、データ分類部21に入力する。データ分類部21においては、フォント展開文字画像から得られた特徴ベクトル、は誤りを許容する高品質セットに、他の特徴ベクトルは、品質が低いためある程度の誤りを許容する低品質セットに分類し(ステップS1)、それぞれ高品質保存部22、低品質保存部23に保存する(ステップS2,S3)。あるいは、ユーザが他の手法で適宜学習セットを分類して、文字認識装置1に対して高品質セットと低品質セットを別々に入力するように構成してもよい。データ分類部21、高品質保存部22、低品質保存部23により記憶手段を、ステップS1〜S3の処理により記憶処理を、それぞれ実現している。
【0031】
クラス内分散行列算出手段であるクラス内分散算出部24においては、低品質保存部23内の低品質特徴ベクトル群を用いて、高品質保存部22内の高品質特徴ベクトル群を用いずに、クラス内分散行列を算出する(クラス内分散行列算出処理)(ステップS4)。クラス内分散の算出方法については詳細を後述する。クラス内分散行列が算出されたならば、それを固有値/固有ベクトル算出部25へ送付する。
【0032】
一方、クラス間分散行列算出手段であるクラス間分散算出部26においては、高品質保存部22内の高品質特徴ベクトル群を用いて、低品質保存部23内の低品質特徴ベクトル群は用いずに、クラス間分散行列を算出する(クラス間分散行列算出処理)(ステップS5)。クラス間分散の算出方法については詳細を後述する。クラス間分散行列が算出されたならば、それを固有値/固有ベクトル算出部25へ送付する。
【0033】
固有値/固有ベクトル算出部25では、送られてきたクラス内分散行列と、クラス間分散行列を用いて、後述の(1)式を用いて固有値/固有ベクトルを算出する(ステップS6)。
【0034】
算出された固有値/固有ベクトルは、射影ベクトル算出部へ送付され、射影行列算出部27では、送られてきた固有値/固有ベクトルを再構成して射影行列を得る(ステップS7)。その詳細については後述する。算出された射影行列は、射影行列保存部28に保存する。
【0035】
このようにして射影行列を求めることで、高品質文字に対する認識性能を低下させずに、低品質文字に対する認識性能が向上することが実験的に確認できた。
【0036】
次に、射影ベクトルの算出までの処理の他の例について説明する。この例においても、そのハードウエア構成は図1のものと同様である。図4は、本例における機能ブロック図であり、図5はフローチャートである。図4に示す各部は、図1に例示するハードウエア上でプログラム20が動作することにより実現する。なお、図2、図3と同一符号の装置、処理は、図2、図3を参照して説明した前述の例と同様であるため、詳細な説明は省略する。
【0037】
本例でも、文字認識の場合を例にとって説明する。文字認識の場合、クラス内分散は主に原稿をスキャンする際に画像にのるノイズなどに起因して値が変動する場合が多い。したがって、文字が同じであれば、フォントなど字形が少々変化しても大きな変動は生じない場合が多い。その一方で、特定の原稿セットなどを認識する場合には、特定のフォントセットに認識対象を限定して、認識系を再設計(パターン辞書を再作成)する場合も多い。このような場合、毎回低品質データセットを収集するのには非常に労力がかかるため、特注対応による高コスト化が問題となる。
【0038】
そこで、スキャナ変化などのクラス内分散の要因となる低品質データを収集し、それに対するクラス内分散行列を算出したならば、認識対象フォントなどが代わった場合でも、そのクラス内分散行列を流用する手法が考えられる。
【0039】
まず、クラス内分散行列については、すでに実施の形態1に示す方法で過去に算出されたものが、クラス内分散保存部31に保存されているものとする。ユーザは新しい認識対象について、実施の形態1と同様に学習データを収集する。その際、クラス内分散は過去のものを流用するので、高品質なデータセットのみを収集すればよい。
【0040】
収集したデータは高品質保存部22に入力しておく。入力されたならば、クラス間分散算出部26においては、実施の形態1と同様の処理を行う(ステップS11)。
【0041】
固有値/固有ベクトル算出部25では、クラス間分散行列が送られてきたならば、クラス内分散保存部31内のクラス内分散行列を参照して、実施の形態1と同様に固有値/固有ベクトルを算出する(ステップS12)。そして、射影行列算出部27における処理は実施例1と同様である(ステップS13)。
【0042】
以上のような処理を実行することにより、低品質データの収集作業から開放されるとともに、高品質画像に対する性能の低下なしに低品質画像に対する性能を向上させることが実験により確認できた。
【0043】
以上、射影ベクトルの算出までについて説明した。このようにして射影行列を算出することで、特徴量の次元圧縮が可能となり、後段の処理であるマッチング処理の時間を低減することができる。
【0044】
[多段階認識を用いたマッチングについて]
ここでは、前述のように算出した射影行列を用いて行う、多段階認識を用いたマッチング処理について説明する。
【0045】
この場合のハードウエア構成は図1のものと同様である。図6は、この場合の処理を実行する際の機能ブロック図であり、図7はフローチャートである。図4に示す各部は、図1に例示するハードウエア上でプログラム20が動作することにより実現する。なお、図2,図4と同一符号の装置は、図2,図4を参照して説明した前述の説明と同様であるため、詳細な説明は省略する。
【0046】
射影行列保存部28には、前述のようにして求められた射影行列が保存されている。また、通常辞書41には、学習データに対して射影行列を施して得られる次元圧縮された特徴量について、各カテゴリの平均を算出した平均特徴量を保存する。一例として、次元圧縮する前の特徴量nは、“n=256次元”、次元圧縮後の特徴量n’は、“n’=64次元”であるとする。また、日本語文書を対象とした場合、クラス数は約4000程度である。
【0047】
類似文字辞書42には、特定の2文字の組み合わせについての射影行列と、それぞれの射影行列を施して得られた次元圧縮後の特徴量について、各カテゴリの平均を算出した平均特徴量を保存する。特定の2文字の組み合わせについての射影行列は、前述のような正準判別は用いずに、ここでは主成分分析を用いて算出する。主成分分析については詳細を後述する。ここでも、次元圧縮する前の特徴量nは、“n=256次元”、次元圧縮後の特徴量n’は、“n’=64次元”であるとする。特定の2文字の組み合わせを対象とするので、クラス数は2となる。
【0048】
その場合、正準判別分析では、次元圧縮後の次元数は最大でもn’=1となり、十分な識別性能が得られない場合が多い。このような場合には正準判別分析による分類は効果がないばかりか、認識性能が低下するので、他の手法によりマッチング処理を行う。ここでは、一例として主成分分析をあげたが、特徴量の次元圧縮を行わずに、この例の場合には256次元の特徴量をそのまま類似文字辞書42に保存してマッチングする方法などでも構わない。特定の2文字の組み合わせは、正準判別による特徴量次元圧縮を用いた場合に識別困難な組み合わせを予め求めて保存しておく。ここでは、文字「ぱ」と「ば」、「ぴ」と「び」、「ぶ」と「ぷ」、「ぺ」と「べ」、「ぼ」と「ぽ」、の組み合わせについてそれぞれの学習データを用いて主成分分析によって求められた射影行列と、平均特徴量が保存されているものとする。この場合の類似文字辞書42の登録例を図8に示す。
【0049】
文字認識装置1の前段には図示しない特徴抽出装置が用意され、前述のように、文字画像からの特徴抽出方法については数多くの方法が提案されており、いかなる手法を用いた場合でも、本実施の形態は成立するので、ここでの説明は省略する。
【0050】
文字画像から抽出された特徴量が、図6に示す文字認識装置1に入力されると、その特徴量は正準特徴圧縮装置43と主成分分析特徴圧縮装置44の両方へ送られる。そしてまず、正準特徴圧縮装置43において、256次元から64次元に次元圧縮処理を行う(ステップS21)。ここでは学習時に作成されている前述の射影行列を参照して、後述の(2)式を用いて次元圧縮特徴量を算出する。
【0051】
算出された64次元の特徴量はマッチング装置45に送られる。マッチング装置45では、通常辞書41に保存されている各クラスの平均特徴量と、送られてきた次元圧縮特徴量のユークリッド距離を算出し、距離の小さい順に候補として類似文字識別装置46へ送って、マッチングを行う(ステップS22)。ここでは一例として単純なユークリッド距離を用いたマッチング方法を示したが、数多く提案されている他のマッチング方法を用いても構わない。
【0052】
類似文字識別装置46では、送られてきた第1候補と第2候補の文字コードを、類似文字辞書42の文字組レコードと比較し、文字組レコードの中に第1候補と第2候補の組と同じものがあった場合には(ステップS23のY)、主成分分析特徴圧縮装置44を起動(辞書レコード番号を送付)して、文字組に対応した次元圧縮特徴量を得る(ステップS24)。それ以外の場合には(ステップS23のN)、送られてきた認識結果をそのまま認識結果として出力する(ステップS26)。例えば、第1候補が「ぴ」、第2候補が「び」の場合には、図8の辞書レコードの番号2が見つかるので、主成分分析特徴圧縮装置44に辞書レコードの番号2を送付して、主成分分析特徴圧縮装置44を起動する。また、第1候補が「ぴ」、第2候補が「U」の場合には、主成分分析特徴圧縮装置44を起動せずに、得られた認識結果を出力する。
【0053】
主成分分析特徴圧縮装置44では、類似文字識別装置46から辞書レコード番号が送付されてきたならば、対応する辞書レコードの射影行列を用いて256次元の特徴量を64次元に次元圧縮する(ステップS24)。そして、得られた次元圧縮特徴量を類似文字識別装置46に送付する。
【0054】
類似文字識別装置46では、次元圧縮特徴量が送られてくると、辞書レコードとして類似文字辞書42に保存されている2つの平均圧縮特徴量との間でユークリッド距離を算出し、距離の小さい方を第1候補、大きいほうを第2候補として、マッチング装置45から送られてきた認識結果を修正して(ステップS25)、その認識結果を出力する(ステップS26)。
【0055】
[正準判別分析について]
正準判別分析について具体的に説明する。
【0056】
(1)正準判別分析
ある文字種cのn次元の特徴ベクトルXから正準判別分析によって、n´次元の特徴量ベクトルYを選択する方法を以下に説明する。
【0057】
まず、次式を満たす固有ベクトル行列Φと固有値行列Λを求める。
【0058】
Φ=SΦΛ …… (1)
ここで、Sはクラス間分散行列、Sはクラス内分散行列であり、Λは固有値λ(λ≦λ≦…≦λ)を対角要素とする固有値行列、Φは対応する固有ベクトルΦを列ベクトルとする固有ベクトル行列である。
【0059】
この固有ベクトルを固有値の大きいほうからだけ取った射影行列W´={Φ,…,Φn´}により、n次元特徴量ベクトルXを射影し、新たなn´次元の特徴量ベクトルYを、
=W´X …… (2)
として求める。但し、分類するクラス数がkの場合、n´≦(k−1)である。
【0060】
(2)主成分分析
ある文字種cのn次元の特徴ベクトルXから主成分分析によって、n´次元の特徴量ベクトルYを選択する方法を以下に説明する。
【0061】
まず、次式を満たす固有ベクトル行列Φと固有値行列Λを求める。
【0062】
Φ=ΦΛ …… (3)
ここで、Sは共分散行列、Λは固有値λ(λ≦λ≦…≦λ)を対角要素とする固有値行列、Φは対応する固有ベクトルΦを列ベクトルとする固有ベクトル行列である。
【0063】
この固有ベクトルを固有値の大きいほうからだけ取った射影行列W´={Φ,…,Φn´}により、n次元特徴量ベクトルXを射影し、新たなn´次元の特徴量ベクトルYを、
=W´X …… (2)
として求める。但し、n´<nである。
【0064】
[クラス内分散、クラス間分散について]
クラス内分散、クラス間分散について具体的に説明する。
【0065】
n次元の各データベクトルをx、クラスをMとした場合、各クラス平均と全体平均との差v及び各例題とクラス平均との差w(t)を、
【0066】
【数1】
Figure 0004336516
【0067】
と定義し、クラス間分散行列Bとクラス内分散行列Wを、
【0068】
【数2】
Figure 0004336516
【0069】
と定義する。
【0070】
【発明の効果】
請求項1,2,6〜8に記載の発明は、高品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0071】
請求項3に記載の発明は、請求項2に記載の発明において、低品質セットの中から一部のカテゴリのデータを選択し、選択されたデータについてクラス内分散を算出することで、品質データに対する認識性能を保持しつつ、また、高品質データに対する悪影響なしに、低品質データに対する認識性能を向上させることができる。
【0072】
請求項4に記載の発明は、請求項2又は3に記載の発明において、正準判別分析による次元圧縮を含めて次元圧縮を多段階に行なうことができる。
【0073】
請求項5に記載の発明は、前請求項4に記載の発明において、正準判別分析による次元圧縮、主成分分析を用いる次元圧縮により、次元圧縮を多段階に行なうことができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である文字認識装置のハードウエア構成を示す電気的な接続のブロック図である。
【図2】文字認識装置の射影ベクトルの算出までの処理の機能ブロック図である。
【図3】文字認識装置の射影ベクトルの算出までの処理のフローチャートである。
【図4】文字認識装置の射影ベクトルの算出までの処理に関する他の例の機能ブロック図である。
【図5】文字認識装置の射影ベクトルの算出までの処理に関する他の例のフローチャートである。
【図6】文字認識装置による多段階認識を用いたマッチング処理の機能ブロック図である。
【図7】文字認識装置による多段階認識を用いたマッチング処理のフローチャートである。
【図8】類似文字辞書の登録例を説明する説明図である。
【符号の説明】
1 特徴量次元圧縮装置、マッチング装置
22,23 記憶手段
24 クラス内分散行列算出手段
26 クラス間分散行列算出手段

Claims (6)

  1. クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行う特徴量次元圧縮装置において、
    学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、
    前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、
    前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、
    を備えていることを特徴とする特徴量次元圧縮装置。
  2. クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行なってパターンマッチングを実行するマッチング装置において、
    学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、
    前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、
    前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、
    を備えていることを特徴とするマッチング装置。
  3. 当該マッチング装置の認識対象のフォントが変更された場合において、
    前記記憶手段は、変更されたフォントの学習データについて収集された高品質セットを記憶し、
    前記クラス間分散行列算出手段は、前記収集された高品質セットを用いてクラス間分散行列を算出し、
    前記クラス内分散行列算出手段は、前記クラス内分散行列の算出の際に、算出結果として、変更される前のフォントの学習データについての低品質セットを用いて前記クラス間分散行列算出手段により既に算出され保存されていたクラス間分散行列を流用すること、
    を特徴とする請求項2に記載のマッチング装置
  4. 正準判別分析を用いた特徴量の次元圧縮をコンピュータに実行させるコンピュータに読み取り可能なプログラムにおいて、
    学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶処理と、
    前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出処理と、
    前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出処理と、
    をコンピュータに実行させることを特徴とするプログラム。
  5. クラス内分散、クラス間分散を利用して正準判別分析を用いた特徴量の次元圧縮を行なってパターンマッチングをコンピュータに実行させるコンピュータに読み取り可能なプログラムにおいて、
    学習データについて誤りを許容しない高品質セットと品質が低いためある程度の誤りを許容する低品質セットとに分類して記憶する記憶手段と、
    前記高品質セットを用いて前記低品質セットは用いることなくクラス間分散行列を算出するクラス間分散行列算出手段と、
    前記低品質セットを用いて前記高品質セットは用いることなくクラス内分散行列を算出するクラス内分散行列算出手段と、
    をコンピュータに実行させるプログラム。
  6. プログラムを記憶している記憶媒体において、
    請求項4又は5に記載のプログラムを記憶していること、を特徴とする記憶媒体。
JP2003106174A 2003-04-10 2003-04-10 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体 Expired - Fee Related JP4336516B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003106174A JP4336516B2 (ja) 2003-04-10 2003-04-10 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003106174A JP4336516B2 (ja) 2003-04-10 2003-04-10 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2004310639A JP2004310639A (ja) 2004-11-04
JP4336516B2 true JP4336516B2 (ja) 2009-09-30

Family

ID=33468438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003106174A Expired - Fee Related JP4336516B2 (ja) 2003-04-10 2003-04-10 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP4336516B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2599440B1 (en) * 2010-11-11 2018-08-22 Olympus Corporation Ultrasonic observation device, method for operating ultrasonic observation device, and operation program for ultrasonic observation device
WO2012063929A1 (ja) 2010-11-11 2012-05-18 オリンパスメディカルシステムズ株式会社 超音波観測装置、超音波観測装置の作動方法および超音波観測装置の作動プログラム
JPWO2012063930A1 (ja) * 2010-11-11 2014-05-12 オリンパスメディカルシステムズ株式会社 超音波診断装置、超音波診断装置の作動方法および超音波診断装置の作動プログラム
JP6080580B2 (ja) * 2013-02-07 2017-02-15 三菱電機株式会社 パターン認識装置

Also Published As

Publication number Publication date
JP2004310639A (ja) 2004-11-04

Similar Documents

Publication Publication Date Title
US6671404B1 (en) Method and apparatus for recognizing patterns
JP4989308B2 (ja) 画像処理装置及び画像検索方法
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
KR100494261B1 (ko) 패턴 인식 장치 및 방법
JP4336516B2 (ja) 特徴量次元圧縮装置、マッチング装置、プログラム及び記憶媒体
JP4066507B2 (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
JP3475886B2 (ja) パターン認識装置及び方法並びに記録媒体
WO2008044380A1 (fr) Dispositif de reconnaissance de motif pour reconnaître un motif de saisie à l'aide d'un motif de dictionnaire
US8379983B2 (en) Dictionary creating apparatus, recognizing apparatus, and recognizing method
CN115294417A (zh) 用于图像处理的方法、设备和存储介质
JPH10307889A (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
US20020097915A1 (en) Word recognition device, word recognition method, and storage medium
WO2011058605A1 (ja) 計量空間学習装置
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP3930174B2 (ja) 文字認識方法および文字認識装置
JP3925011B2 (ja) パターン認識装置及び認識方法
JP2765514B2 (ja) 手書き記号認識システム
JP7335378B1 (ja) メッセージ分類装置、メッセージ分類方法、およびプログラム
JP2002183667A (ja) 文字認識装置及び記録媒体
JPH07160824A (ja) 文字認識装置
JP4377283B2 (ja) 特徴抽出装置、特徴抽出方法、および、プログラム
JP4805485B2 (ja) 単語認識方法および単語認識装置
CN114296894A (zh) 基于日志数据的调用链智能分析方法、装置及电子设备

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041012

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051116

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090629

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees