JP2007188190A - パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 - Google Patents

パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 Download PDF

Info

Publication number
JP2007188190A
JP2007188190A JP2006004135A JP2006004135A JP2007188190A JP 2007188190 A JP2007188190 A JP 2007188190A JP 2006004135 A JP2006004135 A JP 2006004135A JP 2006004135 A JP2006004135 A JP 2006004135A JP 2007188190 A JP2007188190 A JP 2007188190A
Authority
JP
Japan
Prior art keywords
component
pattern
dictionary
similarity
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006004135A
Other languages
English (en)
Other versions
JP5020513B2 (ja
Inventor
Minako Kuwata
みな子 桑田
Yoshiyuki Koyama
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006004135A priority Critical patent/JP5020513B2/ja
Publication of JP2007188190A publication Critical patent/JP2007188190A/ja
Application granted granted Critical
Publication of JP5020513B2 publication Critical patent/JP5020513B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】類似度によるパターン認識を高速に行うための技術を提供する。
【解決手段】マッチング部107は、入力特徴ベクトルの成分と辞書特徴ベクトルの成分の積和演算を繰り返し行う。ベクトル成分並べ替え部106は、入力特徴ベクトルの成分のうち、値の大きな成分を優先的に演算の対象として取り出せるように設定する。具体的には、入力特徴ベクトルの成分を降順に並べ替え、並べ替え処理に関する情報を並べ替え情報114として記憶する。これによりマッチング部107は、特徴ベクトルの成分のうち、類似度の値に大きな影響を持つ成分を優先的に演算の対象とする。そのため、すべての成分を類似度算出の演算対象とする必要がなくなる。したがって、予め上記演算の対象とする成分の数を設定したり、閾値を設定し上記演算を途中で打ち切ったりすることができるようになるため、類似度によるパターン認識を高速に行うことができる。
【選択図】図1

Description

本発明は、認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関する。
従来、光学式文字読取装置(以下OCRと略す)などの文字認識装置において、パターンマッチングにより文字認識を行う方法が広く用いられている。パターンマッチングは、入力文字画像から特徴ベクトルを抽出し(入力文字画像から抽出された特徴ベクトルのことを、特に、入力特徴ベクトルと呼称する)、予め各文字に対して用意されている標準的な特徴ベクトル(以下辞書特徴ベクトルと呼称する)との照合処理を行い、最もパターンが近いと判断された辞書特徴ベクトルに対応した文字を認識結果として決定するものである。
ここで、特徴ベクトルについてメッシュ特徴ベクトルを例として説明を行う。図17(a)は、特徴ベクトルを抽出するために矩形に切り取られた文字画像の例を表す図である。上記文字画像に対しメッシュ分割を行い、メッシュで分割された各領域の画素数を元に正規化等の処理を行って算出した値を成分とするベクトルを、メッシュ特徴ベクトルと呼ぶ。
図17(b)は、図17(a)の文字画像を、縦横8×8の領域にメッシュ分割した様子を表す図である。図18は、図17(b)のメッシュ分割の結果抽出されるメッシュ特徴ベクトルの各成分を、上記分割された各領域に示した図である。図18の例ではメッシュ特徴ベクトルの成分の数は64(8×8)であり、一文字がこれら64の成分からなる特徴ベクトルにより規定される。
次に、辞書特徴ベクトルについて、より詳しく説明を行う。上述の通り、辞書特徴ベクトルは、パターンマッチングの照合処理の基準として、予め用意されている標準的な特徴ベクトルである。そのため、辞書特徴ベクトルは、あるカテゴリー(たとえばある一文字)について収集された複数のサンプルデータについて、それぞれ特徴ベクトルが抽出され、それらに対し統計処理を行うことにより作成される。
辞書特徴ベクトルはカテゴリーごとに登録され、辞書を構成する。図19は、辞書の構成例の一つを表す図である。図19に示されている辞書は、辞書カテゴリー1から辞書カテゴリーNまでのN個のカテゴリーから成る。さらに、1つのカテゴリー(たとえばある1文字)は、第1特徴ベクトルから第Z特徴ベクトルまでのZ個の特徴ベクトルで構成されている。
特徴ベクトルを用いたマッチング演算は、シティーブロック距離や、ユークリッド距離、類似度等を用いて行われる。入力された文字とマッチング対象となる辞書登録された文字が、それぞれ、図18に示すような縦横8×8にメッシュ分割した64成分からなる特徴ベクトルにより規定される場合を例として、シティーブロック距離及び類似度の算出式をそれぞれ数1、数2に示す。
入力された文字の入力特徴ベクトルをX(X1、X2・・・X64の64成分)、マッチング対象となる辞書登録された文字の辞書特徴ベクトルをY(Y1、Y2・・・Y64の64成分)とすると、シティーブロック距離Dは次の計算式で求められる。
Figure 2007188190
また、単純類似度Sは次の計算式で求められる。
Figure 2007188190
上述したとおり、パターンマッチングは入力文字画像から抽出された入力特徴ベクトルと予め登録されている辞書特徴ベクトルとのマッチング処理により行われるが、このマッチング処理は時間を要するため、従来から、この時間を短縮するための方法が提案されてきた。
特許文献1では、文字認識装置において、読み取った文字の特徴量(上記特徴ベクトルの各成分に相当)と標準文字の特徴量(上記辞書特徴ベクトルの各成分に相当)との差を累積加算する演算を実行し、累積加算された値が設定された閾値を超えた場合、実行中の標準文字に関する累積加算の演算を終了し、次の標準文字に関して上記演算を開始することにより、マッチング時間を短縮する方法が開示されている。
また、従来技術においては、マッチング処理は、まず辞書の第1特徴ベクトルとのマッチング距離が近いものから上位P個を抽出し、抽出されたP個については、さらに詳細に識別するために第2特徴ベクトルから第Z特徴ベクトルまでマッチングを行う。
次に、図20を用いて、OCRなどの文字認識装置において従来用いられてきたパターンマッチング高速化手法の処理フローについて説明を行う。以下の説明では、マッチングは、メッシュ特徴ベクトルを用いて行われるものとする。
はじめに、マッチング処理の概要について説明する。図20に示す従来のマッチング処理の例では、まず、入力文字とすべての辞書登録文字との距離が算出される。つまり、入力文字画像から抽出された入力特徴ベクトルと辞書に登録されているすべての文字の辞書特徴ベクトルとの距離(たとえばシティーブロック距離)が算出される。算出された距離は値が小さいほど誤差が少なくパターンが近いといえる。
図20の例では、上記距離は、シティーブロック距離の算出式の数1に示されるような、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算する演算により算出される。ここで、上記累積加算は、各特徴ベクトルのすべての成分について行われる訳ではなく、上記累積加算の対象とする特徴ベクトルの成分の数(図20においてはY)が予め設定されている。つまり、上記累積加算は、上記予め設定された回数(ここではY回)のみ実行されることになる。
すべての文字について距離算出が終了すると、算出された距離が小さいものから上位P個の辞書登録文字を候補文字とする。以降は、上記候補文字P個についてのみ詳細マッチングを行うが、最初に実行するすべての文字に対するマッチング処理と同様に、ここでも累積加算の演算を行う。ただし、ここでは詳細にマッチングを行うため実行される累積加算回数は、すべての文字に対するマッチング処理時の累積加算の回数(ここではY回)より増加させることになる。また、詳細マッチングでは、辞書の第1特徴ベクトルとの距離演算だけでなく、第2特徴ベクトルから第Z特徴ベクトルまでのすべての辞書特徴ベクトルとの距離演算が行われる。
それでは、図20のフローについての詳細な説明を行う。まず、文字画像が入力され(S2001)、入力された文字画像の切り出しが行われる(S2002)。入力された文字画像はメッシュ分割され、各領域の画素数に基づき正規化等の処理が行われ入力特徴ベクトルが抽出される(S2003)。
入力特徴ベクトルが抽出されると、マッチング処理が開始される。処理概要で説明したとおり、はじめにすべての文字について距離の算出が行われるため、すべての文字について、マッチングが行われたか否かについての判定を行う必要がある。そして上記の判定を行うためには、現在までに距離の算出が行われた文字数をカウントしておく必要がある。
そのため、上記カウント用の変数としてマッチング辞書カウンタjが用意されており、はじめにこれを初期化(jに0を設定)しておく(S2004)。また、図20の例においては、辞書に登録されているすべての文字数をNとする。
次に、すべての文字について、1文字づつ繰り返し距離が算出されることになるが、新たな文字についての距離が算出される前には毎回、すべての文字について距離算出が終了したか否かの終了判定を行う(S2005)。ここで、すべての文字について距離算出が終了していない場合(j<Nの場合)、入力文字と辞書登録された文字との距離算出の演算が開始される。
距離算出の演算は、処理概要で説明したとおり、予め設定された回数(ここではY回)の累積加算の演算が実行されるため、現在何回目の累積加算を実行したかをカウントしておく必要がある。そのため、上記累積加算の回数をカウントするための変数として、マッチング要素カウンタiが用意されている。また、距離算出のための累積加算用の変数としてDjが用意され、これらを初期化(i及びDjに0を設定)しておく(S2006)。
累積加算が実行される前には毎回、累積加算の回数が予め設定された回数(ここではY回)を超えてないかの判定が行われる(S2007)。ここで、累積加算回数が予め設定された回数を超えていない間(i<Y)、Djに入力特徴ベクトルと辞書特徴ベクトルの成分の差が累積加算され(S2008)、累積加算回数のカウント用変数iがインクリメントされる(S2009)という一連の処理が繰り返される。
上記繰り返し処理中に、累積加算回数についての判定ステップS2007で、累積加算の回数が予め設定された回数を超えた場合(i<Yでない場合)、現在マッチング対象としている文字についての距離算出は終了する。
その後、マッチング辞書カウンタjをインクリメントして(S2010)、現在までに距離の算出が終了した文字数をカウントする。そして、すべての文字についてマッチングが終了したか否かの終了判定ステップS2005に進む。すべての文字についてのマッチングが終了した場合(j<Nでないの場合)には、距離の算出結果が格納されているD0からDnについてソートする(S2011)。
以降は、上記抽出された上位P個の文字について詳細マッチングを行い(S2012)、その結果、最も入力された文字とパターンが近いと判定された文字をマッチング結果として出力し(S2013)、処理を終了する。
以上、図20を用いて、従来のパターンマッチング高速化手法の処理フローについて一例を示した。図20の例では、入力された文字に対して、辞書に登録されているすべての文字とマッチングを行うが、各文字のマッチング処理で実行される入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算する処理について、予め累積加算する成分の数(累積加算の実行回数に相当)を設定し、各特徴ベクトルのすべての要素を累積加算の対象とはしないことにより(各特徴ベクトルの一部の要素のみ累積加算の対象とすることにより)、高速化を図っていた。
また、図20の処理フローにより説明した方法と比較し、さらなる高速化を図るため、距離算出の演算について閾値によるスキップ処理を導入する方法も提案されてきた。
図21は、上記閾値によるスキップ処理を行う際に使用される閾値テーブル2101の例である。図21には、閾値テーブル2101と辞書2102との関係についても示されている。閾値テーブル2101は、辞書2102を構成している各カテゴリー(たとえば、文字)に対応した閾値が集まって構成されている。たとえば、判定閾値Tnは、辞書のカテゴリーNに対応する閾値である。各判定閾値は学習データにより統計的に計算された値であり、たとえば辞書のカテゴリーNに登録されている辞書特徴ベクトルとカテゴリーNについての任意の入力特徴ベクトルとの距離は、必ず判定閾値Tnの範囲内であることが保障されている。
入力文字と辞書登録されている文字との距離の算出は、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算することによって行われるが、辞書登録されている文字ごとにそれぞれ距離の閾値が設けられていることによって、累積加算により算出された値が、上記設定されている閾値以下の間のみ、さらに下位要素についてまでの累積加算演算を続行し、上記設けられている閾値を上回った場合、演算を打ち切るような処理を行わせることが可能となる。
図22は、閾値により距離算出の演算をスキップするパターンマッチングのフローチャートである。図22のステップS2201からステップS2208は、図20のステップS2001からステップS2008と同様の処理内容であり説明は省略する。
距離算出においては、図20の処理と同様に入力された文字の入力特徴ベクトルと辞書登録されている文字の辞書特徴ベクトルの各要素(成分)の差を累積加算する演算が実行されることになる。
前述したとおり、図22の処理においては、累積加算により算出された距離が、辞書のカテゴリー(たとえば文字)ごとにそれぞれ設けられている閾値以下の間のみ、さらに下位要素についてまでの累積加算の演算を続行し、上記設けられている閾値を上回った場合、累積演算を打ち切り、現在対象としている文字についての距離が確定され、次の文字についての距離算出へと処理が移ることになる。
そこで、ステップS2209では、現在対象としている文字について、累積加算により算出された距離が、閾値テーブル2101に格納されている判定閾値以下であるか否かの判定が行われることになる。この判定において、距離が判定閾値以下であった(Dj<Tj)場合には、ステップS2210に移行しマッチング要素カウンタiがインクリメントされ、そのまま距離算出の演算が続行される。
また、距離が判定閾値を上回る(Dj<Tjでない)場合には、現在対象としている文字についての距離は確定され、ステップS2211にて距離変数Djに、算出された距離の最大値が格納され、ステップS2212にてマッチング辞書カウンタjをインクリメントし、次の文字の距離計算に処理を移す。
以降のステップS2213からステップS2215は、図20のステップS2011からステップS2013と同様の処理内容であり説明は省略する。以上が、閾値によるスキップ処理を導入しパターンマッチングを高速化させる手法の従来例である。
また、特許文献2では、文字認識方式において、特徴ベクトルの要素数に依存して累積加算の演算が増加し、それに伴いマッチング処理が長時間化する問題に対し、文字識別効果の大きい辞書特徴ベクトルの成分と、上記効果がそれほど顕著でない辞書特徴ベクトルの成分とがあることを利用したマッチング処理の高速化手法について開示されている。
具体的には、全文字種の辞書特徴ベクトルの成分を、標準偏差または分散の大きい順に並べ替えて、辞書特徴ベクトルとして登録している。一方、入力文字は入力特徴ベクトルが抽出されると、入力特徴ベクトルの各成分が並べ替え部にて並べ替えテーブルの情報に従って標準偏差または分散の大きい順に並べ替えられ、距離演算が行われる。
つまり、各文字の特徴ベクトルの成分(特徴量)を文字識別効果の高い成分から優先的に累積加算されるように、並べ替えを行っておくことにより、より高速なマッチング処理を実現するというものである。
以上のとおり、従来の文字認識装置において、距離演算回数が少なくなるような各種の方法を用いることにより、パターンマッチングの高速化が実現されてきた。
特開平02−44488号公報(1990年2月14日公開) 特開昭63−109592号公報(1988年5月14日公開)
上記従来技術の距離を使用するマッチング手法においては、距離算出の累積加算は、必ずしも特徴ベクトルのすべての成分について上記累積加算の対象とする必要はなかった。しかしながら、類似度を用いたマッチングを行う場合は、算出された類似度が最大のものをマッチング結果とするため、特徴ベクトルの一部の要素のみを累積加算の対象とすることはマッチングの精度を考慮すると好ましくなかった。
つまり、上記距離を使用するマッチング処理においては、あらかじめ累積加算の対象とする特徴ベクトルの要素数を設定しておくことや、閾値を設定することにより累積加算を打ち切りなどの高速化手法を適用できたが、類似度を用いたマッチング処理に対して上記高速化手法を適用することは困難であった。
したがって、従来、類似度を用いてマッチングを行う場合は、図18のメッシュ特徴ベクトルの場合を例に挙げると、1つの特徴ベクトルの要素数は64(8×8)であり、1つのカテゴリー(たとえばある1文字)について距離を求める場合64回の演算が必要となる。
これでは、日本語のように文字数が多い言語においては、カテゴリー数が3000以上にもなり、少なくとも192000(64×3000)回の演算を行わなくてはならなかった。さらに、1つのカテゴリーの辞書特徴ベクトルが複数の特徴ベクトルから成る場合、詳細マッチングにおいては、さらに多くの演算が必要であった。さらに、類似度演算は積和によるため加算のみで実現可能な距離演算に比べ、1回の演算に要する時間のコストが高かった。
そのため、類似度を用いたマッチング処理においても、特徴ベクトルの要素の一部のみを累積加算の対象とする手法や、閾値を設定し距離演算を途中で打ち切る手法を導入できるようにしたいという要求があった。
また、特許文献2において示されている特徴ベクトルの要素の文字識別効果を基準にした並び替えは、統計的な手法によるものであり、入力特徴ベクトルの特性により並び替えを行っているものではなかった。したがって、入力された文字が「/」のように特徴ベクトルの成分に0が多く(文字画像の画素が存在しないメッシュ分割領域が多く)、入力特徴ベクトルの要素の値に非常に偏りがあるような場合には、高速化の効果が薄いという問題点もあった。
本発明は、識別対象パターンをより高速に認識できるパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体を提供することを目的とする。
本発明に係るパターン認識装置は、上記問題を解決するために、
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識手段とを備えていることを特徴としている。
上記の構成によれば、本発明に係るパターン認識装置は、認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置である。まず、上位成分抽出手段が、前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する。そして、乗算値算出手段が、前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する(すなわち、前記上位成分に方向が一致する)前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する。さらに、上位成分類似度算出手段が、前記上位成分について算出された前記乗算値のみを加算することによって(すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって)、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する。最後に、パターン認識手段が、前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識する。
以上のように、パターン認識装置は、入力特徴ベクトルを構成する成分のうち、値の大きな成分を、上位成分類似度を算出する演算の対象として優先的に使用する。すなわち、値の小さい成分を、上位成分類似度を算出する演算の対象から外す。このような演算方式に基づいても、パターン認識装置が算出する上位成分類似度は、各辞書パターンと認識対象パターンとの正確な類似度を十分に反映したものとなる。すなわち、パターン認識装置が算出する上位成分類似度の精度は、入力特徴ベクトルを構成するすべての成分を前記演算の対象として算出される類似度の精度と、同等になる。したがって、パターン認識装置は、認識対象パターンがどの辞書パターンにマッチングするのかを、算出した上位成分類似度に基づき正確に照合できる。
このようにパターン認識装置は、認識対象パターンを正確に認識するための判定根拠となる上位成分類似度を、限られたベクトル成分を使って算出する。これにより、パターン同士をより少ない計算量によって照合できるため、結果的に、より少ない計算量によって、認識対象パターンをある辞書パターンとして認識できる。これによりパターン認識装置は、識別対象パターンをより高速に認識できる効果を奏する。
本発明に係るパターン認識方法は、上記の課題を解決するために、
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置が実行するパターン認識方法であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出ステップと、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出ステップと、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出ステップと、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識ステップとを含んでいることを特徴としている。
上記の構成によれば、上述したパターン認識装置と同様の作用効果を奏する。
また、本発明に係るパターン認識装置では、さらに、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することが好ましい。
上記の構成によれば、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。そして、下位成分抽出手段が、前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する。次に、下位成分乗算値算出手段が、前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する(すなわち、前記上位成分に方向が一致する)前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出し、下位成分加算値算出手段が、前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する。さらに、全成分類似度算出手段が、前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する。最後に、前記パターン認識手段が、前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識する。
以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた数の候補パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際に用いる上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについては、候補パターンを絞り込む際に対象としなかった入力特徴ベクトルの成分について、全成分類似度を算出する演算の対象とする。つまり、入力特徴ベクトルを構成するすべての成分を用いることによって、上位成分類似度よりも高精度な全成分類似度を算出することになる。したがって、パターン認識装置は、認識対象パターンを、候補パターンとの高精度な全成分類似度に基づく照合により、正確に認識できる。
このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って上位成分類似度を算出することで、候補パターンの抽出を高速に行うことができる。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。
また、本発明に係るパターン認識装置では、さらに、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することが好ましい。
上記構成によれば、本発明に係るパターン認識装置は、互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されている。そして、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。次に、関連乗算値算出手段が、前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する(すなわち、前記上位成分に方向が一致する)前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する。さらに、関連上位成分類似度算出手段が、前記上位成分について算出された前記関連乗算値のみを加算することによって(すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって)、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する。そして、詳細類似度算出手段が、前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識する。
以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた数の候補パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについて、関連辞書特徴ベクトルを用いて、認識対象パターンとの、関連上位成分類似度を算出する。この関連上位成分類似度の算出においても、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、関連上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。パターン認識装置は、この関連上位成分類似度と、候補パターンを抽出する際に算出した上位成分類似度とを、候補パターンごとに加算して算出する高精度な詳細類似度に基づいて、認識対象パターンを照合する。
このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って上位成分類似度を算出することで、候補パターンの抽出を高速に行うことができる。さらに、高精度な詳細類似度を算出するための関連上位成分類似度を算出する際にも、限られたベクトル成分を使って関連上位成分類似度を算出する。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。
また、本発明に係るパターン認識装置では、さらに、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することが好ましい。
上記構成によれば、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。そして、下位成分抽出手段が、前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する。次に、下位成分乗算値算出手段が、前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する(すなわち、前記上位成分に方向が一致する)前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出し、下位成分加算値算出手段が、前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する。さらに、全成分類似度算出手段が、前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識する。
以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについては、候補パターンを絞り込む際に対象としなかった入力特徴ベクトルの成分についても、全成分類似度を算出する演算の対象とする。つまり、入力特徴ベクトルを構成するすべての成分を用いることによって、上位成分類似度よりも高精度な全成分類似度を算出することになる。したがって、パターン認識装置は、認識対象パターンを、候補パターンとの高精度な全成分類似度に基づく照合により、正確に認識できる。
このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って類似度を算出することで、候補パターンの抽出を高速に行うことができる。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。
また、本発明に係るパターン認識装置は、さらに、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することが好ましい。
上記構成によれば、本発明に係るパターン認識装置は、互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されている。そして、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。次に、関連乗算値算出手段が、前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する(すなわち、前記上位成分に方向が一致する)前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する。さらに、関連上位成分類似度算出手段が、前記上位成分について算出された前記関連乗算値のみを加算することによって(すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって)、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する。そして、詳細類似度算出手段が、前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識する。
以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについて、関連辞書特徴ベクトルを用いて、認識対象パターンとの、関連上位成分類似度を算出する。この関連上位成分類似度の算出においても、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、関連上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。パターン認識装置は、この関連上位成分類似度と、候補パターンを抽出する際に算出した上位成分類似度とを、候補パターンごとに加算して算出する高精度な詳細類似度に基づいて、認識対象パターンを照合する。
このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って上位成分類似度を算出することで、候補パターンの抽出を高速に行うことができる。さらに、高精度な詳細類似度を算出するための関連上位成分類似度を算出する際にも、限られたベクトル成分を使って関連上位成分類似度を算出する。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。
また、本発明に係るパターン認識装置は、さらに、
前記閾値は、前記辞書パターンごとに個別に設定されていることが好ましい。
上記構成により、前記辞書パターンごとに、詳細マッチングの対象とするかを判定する閾値を設定することで、詳細マッチングの対象となる候補パターンの抽出を精度よく行うことができるという効果を奏する。
また、本発明に係るパターン認識装置は、さらに、
前記上位成分抽出手段が抽出する前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出手段をさらに備えていることが好ましい。
上記構成により、上位成分類似度を算出する演算の対象とする入力特徴ベクトルの成分の数を、入力特徴ベクトルの成分の特性に応じて決定することができるという効果を奏する。
また、本発明に係るパターン認識装置は、さらに、
前記乗算値算出手段は、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、
前記上位成分類似度算出手段は、前記乗算値を順に加算することによって、前記上位成分類似度を算出することが好ましい。
上記構成により、本発明に係るパターン認識装置は、前記乗算値算出手段が、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、前記上位成分類似度算出手段が、前記乗算値を順に加算することによって、前記上位成分類似度を算出する。
以上のように、パターン認識装置は、上位成分類似度を算出する演算において、前記演算の対象となる入力特徴ベクトルの成分の値が、あらかじめ定められた閾値を下回った時点で、前記演算を打ち切ることができる。これにより、上位成分類似度を算出する演算の回数を減らし、識別対象パターンをより高速に認識できる効果を奏する。
なお、前記パターン認識装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記パターン認識装置をコンピュータにおいて実現するパターン認識プログラム、およびそのパターン認識プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、パターン認識装置は、認識対象パターンを正確に認識するための判定根拠となる類似度を、限られたベクトル成分を使って算出する。これにより、パターン同士をより少ない計算量によって照合できるため、結果的に、より少ない計算量によって、認識対象パターンをある辞書パターンとして認識できる。これによりパターン認識装置は、識別対象パターンをより高速に認識できる効果を奏する。
以下図面を参照しながら、本発明に係る一実施形態について説明する。
(機能構成)
はじめに、本発明に係る文字認識装置1(パターン認識装置)の構成について、図1を参照して説明する。図1は、本発明に係る文字認識装置1の要部構成を表すブロック図である。
図1に示すように、文字認識装置1は、スキャナー102と、読み取り部103と、切り出し部104と、特徴抽出部105と、ベクトル成分並べ替え部106(上位成分抽出手段)と、マッチング部107(乗算値算出手段、上位成分類似度算出手段、パターン認識手段、候補パターン抽出手段、下位成分抽出手段、下位成分乗算値算出手段、下位成分加算値算出手段、上位成分抽出数算出手段)と、詳細マッチング部108(全成分類似度算出手段、関連乗算値算出手段、関連上位成分類似度算出手段、詳細類似度算出手段)と
、メモリ109と、ハードディスク110と、出力処理部111と、出力部112とを備えている。さらに、ハードディスク110は、辞書113と並べ替え情報114を記憶している。
(マッチング方法)
文字認識装置1におけるマッチング処理の概要について、以下に説明する。まず、ユーザが、スキャナー部102を介して、原稿などから文字を入力する。次に、読み取り部103は、ユーザが入力した文字を画像として読み取る。次に、切り出し部104は、画像として読み取られた文字を、文字パターン(認識対象パターン)として矩形に切り出す。
次に、特徴抽出部105は、文字パターンから入力特徴ベクトルを抽出する。このとき、まず、文字パターンを、図3に示すような縦横8×8の正方形のメッシュ領域に等分割する。特徴抽出部105が分割する各メッシュ領域の面積は、すべて等しくなる。また、以下では、説明のため、分割した各領域を、図3の各領域上に示す番号により規定する。成分の番号は、最上段の左端のメッシュ領域を0番とし、左から右へ順番に1づつ増加する。番号は、右端に達すると、次段の左端へと続き、最上段と同様に右へ順番に1づつ増加する。以下、同様の規則に従い、最下段の右端のメッシュ領域まで、番号を付す。本明細書では、図3において番号nが示されている領域を、第n番目の領域と呼ぶ。
さらに、特徴抽出部105は、各メッシュ領域に含まれる文字を表す画素(黒色画素)の数を、メッシュ領域ごとにカウントする。ベクトル成分並べ替え部106、マッチング部107およびマッチング部108は、各メッシュ領域に含まれる黒色画素の数を成分とするベクトルを用いて処理を行う。パターン認識技術の分野において、上記黒色画素の数のようなパターンの特徴を表す量を、特徴量という。また、この特徴量を成分とするベクトルを、特徴ベクトルという。特に、各メッシュ領域に含まれる黒色画素の数を成分とする特徴ベクトルを、メッシュ特徴ベクトルという。
マッチング部107および詳細マッチング部108は、ユーザが入力した文字と、辞書113が記憶している文字とのマッチング(以下では単にマッチング処理と呼ぶ)を行う。ここでは、ユーザが入力した文字(以下では、入力文字と呼ぶ)から特徴抽出部105が抽出した特徴ベクトルを、入力特徴ベクトルと呼ぶ。また、辞書113が記憶している各文字(以下では、辞書登録文字と呼ぶ)についての特徴ベクトルを、辞書特徴ベクトルと呼ぶ。辞書特徴ベクトルは、各文字の標準的なパターンを表す特徴ベクトルである。
ここで、辞書113の構成について、図19を参照して説明する。辞書113は、図19に示すように、N個(Nは正の整数)のカテゴリーについての辞書特徴ベクトルを記憶している。ここでいう「カテゴリー」は、本実施形態では文字に対応する。また、特許請求の範囲に記載の「辞書パターン」にも対応する。また、一つの文字についての辞書特徴ベクトルは、第1特徴ベクトルから第Z特徴ベクトルまでのZ個(Zは正の整数)の特徴ベクトルから成る。つまり、第1特徴ベクトルから第Z特徴ベクトルは、それぞれ、ある一つの文字についての異なるZ個の標準的なパターンから、特徴抽出部105が特徴を抽出して生成した特徴ベクトルである。辞書特徴ベクトルは、カテゴリーごとに同じ数だけ用意されている。すなわち、いずれのカテゴリーについても、対応する辞書特徴ベクトルが、第1〜第Z特徴ベクトルまで用意されている。
また、マッチング部107および詳細マッチング部108は、入力文字と辞書登録文字との類似度を算出することによって、マッチング処理を行う。マッチング部107および詳細マッチング部108は、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第n番目の領域に含まれる黒色画素の数同士を乗算し、上記乗算の結果をすべて加算することにより、類似度を算出する。すなわち、入力特徴ベクトルを構成する成分と、辞書特徴ベクトルを構成する成分とを、対応する成分同士を掛け合わせる。
マッチング部107は、類似度を算出する際、辞書特徴ベクトルのうち、いずれか1つを演算の対象とする。以下では、第1特徴ベクトルのみを演算の対象とする例を説明する。また、詳細マッチング部108は、類似度を算出する際、第1特徴ベクトルのみならず、第2特徴ベクトルから第Z特徴ベクトルまでも演算の対象とする。なお、第2〜第Z特徴ベクトルは、特許請求の範囲における関連辞書特徴ベクトルに対応する。
(入力特徴ベクトルの成分の並び替え)
マッチング部107および詳細マッチング部108が処理を開始する前に、ベクトル成分並べ替え部106は、入力特徴ベクトルの成分を降順に並べ替える。そこで以下に、図4を用いて、入力特徴ベクトルの並べ替えについて説明する。
図4(a)は、入力文字「あ」について、特徴抽出部105がカウントした各メッシュ領域に含まれる黒色画素の数を、各メッシュ領域上に示した図である。図4(b)は、入力文字「あ」について、特徴抽出部105が生成する入力特徴ベクトルを表す図である。図4(b)に示される特徴抽出部105が生成する入力特徴ベクトルの第n成分は、図4(a)に示される第n番目の領域に含まれる黒色画素の数に対応している。図4(c)は、入力文字「あ」について、図4(b)に示される入力特徴ベクトルの各成分を、ベクトル成分並べ替え部106が降順に並べ替えた後の入力特徴ベクトルを表す図である。図4(c)に示される並べ替え後の入力特徴ベクトルの第n成分は、図4(a)に示される第n番目の領域に含まれる黒色画素の数に対応していない。
以下では、図4(b)、図4(c)に示される特徴ベクトルを、それぞれ、並べ替え前の入力特徴ベクトル、並べ替え後の入力特徴ベクトルと呼ぶ。
上述したとおり、マッチング部107および詳細マッチング部108は、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第n番目の領域に含まれる黒色画素の数同士を乗算し、上記乗算の結果をすべて加算することにより、類似度を算出する。類似度を算出するための上記乗算および加算を積和演算と呼ぶ。
マッチング部107および詳細マッチング部108は、並べ替え後の入力特徴ベクトルを用いてマッチング処理を行う。
ここで、並び替え後の入力特徴ベクトルの第n成分と、辞書特徴ベクトルの第n成分とは、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第n番目の領域に含まれる黒色画素の数同士ではない。したがって、マッチング部107および詳細マッチング部108は、類似度の算出において、並び替え後の入力特徴ベクトルの第n成分と、辞書特徴ベクトルの第n成分とを演算の対象とすることはできない。そこで、マッチング部107および詳細マッチング部108は、類似度を算出する際に、並べ替え後の入力特徴ベクトルの第n成分について演算の対象となる辞書特徴ベクトルの成分(辞書成分)を検索する必要がある。そのため、文字認識装置1は、入力特徴ベクトルの成分の並べ替えについての情報を保持しておく必要があり、並べ替え情報114として、記憶する。
図4(d)は、ベクトル成分並べ替え部106が、図4(b)に示される入力特徴ベクトルの成分を並べ替えて、図4(c)に示される入力特徴ベクトルを生成する際に作成する並べ替え情報テーブル400を表す図である。並べ替え情報テーブル400が、上述した並べ替え情報114を具体的に記憶している。並べ替え情報テーブル400は、1レコードを、テーブル番号、並べ替え前要素番号、並べ替え後要素番号の3つの項目から構成する。
テーブル番号は、レコードを識別するための項目である。また、並べ替え前要素番号、並べ替え後要素番号は、それぞれ並べ替え前の入力特徴ベクトルの成分番号と並べ替え後の入力特徴ベクトルの成分番号を格納する項目である。たとえば、レコード401は、並べ替え前要素番号0、並べ替え後要素番号は50となっている。これは、並べ替え前の入力特徴ベクトルの第0成分が、並べ替え後の入力特徴ベクトルの第50成分に対応していることを表している。
類似度を算出するための演算時には、マッチング部107および詳細マッチング部108は、この並べ替え情報テーブル400に基づいて並べ替え後の入力特徴ベクトルの各成分について演算の対象となる辞書特徴ベクトルの成分を検索する。
たとえば、並べ替え後の入力特徴ベクトルの第50成分について演算を行う場合には、マッチング部107および詳細マッチング部108は、まず、並べ替え情報テーブル400の並べ替え後要素番号が50であるレコードを検索する。この例では、レコード401が検索結果に該当する。そして、取得したレコード401に含まれる並べ替え前要素番号が演算対象とする辞書特徴ベクトルの成分の番号である。この例では、辞書特徴ベクトルの第0成分が演算対象となる。
以上、入力特徴ベクトルの成分の並べ替えと並べ替え情報テーブルについて説明した。本実施形態の並べ替え処理は、ベクトル成分並べ替え部106が、入力特徴ベクトルの成分を、その大きさの降順に並べ替えるものである。入力特徴ベクトルの成分を予め降順に並べ替えておくことにより、値の大きな成分から優先的に積和演算の対象とすることが可能となる。これは、つまり、類似度に対する影響が大きい成分から順番に積和演算の対象とすることが可能ということである。
これにより、従来技術では入力特徴ベクトルのすべての成分を対象とする必要があった積和演算において、本発明では入力特徴ベクトルのすべての成分のうち、値の大きい、上位の限られたベクトル成分(上位成分)のみを対象とする。そのため、従来技術に比べ、類似度を算出する処理に要する時間を短縮でき、マッチング処理を高速化することが可能となる。上位限られたベクトル成分のみを対象として算出した類似度が、特許請求の範囲に記載の、上位成分類似度に対応する。

なお、これまで説明した、ベクトル成分並べ替え部106が、入力特徴ベクトルの成分をその大きさの降順に並べ替えることによりマッチング処理を高速化する手法と同様に、辞書特徴ベクトルの成分をその大きさの降順に並び替えることによってマッチング処理を高速化することも可能である。その場合、ベクトル成分並べ替え部106は、辞書特徴ベクトルの成分について並べ替え情報テーブル400を生成するが、並べ替え情報テーブル400は、辞書登録文字の個数分(ここではN個)必要である。
(標準処理フロー)
図2は、文字認識装置1が文字を認識するための処理の流れを表すフローチャートである。まず、読み取り部103が、スキャナー102を介して、ユーザが入力した原稿などの文字画像を読み込む(ステップS201)。次に、切り出し部104が、読み取り部103に読み込まれた文字画像から、文字パターンを切り出す(ステップS202)。そして、特徴抽出部105は、切り出し部104が切り出した文字パターンをメッシュ領域に分割し、入力特徴ベクトルを抽出する(ステップS203)。
次に、ベクトル成分並べ替え部106は、ステップS203において特徴抽出部105が抽出した入力特徴ベクトルの成分を並べ替え、上記並べ替え処理に関する情報を並べ替え情報114として生成する(ステップS204)。入力特徴ベクトルの成分の並べ替え及び並べ替え情報テーブルについての詳細内容については、(マッチング準備)において説明したとおりである。
次に、マッチング部107が、入力文字と辞書登録文字とのマッチングを行う。辞書登録文字は複数あるため、マッチング部107は、類似度の算出を、すべての辞書登録文字について終了するまで、1文字づつ繰り返し実行する。そのため、マッチング部107は、すべての辞書登録文字について類似度の算出が終了したか否かについて判定する(ステップS206)。なお、本実施形態においては、辞書登録文字は全部でN文字とする。
ステップS206におけるマッチングの終了判定を行うため、マッチング部107は、現在までに類似度を算出した文字数をカウントする必要がある。そこで、マッチング部107は、マッチング辞書カウンタjにより上記文字数をカウントする。マッチング部107は、マッチング処理の始めに、上記カウンタjを初期化(jに0を設定)しておく(ステップS205)。
ステップS206における判定の結果、すべての文字についての類似度の算出が終了していない(j<N)場合には、マッチング部107は、次の文字について類似度の算出を開始する。
上述したとおり、マッチング部107は、入力文字および辞書登録文字の各特徴ベクトル(入力特徴ベクトルと辞書特徴ベクトル)の成分について積和演算することにより類似度を算出する。ここでは、積和演算の対象とする成分の数はm(mは正の整数)とする。マッチング部107は、積和演算をm回実行した段階において、現在対象としている文字について類似度の算出を終了する。そのため、マッチング部107は、現在何回目の加算処理を実行したかをカウントしておく必要がある。そこで、マッチング部107は、マッチング要素カウンタiにより、積和演算の回数をカウントする。
また、マッチング部107が行う積和演算は、具体的には、入力特徴ベクトルと辞書特徴ベクトルの各成分の積を、類似度変数Rjに加算する処理である。マッチング部107は、この処理を、対象とするm個の成分について繰り返し実行する。ここでは、類似度を文字ごとに区別するため、類似度変数Rjは、マッチング辞書カウンタjを添え字としている。そこで、マッチング部107は、類似度を算出する処理の始めに、毎回、上記変数i及びRjについて初期化(i及びRjに0を設定)しておく(ステップS207)。
また、マッチング部107は、新たに積和演算を実行する前には毎回、既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えてないかについて判定する(ステップS208)。既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えていない場合(i<m)、マッチング部107は、入力特徴ベクトルの成分Viと辞書特徴ベクトルの成分Djiを乗算し、上記乗算結果を類似度変数Rjに加算する(ステップS209)。ここで、ViおよびDjiの添え字iは、特徴ベクトルの各成分を区別するための添え字である。また、Djiの添え字jは、辞書特徴ベクトルを文字ごとに区別するための添え字である。
なお、Djiは、入力特徴ベクトルの成分Viの演算対象となる辞書特徴ベクトルの成分を表している。つまり、マッチング部107は、並べ替え後の入力特徴ベクトルの成分Viについて演算対象となる辞書特徴ベクトルの成分Djiを、並べ替え情報テーブル400の検索結果に基づいて取得しているものとする。上記検索では、マッチング部107は、まず、並べ替え情報テーブル400から、並べ替え後要素番号がiのレコードを検索する。そして、取得したレコードの並べ替え前要素番号が、演算の対象とする辞書特徴ベクトルの成分を表す番号である。マッチング部107は、この番号の辞書特徴ベクトルを取得しDjiとしている。
ステップS209の演算の後、マッチング部107は、実行した積和演算の回数をカウントするための変数iをインクリメントする(S210)。その後、マッチング部107は、ステップS208にて積和演算の終了判定を行う。
ここで、既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えた場合(i<mでない場合)、マッチング部107は、現在対象としている辞書登録文字について、類似度を算出する処理を終了する。そして、マッチング部107は、この終了時点において類似度変数Rjに格納している値を、現在対象としていた文字に対する類似度として確定し、メモリ109上に保持しておく(S211)。
その後、マッチング部107は、マッチング辞書カウンタjをインクリメントして(ステップS212)、現在までに類似度の算出が終了した文字数をカウントする。その後、処理はステップS206に移り、マッチング部107は、すべての辞書登録文字について類似度の算出が終了したか否かの判定をする。
すべての辞書登録文字についての類似度の算出が終了した場合(j<Nでないの場合)、マッチング部107は、すべての辞書登録文字についての類似度Rj(j=1,2・・・N)をソートする(ステップS213)。
以降は、詳細マッチング部108が、類似度が大きい上位P個(Pは正の整数)の文字(候補パターン)について詳細マッチングを行う(ステップS214)。ステップS214における詳細マッチングの結果、入力文字に対する類似度が最も大きい辞書登録文字をマッチング結果とする。最後に、出力処理部111は、マッチング結果を、出力部112に出力する(ステップS215)。以上で、文字認識装置1が行う、文字を認識する処理は終了する。なお、ステップS214の詳細マッチングについては、詳細を後述する。
(処理イメージ)
図5から図8を用いて、マッチング部107が、特徴ベクトルのすべての成分を演算の対象として類似度を算出する場合のイメージについて説明する。
図5は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。図6(a)、図7(a)、図8(a)は、それぞれ、辞書登録文字「あ」、「い」、「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。
図6(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「あ」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図6(b)において、各メッシュ領域上に示されている値は、図5および図6(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図6(b)の例では、入力文字「あ」と辞書登録文字「あ」の類似度は、62327となる。
図7(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「い」の類似度を算出する過程での演算内容を各メッシュ分割領域上に示した図である。図7(b)において、各メッシュ領域上に示されている値は、図5および図7(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図7(b)の例では、入力文字「あ」と辞書登録文字「い」の類似度は、32010となる。
図8(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「会」の類似度を算出する過程での演算内容を各メッシュ分割領域上に示した図である。図8(b)において、各メッシュ領域上に示されている値は、図5および図8(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図8(b)の例では、入力文字「あ」と辞書登録文字「会」の類似度は、47401となる。
図6(b)、図7(b)、図8(b)に示される類似度を比較すると、図6(b)に示される類似度が最も高い。これは、入力文字「あ」についてのマッチング結果が、辞書登録文字「あ」であることを示している。
図9から図12を用いて、マッチング部107が、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として、類似度を算出する場合のイメージについて説明する。
図9は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図である。図10(a)、図11(a)、図12(a)は、それぞれ、辞書登録文字「あ」、「い」、「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図である。
図10(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「あ」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図10(b)において、各メッシュ領域上に示されている値は、図9および図10(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、16のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図10(b)の例では、入力文字「あ」と辞書登録文字「あ」の類似度は、38142となる。
図11(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「い」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図11(b)において、各メッシュ領域上に示されている値は、図9および図11(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、16のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図11(b)の例では、入力文字「あ」と辞書登録文字「い」の類似度は、17184となる。
図12(b)は、マッチング部107が、入力文字「あ」と辞書登録文字「会」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図12(b)において、各メッシュ領域上に示されている値は、図9および図12(a)の互いに第n番目の領域に示される値同士を乗算した結果である。最終的には、16のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図12(b)の例では、入力文字「あ」と辞書登録文字「会」の類似度は、25042となる。
図10(b)、図11(b)、図12(b)に示される類似度を比較すると、図10(b)に示される類似度が最も高い。これは、マッチング部107が、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する場合においても、正しいマッチング結果が得られることを表している。
(図13のフローチャート)
図13は、図2で示した文字認識装置1が文字を認識するための処理の流れにおいて、詳細マッチングの対象としない文字を類似度の値で区別するための処理を追加したフローチャートである。図13のステップS1301からステップS1310は、図2のステップS201からステップS210と同様の処理内容であり説明は省略する。
図13に示す文字認識の処理では、閾値Tを設定する。閾値Tについては、ユーザが予め設定してもよいし、文字認識装置1が統計情報などに基づいて算出してもよい。追加する処理の具体的な内容は以下の通りである。マッチング部107は、現在マッチングの対象としている文字について類似度の算出が終了すると、算出した類似度Rjと閾値Tを比較する(ステップS1311)。ステップS1311にて、算出した類似度が閾値より小さい場合(Rj<Tの場合)、マッチング部107は、算出した類似度を格納している変数Rjの値を、類似度としてとり得る値の中で最小の値に置き換える(ステップS1312)。
ステップS1311にて、マッチング部107が算出した類似度が閾値より大きい場合(Rj>Tの場合)、以降の処理内容については、ステップS1313からステップS1317まで、図2のステップS211からS215と同様の処理内容であり説明は省略する。
なお、図13に示す例では、すべての辞書登録文字に対し共通の閾値を設定しているが、上記閾値は辞書登録文字ごとに設定してもよい。また、図13に示す例では、詳細マッチングの対象から除外する文字を、Rjに最小値を代入することによって区別しているが、Rjに負の値(例えば−1)などの類似度としてとり得ない値を代入することによって区別してもよい。
以上のとおり、詳細マッチング部108は、ステップS1316において、上記最小の値に置き換えられた類似度Rjを有する文字について、詳細マッチングの対象から除外することができる。これにより、詳細マッチング部108が実行する類似度を算出する演算の回数は減少し、マッチング処理を高速化できる。
(図14のフローチャート)
図14は、図2で示した文字認識装置1が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象とする特徴ベクトルの成分の数を入力特徴ベクトルの特性に基づいて算出するための処理を追加したフローチャートである。
図14のステップS1401からステップS1404は、図2のステップS201からステップS204と同様の処理内容であり説明は省略する。
図14に示す文字認識の処理では、マッチング部107が、類似度を算出する演算の対象とする特徴ベクトルの成分の数mを、入力特徴ベクトルの成分の値を元に算出する(ステップS1405)。ここで、mの定義は、入力特徴ベクトルの成分の最大値をVmax、最小値をVmin、平均値をVavrとし、また、0からVmaxの間のある数を定数Vcとすると、以下のような例がある。
(例1)入力特徴ベクトルの成分の中で、(Vmax−Vc)以上の値を有する成分の数
(例2)入力特徴ベクトルの成分の中で、((Vmax+Vmin)÷2)以上の値を有する成分の数
(例3)入力特徴ベクトルの成分の中で、(Vavr+(Vmax−Vavr)÷2)以上の値を有する成分の数
図14のステップS1406からステップS1416は、図2のステップS205からステップS215と同様の処理内容であり説明は省略する。
以上のとおり、マッチング部107は、ステップS1405において、類似度を算出する演算の対象とする特徴ベクトルの成分の数を、入力特徴ベクトルの成分の特性に応じて算出することができる。これにより、入力特徴ベクトルの成分の特性に応じて、類似度を算出する演算の回数を減らし、マッチング処理を高速化できる。
(図15のフローチャート)
図15は、図2で示した文字認識装置1が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象としない特徴ベクトルの成分を、閾値により除外する処理を追加したフローチャートである。図15のステップS1501からステップS1504は、図2のステップS201からステップS204と同様の処理内容であり説明は省略する。
図15に示す文字認識の処理では、類似度を算出する演算の対象としない入力特徴ベクトルの成分を除外するため、閾値Lを設定する(ステップS1505)。閾値Lは、ユーザがあらかじめ定数(たとえば0)を設定してもよいし、ベクトル成分並べ替え部106またはマッチング部107が算出してもよい。
ベクトル成分並べ替え部106またはマッチング部107が閾値Lを算出する場合、たとえば、入力特徴ベクトルの成分の平均値から予めユーザが設定した定数を減算した値を閾値Lとすればよい。あるいは、並べ替え後の入力特徴ベクトルの成分について上位第何位の成分の値を閾値Lとするか、あらかじめユーザが指定し、ベクトル成分並べ替え部106またはマッチング部107は、ユーザが指定する入力特徴ベクトルの成分の値を閾値Lとして設定してもよい。
ステップS1506からステップS1509は、ステップS205からS208と同様の処理内容であり説明は省略する。
ステップS1511において、マッチング部107は、入力特徴ベクトルの成分Viと辞書特徴ベクトルの成分Djiを乗算した値をRjに加算する。マッチング部107は、この処理を演算の対象とする特徴ベクトルの成分の数だけ繰り返し、類似度を算出する。
ここで、ある入力特徴ベクトルViと辞書特徴ベクトルDjiを乗算した値が、最終的な類似度Rjに対し、無視できる位に十分小さい値をとる場合には、加算の対象から除外できる。特に、値が0の特徴ベクトルの成分を積和演算の対象とする場合、0を加算することになるが、演算結果には影響せず、演算処理に費やす時間を増加させるだけである。
そこで、マッチング部107は、ステップS1511を行う前に、毎回、入力特徴ベクトルの成分Viについて、類似度を算出する演算の対象とするか否かについて判定する(ステップS1510)。入力特徴ベクトルの成分が閾値Lより小さい場合(Vi<Lの場合)、マッチング部107は、その入力特徴ベクトルの成分について、類似度を算出する演算の対象としない。
また、入力特徴ベクトルの成分は、値の大きな成分から順番に演算の対象となる。そのため、ステップS1510で、マッチング部107が、一度、入力特徴ベクトルの成分Viが閾値Lより小さいと判定した場合、それ以降に演算の対象となる予定であった入力特徴ベクトルの成分の値は、閾値Lより小さく、もはや演算の対象とはならない。したがって、マッチング部107は、現在対象としている文字について、類似度を算出する演算を打ち切り、ステップS1513に移る。
ステップS1511からステップS1517は、図2のステップS209からS215と同様の処理であり説明は省略する。
なお、図15では、マッチング部107が、入力特徴ベクトルの成分Viと閾値Lとを比較し、類似度を算出する演算を打ち切るか否かを判定する例を示したが、辞書特徴ベクトルDjiを判定の対象としてもよい。
以上のとおり、マッチング部107は、ステップS1510により、演算の対象となる入力特徴ベクトルの成分の値が閾値を下回った時点で、類似度を算出する演算を打ち切ることができる。これにより、類似度を算出する演算の回数を減らし、マッチング処理を高速化できる。
(詳細マッチング処理フロー)
図16は、図2で示した文字認識装置1が文字を認識するための処理の流れにおける詳細マッチングについてのフローチャートである。
詳細マッチングの処理の前には、マッチング部107が、すべての辞書登録文字のうち、入力文字との類似度が大きい上位P個の文字を選別している。詳細マッチング部108が類似度を算出する演算の対象とするのは、上記P個の文字についてのみである。そこで、詳細マッチング部108は、すべての辞書登録文字について、マッチング部107が選別したP個の文字に該当するか否かをチェックし、上記P個の文字に該当した場合についてのみ、類似度を算出する演算を実行する。
まず、マッチング部107は、詳細マッチング部108に、並び替え後の入力特徴ベクトルVi、並び替え情報テーブル、マッチング対象要素数m、類似度Rj、P個の選別結果情報を入力する(ステップS1601)。
次に、詳細マッチング部108は、カウンタ変数jを初期化(j=0)する(ステップS1602)。その後、詳細マッチング部108は、マッチング部107が選別したP個の文字に該当するか否かのチェックをすべての辞書登録文字について終了したか判定する(ステップS1603)。
ステップS1603における判定の結果、マッチング部107が選別したP個の文字に該当するか否かのチェックをすべての辞書登録文字について終了していない場合(j<N)、詳細マッチング部108は、次の文字についてマッチング部107が選別したP個の文字に該当するか否かのチェックを行う(ステップS1604)。
ステップS1604のチェック処理において、チェック対象の文字が、マッチング部107が選別したP個の文字に該当する場合には、詳細マッチング部108は、マッチング部107が類似度を算出する演算の対象としなかった特徴ベクトルの残りの成分(ここでは64−m個の成分、特許請求の範囲における下位成分に対応)を用いて、類似度を算出し直す。
つまり、詳細マッチング部108は、残りの成分についてステップS209と同様の積和演算を実行し、その結果を、マッチング部107が算出した類似度Rjに加算する(ステップS1607)。上位限られたベクトル成分のみを対象として算出した類似度を元にして、残りのベクトル成分についても対象として算出し直した類似度が、特許請求の範囲に記載の全成分類似度に対応する。
さらに、詳細マッチング部108は、マッチング部107が類似度を算出する演算の対象にしなかった、辞書登録文字の第2特徴ベクトルから第Z特徴ベクトルのすべての成分についても、ステップS209と同様の積和演算を実行する。そして、詳細マッチング部108はその結果を、ステップS1607で算出した類似度Rjに加算し、最終的な類似度Rjを算出する(ステップS1608)。
ステップS1604のチェック処理において、チェック対象の文字が、マッチング部107が選別したP個の文字に該当しない場合、詳細マッチング部108は、類似度Rjに、類似度としてとり得る最小の値を設定する(ステップS1605)。そして、詳細マッチング部108は、カウンタ変数jをインクリメントし(ステップS1606)、上記チェックが終了した文字の数をカウントした後、ステップS1603に移る。
ステップS1603における判定の結果、マッチング部107が選別したP個の文字に該当するか否かのチェックを、すべての辞書登録文字について終了した場合(j<Nでない場合)、入力文字とすべての辞書登録文字との類似度Rjが確定する。最後に、詳細マッチング部108は、類似度Rjをソートする。(ステップS1609)。
これまで説明したとおり、マッチング部107は、類似度を算出する際、入力特徴ベクトルの成分のうち値が大きい上位m個の成分のみを演算の対象とし、かなりの精度を得ることができる。したがって、詳細マッチング部108は、ステップS1607を省略することが可能である。また、詳細マッチング部108は、ステップS1608において、入力特徴ベクトルの成分のうち値が大きい上位m個の成分のみを演算の対象とすればよい。
辞書登録文字の第2特徴ベクトルから第Z特徴ベクトルの各特徴ベクトルごとに算出した各類似度が、特許請求の範囲に記載の、関連上位成分類似度に対応する。また、辞書登録文字の第2特徴ベクトルから第Z特徴ベクトルの各特徴ベクトルごとに算出した類似度を、上位限られたベクトル成分のみを対象として算出した類似度に加算して算出する類似度が、特許請求の範囲に記載の詳細類似度に対応する。
さらに、詳細マッチング部108は、図15のフローチャートについて説明したように、入力特徴ベクトルの成分が閾値Lより小さいかどうかをチェックし、小さい場合は、演算をスキップするようにすれば、さらなる高速化が可能である。
なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
(他の構成)
なお、本発明を、以下のように表現することも可能である。
(第1の構成)
入力特徴ベクトルと予め記録されている複数カテゴリーの辞書特徴ベクトルとを比較するパターン照合装置において、入力特徴ベクトルの各要素を並べ変える手段と、並べ替え情報を記憶するテーブルとを持ち、入力特徴ベクトルの各要素と各カテゴリーの辞書特徴ベクトルとを上記テーブルに記載された情報に基づいて照合し、入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとの類似度を求めるパターン照合装置で、並び替えられた入力特徴ベクトルの上位m個の要素について辞書の全カテゴリーについて類似度を求め、求めた類似度の上位P個のみ詳細にマッチング処理を行うことを特徴とするパターン照合装置。
(第2の構成)
入力特徴ベクトルと予め記録されている複数カテゴリーの辞書特徴ベクトルとを比較するパターン照合装置において、入力特徴ベクトルの各要素を並べ変える手段と、並べ替え情報を記憶するテーブルとを持ち、入力特徴ベクトルの各要素と各カテゴリーの辞書特徴ベクトルとを上記テーブルに記載された情報に基づいて照合し、入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとの類似度を求めるパターン照合装置で、並び替えられた入力特徴ベクトルの上位m個の要素について辞書の全カテゴリーについて類似度を求め、求めた類似度がある閾値以下ならばそのカテゴリーについては候補ではないとして詳細なマッチング処理をしないことを特徴とするパターン照合装置。
(第3の構成)
類似度の閾値を辞書カテゴリー毎に持つことを特徴とする第2の構成に記載のパターン照合装置。
(第4の構成)
入力特徴ベクトルの特性から演算を行う要素数を設定する手段を持ち、入力特徴ベクトルにより演算を行う要素数の変更が可能なことを特徴とする第1の構成または第2の構成に記載のパターン照合装置。
(第5の構成)
入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとのマッチング処理において、並べ替えた入力特徴ベクトルの要素がある閾値を下回った時点で、累積されている類似度をそのカテゴリーとの類似度として採用することを特徴とする第1の構成または第2の構成に記載のパターン照合装置。
(プログラムおよび記録媒体)
最後に、文字認識装置に含まれている各ブロックは、ハードウェアロジックによって構成すればよい。または、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
すなわち、文字認識装置は、各機能を実現する制御プログラムの命令を実行するCPU、この制御プログラムを格納したROM(Read Only Memory)、上記制御プログラムを実行可能な形式に展開するRAM(Random Access Memory)、および、上記制御プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)を備えている。
この構成により、本発明の目的は、所定の記録媒体によっても、達成できる。この記録媒体は、上述した機能を実現するソフトウェアである文字認識装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録していればよい。文字認識装置には、この記録媒体を供給する。これにより、コンピュータとしての文字認識装置(またはCPUやMPU)が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。
プログラムコードを上記各装置に供給する記録媒体は、特定の構造または種類のものに限定されない。すなわち、この記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。
また、文字認識装置を、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して文字認識装置に供給する。この通信ネットワークは、文字認識装置にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等であればよい。
この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、IEEE1394、USB(Universal Serial Bus)、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、画像のパターン認識機能を有する各種の装置に適用可能である。したがって、文字を識別するOCRの他にも、顔画像、指紋、印鑑などによる認証装置や、その他画像のパターン認識機能を有するあらゆる装置において利用可能である。
本発明に係る文字認識装置の構成を表すブロック図である。 文字認識装置が文字を認識するための処理の流れを表すフローチャートである。 特徴抽出部がメッシュ領域に分割した文字パターンの各メッシュ領域を識別するための番号を示した図である。 (a)は、入力文字「あ」について、特徴抽出部がカウントした各メッシュ領域に含まれる黒色画素の数を、各メッシュ領域上に示した図であり、(b)は、入力文字「あ」について、特徴抽出部が生成する入力特徴ベクトルを表す図であり、(c)は、入力文字「あ」について、(b)に示される入力特徴ベクトルの各成分を、ベクトル成分並べ替え部が降順に並べ替えた後の入力特徴ベクトルを表す図であり、(d)は、ベクトル成分並べ替え部が、(b)に示される入力特徴ベクトルの成分を並べ替えて、図4(c)に示される入力特徴ベクトルを生成する際に作成する並べ替え情報テーブルを表す図である。 入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。 (a)は、辞書登録文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「あ」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 (a)は、辞書登録文字「い」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「い」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 (a)は、辞書登録文字「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「会」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 図9は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図である。 (a)は、辞書登録文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「あ」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 (a)は、辞書登録文字「い」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「い」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 (a)は、辞書登録文字「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位16個の領域についてのみ示した図であり、(b)は、マッチング部が、入力文字「あ」と辞書登録文字「会」について、入力特徴ベクトルの成分の中で値の大きい上位16成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。 図2で示した文字認識装置が文字を認識するための処理の流れにおいて、詳細マッチングの対象としない文字を類似度の値で区別するための処理を追加したフローチャートである。 図2で示した文字認識装置が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象とする特徴ベクトルの成分の数を入力特徴ベクトルの特性に基づいて算出するための処理を追加したフローチャートである。 図2で示した文字認識装置が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象としない特徴ベクトルの成分を、閾値により除外する処理を追加したフローチャートである。 図2で示した文字認識装置が文字を認識するための処理の流れにおける詳細マッチングについてのフローチャートである。 (a)は、特徴ベクトルを抽出するために矩形に切り取られた文字画像の例を表す図であり、(b)は、図17(a)の文字画像を、縦横8×8のメッシュ領域に分割した様子を表す図である。 図17(b)に示す各メッシュ領域に対応するメッシュ特徴ベクトルの各成分を、各メッシュ領域に示した図である。 辞書の構成例の一つを表す図である。 従来の文字認識装置が文字パターンを認識するための処理の流れを表すフローチャートである。 距離を用いたパターンマッチングにおいて、距離を算出する演算を、閾値によりスキップする場合に使用する閾値テーブルの例である。 図20に示す従来の文字認識装置が文字パターンを認識するための処理の流れにおいて、閾値により距離を算出する演算をスキップする処理を追加したフローチャートである。
符号の説明
1 文字認識装置(パターン認識装置)
102 スキャナー
103 読み取り部
104 切り出し部
105 特徴抽出部
106 ベクトル成分並べ替え部(上位成分抽出手段)
107 マッチング部(乗算値算出手段、上位成分類似度算出手段、パターン認識手段、候補パターン抽出手段、下位成分抽出手段、下位成分乗算値算出手段、下位成分加算値算出手段、上位成分抽出数算出手段)
108 詳細マッチング部(全成分類似度算出手段、関連乗算値算出手段、関連上位成分類似度算出手段、詳細類似度算出手段)
109 メモリ
110 ハードディスク
111 出力処理部
112 出力部
113 辞書
114 並べ替え情報

Claims (11)

  1. 認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
    前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
    前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
    前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
    前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識手段とを備えていることを特徴とするパターン認識装置。
  2. 前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
    前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
    前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
    前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
    前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
    前記パターン認識手段は、
    前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することを特徴とする請求項1に記載のパターン認識装置。
  3. 互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
    前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
    前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
    前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
    前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
    前記パターン認識手段は、
    前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することを特徴とする請求項1に記載のパターン認識装置。
  4. 前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
    前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
    前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
    前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
    前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
    前記パターン認識手段は、
    前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することを特徴とする請求項1に記載のパターン認識装置。
  5. 互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
    前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
    前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
    前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
    前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
    前記パターン認識手段は、
    前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することを特徴とする請求項1に記載のパターン認識装置。
  6. 前記閾値は、前記辞書パターンごとに個別に設定されていることを特徴とする請求項4または請求項5に記載のパターン認識装置。
  7. 前記上位成分抽出手段が抽出する前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出手段をさらに備えていることを特徴とする請求項1に記載のパターン認識装置。
  8. 前記乗算値算出手段は、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、
    前記上位成分類似度算出手段は、前記乗算値を順に加算することによって、前記上位成分類似度を算出することを特徴とする請求項1に記載の記載のパターン認識装置。
  9. 認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置が実行するパターン認識方法であって、
    前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出ステップと、
    前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出ステップと、
    前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出ステップと、
    前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識ステップとを含んでいることを特徴とするパターン認識方法。
  10. 請求項1から8のいずれか1項に記載のパターン認識装置を動作させるパターン認識プログラムであって、コンピュータを上記の各手段として機能させるためのパターン認識プログラム。
  11. 請求項10に記載のパターン認識プログラムを記録しているコンピュータ読み取り可能な記録媒体。
JP2006004135A 2006-01-11 2006-01-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 Expired - Fee Related JP5020513B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006004135A JP5020513B2 (ja) 2006-01-11 2006-01-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006004135A JP5020513B2 (ja) 2006-01-11 2006-01-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2007188190A true JP2007188190A (ja) 2007-07-26
JP5020513B2 JP5020513B2 (ja) 2012-09-05

Family

ID=38343332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006004135A Expired - Fee Related JP5020513B2 (ja) 2006-01-11 2006-01-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Country Status (1)

Country Link
JP (1) JP5020513B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010046963A1 (ja) * 2008-10-20 2010-04-29 株式会社 Jsp データ検索システム、データ検索方法及びデータ検索プログラム
JP2010244511A (ja) * 2008-10-10 2010-10-28 Hitachi Software Eng Co Ltd 1対n認証装置及び1対n認証方法
US11574641B2 (en) 2019-06-07 2023-02-07 Samsung Electronics Co., Ltd. Method and device with data recognition

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61290584A (ja) * 1985-06-19 1986-12-20 Canon Inc 文字認識方法
JPS63780A (ja) * 1986-06-20 1988-01-05 Ricoh Co Ltd パターン認識方法
JPS63109592A (ja) * 1986-10-28 1988-05-14 Ricoh Co Ltd 文字認識方式
JPH09147051A (ja) * 1995-11-24 1997-06-06 Nec Corp 特徴生成装置
JPH10222611A (ja) * 1996-12-05 1998-08-21 N T T Data Tsushin Kk 文字種選択方法、文字認識装置及び記録媒体
JP2002074268A (ja) * 2000-08-31 2002-03-15 Hewlett Packard Co <Hp> 文字認識システム
JP2002236878A (ja) * 2001-02-08 2002-08-23 Fujitsu Ltd 手書き文字情報入力装置及び方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61290584A (ja) * 1985-06-19 1986-12-20 Canon Inc 文字認識方法
JPS63780A (ja) * 1986-06-20 1988-01-05 Ricoh Co Ltd パターン認識方法
JPS63109592A (ja) * 1986-10-28 1988-05-14 Ricoh Co Ltd 文字認識方式
JPH09147051A (ja) * 1995-11-24 1997-06-06 Nec Corp 特徴生成装置
JPH10222611A (ja) * 1996-12-05 1998-08-21 N T T Data Tsushin Kk 文字種選択方法、文字認識装置及び記録媒体
JP2002074268A (ja) * 2000-08-31 2002-03-15 Hewlett Packard Co <Hp> 文字認識システム
JP2002236878A (ja) * 2001-02-08 2002-08-23 Fujitsu Ltd 手書き文字情報入力装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244511A (ja) * 2008-10-10 2010-10-28 Hitachi Software Eng Co Ltd 1対n認証装置及び1対n認証方法
WO2010046963A1 (ja) * 2008-10-20 2010-04-29 株式会社 Jsp データ検索システム、データ検索方法及びデータ検索プログラム
US11574641B2 (en) 2019-06-07 2023-02-07 Samsung Electronics Co., Ltd. Method and device with data recognition

Also Published As

Publication number Publication date
JP5020513B2 (ja) 2012-09-05

Similar Documents

Publication Publication Date Title
CN109791569B (zh) 因果关系识别装置及存储介质
CN105469080B (zh) 一种人脸表情识别方法
JP2013206187A (ja) 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
CN111126396A (zh) 图像识别方法、装置、计算机设备以及存储介质
CN107871103B (zh) 一种人脸认证方法和装置
JP2022543052A (ja) 文書処理方法、文書処理装置、文書処理機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN110287311A (zh) 文本分类方法及装置、存储介质、计算机设备
CN103870840A (zh) 基于改进的潜在狄利克雷分配的自然图像分类方法
Tavallali et al. A systematic training procedure for viola-jones face detector in heterogeneous computing architecture
CN112767386A (zh) 基于主题特征和评分分布的图像美学质量评价方法及系统
JP5020513B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
CN112257689A (zh) 人脸识别模型的训练和识别方法、存储介质及相关设备
JP2007179413A (ja) パターン認識装置、パターン認識方法、および特徴抽出パラメータの生成方法
Omaia et al. 2D-DCT distance based face recognition using a reduced number of coefficients
CN113792167B (zh) 一种基于注意力机制和模态依赖的跨媒体交叉检索方法
CN115953506A (zh) 基于图像生成模型的工业零件缺陷图像生成方法及系统
JP6831221B2 (ja) 学習装置及び学習方法
Law et al. Hybrid pooling fusion in the bow pipeline
Yektaii et al. A criterion for measuring the separability of clusters and its applications to principal component analysis
CN1332347C (zh) 基于迭代特征选择的快速人脸识别方法
JP4852086B2 (ja) パターン認識装置
Rezende et al. An approach for Brazilian Sign Language (BSL) recognition based on facial expression and k-NN classifier
Verma et al. Machine-learning-based image feature selection
Zhang et al. Automatic facial expression recognition using evolution-constructed features
CN110990349A (zh) 一种智能系统安全体系中的不平衡日志过采样方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120425

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120613

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees