JP2008097275A - パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 - Google Patents

パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 Download PDF

Info

Publication number
JP2008097275A
JP2008097275A JP2006277737A JP2006277737A JP2008097275A JP 2008097275 A JP2008097275 A JP 2008097275A JP 2006277737 A JP2006277737 A JP 2006277737A JP 2006277737 A JP2006277737 A JP 2006277737A JP 2008097275 A JP2008097275 A JP 2008097275A
Authority
JP
Japan
Prior art keywords
vector
dictionary
input
collation
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006277737A
Other languages
English (en)
Other versions
JP4087421B2 (ja
Inventor
Minako Kuwata
みな子 桑田
Yoshiyuki Koyama
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006277737A priority Critical patent/JP4087421B2/ja
Priority to EP07791060A priority patent/EP2073146A4/en
Priority to PCT/JP2007/064322 priority patent/WO2008044380A1/ja
Priority to CN2007800379798A priority patent/CN101553825B/zh
Publication of JP2008097275A publication Critical patent/JP2008097275A/ja
Application granted granted Critical
Publication of JP4087421B2 publication Critical patent/JP4087421B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】高速かつ高精度なパターン認識を可能とする。
【解決手段】
パターン認識装置1は、入力パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル抽出部823と、辞書照合ベクトル蓄積バッファ813から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出する照合ベクトル一致度判定部824と、所定閾値より大きい一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をし、照合結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンを、辞書データ811から読出して出力する。
【選択図】図1

Description

本発明は、入力パターンを認識するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関し、特に、入力パターンが複数の異なる辞書パターンのいずれに一致するかを判定するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関する。
従来、光学式文字読取装置(Optical Character Reader:OCRと略す)などの文字認識装置において、一般的には、パターンマッチングにより文字認識を行なう。パターンマッチングでは、まず、入力文字画像から特徴ベクトルを抽出する。ここでは、入力文字画像から抽出された特徴ベクトルのことを、入力特徴ベクトルと呼ぶ。そして、入力特徴ベクトルと、各文字に対応して辞書データに予め登録された標準的な特徴ベクトル(以下、辞書特徴ベクトルよいう)との照合処理を行なう。照合処理の結果、最もパターンが類似していると判断された辞書特徴ベクトルに対応した文字を認識結果として決定し出力する。
ここで、特徴ベクトルについてのメッシュ特徴ベクトルを例示する。図17は、特徴ベクトルを抽出するために入力画像において矩形状に切取られた文字画像の例を示す。図17の文字画像をメッシュ状に分割すると、文字画像は複数の領域に分割される。メッシュ状に分割された文字画像の各領域の画素数に基づき、各領域の画素数について正規化等の処理を行なう。当該処理により算出された各領域の画素数を指す値を成分とするベクトルを生成する。このようにして生成されたベクトルを、メッシュ特徴ベクトルと呼ぶ。
図18では、図17の矩形状の文字画像を、縦8×横8の64個の領域にメッシュ分割した様子が示される。図19では、図18に示したメッシュ分割された画像から生成されるメッシュ特徴ベクトルの各成分を、各領域に対応付けて示される。図19によれば、メッシュ特徴ベクトルの成分の個数は64(8×8)個であり、一文字は64個の成分からなる特徴ベクトルにより規定されることが示される。
図20を参照して、パターン認識において参照される辞書データ811について説明する。図20の辞書データ811は、複数種類の辞書登録文字CHi(i=1、2、3、・・・、n)と、辞書登録文字CHiのそれぞれに対応して、辞書特徴ベクトル群VEi(i=1、2、3、・・・、n)とを含む。辞書特徴ベクトル群VEiは、対応の辞書登録文字CHiについて、m個の辞書特徴ベクトルVTj(j=1、2、3、・・・、m)を含む。ここでは辞書登録文字CHiは当該文字を識別する文字コードを示す。
特徴ベクトルVTiは、対応の辞書登録文字CHiについて複数種類のフォントの文字を学習することによって、各種のフォント(書体:明朝、ゴシックなど)について統計的に生成された特徴ベクトルを指す。特徴ベクトルVTiは、傾いた文字、かすれた文字、または潰れた文字などを学習することにより統計的に生成された特徴ベクトルを指してもよい。
辞書データには、いずれの辞書登録文字CHiについても、基本的にm個の特徴ベクトルVTjが格納されているとする。具体的には、全てのフォントを学習して、第1特徴ベクトルVT1〜第m特徴ベクトルVTmを作成する。第1特徴ベクトルVT1が、全ての学習ベクトルの平均を算出した結果を指す。第2特徴ベクトルVT2は、第1特徴ベクトルVT1に直交するベクトルを算出した結果を指す。第3ベクトルVT3は、第2特徴ベクトルVT2に直交するベクトルを算出した結果を指す。以下、特徴ベクトルVTmまで同様にして算出がなされて、算出結果を指す。
従来、特徴ベクトルVTjを用いたパターンマッチングのための演算では、シティーブロック距離、ユークリッド距離、類似度などが用いられる。これらは、すべてパターン認識に一般的に用いられる周知の尺度である。パターン認識では、未知ベクトルと標準ベクトルとを想定した場合に、標準ベクトルと未知ベクトルとの距離や類似度を算出し、算出結果に基づき、最も近い(類似している)文字コードCHiが指示する文字コードを認識結果として出力する。
入力された文字とマッチング対象となる辞書登録文字が、それぞれ、図19に示すメッシュ状の等分割による64個の成分からなる特徴ベクトルによって規定される場合を例にして、シティーブロック距離および類似度の算出式をそれぞれ式(1)と式(2)に示す。
Figure 2008097275
Figure 2008097275
入力文字の特徴ベクトル(以下、入力特徴ベクトルという)X(ベクトルXはX1、X2・・・X64の64個の成分からなる)、マッチング対象となる辞書登録文字CHiの特徴ベクトル(以下、辞書特徴ベクトルという)Y(ベクトルYはY1、Y2・・・Y64の64個の成分からなる)とすると、シティーブロック距離Dは式(1)に従い算出されて、また、単純類似度Sは式(2)に従い算出される。
上述したとおり、パターンマッチングは入力文字画像から抽出された入力特徴ベクトルと予め登録されている辞書特徴ベクトルとのマッチング処理により行なわれるが、このマッチング処理は時間を要するため、従来から、この時間を短縮するための方法が提案されてきた。
特許文献1では、詳細マッチングを行なうか否かの判定のための閾値を文字種毎に閾値テーブルに登録しておき、辞書kと入力特徴ベクトルとの距離dが閾値Thkを超えた時点でマッチングを中止する方法が開示されている。
また、従来技術においては、マッチング処理は、まず辞書の第1特徴ベクトルとのマッチング距離が近いものから上位P個を抽出し、抽出されたP個については、さらに詳細に識別するために第2特徴ベクトルから第Z特徴ベクトルまでマッチングを行なう。
次に、図21を用いて、OCRなどの文字認識装置において従来用いられてきたパターンマッチング高速化のための処理を説明する。以下の説明では、マッチングは、メッシュ特徴ベクトルを用いて行なわれるものとする。
はじめに、マッチング処理の概要について説明する。図21では、まず、入力文字とすべての辞書登録文字との距離が算出される。つまり、入力文字画像から抽出された入力特徴ベクトルと辞書に登録されているすべての文字の辞書特徴ベクトルとの距離(たとえばシティーブロック距離)が算出される。算出された距離の値が小さいほど誤差が少なく入力文字パターンと辞書登録文字パターンとは類似しているといえる。
図21の例では、上記距離は、式(1)のシティーブロック距離の算出式に従い、入力特徴ベクトルと辞書特徴ベクトルの各成分の差を累積加算することにより算出される。
すべての辞書登録文字について距離の算出が終了すると、算出された距離の値が小さい順に(昇順に)並べた順列において、上位P個の辞書登録文字を抽出する。そして、以降は、抽出されたP個の辞書登録文字を対象にして詳細マッチングが行なわれる。詳細マッチングでは、辞書の第1特徴ベクトルとの距離演算だけでなく、第2特徴ベクトルから第Z特徴ベクトルまでのすべての辞書特徴ベクトルとの距離演算が行なわれる。
次に、図21のフローチャートに従い詳細に説明する。まず、OCRは光学読取り部と認識部と記憶部を有する。まず、光学読取り部により、紙面上に書かれた文字が読取られて、読取り結果を指す画像が出力される。認識部は、光学読取り部から出力された画像を入力して(ステップS101)、入力画像から文字画像を切り出す(ステップS102)。文字画像の切り出しは特開昭63−216188号公報に示されるように、入力画像から黒画素を抽出し、この抽出結果に基づき文字行を抽出する。その後、抽出された行に垂直な方向のヒストグラムに従い文字画像が切り出される。
入力された文字画像はメッシュ分割され、メッシュ分割の結果得られた複数の領域のそれぞれの画素数に基づき、正規化等の処理が行なわれる。その結果に基づき、入力特徴ベクトルが抽出(生成)される(ステップS103)。
次に、マッチングカウンタを示す変数iの値を初期化する。すなわちi=1とする(ステップS104)。なお、OCRの記憶部に予め格納された辞書に登録されているすべての文字数をN個と想定する。
次に、辞書に登録されたすべての文字のそれぞれについて、以下のように、入力文字(切り出された文字)とのパターンマッチング処理が行なわれる。パターンマッチング処理は、入力文字についての入力特徴ベクトルと、辞書に登録された文字についての辞書特徴ベクトルとの距離を算出することを指す。
まず、入力文字と登録文字とのパターンマッチングが行なわれる際には、予め、辞書に登録された全ての文字について距離算出が終了したか否かの終了判定を行なう(ステップS105)。ここで、すべての文字について距離算出が終了していないと判定された場合(i<Nの場合)、入力特徴ベクトルと辞書登録された文字の第1特徴ベクトルとの距離算出がされて、算出された距離は変数Diにセットされる(ステップS106)。ここでは変数Diを距離値Diともいう。
1つの辞書登録文字について距離値Diが算出されると、変数iの値を1インクリメントする(ステップS110)。このインクリメント後の変数jの値は、現在までに距離の算出が終了した辞書中の文字数を指す。そして、辞書中のすべての文字について距離値Djの算出が、すなわちマッチングが終了したか否かの判定がされる(ステップS105)。すべての文字についてのマッチングが終了した場合(i<Nでないの場合)には、距離の算出結果が格納されている変数Di(i=0、1、2、3、・・・、N)をその値の昇順にソートする(ステップS107)。
ソート結果の順列において、上位のP個の変数Diに対応する辞書登録文字を対象にして詳細マッチングが行なわれる(ステップS108)、その結果に基づき、入力文字とパターンが近いと判定された文字をマッチング結果として、すなわち候補文字として辞書から読出して出力する(ステップS109)。その後、処理を終了する。
図21の認識処理の手順よりも、さらなる高速化を図るため、距離算出の演算について閾値に基づくスキップ処理を導入する方法も提案されてきた。
図22には、閾値に基づくスキップ処理を行なう際に参照される閾値テーブル6002が例示される。図22を参照して、閾値テーブル6002には、辞書データ6001に登録された各文字と関連付けて、当該登録文字の閾値Ti(i=1、2、3、・・・、n)が予め登録されている。たとえば、閾値Tnは、辞書データの登録文字CHnに対応する閾値である。閾値Tiは学習データにより統計的に計算された値であり、たとえば辞書データ6001の登録文字CHiに対応して登録されている辞書特徴ベクトルと登録文字CHiについての任意の入力特徴ベクトルとの距離は、必ず閾値Tiで示される範囲内であることが保証されている。
入力文字と辞書登録文字との距離の算出は、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算することによって行なわれるが、辞書登録されている文字ごとにそれぞれ距離の閾値Tiが設けられていることによって、累積加算により算出された値が、閾値Ti以下の間のみ、さらに下位成分についてまでの累積加算演算を続行し、上記設けられている閾値を上回った場合、演算を打ち切るような処理を行なわせることが可能となる。
図23は、閾値Tiに基づき距離算出の演算をスキップするパターンマッチングのフローチャートである。図23のステップS201からステップS205は、図21のステップS101からステップS105と同様の処理内容であり説明は省略する。
距離算出においては、図21の処理と同様に入力された文字の入力特徴ベクトルと辞書登録されている文字の辞書特徴ベクトルの各成分の差を累積加算する演算が実行されることになる。
前述したとおり、図23の処理においては、累積加算により算出された距離の値が、辞書の登録文字ごとにそれぞれ設けられている閾値Ti以下を指示する場合には、さらに下位成分についてまでの累積加算の演算を続行し、閾値Tiを上回ったことを指示する場合、累積演算を打ち切り、現在対象としている文字についての距離が確定され、次の文字についての距離算出へと処理が移ることになる(ステップS206〜S208)。
そこで、ステップS209では、現在対象としている文字について、累積加算により算出された距離が、閾値テーブル6002に格納されている判定閾値Ti以下であるか否かの判定が行なわれることになる。この判定において、距離が判定閾値Ti以下であった(Di<Ti)場合には、ステップS210に移行しマッチング成分カウンタjがインクリメントされ、そのまま距離算出の演算が続行される。
また、距離が判定閾値を上回る(Di<Tiでない)場合には、現在対象としている文字についての距離は確定され、ステップS213にて距離変数Diに、算出された距離の最大値が格納され、ステップS214にてマッチング辞書カウンタiをインクリメントし、次の文字の距離計算に処理を移す。
以降の処理(ステップS211〜S213)は、図21と同様の処理内容であり説明は省略する。以上が、閾値によるスキップ処理を導入しパターンマッチングを高速化させる手法の従来例である。
以上のとおり、従来の文字認識装置において、距離演算回数が少なくする為に各種の方法を用いることにより、パターンマッチングの高速化が実現されてきた。
特開昭63−109592号公報
上記した従来技術の距離を使用するマッチング手法においては、距離算出の累積加算は、必ずしも特徴ベクトルのすべての成分を対象とする必要はなかった。しかしながら、類似度を用いたマッチングを行なう場合は、算出された類似度が最大のものをマッチング結果とするため、特徴ベクトルの一部の要素のみを累積加算の対象とすることはマッチングの精度を考慮すると好ましくなかった。
つまり、上記距離を使用するマッチング処理においては、あらかじめ累積加算の対象とする特徴ベクトルの成分数を設定しておくことや、閾値を設定することにより累積加算を打ち切るなどの高速化手法を適用できたが、類似度を用いたマッチング処理に対して上記高速化手法を適用することは困難であった。
したがって、従来、類似度を用いてマッチングを行なう場合は、図18のメッシュ特徴ベクトルの場合を例に挙げると、1つの特徴ベクトルの成分数は64(8×8)であり、1つの登録文字について距離を求める場合64回の演算が必要となる。
これでは、日本語のように文字数が多い言語においては、登録文字数が3000以上にもなり、少なくとも192000(64×3000)回の演算を行なわなくてはならなかった。さらに、1つの登録文字の辞書特徴ベクトルが複数の特徴ベクトルから成る場合、詳細マッチングにおいては、さらに多くの演算が必要であった。さらに、類似度演算は積和によるため加算のみで実現可能な距離演算に比べ、1回の演算に要する時間のコストが高かった。
そのため、類似度を用いたマッチング処理においては、積和演算を行なう前に、高速に正解の可能性が無いと高速に判断する方法、つまり、積和演算を行なう必要がない辞書登録文字を高速に判別する大分類方法が望まれていた。
本発明は、類似度によるパターンマッチングにおいても、距離によるパターンマッチングにおいても、より高速に高精度に認識できるパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体を提供することを目的とする。
この発明のある局面に係るパターン認識装置は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成手段と、辞書照合ベクトル格納手段から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、所定閾値より大きい一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をする照合手段と、を備える。そして、入力パターンと、照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なう。
好ましくは、所定閾値は、辞書照合ベクトル格納手段において辞書特徴ベクトル毎に予め格納されている。
好ましくは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の入力照合ベクトルの1を指す成分の総数に対する割合を指示する。
好ましくは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の辞書照合ベクトルの1を指す成分の総数に対する割合を指示する。
好ましくは、特徴は画像の濃淡を指示する。
好ましくは、特徴は画像の濃淡を指示し、成分は濃淡を1と0により指示し、入力照合ベクトルの1を指す成分の総数が予め設定した数値より大きいときは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の入力照合ベクトルの1を指す成分の総数に対する割合を指示する。
好ましくは、特徴は画像の濃淡を指示し、成分は濃淡を1と0により指示し、入力照合ベクトルの1を指す成分の総数が予め設定した数値以下のときは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の辞書照合ベクトルの1を指す成分の総数に対する割合を指示する。
この発明の他の局面に係るパターン認識方法は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備えるコンピュータを用いたパターン認識方法であって、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、辞書照合ベクトル格納部から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、所定閾値より大きい前記一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をする照合ステップと、入力パターンと、前述の照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なうステップとを備える。
この発明のさらに他の局面では、上述のパターン認識方法をコンピュータに実行させるためのパターン認識プログラムが提供される。
この発明のさらに他の局面では、上述のパターン認識方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体が提供される。
本発明によれば、値が1または0で示される成分からなる辞書照合ベクトルと入力照合ベクトルとの一致度を基に、辞書パターンと入力パターンが類似しているかどうかの照合を行なうが、一致度は辞書照合ベクトルと入力照合ベクトルとの内積に基づき算出されるから、高速に一致度を得ることができる、照合も速やかに行なうことが可能となる。
これによりパターン認識では、時間を要する類似度演算の回数が削減され、入力パターンをより高速に認識することが可能となる。
以下図面を参照しながら、本発明に係る実施形態について説明する。
(実施の形態1)
(機能構成)
図1には、本実施の形態に係る文字認識装置1の要部の機能構成が示される。図2には、実施の形態に係るコンピュータの構成が示される。
図2は本実施の形態に係る文字認識装置1が搭載されるコンピュータの構成図である。図2を参照してコンピュータは、画像入力部101、CRT(陰極線管)や液晶などからなるディスプレイ610、該コンピュータ自体を集中的に管理し制御するためのCPU(Central Processing Unit)622、ROM(Read Only Memory)またはRAM(Random Access Memory)を含んで構成されるメモリ624、固定ディスク626、FD(Flexible Disk)632が着脱自在に装着されて、装着されたFD632をアクセスするFD駆動装置630、CD−ROM(Compact Disc Read Only Memory)642が着脱自在に装着されて、装着されたCD−ROM642をアクセスするCD−ROM駆動装置640、通信ネットワーク300と、該コンピュータとを通信接続するための通信インターフェイス680、プリンタ690およびキーボード650およびマウス660を有する入力部700を含む。これらの各部はバスを介して通信接続される。
画像入力部101は、スキャナを有し、紙面に書かれた文字をスキャナにより光学的に読取り、画像データを出力する。またはカメラなどの撮像部を有し、紙面に書かれた文字を撮像部により撮像して画像データを出力する。
コンピュータには、カセット形式の磁気テープが着脱自在に装着されて磁気テープをアクセスする磁気テープ装置が設けられてもよい。
図1を参照して、文字認識装置1は、入力部700に対応の入力部800、画像入力部101に対応する入力部801、ならびにプリンタ690またはディスプレイ610に対応の出力部802を接続する。文字認識装置1は内部に、CPU622などに対応の制御部803、与えられる画像データから文字部分のデータを抽出(切り出し)する切り出し部804、切り出した文字画像データが示す文字から特徴を抽出する特徴抽出部805、辞書特徴ベクトルと入力特徴ベクトルとを用いたパターンマッチングを行なうマッチング部820、辞書データ811、入力特徴ベクトルの照合用のベクトルを格納するための入力照合ベクトル蓄積バッファ825、辞書特徴ベクトルの照合用のベクトルを蓄積する辞書照合ベクトル蓄積バッファ813、およびメモリ814を備える。
メモリ814は画像データ、文字パターンなどを処理するための作業領域として利用されるとともに、文字認識処理途中の中間データなどを格納するための領域である。
マッチング部820は、辞書特徴ベクトルと入力特徴ベクトルのパターンマッチングを行なうパターンマッチング部821を含む。パターンマッチング部821は、入力パターンの濃淡の度合いを判定する濃淡判定部822、入力特徴ベクトルの成分の値に従い入力照合ベクトルを抽出する照合ベクトル抽出部823、辞書特徴ベクトルと入力特徴ベクトルが類似しているかどうかを判定する照合ベクトル一致度判定部824、閾値作成部826、第1ベクトル類似度算出部827および詳細類似度算出部828を含む。
図20の辞書データ811、閾値バッファ812、辞書照合ベクトル蓄積バッファ813、メモリ814、および入力照合ベクトル蓄積バッファ825は、メモリ624、固定ディスク626、FD632およびCD−ROM642に対応する。
切り出し部804および特徴抽出部805、ならびにマッチング部820の各部の機能は、対応するプログラムを実行することにより実現される。つまり、これらプログラムは、メモリ624、固定ディスク626、FD632およびCD−ROM642などに予め格納されており、CPU622がこれらプログラムを読出して実行することにより対応する機能が実現される。なお、ここでは、これら各部の機能はプログラムで実現されるとしているが全部またはその一部が回路を用いて実現されても良い。
(マッチング処理)
本実施の形態に係る辞書データ811の一部の構成は図20に示される。
文字認識装置1におけるマッチング処理の概要について図3のフローチャートを参照しながら説明する。当該フローチャートはプログラムとして、たとえばメモリ624に格納されて、CPU622がメモリ624から当該プログラムの命令を読出して実行することによりマッチング処理が進行する。
まず、ユーザが、画像入力部801を操作して、文字が記載された紙面(原稿)を光学的に走査することにより、または当該紙面を撮像することにより、画像データが画像入力部801により入力される。画像入力部801は入力した画像データを文字認識装置1に出力する。文字認識装置1は、画像入力部801から出力された画像データを入力する。入力した画像データはメモリ814に格納される(ステップS(以下、単にSと略す)1)。画像入力部801から出力される画像データは、画像の各画素が白または黒の値を有する2値化された、すなわち特徴として濃淡を呈する画像のデータを指す。
切り出し部804は、メモリ814に格納された画像データを読出して切り出し処理を行なう。つまり、当該画像データのうちから、文字に対応する画像データを、文字パターン(入力パターン)データとして切り出す。切り出された文字パターンデータは矩形状のパターンデータを指す(S2)。文字パターンデータ(以下、文字パターンという)の切り出しは、たとえば、特開昭63−216188号公報に示される手順に従い行なわれる。つまり、入力画像データより黒画素を抽出し、抽出した黒画素に基づき入力画像において文字の行を判別した後、判別した行に垂直な方向の黒画素のヒストグラムに従い文字パターンを切り出す。ここでは、たとえば、図17の文字パターンが切り出されたと想定する。図17の文字パターンは黒画素からなる文字領域と、白画素からなる文字の背景領域からなる。切り出し部804により切り出された文字パターンは、メモリ814に格納される。
特徴抽出部805は、メモリ814から文字パターンを読出し、読出した文字パターンから当該文字パターンの特徴を抽出する。当該特徴は入力特徴ベクトルとして抽出される(S3)。その後、パターンマッチング(S4)が行なわれる。入力特徴ベクトルの抽出手順の詳細が図4に示される。
図4を参照して、特徴抽出部805は、メモリ814から読出した文字パターン、たとえば、図17の文字パターンの矩形状の領域を、メモリ814の作業領域においてメッシュ状の複数の領域に分割する(S31)。ここでは、矩形状の文字パターンは図12に示すように縦横8×8の正方形の64個の領域に等分割される。本実施の形態では、等分割された64個の各領域は、図5に示すように文字パターンの矩形領域の左上端から右下端にかけて領域e1、e2、e3、・・・、e64と順番に指示される。
さらに、特徴抽出部805は、等分割して得た64個の各領域に、当該領域に含まれる画素(pixel)のうち、文字領域を表す画素(黒画素)の数をカウントし、各領域のカウントされた黒画素数の2乗の総和が一定になるように正規化を行なう(S33)。正規化では、各成分の値の2乗の総和が、たとえば65536と一定となるように行なわれる。
特徴抽出部805により出力される入力特徴ベクトルは、正規化された64個の成分を有する。各成分は、正規化された黒色画素の数を指す。抽出された入力特徴ベクトルはメモリ814に格納される(S35)。その後、処理は図3のステップS4に移行する。
ここで正規化とは、64個の領域のそれぞれについてカウントされた黒画素数の2乗値を算出して、算出された各領域の黒画素数の2乗値を、64個の領域全てについて足し合わせて、その足し合わせた値が、所定値となるように入力特徴ベクトルの各成分を調整することを指す。正規化をすることにより、入力文字パターンが同じフォント(書体)の「A」であれば、32pixel×32pixelの文字パターンも64pixel×64pixelの文字パターンも、その入力特徴ベクトルは、同じ値のベクトルを指す。これにより、同一文字についてフォントが同じであれば、大きな文字も小さな文字も、辞書ベクトルと比較されるべき入力特徴ベクトルは等しくなる。
パターンマッチング部821はメモリ814から入力特徴ベクトルを読出して、読出した入力特徴ベクトルと辞書データ811に予め格納されている辞書特徴ベクトルVTjとを用いて、パターンマッチング処理を行なう(S4)。つまり、パターンマッチング部821は、入力特徴ベクトルと辞書データ811から読出した辞書特徴ベクトルVTjとを用いて入力文字と辞書登録文字とのパターンマッチング処理を行なう。
このようなパターンマッチング処理のための各部の機能について説明する。
(第1ベクトル類似度算出部)
第1ベクトル類似度算出部827による具体的な類似度の算出手順は次のようである。つまり、第1ベクトル類似度算出部827は、入力文字パターンと辞書登録文字CHiの文字パターンについて、図5のメッシュ状に分割された64個の領域のうち、互いの領域ex(x=1,2,3、・・・、64)における黒色画素の割合同士を乗算する。すなわち、入力特徴ベクトルを構成する64個の成分と、辞書特徴ベクトルVTiを構成する64個の成分について対応する成分の値同士を乗算する。そして、乗算結果の値を図5の64個の領域e1〜e64(64個の成分)について、すべて加算する。この加算結果が類似度を指す。
第1ベクトル類似度算出部827が、類似度を算出する際には、パターンマッチング部821によりまず、辞書特徴ベクトル群VEiそれぞれの第1の特徴ベクトルVT1を演算の対象して、概略的なマッチングが行なわれる。これにより64個の演算結果(乗算値)が得られる。所定の閾値よりも大きい乗算値を有する第1の特徴ベクトルVT1に対応の辞書登録文字CHiのそれぞれについて、次に、対応の第2の特徴ベクトルVT2〜第mの特徴ベクトルVTmのそれぞれを対象として演算をする。それらの演算結果に基づき認識結果が出力される。
(照合ベクトル抽出部)
照合ベクトル抽出部823について図6(A)〜図6(C)を参照し説明する。照合ベクトル抽出部823は、たとえば図6(A)の入力特徴ベクトル100から図6(B)の入力照合ベクトル101を生成して、その後、生成された入力照合ベクトル101に基づき図6(C)の照合ベクトルテーブル925を生成する。生成された照合ベクトルテーブル925は図7の入力照合ベクトル蓄積バッファ825に格納される。
具体的には、照合ベクトル抽出部823は、図6(A)の入力特徴ベクトル100をメモリ814から読出す。そして読出した入力特徴ベクトル100の64個の成分それぞれの値と、所定の閾値(ここでは、所定閾値を32とする)とを比較する。比較結果に基づき入力照合ベクトル101を生成する。なお、所定閾値は、特徴ベクトルの各成分を、高い値の成分、低い値の成分に分けるための閾値を指す。前述の正規化で述べたように、各成分の値の2乗の総和が、ここでは65536を指すので、全ての成分が同じ値を指すと想定した場合には、各成分の値は32を指すことになる。つまり、32×32×64=65536である。そこで、ここでは、所定閾値として32を採用している。このように、所定閾値は、正規化の時の総和の値により決定される。したがって、所定閾値は32に限定されない。
照合ベクトル抽出部823はまず64個の成分からなるベクトルを生成する。これを、生成ベクトルという。このとき生成ベクトルの各成分の値はたとえば‘0’がセットされている。次に、上述の比較結果に基づき、図6(A)の入力特徴ベクトル100の64個の成分のうち、所定閾値(=32)より大きいと判定された値を有する生成ベクトルの成分の値のみを‘1’にセットする(所定閾値以下と判定された値を有する成分に対応する生成ベクトルの成分の値は‘0’のままである)。これにより生成ベクトルは、図6(B)に示すように値‘1’または‘0’のいずれかが割当てされた64個の成分を有する入力照合ベクトル101を指示する。生成された入力照合ベクトル101は一旦メモリ814に格納される。
さらに、照合ベクトル抽出部823は、メモリ814から図6(B)の入力照合ベクトル101を読出し、読出した入力照合ベクトル101の64個の成分の値を、図6(B)の矢印ARで示すように行単位に順番にビット列として抽出する。したがって、計8個のビット列が抽出される。抽出された各ビット列は8ビットの長さを有する。次に、照合ベクトル抽出部823は、入力照合ベクトル101から抽出された順番に従い8個のビット列を格納した図6(C)の入力照合ベクトルテーブル925を生成する。生成された入力照合ベクトルテーブル925は入力照合ベクトル蓄積バッファ825に格納される。
入力照合ベクトルテーブル925は、入力照合ベクトル101から抽出された順番に従い8個のビット列をレコードIRk(k=1,2,3,4,5,6,7,8)として格納する。また、照合ベクトル抽出部823は、生成した入力照合ベクトル101の64個の成分のうち値が‘1’を指す成分の数、つまり64個の成分のうち値が所定閾値よりも大きい成分の総数をカウントして、カウント値を入力カウントデータ926として入力照合ベクトル蓄積バッファ825に格納する。図6(B)の例では入力カウントデータ926は‘27個’を指す。
(辞書照合ベクトル蓄積バッファ)
図8(A)と(B)には、辞書照合ベクトル蓄積バッファ813の内容の一例が示される。本実施の形態では、辞書データ811の辞書登録文字CHiのそれぞれについても、対応する辞書特徴ベクトルVTjについて、入力特徴ベクトル100と同様にして入力照合ベクトルテーブル925に相当する辞書照合ベクトルテーブルD1jと入力カウントデータ926に相当する辞書カウントデータD2jが算出されて、算出された両方の値は対応付けされて辞書照合ベクトル蓄積バッファ813に格納される。
辞書照合ベクトル蓄積バッファ813には、図8(A)に示すように辞書データ811の辞書登録文字CHiに対応の辞書特徴ベクトルVTjのそれぞれに関連付けされたデータDjが予め格納される。図8(A)を参照してデータDjは、関連付けされた辞書特徴ベクトルVTjについて算出された辞書照合ベクトルD1j、辞書カウントデータD2j、判定閾値(辞書)データD3jおよび判定閾値(入力)データD4jを有する。判定閾値(辞書)データD3jおよび判定閾値(入力)データD4jについては後述する。図8(B)には辞書照合ベクトルテーブルD1jの一例が示される。辞書照合ベクトルテーブルD1jは入力照合ベクトルテーブル925と同様に8ビット長の8個のレコードRRk(k=1,2,3、・・・、8)を有する。
データDjは、たとえば、文字認識装置1が起動したとき辞書データ811をロードする場合に、ロードされた辞書データ811に基づき算出して辞書照合ベクトル蓄積バッファ813に格納するようにしてもよい。
図9には、辞書照合ベクトル蓄積バッファ813の具体的な内容例が示される。たとえば図9の辞書特徴ベクトルVTjの場合には、照合ベクトル抽出部823により図9の辞書照合ベクトルテーブルD1jと辞書カウントデータD2jとが算出されて格納される。また、辞書照合ベクトルテーブルD1jの‘1’の成分の数を基準にした一致度判定閾値(辞書)データD3jと、入力照合ベクトル101の‘1’の成分の数を基準にした一致度判定閾値(入力)データD4jが算出されて格納される。
(照合ベクトル一致度判定部)
次に、照合ベクトル一致度判定部824について説明する。図10(A)〜(H)には、照合ベクトル一致度判定部824の処理手順が模式的に示される。ここでは、図10(A)と(B)の辞書特徴ベクトルVTjと入力特徴ベクトル100のそれぞれから、照合ベクトル抽出部823により、図10(C)と(D)の辞書照合ベクトルテーブルD1jと入力照合ベクトルテーブル101のそれぞれと、図10(F)と(G)の辞書カウントデータD2jと入力カウントデータ926のそれぞれが算出されていると想定する。
照合ベクトル一致度判定部824は、判定に用いるデータを作成する。つまり、入力照合ベクトルテーブル101のレコードIRkと辞書照合ベクトルテーブルD1jのレコードRRkの8ビットのデータどうしをビット単位で論理積を算出する。変数kの値を1から順にインクリメントしながら8となるまで、レコードIRkとRRkのデータどうしの論理積を算出する。これにより、レコードIRkとRRkどうしの論理積(8ビットデータ)を格納した8個のレコードRからなる図10(E)に示す論理積データ200が得られる。論理積データ200は一時的にメモリ814に格納される。
照合ベクトル一致度判定部824は、次に、メモリ814の論理積データ200の各レコードRのデータを読出し、読出したデータが示す8ビットのうち、‘1’を指すビットの総数を計算する。算出された総数は、辞書照合ベクトルVTjと入力照合ベクトル100の内積値201(図10(H)参照)を指す。算出された内積値201はメモリ814に格納される。照合ベクトル一致度判定部824による一致度の判定の詳細は後で述べる。
辞書ベクトルVTjから作成された各成分の値が0と1のいずれかである辞書照合ベクトルテーブルD1jと、入力特徴ベクトル100から辞書照合ベクトルテーブルD1jと同じ閾値を用いて作成された各成分の値が0と1のいずれかを指す入力照合ベクトルテーブル101を比較する場合、2つが同じ文字種であれば両方のテーブルにおいて値が‘1’を指す成分の場所が一致する度合いが高くなり、したがって、内積値201の値が大きくなる。したがって、内積値201の値が大きいほど入力文字と辞書登録文字CHiのパターンは一致する程度が高いといえる。
(閾値作成部)
閾値作成部826による、入力照合ベクトルの値が‘1’を指す成分の総数を基準にした一致度判定閾値の作成方法と、辞書照合ベクトルの値が‘1’の成分の総数を基準にした一致度判定閾値の作成方法を図11(A)〜(H)に従い説明する。
「A」という文字を例に説明する。前述の方法に従い、辞書照合ベクトル蓄積バッファ813には「A」を指す辞書登録文字CHiの辞書特徴ベクトルVTj(図11(A)参照)と辞書照合ベクトルテーブルD1j(図11(C)参照)が予め格納されている。また、予め、「A」の異なる種類のフォント毎に、図11(B)に示すようにその文字パターンから作成した学習特徴ベクトルについてそれぞれ図11(D)の学習照合ベクトルテーブル103を作成する。次に、作成された学習照合ベクトルテーブル103それぞれについて「A」の辞書照合ベクトルテーブルD1jとの論理積203(図11(E)参照)を算出して、論理積203のそれぞれについて図11(H)の内積値204を算出する。
さらに辞書照合ベクトルの値‘1’の成分の総数104(図11(F))に対する各学習照合ベクトルに対応の内積値204の比率RLと、学習照合ベクトルの値‘1’の成分の総数105のそれぞれに対する、当該学習照合ベクトルの内積値204の比率RDを求める。図11(F)〜(H)では総数104が‘22’、総数105が‘27’、および内積値204が‘7’である場合には、比率RLは0.318であり、比率RDは0.259である。
図11(B)のすべての学習特徴ベクトルについて比率RLと比率RDを計算し、比率RLの最小値を「A」の入力照合ベクトルの値‘1’の成分の総数を基準にした一致度判定閾値MinIとし、比率RDの最小値を「A」の辞書照合ベクトルの値‘1’の成分の総数を基準にした一致度判定閾値MinDとする。算出された一致度判定閾値MinIとMinDは、図8の辞書照合ベクトル蓄積バッファ813に当該辞書特徴ベクトルVTjに対応の判定閾値データD3jおよびD4jとして格納される。
図12は、閾値作成部826による、1つの辞書特徴ベクトルVTjについての2つの閾値、つまり、辞書照合ベクトルの値‘1’の成分の総数を基準にした一致度判定閾値MinD(判定閾値データD3j)と、入力照合ベクトルの値‘1’の成分の総数を基準にした一致度判定閾値MinI(判定閾値データD4j)との作成処理フローチャートである。
まず、閾値作成部826は、閾値作成対象の辞書特徴ベクトルVTjを辞書データ811から読出して入力する(S1301)。求めるべき閾値(MinD、MinI)に初期値として最大値‘1’(=100%)をセットする(S1302)。入力した辞書特徴ベクトルVTjから辞書照合ベクトルテーブルD1jを作成する(S1303)。次に、作成した辞書照合ベクトルテーブルD1jにおいて閾値(=32)を超えている成分の総数Sdを算出する(S1304)。
次に、学習された特徴ベクトルデータであって、未だ、閾値作成に用いられていないデータがあるかどうかを判断し(S1305)、あれば、1つの学習特徴ベクトルデータ(以下、学習特徴ベクトルという)を入力する(S1306)。ここでは学習により得られた複数の学習特徴ベクトルはメモリ814に予め格納されているので、メモリ814から読出されることにより学習特徴ベクトルが入力される。
次に、入力された学習特徴ベクトルから学習照合ベクトルテーブル103を作成し(S1307)、作成した学習照合ベクトルテーブル103の閾値(=32)を超えている成分の総数Siを算出する(S1308)。
次に、辞書照合ベクトルテーブルD1jを辞書照合ベクトル蓄積バッファ813から読出し、読出した辞書照合ベクトルテーブルD1jと作成した学習照合ベクトルテーブル103との内積値204を指す内積値Wを算出する(S1309)。
そして、内積値Wに対する総数Sdの比(W/Sd)と閾値MinDとを比較して、比較結果に基づき、比(W/Sd)は閾値MinDより小さいかを判定する(S1310)。小さいと判定されないとステップS1312に移行するが、小さいと判定されると閾値MinDに比(W/Sd)をセットして(S1311)、ステップS1312に移行する。
ステップS1312では、内積値Wに対する総数Siの比(W/Si)と閾値MinIとを比較して、比較結果に基づき、比(W/Si)は閾値MinIより小さいかを判定する。小さいと判定されないとステップS1305に移行するが、小さいと判定されると閾値MinIに比(W/Si)をセットして(S1313)、ステップS1305に移行する。
ステップS1306〜S1313の処理を、メモリ814に格納された全ての学習特徴ベクトルそれぞれについて繰り返し行なう。学習特徴ベクトルの全てについて処理が終了したことが判定されると(S1305で‘Y’)、その時点の閾値MinDおよびMinIの値を出力する。すなわち、出力された閾値MinDとMinIの値は、辞書特徴ベクトルVTjに対応の判定閾値データD3jおよびD4jとして辞書照合ベクトル蓄積バッファ813に格納される(S1314)。以上により一致度判定閾値作成処理は終了する。
ここで用いる学習ベクトルは、辞書特徴ベクトルVTjと同じ文字種の大量データである。図12の一致度判定閾値作成処理は、辞書データ811の全ての辞書登録文字CHiのすべての辞書特徴ベクトルデータVTjについて行なわれる。
ここで、辞書登録文字CHiの各特徴ベクトルVTjの一致度判定閾値データD3jとD4jを学習ベクトルから求めた最小の閾値MinDとMinIとする理由は次のようである。
つまり、前述したように辞書特徴ベクトルVTjと入力特徴ベクトル100との間では、同じ文字種であれば、両方のベクトルにおいて成分の値が‘1’の場所が一致する度合いが高いはずである。たとえば、文字‘J’の辞書照合ベクトルテーブルD1jと入力文字‘L’の入力照合ベクトルテーブル101とでは、値‘1’の場所が一致する度合いは低いはずである。反対に‘L’の辞書照合ベクトルテーブルD1jと‘L’の入力照合ベクトルテーブル101とは、値‘1’の場所が一致する度合いが高いはずである。しかし、どのくらい度合いが高いかは、データによって異なるので確定することは困難である。そこで、手がかりとして、図12では学習データから一致する割合を、すなわち辞書特徴ベクトルと学習ベクトルが一致する割合を、算出している。
したがって、図12の処理で一致度判定閾値データD3jとD4jを最小値とすれば、学習データのすべてを網羅することが可能となる。学習データについて言えば、後述の図14のパターンマッチング処理の類似度計算(第1辞書ベクトルとの類似度計算)と詳細マッチング(第2辞書ベクトルとの類似度計算)(S1510とS1512)を誤ってスキップしてしまうことはない。このような理由から、最小値を例に挙げている。もちろん、最小値でなくてもかまわないが、値が大きくなるとパターンマッチング処理は早くなる代わりに精度は落ちるであろう。
図13は、照合ベクトル抽出部823において、照合ベクトルテーブル(辞書照合ベクトルテーブルD1jまたは入力照合ベクトルテーブル101など)の値‘1’の成分の総数(辞書カウントデータD2jまたは入力カウントデータ926)を算出する時に使用するテーブルを示す。図13のテーブルは、10進数の値(0〜255)のそれぞれに対応して、2進数の値と、2進数の値で示される値が‘1’のビットの個数とが格納されている。このテーブルは予めメモリ814に格納されている。
たとえば、照合ベクトルテーブルのレコード(レコードRRkまたはIRk)の成分の値が00000101(10進で5)の時、図13のテーブルの10進数の‘5’に対応のビット数を検索すると‘2’が得られる。このような手順で図13のテーブルを検索することにより、照合ベクトルテーブルの各レコードについて閾値を超えている成分の数(ビット数)を得ることができるから、得られたビット数の総和を求める、すなわち7回の足し算のみで値‘1’の成分の総数を高速に得ることができる。
(パターンマッチング処理)
図14には、パターンマッチング部821の処理手順が示される。
特徴抽出部805で作成された、たとえば図6(A)の入力特徴ベクトル100がマッチング部820のパターンマッチング部821に入力されたと想定する(S1501)。照合ベクトル抽出部823は入力特徴ベクトル100に基づき入力照合ベクトル101を作成し(S1502)、入力照合ベクトル101の値‘1’の成分の総数SIを算出(カウント)する(S1503)。これにより、入力照合ベクトル蓄積バッファ825には入力照合ベクトルテーブル925と総数SIに相当の入力カウントデータ926が格納される。
パターンマッチング部821は、辞書データ811から読出されてパターンマッチングに用いられる辞書登録文字CHiをカウントするためのカウンタiを1にセットし(S1504)、辞書登録文字数の相当する回数だけマッチングが行なわれたか判定する(S1505)。図20に従えば辞書登録文字CHiの総数はn個である。パターンマッチング部821には、予めn個を指すデータが与えられているので、カウンタiが指示する値と登録辞書文字数(n個)とを比較し、比較結果の基づき‘i<n(登録辞書文字数)’の条件が成立するか否かを判定することにより、辞書登録文字数の相当する回数だけマッチングが行なわれたか否かを判定する。
‘i<n(登録辞書文字数)’の条件が成立して、辞書登録文字の全てについてマッチングがまだ行なわれていないと判定すると(S1505でY)、辞書登録文字CHiに対応の第1辞書特徴ベクトルVT1について後述の類似度計算(S1510)が可能となるが、その前に、第1辞書特徴ベクトルVT1は類似度計算(S1510)の対象となるかを判別するための照合ベクトル一致度判定部825を用いた処理(S1506〜S1509)が行なわれる。
まず、照合ベクトル一致度判定部825は、辞書特徴ベクトルVT1に対応する辞書照合ベクトルテーブルD11、閾値MinDおよびMinIに相当の閾値データD31およびD41、ならびに辞書照合ベクトルテーブルD11の値‘1’の成分の総数Sdに相当の辞書カウントデータD21を照合ベクトル蓄積バッファ813から読出す(S1506)。
次に、照合ベクトル一致度判定部825は、入力照合ベクトル蓄積バッファ825から読み出した入力照合ベクトルテーブル925と辞書照合ベクトルテーブルD11の内積値Wを算出する(S1507)。そして、入力照合ベクトルテーブル101と辞書照合ベクトルテーブルD11との一致度が所定閾値(MinD、MinI)を超えるか否かにより、入力文字の認識結果候補として辞書登録文字CHiを選択するか否かを判定する。選択した場合には、当該辞書登録文字CHiに関してステップS1510の類似度計算が行なわれる。照合ベクトル一致度判定部825は、具体的には、内積値Wの総数Sdに対する比W/Sdを求めて、比W/Sdが閾値データD31の値(閾値MinDに相当)を比較し、比較結果に基づき(W/Sd>MinD)が成立すると判定されると(S1508で‘Y’)次の判断処理(S1509)に進むが、成立すると判定されないと(S1508の‘N’)、入力特徴ベクトル100は、この辞書特徴ベクトルVT1とは全く類似しないと判断する。その場合には、第1ベクトル類似度算出部827による類似度計算(S1510)は行なわれず、カウントiの値を1インクリメントして次の辞書登録文字CHiを指示するようにして(S1508)、ステップS1505の処理に戻り、指示された次の辞書登録文字CHiについてS1506以降の処理が同様に行なわれる。
一方、照合ベクトル一致度判定部825は(W/Sd>MinD)が成立すると判定すると(S1508の‘Y’)、内積Wの総数SIに対する比W/SIを求めて、比W/SIが閾値データD32の値(閾値MinIに相当)を比較し、比較結果に基づき(W/SI>MinI)が成立すると判定すると(S1509で‘Y’)、類似度計算が行なわれる(S1510)。(W/SI>MinI)が成立しないと判定すると(S1509で‘N’)、入力特徴ベクトル100は、現在の辞書特徴ベクトルVT1とはまったく類似しないと判断する。その場合には、類似度計算(S1510)は行なわれず、次の辞書登録文字CHiを指示するようにカウンタiの値を1インクリメントして(S1508a)、対応の特徴ベクトルVT1について、ステップS1505以降の処理が同様に行なわれる。
以上の処理は、S1505の条件が成立すると判定されるまで(S1505でN)、すなわち辞書データ811の辞書登録文字CHiのすべてについて行なわれる。したがって、辞書データ811のn個の辞書登録文字CHiのうち、その辞書特徴ベクトルVT1についてS1508およびS1509の条件が成立したx個の辞書登録文字CHiについてのみ類似度計算(S1510)が行なわれる。
第1ベクトル類似度算出部827は、x個の辞書登録文字CHiそれぞれの第1特徴ベクトルVT1と入力照合ベクトル101との類似度を前述した手順に従い算出する。ここでは算出された類似度は、x個の類似度R1、R2、R3、・・・、Rxとして、辞書データ811の対応の辞書登録文字CHiとポインタなどで関連付けされてメモリ814に格納される。
その後、パターンマッチング部821は、メモリ814のx個の類似度R1、R2、R3、・・・,Rxをソートし(S1511)、ソート結果に基づき、大きい方から上位P個の類似度に対応の辞書登録文字CHiを辞書データ814から読出し、さらに詳細類似度算出部828により詳細マッチングを行なう(S1512)。詳細マッチングの結果に基づき、認識結果候補文字が出力部802などに出力される(S1513)。
本実施の形態では、詳細マッチング(S1512)はたとえば次のように行なわれる。つまり、詳細類似度算出部828は、上位P個の類似度に対応の辞書登録文字CHiそれぞれについて第2辞書特徴ベクトルVT2〜第m辞書特徴ベクトルVTmについて類似度の演算を行なう。つまり、P個の辞書登録文字CHiのそれぞれについて、当該辞書登録文字CHiに対応の第2辞書特徴ベクトルVT2〜第m辞書特徴ベクトルVTmのそれぞれと入力特徴ベクトル101との類似度を算出する。類似度の算出は、前述した式2に従う類似度Sの算出を指す。P個の辞書登録文字CHiのそれぞれについて、辞書特徴ベクトルそれぞれについて算出された類似度の総和が算出される。そして、P個の辞書登録文字CHiのうち、対応の類似度の総和が大きい順に従い辞書登録文字CHiを選択して、選択した辞書登録文字CHiを認識結果を指す候補として、辞書データ811から読み出し、出力部802に与える。これにより、ステップS1513では、出力部802は、入力した認識結果候補の辞書登録文字CHiが指す文字コードに基づき文字を表示する。
したがって、詳細類似度算出部828は、入力パターン(入力特徴ベクトル101)と、前述の第1ベクトル類似度算出部827による照合の結果に基づき入力特徴ベクトル101と一致すると判定された辞書特徴ベクトルVT1に対応の辞書パターン(第2辞書特徴ベクトルVT2〜第m辞書特徴ベクトルVTm)のみとの間でパターンマッチングを行なう。
ここでは、照合ベクトル一致度判定部824は、辞書登録文字CHi毎に設定された2つの閾値データD3jとD4jを用いて判定を行なっているが、0.5などの固定値でもよい。
図14の処理では一致度判定閾値データD3jとD4jを学習データから算出された値のうちの最小値としているので、辞書登録文字CHiとして入力が想定される文字パターンのすべてを網羅することが可能となる。したがって、図14のパターンマッチング処理では類似度計算(第1辞書ベクトルとの類似度計算)と詳細マッチング(第2辞書ベクトルとの類似度計算)(S1510とS1512)を誤ってスキップしてしまうことはないから、パターンマッチング処理の結果について高い精度を持つことができる。
ただし、精度が要求されない場合など、最小値をとる必要がない場合は、調整し、高い値にすることも可能である。たとえば、高速性を優先する場合には、必ずしも最小値をとる必要はない。
(マッチング処理の他の例)
図15は、図14のマッチング部の処理に濃淡判定部822のための処理(S1604、S1609)が加わった場合の処理手順を示す。図15のS1604とS1609を除く他の処理は図14で説明したものと同じであるから、詳細説明を略する。
濃淡判定部822の処理のために濃淡フラグflagが参照される。濃淡フラグflagの設定手順を、図16を参照して説明する。
濃淡判定部822は、図16に示すように濃淡判定を行なう。まず、入力照合ベクトルテーブル101の値‘1’の成分の総数SIと濃淡フラグflagの値を入力する。このとき濃淡フラグflagは‘0’として入力される(S1701)。次に、濃淡判定部822は、予め定められた閾値Tと総数SIの値とを比較して、比較結果に基づき(SI>T)の条件が成立しているか否かを判定する(S1702)。条件成立と判定されると、すなわち総数SIは閾値Tより大きいと判定されると(S1702で‘Y’)、濃淡フラグflagに‘1’がセットされるが(S1703)、成立しないと判定されると(S1702で‘N’)濃淡フラグflagの値は‘0’のままである。これにより、濃淡判定部822の処理は終了する。つまり、濃淡判定部822により、入力文字パターンに黒画素が多い場合には濃淡フラグflagに‘1’がセットされる。
濃淡判定では、処理対象の入力特徴ベクトルの基になった画像が、黒っぽいか白っぽいかの判定をさすから、ベクトルの成分の総数(64個)のうちの3分の1程度から2分の1程度(20から30)の値を、閾値Tとして用いることが好ましい。
なお、濃淡判定は、図16のように入力照合ベクトルテーブル101の値‘1’の成分の総数SIに基づき行なってもよいし、入力特徴ベクトル100の成分の値に基づき行なってもよい。入力照合ベクトルテーブル101を介さず入力特徴ベクトルに基づき濃淡判定を行なえば、入力照合ベクトルテーブル作成時の閾値とは別の閾値で、判定を行なうことができる。
図15を参照して、ステップS1501〜S1503の処理が図14と同様に行なわれる。次に、濃淡判定部822により、S1503で算出した総数SIを用いて図16で示したように濃淡フラグflagに値が設定される(S1604)。次に、S1505〜S1507の処理が図14と同様に行なわれる。
次に、濃淡フラグflagの値が‘1’を指すか否かを判定する(S1609)。濃淡フラグflagが‘1’を指すと判定すると(S1609で‘Y’)、一致度判定閾値MinIに基づく判断を行ない(S1509)、濃淡フラグflagが‘0’を指すと判定すると(S1609で‘N’)、一致度判定閾値MinDに基づく判断を行なう(S1508)。その後は、図14と同様に処理が行なわれる。
図15の処理手順に従うと次のメリットが得られる。つまり、図14の手順では、類似度計算(S1511)をするかしないかの判断を一致度判定閾値MinDとMinIの2つの閾値のみに基づき行なっているために、入力パターンの内容にかかわらず閾値MinDを用いた比較処理(S1508)は必ず行なわれる。一方、図15のように濃淡判定部822を用いる場合は、濃い画素(文字領域)の多い入力パターンほど、すなわち総数SIの値が大きい入力パターンほど、ステップS1509の判定処理により類似度計算(S1510)の対象から外される可能性が高い。このことに着目して、図15の手順では、濃淡フラグflagにより、ステップS1508の閾値MinDを用いた判定処理をスキップして、S1509の閾値MinIを用いた判定処理のみをすることができる。したがって、図14の手順に比較して処理を高速に行なうことが可能となる。
(実施の形態2)
次に実施の形態2について説明する。
実施の形態1で説明した処理機能を有したシステムは、プログラムで実現される。本実施の形態2では、このプログラムはコンピュータで読取可能な記録媒体に格納される。
本実施の形態2では、この記録媒体として、図2に示されているコンピュータで処理が行なわれるために必要なメモリ、たとえばメモリ624のようなそのものがプログラムメディアであってもよいし、また外部記憶装置として磁気テープ装置およびCD−ROM駆動装置640などのプログラム読取装置が設けられ、そこに記憶媒体である磁気テープまたはCD−ROM642が挿入されることで読取可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはCPU622がアクセスして実行させる構成であってよい。
ここで、上述したプログラムメディアはコンピュータ本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープなどのテープ系、FD632や固定ディスク626などの磁気ディスクやCD−ROM642/MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)などの光ディスクのディスク系、ICカード(メモリカードを含む)/光カードなどのカード系、あるいはマスクROM、EPROM(Erasable and Programmable ROM)、EEPROM(Electrically EPROM)、フラッシュROMなどによる半導体メモリを含めた固定的なプログラムを担持する媒体であってもよい。
また、本実施の形態においては、コンピュータはインターネットを含む通信ネットワーク300と通信インターフェイス680を介して接続可能な構成が採用されているから、これら通信ネットワークからプログラムがダウンロードされるよ流動的にプログラムを担持する媒体であってもよい。
なお、一般的傾向として、コンピュータのオペレーティングシステムの一部として様々なプログラムモジュールを用意しておき、アプリケーションプログラムはこれらモジュールを所定の配列で必要なときに呼出して処理を進める方式が一般的である。そうした場合、当該パターン認識装置を実現するためのソフトウェア自体にはそうしたモジュールは含まれず、図2のコンピュータでオペレーティングシステムと協働してはじめてパターン認識装置が実現することになる。しかし、一般的なプラットホームを使用する限り、そうしたモジュールを含ませたソフトウェアを流通させる必要はなく、それらモジュールを含まないソフトウェア自体およびそれらソフトウェアを記録した記録媒体(およびそれらソフトウェアがネットワーク上を流通する場合のデータ信号)が実施の形態を構成すると考えることができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明は、画像のパターン認識機能を有する各種の装置に適用可能である。したがって、文字を識別するOCRの他にも、顔画像、指紋、印鑑などによる認証装置や、その他画像のパターン認識機能を有するあらゆる装置において利用可能である。
本実施の形態に係る文字認識装置の要部の機能構成図である。 本実施の形態に係る文字認識装置が搭載されるコンピュータの構成図である。 本実施の形態に係る概略処理フローチャートである。 特徴抽出部の処理フローチャートである。 本実施の形態に係るメッシュ状の領域を示す図である。 照合ベクトル抽出部823の処理を示す図である。 入力照合ベクトル蓄積バッファの内容例を示す図である。 辞書照合ベクトル蓄積バッファの概略的な内容例を示す図である。 辞書照合ベクトル蓄積バッファの具体的内容例を示す図である。 (A)〜(H)は、照合ベクトル一致度判定部の処理手順を模式的に示す図である。 (A)〜(H)は、閾値作成部の処理手順を模式的に示す図である。 閾値作成の処理フローチャートである。 照合ベクトル抽出部により使用されるテーブルの一例を示す図である。 パターンマッチング部の処理手順の一例を示す図である。 パターンマッチング部の処理手順の他の例を示す図である。 濃淡判定処理の手順を示す図である。 入力文字画像の例を示す図である。 入力文字画像をメッシュ分割した状態を示す図である。 特徴ベクトルの各成分を示す図である。 従来および本実施の形態に適用される辞書データを示す図である。 従来の処理手順の一例を示す図である。 従来の閾値テーブルを示す図である。 従来の処理手順の他の例を示す図である。
符号の説明
1 文字認識装置、805 特徴抽出部、811 辞書データ、813 辞書照合ベクトル蓄積バッファ、821 パターンマッチング部、822 濃淡判定部、823 照合ベクトル抽出部、824 照合ベクトル一致度判定部、825 入力照合ベクトル蓄積バッファ、826 閾値作成部、827 第1ベクトル類似度算出部、828 詳細類似度算出部。
この発明のある局面に係るパターン認識装置は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成手段と、辞書照合ベクトル格納手段から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、所定閾値より大きい一致度が算出された辞書照合ベクトルと、入力照合ベクトルとの照合をする照合手段と、を備える。そして、入力パターンと、照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なう。
好ましくは、所定閾値は、辞書照合ベクトル格納手段において辞書照合ベクトル毎に予め格納されている。
この発明の他の局面に係るパターン認識方法は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備えるコンピュータを用いたパターン認識方法であって、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、辞書照合ベクトル格納部から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、所定閾値より大きい前記一致度が算出された辞書照合ベクトルと、入力照合ベクトルとの照合をする照合ステップと、入力パターンと、前述の照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なうステップとを備える。

Claims (10)

  1. 複数の辞書パターンを格納した辞書部と、
    前記複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、
    入力パターンに基づき、当該入力パターンの特徴を示す前記所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成手段と、
    前記辞書照合ベクトル格納手段から読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、
    所定閾値より大きい前記一致度が算出された前記辞書特徴ベクトルと、前記入力照合ベクトルとの照合をする照合手段と、を備え、
    前記入力パターンと、前記照合の結果に基づき前記入力照合ベクトルと一致すると判定された前記辞書照合ベクトルに対応の前記辞書パターンのみとの間で、パターンマッチングを行なう、パターン認識装置。
  2. 前記所定閾値は、前記辞書照合ベクトル格納手段において前記辞書特徴ベクトル毎に予め格納されている、請求項1に記載のパターン認識装置。
  3. 前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1または2に記載のパターン認識装置。
  4. 前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記辞書照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1から3のいずれか1項に記載のパターン認識装置。
  5. 前記特徴は画像の濃淡を指示する、請求項1から4のいずれか1項に記載のパターン認装置。
  6. 前記特徴は画像の濃淡を指示し、前記成分は濃淡を1と0により指示し、
    前記入力照合ベクトルの1を指す成分の総数が予め設定した数値より大きいときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1または2に記載のパターン認識装置。
  7. 前記特徴は画像の濃淡を指示し、前記成分は濃淡を1と0により指示し、
    前記入力照合ベクトルの1を指す成分の総数が予め設定した数値以下のときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記辞書照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1、2および6のいずれかに記載のパターン認識装置。
  8. 複数の辞書パターンを格納した辞書部と、前記複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は1または0を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備える情報処理装置を用いたパターン認識方法であって、
    入力パターンに基づき、当該入力パターンの特徴を示す前記所定個数の成分からなり、各成分は1または0を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、
    前記辞書照合ベクトル格納部から読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、
    所定閾値より大きい前記一致度が算出された前記辞書特徴ベクトルと、前記入力照合ベクトルとの照合をする照合ステップと、
    前記入力パターンと、前記照合の結果に基づき前記入力照合ベクトルと一致すると判定された前記辞書照合ベクトルに対応の前記辞書パターンのみとの間でパターンマッチングを行なうステップとを備える、パターン認識方法。
  9. 請求項8に記載のパターン認識方法をコンピュータに実行させるためのパターン認識プログラム。
  10. 請求項8に記載のパターン認識方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006277737A 2006-10-11 2006-10-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 Expired - Fee Related JP4087421B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006277737A JP4087421B2 (ja) 2006-10-11 2006-10-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
EP07791060A EP2073146A4 (en) 2006-10-11 2007-07-20 PATTERN DETECTION APPARATUS FOR DETECTING AN INPUT PATTERN BY USING A DICTIONARY PATTERN
PCT/JP2007/064322 WO2008044380A1 (fr) 2006-10-11 2007-07-20 Dispositif de reconnaissance de motif pour reconnaître un motif de saisie à l'aide d'un motif de dictionnaire
CN2007800379798A CN101553825B (zh) 2006-10-11 2007-07-20 基于字典模式来识别输入模式的模式识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006277737A JP4087421B2 (ja) 2006-10-11 2006-10-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2008097275A true JP2008097275A (ja) 2008-04-24
JP4087421B2 JP4087421B2 (ja) 2008-05-21

Family

ID=39282590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006277737A Expired - Fee Related JP4087421B2 (ja) 2006-10-11 2006-10-11 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Country Status (4)

Country Link
EP (1) EP2073146A4 (ja)
JP (1) JP4087421B2 (ja)
CN (1) CN101553825B (ja)
WO (1) WO2008044380A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017112087A1 (en) * 2015-12-26 2017-06-29 Intel Corporation Reconstruction of signals using a gramian matrix
KR20190056664A (ko) * 2017-11-17 2019-05-27 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법
JP2019192309A (ja) * 2015-09-08 2019-10-31 日本電気株式会社 顔認識システム、表示制御装置、表示制御方法および表示制御プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5459312B2 (ja) * 2009-03-27 2014-04-02 日本電気株式会社 パターン照合装置、パターン照合方法及びパターン照合プログラム
WO2015194132A1 (ja) * 2014-06-19 2015-12-23 日本電気株式会社 情報処理装置、ベクトルデータ処理方法、及び、記録媒体
JP6618884B2 (ja) * 2016-11-17 2019-12-11 株式会社東芝 認識装置、認識方法およびプログラム
CN112084979B (zh) * 2020-09-14 2023-07-11 武汉轻工大学 食品成分识别方法、装置、设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4259661A (en) * 1978-09-01 1981-03-31 Burroughs Corporation Apparatus and method for recognizing a pattern
JPH0795336B2 (ja) 1986-10-28 1995-10-11 株式会社リコー 文字認識方式
JPH0634256B2 (ja) 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JPH0281282A (ja) * 1988-09-19 1990-03-22 Hitachi Ltd 文字認識方法
US5303311A (en) * 1990-03-12 1994-04-12 International Business Machines Corporation Method and apparatus for recognizing characters
US5121441A (en) * 1990-09-21 1992-06-09 International Business Machines Corporation Robust prototype establishment in an on-line handwriting recognition system
JP2938276B2 (ja) * 1992-06-30 1999-08-23 シャープ株式会社 文字認識装置
JPH0660226A (ja) * 1992-08-11 1994-03-04 Nireco Corp 文字読取装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019192309A (ja) * 2015-09-08 2019-10-31 日本電気株式会社 顔認識システム、表示制御装置、表示制御方法および表示制御プログラム
US10885312B2 (en) 2015-09-08 2021-01-05 Nec Corporation Face recognition system, face recognition method, display control apparatus, display control method, and display control program
US10885311B2 (en) 2015-09-08 2021-01-05 Nec Corporation Face recognition system, face recognition method, display control apparatus, display control method, and display control program
US10970524B2 (en) 2015-09-08 2021-04-06 Nec Corporation Face recognition system, face recognition method, display control apparatus, display control method, and display control program
JP2021157817A (ja) * 2015-09-08 2021-10-07 日本電気株式会社 顔認識システム、表示制御装置、表示制御方法および表示制御プログラム
JP7196952B2 (ja) 2015-09-08 2022-12-27 日本電気株式会社 顔認識システム、表示制御装置、表示制御方法および表示制御プログラム
US11842566B2 (en) 2015-09-08 2023-12-12 Nec Corporation Face recognition system, face recognition method, display control apparatus, display control method, and display control program
WO2017112087A1 (en) * 2015-12-26 2017-06-29 Intel Corporation Reconstruction of signals using a gramian matrix
KR20190056664A (ko) * 2017-11-17 2019-05-27 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법
KR101990998B1 (ko) * 2017-11-17 2019-06-20 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법

Also Published As

Publication number Publication date
WO2008044380A1 (fr) 2008-04-17
CN101553825A (zh) 2009-10-07
EP2073146A1 (en) 2009-06-24
EP2073146A4 (en) 2009-10-21
JP4087421B2 (ja) 2008-05-21
CN101553825B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
JP4087421B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US6563949B1 (en) Character string extraction apparatus and pattern extraction apparatus
US9025882B2 (en) Information processing apparatus and method of processing information, storage medium and program
JP4806101B2 (ja) 物体検出装置及び物体検出方法
JP2008159056A (ja) 画像中に生じる特徴の生成モデルによる分類
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
CN110490199A (zh) 一种文本识别的方法、装置、存储介质及电子设备
US20080175447A1 (en) Face view determining apparatus and method, and face detection apparatus and method employing the same
US9092688B2 (en) Assisted OCR
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JPH11272800A (ja) 文字認識装置
US8472719B2 (en) Method of stricken-out character recognition in handwritten text
AU2017225022A1 (en) Method, system and apparatus for processing image data
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
JP2015225469A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2005149395A (ja) 文字認識装置、ナンバープレート認識システム
JP2007188190A (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
WO2024189739A1 (ja) 情報処理装置、情報処理方法、記憶媒体
Hong et al. Algorithms for postprocessing OCR results with visual inter-word constraints
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
US20240221197A1 (en) Teaching data generation device, teaching data generation method, and image processing device
JP2001092924A (ja) パターン認識方法および装置
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
JPH09179935A (ja) 文字認識装置およびその制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4087421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees