JP3958954B2

JP3958954B2 - 認識辞書カスタマイズ装置，方法，プログラム及び記録媒体

Info

Publication number: JP3958954B2
Application number: JP2001349864A
Authority: JP
Inventors: 浩明武部
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-11-15
Filing date: 2001-11-15
Publication date: 2007-08-15
Anticipated expiration: 2021-11-15
Also published as: JP2003150905A

Description

【０００１】
【発明の属する技術分野】
本発明は認識辞書カスタマイズ装置，方法，プログラム及び記録媒体に関する。
【０００２】
本発明の発明者により先に文字等のパターンを認識する装置及び方法について提案をしたが，認識のための基本辞書を固有値・固有ベクトルを修正することで認識率を向上する必要がある。
【０００３】
【従来の技術】
従来の文字認識における代表的な識別方法に次のような方法がある。
【０００４】
入力された文字パターンを二値画像に変換し，メッシュ状に区切って，各メッシュ中の２値のパターンの方向成分（ベクトル）を識別し，全メッシュの成分を決められた計算により数値の組，すなわちベクトルとして特徴を抽出する。特徴抽出によって入力文字パターンは，特徴ベクトル空間内の点に写像される。この入力パターンの特徴ベクトルと，ベクトル空間における各カテゴリ（各文字）の代表点との距離を計算し，最も近いカテゴリを認識結果とする。ここで，ベクトル空間における各カテゴリの代表点は，カテゴリ毎に用意された標本パターン特徴ベクトルのベクトル空間における平均であり。距離尺度としては，シティブロック距離，ユークリッド距離等が用いられる。
【０００５】
一方，文字認識における有力な識別方法として擬似ベイズ識別手法がある。これは，識別においてシティブロック距離やユークリッド距離を用いるのではなく，特徴ベクトル空間における各カテゴリの分布を識別に反映させる点に特徴を持つ。これにより，文字パターンの変形に対し柔軟な識別が可能となる。また，この手法は，共分散行列の固有ベクトルが高次になるほど推定誤差が大きくなること，及び膨大な計算量や記憶容量が必要になること等の問題を解決している。以下，具体的な擬似ベイズ識別関数ｇ_C(x) は次の式（１）となる。
【０００６】
α_C ⁱ：共分散行列Σ_Cのｉ番目の固有値
ｖ_C ⁱ：Σ_Cのｉ番目の固有値に対応する固有ベクトル
ｋ：１以上ｎ以下の整数
【０００７】
【数１】

【０００８】
しかし，擬似ベイズ識別でも，最も標準的なフォントである明朝体に比べて変形の強いフォントや，入出力状況に応じて劣化の激しい文書における文字の認識精度は良くない。また，当然に，変形の強いフォントでしかも劣化が加わると，認識精度は更に低下する。これらの問題に対し，本発明の発明者は，従来の擬似ベイズ識別関数に，フォント特有のまたは劣化の変形特有の情報を付加する方法を用いた『確率密度関数を用いたパターン認識装置および方法』として提案した（特願２００１−２２６６６）。
【０００９】
その提案された認識方法の原理を図１３に示す。このパターン認識の構成では，計算手段８０と認識手段８１を備え，パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行う。計算手段８０はあるパターン集合について，各パターンの特徴ベクトルを各正解カテゴリの平均特徴ベクトルとの差分をとることで，差分ベクトルの集合が生成され，その差分ベクトルの集合の自己相関行列を共分散行列とし，未知パターンの特徴ベクトルを平均とするような正規分布，確率密度関数として用いて，あるカテゴリの確率密度の期待値が定義され，その期待値に基づいてそのカテゴリの識別関数が定義されたとき，前記未知パターンの特徴ベクトルに対するその識別関数の値を計算する。識別手段８１は，その識別関数の値にもとづいて前記未知パターンの認識を行い認識結果を出力する。
【００１０】
差分ベクトルの集合は，パターン集合特有の差分分布を表していると考えられ，その自己相関行列は差分分布の情報を含んでいる。この自己相関行列を共分散行列とする正規分布を確率密度関数として用いることにより，差分分布の情報を反映した期待値が生成される。従って，この期待値に基づいて定義された識別関数は，パターン集合特有の特徴を反映している。
【００１１】
計算手段８０は未知パターンの特徴ベクトルに対するこの識別関数の値を計算し，計算結果を認識手段８１に出力する。認識手段８１は受け取った識別関数の値に基づいて未知パターンのカテゴリを判定し，判定結果を出力する。このようなパターン認識装置によれば，パターン集合と同様の特徴をもつ未知パターンに対して，より高精度な認識処理を行うことができる。例えば，変形の強いフォントの文字パターンの集合から差分ベクトルの集合を生成すれば，そのフォントの未知パターンの認識精度が向上し，劣化の激しい文書における文字パターンの集合から差分ベクトルの集合を生成すれば，同じような劣化が見られる未知パターンの認識精度が向上する。
【００１２】
図１４は提案された方法による識別関数値の生成を示し，未知パターンの特徴ベクトルｘが与えられたとき，特徴ベクトル空間内の点ｘに関して，上記のパターン集合特有の差分分布（誤差分布）を確率密度関数Ｆ_e（ｘ）とする。そして，あるカテゴリＣの識別関数の確率密度関数をＦ_C（ｘ）として，Ｆ_C（ｘ）の期待値（類似度）をＦ_e（ｘ）を用いて求め，得られた期待値に基づいて，そのカテゴリＣに対する識別関数値を定義する。この時，Ｆ_e（ｘ）の期待値は，図１４の領域８２の面積に対応し，次の式（２）で与えられる。
【００１３】
【数２】

【００１４】
そして，未知パターンの特徴ベクトルｘのあるカテゴリＣに対する識別関数値を，特徴空間上の点ｘに関し，パターン集合特有の差分分布を密度関数としたカテゴリの識別関数の期待値と定義したものである。計算の結果，具体的な識別関数Ψ_C（ｘ）は次の式（３）のようになる。
【００１５】
ｘ：文字パターンの特徴ベクトル（ｎ次元）
ｍ_C：カテゴリＣの平均ベクトル
Σ_C：カテゴリＣの共分散行列
Σ ：パターン集合の差分分布に関する共分散行列
【００１６】
【数３】

【００１７】
ここで，γ₁，γ₂，……，γ_Iは，Σ＋Σ_Cの上位の固有値であり，ｚ₁，ｚ₂，……，ｚ_Iはそれに対応するΣ＋Σ_Cの上位の固有ベクトルである。実際は，両者とも，Σ_CとΣの固有値の大きさが大きい上位の固有値・固有ベクトルを用いて求めた近似値を使用する。
【００１８】
【発明が解決しようとする課題】
上記の提案された方法を文書認識に適用するとき，差分分布を取得する必要がある。上記発明では認識対象文書がどのようなスキャナ等の入力機器を用い，いかなる解像度によって入力されたのかをユーザに指定してもらわなければならなかった。しかも，入力機器には，２値化のしきい値等の細かい設定があることや，オーバーヘッドリーダで画像入力するような場合，照明環境が画像の性質に大きく影響を及ぼすこと，等を考慮すると，入力機器や解像度を指定し，組み合わせだけでは十分な効果が期待できない。また，上記提案された方法では，一度認識を行って，認識結果から正解文字がどれなのかを推定し，差分分布を取得する手法も提案されているが，推定を失敗する可能性があるという問題があった。
【００１９】
本発明は上記問題を解決し，ユーザが独自の業務環境により細やかに適応した高精度文書認識を達成するために，ユーザがインタラクティブに認識辞書を自らの環境に合わせて簡単にカスタマイズできる認識辞書カスタマイズ装置，方法，プログラム及び記録媒体を提供することを目的とする。
【００２０】
【課題を解決するための手段】
本発明の原理はある環境における画像変形の傾向を差分分布として表し，それをファイルとして記憶し，その環境下で文書を認識するときは，そのファイルをもとに基本辞書を変形し，認識辞書として用いるというものである。
【００２１】
図１は本発明の原理構成を示す。図中，１０は画像を入力するスキャナ等の各種の機器の特性や，対象となる文字のフォントの種別等に応じた異なる様々な環境が存在する中の，一つのある環境における画像取得手段，１１は文字認識の基本的な機能として一般に使用される基本辞書を用いて文字認識を行う文字認識手段，１２は文字認識手段１１による認識結果を出力すると共に正しい結果が入力される入出力手段，１３は認識結果と修正結果との差分分布を算出してファイルに記憶する差分分布算出手段，１４は上記の画像取得手段１０の環境に対応（カスタマイズ）した認識辞書を生成するある環境における認識辞書生成手段，１５は認識辞書，１６は基本辞書，１７はファイルである。
【００２２】
ある環境における画像取得手段１０により認識対象となる文字を含む文書等の画像を入力する。その環境に対応して得られた文字の画像を文字認識手段１１が基本辞書１６を用いて認識を行い，この文字認識手段１１による文字認識の結果は入出力手段１２により出力される。出力された文字認識の結果を見てユーザが誤りを検出すると，誤って認識した部分（誤読部分）を修正した入力を入出力手段１２から行う。この修正入力を受けた差分分布算出手段１３において，入力画像における文字のパターン特徴ベクトルと修正入力された文字の平均ベクトルとのずれを表す差分分布（Σで表す）を計算し，ファイル１７として保存する。これにより完全な差分分布（Σ）の情報が得られる。この後，同じ環境のもとで文書を認識したい時には，保存したファイルを指定して，そのファイルと基本辞書１６から認識辞書１５を生成する。この時，基本辞書１６には各カテゴリ（各文字）の変動分布（Σ_C）の固有値・固有ベクトルが記されており，Σ＋Σ_Cの固有値・固有ベクトルの近似値を，Σ_C＋Σの上位の固有値・固有ベクトルだけを用いており，認識辞書１５とする。
【００２３】
図１に示すような各手段から成るパターン認識装置によれば，各環境における認識結果を修正した差分分布をファイルとすることで，基本辞書を修正することで，環境に対応した認識辞書を作成することで，各環境における認識率を向上することができる。
【００２４】
本発明の原理構成に示す各手段が備える各機能はコンピュータにより読み取り可能な記録媒体に記録されたプログラムにより実現することができる。
【００２５】
【発明の実施の形態】
本発明の実施の形態として，情報処理装置においてプログラムで実施する場合のフローチャートを示す。この実施例では，学習モードと認識モードに分けることができる。そして，学習モードは，辞書ファイルを初めて生成する学習モード１と，その後に辞書ファイルを追加する学習モード２に分けられる。
【００２６】
図２は学習モード１の処理フローであり，図７は学習モード１における辞書ファイル生成の処理フローである。
【００２７】
図２の学習モード１では，最初にユーザの業務環境をＡとする。これは入力機器，及びその入力機器の特性（解像度等）の設定が含まれ，場合によっては照明環境等の外部の状況を指すこともある。この環境Ａのもとで文書（画像）を入力する（図２のＳ１）。次のＳ２において，Ｓ１により入力した画像に対して，認識対象領域を設定し，文字認識する。文字認識は，基本辞書（その内部構成例を後述する図３に示す）を用いて行う。具体的には，入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとをユークリッド距離あるいは，シティブロック距離で測るか，または擬似ベイズ識別で行う。擬似ベイズ識別には，基本辞書に記された各カスタマイズの分布に関する固有値・固有ベクトルを用いる。基本辞書の内部構成例は図３に示され，カテゴリ名（文字の名前）に続いて平均ベクトル（ｎ次元），固有値，固有ベクトル（ｎ次元），……，固有値，固有ベクトル（ｎ次元）がｋ個配置されている。
【００２８】
次に，Ｓ２で得られた認識結果を出力（表示装置の画面に表示）する（図２のＳ３）。この認識結果の出力に対して，修正指示の入力が発生したか判別し（図２のＳ４），修正がない場合はＳ１１へ移行するが，修正指示がある場合，その修正が統合指示であるか判別する（同Ｓ５）。統合指示の場合は，統合処理を行って（図３のＳ６），Ｓ１１に移行し，統合指示でない場合は，分割指示であるか判別する（同Ｓ７）。分割指示の場合は，分割を行って（同Ｓ８），Ｓ１１に移行する。修正指示として別文字入力指示が検出されると（図３のＳ９），別文字を入力の処理を行い（同Ｓ１０），次いで，修正を含む認識結果から辞書ファイル（その内部構成例を後述する図８に示す）Ａを生成して保存する（同Ｓ１１）。この辞書ファイルＡは環境Ａに対応する。なお，この認識結果を修正した結果に基づく辞書ファイルの生成の処理は後述する図７に示す。
【００２９】
上記図２のＳ４乃至Ｓ１０の修正指示による修正処理で，正しい切り出し位置と文字コードを取得する。修正は，認識結果の中から誤りを見つけ，統合処理，分割処理，別の文字入力処理を繰り返して行うことによりなされるが，修正の各処理の具体例を以下に図４乃至図６を用いて説明する。
【００３０】
図４は統合処理の例である。この例では，“桜”という入力パターンに対し，切り出しを誤り，認識結果が「木」「妥」という２つの文字になった例である。この時，認識結果画面の「木妥」を選択し，統合処理を実行させる。統合処理では，「木妥」に相当する画像部分を再度文字認識する。その結果，“桜”という正しい結果が得られる。
【００３１】
図５は分離処理の例である。この例では，“制度”という入力パターンに対し，２文字を１文字と誤り，認識結果が“般”であった例である。この場合，認識結果画面の“般”を選択し，分離処理を実行させる。分離処理では，“般”に相当する画像部分をユーザに表示する。ユーザが分離箇所を指定すると，分離箇所で切り出した部分をそれぞれ文字認識する。その結果，“制度”という正しい結果が得られる。
【００３２】
図６は別の文字入力処理の例である。この例では，“士”という入力パターンに対し，認識を誤り，認識結果が“土”であった例である。このとき，認識結果画面の“士”を選択し，文字入力処理を実行させる。文字入力処理では，文字入力ウィンドウを表示し，ユーザによる正しい文字入力を検出する。
【００３３】
上記図２のＳ１１において実行される辞書ファイルの生成の詳細を図７を用いて説明する。図７は辞書ファイル生成の処理フローであり，最初に認識結果の切り出し位置をもとに１文字毎に特徴抽出を行い，その特徴ベクトルと認識結果の正解カテゴリの平均ベクトルとの差分を計算する（図７のＳ１）。次に全ての文字の差分ベクトルから自己相関行列を計算する（図７のＳ２），続いて，その自己相関行列の上位ｍ個の固有値・固有ベクトルを計算する（同Ｓ３）。そして，自己相関行列とｍ個の固有値・固有ベクトルを辞書ファイルとして保存する（図７のＳ４）。
【００３４】
図８は辞書ファイルの内部構成例であり，文字毎に上記図７に示す処理フローにより得られた自己相関行列とｍ個の固有値・固有ベクトル（ｎ次元）とが格納される。
【００３５】
上記の図２及び図７の処理フローにより，学習モード１により辞書ファイルを初めて作成することができる。こうして辞書ファイルが作成された後に，辞書ファイルの内容を追加する場合を学習モード２とする。
【００３６】
図９は学習モード２の処理フローであり，ユーザの業務環境をＡとし，これに関する辞書ファイルがあるものとし，その辞書ファイルをＡ．ｄｉｃと呼ぶ。
【００３７】
最初に環境Ａのもとで，文書の画像を入力する（図９のＳ１）。入力した画像に対して，認識対象領域を設定し，文字認識する（図９のＳ２）。文字認識は，上記図３に示した基本辞書を用いて行う。具体的には，入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとをユークリッド距離あるいはシティブロック距離で測るか，または擬似ベイズ識別で行っても良い。その際には，各カスタマイズの分布に関する固有値・固有ベクトルを用いる。この文字認識の結果を出力して，修正を指示する入力に応じて図９では図示省略されているが上記図２のＳ３〜Ｓ１０と同様の処理により，認識結果が修正されると，正しい切り出し位置と文字コードを取得する（図９のＳ３）。修正は，認識結果の中から誤りを見つけ，統合処理，分割処理，別の文字入力処理を繰り返し行うことにより実現される。こうして修正された認識結果から，辞書ファイルを更新しＡ．ｄｉｃに追加（上書き）して保存する（図９のＳ４）。この辞書ファイルの更新処理の詳細は図１０に示す。
【００３８】
図１０は辞書ファイル更新の処理フローを示す。認識結果の切り出し位置にもとづいて１文字毎に特徴抽出を行い，その特徴ベクトルと認識結果の正解カテゴリの平均ベクトルとの差分を計算する（図１０のＳ１）。次に，すべての文字の差分ベクトルから自己相関行列を計算する（図１０のＳ２）。続いて，この自己相関行列と辞書ファイルＡ．ｄｉｃに記録されている自己相関行列との和を計算する（図１０のＳ３）。こうして，和が計算された自己相関行列の上位ｍ個の固有値・固有ベクトルを計算する（図１０のＳ４）。自己相関行列とｍ個の固有値・固有ベクトルを辞書ファイルとして保存する。
【００３９】
図１１は認識モードの処理フローである。ユーザの業務環境をＡとし，これに関する辞書ファイルが存在するものとし，それを辞書ファイルＡ．ｄｉｃとする。最初に，環境Ａのもとで画像を入力する（図１１のＳ１）。辞書ファイルとして同じ環境のＡ．ｄｉｃを指定し（図１１のＳ２），辞書を生成する（同Ｓ３）。このとき，各カテゴリの変動分布の固有値・固有ベクトルが記されている擬似ベイズ識別の辞書がロードされているとして，カテゴリ毎に，カテゴリの変動分布の固有値・固有ベクトルと辞書ファイルＡ．ｄｉｃに記されている差分分布の固有値・固有ベクトルから，上記の本発明の発明者により先に提案された上記方法を用いて，Σ＋Σ_Cの固有値・固有ベクトルの近似値を計算し，それを記録して，認識辞書とする。次いで，上記Ｓ１で入力した画像に対して，認識対象領域を設定し（図１１のＳ４），文字認識を行う（同Ｓ５）。
【００４０】
図１２は本発明が実施される情報処理装置（コンピュータ）の構成例を示し，図中，２０はＣＰＵ，２１はデータやプログラムを格納するメモリ，２２はハードディスク，２３はキーボードやマウス等の入力装置，２４はディスプレイ等の出力装置，２５は紙の上に印刷または記入された文字やパターンを読み取るスキャナ，２６はプログラムやデータを記録したＣＤＲＯＭを読み取るためのＣＤＲＯＭ装置，２７はプログラムやデータを記録または読み取るためのフレキシブルディスクを駆動するフレキシブルディスク装置，２８は外部のコンピュータ等とデータを送受信するための通信装置を表す。
【００４１】
学習モードでは，スキャナ２５（図１の画像取得部１０に対応）が認識の対象となる文書を読み取ってメモリ２１に格納する。読取った画像について文字認識を行うメモリ２１上のプログラム及びハードディスク２２に格納された辞書を用いて文字認識が行われ，認識結果は出力装置２４に出力され，この認識結果に誤りがあった場合，利用者により修正を指示する入力が入力装置２３から入力される。この修正指示の内容に応じてプログラムにより修正処理とファイル辞書の生成が行われる。学習モードだけでなく認識モードの処理も同様に情報処理装置のプログラムにより実行される。また，プログラムはＣＤＲＯＭ装置２６，フレキシブルディスク装置２７へのＣＤＲＯＭやフレキシブルディスク等の記録媒体に記録されたり，通信装置２８を介して遠隔の端末等の装置から転送されてメモリ２１にロードして実行することができる。
【００４２】
（付記１）パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識装置において，
文字入力機器の特性や，文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行う文字認識手段と，前記認識結果を出力すると共に，認識結果を修正する入力が行われる入出力手段と，前記修正結果から１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存する差分分布算出手段と，前記と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する認識辞書生成手段と，を備えることを特徴とする認識辞書カスタマイズ装置。
【００４３】
（付記２）付記１において，前記文字認識手段は，カテゴリ毎に複数個の平均ベクトルと固有値・固有ベクトルとからなる基本辞書を用い，認識対象文字の入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとの距離または擬似ベイズ識別の何れかで行うことを特徴とする認識辞書カスタマイズ装置。
【００４４】
（付記３）付記１において，前記差分分布算出手段は，前記識別結果を修正する入力として，複数に分離した文字として認識した結果を統合させる指示か，複数の文字を１つの文字として認識した結果を分離させる指示か，異なる文字として誤って認識した結果を正すための別文字の入力の指示か，等の指示の何れかにより応じて，正しい切り出し位置と文字コードとからなる認識結果を得ることを特徴とする認識辞書カスタマイズ装置。
【００４５】
（付記４）付記１において，前記ある環境に適応した辞書ファイルには，１文字毎に差分ベクトルを計算して自己相関行列を計算し，該自己相関行列の上位の一定個数の固有値・固有ベクトルを計算して，それぞれの計算結果が保存されることを特徴とする認識辞書カスタマイズ装置。
【００４６】
（付記５）付記１において，前記各環境に適応した辞書ファイルの中から現在の環境を指定することで認識のための辞書ファイルから現在の環境に適応した辞書を生成する手段と，生成された辞書を用いて入力画像に対して認識対象領域を設定して文字認識を行うことを特徴とする認識辞書カスタマイズ装置。
【００４７】
（付記６）パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において，文字入力機器の特性や，文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，前記出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
【００４８】
（付記７）パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において，
文字入力機器の特性や，文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，前記出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
【００４９】
（付記８）パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて，文字入力機器の特性や，文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラム。
【００５０】
（付記９）パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて，文字入力機器の特性や，文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，前記と同じある環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する機能を備えたプログラムを格納したコンピュータ読み取り可能な記録媒体。
【００５１】
【発明の効果】
本発明によれば，ユーザがインタラクティブに認識辞書を自らの環境に合わせ簡単にカスタマイズできるようになり，ユーザ独自の業務環境に，より細やかに適応した高精度の文字認識が可能となる。
【図面の簡単な説明】
【図１】本発明の原理構成を示す図である。
【図２】学習モード１の処理フローを示す図である。
【図３】基本辞書の内部構成例を示す図である。
【図４】統合処理の例を示す図である。
【図５】分離処理の例を示す図である。
【図６】別の文字入力処理の例を示す図である。
【図７】学習モード１における辞書ファイル生成の処理フローを示す図である。
【図８】辞書ファイルの内部構成例を示す図である。
【図９】学習モード２の処理フローを示す図である。
【図１０】辞書ファイル更新の処理フローを示す図である。
【図１１】認識モードの処理フローを示す図である。
【図１２】本発明が実施される情報処理装置（コンピュータ）の構成例を示す図である。
【図１３】提案された方法の原理を示す図である。
【図１４】提案された方法による識別関数値の生成を示す図である。
【符号の説明】
１０画像取得手段
１１文字認識手段
１２入出力手段
１３差分分布算出手段
１４認識辞書生成手段
１５認識辞書
１６基本辞書
１７ファイル

Claims

パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識装置において，
文字入力機器の特性や，文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行う文字認識手段と，
前記認識結果を出力すると共に，認識結果を修正する入力が行われる入出力手段と，
前記修正結果から１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存する差分分布算出手段と，
前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する認識辞書生成手段と，
を備えることを特徴とする認識辞書カスタマイズ装置。
パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において，
文字入力機器の特性や，文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，
前記出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，
前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて，
文字入力機器の特性や，文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，前記画像取得時と同じある環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラム。
パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて，
文字入力機器の特性や，文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し，出力された認識結果を修正する入力に基づいて１文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し，全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し，前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラムを格納したコンピュータ読み取り可能な記録媒体。