JP3958954B2 - 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体 - Google Patents

認識辞書カスタマイズ装置,方法,プログラム及び記録媒体 Download PDF

Info

Publication number
JP3958954B2
JP3958954B2 JP2001349864A JP2001349864A JP3958954B2 JP 3958954 B2 JP3958954 B2 JP 3958954B2 JP 2001349864 A JP2001349864 A JP 2001349864A JP 2001349864 A JP2001349864 A JP 2001349864A JP 3958954 B2 JP3958954 B2 JP 3958954B2
Authority
JP
Japan
Prior art keywords
recognition
character
dictionary
category
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001349864A
Other languages
English (en)
Other versions
JP2003150905A (ja
Inventor
浩明 武部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001349864A priority Critical patent/JP3958954B2/ja
Publication of JP2003150905A publication Critical patent/JP2003150905A/ja
Application granted granted Critical
Publication of JP3958954B2 publication Critical patent/JP3958954B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は認識辞書カスタマイズ装置,方法,プログラム及び記録媒体に関する。
【0002】
本発明の発明者により先に文字等のパターンを認識する装置及び方法について提案をしたが,認識のための基本辞書を固有値・固有ベクトルを修正することで認識率を向上する必要がある。
【0003】
【従来の技術】
従来の文字認識における代表的な識別方法に次のような方法がある。
【0004】
入力された文字パターンを二値画像に変換し,メッシュ状に区切って,各メッシュ中の2値のパターンの方向成分(ベクトル)を識別し,全メッシュの成分を決められた計算により数値の組,すなわちベクトルとして特徴を抽出する。特徴抽出によって入力文字パターンは,特徴ベクトル空間内の点に写像される。この入力パターンの特徴ベクトルと,ベクトル空間における各カテゴリ(各文字)の代表点との距離を計算し,最も近いカテゴリを認識結果とする。ここで,ベクトル空間における各カテゴリの代表点は,カテゴリ毎に用意された標本パターン特徴ベクトルのベクトル空間における平均であり。距離尺度としては,シティブロック距離,ユークリッド距離等が用いられる。
【0005】
一方,文字認識における有力な識別方法として擬似ベイズ識別手法がある。これは,識別においてシティブロック距離やユークリッド距離を用いるのではなく,特徴ベクトル空間における各カテゴリの分布を識別に反映させる点に特徴を持つ。これにより,文字パターンの変形に対し柔軟な識別が可能となる。また,この手法は,共分散行列の固有ベクトルが高次になるほど推定誤差が大きくなること,及び膨大な計算量や記憶容量が必要になること等の問題を解決している。以下,具体的な擬似ベイズ識別関数gC (x) は次の式(1)となる。
【0006】
αC i :共分散行列ΣC のi番目の固有値
C i :ΣC のi番目の固有値に対応する固有ベクトル
k :1以上n以下の整数
【0007】
【数1】
Figure 0003958954
【0008】
しかし,擬似ベイズ識別でも,最も標準的なフォントである明朝体に比べて変形の強いフォントや,入出力状況に応じて劣化の激しい文書における文字の認識精度は良くない。また,当然に,変形の強いフォントでしかも劣化が加わると,認識精度は更に低下する。これらの問題に対し,本発明の発明者は,従来の擬似ベイズ識別関数に,フォント特有のまたは劣化の変形特有の情報を付加する方法を用いた『確率密度関数を用いたパターン認識装置および方法』として提案した(特願2001−22666)。
【0009】
その提案された認識方法の原理を図13に示す。このパターン認識の構成では,計算手段80と認識手段81を備え,パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行う。計算手段80はあるパターン集合について,各パターンの特徴ベクトルを各正解カテゴリの平均特徴ベクトルとの差分をとることで,差分ベクトルの集合が生成され,その差分ベクトルの集合の自己相関行列を共分散行列とし,未知パターンの特徴ベクトルを平均とするような正規分布,確率密度関数として用いて,あるカテゴリの確率密度の期待値が定義され,その期待値に基づいてそのカテゴリの識別関数が定義されたとき,前記未知パターンの特徴ベクトルに対するその識別関数の値を計算する。識別手段81は,その識別関数の値にもとづいて前記未知パターンの認識を行い認識結果を出力する。
【0010】
差分ベクトルの集合は,パターン集合特有の差分分布を表していると考えられ,その自己相関行列は差分分布の情報を含んでいる。この自己相関行列を共分散行列とする正規分布を確率密度関数として用いることにより,差分分布の情報を反映した期待値が生成される。従って,この期待値に基づいて定義された識別関数は,パターン集合特有の特徴を反映している。
【0011】
計算手段80は未知パターンの特徴ベクトルに対するこの識別関数の値を計算し,計算結果を認識手段81に出力する。認識手段81は受け取った識別関数の値に基づいて未知パターンのカテゴリを判定し,判定結果を出力する。このようなパターン認識装置によれば,パターン集合と同様の特徴をもつ未知パターンに対して,より高精度な認識処理を行うことができる。例えば,変形の強いフォントの文字パターンの集合から差分ベクトルの集合を生成すれば,そのフォントの未知パターンの認識精度が向上し,劣化の激しい文書における文字パターンの集合から差分ベクトルの集合を生成すれば,同じような劣化が見られる未知パターンの認識精度が向上する。
【0012】
図14は提案された方法による識別関数値の生成を示し,未知パターンの特徴ベクトルxが与えられたとき,特徴ベクトル空間内の点xに関して,上記のパターン集合特有の差分分布(誤差分布)を確率密度関数Fe (x)とする。そして,あるカテゴリCの識別関数の確率密度関数をFC (x)として,FC (x)の期待値(類似度)をFe (x)を用いて求め,得られた期待値に基づいて,そのカテゴリCに対する識別関数値を定義する。この時,Fe (x)の期待値は,図14の領域82の面積に対応し,次の式(2)で与えられる。
【0013】
【数2】
Figure 0003958954
【0014】
そして,未知パターンの特徴ベクトルxのあるカテゴリCに対する識別関数値を,特徴空間上の点xに関し,パターン集合特有の差分分布を密度関数としたカテゴリの識別関数の期待値と定義したものである。計算の結果,具体的な識別関数ΨC (x)は次の式(3)のようになる。
【0015】
x :文字パターンの特徴ベクトル(n次元)
C :カテゴリCの平均ベクトル
ΣC :カテゴリCの共分散行列
Σ :パターン集合の差分分布に関する共分散行列
【0016】
【数3】
Figure 0003958954
【0017】
ここで,γ1 ,γ2 ,……,γI は,Σ+ΣC の上位の固有値であり,z1 ,z2 ,……,zI はそれに対応するΣ+ΣC の上位の固有ベクトルである。実際は,両者とも,ΣC とΣの固有値の大きさが大きい上位の固有値・固有ベクトルを用いて求めた近似値を使用する。
【0018】
【発明が解決しようとする課題】
上記の提案された方法を文書認識に適用するとき,差分分布を取得する必要がある。上記発明では認識対象文書がどのようなスキャナ等の入力機器を用い,いかなる解像度によって入力されたのかをユーザに指定してもらわなければならなかった。しかも,入力機器には,2値化のしきい値等の細かい設定があることや,オーバーヘッドリーダで画像入力するような場合,照明環境が画像の性質に大きく影響を及ぼすこと,等を考慮すると,入力機器や解像度を指定し,組み合わせだけでは十分な効果が期待できない。また,上記提案された方法では,一度認識を行って,認識結果から正解文字がどれなのかを推定し,差分分布を取得する手法も提案されているが,推定を失敗する可能性があるという問題があった。
【0019】
本発明は上記問題を解決し,ユーザが独自の業務環境により細やかに適応した高精度文書認識を達成するために,ユーザがインタラクティブに認識辞書を自らの環境に合わせて簡単にカスタマイズできる認識辞書カスタマイズ装置,方法,プログラム及び記録媒体を提供することを目的とする。
【0020】
【課題を解決するための手段】
本発明の原理はある環境における画像変形の傾向を差分分布として表し,それをファイルとして記憶し,その環境下で文書を認識するときは,そのファイルをもとに基本辞書を変形し,認識辞書として用いるというものである。
【0021】
図1は本発明の原理構成を示す。図中,10は画像を入力するスキャナ等の各種の機器の特性や,対象となる文字のフォントの種別等に応じた異なる様々な環境が存在する中の,一つのある環境における画像取得手段,11は文字認識の基本的な機能として一般に使用される基本辞書を用いて文字認識を行う文字認識手段,12は文字認識手段11による認識結果を出力すると共に正しい結果が入力される入出力手段,13は認識結果と修正結果との差分分布を算出してファイルに記憶する差分分布算出手段,14は上記の画像取得手段10の環境に対応(カスタマイズ)した認識辞書を生成するある環境における認識辞書生成手段,15は認識辞書,16は基本辞書,17はファイルである。
【0022】
ある環境における画像取得手段10により認識対象となる文字を含む文書等の画像を入力する。その環境に対応して得られた文字の画像を文字認識手段11が基本辞書16を用いて認識を行い,この文字認識手段11による文字認識の結果は入出力手段12により出力される。出力された文字認識の結果を見てユーザが誤りを検出すると,誤って認識した部分(誤読部分)を修正した入力を入出力手段12から行う。この修正入力を受けた差分分布算出手段13において,入力画像における文字のパターン特徴ベクトルと修正入力された文字の平均ベクトルとのずれを表す差分分布(Σで表す)を計算し,ファイル17として保存する。これにより完全な差分分布(Σ)の情報が得られる。この後,同じ環境のもとで文書を認識したい時には,保存したファイルを指定して,そのファイルと基本辞書16から認識辞書15を生成する。この時,基本辞書16には各カテゴリ(各文字)の変動分布(ΣC )の固有値・固有ベクトルが記されており,Σ+ΣC の固有値・固有ベクトルの近似値を,ΣC +Σの上位の固有値・固有ベクトルだけを用いており,認識辞書15とする。
【0023】
図1に示すような各手段から成るパターン認識装置によれば,各環境における認識結果を修正した差分分布をファイルとすることで,基本辞書を修正することで,環境に対応した認識辞書を作成することで,各環境における認識率を向上することができる。
【0024】
本発明の原理構成に示す各手段が備える各機能はコンピュータにより読み取り可能な記録媒体に記録されたプログラムにより実現することができる。
【0025】
【発明の実施の形態】
本発明の実施の形態として,情報処理装置においてプログラムで実施する場合のフローチャートを示す。この実施例では,学習モードと認識モードに分けることができる。そして,学習モードは,辞書ファイルを初めて生成する学習モード1と,その後に辞書ファイルを追加する学習モード2に分けられる。
【0026】
図2は学習モード1の処理フローであり,図7は学習モード1における辞書ファイル生成の処理フローである。
【0027】
図2の学習モード1では,最初にユーザの業務環境をAとする。これは入力機器,及びその入力機器の特性(解像度等)の設定が含まれ,場合によっては照明環境等の外部の状況を指すこともある。この環境Aのもとで文書(画像)を入力する(図2のS1)。次のS2において,S1により入力した画像に対して,認識対象領域を設定し,文字認識する。文字認識は,基本辞書(その内部構成例を後述する図3に示す)を用いて行う。具体的には,入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとをユークリッド距離あるいは,シティブロック距離で測るか,または擬似ベイズ識別で行う。擬似ベイズ識別には,基本辞書に記された各カスタマイズの分布に関する固有値・固有ベクトルを用いる。基本辞書の内部構成例は図3に示され,カテゴリ名(文字の名前)に続いて平均ベクトル(n次元),固有値,固有ベクトル(n次元),……,固有値,固有ベクトル(n次元)がk個配置されている。
【0028】
次に,S2で得られた認識結果を出力(表示装置の画面に表示)する(図2のS3)。この認識結果の出力に対して,修正指示の入力が発生したか判別し(図2のS4),修正がない場合はS11へ移行するが,修正指示がある場合,その修正が統合指示であるか判別する(同S5)。統合指示の場合は,統合処理を行って(図3のS6),S11に移行し,統合指示でない場合は,分割指示であるか判別する(同S7)。分割指示の場合は,分割を行って(同S8),S11に移行する。修正指示として別文字入力指示が検出されると(図3のS9),別文字を入力の処理を行い(同S10),次いで,修正を含む認識結果から辞書ファイル(その内部構成例を後述する図8に示す)Aを生成して保存する(同S11)。この辞書ファイルAは環境Aに対応する。なお,この認識結果を修正した結果に基づく辞書ファイルの生成の処理は後述する図7に示す。
【0029】
上記図2のS4乃至S10の修正指示による修正処理で,正しい切り出し位置と文字コードを取得する。修正は,認識結果の中から誤りを見つけ,統合処理,分割処理,別の文字入力処理を繰り返して行うことによりなされるが,修正の各処理の具体例を以下に図4乃至図6を用いて説明する。
【0030】
図4は統合処理の例である。この例では,“桜”という入力パターンに対し,切り出しを誤り,認識結果が「木」「妥」という2つの文字になった例である。この時,認識結果画面の「木妥」を選択し,統合処理を実行させる。統合処理では,「木妥」に相当する画像部分を再度文字認識する。その結果,“桜”という正しい結果が得られる。
【0031】
図5は分離処理の例である。この例では,“制度”という入力パターンに対し,2文字を1文字と誤り,認識結果が“般”であった例である。この場合,認識結果画面の“般”を選択し,分離処理を実行させる。分離処理では,“般”に相当する画像部分をユーザに表示する。ユーザが分離箇所を指定すると,分離箇所で切り出した部分をそれぞれ文字認識する。その結果,“制度”という正しい結果が得られる。
【0032】
図6は別の文字入力処理の例である。この例では,“士”という入力パターンに対し,認識を誤り,認識結果が“土”であった例である。このとき,認識結果画面の“士”を選択し,文字入力処理を実行させる。文字入力処理では,文字入力ウィンドウを表示し,ユーザによる正しい文字入力を検出する。
【0033】
上記図2のS11において実行される辞書ファイルの生成の詳細を図7を用いて説明する。図7は辞書ファイル生成の処理フローであり,最初に認識結果の切り出し位置をもとに1文字毎に特徴抽出を行い,その特徴ベクトルと認識結果の正解カテゴリの平均ベクトルとの差分を計算する(図7のS1)。次に全ての文字の差分ベクトルから自己相関行列を計算する(図7のS2),続いて,その自己相関行列の上位m個の固有値・固有ベクトルを計算する(同S3)。そして,自己相関行列とm個の固有値・固有ベクトルを辞書ファイルとして保存する(図7のS4)。
【0034】
図8は辞書ファイルの内部構成例であり,文字毎に上記図7に示す処理フローにより得られた自己相関行列とm個の固有値・固有ベクトル(n次元)とが格納される。
【0035】
上記の図2及び図7の処理フローにより,学習モード1により辞書ファイルを初めて作成することができる。こうして辞書ファイルが作成された後に,辞書ファイルの内容を追加する場合を学習モード2とする。
【0036】
図9は学習モード2の処理フローであり,ユーザの業務環境をAとし,これに関する辞書ファイルがあるものとし,その辞書ファイルをA.dicと呼ぶ。
【0037】
最初に環境Aのもとで,文書の画像を入力する(図9のS1)。入力した画像に対して,認識対象領域を設定し,文字認識する(図9のS2)。文字認識は,上記図3に示した基本辞書を用いて行う。具体的には,入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとをユークリッド距離あるいはシティブロック距離で測るか,または擬似ベイズ識別で行っても良い。その際には,各カスタマイズの分布に関する固有値・固有ベクトルを用いる。この文字認識の結果を出力して,修正を指示する入力に応じて図9では図示省略されているが上記図2のS3〜S10と同様の処理により,認識結果が修正されると,正しい切り出し位置と文字コードを取得する(図9のS3)。修正は,認識結果の中から誤りを見つけ,統合処理,分割処理,別の文字入力処理を繰り返し行うことにより実現される。こうして修正された認識結果から,辞書ファイルを更新しA.dicに追加(上書き)して保存する(図9のS4)。この辞書ファイルの更新処理の詳細は図10に示す。
【0038】
図10は辞書ファイル更新の処理フローを示す。認識結果の切り出し位置にもとづいて1文字毎に特徴抽出を行い,その特徴ベクトルと認識結果の正解カテゴリの平均ベクトルとの差分を計算する(図10のS1)。次に,すべての文字の差分ベクトルから自己相関行列を計算する(図10のS2)。続いて,この自己相関行列と辞書ファイルA.dicに記録されている自己相関行列との和を計算する(図10のS3)。こうして,和が計算された自己相関行列の上位m個の固有値・固有ベクトルを計算する(図10のS4)。自己相関行列とm個の固有値・固有ベクトルを辞書ファイルとして保存する。
【0039】
図11は認識モードの処理フローである。ユーザの業務環境をAとし,これに関する辞書ファイルが存在するものとし,それを辞書ファイルA.dicとする。最初に,環境Aのもとで画像を入力する(図11のS1)。辞書ファイルとして同じ環境のA.dicを指定し(図11のS2),辞書を生成する(同S3)。このとき,各カテゴリの変動分布の固有値・固有ベクトルが記されている擬似ベイズ識別の辞書がロードされているとして,カテゴリ毎に,カテゴリの変動分布の固有値・固有ベクトルと辞書ファイルA.dicに記されている差分分布の固有値・固有ベクトルから,上記の本発明の発明者により先に提案された上記方法を用いて,Σ+ΣC の固有値・固有ベクトルの近似値を計算し,それを記録して,認識辞書とする。次いで,上記S1で入力した画像に対して,認識対象領域を設定し(図11のS4),文字認識を行う(同S5)。
【0040】
図12は本発明が実施される情報処理装置(コンピュータ)の構成例を示し,図中,20はCPU,21はデータやプログラムを格納するメモリ,22はハードディスク,23はキーボードやマウス等の入力装置,24はディスプレイ等の出力装置,25は紙の上に印刷または記入された文字やパターンを読み取るスキャナ,26はプログラムやデータを記録したCDROMを読み取るためのCDROM装置,27はプログラムやデータを記録または読み取るためのフレキシブルディスクを駆動するフレキシブルディスク装置,28は外部のコンピュータ等とデータを送受信するための通信装置を表す。
【0041】
学習モードでは,スキャナ25(図1の画像取得部10に対応)が認識の対象となる文書を読み取ってメモリ21に格納する。読取った画像について文字認識を行うメモリ21上のプログラム及びハードディスク22に格納された辞書を用いて文字認識が行われ,認識結果は出力装置24に出力され,この認識結果に誤りがあった場合,利用者により修正を指示する入力が入力装置23から入力される。この修正指示の内容に応じてプログラムにより修正処理とファイル辞書の生成が行われる。学習モードだけでなく認識モードの処理も同様に情報処理装置のプログラムにより実行される。また,プログラムはCDROM装置26,フレキシブルディスク装置27へのCDROMやフレキシブルディスク等の記録媒体に記録されたり,通信装置28を介して遠隔の端末等の装置から転送されてメモリ21にロードして実行することができる。
【0042】
(付記1) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識装置において,
文字入力機器の特性や,文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行う文字認識手段と,前記認識結果を出力すると共に,認識結果を修正する入力が行われる入出力手段と,前記修正結果から1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存する差分分布算出手段と,前記と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する認識辞書生成手段と,を備えることを特徴とする認識辞書カスタマイズ装置。
【0043】
(付記2) 付記1において,前記文字認識手段は,カテゴリ毎に複数個の平均ベクトルと固有値・固有ベクトルとからなる基本辞書を用い,認識対象文字の入力パターンの特徴ベクトルと各カテゴリの平均ベクトルとの距離または擬似ベイズ識別の何れかで行うことを特徴とする認識辞書カスタマイズ装置。
【0044】
(付記3) 付記1において,前記差分分布算出手段は,前記識別結果を修正する入力として,複数に分離した文字として認識した結果を統合させる指示か,複数の文字を1つの文字として認識した結果を分離させる指示か,異なる文字として誤って認識した結果を正すための別文字の入力の指示か,等の指示の何れかにより応じて,正しい切り出し位置と文字コードとからなる認識結果を得ることを特徴とする認識辞書カスタマイズ装置。
【0045】
(付記4) 付記1において,前記ある環境に適応した辞書ファイルには,1文字毎に差分ベクトルを計算して自己相関行列を計算し,該自己相関行列の上位の一定個数の固有値・固有ベクトルを計算して,それぞれの計算結果が保存されることを特徴とする認識辞書カスタマイズ装置。
【0046】
(付記5) 付記1において,前記各環境に適応した辞書ファイルの中から現在の環境を指定することで認識のための辞書ファイルから現在の環境に適応した辞書を生成する手段と,生成された辞書を用いて入力画像に対して認識対象領域を設定して文字認識を行うことを特徴とする認識辞書カスタマイズ装置。
【0047】
(付記6) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において,文字入力機器の特性や,文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,前記出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
【0048】
(付記7) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において,
文字入力機器の特性や,文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,前記出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
【0049】
(付記8) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて,文字入力機器の特性や,文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラム。
【0050】
(付記9) パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて,文字入力機器の特性や,文字フォントの種別等に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,前記と同じある環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する機能を備えたプログラムを格納したコンピュータ読み取り可能な記録媒体。
【0051】
【発明の効果】
本発明によれば,ユーザがインタラクティブに認識辞書を自らの環境に合わせ簡単にカスタマイズできるようになり,ユーザ独自の業務環境に,より細やかに適応した高精度の文字認識が可能となる。
【図面の簡単な説明】
【図1】本発明の原理構成を示す図である。
【図2】学習モード1の処理フローを示す図である。
【図3】基本辞書の内部構成例を示す図である。
【図4】統合処理の例を示す図である。
【図5】分離処理の例を示す図である。
【図6】別の文字入力処理の例を示す図である。
【図7】学習モード1における辞書ファイル生成の処理フローを示す図である。
【図8】辞書ファイルの内部構成例を示す図である。
【図9】学習モード2の処理フローを示す図である。
【図10】辞書ファイル更新の処理フローを示す図である。
【図11】認識モードの処理フローを示す図である。
【図12】本発明が実施される情報処理装置(コンピュータ)の構成例を示す図である。
【図13】提案された方法の原理を示す図である。
【図14】提案された方法による識別関数値の生成を示す図である。
【符号の説明】
10 画像取得手段
11 文字認識手段
12 入出力手段
13 差分分布算出手段
14 認識辞書生成手段
15 認識辞書
16 基本辞書
17 ファイル

Claims (4)

  1. パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識装置において,
    文字入力機器の特性や,文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行う文字認識手段と,
    前記認識結果を出力すると共に,認識結果を修正する入力が行われる入出力手段と,
    前記修正結果から1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存する差分分布算出手段と,
    前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成する認識辞書生成手段と,
    を備えることを特徴とする認識辞書カスタマイズ装置。
  2. パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うパターン認識方法において,
    文字入力機器の特性や,文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,
    前記出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,
    前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記ある環境に適応した辞書ファイルを生成することを特徴とする認識辞書カスタマイズ方法。
  3. パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて,
    文字入力機器の特性や,文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,前記画像取得時と同じある環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラム。
  4. パターンの特徴ベクトル空間においてカテゴリ毎に定義された確率密度関数の値に基づいて認識を行うためのプログラムにおいて,
    文字入力機器の特性や,文字フォントの種別に対応したある環境において取得された画像に対して各カテゴリの基本的な特徴を格納した基本辞書を用いて文字認識を行って認識結果を出力し,出力された認識結果を修正する入力に基づいて1文字毎の特徴ベクトルと修正入力による正解カテゴリの平均ベクトルの差分を検出し,全体の差分ベクトルの集合から自己相関行列とその固有値・固有ベクトルを求めてファイルに保存し,前記画像取得時と同じ環境で文字認識する際に前記ファイルと前記基本辞書とから前記環境に適応した辞書ファイルを生成する機能を備えたプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2001349864A 2001-11-15 2001-11-15 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体 Expired - Fee Related JP3958954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001349864A JP3958954B2 (ja) 2001-11-15 2001-11-15 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001349864A JP3958954B2 (ja) 2001-11-15 2001-11-15 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2003150905A JP2003150905A (ja) 2003-05-23
JP3958954B2 true JP3958954B2 (ja) 2007-08-15

Family

ID=19162471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001349864A Expired - Fee Related JP3958954B2 (ja) 2001-11-15 2001-11-15 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3958954B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6490852B1 (ja) * 2018-03-09 2019-03-27 株式会社東芝 不読判定閾値設定方法及び不読判定閾値設定装置

Also Published As

Publication number Publication date
JP2003150905A (ja) 2003-05-23

Similar Documents

Publication Publication Date Title
US5675665A (en) System and method for word recognition using size and placement models
US7885464B2 (en) Apparatus, method, and program for handwriting recognition
US8019160B2 (en) Method of modifying classification scheme for hand-written characters
CN111401099B (zh) 文本识别方法、装置以及存储介质
KR100412317B1 (ko) 문자인식/수정방법및장치
US8755604B1 (en) Using shape similarity methods to improve OCR speed and accuracy
US10963717B1 (en) Auto-correction of pattern defined strings
CN110942057A (zh) 一种集装箱箱号识别方法、装置和计算机设备
JP4393720B2 (ja) パターン認識装置および方法
EP1661067A1 (en) Greedy support vector machine classification for feature selection applied to the nodule detection problem
US8208685B2 (en) Word recognition method and word recognition program
KR20000071094A (ko) 패턴 인식 방법 및 장치
CN114637877A (zh) 标注方法、电子设备及存储介质
JP3099797B2 (ja) 文字認識装置
JP3958954B2 (ja) 認識辞書カスタマイズ装置,方法,プログラム及び記録媒体
JP2009276937A (ja) 辞書作成装置、認識装置、認識方法及び認識プログラム
CN115688166A (zh) 信息脱敏处理方法、装置、计算机设备及可读存储介质
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP3428512B2 (ja) 文字認識装置およびコンピュータ可読記録媒体
JP2000090117A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
US20230419712A1 (en) Image processing apparatus, image processing method, and storage medium
US20230045871A1 (en) Character recognition method, computer program product with stored program and computer readable medium with stored program
US20230005282A1 (en) Information processing apparatus, information processing method, computer program product, and recording medium
JP2592756B2 (ja) 文字切り出し装置およびこれを用いた文字認識装置
JPH1027217A (ja) フォント種別識別方法、フォント種別識別装置、フォン ト種別の識別プログラムを記録した記録媒体、手書きフォント生成方法、手書きフォント生成装置、文字生成装置、及び手書きフォント生成プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140518

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees