JP4280355B2

JP4280355B2 - 文字認識装置

Info

Publication number: JP4280355B2
Application number: JP12605399A
Authority: JP
Inventors: 保直伊崎; 英夫鎌田; 俊司坂根; 克美井出
Original assignee: Fujitsu Ltd; Fujitsu Frontech Ltd
Current assignee: Fujitsu Ltd; Fujitsu Frontech Ltd
Priority date: 1999-05-06
Filing date: 1999-05-06
Publication date: 2009-06-17
Anticipated expiration: 2019-05-06
Also published as: CN1273401A; JP2000315247A; KR20000075420A; CN1181446C; KR100582039B1

Description

【０００１】
【発明の属する技術分野】
本発明は、入力された文字画像を文字として認識する文字認識装置に関する。
【０００２】
【従来の技術】
従来、入力された文字画像を文字として認識する文字認識装置の分野において、例えばＯＣＲ（光学式文字読取装置）やイメージスキャナとＯＣＲソフトとを組み合わせた文字認識装置などが広い業務分野で用いられている。従来のＯＣＲ用帳票では、一文字ずつの文字記入枠が印刷された帳票が用いられ、漢字を用いるシステムでは文字記入枠の大きさも漢字が記入しやすいよう大きな文字記入枠が採用されている。このようにすることによりＯＣＲにとっては記入された文字を正確に認識しやすくなり、また記入者に対して隣の文字と接触しないように記入することを促す効果がある。
【０００３】
しかし、ＯＣＲの利用分野が一層広まるに従って、一般に使用される通常の帳票のような小さな帳票を用い文字枠にとらわれずに記入された文字列、すなわち、通常の伝票などに不規則な文字間隔、不規則な記入方法で記入された隣接する文字どうしが接触し合うような低品質の手書きの文字列についても実用になる認識精度で認識することが可能な文字認識装置が求められている。
【０００４】
また、印刷された文字列の場合は、ＯＣＲ−Ｂあるいはマルチフォントなどのように複数の特定の文字フォントだけを用いて注意深く印刷されたＯＣＲ帳票が使用されているが、印刷された文字列についても、不特定のプリンタにより多様な文字ピッチで印刷された、多様な変形のある文字列、例えば、文字ピッチが狭いプリンタやプロポーショナルピッチで印刷された文字列、あるいは半角文字と全角文字が混在する文字列などから実用になる認識精度で文字列を切り出すことのできる文字認識装置が要望されている。
【０００５】
【発明が解決しようとする課題】
従来の文字認識装置における文字切出し方式、特にフリーピッチの文字列、すなわち文字枠が設定されていないフィールドからの文字切出し方式では、孤立した黒画素の連結領域について文字列の高さ情報を求め、その高さ情報から文字のピッチ情報を求め、その値により隣り合う文字を統合しあるいは分離して認識対象とすべき一文字を切り出す方式が採用されている。あるいは１行、１フィールドの文字列を行方向、フィールド方向に垂直な方向へ投影しておき、文字列の高さ情報から文字のピッチ情報を求め、その値により投影ヒストグラムから文字位置を切り出していく方式を採用したものもある。その切出しが一通りに決まらない場合には複数通りの切出し位置を求めることも行われている。
【０００６】
通常、不特定多数の筆記者により予め決められた書式に従って記入された文字を収集し、これらの文字から認識方式に依存する文字パターンの特徴を抽出し統計的な手法などにより標準パターンが作成される。また、標準パターンは、収集された文字から平均パターンとして作成されることもある。手書き文字の場合には、記入者により大きな字形変形が生じるため各字種について複数の標準パターンが作成される。通常一つの標準パターンをテンプレートとよび、複数の標準パターンを集めた辞書を複数テンプレート辞書と呼ぶ。辞書照合方法としては、入力帳票から切り出された一文字からその文字パターンの特徴を抽出し、この特徴と標準パターン辞書のテンプレートの特徴との間で類似度計算あるいは距離計算を行い、最大の類似度を持つカテゴリあるいは最小の距離を持つテンプレートのカテゴリを認識結果として求める方法が採用されている。侯補文字列としては、距離の小さい順に例えば８位までを侯補文字列としている。
【０００７】
印刷文字に関しても同様な方法で候補文字列が求められる。複数通りの侯補がある場合はパターンどうしの類似度評価値により、あるいは知識処理などの言語処理により最良の切出し候補を決定する方法が採用されている。
【０００８】
一般に、通常の伝票に手書き記入する場合のようにフリーピッチで記入された文字列、あるいは不特定のプリンタで印刷された文字列を認識する場合に、隣接する文字どうしが接触することが多く、また、印刷文字列の場合は半角文字と全角文字が混在することがあり、隣り合う文字どうしが接触することが多いため、一文字ずつ検出して認識する方法では、どの範囲までが一文字かを判断するのが困難であり、実用に耐える認識精度を実現することは難しい。ひらがな、カタカナ、および漢字では偏（へん）と旁（つくり）のように、もともと分離した文字領域からなる文字もあり、これらの文字領域が正しく認識できなければ何文字記入してあるのかさえ判断できない場合もある。
【０００９】
印刷文字列の文字切出しでは、１行の文字列から個々の文字のピッチを推定する方法として次のような種々の方法が提案されている。
【００１０】
第１の方法は、１行の文字列の黒画素を行方向に投影して行を構成する文字の平均高さを求める。次に、文字列の黒画素を行方向に垂直な方向に投影して黒画素の行方向の頻度をヒストグラムとして表しそのヒストグラムから頻度が０の位置、すなわち文字列が途切れている位置、あるいはヒストグラムの極小点、すなわち接触文字または重なり文字を切り離すべき切断候補位置を求める。この切断候補位置に基づき、先に求めた文字列の平均高さから全角文字、半角文字の列として妥当と見られる位置を文字切出し位置とする。
【００１１】
第２の方法は、１行の文字列の黒画素を行方向に垂直な方向に投影して黒画素の行方向の頻度をヒストグラムとして表しそのヒストグラムから頻度が０の位置、あるいはヒストグラムの極小点を求め、文字切出し位置と推定される位置をその文字列に対して複数通り求める。複数通りの文字切出位置のうちのいずれが尤もらしい文字切出位置であるかの判定は、文字列の類似度評価値と認識結果からの判断にゆだねる。
【００１２】
第３の方法は、１行の文字列について黒画素の連結領域を求め、連結領域の並びについて小さな領域どうしは統合し、大きな領域は複数に分離して一文字の領域を決めて文字切出しを行なう。その際の小さい領域、大きい領域の判断は文字列の高さを基準にして行う。
【００１３】
しかし、上記のいずれの方法にもそれぞれ次のような問題がある。すなわち、第１の方法においては、１行の文字列が全て全角文字で構成されている場合には、全角文字は文字幅と文字高さが全て等しいと考えられるので平均文字高さから文字幅を正確に推定することができ、従って、一文字ずつ正確に切り出すことができるが、半角文字と全角文字が混在している場合、例えば全角の仮名交じり漢字文字列に半角の英数字あるいはカタカナが混入している場合には、文字位置が半角分だけずれたり、半角２文字が一文字分に認識されることがあり、正しい文字切出位置が求められないことがある。
【００１４】
また、第２の方法では、１行の文字列に対して複数通りの切出し結果が得られるため１行の認識処理に複数行分の処理時間がかかり、接触文字が多数ある場合などは非常に多くの切出し結果が出てくるため認識処理速度が著しく低下するという問題がある。
【００１５】
また、第３の方法では、接触した文字列部分の分離に関して認識精度上多くの問題があり、正確に文字認識を行うことは困難である。
【００１６】
本発明は、上記の事情に鑑み、文字認識の難しい文字画像からでも正確にかつ高速で文字認識することが可能な文字認識装置を提供することを目的とする。
【００１７】
【課題を解決するための手段】
上記の目的を達成する本発明の文字認識装置は、
入力された文字画像から文字幅を推定してその文字画像から文字幅に相当する長さの文字領域を切り出す文字領域切出部と、
上記文字領域切出部により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部と、
標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書と、
上記特徴抽出部で抽出された、文字領域内の文字パターンの特徴を、上記標準パターン辞書を構成する上記一文字標準パターン辞書および上記複数文字標準パターン辞書に記述された一文字および文字列それぞれの特徴と照合してその文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部とを備えたことを特徴とする。
【００１８】
ここで、本発明の文字認識装置が、上記辞書照合部により、上記文字領域内の文字パターンの特徴を上記複数文字標準パターン辞書に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、上記特徴抽出部に、文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、上記辞書照合部に、上記分割領域それぞれの文字パターンの特徴を、上記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合させて上記分割領域の配列に対応した文字列の候補を抽出させ、その文字列の候補が、上記複数文字標準パターン辞書を用いて抽出された文字列の候補と一致するか否かを検証する検証部を備えたものであることが好ましい。
【００１９】
また、上記文字領域切出部が、上記文字画像から上記文字幅に相当する長さの文字領域を、該文字幅を上記所定数と同数に分割したときの一分割分の長さずつずらしながら切り出すものであることも好ましい。
【００２０】
また、上記辞書照合部が、上記文字領域切出部により切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出するものであることも好ましい態様である。
【００２１】
さらに、上記辞書照合部が、文字認識不能な文字認識不能領域が残った場合に、上記文字認識不能領域の文字パターンの特徴を上記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合して文字候補を抽出するものであることも好ましい態様の一つである。
【００２２】
【発明の実施の形態】
以下、本発明の実施形態について説明する。
【００２３】
図１は、本発明の文字認識装置が運用されるコンピュータの外観図（ａ）および内部構成図（ｂ）である。
【００２４】
図１（ａ）および図１（ｂ）に示すように、このコンピュータ６０は、ＣＰＵ６１、メモリ６２、表示装置６３、プリンタ６４、ＣＤ−ＲＯＭドライブ６５、磁気ディスク６６、マウス６７、キーボード６８、およびイメージスキャナ６９などがシステムバス７０によって接続されて構成されおり、このコンピュータ６０に本発明の文字認識装置が形成されている。
【００２５】
イメージスキャナ６９によりこのコンピュータ６０に文字画像が入力されて文字認識が行われる。
【００２６】
図２は、本発明の文字認識装置の第１の実施形態における機能ブロック図である。
【００２７】
図２に示すように、この第１の実施形態の文字認識装置１００は、入力された文字画像１０から文字幅を推定して文字画像１０から文字幅に相当する長さの文字領域を切り出す文字領域切出部１１、文字領域切出部１１により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部１２、標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書１４＿１と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書１４＿２との双方からなる標準パターン辞書１４、特徴抽出部１２で抽出された、文字領域内の文字パターンの特徴を、標準パターン辞書１４を構成する一文字標準パターン辞書１４＿１および複数文字標準パターン辞書１４＿２に記述された一文字および文字列それぞれの特徴と照合してその文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部１３、および抽出された文字あるいは文字列の候補を格納し外部に出力する候補文字出力部１５を備えている。
【００２８】
次に、この第１の実施形態の文字認識装置１００の動作について説明する。
【００２９】
例えば、イメージスキャナなどにより帳票などから取り込まれた文字画像１０がこの文字認識装置１００に入力されると、文字領域切出部１１により文字の平均高さが求められ、それに基づいて文字幅が推定される。文字の平均高さは、文字列の黒画素を行方向に投影することによって求められ、日本語の全角文字の幅と高さはほぼ等しく記入されることが多いという前提に基づき文字の平均高さから文字ピッチ、すなわち文字幅を推定することができる。この文字幅により全角文字を検出することができる。
【００３０】
半角文字は全角文字の半分の文字幅であるから文字の平均高さの半分の文字幅で半角文字一文字を検出することができる。
【００３１】
隣接する文字どうしが接触している接触文字については、文字領域の幅が上記の文字幅の２文字分の幅である場合は、文字領域を２分の１に強制的に分割することにより２文字として検出することができる。また、３文字分の幅がある場合は文字領域を３分の１に強制的に分割すればよい。
【００３２】
こうして得られた文字幅に相当する長さの文字領域が文字画像１０の左端から順次切り出される。文字幅の推定および文字領域の切出しは、文字画像１０の左端からだけではなく、必要に応じて文字画像１０の途中から行えるように構成してもよい。
【００３３】
特徴抽出部１２は、切り出された文字領域内の文字パターンの特徴を抽出する。文字パターンの特徴は、例えば、一文字分の矩形の領域を縦８列横８行の８×８＝６４領域に分割し、垂直方向と水平方向に走査して黒画素の個数を計数して得られる投影分布関数により表わすことができる。このような方法で抽出された文字領域内の文字パターンの特徴は、辞書照合部１３において、一文字標準パターン辞書１４＿１および複数文字標準パターン辞書１４＿２に記述された一文字および文字列それぞれの特徴と照合され相互間の距離を求めて距離の小さい順に例えば１０個の候補が求められる。
【００３４】
ここで、標準パターン辞書１４（図２参照）は、標準的な文字の文字領域から統計的に作成された一文字標準パターン辞書１４＿１と、標準的な文字が所定数、例えば２つ配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書１４＿２との２つの部分から構成されている。
【００３５】
このように、本実施形態において標準パターン辞書１４として一文字標準パターン辞書１４＿１および複数文字標準パターン辞書１４＿２の２種類の辞書を備えているのは、全角文字列の中に半角数字が並んでいる場合に、文字領域切出部１１は、半角２文字を一文字として検出するので、この半角２文字を一つのパターンとして辞書照合を行うようにするためである。
【００３６】
標準パターン辞書１４には、標準パターンとそのカテゴリ、すなわちその標準パターンを作成した文字カテゴリを表す文字コードが記述されている。一文字標準パターン辞書の場合は、例えば「０」というように１つの文字コードが記述されており、複数文字標準パターン辞書の場合は、例えば「００」というように２つの文字コードの並びが記述されている。
【００３７】
辞書照合部１３での一文字の標準パターン辞書を用いた照合により得られた結果は、標準的な文字として検出できた文字領域であると判断されるのでそのまま１つの文字コードを候補として出力する。辞書照合部１３での複数文字標準パターン辞書を用いた照合により得られた結果は、複数文字コードの並びを候補として出力する。
【００３８】
候補文字出力部１５では、辞書照合部１３から出力された文字コードを整理して最終候補文字列を作成し、一文字の候補は１つの文字コードのまま、複数文字の候補は複数の文字コードの並びとして外部に出力される。
【００３９】
このように、本実施形態の文字認識装置１００では、文字行全体ではなく局所的な文字列部分に着目し一文字標準パターン辞書と複数文字標準パターン辞書との双方からなる標準パターン辞書を用いて照合を行うことにより、半角文字が含まれていたり文字どうしが接触していたりしている低品質な文字列からでも、文字を正確に切り出すことができるので、文字認識の精度は高くなり、しかも多くの切出し候補を抽出する必要がなくなるから認識処理時間も短縮される。
【００４０】
次に、本発明の文字認識装置の第２の実施形態について説明する。
【００４１】
図３は、本発明の文字認識装置の第２の実施形態を示す概略構成図である。
【００４２】
図３に示すように、この第２の実施形態の文字認識装置２００は、図２に示した第１の実施形態の文字認識装置１００と同様の文字領域切出部１１、特徴抽出部１２、一文字標準パターン辞書１４＿１と複数文字標準パターン辞書１４＿２との双方からなる標準パターン辞書１４、辞書照合部１３、および候補文字出力部１５を備えたほかに、検証部１６が追加されている。
【００４３】
この検証部１６は、辞書照合部１３により、文字領域内の文字パターンの特徴を複数文字標準パターン辞書１４＿２に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、特徴抽出部１２に、上記文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、辞書照合部１３に、分割領域それぞれの文字パターンの特徴を、一文字標準パターン辞書１４＿１に記述された一文字それぞれの特徴と照合させて分割領域の配列に対応した文字列の候補を抽出させ、その文字列の候補が、複数文字標準パターン辞書１４＿２を用いて抽出された文字列の候補と一致するか否かを検証するものである。
【００４４】
図４は、第２の実施形態の文字認識装置に設けられる検証部の動作を説明する流れ図であり、図５は、第２の実施形態における検証の機能の説明図である。
【００４５】
図４に示すように、認識結果が複数文字パターンの認識結果であるか否かが判定され（ステップＳ１）、判定の結果が複数文字パターンの認識結果である場合、すなわち、辞書照合部１３が、文字領域内の文字パターンの特徴を複数文字標準パターン辞書１４＿２に記述された文字列の特徴と照合した結果、文字列の候補が抽出された場合に再びその文字領域の切り出しを行う（ステップＳ２）。すなわち、特徴抽出部１２に、上記文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させる。
【００４６】
ここまでの処理過程を図５に基づき説明すると、辞書照合部１３（図３参照）による照合の結果、複数文字、例えば、「０」の２文字が一つのパターン２０として認識された場合、文字領域切出部１１によりその文字領域の切り出しが行われ、パターン２０の垂直方向の黒画素投影ヒストグラムの極小値を示す位置で分割が行われる。この例では２文字なのでパターン２０＿１とパターン２０＿２とに２分割される。半角文字が２文字並んでいる場合には２等分される。
【００４７】
次に、分割された文字それぞれの認識が行われる（ステップＳ３）。すなわち、辞書照合部１３は、分割されたそれぞれの文字パターン２０＿１，２０＿２の特徴を、一文字標準パターン辞書１４＿１に記述された一文字それぞれの特徴と照合させて分割領域の配列に対応した文字列の候補を抽出する。
【００４８】
次に、認識結果の検証が行われる（ステップＳ４）。すなわち、検証部１６は、一文字標準パターン辞書１４＿１を用いて抽出した文字列の候補が、複数文字標準パターン辞書１４＿２を用いて抽出した文字列の候補と一致するか否かを検証する。
【００４９】
検証部１６による検証の結果（ステップＳ５）、一文字標準パターン辞書１４＿１を用いて抽出した文字列の候補が、複数文字標準パターン辞書１４＿２を用いて抽出した文字列の候補と一致する場合は、分割された文字は妥当であると判断し、これらのパターン２０＿１，２０＿２の文字コード２１，２２（図５参照）を候補文字出力部１５に出力する。ステップＳ５における判定の結果、両者が一致しない場合は分割は不適切であるとして分割結果を候補から除外する（ステップＳ６）。
【００５０】
第２の実施形態ではこのような検証が行われるので、図５に示したような２つの文字どうしが接触した場合の文字画像からでも正確な文字認識を行うことができる。
【００５１】
次に、本発明の文字認識装置の第３の実施形態について説明する。
【００５２】
図６は、本発明の文字認識装置の第３の実施形態における文字切り出し方式の説明図である。
【００５３】
この第３の実施形態の文字認識装置は、図２または図３に示した第１または第２の実施形態の文字認識装置と類似の構成を有しており、文字領域切出部の機能のみが第１および第２の実施形態の文字認識装置と相違している。すなわち、第３の実施形態の文字認識装置の文字領域切出部では、入力された文字画像から文字幅に相当する長さの文字領域を、文字幅を２つに分割したときの一分割分の長さずつずらしながら切り出すよう構成されている。
【００５４】
図６に示すような「１」から「０」までの１０個の全角文字列に相当する文字画像３０から文字領域を切り出す場合について説明する。
【００５５】
先ず、文字画像３０の黒画素を文字列方向と垂直方向に、すなわち、横書き文字列と推定される文字画像３０の場合は、上下方向に投影してヒストグラムを作成し、そのヒストグラムの極小となる位置を求め、高さＨから判断して文字画像の先頭からＨおよびＨ／２に相当する距離に現れる極小値の位置の間隔からＷおよびＷ／２を推定する。そしてこの文字幅ＷでピッチをＷ／２ずつずらしながら文字領域を切り出していく。
【００５６】
図６の場合、先ずａｌの文字領域「１２」が一文字として切り出され、特徴抽出、辞書照合が行われ、候補が求められる。この文字領域「１２」の場合は複数文字標準パターン辞書１４＿２（図３参照）の中の「１２」の標準パターンに最も距離が近いので、第２の実施形態におけると同様な方法で再び文字切出、特徴抽出、辞書照合、および検証が行われ、文字領域「１２」が２つの文字領域に分割され、「１」および「２」という２文字の候補が得られる。次に、Ｗ／２だけずらしたａ２の文字領域「２３」が一文字として切り出され、文字領域ａｌの場合と同様な認識処理が行なわれ、「２」および「３」という２文字の候補が得られる。同様にして、文字領域ａ３，ａ４，・・・が認識処理され、「３」および「４」という２文字の候補、「４」および「５」という２文字の候補、・・・が得られる。
【００５７】
辞書照合部１３は、上記のようにして切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出し候補文字出力部に出力する。
【００５８】
このように文字切出を行うことにより、全角文字と半角文字とが混在している文字画像であっても正確な文字認識を行うことができる。
【００５９】
また、この文字切出方式によれば、次に示すような接触文字の場合にも正確な文字認識を行うことができる。
【００６０】
図７は、第３の実施形態における文字切り出し方式による他の処理例を示す図である。
【００６１】
図７に示すように、この文字画像４０には１つの「１」と、互いに接触した７つの「０」とが含まれている。この文字画像４０の場合にも、図６におけると同様に、先ずａｌの文字領域「１０」が一文字として切り出され、特徴抽出、辞書照合が行われ、候補が求められる。この文字領域「１０」の場合は複数文字標準パターン辞書１４＿２（図３参照）の中の「１０」の標準パターンに最も距離が近いので、第２の実施形態におけると同様の方法により「１」および「０」という２文字の候補が得られる。次に、Ｗ／２だけずらしたａ２の文字領域「００」が一文字として切り出され、「０」および「０」という２文字の候補が得られる。同様にして、ａ３，ａ４，・・・の領域が処理される。
【００６２】
辞書照合部１３は、上記のようにして切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出し候補文字出力部に出力する。
【００６３】
このように文字切出を行うことにより隣り合う文字どうしが接触した文字画像であっても正確な文字認識を行うことができる。
【００６４】
次に、本発明の文字認識装置の第４の実施形態について説明する。
【００６５】
この第４の実施形態の文字認識装置は、図２または図３に示した文字認識装置１００，２００とほぼ同様の構成を有しているが、この実施形態の辞書照合部は、文字認識不能領域が残った場合に、その文字パターンの特徴を一文字標準パターン辞書１４＿１に記述された一文字それぞれの特徴と照合して文字候補を抽出するよう構成されている。
【００６６】
図８は、本発明の文字認識装置の第４の実施形態における文字切り出し方式の説明図である。
【００６７】
図８（ａ）に示すように、全角のカタカナ文字の並びの中に半角に相当する文字幅で濁点あるいは空白が混入した文字画像５０の場合は、図８（ｂ）に示すように、先ず、第２および第３の実施形態におけると同様の方法により平均高さＨから文字幅Ｗを推定し、文字画像５０の左端から文字幅Ｗで文字領域ａｌ「カ」を切り出してカタカナの「カ」が認識される。次に、Ｗ／２だけ切出位置をずらして文字幅Ｗで文字領域ａ２を切り出して認識処理をおこなう。しかしこの文字領域ａ２は辞書とマッチングしないので文字候補は得られない。以下同様にして、ａ３、ａ４、ａ５、ａ６、の各文字領域の切り出し、認識処理が続けられる。
【００６８】
図８（ｂ）の場合、文字領域ａｌ、文字領域ａ３、および文字領域ａ６はそれぞれカタカナ文字「カ」、カタカナ文字「カ」、およびカタカナ文字「ク」として認識されるが、文字領域ａ２、文字領域ａ４、および文字領域ａ５は辞書照合の結果、リジェクトされる。このように切出位置をＷ／２ずつずらした結果得られた文字候補は本実施形態の辞書照合部により総合され、文字配列の候補として抽出される。図８の例では、文字領域ａ１から得られた文字「カ」と文字領域ａ３から得られた文字「カ」とが総合された文字配列「カカ」が得られるが、文字領域ａ３から得られた文字「カ」と文字領域ａ６から得られた文字「ク」との間に文字認識不能な文字認識不能領域ａ７が残ってしまう。
【００６９】
そこで、本実施形態の辞書照合部は、文字認識不能領域ａ７は半角文字に相当する文字領域であることから、この文字認識不能領域ａ７の文字パターンの特徴を一文字標準パターン辞書１４＿１（図２，３参照）に記述された一文字それぞれの特徴と照合して文字候補を抽出しなおすことにより文字認識不能領域ａ７を半角濁点として認識する。こうして、図８（ｂ）に示す文字列から図８（ｃ）に示すような認識結果が得られる。
【００７０】
図９は、第４の実施形態における文字認識不能領域の処理の流れ図である。
【００７１】
図９に示すように、文字領域ａｌ〜ａｎの認識結果を求め（ステップＳ１１）、文字領域ａｌ〜ａｎの中に認識不能領域があるか否かが判定され（ステップＳ１２）、認識不能領域がある場合は、認識不能領域を一文字とみなして一文字標準パターン辞書１４＿１を用いて辞書参照を行い文字候補を求める。
【００７２】
以上説明したように、この第４の実施形態では、半角一文字が全角の文字の間に混入していてもそれを正確に認識することができる。また、図８（ａ）に示すように半角の空白が全角の文字の間に混入している場合についても上記の半角濁点の場合と同様に正確に認識することができる。
【００７３】
【発明の効果】
以上説明したように、本発明の文字認識装置によれば、標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書を用いて文字認識を行うので、通常の伝票に記入するような不規則な間隔、記入の仕方で記入された文字列でも、全角文字、半角文字の混在した印刷文字列でも高精度に文字を切り出して認識することが可能であり、文字認識の難しい文字画像からでも正確にかつ高速で文字認識することが可能な文字認識装置を実現することができる。
【図面の簡単な説明】
【図１】本発明の文字認識装置が運用されるコンピュータの外観図（ａ）および内部構成図（ｂ）である。
【図２】本発明の文字認識装置の第１の実施形態における機能ブロック図である。
【図３】本発明の文字認識装置の第２の実施形態を示す概略構成図である。
【図４】第２の実施形態の文字認識装置に設けられる検証部の動作を説明する流れ図である。
【図５】第２の実施形態における検証過程の説明図である。
【図６】本発明の文字認識装置の第３の実施形態における文字切り出し方式の説明図である。
【図７】第３の実施形態における文字切り出し方式による他の処理例を示す図である。
【図８】第３の実施形態における文字切り出し方式による処理例を示す図である。
【図９】第４の実施形態における文字認識不能領域の処理の流れ図である。
【符号の説明】
１０文字画像
１１文字領域切出部
１２特徴抽出部
１３辞書照合部
１４標準パターン辞書
１４＿１一文字標準パターン辞書
１４＿２複数文字標準パターン辞書
１５候補文字出力部
１６検証部
２０，２０＿１，２０＿２パターン
２１，２２文字コード
３０，４０，５０文字画像
６０コンピュータ
６１ＣＰＵ
６２メモリ
６３表示装置
６４プリンタ
６５ＣＤ−ＲＯＭドライブ
６６磁気ディスク
６７マウス
６８キーボード
６９イメージスキャナ
７０システムバス
１００，２００文字認識装置

Claims

入力された文字画像から文字幅を推定して該文字画像から該文字幅に相当する長さの文字領域を切り出す文字領域切出部と、
前記文字領域切出部により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部と、
全角と半角との双方について標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と、全角と半角との双方について標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書と、
前記特徴抽出部で抽出された、文字領域内の文字パターンの特徴を、前記標準パターン辞書を構成する前記一文字標準パターン辞書に記述された一文字の特徴と照合するとともに、該文字領域内の文字パターンの特徴を、該標準パターン辞書を構成する前記複数文字標準パターン辞書に記述された文字列の特徴と照合して該文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部と、
前記辞書照合部により、前記文字領域内の文字パターンの特徴を前記複数文字標準パターン辞書に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、前記特徴抽出部に、文字列の候補が抽出された文字領域がさらに該文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、前記辞書照合部に、前記分割領域それぞれの文字パターンの特徴を、前記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合させて前記分割領域の配列に対応した文字列の候補を抽出させ、該文字列の候補が、前記複数文字標準パターン辞書を用いて抽出された文字列の候補と一致するか否かを検証する検証部とを備えたことを特徴とする文字認識装置。
前記文字領域切出部が、前記文字画像から前記文字幅に相当する長さの文字領域を、該文字幅を前記所定数と同数に分割したときの一分割分の長さずつずらしながら切り出すものであることを特徴とする請求項１記載の文字認識装置。
前記辞書照合部が、前記文字領域切出部により切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を配列して文字配列の候補を抽出するものであることを特徴とする請求項２記載の文字認識装置。
前記辞書照合部が、文字認識不能な文字認識不能領域が残った場合に、前記文字認識不能領域の文字パターンの特徴を前記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合して文字候補を抽出するものであることを特徴とする請求項３記載の文字認識装置。