JP4280355B2 - 文字認識装置 - Google Patents
文字認識装置 Download PDFInfo
- Publication number
- JP4280355B2 JP4280355B2 JP12605399A JP12605399A JP4280355B2 JP 4280355 B2 JP4280355 B2 JP 4280355B2 JP 12605399 A JP12605399 A JP 12605399A JP 12605399 A JP12605399 A JP 12605399A JP 4280355 B2 JP4280355 B2 JP 4280355B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- characters
- width
- standard pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、入力された文字画像を文字として認識する文字認識装置に関する。
【0002】
【従来の技術】
従来、入力された文字画像を文字として認識する文字認識装置の分野において、例えばOCR(光学式文字読取装置)やイメージスキャナとOCRソフトとを組み合わせた文字認識装置などが広い業務分野で用いられている。従来のOCR用帳票では、一文字ずつの文字記入枠が印刷された帳票が用いられ、漢字を用いるシステムでは文字記入枠の大きさも漢字が記入しやすいよう大きな文字記入枠が採用されている。このようにすることによりOCRにとっては記入された文字を正確に認識しやすくなり、また記入者に対して隣の文字と接触しないように記入することを促す効果がある。
【0003】
しかし、OCRの利用分野が一層広まるに従って、一般に使用される通常の帳票のような小さな帳票を用い文字枠にとらわれずに記入された文字列、すなわち、通常の伝票などに不規則な文字間隔、不規則な記入方法で記入された隣接する文字どうしが接触し合うような低品質の手書きの文字列についても実用になる認識精度で認識することが可能な文字認識装置が求められている。
【0004】
また、印刷された文字列の場合は、OCR−Bあるいはマルチフォントなどのように複数の特定の文字フォントだけを用いて注意深く印刷されたOCR帳票が使用されているが、印刷された文字列についても、不特定のプリンタにより多様な文字ピッチで印刷された、多様な変形のある文字列、例えば、文字ピッチが狭いプリンタやプロポーショナルピッチで印刷された文字列、あるいは半角文字と全角文字が混在する文字列などから実用になる認識精度で文字列を切り出すことのできる文字認識装置が要望されている。
【0005】
【発明が解決しようとする課題】
従来の文字認識装置における文字切出し方式、特にフリーピッチの文字列、すなわち文字枠が設定されていないフィールドからの文字切出し方式では、孤立した黒画素の連結領域について文字列の高さ情報を求め、その高さ情報から文字のピッチ情報を求め、その値により隣り合う文字を統合しあるいは分離して認識対象とすべき一文字を切り出す方式が採用されている。あるいは1行、1フィールドの文字列を行方向、フィールド方向に垂直な方向へ投影しておき、文字列の高さ情報から文字のピッチ情報を求め、その値により投影ヒストグラムから文字位置を切り出していく方式を採用したものもある。その切出しが一通りに決まらない場合には複数通りの切出し位置を求めることも行われている。
【0006】
通常、不特定多数の筆記者により予め決められた書式に従って記入された文字を収集し、これらの文字から認識方式に依存する文字パターンの特徴を抽出し統計的な手法などにより標準パターンが作成される。また、標準パターンは、収集された文字から平均パターンとして作成されることもある。手書き文字の場合には、記入者により大きな字形変形が生じるため各字種について複数の標準パターンが作成される。通常一つの標準パターンをテンプレートとよび、複数の標準パターンを集めた辞書を複数テンプレート辞書と呼ぶ。辞書照合方法としては、入力帳票から切り出された一文字からその文字パターンの特徴を抽出し、この特徴と標準パターン辞書のテンプレートの特徴との間で類似度計算あるいは距離計算を行い、最大の類似度を持つカテゴリあるいは最小の距離を持つテンプレートのカテゴリを認識結果として求める方法が採用されている。侯補文字列としては、距離の小さい順に例えば8位までを侯補文字列としている。
【0007】
印刷文字に関しても同様な方法で候補文字列が求められる。複数通りの侯補がある場合はパターンどうしの類似度評価値により、あるいは知識処理などの言語処理により最良の切出し候補を決定する方法が採用されている。
【0008】
一般に、通常の伝票に手書き記入する場合のようにフリーピッチで記入された文字列、あるいは不特定のプリンタで印刷された文字列を認識する場合に、隣接する文字どうしが接触することが多く、また、印刷文字列の場合は半角文字と全角文字が混在することがあり、隣り合う文字どうしが接触することが多いため、一文字ずつ検出して認識する方法では、どの範囲までが一文字かを判断するのが困難であり、実用に耐える認識精度を実現することは難しい。ひらがな、カタカナ、および漢字では偏(へん)と旁(つくり)のように、もともと分離した文字領域からなる文字もあり、これらの文字領域が正しく認識できなければ何文字記入してあるのかさえ判断できない場合もある。
【0009】
印刷文字列の文字切出しでは、1行の文字列から個々の文字のピッチを推定する方法として次のような種々の方法が提案されている。
【0010】
第1の方法は、1行の文字列の黒画素を行方向に投影して行を構成する文字の平均高さを求める。次に、文字列の黒画素を行方向に垂直な方向に投影して黒画素の行方向の頻度をヒストグラムとして表しそのヒストグラムから頻度が0の位置、すなわち文字列が途切れている位置、あるいはヒストグラムの極小点、すなわち接触文字または重なり文字を切り離すべき切断候補位置を求める。この切断候補位置に基づき、先に求めた文字列の平均高さから全角文字、半角文字の列として妥当と見られる位置を文字切出し位置とする。
【0011】
第2の方法は、1行の文字列の黒画素を行方向に垂直な方向に投影して黒画素の行方向の頻度をヒストグラムとして表しそのヒストグラムから頻度が0の位置、あるいはヒストグラムの極小点を求め、文字切出し位置と推定される位置をその文字列に対して複数通り求める。複数通りの文字切出位置のうちのいずれが尤もらしい文字切出位置であるかの判定は、文字列の類似度評価値と認識結果からの判断にゆだねる。
【0012】
第3の方法は、1行の文字列について黒画素の連結領域を求め、連結領域の並びについて小さな領域どうしは統合し、大きな領域は複数に分離して一文字の領域を決めて文字切出しを行なう。その際の小さい領域、大きい領域の判断は文字列の高さを基準にして行う。
【0013】
しかし、上記のいずれの方法にもそれぞれ次のような問題がある。すなわち、第1の方法においては、1行の文字列が全て全角文字で構成されている場合には、全角文字は文字幅と文字高さが全て等しいと考えられるので平均文字高さから文字幅を正確に推定することができ、従って、一文字ずつ正確に切り出すことができるが、半角文字と全角文字が混在している場合、例えば全角の仮名交じり漢字文字列に半角の英数字あるいはカタカナが混入している場合には、文字位置が半角分だけずれたり、半角2文字が一文字分に認識されることがあり、正しい文字切出位置が求められないことがある。
【0014】
また、第2の方法では、1行の文字列に対して複数通りの切出し結果が得られるため1行の認識処理に複数行分の処理時間がかかり、接触文字が多数ある場合などは非常に多くの切出し結果が出てくるため認識処理速度が著しく低下するという問題がある。
【0015】
また、第3の方法では、接触した文字列部分の分離に関して認識精度上多くの問題があり、正確に文字認識を行うことは困難である。
【0016】
本発明は、上記の事情に鑑み、文字認識の難しい文字画像からでも正確にかつ高速で文字認識することが可能な文字認識装置を提供することを目的とする。
【0017】
【課題を解決するための手段】
上記の目的を達成する本発明の文字認識装置は、
入力された文字画像から文字幅を推定してその文字画像から文字幅に相当する長さの文字領域を切り出す文字領域切出部と、
上記文字領域切出部により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部と、
標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書と、
上記特徴抽出部で抽出された、文字領域内の文字パターンの特徴を、上記標準パターン辞書を構成する上記一文字標準パターン辞書および上記複数文字標準パターン辞書に記述された一文字および文字列それぞれの特徴と照合してその文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部とを備えたことを特徴とする。
【0018】
ここで、本発明の文字認識装置が、上記辞書照合部により、上記文字領域内の文字パターンの特徴を上記複数文字標準パターン辞書に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、上記特徴抽出部に、文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、上記辞書照合部に、上記分割領域それぞれの文字パターンの特徴を、上記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合させて上記分割領域の配列に対応した文字列の候補を抽出させ、その文字列の候補が、上記複数文字標準パターン辞書を用いて抽出された文字列の候補と一致するか否かを検証する検証部を備えたものであることが好ましい。
【0019】
また、上記文字領域切出部が、上記文字画像から上記文字幅に相当する長さの文字領域を、該文字幅を上記所定数と同数に分割したときの一分割分の長さずつずらしながら切り出すものであることも好ましい。
【0020】
また、上記辞書照合部が、上記文字領域切出部により切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出するものであることも好ましい態様である。
【0021】
さらに、上記辞書照合部が、文字認識不能な文字認識不能領域が残った場合に、上記文字認識不能領域の文字パターンの特徴を上記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合して文字候補を抽出するものであることも好ましい態様の一つである。
【0022】
【発明の実施の形態】
以下、本発明の実施形態について説明する。
【0023】
図1は、本発明の文字認識装置が運用されるコンピュータの外観図(a)および内部構成図(b)である。
【0024】
図1(a)および図1(b)に示すように、このコンピュータ60は、CPU61、メモリ62、表示装置63、プリンタ64、CD−ROMドライブ65、磁気ディスク66、マウス67、キーボード68、およびイメージスキャナ69などがシステムバス70によって接続されて構成されおり、このコンピュータ60に本発明の文字認識装置が形成されている。
【0025】
イメージスキャナ69によりこのコンピュータ60に文字画像が入力されて文字認識が行われる。
【0026】
図2は、本発明の文字認識装置の第1の実施形態における機能ブロック図である。
【0027】
図2に示すように、この第1の実施形態の文字認識装置100は、入力された文字画像10から文字幅を推定して文字画像10から文字幅に相当する長さの文字領域を切り出す文字領域切出部11、文字領域切出部11により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部12、標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書14_1と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書14_2との双方からなる標準パターン辞書14、特徴抽出部12で抽出された、文字領域内の文字パターンの特徴を、標準パターン辞書14を構成する一文字標準パターン辞書14_1および複数文字標準パターン辞書14_2に記述された一文字および文字列それぞれの特徴と照合してその文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部13、および抽出された文字あるいは文字列の候補を格納し外部に出力する候補文字出力部15を備えている。
【0028】
次に、この第1の実施形態の文字認識装置100の動作について説明する。
【0029】
例えば、イメージスキャナなどにより帳票などから取り込まれた文字画像10がこの文字認識装置100に入力されると、文字領域切出部11により文字の平均高さが求められ、それに基づいて文字幅が推定される。文字の平均高さは、文字列の黒画素を行方向に投影することによって求められ、日本語の全角文字の幅と高さはほぼ等しく記入されることが多いという前提に基づき文字の平均高さから文字ピッチ、すなわち文字幅を推定することができる。この文字幅により全角文字を検出することができる。
【0030】
半角文字は全角文字の半分の文字幅であるから文字の平均高さの半分の文字幅で半角文字一文字を検出することができる。
【0031】
隣接する文字どうしが接触している接触文字については、文字領域の幅が上記の文字幅の2文字分の幅である場合は、文字領域を2分の1に強制的に分割することにより2文字として検出することができる。また、3文字分の幅がある場合は文字領域を3分の1に強制的に分割すればよい。
【0032】
こうして得られた文字幅に相当する長さの文字領域が文字画像10の左端から順次切り出される。文字幅の推定および文字領域の切出しは、文字画像10の左端からだけではなく、必要に応じて文字画像10の途中から行えるように構成してもよい。
【0033】
特徴抽出部12は、切り出された文字領域内の文字パターンの特徴を抽出する。文字パターンの特徴は、例えば、一文字分の矩形の領域を縦8列横8行の8×8=64領域に分割し、垂直方向と水平方向に走査して黒画素の個数を計数して得られる投影分布関数により表わすことができる。このような方法で抽出された文字領域内の文字パターンの特徴は、辞書照合部13において、一文字標準パターン辞書14_1および複数文字標準パターン辞書14_2に記述された一文字および文字列それぞれの特徴と照合され相互間の距離を求めて距離の小さい順に例えば10個の候補が求められる。
【0034】
ここで、標準パターン辞書14(図2参照)は、標準的な文字の文字領域から統計的に作成された一文字標準パターン辞書14_1と、標準的な文字が所定数、例えば2つ配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書14_2との2つの部分から構成されている。
【0035】
このように、本実施形態において標準パターン辞書14として一文字標準パターン辞書14_1および複数文字標準パターン辞書14_2の2種類の辞書を備えているのは、全角文字列の中に半角数字が並んでいる場合に、文字領域切出部11は、半角2文字を一文字として検出するので、この半角2文字を一つのパターンとして辞書照合を行うようにするためである。
【0036】
標準パターン辞書14には、標準パターンとそのカテゴリ、すなわちその標準パターンを作成した文字カテゴリを表す文字コードが記述されている。一文字標準パターン辞書の場合は、例えば「0」というように1つの文字コードが記述されており、複数文字標準パターン辞書の場合は、例えば「00」というように2つの文字コードの並びが記述されている。
【0037】
辞書照合部13での一文字の標準パターン辞書を用いた照合により得られた結果は、標準的な文字として検出できた文字領域であると判断されるのでそのまま1つの文字コードを候補として出力する。辞書照合部13での複数文字標準パターン辞書を用いた照合により得られた結果は、複数文字コードの並びを候補として出力する。
【0038】
候補文字出力部15では、辞書照合部13から出力された文字コードを整理して最終候補文字列を作成し、一文字の候補は1つの文字コードのまま、複数文字の候補は複数の文字コードの並びとして外部に出力される。
【0039】
このように、本実施形態の文字認識装置100では、文字行全体ではなく局所的な文字列部分に着目し一文字標準パターン辞書と複数文字標準パターン辞書との双方からなる標準パターン辞書を用いて照合を行うことにより、半角文字が含まれていたり文字どうしが接触していたりしている低品質な文字列からでも、文字を正確に切り出すことができるので、文字認識の精度は高くなり、しかも多くの切出し候補を抽出する必要がなくなるから認識処理時間も短縮される。
【0040】
次に、本発明の文字認識装置の第2の実施形態について説明する。
【0041】
図3は、本発明の文字認識装置の第2の実施形態を示す概略構成図である。
【0042】
図3に示すように、この第2の実施形態の文字認識装置200は、図2に示した第1の実施形態の文字認識装置100と同様の文字領域切出部11、特徴抽出部12、一文字標準パターン辞書14_1と複数文字標準パターン辞書14_2との双方からなる標準パターン辞書14、辞書照合部13、および候補文字出力部15を備えたほかに、検証部16が追加されている。
【0043】
この検証部16は、辞書照合部13により、文字領域内の文字パターンの特徴を複数文字標準パターン辞書14_2に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、特徴抽出部12に、上記文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、辞書照合部13に、分割領域それぞれの文字パターンの特徴を、一文字標準パターン辞書14_1に記述された一文字それぞれの特徴と照合させて分割領域の配列に対応した文字列の候補を抽出させ、その文字列の候補が、複数文字標準パターン辞書14_2を用いて抽出された文字列の候補と一致するか否かを検証するものである。
【0044】
図4は、第2の実施形態の文字認識装置に設けられる検証部の動作を説明する流れ図であり、図5は、第2の実施形態における検証の機能の説明図である。
【0045】
図4に示すように、認識結果が複数文字パターンの認識結果であるか否かが判定され(ステップS1)、判定の結果が複数文字パターンの認識結果である場合、すなわち、辞書照合部13が、文字領域内の文字パターンの特徴を複数文字標準パターン辞書14_2に記述された文字列の特徴と照合した結果、文字列の候補が抽出された場合に再びその文字領域の切り出しを行う(ステップS2)。すなわち、特徴抽出部12に、上記文字列の候補が抽出された文字領域がさらにその文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させる。
【0046】
ここまでの処理過程を図5に基づき説明すると、辞書照合部13(図3参照)による照合の結果、複数文字、例えば、「0」の2文字が一つのパターン20として認識された場合、文字領域切出部11によりその文字領域の切り出しが行われ、パターン20の垂直方向の黒画素投影ヒストグラムの極小値を示す位置で分割が行われる。この例では2文字なのでパターン20_1とパターン20_2とに2分割される。半角文字が2文字並んでいる場合には2等分される。
【0047】
次に、分割された文字それぞれの認識が行われる(ステップS3)。すなわち、辞書照合部13は、分割されたそれぞれの文字パターン20_1,20_2の特徴を、一文字標準パターン辞書14_1に記述された一文字それぞれの特徴と照合させて分割領域の配列に対応した文字列の候補を抽出する。
【0048】
次に、認識結果の検証が行われる(ステップS4)。すなわち、検証部16は、一文字標準パターン辞書14_1を用いて抽出した文字列の候補が、複数文字標準パターン辞書14_2を用いて抽出した文字列の候補と一致するか否かを検証する。
【0049】
検証部16による検証の結果(ステップS5)、一文字標準パターン辞書14_1を用いて抽出した文字列の候補が、複数文字標準パターン辞書14_2を用いて抽出した文字列の候補と一致する場合は、分割された文字は妥当であると判断し、これらのパターン20_1,20_2の文字コード21,22(図5参照)を候補文字出力部15に出力する。ステップS5における判定の結果、両者が一致しない場合は分割は不適切であるとして分割結果を候補から除外する(ステップS6)。
【0050】
第2の実施形態ではこのような検証が行われるので、図5に示したような2つの文字どうしが接触した場合の文字画像からでも正確な文字認識を行うことができる。
【0051】
次に、本発明の文字認識装置の第3の実施形態について説明する。
【0052】
図6は、本発明の文字認識装置の第3の実施形態における文字切り出し方式の説明図である。
【0053】
この第3の実施形態の文字認識装置は、図2または図3に示した第1または第2の実施形態の文字認識装置と類似の構成を有しており、文字領域切出部の機能のみが第1および第2の実施形態の文字認識装置と相違している。すなわち、第3の実施形態の文字認識装置の文字領域切出部では、入力された文字画像から文字幅に相当する長さの文字領域を、文字幅を2つに分割したときの一分割分の長さずつずらしながら切り出すよう構成されている。
【0054】
図6に示すような「1」から「0」までの10個の全角文字列に相当する文字画像30から文字領域を切り出す場合について説明する。
【0055】
先ず、文字画像30の黒画素を文字列方向と垂直方向に、すなわち、横書き文字列と推定される文字画像30の場合は、上下方向に投影してヒストグラムを作成し、そのヒストグラムの極小となる位置を求め、高さHから判断して文字画像の先頭からHおよびH/2に相当する距離に現れる極小値の位置の間隔からWおよびW/2を推定する。そしてこの文字幅WでピッチをW/2ずつずらしながら文字領域を切り出していく。
【0056】
図6の場合、先ずalの文字領域「12」が一文字として切り出され、特徴抽出、辞書照合が行われ、候補が求められる。この文字領域「12」の場合は複数文字標準パターン辞書14_2(図3参照)の中の「12」の標準パターンに最も距離が近いので、第2の実施形態におけると同様な方法で再び文字切出、特徴抽出、辞書照合、および検証が行われ、文字領域「12」が2つの文字領域に分割され、「1」および「2」という2文字の候補が得られる。次に、W/2だけずらしたa2の文字領域「23」が一文字として切り出され、文字領域alの場合と同様な認識処理が行なわれ、「2」および「3」という2文字の候補が得られる。同様にして、文字領域a3,a4,・・・が認識処理され、「3」および「4」という2文字の候補、「4」および「5」という2文字の候補、・・・が得られる。
【0057】
辞書照合部13は、上記のようにして切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出し候補文字出力部に出力する。
【0058】
このように文字切出を行うことにより、全角文字と半角文字とが混在している文字画像であっても正確な文字認識を行うことができる。
【0059】
また、この文字切出方式によれば、次に示すような接触文字の場合にも正確な文字認識を行うことができる。
【0060】
図7は、第3の実施形態における文字切り出し方式による他の処理例を示す図である。
【0061】
図7に示すように、この文字画像40には1つの「1」と、互いに接触した7つの「0」とが含まれている。この文字画像40の場合にも、図6におけると同様に、先ずalの文字領域「10」が一文字として切り出され、特徴抽出、辞書照合が行われ、候補が求められる。この文字領域「10」の場合は複数文字標準パターン辞書14_2(図3参照)の中の「10」の標準パターンに最も距離が近いので、第2の実施形態におけると同様の方法により「1」および「0」という2文字の候補が得られる。次に、W/2だけずらしたa2の文字領域「00」が一文字として切り出され、「0」および「0」という2文字の候補が得られる。同様にして、a3,a4,・・・の領域が処理される。
【0062】
辞書照合部13は、上記のようにして切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を総合して文字配列の候補を抽出し候補文字出力部に出力する。
【0063】
このように文字切出を行うことにより隣り合う文字どうしが接触した文字画像であっても正確な文字認識を行うことができる。
【0064】
次に、本発明の文字認識装置の第4の実施形態について説明する。
【0065】
この第4の実施形態の文字認識装置は、図2または図3に示した文字認識装置100,200とほぼ同様の構成を有しているが、この実施形態の辞書照合部は、文字認識不能領域が残った場合に、その文字パターンの特徴を一文字標準パターン辞書14_1に記述された一文字それぞれの特徴と照合して文字候補を抽出するよう構成されている。
【0066】
図8は、本発明の文字認識装置の第4の実施形態における文字切り出し方式の説明図である。
【0067】
図8(a)に示すように、全角のカタカナ文字の並びの中に半角に相当する文字幅で濁点あるいは空白が混入した文字画像50の場合は、図8(b)に示すように、先ず、第2および第3の実施形態におけると同様の方法により平均高さHから文字幅Wを推定し、文字画像50の左端から文字幅Wで文字領域al「カ」を切り出してカタカナの「カ」が認識される。次に、W/2だけ切出位置をずらして文字幅Wで文字領域a2を切り出して認識処理をおこなう。しかしこの文字領域a2は辞書とマッチングしないので文字候補は得られない。以下同様にして、a3、a4、a5、a6、の各文字領域の切り出し、認識処理が続けられる。
【0068】
図8(b)の場合、文字領域al、文字領域a3、および文字領域a6はそれぞれカタカナ文字「カ」、カタカナ文字「カ」、およびカタカナ文字「ク」として認識されるが、文字領域a2、文字領域a4、および文字領域a5は辞書照合の結果、リジェクトされる。このように切出位置をW/2ずつずらした結果得られた文字候補は本実施形態の辞書照合部により総合され、文字配列の候補として抽出される。図8の例では、文字領域a1から得られた文字「カ」と文字領域a3から得られた文字「カ」とが総合された文字配列「カカ」が得られるが、文字領域a3から得られた文字「カ」と文字領域a6から得られた文字「ク」との間に文字認識不能な文字認識不能領域a7が残ってしまう。
【0069】
そこで、本実施形態の辞書照合部は、文字認識不能領域a7は半角文字に相当する文字領域であることから、この文字認識不能領域a7の文字パターンの特徴を一文字標準パターン辞書14_1(図2,3参照)に記述された一文字それぞれの特徴と照合して文字候補を抽出しなおすことにより文字認識不能領域a7を半角濁点として認識する。こうして、図8(b)に示す文字列から図8(c)に示すような認識結果が得られる。
【0070】
図9は、第4の実施形態における文字認識不能領域の処理の流れ図である。
【0071】
図9に示すように、文字領域al〜anの認識結果を求め(ステップS11)、文字領域al〜anの中に認識不能領域があるか否かが判定され(ステップS12)、認識不能領域がある場合は、認識不能領域を一文字とみなして一文字標準パターン辞書14_1を用いて辞書参照を行い文字候補を求める。
【0072】
以上説明したように、この第4の実施形態では、半角一文字が全角の文字の間に混入していてもそれを正確に認識することができる。また、図8(a)に示すように半角の空白が全角の文字の間に混入している場合についても上記の半角濁点の場合と同様に正確に認識することができる。
【0073】
【発明の効果】
以上説明したように、本発明の文字認識装置によれば、標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書を用いて文字認識を行うので、通常の伝票に記入するような不規則な間隔、記入の仕方で記入された文字列でも、全角文字、半角文字の混在した印刷文字列でも高精度に文字を切り出して認識することが可能であり、文字認識の難しい文字画像からでも正確にかつ高速で文字認識することが可能な文字認識装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置が運用されるコンピュータの外観図(a)および内部構成図(b)である。
【図2】本発明の文字認識装置の第1の実施形態における機能ブロック図である。
【図3】本発明の文字認識装置の第2の実施形態を示す概略構成図である。
【図4】第2の実施形態の文字認識装置に設けられる検証部の動作を説明する流れ図である。
【図5】第2の実施形態における検証過程の説明図である。
【図6】本発明の文字認識装置の第3の実施形態における文字切り出し方式の説明図である。
【図7】第3の実施形態における文字切り出し方式による他の処理例を示す図である。
【図8】第3の実施形態における文字切り出し方式による処理例を示す図である。
【図9】第4の実施形態における文字認識不能領域の処理の流れ図である。
【符号の説明】
10 文字画像
11 文字領域切出部
12 特徴抽出部
13 辞書照合部
14 標準パターン辞書
14_1 一文字標準パターン辞書
14_2 複数文字標準パターン辞書
15 候補文字出力部
16 検証部
20,20_1,20_2 パターン
21,22 文字コード
30,40,50 文字画像
60 コンピュータ
61 CPU
62 メモリ
63 表示装置
64 プリンタ
65 CD−ROMドライブ
66 磁気ディスク
67 マウス
68 キーボード
69 イメージスキャナ
70 システムバス
100,200 文字認識装置
Claims (4)
- 入力された文字画像から文字幅を推定して該文字画像から該文字幅に相当する長さの文字領域を切り出す文字領域切出部と、
前記文字領域切出部により切り出された文字領域内の文字パターンの特徴を抽出する特徴抽出部と、
全角と半角との双方について標準的な文字一文字それぞれの特徴が記述された一文字標準パターン辞書と、全角と半角との双方について標準的な文字が所定数配列されてなる文字列それぞれの特徴が記述された複数文字標準パターン辞書との双方からなる標準パターン辞書と、
前記特徴抽出部で抽出された、文字領域内の文字パターンの特徴を、前記標準パターン辞書を構成する前記一文字標準パターン辞書に記述された一文字の特徴と照合するとともに、該文字領域内の文字パターンの特徴を、該標準パターン辞書を構成する前記複数文字標準パターン辞書に記述された文字列の特徴と照合して該文字領域内の文字パターンが表す文字あるいは文字列の候補を抽出する辞書照合部と、
前記辞書照合部により、前記文字領域内の文字パターンの特徴を前記複数文字標準パターン辞書に記述された文字列の特徴と照合した結果文字列の候補が抽出された場合に、前記特徴抽出部に、文字列の候補が抽出された文字領域がさらに該文字列を構成する文字数と同数に分割されてなる各分割領域それぞれの文字パターンの特徴を抽出させ、前記辞書照合部に、前記分割領域それぞれの文字パターンの特徴を、前記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合させて前記分割領域の配列に対応した文字列の候補を抽出させ、該文字列の候補が、前記複数文字標準パターン辞書を用いて抽出された文字列の候補と一致するか否かを検証する検証部とを備えたことを特徴とする文字認識装置。 - 前記文字領域切出部が、前記文字画像から前記文字幅に相当する長さの文字領域を、該文字幅を前記所定数と同数に分割したときの一分割分の長さずつずらしながら切り出すものであることを特徴とする請求項1記載の文字認識装置。
- 前記辞書照合部が、前記文字領域切出部により切り出された文字領域それぞれについて文字あるいは文字列の候補を抽出するとともに抽出された文字あるいは文字列の候補を配列して文字配列の候補を抽出するものであることを特徴とする請求項2記載の文字認識装置。
- 前記辞書照合部が、文字認識不能な文字認識不能領域が残った場合に、前記文字認識不能領域の文字パターンの特徴を前記一文字標準パターン辞書に記述された一文字それぞれの特徴と照合して文字候補を抽出するものであることを特徴とする請求項3記載の文字認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12605399A JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
KR1019990047465A KR100582039B1 (ko) | 1999-05-06 | 1999-10-29 | 문자 인식 장치 |
CNB99123281XA CN1181446C (zh) | 1999-05-06 | 1999-11-01 | 文字识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12605399A JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000315247A JP2000315247A (ja) | 2000-11-14 |
JP4280355B2 true JP4280355B2 (ja) | 2009-06-17 |
Family
ID=14925485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12605399A Expired - Fee Related JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP4280355B2 (ja) |
KR (1) | KR100582039B1 (ja) |
CN (1) | CN1181446C (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056266A (ja) * | 2002-07-17 | 2004-02-19 | Ricoh Co Ltd | 像域分離装置、画像処理装置、画像形成装置、プログラム及び記憶媒体 |
JP2005301664A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム |
JP2005352653A (ja) * | 2004-06-09 | 2005-12-22 | Omron Corp | 文字認識装置 |
KR100598115B1 (ko) * | 2004-08-31 | 2006-07-10 | 삼성전자주식회사 | 고속 문자인식방법 및 장치 |
JP5041775B2 (ja) * | 2006-09-28 | 2012-10-03 | 沖電気工業株式会社 | 文字切出方法及び文字認識装置 |
CN101226596B (zh) * | 2007-01-15 | 2012-02-01 | 夏普株式会社 | 文档图像处理装置以及文档图像处理方法 |
CN101354704B (zh) * | 2007-07-23 | 2011-01-12 | 夏普株式会社 | 字形特征字典制作装置及具备该装置的文档图像处理装置 |
CN101354703B (zh) * | 2007-07-23 | 2010-11-17 | 夏普株式会社 | 文档图像处理装置和文档图像处理方法 |
CN101493896B (zh) * | 2008-01-24 | 2013-02-06 | 夏普株式会社 | 文档图像处理装置及文档图像处理方法 |
CN101763505B (zh) * | 2009-12-29 | 2011-12-07 | 重庆大学 | 基于投影对称性的车牌字符特征提取及分类方法 |
CN102867178B (zh) * | 2011-07-05 | 2015-06-10 | 富士通株式会社 | 汉字识别方法和装置 |
CN105869140A (zh) * | 2015-11-24 | 2016-08-17 | 乐视致新电子科技(天津)有限公司 | 图像处理方法和装置 |
CN107016392A (zh) * | 2016-01-27 | 2017-08-04 | 四川效率源信息安全技术股份有限公司 | 一种去除图片中文字边框的方法 |
CN107071179A (zh) * | 2017-04-25 | 2017-08-18 | 北京小米移动软件有限公司 | 日程管理方法及装置 |
JP6729486B2 (ja) * | 2017-05-15 | 2020-07-22 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、情報処理プログラム及び情報処理方法 |
KR102570961B1 (ko) * | 2020-10-21 | 2023-08-25 | 엄혜용 | 온라인 게임 내에서 문자를 인식하는 텍스트 마이닝 장치 |
KR20230164347A (ko) * | 2022-05-25 | 2023-12-04 | (주)그리드원 | Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07152877A (ja) * | 1993-12-01 | 1995-06-16 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JP2988304B2 (ja) * | 1995-02-23 | 1999-12-13 | 松下電器産業株式会社 | 文字列管理装置 |
JP2751865B2 (ja) * | 1995-04-17 | 1998-05-18 | 日本電気株式会社 | 文字列認識装置 |
JPH09245120A (ja) * | 1996-03-11 | 1997-09-19 | Hitachi Ltd | 文字切出し方法 |
TW490643B (en) * | 1996-05-21 | 2002-06-11 | Hitachi Ltd | Estimated recognition device for input character string |
JPH09326012A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | 文字認識装置および文字認識方法 |
JP3452774B2 (ja) * | 1997-10-16 | 2003-09-29 | 富士通株式会社 | 文字認識方法 |
-
1999
- 1999-05-06 JP JP12605399A patent/JP4280355B2/ja not_active Expired - Fee Related
- 1999-10-29 KR KR1019990047465A patent/KR100582039B1/ko not_active IP Right Cessation
- 1999-11-01 CN CNB99123281XA patent/CN1181446C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1273401A (zh) | 2000-11-15 |
JP2000315247A (ja) | 2000-11-14 |
KR20000075420A (ko) | 2000-12-15 |
CN1181446C (zh) | 2004-12-22 |
KR100582039B1 (ko) | 2006-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4280355B2 (ja) | 文字認識装置 | |
Spitz | Determination of the script and language content of document images | |
US6335986B1 (en) | Pattern recognizing apparatus and method | |
US7567730B2 (en) | Detecting an orientation of characters in a document image | |
JP3452774B2 (ja) | 文字認識方法 | |
JP2000181993A (ja) | 文字認識方法および装置 | |
Pal et al. | Machine-printed and hand-written text lines identification | |
JP3294995B2 (ja) | 帳票読取装置 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JP2001283152A (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Okamoto et al. | Performance evaluation of a robust method for mathematical expression recognition | |
JP2730665B2 (ja) | 文字認識装置および方法 | |
JP3525997B2 (ja) | 文字認識方法 | |
Shafait et al. | Layout analysis of Urdu document images | |
US11551461B2 (en) | Text classification | |
Baird | Global-to-local layout analysis | |
Chaudhuri et al. | Extraction of type style-based meta-information from imaged documents | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
JP4194020B2 (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP3457094B2 (ja) | 文字認識装置及び文字認識方法 | |
JPH07319880A (ja) | キーワード抽出・検索装置 | |
JP3428504B2 (ja) | 文字認識装置 | |
JP3384634B2 (ja) | 文字種識別方法 | |
JP3197441B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090310 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090316 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |