JP2004110369A - 文字認識方法および文字認識装置 - Google Patents
文字認識方法および文字認識装置 Download PDFInfo
- Publication number
- JP2004110369A JP2004110369A JP2002271604A JP2002271604A JP2004110369A JP 2004110369 A JP2004110369 A JP 2004110369A JP 2002271604 A JP2002271604 A JP 2002271604A JP 2002271604 A JP2002271604 A JP 2002271604A JP 2004110369 A JP2004110369 A JP 2004110369A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- background difference
- difference image
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】接触文字に対して背景差分画像作成処理を行っても文字欠けを発生させずに文字を抽出して正しく文字を認識する文字認識方法および文字認識装置を提供する。
【解決処理】入力画像26に文字接触があったとすると、ステップS2の文字切断位置決定処理手段2bで文字切断位置を得て、ステップS3の文字切断処理手段2cによる文字切断処理を行なって文字切断画像9を作成し、次に、ステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理、またステップS5の二値化処理手段2eによる部分二値化処理を用いて画像全体の濃度むらに影響されずに部分二値化処理画像14を作成し、ステップS6のノイズ除去により汚れを除去して正しい文字を抽出し文字認識を行なう。
【選択図】 図1
【解決処理】入力画像26に文字接触があったとすると、ステップS2の文字切断位置決定処理手段2bで文字切断位置を得て、ステップS3の文字切断処理手段2cによる文字切断処理を行なって文字切断画像9を作成し、次に、ステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理、またステップS5の二値化処理手段2eによる部分二値化処理を用いて画像全体の濃度むらに影響されずに部分二値化処理画像14を作成し、ステップS6のノイズ除去により汚れを除去して正しい文字を抽出し文字認識を行なう。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、悪環境で文字認識を行なう文字認識方法および文字認識装置に関する。
【0002】
【従来の技術】
図2は、従来の文字認識装置の処理動作を示すと共に処理画像を併記したフローチャートである。
先ず、ステップS20に示す画像入力処理は、カメラから入力した映像信号をデジタル化して入力画像20を作成する。ここで、入力画像は0〜255の範囲の濃度を持つ多値画像とし、黒い画素の濃度は小さい値をとり、白い画素の濃度は大きい値をとる。ステップS21の背景差分画像作成処理は、入力画像20から文字の画像情報だけを抽出するものである。入力画像20の文字が背景に比べ暗い場合、ステップS22で示す局所最大値フィルタをN回実行し、同じくステップS23で示す局所最小値フィルタ処理をN回実行し、両フィルタの実行回数Nは文字の太さとすることで文字を消去した背景画像21を作成する。続くステップS24では、この背景画像21から入力画像20を差し引く画像間差分処理を行ない、背景差分画像22を作成する。ここで、ステップS22の局所最大値フィルタ処理は、例えば、3×3画素の局所領域の最大濃度を求め、その濃度を中心位置の濃度と置き換える処理をラスタースキャンで全面走査するもので、二値画像の膨張処理に相当する。また、ステップS23の局所最小値フィルタ処理は、局所領域の最小濃度を中心位置の濃度と置き換える処理で、二値画像の収縮処理に相当する。このような背景差分処理は特開昭63−153682号公報に記載されている。
【0003】
次に、ステップS25で二値化処理を行ない、背景差分画像22の濃度ヒストグラムを基に文字を白に背景を黒にする最適な二値化しきい値を算出して、背景差分画像を二値画像23に変換する。濃度ヒストグラムを基づく二値化は、例えば「画像処理工学」(南敏、中村納著、コロナ社、1985年11月発行)79〜81頁に記載されている。さらに、ステップS26に示すノイズ除去処理では、二値画像23をラベリング処理を用いて、白物体の面積が文字の最小面積以上で最大面積以下の白物体のみを残してノイズ除去画像24を作成し、これにより文字以外のノイズを除去する。ラベリング処理によるノイズ除去処理は、例えば「C言語で学ぶ実践画像処理」(八木伸行、他著、オーム社、1995年12月発行)99〜103頁に記載されている。次に、ステップS27に示す文字切出し処理では、ノイズ除去画像24を垂直投影して投影分布25を測定し、投影値が零になる部分の位置を文字切出し位置とする。続くステップS28に示した文字認識処理は、文字切出し位置を用いてノイズ除去画像24に対して、従来のOCR(光学的文字読取装置)により各桁の文字を認識する。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の文字認識装置では、図3に示すように文字接触があり、濃度むら、汚れが複合する悪環境の入力画像26の場合、ステップS21の背景差分画像作成処理で文字接触部に文字欠けを発生させた背景差分画像27を作成し、さらにステップS25の二値化処理では背景差分画像27に濃度むらがあるために正しく文字を二値化できないことによって文字欠けを発生した二値画像28を作成してしまい、次にステップS26のノイズ除去処理ではノイズ除去画像29を作成してしまう。このノイズ除去画像29にステップS27の文字切り出し処理およびステップS28の文字認識処理を行なうと、文字欠けの発生によって認識結果は「× 3 3 3 9 5」となり、6桁目は認識不可、5桁目と4桁目は0を3と誤認識してしまう。このように文字接触が存在する悪環境の画像においては、正しく文字を抽出できないことによって文字を誤認識してしまう。
【0005】
本発明の目的は、接触文字に対して背景差分画像作成処理を行っても文字欠けを発生させずに文字を抽出して正しく文字を認識する文字認識方法および文字認識装置を提供することにある。
【0006】
【課題を解決するための処理】
本発明は上記目的を達成するために、入力画像に基づいて背景差分画像を作成し、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行ない、この切り出した文字列に対して文字認識を行なう文字認識方法において、上記入力画像における文字間の切断位置を決定した後に文字切断を行ない、その後、背景差分画像を作成するようにしたことを特徴とする。
【0007】
本発明による文字認識方法は、入力画像における文字間の切断位置を決定した後に文字切断を行ない、その後、背景差分画像を作成するようにしたため、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0008】
請求項2に記載の本発明は上記目的を達成するために、請求項1記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理を実行するようにしたことを特徴とする。
【0009】
請求項2に記載の本発明による文字認識方法は、文字切断を行なった後の背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理を実行するようにしたため、入力画像の背景全体に濃度むらが存在していても、細分化した領域を設定して各領域でそれぞれ二値化処理を行なうことによって、画像全体の濃度むらに影響されずに部分二値化処理画像を作成することができ、文字が消去されてしまうのを防止して精度良く文字認識を行なうことができる。
【0010】
請求項3に記載の本発明は上記目的を達成するために、入力画像に基づいて背景差分画像を作成する背景差分画像作成手段と、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行なう文字切り出し手段とを備え、この切り出した文字に対して文字認識を行なう文字認識装置において、上記入力画像における文字間の切断位置を決定した後に文字切断を行なう文字切断手段を設け、上記背景差分画像作成手段はこの文字切断手段による文字切断後に上記背景差分画像を作成するようにしたことを特徴とする。
【0011】
請求項3に記載の本発明による文字認識装置は、入力画像における文字間の切断位置を決定した後に文字切断を行なう文字切断手段を設け、背景差分画像作成手段はこの文字切断手段による文字切断後に背景差分画像を作成するようにしたため、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0012】
請求項4に記載の本発明は上記目的を達成するために、請求項3記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理手段を設けたことを特徴とする。
【0013】
請求項4に記載の本発明による文字認識装置は、文字切断を行なった後の背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理手段を設けたため、入力画像の背景全体に濃度むらが存在していても、細分化した領域を設定して各領域でそれぞれ二値化処理を行なうことによって、画像全体の濃度むらに影響されずに部分二値化処理画像を作成することができ、文字が消去されてしまうのを防止して精度良く文字認識を行なうことができる。
【0014】
請求項5に記載の本発明は上記目的を達成するために、請求項3記載のものにおいて、上記文字切断処理手段は、上記ノイズ除去画面を垂直投影した投影分布から算出した文字間が少なくとも所定の閾値よりも狭いところを文字切り出し位置としたことを特徴とする。
【0015】
請求項5に記載の本発明による文字認識装置は、文字切断処理手段は、ノイズ除去画面を垂直投影した投影分布から算出した文字間が少なくとも所定の閾値よりも狭いところを文字切り出し位置としたため、文字印字制御装置等からの文字位置が得られない場合でも、適切な文字切り出し位置を得ることができ、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
図4は、本発明の一実施の形態による文字認識装置を示すブロック構成図である。
この文字認識装置は、カメラ1などの画像出力装置からの画像を文字認識部2に入力し、この文字認識部2において画像の文字を認識し、この結果を出力するものである。文字認識部2は、画像入力処理手段2aと、文字切断位置決定処理手段2bと、文字切断処理手段2cと、背景差分画像作成処理手段2dと、二値化処理手段2eと、ノイズ除去処理手段2fと、文字切り出し処理手段2gと、文字認識処理手段2hとを有している。
【0017】
図1は、上述した文字認識部2の処理動作を示すフローチャートである。
画像入力処理手段2aがステップS1で入力画像を取り込んだとき、これが図3に示した入力画像26のように文字接触があり、濃度むら、汚れが複合する悪環境のものであったとし、これらに対処する処理を行なうよう選択したとする。次にステップS2の文字切断位置決定処理手段2bについて説明する。先ず、文字切断位置決定処理手段2bは認識対象の文字位置が分かるか否かを判断し、文字位置が分かる場合、図4のように文字印字制御装置等から文字位置データ3を取り込み、文字切断位置決定処理手段2bはこの文字位置データ3に基づいて文字切断位置を得る。
【0018】
一方、認識対象文字の位置が分からない場合、文字切断位置決定処理手段2bの処理動作を図5に示した処理画像を併記したフローチャートに基づいて説明する。
先ず、ステップS10で背景差分画像作成処理手段により背景差分画像作成処理を実行する。これは図2に示したステップS22およびステップS23で説明した局所最大値フィルタ処理および局所最小値フィルタ処理であり、図3に示した入力画像26から文字を消去した図5の背景画像4を得る。このとき、図3に示した入力画像26では、6桁目と5桁目の文字、また5桁目と4桁目の文字がそれぞれ接触しているため、図5の背景画像4に文字接触部が背景として残る。これは文字が接触することによって文字幅が太くなり、局所最大値フィルタ処理において文字を消去しきれないことによる。
【0019】
さらに背景差分画像作成処理手段による背景差分画像作成処理として、図5の背景画像4から図3に示した入力画像26を差し引く図2のステップS24で示す画像間差分処理を行ない、この画像間差分処理によって図5に示した背景差分画像5を作成する。このとき、背景画像4に文字接触部が背景として残っていることにより、文字接触部が背景差分画像5では文字欠けとなる。しかし、文字欠けとなることにより、背景差分画像5において接触文字は分離される。
【0020】
次に、図6に示したステップS11の二値化処理を行なって、図5に示した二値画像6を作成する。ここで二値化処理に部分二値化処理を用いるが、部分二値化処理については図1に示したステップS5の二値化処理で説明する。
【0021】
続いて、ステップS12のノイズ除去処理を行ない、図5に示した二値画像6の1桁目と2桁目との文字間上方に位置する汚れを除去したノイズ除去画像7を作成する。その後、ステップS13の文字切出し処理を行ない、ノイズ除去画像7を垂直投影して投影分布8を測定し、投影値が0となる各文字間隔の中心位置を切出し位置として決定する。これらのステップS10からステップS13の一連の処理によって、認識対象文字の位置が分からず、しかも接触部分がある場合でも接触文字を分離し、文字切断位置を決定することができる。
【0022】
これは従来の文字認識方法および文字認識装置で行なわれていた文字の切り出し位置決定とほぼ同様であるから、図4に示したように文字位置データ3から文字位置データを得られない場合でも、簡単に文字切断位置決定処理手段2bを構成することができる。
【0023】
こうして文字切断位置決定処理手段2bによって文字位置が分かる場合でも分からない場合でも、文字切断位置が決定されたため、図1に示したステップS3に進み、文字切断処理手段2cによる文字切断処理を行なう。文字切断処理手段2cは、図3に示した入力画像26にステップS2の文字切断位置決定処理手段2bで決定した各切断位置に縦方向の白線を描画して、図6に示したような文字切断画像9を作成する。このとき、図5に示した投影分布8において、投影値が零となる各文字間隔の幅を測定し、これら各文字間隔を予め設定した閾値と比較し、文字間隔が閾値以下の部分にのみ白線を描画するようにするとよい。
【0024】
次に、ステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理を行なう。これは上述した場合と同様に局所最大値フィルタ処理および局所最小値フィルタ処理によって図6に示した文字切断画像9から文字を消去して図7に示した背景画像10を作成するものである。図5に示したステップS10の背景差分画像作成処理では文字接触部が背景画像4に残ったが、このステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理では、すでに文字が切断されていることにより、文字が接触していた部分が残らない背景画像10となる。つまり、接触している文字が図6のように白線描画によって切断されて、文字幅が正常な太さになることにより、局所最大値フィルタ処理において接触部の文字も消去されるためである。
【0025】
次に、背景差分画像作成処理手段2dによる背景差分画像作成処理の次の処理として、図7に示した背景画像10から図6に示した文字切断画像9を差し引く画像間差分処理を行ない、これによって図7に示した背景差分画像11を作成する。このとき、図7に示した背景画像10に文字接触部が残っていないことにより、文字を切断して文字を抽出できる。
【0026】
続くステップS5の二値化処理手段2eによる二値化処理では部分二値化処理を用いる。この部分二値化処理については、図8を用いて従来の二値化処理と比較して説明する。処理対象画像の図7に示した背景差分画像11の文字背景は、左側から右側へ向けて濃度が暗くなる濃度むらを残した画像になっている。これは図3に示した入力画像26に文字の背景が左側から右側に向けて濃度が明るくなる濃度むらが存在したためである。先ず、従来の二値化処理を行なった場合、図7の背景差分画像11は図8の二値画像12に変換されるが、図7に示した背景差分画像11の全領域で二値化閾値を決定して二値化処理を行なうと、図7の背景差分画像11に濃度むらが存在したために左側の背景も白となり、文字が消去されてしまう。
【0027】
そこで、処理領域を図8に示した処理領域13のように横方向に細分化した領域を設定し、この各領域においてそれぞれ二値化処理を行なう。この各領域で二値化閾値を決定することによって、画像全体の濃度むらに影響されずに文字を白、背景を黒とした図8の部分二値化処理画像14を作成することができる。ここでは、横方向に濃度むらがある場合について説明したが、縦方向に濃度むらがある場合は縦方向に細分化した領域を設定し、また、濃度むらが部分的にある場合は領域を格子状に細分化して設定することによって濃度むらに影響されずに二値画像を作成することができる。
【0028】
さらにステップS6に示したノイズ除去処理をノイズ除去処理手段2fによって行なう。このノイズ除去処理によって図8に示した部分二値化処理画像14の1桁目と2桁目の文字間上方にあるノイズを除去し、図9に示すノイズ除去画像15を得ることができ、これに基づいて図5と同様の投影分布8からステップS7の文字切出し処理を文字切出し処理手段2gによって行なって、文字の切出し位置を決定する。最後に図9に示したノイズ除去画像15を対象に、文字認識処理手段2hを用いてステップS8の文字認識処理を行なうことにより、認識結果は「0 0 0 3 9 5」となり、文字を正しくを認識することができる。
【0029】
このような文字認識方法および文字認識装置によれば、文字接触があっても文字欠けが発生することなく文字を抽出でき、また、濃度むらに影響されずに文字列を二値化でき、さらに汚れ等のノイズを除去できるので、接触文字、濃度むら、汚れ等が複合した悪環境の入力画像においても文字列を良好に抽出できることによって、文字認識率の向上を図ることができる。
【0030】
尚、上述した実施の形態では、画像入力処理手段2aがステップS1で入力画像を取り込んだとき、これが図3に示した入力画像26のように文字接触があり、濃度むら、汚れが複合する悪環境のものであったとして説明したが、文字接触があるものの他の条件がよい場合は、図1に示したステップS2の文字切断位置決定処理手段2bとステップS3の文字切断処理手段2cを作動した後、ステップS8の文字認識処理手段2hによる文字認識を行なうように選択することもできる。このとき文字切断位置決定処理手段2bは、ノイズ除去画像7に限らず他の画像を垂直投影し文字間を算出して文字の切り出し位置を決定することもできる。
【0031】
【発明の効果】
以上説明したように本発明の文字認識方法および文字認識装置によれば、文字接触があっても文字欠けが発生することなく文字を抽出でき、接触文字が存在する入力画像においても文字列を良好に抽出できることによって、文字認識率の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態による文字認識装置の処理動作を示すフローチャートである。
【図2】従来の文字認識装置の処理動作を処理画面と共に示すフローチャートである。
【図3】図2に示した文字認識装置による文字接触がある場合の処理画像を示す工程図である。
【図4】図1に示した文字認識装置の具体構成を示すブロック構成図である。
【図5】図4に示した文字認識装置における文字切断位置決定手段の他の構成例を処理画面と共に示すフローチャートである。
【図6】図1に示した文字認識装置の文字切断手段による文字切断画像を示す平面図である。
【図7】図1に示した文字認識装置の背景差分画像作成手段による背景画像および背景差分画像の平面図である。
【図8】図1に示した文字認識装置の部分二値化処理手段による二値画像を示す平面図である。
【図9】図1に示した文字認識装置のノイズ除去処理手段によるノイズ除去画像を示す平面図である。
【符号の説明】
2 文字認識部
2a 画像入力処理手段
2b 文字切断位置決定処理手段
2c 文字切断処理手段
2d 背景差分画像作成処理手段
2e 二値化処理手段
2f ノイズ除去処理手段
2g 文字切切出し処理手段
【発明の属する技術分野】
本発明は、悪環境で文字認識を行なう文字認識方法および文字認識装置に関する。
【0002】
【従来の技術】
図2は、従来の文字認識装置の処理動作を示すと共に処理画像を併記したフローチャートである。
先ず、ステップS20に示す画像入力処理は、カメラから入力した映像信号をデジタル化して入力画像20を作成する。ここで、入力画像は0〜255の範囲の濃度を持つ多値画像とし、黒い画素の濃度は小さい値をとり、白い画素の濃度は大きい値をとる。ステップS21の背景差分画像作成処理は、入力画像20から文字の画像情報だけを抽出するものである。入力画像20の文字が背景に比べ暗い場合、ステップS22で示す局所最大値フィルタをN回実行し、同じくステップS23で示す局所最小値フィルタ処理をN回実行し、両フィルタの実行回数Nは文字の太さとすることで文字を消去した背景画像21を作成する。続くステップS24では、この背景画像21から入力画像20を差し引く画像間差分処理を行ない、背景差分画像22を作成する。ここで、ステップS22の局所最大値フィルタ処理は、例えば、3×3画素の局所領域の最大濃度を求め、その濃度を中心位置の濃度と置き換える処理をラスタースキャンで全面走査するもので、二値画像の膨張処理に相当する。また、ステップS23の局所最小値フィルタ処理は、局所領域の最小濃度を中心位置の濃度と置き換える処理で、二値画像の収縮処理に相当する。このような背景差分処理は特開昭63−153682号公報に記載されている。
【0003】
次に、ステップS25で二値化処理を行ない、背景差分画像22の濃度ヒストグラムを基に文字を白に背景を黒にする最適な二値化しきい値を算出して、背景差分画像を二値画像23に変換する。濃度ヒストグラムを基づく二値化は、例えば「画像処理工学」(南敏、中村納著、コロナ社、1985年11月発行)79〜81頁に記載されている。さらに、ステップS26に示すノイズ除去処理では、二値画像23をラベリング処理を用いて、白物体の面積が文字の最小面積以上で最大面積以下の白物体のみを残してノイズ除去画像24を作成し、これにより文字以外のノイズを除去する。ラベリング処理によるノイズ除去処理は、例えば「C言語で学ぶ実践画像処理」(八木伸行、他著、オーム社、1995年12月発行)99〜103頁に記載されている。次に、ステップS27に示す文字切出し処理では、ノイズ除去画像24を垂直投影して投影分布25を測定し、投影値が零になる部分の位置を文字切出し位置とする。続くステップS28に示した文字認識処理は、文字切出し位置を用いてノイズ除去画像24に対して、従来のOCR(光学的文字読取装置)により各桁の文字を認識する。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の文字認識装置では、図3に示すように文字接触があり、濃度むら、汚れが複合する悪環境の入力画像26の場合、ステップS21の背景差分画像作成処理で文字接触部に文字欠けを発生させた背景差分画像27を作成し、さらにステップS25の二値化処理では背景差分画像27に濃度むらがあるために正しく文字を二値化できないことによって文字欠けを発生した二値画像28を作成してしまい、次にステップS26のノイズ除去処理ではノイズ除去画像29を作成してしまう。このノイズ除去画像29にステップS27の文字切り出し処理およびステップS28の文字認識処理を行なうと、文字欠けの発生によって認識結果は「× 3 3 3 9 5」となり、6桁目は認識不可、5桁目と4桁目は0を3と誤認識してしまう。このように文字接触が存在する悪環境の画像においては、正しく文字を抽出できないことによって文字を誤認識してしまう。
【0005】
本発明の目的は、接触文字に対して背景差分画像作成処理を行っても文字欠けを発生させずに文字を抽出して正しく文字を認識する文字認識方法および文字認識装置を提供することにある。
【0006】
【課題を解決するための処理】
本発明は上記目的を達成するために、入力画像に基づいて背景差分画像を作成し、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行ない、この切り出した文字列に対して文字認識を行なう文字認識方法において、上記入力画像における文字間の切断位置を決定した後に文字切断を行ない、その後、背景差分画像を作成するようにしたことを特徴とする。
【0007】
本発明による文字認識方法は、入力画像における文字間の切断位置を決定した後に文字切断を行ない、その後、背景差分画像を作成するようにしたため、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0008】
請求項2に記載の本発明は上記目的を達成するために、請求項1記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理を実行するようにしたことを特徴とする。
【0009】
請求項2に記載の本発明による文字認識方法は、文字切断を行なった後の背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理を実行するようにしたため、入力画像の背景全体に濃度むらが存在していても、細分化した領域を設定して各領域でそれぞれ二値化処理を行なうことによって、画像全体の濃度むらに影響されずに部分二値化処理画像を作成することができ、文字が消去されてしまうのを防止して精度良く文字認識を行なうことができる。
【0010】
請求項3に記載の本発明は上記目的を達成するために、入力画像に基づいて背景差分画像を作成する背景差分画像作成手段と、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行なう文字切り出し手段とを備え、この切り出した文字に対して文字認識を行なう文字認識装置において、上記入力画像における文字間の切断位置を決定した後に文字切断を行なう文字切断手段を設け、上記背景差分画像作成手段はこの文字切断手段による文字切断後に上記背景差分画像を作成するようにしたことを特徴とする。
【0011】
請求項3に記載の本発明による文字認識装置は、入力画像における文字間の切断位置を決定した後に文字切断を行なう文字切断手段を設け、背景差分画像作成手段はこの文字切断手段による文字切断後に背景差分画像を作成するようにしたため、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0012】
請求項4に記載の本発明は上記目的を達成するために、請求項3記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理手段を設けたことを特徴とする。
【0013】
請求項4に記載の本発明による文字認識装置は、文字切断を行なった後の背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理手段を設けたため、入力画像の背景全体に濃度むらが存在していても、細分化した領域を設定して各領域でそれぞれ二値化処理を行なうことによって、画像全体の濃度むらに影響されずに部分二値化処理画像を作成することができ、文字が消去されてしまうのを防止して精度良く文字認識を行なうことができる。
【0014】
請求項5に記載の本発明は上記目的を達成するために、請求項3記載のものにおいて、上記文字切断処理手段は、上記ノイズ除去画面を垂直投影した投影分布から算出した文字間が少なくとも所定の閾値よりも狭いところを文字切り出し位置としたことを特徴とする。
【0015】
請求項5に記載の本発明による文字認識装置は、文字切断処理手段は、ノイズ除去画面を垂直投影した投影分布から算出した文字間が少なくとも所定の閾値よりも狭いところを文字切り出し位置としたため、文字印字制御装置等からの文字位置が得られない場合でも、適切な文字切り出し位置を得ることができ、入力画像に接触文字があったとしても、その接触文字に対して背景差分画像作成処理を行なっても文字欠けを発生させずに、文字を抽出して正しく文字を認識することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
図4は、本発明の一実施の形態による文字認識装置を示すブロック構成図である。
この文字認識装置は、カメラ1などの画像出力装置からの画像を文字認識部2に入力し、この文字認識部2において画像の文字を認識し、この結果を出力するものである。文字認識部2は、画像入力処理手段2aと、文字切断位置決定処理手段2bと、文字切断処理手段2cと、背景差分画像作成処理手段2dと、二値化処理手段2eと、ノイズ除去処理手段2fと、文字切り出し処理手段2gと、文字認識処理手段2hとを有している。
【0017】
図1は、上述した文字認識部2の処理動作を示すフローチャートである。
画像入力処理手段2aがステップS1で入力画像を取り込んだとき、これが図3に示した入力画像26のように文字接触があり、濃度むら、汚れが複合する悪環境のものであったとし、これらに対処する処理を行なうよう選択したとする。次にステップS2の文字切断位置決定処理手段2bについて説明する。先ず、文字切断位置決定処理手段2bは認識対象の文字位置が分かるか否かを判断し、文字位置が分かる場合、図4のように文字印字制御装置等から文字位置データ3を取り込み、文字切断位置決定処理手段2bはこの文字位置データ3に基づいて文字切断位置を得る。
【0018】
一方、認識対象文字の位置が分からない場合、文字切断位置決定処理手段2bの処理動作を図5に示した処理画像を併記したフローチャートに基づいて説明する。
先ず、ステップS10で背景差分画像作成処理手段により背景差分画像作成処理を実行する。これは図2に示したステップS22およびステップS23で説明した局所最大値フィルタ処理および局所最小値フィルタ処理であり、図3に示した入力画像26から文字を消去した図5の背景画像4を得る。このとき、図3に示した入力画像26では、6桁目と5桁目の文字、また5桁目と4桁目の文字がそれぞれ接触しているため、図5の背景画像4に文字接触部が背景として残る。これは文字が接触することによって文字幅が太くなり、局所最大値フィルタ処理において文字を消去しきれないことによる。
【0019】
さらに背景差分画像作成処理手段による背景差分画像作成処理として、図5の背景画像4から図3に示した入力画像26を差し引く図2のステップS24で示す画像間差分処理を行ない、この画像間差分処理によって図5に示した背景差分画像5を作成する。このとき、背景画像4に文字接触部が背景として残っていることにより、文字接触部が背景差分画像5では文字欠けとなる。しかし、文字欠けとなることにより、背景差分画像5において接触文字は分離される。
【0020】
次に、図6に示したステップS11の二値化処理を行なって、図5に示した二値画像6を作成する。ここで二値化処理に部分二値化処理を用いるが、部分二値化処理については図1に示したステップS5の二値化処理で説明する。
【0021】
続いて、ステップS12のノイズ除去処理を行ない、図5に示した二値画像6の1桁目と2桁目との文字間上方に位置する汚れを除去したノイズ除去画像7を作成する。その後、ステップS13の文字切出し処理を行ない、ノイズ除去画像7を垂直投影して投影分布8を測定し、投影値が0となる各文字間隔の中心位置を切出し位置として決定する。これらのステップS10からステップS13の一連の処理によって、認識対象文字の位置が分からず、しかも接触部分がある場合でも接触文字を分離し、文字切断位置を決定することができる。
【0022】
これは従来の文字認識方法および文字認識装置で行なわれていた文字の切り出し位置決定とほぼ同様であるから、図4に示したように文字位置データ3から文字位置データを得られない場合でも、簡単に文字切断位置決定処理手段2bを構成することができる。
【0023】
こうして文字切断位置決定処理手段2bによって文字位置が分かる場合でも分からない場合でも、文字切断位置が決定されたため、図1に示したステップS3に進み、文字切断処理手段2cによる文字切断処理を行なう。文字切断処理手段2cは、図3に示した入力画像26にステップS2の文字切断位置決定処理手段2bで決定した各切断位置に縦方向の白線を描画して、図6に示したような文字切断画像9を作成する。このとき、図5に示した投影分布8において、投影値が零となる各文字間隔の幅を測定し、これら各文字間隔を予め設定した閾値と比較し、文字間隔が閾値以下の部分にのみ白線を描画するようにするとよい。
【0024】
次に、ステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理を行なう。これは上述した場合と同様に局所最大値フィルタ処理および局所最小値フィルタ処理によって図6に示した文字切断画像9から文字を消去して図7に示した背景画像10を作成するものである。図5に示したステップS10の背景差分画像作成処理では文字接触部が背景画像4に残ったが、このステップS4の背景差分画像作成処理手段2dによる背景差分画像作成処理では、すでに文字が切断されていることにより、文字が接触していた部分が残らない背景画像10となる。つまり、接触している文字が図6のように白線描画によって切断されて、文字幅が正常な太さになることにより、局所最大値フィルタ処理において接触部の文字も消去されるためである。
【0025】
次に、背景差分画像作成処理手段2dによる背景差分画像作成処理の次の処理として、図7に示した背景画像10から図6に示した文字切断画像9を差し引く画像間差分処理を行ない、これによって図7に示した背景差分画像11を作成する。このとき、図7に示した背景画像10に文字接触部が残っていないことにより、文字を切断して文字を抽出できる。
【0026】
続くステップS5の二値化処理手段2eによる二値化処理では部分二値化処理を用いる。この部分二値化処理については、図8を用いて従来の二値化処理と比較して説明する。処理対象画像の図7に示した背景差分画像11の文字背景は、左側から右側へ向けて濃度が暗くなる濃度むらを残した画像になっている。これは図3に示した入力画像26に文字の背景が左側から右側に向けて濃度が明るくなる濃度むらが存在したためである。先ず、従来の二値化処理を行なった場合、図7の背景差分画像11は図8の二値画像12に変換されるが、図7に示した背景差分画像11の全領域で二値化閾値を決定して二値化処理を行なうと、図7の背景差分画像11に濃度むらが存在したために左側の背景も白となり、文字が消去されてしまう。
【0027】
そこで、処理領域を図8に示した処理領域13のように横方向に細分化した領域を設定し、この各領域においてそれぞれ二値化処理を行なう。この各領域で二値化閾値を決定することによって、画像全体の濃度むらに影響されずに文字を白、背景を黒とした図8の部分二値化処理画像14を作成することができる。ここでは、横方向に濃度むらがある場合について説明したが、縦方向に濃度むらがある場合は縦方向に細分化した領域を設定し、また、濃度むらが部分的にある場合は領域を格子状に細分化して設定することによって濃度むらに影響されずに二値画像を作成することができる。
【0028】
さらにステップS6に示したノイズ除去処理をノイズ除去処理手段2fによって行なう。このノイズ除去処理によって図8に示した部分二値化処理画像14の1桁目と2桁目の文字間上方にあるノイズを除去し、図9に示すノイズ除去画像15を得ることができ、これに基づいて図5と同様の投影分布8からステップS7の文字切出し処理を文字切出し処理手段2gによって行なって、文字の切出し位置を決定する。最後に図9に示したノイズ除去画像15を対象に、文字認識処理手段2hを用いてステップS8の文字認識処理を行なうことにより、認識結果は「0 0 0 3 9 5」となり、文字を正しくを認識することができる。
【0029】
このような文字認識方法および文字認識装置によれば、文字接触があっても文字欠けが発生することなく文字を抽出でき、また、濃度むらに影響されずに文字列を二値化でき、さらに汚れ等のノイズを除去できるので、接触文字、濃度むら、汚れ等が複合した悪環境の入力画像においても文字列を良好に抽出できることによって、文字認識率の向上を図ることができる。
【0030】
尚、上述した実施の形態では、画像入力処理手段2aがステップS1で入力画像を取り込んだとき、これが図3に示した入力画像26のように文字接触があり、濃度むら、汚れが複合する悪環境のものであったとして説明したが、文字接触があるものの他の条件がよい場合は、図1に示したステップS2の文字切断位置決定処理手段2bとステップS3の文字切断処理手段2cを作動した後、ステップS8の文字認識処理手段2hによる文字認識を行なうように選択することもできる。このとき文字切断位置決定処理手段2bは、ノイズ除去画像7に限らず他の画像を垂直投影し文字間を算出して文字の切り出し位置を決定することもできる。
【0031】
【発明の効果】
以上説明したように本発明の文字認識方法および文字認識装置によれば、文字接触があっても文字欠けが発生することなく文字を抽出でき、接触文字が存在する入力画像においても文字列を良好に抽出できることによって、文字認識率の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態による文字認識装置の処理動作を示すフローチャートである。
【図2】従来の文字認識装置の処理動作を処理画面と共に示すフローチャートである。
【図3】図2に示した文字認識装置による文字接触がある場合の処理画像を示す工程図である。
【図4】図1に示した文字認識装置の具体構成を示すブロック構成図である。
【図5】図4に示した文字認識装置における文字切断位置決定手段の他の構成例を処理画面と共に示すフローチャートである。
【図6】図1に示した文字認識装置の文字切断手段による文字切断画像を示す平面図である。
【図7】図1に示した文字認識装置の背景差分画像作成手段による背景画像および背景差分画像の平面図である。
【図8】図1に示した文字認識装置の部分二値化処理手段による二値画像を示す平面図である。
【図9】図1に示した文字認識装置のノイズ除去処理手段によるノイズ除去画像を示す平面図である。
【符号の説明】
2 文字認識部
2a 画像入力処理手段
2b 文字切断位置決定処理手段
2c 文字切断処理手段
2d 背景差分画像作成処理手段
2e 二値化処理手段
2f ノイズ除去処理手段
2g 文字切切出し処理手段
Claims (5)
- 入力画像に基づいて背景差分画像を作成し、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行ない、この切り出した文字列に対して文字認識を行なう文字認識方法において、上記入力画像における文字間の切断位置を決定した後に文字切断を行ない、その後、背景差分画像を作成するようにしたことを特徴とする文字認識方法。
- 請求項1記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理を実行するようにしたことを特徴とする文字認識方法。
- 入力画像に基づいて背景差分画像を作成する背景差分画像作成処理手段と、この背景差分画像に基づいて作成したノイズ除去画面から文字切り出しを行なう文字切り出し処理手段とを備え、この切り出した文字に対して文字認識を行なう文字認識装置において、上記入力画像における文字間の切断位置を決定した後に文字切断を行なう文字切断処理手段を設け、上記背景差分画像作成処理手段はこの文字切断処理手段による文字切断後に上記背景差分画像を作成するようにしたことを特徴とする文字認識装置。
- 請求項3記載のものにおいて、文字切断を行なった後の上記背景差分画像に対して文字列の含む領域を細分化した各領域で二値画像に変換する部分二値化処理手段を設けたことを特徴とする文字認識装置。
- 請求項3記載のものにおいて、上記文字切断処理手段は、上記ノイズ除去画面を垂直投影した投影分布から算出した文字間が少なくとも所定の閾値よりも狭いところを文字切り出し位置としたことを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271604A JP2004110369A (ja) | 2002-09-18 | 2002-09-18 | 文字認識方法および文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271604A JP2004110369A (ja) | 2002-09-18 | 2002-09-18 | 文字認識方法および文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004110369A true JP2004110369A (ja) | 2004-04-08 |
Family
ID=32268863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002271604A Pending JP2004110369A (ja) | 2002-09-18 | 2002-09-18 | 文字認識方法および文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004110369A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331672B2 (en) | 2008-06-24 | 2012-12-11 | Samsung Electronics Co., Ltd | Method and apparatus for recognizing character in character recognizing apparatus |
US10332263B2 (en) | 2016-10-28 | 2019-06-25 | Pfu Limited | Image processing device, image processing method, and non-transitory computer-readable recording medium |
-
2002
- 2002-09-18 JP JP2002271604A patent/JP2004110369A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331672B2 (en) | 2008-06-24 | 2012-12-11 | Samsung Electronics Co., Ltd | Method and apparatus for recognizing character in character recognizing apparatus |
US10332263B2 (en) | 2016-10-28 | 2019-06-25 | Pfu Limited | Image processing device, image processing method, and non-transitory computer-readable recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002208007A (ja) | スキャンした文書の自動式検出 | |
JP5357612B2 (ja) | 下線除去装置 | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
JPH1139469A (ja) | 顔画像処理装置 | |
JPH0546591B2 (ja) | ||
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
JP4011646B2 (ja) | 行検出方法および文字認識装置 | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2004110369A (ja) | 文字認識方法および文字認識装置 | |
JP2023034823A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
JP2003281468A (ja) | 文字認識装置および文字認識方法 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JP2002158874A (ja) | 画像処理装置 | |
JP2670074B2 (ja) | 車両番号認識装置 | |
JP4218179B2 (ja) | パターン検出装置及び方法 | |
JPS60200375A (ja) | テンプレ−トマツチング方式 | |
JPH09231376A (ja) | ナンバープレート検出システム | |
JPH09305709A (ja) | 画像認識方法及びその装置 | |
JPH06274689A (ja) | 文字認識装置 | |
JPH0728953A (ja) | 文字検出装置 | |
JP2000222524A (ja) | 罫線除去方法及び装置、記録媒体 | |
JPS6156554B2 (ja) | ||
JPH09147049A (ja) | ナンバープレート位置検出装置 | |
JPH0391885A (ja) | 活字文字認識装置 | |
JPH1011589A (ja) | 画像処理方法 |